GUY AULIAC - JEAN DELCOURT RÉMY GOBLOT
GUY AULIAC - JEAN DELCOURT - RÉMY GOBLOT
MATHÉMATIQUES Algèbre et géométrie Cou...
62 downloads
1081 Views
3MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
GUY AULIAC - JEAN DELCOURT RÉMY GOBLOT
GUY AULIAC - JEAN DELCOURT - RÉMY GOBLOT
MATHÉMATIQUES Algèbre et géométrie Cours et exercices corrigés
Mathématiques L1 L2 L3
Tome 1
E. Azoulay, J. Avignant, G. Auliac
Tome 2
E. Azoulay, J. Avignant, G. Auliac
Tome 1
E. Azoulay, J. Avignant, G. Auliac
Tome 2
E. Azoulay, J. Avignant, G. Auliac
Intégration et probabilités
G. Auliac, Ch. Cocozza-Thivent, S. Mercier, M. Roussignol
Algèbre et géométrie
G. Auliac, J. Delcourt, R. Goblot
Topologie et analyse
G. Auliac, J.-Y. Caby
ISBN 2 10 048335 8
www.ediscience.net
Guy Auliac est professeur agrégé à l’université de Marne-la-Vallée Jean Delcourt est professeur à l’université de Cergy-Pontoise Rémy Goblot est professeur à l’université de Lille
MATHÉMATIQUES Algèbre et géométrie
Ce cours en trois tomes (Algèbre et géométrie, Intégration et probabilités, et Topologie et analyse) est destiné aux étudiants en Licence 3 de mathématiques. Il fait suite au cours en quatre volumes de Élie Azoulay, Jean Avignat et Guy Auliac destiné aux étudiants de Licences 1 et 2. La compréhension du sujet est facilitée par de nombreux exemples. Afin d’aider l’étudiant à bien assimiler les notions, plus de 200 exercices résolus sont proposés en complément au cours. Une trentaine de problèmes dont la solution détaillée est disponible sur le WEB sont également proposés. Ces exercices et ces problèmes sont aussi bien des applications immédiates du cours qu’un approfondissement et une synthèse des nouvelles notions abordées au niveau 3.
3 eannée Sous la direction de GUY AULIAC GUY AULIAC - JEAN DELCOURT - RÉMY GOBLOT
MATHÉMATIQUES
Algèbre et géométrie
MATHÉMATIQUES ALGÈBRE ET GÉOMÉTRIE
MATHÉMATIQUES Algèbre et géométrie 50 % Cours + 50 % exos
Sous la direction de
Guy Auliac Professeur agrégé à l’université de Marne-la-Vallée
Jean Delcourt Professeur agrégé à l’université de Cergy-Pontoise
Rémy Goblot Professeur à l’université de Lille
Couverture : Claude Lieber
© Dunod, Paris, 2005 ISBN 2 10 048335 8
i
i
i
i
Table des matières
AVANT-PROPOS
IX
CHAPITRE 1 • THÉORIE DES ENSEMBLES 1.1
Ensembles, applications
1
1.2
Cardinal d’un ensemble
5
1.3
Ensembles ordonnés, bon ordre
8
1.4
Relation d’équivalence, ensembles quotients
11
1.5
Rappels d’arithmétique élémentaire
13
© Dunod. La photocopie non autorisée est un délit.
Exercices
14
CHAPITRE 2 • ANNEAUX ET CORPS 2.1
Anneaux, sous-anneaux, idéaux
25
2.2
Divisibilité
36
2.3
Anneaux principaux, euclidiens et factoriels
39
Exercices
46
CHAPITRE 3 • POLYNÔMES 3.1
L’anneau des polynômes A[X]
59
3.2
Polynômes irréductibles
62
3.3
Polynômes à plusieurs indéterminées
68
Exercices
72
i
i i
i
i
i
i
i
Mathématiques pour la licence : Algèbre et géométrie 3e année
VI
CHAPITRE 4 • ALGÈBRE LINÉAIRE 4.1
Diagonalisation et trigonalisation
85
4.2
Décomposition de Dunford et réduction de Jordan
94
4.3
Réduction de Frobenius
Exercices
102 108
CHAPITRE 5 • GROUPES 5.1
Sous-groupes, morphismes
119
5.2
Groupe quotient et groupe produit
123
5.3
Groupes commutatifs finis
126
5.4
Actions de groupes
130
5.5
Théorèmes de Sylow
134
Exercices
136
CHAPITRE 6 • ALGÈBRE BILINÉAIRE 6.1
Formes bilinéaires
147
6.2
Formes bilinéaires symétriques et antisymétriques
150
6.3
Formes quadratiques
155
6.4
Espaces vectoriels euclidiens et hermitiens
159
6.5
Adjoints
164
Exercices
169
CHAPITRE 7 • GROUPES CLASSIQUES 7.1
Les groupes linéaires et spécial linéaires
179
7.2
Le groupe orthogonal
183
7.3
La dimension deux
187
7.4
Décomposition des transformations orthogonales
193
Exercices
194
CHAPITRE 8 • ESPACES AFFINES EUCLIDIENS 8.1
Notions affines
203
8.2
Géométrie euclidienne
222
Exercices
233
i
i i
i
i
i
i
i
Table des matières
VII
CHAPITRE 9 • CALCULS BARYCENTRIQUES 9.1
Espace vectoriel des points pondérés
243
9.2
Application en géométrie plane
248
9.3
Application en géométrie du triangle
254
9.4
Fonction de Leibnitz
255
Exercices
256
CHAPITRE 10 • TÉTRAÈDRES ET PARALLÉLÉPIPÈDES 10.1 Produit mixte, produit vectoriel
267
10.2 Applications à des configurations
272
Exercices
277
CHAPITRE 11 • GÉOMÉTRIE DES CERCLES 11.1 Positions relatives de cercles et de droites
283
11.2 Puissance d’un point
287
11.3 Propriété angulaire du cercle
292
11.4 Faisceaux de cercles
294
11.5 L’espace des cercles du plan
296
11.6 Projection stéréographique
304
Exercices
308
© Dunod. La photocopie non autorisée est un délit.
CHAPITRE 12 • CONIQUES 12.1 Coniques dans un plan affine
315
12.2 Coniques dans un plan affine euclidien
325
Exercices
338
CHAPITRE 13 • NOMBRES COMPLEXES ET GÉOMÉTRIE 13.1 Le corps C comme plan géométrique
349
13.2 Utilisation de C en géométrie affine plane
351
13.3 La géométrie des cercles et C
355
13.4 Groupe circulaire
362
Exercices
367
INDEX
382
RÉFÉRENCES BIBLIOGRAPHIQUES
386
i
i i
i
i
i
i
i
i
i i
i
i
i
i
i
Avant-propos
© Dunod. La photocopie non autorisée est un délit.
La présente série est destinée aux étudiants de troisième année de Licence qui suivent un parcours de mathématiques. Elle est composée de trois volumes, Intégration et probabilités, Algèbre et géométrie, Topologie et analyse, et elle couvre les notions généralement enseignées sur ces thèmes à ce niveau d’études. C’est en troisième année de licence que se constituent les bases à partir desquelles un étudiant pourra, soit aborder un master de mathématiques appliquées ou de mathématiques pures, soit préparer le CAPES de mathématiques. De nombreuses notions nouvelles sont abordées et il est indispensable que l’étudiant les fasse siennes, se les approprie. Cette appropriation nécessite dans un premier temps une lecture attentive et une bonne compréhension des résultats du cours, ainsi que des démonstrations qui les justifient, des motivations et heuristiques qui les sous-tendent. L’acquisition de nouvelles notions mathématiques ne saurait par ailleurs être complète sans une réelle manipulation de ces nouveaux concepts de la part de l’étudiant. C’est pourquoi cette série a le parti pris de proposer, outre un cours complet, une quantité importante d’exercices corrigés. Ces exercices vont d’une application immédiate du cours à un approfondissement de certains résultats. Ils sont un élément fondamental d’assimilation et d’appropriation du contenu du cours. Rappelons à ce propos que chercher un exercice est en soit très formateur et que c’est justement cette recherche qui fait progresser. En d’autres termes, il n’est guère souhaitable de se précipiter sur la solution à la première difficulté...
i
i i
i
i
i
i
i
X
Mathématiques pour la licence : Algèbre et géométrie 3e année
Dans ce tome consacré à l’algèbre et à la géométrie, on s’est efforcé de présenter toutes les connaissances et tous les outils qui constituent le socle de l’algèbre et de la géométrie. Parlons d’abord de la forme : il s’agit pour nous, tout en évitant les généralités excessives, d’utiliser les notions abstraites comme par exemple les quotients, qui permettent d’arriver plus vite à l’essentiel. Les démonstrations sont détaillées, les exemples nombreux. Quelques exercices sont insérés dans le fil du cours, ils l’illustrent ou le prolongent. D’autres exercices parfois un peu plus longs sont placés en fin de chapitre. Tous les exercices sont corrigés. De courts problèmes permettent d’approfondir, d’ouvrir d’autres portes. Les corrigés des problèmes sont disponibles sur le site de Dunod : www.dunod.com. On trouve une bonne partie de ce que doit connaître un étudiant en mathématiques, qu’il se destine à l’enseignement, à la recherche ou aux applications. Les chapitres d’algèbre concernent beaucoup l’algèbre générale (anneaux, groupes) mais aussi des compléments d’algèbre linéaire et bilinéaire. Pour les chapitres de géométrie, on a choisi une approche et un éclairage qui utilisent toutes les ressources de la première partie du livre ; c’est ainsi, par exemple, que la théorie des formes quadratiques est constamment sollicitée pour une étude précise des faisceaux de cercles, des coniques. Nous souhaitons enfin rappeler que cette série a vu le jour grâce à notre ami Guy Auliac. Il en a conçu le projet et il est co-auteur des volumes d’Intégration et probabilités, ainsi que d’Analyse. Malgré sa maladie, il a travaillé à ces ouvrages avec l’enthousiasme, l’énergie et la compétence qui le caractérisaient. Il nous a maintenant quitté et nous lui dédions ces livres.
i
i i
i
i
i
i
i
Chapitre 1
Théorie des ensembles : rappels et compléments
© Dunod. La photocopie non autorisée est un délit.
Nous n’avons pas l’intention de présenter ici une théorie mathématique rigoureuse et complète. Il faudrait pour cela des prérequis de logique, un appareillage complexe, choisir entre différentes axiomatiques... Nous nous bornerons à une partie de la « théorie naïve des ensembles », selon l’expression de Paul Halmös (voir [18]).
1.1 ENSEMBLES, APPLICATIONS 1.1.1. Ensembles Acceptons la notion intuitive d’ensemble : un ensemble E est un objet mathématique ; si x est un objet mathématique, la relation d’appartenance x ∈ E est soit vraie, soit fausse, et les x pour lesquels elle est vraie sont appelés les éléments de E . Deux ensembles sont égaux s’ils ont exactement les mêmes éléments. Un ensemble est défini en extension si on en donne la liste des éléments, liste mise entre des accolades. Cas particulier : ∅ = {} est l’ensemble qui n’a aucun élément, on l’appelle ensemble vide ; {∅} est un ensemble qui a un élément : ∅ ∈ {∅}. Il est défini en compréhension lorsqu’on définit ses éléments par une propriété, exprimée sous forme d’une proposition mathématique. C’est dans ce second cas qu’il pourra être utile de se poser la question : mon ensemble peut-il être vide ? Admettons
i
i i
i
i
i
i
i
1 • Théorie des ensembles
2
qu’on connaisse l’ensemble des nombres entiers naturels N. On peut alors définir les ensembles : • P = {n ∈ N | ∃k ∈ N, n = 2k} • A = {n ∈ N | n | 60} • Q = {1, 2, 3, 4, 5, 6, 10, 12, 15, 20, 30, 60} • P = {p ∈ N | (∀n ∈ N, n | p ⇒ n = 1 ou n = p) et (p = 1)} • I = {a ∈ N | ∃b ∈ N, a2 − 1973b2 = −1} Il est facile de voir que l’ensemble P est formé des nombres pairs, l’ensemble P est formé des nombres premiers, les deux ensembles A et Q sont égaux, et quant à l’ensemble I , il n’est pas du tout immédiat de décider s’il est ou non vide 1. Mais étant donné un nombre a, on peut décider rapidement s’il est, ou non, dans l’ensemble I . On appelle sous-ensemble d’un ensemble E , un ensemble F tel que : ∀x ∈ F, x ∈ E , et on écrit F ⊂ E . L’ensemble vide et E lui-même sont des sous-ensembles de E .
Remarques • Un ensemble est défini en compréhension de la façon suivante A = {x ∈ E | p(x)}
et ses éléments sont a priori choisis dans un ensemble E , p étant une propriété qui a un sens pour les éléments de E . Si on ne fait pas cette restriction, on pourrait écrire : A = {x | x ∈ / x} et la proposition A ∈ A risque de donner des maux de têtes : est-elle vraie, mais alors elle est fausse ?... • Autre remarque : un « vrai » logicien ne fait pas la différence entre des êtres mathématiques qui seraient des ensembles, d’autres qui n’auraient vocation qu’à être des éléments. Dans la « vraie » théorie des ensembles, tout est ensemble.
1.1.2. Union et intersection de deux ensembles, produit cartésien Si A et B sont deux ensembles, on définit leur union A ∪ B et leur intersection A ∩ B par :
A ∪ B = {x | x ∈ A ou x ∈ B}
A ∩ B = {x | x ∈ A et x ∈ B}
Ce sont deux ensembles (et cela nécessite un axiome pour l’union, en vertu de la remarque précédente, alors que l’intersection peut être définie comme {x ∈ A | x ∈ B}). Les opérations ainsi définies ont des propriétés bien connues 1. Il est non vide : essayer avec a = 88526 et b = 1993.
i
i i
i
i
i
i
i
1.1 Ensembles, applications
3
que nous ne détaillerons pas. Signalons également la définition de la différence ensembliste A \ B = {x ∈ A | x ∈ / B} et rappelons que la proposition A ⊂ B est une abréviation de A ∩ B = A. Si A ⊂ B , l’ensemble B \ A s’appelle le complémentaire de A dans B . On va maintenant définir le couple (a, b) : c’est l’ensemble
(a, b) = {a, {a, b}} Cela permet d’obtenir l’équivalence :
(a, b) = (a , b )
(a = a et b = b )
⇐⇒
Ne pas confondre le couple (a, b) avec l’ensemble (la paire) {a, b} ; avec notre définition, le couple (a, a) désigne l’ensemble {a, {a}}. Cette définition des couples peut paraître inutilement abstraite, et elle masque la « symétrie » qu’il y a entre (a, b) et (b, a). Le produit cartésien 2 de deux ensembles est alors l’ensemble des couples :
A × B = {(a, b) | a ∈ A et b ∈ B} Enfin rappelons également que P(E) est l’ensemble de tous les sous-ensembles de E . Il contient en particulier l’ensemble vide et E lui-même.
1.1.3. Relations, Applications Des définitions : • Une relation binaire R est un sous-ensemble de A × B ; on écrit a R b plutôt que (a, b) ∈ R. © Dunod. La photocopie non autorisée est un délit.
• Une application de A dans B est une relation f qui vérifie :
∀a ∈ A,
∃b ∈ B,
af b
et
∀a ∈ A, ∀(b, b ) ∈ B × B, (a f b et a f b ) ⇒ (b = b ) Cela signifie qu’il y a toujours un b tel que tel que a f b et qu’il y a unicité de b. On écrit : f : A −→ B a −→ b = f (a) On peut composer des relations, R ⊂ A × B et S ⊂ B × C en posant pour x dans A et z dans C :
(x, z) ∈ R • S ⇐⇒ ∃y ∈ B
(x, y) ∈ R et (y, z) ∈ S
2. En l’honneur de René Descartes, qui a utilisé les couples de coordonnées pour repérer des points.
i
i i
i
i
i
i
i
1 • Théorie des ensembles
4
Dans le cas où R et S sont des applications, R • S est une application et :
z = R • S(x) ⇐⇒ ∃y ∈ B
y = R(x) et z = S(y)
et donc R • S sera une application telle que R • S(x) = S(R(x)). On préfère en ce cas noter z = R • S(x) = S ◦ R(x), c’est ce qu’on appelle « la loi rond ». L’ensemble des applications d’un ensemble A dans un ensemble B est noté B A (chercher une justification de cette notation...). On peut alors définir les applications injectives, surjectives et bijectives.
1.1.4. Familles, produit On appelle famille indexée par un ensemble I , une application de I dans un ensemble A. On note ai l’image de i ∈ I et (ai )i∈I la famille. Il est possible bien sûr que les a i soient eux-mêmes des ensembles. Si (A i )i∈I est une famille d’ensembles, il existe un ensemble qui est la réunion des ensembles A i ; on le note A= Ai i∈I
et il est caractérisé par :
a ∈ A ⇐⇒ ∃i ∈ I, a ∈ Ai Si I est de la forme I = {i1 , i2 }, on retrouve la réunion traditionnelle de deux ensembles. Si I est vide, la réunion est vide. Et si I est non vide, on peut définir l’intersection de la famille : B= Ai i∈I
caractérisée par :
a ∈ B ⇐⇒ ∀i ∈ I, a ∈ Ai Il y a un peu de subtilité dans ces définitions : l’intersection d’une famille vide I = ∅ ne peut être définie sans contradiction, (c’est lié à l’impossibilité d’accepter l’existence de l’ensemble de tous les ensembles) ; bien sûr, l’intersection peut être vide, par exemple quand l’un des A i est vide, mais pas seulement dans ce cas... De même qu’on a défini le produit cartésien de deux ensembles, définissons le produit d’une famille par : Ai = {f : I −→ Ai | f (i) ∈ Ai } i∈I
i∈I
Se donner un élément de ce produit, c’est finalement se donner une famille, indexée par I , de la forme (ai )i∈I où ai ∈ Ai pour tout i ∈ I , et si I a deux éléments, on retrouve (moyennant une identification : laquelle ?), le produit cartésien habituel.
i
i i
i
i
i
i
i
1.2 Cardinal d’un ensemble
5
Exercice 1.1. Examiner le rôle que joue ∅ vis-à-vis des opérations d’union, intersec-
tion, produit cartésien. Déterminer
A∅ , ∅A , ∅∅
Exercice 1.2. Déterminer P(∅), P (P(∅)), etc.
1.2 CARDINAL D’UN ENSEMBLE On ne peut se contenter d’une définition circulaire comme « le cardinal d’un ensemble est son nombre d’éléments ». Depuis Cantor, on procède en gros de la façon suivante : on dit que deux ensembles sont équipotents s’il existe une bijection de l’un vers l’autre, et on conviendra que le cardinal d’un ensemble est la « classe » de tous les ensembles qui sont en bijection avec lui. Attention, on ne peut parler d’« ensemble de tous les ensembles » sans contradiction. C’est pour cela qu’on a employé le terme un peu vague de classe.
© Dunod. La photocopie non autorisée est un délit.
1.2.1. Ensembles finis, infinis, dénombrables Commençons par admettre qu’on a défini l’ensemble des nombres entiers N : cet ensemble contient un élément noté 0 et tout élément n a un successeur, noté n + 1 ; deux éléments qui ont même successeur sont égaux, et 0 n’est pas un successeur. De plus, N a la propriété de récurrence, que l’on peut énoncer ainsi : pour tout F ⊂ N, on a 0∈F ⇒F =N ∀n ∈ N, (n ∈ F ⇒ n + 1 ∈ F ) On peut alors définir dans N l’addition, la multiplication et la relation d’ordre habituelle, que l’on appelle ordre naturel et que l’on note . Nous ne détaillerons pas ces constructions. En suivant la démarche proposée dans le cas général, on va définir les ensembles finis, infinis, dénombrables : • On dit qu’un ensemble A est fini s’il existe un entier n tel que A soit en bijection avec {1, . . . , n}3. • Un ensemble est infini s’il n’est pas fini, et dénombrable s’il est en bijection avec N. 3. Notation qui représente bien sûr l’ensemble {k ∈ N | 1 k n}
i
i i
i
i
i
i
i
1 • Théorie des ensembles
6
Dans le cas d’un ensemble fini E , l’entier n est appelé cardinal de E et est noté Card(E).
Remarque : Cette définition a un sens, car on peut démontrer (par récurrence) que si n = p, l’ensemble {1, . . . , n} et l’ensemble {1, . . . , p} ne sont pas en bijection. On dit également que le cardinal de l’ensemble vide est 0. On peut vérifier (voir par exemple la section suivante) que Q est dénombrable, mais un théorème célèbre attribué à Cantor affirme que R n’est pas dénombrable. Il est alors possible d’énoncer le théorème suivant : Théorème 1.1. Si E et F sont deux ensembles finis de même cardinal, toute injection (resp. surjection) de l’un dans l’autre, est bijective.
Avant de faire la démonstration, remarquons l’analogie avec le théorème qui concerne les applications linéaires entre espaces vectoriels de même dimension finie.
Démonstration. Il convient d’abord de montrer que si F est un sous-ensemble de F , alors F est fini, de cardinal inférieur à celui de F . De plus, l’inclusion est stricte si et seulement si Card(F ) < Card(F ). Ce lemme se démontre par récurrence sur le cardinal de F : si Card(F ) = 1, il est facile de déterminer tous les sous-ensembles de F et de vérifier le lemme. Supposons la proposition vraie pour tous les ensembles de cardinal n, et prenons F de cardinal n + 1, une bijection permet de supposer que F = {1, . . . , n + 1}. Soit F un sous-ensemble strict de F . On peut supposer, quitte à composer par une bijection, que F ne contient pas n+1, ainsi F est un sous-ensemble de {1, . . . , n}. Si cette inclusion est stricte, l’hypothèse de récurrence s’applique, F est fini de cardinal strictement inférieur à n donc à n + 1. Sinon, F coïncide avec {1, . . . , n}, il est de cardinal n, strictement inférieur à n + 1. Passons à la démonstration du théorème, et soit f injective de E dans F . Alors f (E) est un sous-ensemble de F , qui est en bijection avec E , donc de même cardinal que E donc que F . On en déduit que f (E) = F et que f est surjective. Le lecteur terminera la démonstration. 1.2.2. Théorème de Cantor-Bernstein Il n’est pas toujours facile de définir une bijection entre deux ensembles. Le théorème suivant, qui n’est pas complètement banal, permet de prouver que deux ensembles ont même cardinal. Théorème 1.2. Théorème de Cantor-Bernstein. Soit A et B deux ensembles. On
suppose qu’il existe une application f injective de A vers B , et une application g injective de B vers A. Alors A et B ont même cardinal.
Démonstration. Commençons par observer que tout élément de A a au maximum un antécédent par g. Et tout élément de B a au maximum un antécédent par f . Partant
i
i i
i
i
i
i
i
1.2 Cardinal d’un ensemble
7
d’un élément a de A, on peut construire une suite, éventuellement finie des antécédents successifs, par g puis par f , etc. • Si cette suite est infinie, on dit que a est dans A ∞ . • Si elle est finie, mais s’arrête en un élément de B , on dit que a est dans A 1 . • Sinon, elle est finie et s’arrête en A, ou elle est vide, (cas où a n’a pas d’antécédent par g), on dit que a est dans A0 . On a ainsi défini une partition de A et on va en déduire une bijection φ de A dans B . Si a ∈ A0 ou a ∈ A∞ , on pose φ(a) = f (a). Si a ∈ A1 , il a un antécédent par g, et on pose φ(a) = g −1 (a), notation un peu abusive pour désigner cet antécédent unique. On peut définir de même dans B trois ensembles B ∞ , B1 et B0 . • L’image de A∞ par φ est alors incluse dans B ∞ , puisque si a a une infinité d’antécédents successifs, f (a) aussi, et tout élément de B ∞ est l’image par φ d’un élément qui a une infinité d’antécédents successifs : φ restreint à A ∞ est donc bijective sur B∞ . • L’image de A0 est formée de f (a), où a a un nombre pair d’antécédents successifs ; les f (a) ont donc un nombre impair d’antécédents successifs, donc f (a) est dans B1 , et tout élément de B1 est l’image par φ d’un élément de A 0 , pour les mêmes raisons ; φ est bijective de A 0 sur B1 . • De même, φ réalise une bijection de A 1 sur B0 . En conclusion, φ est bien bijective de A sur B .
1.2.3. Le théorème de Cantor Il s’agit de montrer que E et P(E) n’ont pas le même cardinal. Théorème 1.3. Théorème de Cantor. Il n’existe pas de surjection d’un ensemble E © Dunod. La photocopie non autorisée est un délit.
dans l’ensemble de ses sous-ensembles P(E)
Démonstration. Supposons que f : E → P(E) soit surjective. L’image d’un élément de E est un sous-ensemble de E , et on peut donc considérer F = {x ∈ E | x ∈ / f (x)} Mais comme f est surjective, il existe y ∈ E tel que F = f (y). Si y ∈ F , c’est / f (y) soit y ∈ / F , contradiction. L’alternative y ∈ / F conduit à la même donc que y ∈ impasse, car y doit vérifier y ∈ f (y) = F , encore une contradiction 4. Il existe bien sûr une application injective de E dans P(E), et on peut donc dire que le cardinal de P(E) est strictement plus grand que le cardinal de E . 4. On pourra réfléchir à la phrase : le barbier de cette ville rase tous les hommes qui ne se rasent pas euxmêmes, et ceux-là seulement.
i
i i
i
i
i
i
i
1 • Théorie des ensembles
8
Exercice 1.3. Montrer que P(E) est en bijection avec {0, 1} E . En déduire le cardinal
de P(E) lorsque E est fini.
Exercice 1.4. Soit f l’application de N dans lui-même définie par f (n) = 2n, et g
l’application de N dans lui-même définie par g(n) = 3n. Décrire la bijection φ donnée par le théorème de Cantor-Bernstein. Si on échange les rôles de f et de g, que dire des bijections correspondantes ? Exercice 1.5. En utilisant le théorème de Cantor-Bernstein, montrer que N est en bijection avec N × N, puis que N est en bijection avec Q.
1.3 ENSEMBLES ORDONNÉS, BON ORDRE 1.3.1. Relations d’ordre Parmi les relations, on va privilégier maintenant des relations binaires définies dans E × E , et pour commencer, consacrons-nous aux relations d’ordre. Définition 1.4. Une relation binaire, notée dans E est une relation d’ordre
si elle a les trois propriétés : xx (réflexivité) (1) ∀x ∈ E , (x y et y x) ⇒ (x = y) (antisymétrie) (2) ∀(x, y) ∈ E × E, (transitivité) (3) ∀(x, y, z) ∈ E × E × E, (x y et y z) ⇒ (x z) Avant de donner des exemples, donnons quelques définitions supplémentaires. • Une relation d’ordre dans E permet parfois d’ordonner les éléments comme les points d’une droite. On dit qu’un ordre est total si
∀(x, y) ∈ E × E,
(x y
ou
y x)
c’est-à-dire si deux éléments quelconques sont toujours comparables. Une relation d’ordre qui n’est pas totale est dite partielle. • Un élément M de E est un majorant de A ⊂ E si
∀a ∈ A,
aM
• α est le plus grand élément de A lorsque
α∈A
et
∀a ∈ A,
aα
Et bien sûr, on définit de même minorant et plus petit élément. Deux notions un peu
i
i i
i
i
i
i
i
1.3 Ensembles ordonnés, bon ordre
9
plus difficiles : • s est borne supérieure de A si c’est le plus petit élément de l’ensemble des majorants de A. • un élément µ de A est maximal si
∀a ∈ A,
(µ a) ⇒ (a = µ)
Des exemples de relations d’ordre, de recherche de majorants, borne supérieures... sont donnés en exercice.
1.3.2. Bon ordre Autre vocabulaire, une relation d’ordre dans E est un bon ordre si on a la propriété : Toute partie non vide de E admet un plus petit élément. C’est le cas de N, qui sert un peu de modèle, et de ses sous-ensembles. Une première remarque Proposition 1.5. Un bon ordre est un ordre total.
Démonstration. Il suffit de dire que toute partie de la forme {a, b} admet un plus petit élément. En revanche, l’exemple de Z avec l’ordre naturel montre qu’un ordre total n’est pas forcément un bon ordre. C’est également le cas de R + , avec l’ordre naturel : les intervalles ouverts à gauche, par exemple, n’ont pas de plus petit élément. Passons maintenant à des considérations un peu plus délicates. Un théorème affirme : Théorème 1.6. Théorème de Zermelo. © Dunod. La photocopie non autorisée est un délit.
Tout ensemble peut être muni d’une relation de bon ordre. Ce théorème est un peu surprenant, si on pense à des ensembles « grands » comme R, pour lequel l’ordre naturel n’est certes pas un bon ordre. En fait, ce théorème résulte d’un axiome que nous n’avons pas encore énoncé, et qui est nommé l’axiome du choix. Axiome 1.7.Axiome du choix
Tout produit
i∈I
Ai d’ensembles non vides est non vide
Cet axiome est ainsi nommé car il signifie qu’il existe f dans ce produit, c’est-àdire une application de I dans la réunion de A i , telle que f (i) ∈ Ai pour tout i ; on dit que c’est une fonction de choix. Lorsque la famille est infinie, l’existence d’une telle fonction n’est pas évidente : il s’agit de « choisir » d’un seul coup une infinité d’éléments, sans forcément avoir un algorithme.
i
i i
i
i
i
i
i
1 • Théorie des ensembles
10
Terminons avec un troisième théorème, encore équivalent aux deux énoncés précédents : Théorème 1.8. Théorème de Zorn
Soit E un ensemble tel que toute partie P de P(E) qui est totalement ordonnée admet un majorant : on dit parfois que E est inductif. Alors E admet (au moins) un élément maximal. On peut déduire les théorèmes de l’axiome du choix, mais l’axiome est aussi impliqué par chacun des théorèmes. On va l’admettre, mais donnons néanmoins un exemple de démonstration : le théorème de Zorn implique le théorème de Zermelo.
Démonstration. Soit X un ensemble. On considère l’ensemble des parties de X qui peuvent être munies d’un bon ordre ; si A est une telle partie, on notera (A, ) le couple formé de cette partie et d’un bon ordre. Soit X l’ensemble de tous les couples possibles. Cet ensemble est non vide (il contient l’ensemble vide et l’ordre vide, et, si X est non vide, il contient les singletons), et il est muni d’un ordre partiel, le prolongement : on dira que A et B deux parties bien ordonnées de X vérifient A ≺ B si A ⊂ B et si l’ordre de B prolonge celui de A, les éléments de B \ A étant tous plus grands que ceux de A. Soit alors P une partie totalement ordonnée de X . La réunion des éléments de P est bien ordonnée et c’est donc un majorant des éléments de P . On en déduit que X contient un élément maximal M . Mais cet élément maximal est X lui-même, muni d’un bon ordre. En effet, si x ∈ X \ M , l’ensemble {x} ∪ M peut être muni d’un bon ordre (en prenant x supérieur à tous les autres éléments de M ), contredisant ainsi la maximalité de M . Reconnaissons qu’on n’utilise pas très souvent ces énoncés. Donnons un des exemples pour lesquels le théorème de Zorn est incontournable. Théorème 1.9. Tout espace vectoriel sur un corps K admet une base.
Démonstration. E est un espace vectoriel et V l’ensemble des systèmes libres. On peut ordonner V par l’inclusion, et si C est un sous-ensemble totalement ordonné de V , il admet un majorant, qui est la réunion des ensembles de C : cette réunion U est un système libre (car si un sous-ensemble fini de U donnait une relation de liaison, ce sous-ensemble serait inclus dans un des éléments de C , contradiction) et c’est un majorant de C . On en déduit que l’ensemble des systèmes libres admet un élément maximal : un tel élément B est une base ; si en effet un vecteur x n’était pas dans vect(B), l’ensemble B ∪ {x} serait libre, contradiction avec la maximalité de B .
Exercice 1.6. Justifier : l’unicité du plus grand élément, de la borne supérieure, (sous réserve d’existence). Montrer que si A admet un plus grand élément, c’est également sa borne supérieure. Donner un exemple où la borne supérieure de A existe, mais n’est pas plus grand élément de A.
i
i i
i
i
i
i
i
1.4 Relation d’équivalence, ensembles quotients
11
Exercice 1.7. Soit ∅ = A ⊂ R, où R est muni de la relation d’ordre . Montrer que s
est la borne supérieure de A si s vérifie : ∀a ∈ A, as ∀ > 0, ∃a ∈ A, s− < a s Exercice 1.8. Montrer que tout ordre dans E est « isomorphe » (en un sens à préciser)
à l’inclusion entre des sous-ensembles de E .
1.4 RELATION D’ÉQUIVALENCE, ENSEMBLES QUOTIENTS Une relation d’ordre introduit un ordonnancement, une hiérarchie, entre les éléments de E . Au contraire, une relation d’équivalence est associée à un regroupement en « classes ». Définition 1.10. Une relation binaire dans E est une relation d’équivalence si
elle a les trois propriétés : xRx (réflexivité) (1) ∀x ∈ E, (xRy) ⇒ (yRx) (symétrie) (2) ∀(x, y) ∈ E × E, (3) ∀(x, y, z) ∈ E × E × E, (xRy et yRz) ⇒ (xRz) (transitivité) La notion de relation d’équivalence est étroitement associée à la notion de partition : une famille (Ei )i∈I de sous-ensembles de E est une partition de E si : • i∈I Ei = E . © Dunod. La photocopie non autorisée est un délit.
• ∀i, j ∈ I,
(i = j) ⇒ (Ei ∩ Ej = ∅)
On obtient alors la partition associée à une relation d’équivalence par : Définition 1.11. À tout a ∈ E , on associe sa classe d’équivalence :
a = {b ∈ E | bRa} et les classes d’équivalence forment une partition de E . La démonstration est immédiate, et le lecteur vérifiera sans peine qu’à toute partition de E , on peut associer une relation d’équivalence. L’ensemble formé par les classes d’équivalence s’appelle le quotient de E par R, il est noté E/R. Ce vocabulaire s’explique aisément : on a divisé l’ensemble E en faisant des regroupements, dans le quotient, des éléments équivalents sont considérés comme identiques. Ce passage au
i
i i
i
i
i
i
i
1 • Théorie des ensembles
12
quotient est extrêmement fréquent en algèbre, nous en verrons des exemples dans les chapitres suivants. Commençons par un exemple général, avec E un ensemble muni d’une relation d’équivalence R. Définition 1.12. Soit f : E → F une application. On dit qu’elle est compatible avec R si
∀(a, b) ∈ E 2 ,
(aRb) ⇒ (f (a) = f (b))
Si une application est compatible avec R, elle « passe au quotient » : Proposition 1.13. Si f : E → F est une application compatible avec une relation d’équivalence R, il existe une unique application f : E/R → F telle que f (a) = f (a).
La vérification est directe : l’important est que f est bien définie par la relation cidessus, par définition d’une application compatible. Si on appelle p l’application qui à a associe a (p est la projection), on a f = f ◦ p. Enfin, supposons que E soit muni d’une loi de composition, c’est-à-dire d’une application : E × E −→ E (x, y) −→ x ∗ y alors on dit que la loi est compatible avec la relation dès que : a R a ∀(a, a , b, b ) ∈ E 4 , ⇒ (a ∗ b) R (a ∗ b ) b R b On en déduit alors, comme ci-dessus, une loi de composition dans l’ensemble quotient E/R, définie par : a∗ b = a ∗ b On vérifie que cette définition a un sens.
Exercice 1.9. Que dire d’une relation qui est à la fois d’ordre et d’équivalence ?
Exercice 1.10. Soit T strictement positif. On suppose que R est la relation définie sur
R par
aRb ⇐⇒ a − b ∈ ZT Que signifie qu’une application de R dans R est compatible avec R ? Caractériser de la même façon les fonctions paires.
i
i i
i
i
i
i
i
1.5 Rappels d’arithmétique élémentaire
13
Exercice 1.11. Soit E l’ensemble des relations définies sur E . On définit dans E une
relation par :
R ≺ S ⇐⇒ (∀(a, b) ∈ E 2 ,
(a R b) ⇒ (a S b))
Montrer que c’est une relation d’ordre, et que E possède un plus petit élément et un plus grand élément que l’on précisera.
1.5 RAPPELS D’ARITHMÉTIQUE ÉLÉMENTAIRE Donnons sans démonstration quelques notations et résultats d’arithmétique dans l’ensemble Z des entiers relatifs.
1.5.1. Divisibilité, congruence Si a et b sont des éléments de Z, on dit que a divise b, ou que b est un multiple de a s’il existe k dans Z tel que b = ak. Cela s’écrit a | b. Restreinte à N, c’est une relation d’ordre et alors :
© Dunod. La photocopie non autorisée est un délit.
a | b ⇐⇒ bZ ⊂ aZ On dit que a et b sont congrus modulo n lorsque a − b est divisible par n. Cela s’écrit a ≡ b (mod n). La congruence modulo n est une relation d’équivalence et l’ensemble des classes d’équivalence est noté Z/nZ. Cette relation de congruence est compatible avec les opérations + et × de Z : a ≡ a (mod n) ⇒ a + b ≡ a + b (mod n) et ab ≡ a b (mod n) b ≡ b (mod n)
1.5.2. Bézout et Gauss Deux entiers de Z sont premiers entre eux s’ils n’ont d’autres diviseurs communs que 1 et −1. On écrit alors a∧b = 1. Il est équivalent de dire (c’est le théorème de Bézout), que l’équation ax + by = 1 admet au moins une solution (x, y) dans Z 2 . Le théorème de Gauss relie divisibilité et nombres premiers entre eux : a | bc ⇒a|c a∧b=1
i
i i
i
i
i
i
i
1 • Théorie des ensembles
14
1.5.3. p.g.c.d. et p.p.c.m. Si a et b sont dans Z, leur p.g.c.d. est l’entier naturel d défini par aZ + bZ = dZ, et leur p.p.c.m. est l’entier naturel m défini par aZ ∩ bZ = mZ. Le p.g.c.d. est le plus grand diviseur commun en ce sens que si d divise à la fois a et b alors d divise d. De la même façon, m est le plus petit commun multiple. On écrit a ∧ b = d pour désigner le p.g.c.d. et deux nombres sont premiers entre eux si leur p.g.c.d. est égal à 1. On écrit a ∨ b = m pour désigner le p.p.c.m. Résultats utiles : ⎧ ⎪ ⎨∃a ∈ Z, a = a d a ∧ b = d ⇐⇒ ∃b ∈ Z, b = b d ⎪ ⎩a ∧ b = 1
(a ∧ b)(a ∨ b) = |ab|
1.5.4. Nombres premiers Un entier naturel p est premier s’il n’a pas d’autres diviseurs dans N que 1 et luimême. L’ensemble P des nombres premiers est assez mystérieux, sujet de nombreuses conjectures ; il y a une infinité de nombres premiers (résultat du à Euclide), ils se raréfient mais on ignore par exemple s’il existe une infinité de nombres premiers jumeaux, c’est-à-dire de la forme n, n + 2 comme 11 et 13. Une autre propriété. Proposition 1.14. Lemme d’Euclide.
Si p est premier, alors p | ab ⇒ p | a ou p | b.
Démonstration. Si p est premier et si a est dans Z, alors p ∧ a = 1 ou p ∧ a = p, car p n’a que 1 et p comme diviseur dans N. Si donc p divise ab et ne divise pas a, il est premier à a et, par le théorème de Gauss, il divise b.
EXERCICES Exercice 1.12. Dans l’ensemble E des relations binaires sur E , on définit la composi-
tion par :
a R • S b ⇐⇒ ∃c ∈ E, aSc et cRb C’est alors une opération toujours définie. Examiner ses propriétés : est elle associative, commutative ? Le composé de deux relations réflexives l’est-il ? Et de deux relations symétriques ? Transitives ? Si on note A∆B l’ensemble (A \ B) ∪ (B \ A), vérifier que (P(E), ∆, ∩) est un anneau commutatif, (avec ∆ dans le rôle de l’addition et ∩ dans le rôle de la multiplication). Exercice 1.13.
i
i i
i
i
i
i
i
Problème
15
Exercice 1.14. La relation dite équivalent entre deux suites est-elle une relation d’équivalence ? Que dire des suites qui sont équivalentes à une suite stationnaire ? Exercice 1.15. Soit R une relation réflexive sur E . On note R −1 la relation définie
par xR−1 y ⇐⇒ yRx. On note S la relation définie par :
xSy ⇐⇒ ∃n ∈ N, x0 , x1 , . . . , xn | x = x0 R1 x1 R2 x2 . . . Rn xn = y avec Ri = R ou R−1 . Montrer que S est la plus petite relation d’équivalence qui contienne R. Comment interpréter S lorsque R représente « est l’enfant de » ? Exercice 1.16. f et g sont deux applications de A dans B (resp. de B dans A). On suppose que f ◦ g est injective : peut-on affirmer que f ou que g est injective ? Même question avec surjective. On suppose maintenant que f ◦ g = id B et g ◦ f = idA . Montrer que f et g sont bijectives et réciproques l’une de l’autre.
Exercice 1.17. Examiner les relations suivantes : sont-elles des relations d’ordre total, partiel, y-a-t-il des plus petits ou plus grands éléments, majorants, bornes supérieures pour E , pour une partie de E , des éléments maximaux ou minimaux ?
– Les ensembles de nombres N, Z, Q, C pour l’ordre naturel (c’est-à-dire habituel...). – N pour la relation « divise ». – L’ensemble P(E) des parties d’un ensemble pour la relation d’inclusion. – N × N pour la relation d’ordre produit
(a, b) (a , b ) ⇐⇒ a a et b b © Dunod. La photocopie non autorisée est un délit.
puis pour l’ordre lexicographique :
(a, b) (a , b ) ⇐⇒ a < a ou a = a et b b
PROBLÈME Le corrigé de ce problème est disponible sur le site de Dunod : www.dunod.com.
1.1. MATRICE D’INCIDENCE, MATRICE DE MÖBIUS On considère un ensemble ordonné fini P , la relation d’ordre sera notée . Soit n le cardinal de P , on notera a1 , . . . an ses éléments. On appelle matrice d’incidence de P toute matrice M de Mn (C) ayant la propriété :
∀i, j, ai aj ⇒ mi,j = 0
i
i i
i
i
i
i
i
1 • Théorie des ensembles
16
(1) Dans cette question, on suppose que n = 3. Décrire l’ensemble des matrices d’incidence lorsque l’ordre est défini par
a1 a2 a3 ,
a2 a1 et a2 a3
puis par
On suppose implicitement qu’il n’y a pas d’autre relations (à part bien sûr a i ai pour tout i). (2) Montrer que l’ensemble E des matrices d’incidence est un sous-espace vectoriel de Mn (C) et qu’il est stable pour le produit. La matrice de l’identité est-elle une matrice d’incidence ? (3) On veut montrer que si une matrice d’incidence est inversible, alors son inverse est aussi une matrice d’incidence. Cette question est plus difficile : (a) On commence par supposer que l’on a :
∀(i, j) ∈ {1, . . . , n}2 ,
ai aj ⇒ i j
Démontrer qu’alors les matrices d’incidence sont triangulaires supérieures. (b) Montrer que si une matrice d’incidence est inversible, alors son inverse est aussi une matrice d’incidence. On pourra raisonner par l’absurde. (c) Montrer que si P = {a1 , a2 , . . . , an } est muni d’une relation d’ordre, il existe une permutation σ de Sn telle que :
∀(i, j) ∈ {1, . . . , n}2 ,
aσ(i) aσ(j) ⇒ i j
En déduire le résultat dans le cas général. (4) Soit Z = (zi,j )i,j la matrice définie par :
∀(i, j) ∈ {1, . . . , n}2 ,
ai aj ⇒ zi,j = 0,
ai aj ⇒ zi,j = 1
C’est donc une matrice d’incidence. Montrer qu’elle est inversible. On appelle matrice de Möbius la matrice inverse Z −1 . On notera mi,j l’élément d’indice (i, j) de cette matrice. (5) On suppose que P est l’ensemble {1, 2, . . . , n} muni de l’ordre naturel, et on note ai = i. Décrire la matrice Z associée ainsi que la matrice de Möbius Z −1 . (6) On suppose que P est l’ensemble {1, 2, . . . , n} muni de l’ordre « divise », et on prend encore ai = i. Décrire la matrice Z associée. Montrer que les coefficients de la forme m(k, ) vérifient : – m(k, k) = 1 – ∀(k, ) ∈ {1, 2, . . . , n}, k ⇒ m(k, ) = 0
– ∀(k, ) ∈ {1, 2, . . . , n}, (k | , k = ) ⇒ k|d| m(k, d) = 0, la somme portant donc sur les tous les d qui sont multiples de k et qui divisent . Vérifiez que ces relations suffisent à déterminer les coefficients µ(k, ). (7) On définit la fonction de Möbius sur N par :
µ(1) = 1,
µ(p1 p2 . . . pk ) = (−1)k , si les pi sont des premiers distincts
i
i i
i
i
i
i
i
Solutions des exercices
17
et µ est nul dans tous les autres cas. Montrer que µ(δ) = 0 δ|
lorsque > 1. On utilisera la décomposition en facteurs premiers de
et on cherchera ses diviseurs. En déduire que, lorsque k | on a m(k, ) = µ k (8) Démontrer la « formule d’inversion de Möbius », lorsque (u n ) et (vn ) sont deux suites numériques : n ud un = vd ⇐⇒ vn = µ d d|n
d|n
(9) Si on note φ(n) le cardinal des entiers k de {1, 2, . . . , n} qui sont premiers avec n (φ est l’indicateur d’Euler), montrer que : n φ(n) = dµ d d|n
puis
φ(n) = n
p∈P,p|n
1 1− p
où P désigne l’ensemble des nombres premiers. (10) Quel est l’analogue de la formule d’inversion de Möbius lorsqu’on prend l’ordre naturel au lieu de l’ordre divise ?
© Dunod. La photocopie non autorisée est un délit.
SOLUTIONS DES EXERCICES
Solution 1.1. On a facilement A ∪ ∅ = A, A ∩ ∅ = ∅. De même, ∅ × A = ∅.
A∅ = {∅}. En effet, A∅ est un sous-ensemble de
P(A × ∅) = P(∅) = {∅} la seule relation définie dans A × ∅ est ∅. Le résultat est le même que A soit vide ou non. Reste à savoir si cette relation est fonctionnelle : la phrase
∀x ∈ A, ∃y ∈ B, xRy est vraie si A est vide, si A et B sont vides, mais pas si A est non vide et B vide. Ainsi, si A est non vide, A∅ = {∅}, ∅∅ = {∅}, ∅A = ∅
i
i i
i
i
i
i
i
1 • Théorie des ensembles
18
Solution 1.2.
P(∅) = {∅},
P({∅}) = {∅, {∅}}
P({∅, {∅}}) = {∅, {∅}, {{∅}}, {∅, {∅}}}
et on pourra continuer si on supporte ses innombrables accolades...
Solution 1.3. À une partie A de E on associe l’application de E dans {0, 1} appelée
fonction caractéristique, notée 1 A et définie par :
1A (x) = 1 si x ∈ A /A 1A (x) = 0 si x ∈ L’application A → 1A de P(E) dans {0, 1}E est bijective car à toute application f de E dans {0, 1} correspond une seule partie de E , celle définie par A = f −1 (1). On en déduit donc que, si E est fini, P(E) est de cardinal 2 Card(E) . On prolonge ce résultat au cas infini : si ℵ0 (lire aleph zéro) est le cardinal de N, alors le cardinal de P(N) est 2ℵ0 , que l’on note ℵ1 .
Solution 1.4. Notons A = N, B = N. Pour qu’un entier ait un antécédent par f il doit être pair, pour qu’un entier ait un antécédent par g il doit être multiple de trois. Ainsi, A0 est formé des entiers de la forme 2 k 3k m où k k , (avec m premier à 2 et à 3) tandis que A1 est formé des entiers de la forme 2 k 3k m où k < k . L’ensemble A∞ est réduit à 0. Ainsi φ est définie par :
⎧ ⎪ ⎨0 → 0 2k 3k m → 2k+1 3k m ⎪ ⎩2k 3k m → 2k 3k −1 m
si k k si k < k
avec toujours m premier à 2 et 3. On peut vérifier que φ est bijective, en se contentant par exemple de visualiser le passage de (k, k ) à (k + 1, k ) ou (k, k − 1) sur un quadrillage. L’application réciproque est obtenue en échangeant les rôles de A et B , donc de 2 et 3.
i
i i
i
i
i
i
i
Solutions des exercices
19
Solution 1.5. Il suffit de trouver une injection f de N dans N × N et une injection g
de N × N dans N. On peut prendre f (n) = (n, 0) et, par exemple, g(n, n ) = 2n 3n . Il est moins immédiat (et c’est inutile par le théorème de Cantor-Bernstein) de décrire une bijection : en utilisant que tout entier s’écrit de façon unique comme une puissance de 2 fois un entier impair : (n, m) → 2n (2m + 1) − 1 (le −1 pour ne pas oublier 0). Il existe de même une injection de N dans Q, donnée par n → n1 et une injection de Q dans N × N, donnée par pq → (2p, q) si p est positif, pq → (−2p + 1, q) si p est strictement négatif (en prenant l’écriture irréductible d’un rationnel).
Solution 1.6. Si α est le plus grand élément de A ⊂ E et β aussi. Alors α et β
sont dans A et α ≺ β , puisque β est plus grand élément, de même β ≺ α et par antisymétrie, α = β . Si A admet une borne supérieure, elle est donc unique puisque c’est le plus petit élément de l’ensemble des majorants. Soit maintenant A un sous-ensemble de E qui admet un plus grand élément α. Par définition du plus grand élément, α est un majorant de A. Si m est un majorant de A, il est plus grand que tous les éléments de A, donc de α : α est le plus petit élément de l’ensemble des majorants de A, c’est la borne supérieure de A. L’exemple dans l’ensemble R des intervalles de la forme [a, b[ montre que la borne supérieure peut exister sans qu’il y ait de plus grand élément.
© Dunod. La photocopie non autorisée est un délit.
Solution 1.7.
∀a ∈ A, as ∀ > 0, ∃a ∈ A, s− < a s
Supposons que s vérifie ces propriétés : la première indique que s est un majorant de A. Soit M un majorant quelconque de A, alors s M , sinon, en notant = s − M , la seconde propriété impliquerait qu’il existe a ∈ A vérifiant s − = M < a s, contradiction. On a montré que s est le plus petit des majorants. La réciproque se traite de la même façon. Cette « propriété de la borne supérieure » s’utilise constamment en analyse. Solution 1.8. Si E est un ensemble ordonné, on peut commencer par définir les
segments initiaux par :
∀x ∈ E, φ(x) = {y ∈ E | y ≺ x} On a ainsi défini une application φ de E dans P(E), et cette application est injective : si I est un segment initial, il est égal à φ(x) où x est l’unique plus grand élément de I . Enfin, x ≺ y ⇒ (∀z ∈ E, z ≺ x ⇒ z ≺ y) donc x ≺ y ⇒ φ(x) ⊂ φ(y). On a ainsi un isomorphisme d’ensemble ordonnés, c’est-à-dire une bijection qui conserve l’ordre.
i
i i
i
i
i
i
i
1 • Théorie des ensembles
20
Solution 1.9. Une relation qui est à la fois d’ordre et d’équivalence est à la fois symétrique et antisymétrique : dès que xRy , on a yRx donc x = y . Comme la relation est non vide (réflexivité), c’est l’égalité.
Solution 1.10. Une fonction f est compatible avec la relation R lorsque f (a) = f (b)
dès que ∃k ∈ Z, a = b + kT . Cela signifie que f est périodique, T est une période. En particulier, f « passe au quotient », c’est-à-dire que l’on peut définir f de R/T Z dans R par f (a) = f (a). Une fonction paire est une application compatible avec la relation xRy ⇐⇒ x = ±y .
Solution 1.11. Cette relation est en fait l’inclusion dans l’ensemble P(E × E). Elle
a donc un plus petit élément qui est la relation vide (jamais vraie) et un plus grand élément qui est E × E , la relation toujours vraie.
Solution 1.12. Montrons que la composition est associative :
a((S • R) • T )b
⇐⇒ ⇐⇒
∃c ∈ E, a(S • R)c et cT b ∃c ∈ E, ∃d ∈ E, aSd et dRc et cT b
et la traduction de a(S • (R • T )b est identique. Cette opération n’est pas commutative dès que E est assez grand : prendre E = {a, b}, R la relation réduite à (a, b) et S la relation réduite à (b, a). Alors R • S et S • R diffèrent. Le composé de deux relations réflexives l’est car
∀a, ∃c, aRc et cSa il suffit de prendre c = a. Si deux relations sont symétriques, leur composé ne l’est pas forcément mais :
aR • Sb ⇒ ∃c ∈ E, aRc et cSb ⇒ ∃c ∈ E, cRa et bSc ⇒ bS • Ra Enfin, le composé de deux relations transitives ne l’est pas forcément, il suffit de bâtir un contre-exemple. On pourra prolonger cet exercice en cherchant un élément neutre, en définissant la relation réciproque d’une relation...
Solution 1.13. Pour vérifier les propriétés de ces opérations, il est pratique de se servir des fonctions caractéristiques vues dans l’exercice 1.3 page 18. On a en effet :
1A∩B = 1A 1B
et
1A∆B = 1A + 1B − 2 × 1A∩B
i
i i
i
i
i
i
i
Solutions des exercices
21
formules que l’on vérifie en examinant tous les cas possibles. Il est alors plus agréable de décider que les fonctions caractéristiques sont à valeur dans Z/2Z, d’où 1A∆B = 1A + 1B . On montre alors par exemple la distributivité par
1A∩(B∆C) = 1A 1B∆C = 1A (1B + 1C ) 1(A∩B)∆(A∩C) = 1A 1B + 1A 1C L’associativité de la différence symétrique résulte alors du calcul :
1(A∆B)∆C
= 1A∆B + 1C = 1A + 1B + 1C
et le calcul de 1A∆(B∆C ) donne le même résultat. L’élément neutre pour l’addition ∆ est ∅ (dont la fonction caractéristique est constante nulle), l’élément neutre pour le produit ∩ est l’ensemble E tout entier. L’opposé de A est lui-même. Solution 1.14. Soit E l’ensemble des suites à valeurs réelles. Deux suites (u n ) et
(vn ) sont équivalentes lorsqu’il existe une suite ( n ) tendant vers 0 telle que : ∀n ∈ N
vn = (1 + n )un
Avec cette définition, l’équivalence n’est pas une relation d’équivalence... Il n’ y a pas symétrie dans le cas où v n est nulle pour certaines valeurs de n sans que u n le soit. Mais il suffit de remplacer la définition par :
© Dunod. La photocopie non autorisée est un délit.
∃n0 ∈ N, ∀n n0 ∈ N
vn = (1 + n )un
pour avoir la symétrie, n 0 dépend des deux suites. Alors 1 n vn = (1 + n )un ⇒ un = vn = 1 − vn 1 + n 1 + n pour n suffisamment grand (car n tendant vers 0 sera différent de −1 pour tous les n suffisamment grands). La réflexivité est immédiate, on prend pour n la suite constante nulle. Pour la transitivité : vn = (1 + n )un ⇒ wn = (1 + n + n + n n )un wn = (1 + n )vn Si une suite est équivalente à une suite stationnaire de limite non nulle , alors elle converge vers . Réciproquement, si une suite converge vers non nul, alors un = + n = (1 + n ), et (un ) est donc équivalente à la suite constante . Par contre, une suite est équivalente à la suite constante nulle si et seulement si elle est stationnaire nulle. Solution 1.15. La relation S contient la relation R, avec ce qu’il faut pour être une relation d’équivalence. Il faut comprendre que x 1 Rx2 Rx3 abrège x1 Rx2 et x2 Rx3 . La relation S est bien d’équivalence : elle est réflexive : on prend n = 1, R 1 = R. Elle est symétrique : si xSy , on a également ySx, on reprend la même succession dans l’ordre inverse, en changeant R en R −1 . Enfin, S est transitive : si xSy et ySz ,
i
i i
i
i
i
i
i
1 • Théorie des ensembles
22
il suffit de faire se succéder les deux suites pour relier x à z . Une relation d’équivalence contenant R doit contenir tous les éléments de S : on peut formaliser davantage, en faisant une récurrence sur la longueur des suites. Pour l’exemple proposé (en ajoutant la réflexivité), on pourra interpréter S par « est de la même famille que ». Solution 1.16. Supposons f ◦ g injective, et prenons a et a dans A. Si g(a) = g(a )
alors f ◦ g(a) = f ◦ g(a ) d’où a = a . On a montré que g est injective. Supposons maintenant f ◦ g surjective. Alors un élément quelconque b de B a un antécédent b par f ◦ g, b = f ◦ g(b ), et b admet g(b ) comme n antécédent par f , f est surjective. Prenons A = B = N, g(n) = 2n et f (n) = 2 (où [x] désigne la partie entière de x). Alors, f ◦ g = idN , g est injective, f est surjective, aucune des deux n’est bijective.
Par contre, si f ◦ g = idB et g ◦ f = idA , f et g sont bijectives. Si b ∈ B , il a un antécédent unique par f , et comme b = f ◦ g(b), cet antécédent est g(b) donc g = f −1 .
Solution 1.17.
• Pour l’ordre naturel, qui est total, une partie de N a toujours un plus petit élément, elle admet un plus grand élément si elle est majorée. Toute partie de Z admet un plus petit élément si elle est minorée, un plus grand si elle est majorée. Par contre, il existe des parties de Q qui n’ont pas de plus grand élément ni même de borne supérieure bien qu’elles soient majorées ; l’exemple le plus simple est celui de
A = {x ∈ Q | x2 < 2} C’est ce « défaut » qui conduit à la construction des nombres réels. Dans R, toute partie non vide et majorée admet une borne supérieure. • Pour l’ordre divise, une partie comme {2, 3} n’a ni plus petit, ni plus grand élément. Par contre, toute partie finie admet une borne supérieure, son p.p.c.m., et une borne inférieure, son p.g.c.d. Attention, avec notre définition de la relation d’ordre divise, N admet un plus petit élément 1 et un plus grand élément...0. On n’a donc pas toujours a | b ⇒ a b. • P(E) muni de l’inclusion a un plus petit élément ∅ et un plus grand élément E . L’ordre n’est pas total (sauf si E est de cardinal 0 ou 1), et toute partie non vide de P(E) a une borne supérieure qui est la réunion de ses éléments, une borne inférieure qui est leur intersection. • L’ordre produit est de façon immédiate une relation d’ordre, il n’est pas total, car (1, 2) et (2, 1) par exemple ne sont pas comparables. Il est instructif de visualiser cet ordre : on représente les points à coordonnées entières dans le plan, et les couples supérieurs au couple (a, b) sont dans un quart de plan limité par les droites x = a et y = b, (en haut à droite) les éléments inférieurs sont dans un rectangle limité par les mêmes droites et les axes. On pourra facilement utiliser cette représentation pour examiner les parties qui ont un plus grand élément, et pour justifier que toute partie majorée admet une borne supérieure, que toute partie admet une borne inférieure.
i
i i
i
i
i
i
i
Solutions des exercices
23
Parties non vides bien sûr. En ce qui concerne l’ordre lexicographique, commençons par dire qu’il s’inspire de l’ordre alphabétique : un mot commençant par A se place avant un mot commençant par B , C ,..., et si deux mots commencent par A, on compare les secondes lettres. Le fait que l’ordre lexicographique est un ordre demande des vérifications. Montrons par exemple la transitivité. On suppose que
(a, b) (c, d) ⇐⇒ (a < c)
(1)
ou (a = c et b d)
(2)
(c, d) (e, f ) ⇐⇒ (c < e)
(3)
ou (c = e et d f )
(4)
© Dunod. La photocopie non autorisée est un délit.
Comme, dans chacune des hypothèses, les possibilités 1 et 2 (resp. 3 et 4) s’excluent, il suffit d’observer que ((1) et (3) ou (1)) et (4) ou ((2) et (3)) impliquent a < e, puis que ((2) et (4)) impliquent a = e et b f pour établir la transitivité. L’ordre lexicographique est total, et une preuve « géométrique » apparaît si on utilise une représentation graphique comme pour l’ordre produit. Cette fois, l’ensemble des couples plus grands que (a, b) et l’ensemble des couples plus petits constituent une partition de N × N. Pour conclure, c’est aussi un bon ordre, mais différent de celui de N : il existe des sous-ensembles infinis qui ont un plus grand élément, comme {0} × N ∪ (1, 0).
i
i i
i
i
i
i
i
i
i i
i
i
i
i
i
Chapitre 2
Anneaux et corps
L’ensemble Z des entiers relatifs, muni de l’addition et de la multiplication est le prototype des anneaux. Le but de ce chapitre est de chercher comment on peut généraliser à un anneau quelconque les propriétés de divisibilité de Z.
2.1 ANNEAUX, SOUS-ANNEAUX, IDÉAUX
© Dunod. La photocopie non autorisée est un délit.
2.1.1. Définitions et exemples Définition 2.1. Un anneau (A, +, ×) est un ensemble non vide dans lequel on
a défini une addition + et une multiplication × telles que : • (A, +) est un groupe commutatif d’élément neutre 0 A .
• la multiplication est associative, distributive à gauche et à droite sur l’addition, et possède un élément neutre 1 A . Si la multiplication est commutative, on dit que A est un anneau commutatif. Les ensembles de nombres
Z⊂D⊂Q⊂R⊂C⊂H (entiers relatifs, décimaux, rationnels, réels, complexes, quaternions) sont des anneaux pour les opérations habituelles. Il existe beaucoup d’anneaux entre Z et Q, construits
i
i i
i
i
i
i
i
2 • Anneaux et corps
26
comme l’anneau des décimaux ou autrement, et beaucoup entre Z et C, comme l’anneau des entiers de Gauss Z[i] que nous étudions dans un problème en fin de chapitre. Comme d’habitude, le produit a × b sera souvent noté par juxtaposition ab, aa s’écrira a2 , etc. Un autre exemple d’anneau est l’anneau nul, qui ne contient que 0, les opérations étant 0 + 0 = 0 et 0 × 0 = 0. Montrons le petit théorème suivant : Proposition 2.2. Dans un anneau, 0A × a = a × 0A = 0A et si A n’est pas l’anneau
nul, 0A = 1A ,
Démonstration. 0A a = (0A + 0A )a = 0A a + 0A a
donc
0A a = 0A
en ajoutant l’opposé de 0A a. Par ailleurs, si 1A = 0A , alors pour tout a de l’anneau, a = 1A a = 0A a donc a = 0A , et l’anneau A ne contient que 0A . Beaucoup d’énoncés ne seront vrais que pour les anneaux non nuls. Autres exemples d’anneaux : • les anneaux résiduels de la forme Z/nZ, anneaux finis de cardinal n. • les anneaux de matrices Mn (K) ou Mn (A), à coefficients dans un corps ou dans un anneau commutatif, les anneaux d’endomorphismes d’un espace vectoriel. • les anneaux d’applications d’un ensemble E dans un corps (ou un anneau), pour les opérations définies par :
f + g : x −→ f (x) + g(x)
et
f × g : x −→ f (x)g(x)
• les anneaux de polynômes, à coefficients dans un anneau ou dans un corps commutatifs. Ces anneaux partagent beaucoup de propriétés avec l’anneau des entiers, mais... pas toutes. Un des objectifs de ce chapitre est de « comprendre » les propriétés arithmétiques de Z, et de chercher comment et à quel point elles peuvent se généraliser.
2.1.2. Inversibles et diviseurs de zéro Un élément a d’un anneau est inversible s’il existe a −1 dans l’anneau tel que aa−1 = a−1 a = 1. On dit également que c’est une unité. Dans un anneau non commutatif, un élément peut n’être inversible que à gauche ou que à droite : voir des exemples en exercice. Rappelons également que le produit de deux éléments inversibles a et b est inversible, d’inverse b −1 a−1 . Il est donc immédiat que : Proposition 2.3. L’ensemble A× des éléments d’un anneau qui sont inversibles est
un groupe pour la multiplication.
i
i i
i
i
i
i
i
2.1 Anneaux, sous-anneaux, idéaux
27
Une propriété utile pour les calculs : Définition 2.4. a ∈ A est régulier à gauche si
∀(x, y) ∈ A2 ,
(ax = ay) ⇒ (x = y)
Cette propriété est moins forte que l’inversibilité car Proposition 2.5. Si a ∈ A est inversible à gauche, alors a est régulier à gauche.
Démonstration. (ax = ax ) ⇒ (a−1 (ax) = a−1 (ax )) ⇒ x = x On peut également définir les éléments réguliers à droite, réguliers des deux côtés (on dira simplement réguliers). La notion « contraire » est également utile. Définition 2.6. Un élément a d’un anneau A est un diviseur de zéro à gauche, s’il est non nul, et s’il existe b non nul tel que ab = 0.
Proposition 2.7. a ∈ A est non nul et non diviseur de zéro à gauche si et seulement si il est régulier à gauche.
Démonstration. Supposons a non nul et non diviseur de zéro à gauche ∀(b, b ) ∈ A2 ,
ab = ab ⇒ a(b − b ) = 0 ⇒ b = b
© Dunod. La photocopie non autorisée est un délit.
et dans l’autre sens, si ab = 0, on a ab = a0, donc si a est régulier à gauche, b = 0 et a n’est pas diviseur de zéro à gauche. Les mêmes énoncés s’étendent au cas à droite. L’ensemble des réguliers peut contenir strictement l’ensemble des inversibles, c’est par exemple le cas dans Z. Parmi les anneaux connus : (1) Les inversibles de Z sont 1 et −1. Les éléments réguliers sont tous les éléments non nuls. (2) Les inversibles et les réguliers de Z/nZ sont les k où k est premier à n. (3) Les inversibles et les réguliers de M n (K) sont les matrices de déterminant non nul. La recherche des réguliers de M n (K) est proposée en exercice. Pour les inversibles de Z/nZ, rappelons l’équivalence qui fait tout fonctionner :
∃k , k k = 1 (mod n) ⇐⇒ ∃k ∈ Z, ∃ ∈ Z, kk − n = 1 ⇐⇒ k ∧ n = 1
i
i i
i
i
i
i
i
2 • Anneaux et corps
28
d’après le théorème de Bezout. L’algorithme d’Euclide permet de trouver une solution explicite rapidement. Par ailleurs, si k ∧ n = d avec d différent de 1 et de n, alors k est diviseur de zéro. En effet,
k = k d, n = n d
donc
kn = k n
soit k n = 0
avec n = 0. On peut aussi utiliser l’exercice 2.1. Terminons ces généralités par deux définitions : Définition 2.8.
• Un anneau non nul est intègre s’il n’a pas de diviseur de zéro. • Un anneau non nul est un corps si tous ses éléments non nuls sont inversibles. Comme un inversible n’est jamais diviseur de zéro, un corps est intègre. Rappelons le cas bien connu : Proposition 2.9. L’anneau Z/nZ est un corps si et seulement si n est un nombre premier p, on le note alors F p
qui résulte de l’examen des inversibles de Z/nZ évoqués ci-dessus.
2.1.3. Sous-anneaux, idéaux Si A est un anneau, un sous-ensemble non vide B est un sous-anneau de A s’il est un sous-anneau pour les mêmes opérations, et avec le même élément neutre 1 A = 1B 1. On vérifie facilement que : Proposition 2.10. B est un sous-anneau de A si et seulement si
∀(x, y) ∈ B 2 , ∀x ∈ B, 1A ∈ B.
x + y ∈ B, xy ∈ B. −x ∈ B.
L’intersection d’une famille non vide (B i )i∈I de sous-anneaux de A est un sousanneau de A, ce qui permet de donner la définition : Définition 2.11. Si A est un anneau et X un sous-ensemble non vide de A,
le sous-anneau de A engendré par X est l’intersection des sous-anneaux de A qui le contiennent. C’est aussi le plus petit anneau de A qui contient X . Par exemple, si A est l’anneau des fonctions définies sur R à valeurs dans R, le sousanneau des fonctions polynômes est le sous-anneau engendré par la fonction x → x, 1. Si A n’est pas l’anneau nul, {0A } n’est donc pas un sous-anneau de A.
i
i i
i
i
i
i
i
2.1 Anneaux, sous-anneaux, idéaux
29
le sous-anneau des polynômes trigonométriques est le sous-anneau engendré par les fonctions x → sin x et x → cos x.
2.1.4. Morphismes Comme on définit des applications linéaires, on peut définir des applications entre anneaux qui préservent les opérations. Définition 2.12. Soit A et B deux anneaux. Un morphisme d’anneaux est une application f : A → B telle que, pour tout (a, b) de A 2 :
f (a + b) = f (a) + f (b),
f (ab) = f (a)f (b),
f (1A ) = 1B
On vérifie facilement qu’on a également : f (0 A ) = 0B en calculant f (0A + 0A ). Un exemple de morphisme de C[X] dans lui-même : P (X) → P (X + a). Par contre P (X) → P (X)2 ne définit pas un morphisme d’anneaux. Remarquons qu’on ne peut déduire f (1A ) = 1B de f (ab) = f (a)f (b). Proposition 2.13. Soit f un morphisme d’anneaux de A dans B . Alors :
• Si C est un sous-anneau de A, f (C) est un sous-anneau de B . • Si D est un sous-anneau de B , f −1 (D) est un sous-anneau de A.
Deux cas particuliers, avec les mêmes notations : Définition 2.14. Le noyau d’un morphisme est Ker(f ) = f −1 (0) ; son image
© Dunod. La photocopie non autorisée est un délit.
est Im(f ) = f (A). L’image est un sous-anneau mais pas le noyau car il ne contient pas 1 A (sauf le cas exceptionnel du morphisme nul dans l’anneau nul). De plus : Proposition 2.15. Un morphisme d’anneaux f de A vers B est injectif si et seulement si Ker f est réduit à {0}. Il est surjectif si et seulement si Im f = B .
2.1.5. Idéaux Il se trouve que la notion de sous-anneau n’est pas la plus riche. La relation d’équivalence a ≡ b ⇐⇒ a − b ∈ B n’est en général pas compatible avec le produit lorsque B est un sous-anneau de A. Pour définir des quotients, il faut utiliser des idéaux et même des idéaux bilatères.
i
i i
i
i
i
i
i
2 • Anneaux et corps
30
Définition 2.16. Si A est un anneau, un sous-ensemble non vide I s’appelle un idéal à gauche (resp. à droite) si :
• ∀x ∈ I, ∀y ∈ I,
x + y ∈ I et − x ∈ I • ∀a ∈ A, ∀x ∈ I, ax ∈ I • (resp.∀a ∈ A, ∀x ∈ I, xa ∈ I ) Définition 2.17. I ⊂ A est un idéal bilatère si c’est à la fois un idéal à gauche
et un idéal à droite de A. Bien sûr, dans le cas où la multiplication est commutative, ces trois notions coïncident. Notons que {0A } et A lui-même sont des idéaux bilatères. On les appelle parfois idéaux triviaux.
Remarque : Un idéal est forcément un sous-groupe pour l’addition. En ce qui concerne la multiplication, la contrainte est différente que pour un sousanneau, mais on ne demande pas que 1 A soit dans l’idéal. D’ailleurs, si un idéal à gauche I contient un inversible a, la seconde propriété impose qu’il contienne a−1 a = 1A , et en réappliquant cette même propriété, il doit contenir tout b1A où b ∈ A, I coïncide avec A. Pour prolonger la fin de la remarque : Proposition 2.18. Un anneau A = {0} est un corps si et seulement si il ne contient aucun idéal à gauche autre que 0 et lui-même.
Démonstration. Si A est un corps, tout idéal non nul contient un inversible, donc coïncide avec A, par la remarque. Réciproquement, soit a un élément non nul de A. Alors Aa est un idéal à gauche, non nul donc coïncidant avec A. Comme A contient 1A , il existe a tel que a a = 1A , a admet un inverse à gauche. Comme a est non nul, il existe a tel que a a = 1A . D’où a = a (a a) = (a a )a = a a est aussi l’inverse à droite de a. On montre de même qu’un anneau qui n’a aucun idéal à droite non trivial est un corps. Par contre, il existe des anneaux qui n’ont aucun idéal bilatère, mais qui ne sont pas des corps ; c’est par exemple le cas de l’anneau des matrices carrées (n 2) à coefficients dans un corps : voir l’exercice 2.4. Les sous-ensembles de la forme nZ sont des idéaux de Z, la vérification est immédiate. Mais il y a plus : Proposition 2.19. Les seuls idéaux de Z sont de la forme nZ.
i
i i
i
i
i
i
i
2.1 Anneaux, sous-anneaux, idéaux
31
Démonstration. Nous avons déjà noté que ce sont bien des idéaux (regarder en passant les cas particuliers n = 0 et n = 1). La réciproque utilise la division euclidienne : soit I un idéal de Z, qu’on suppose non réduit à {0}. Alors I contient des éléments positifs (car s’il contient x, il contient aussi (−1)x), et comme N est bien ordonné, il contient un plus petit élément strictement positif, noté n. Alors I contient alors nZ, par définition d’un idéal. Et si m ∈ I , on peut le diviser par n d’où m = nq + r avec 0 r < n, et alors r = m − nq ∈ I , donc r = 0 par le caractère minimal de n. 2.1.6. Anneaux quotients Dans ce paragraphe, nous allons généraliser dans un anneau quelconque la construction faite pour l’anneau Z/nZ. À tout idéal I bilatère on peut associer une relation ≡ définie par : x ≡ y ⇐⇒ x − y ∈ I Proposition 2.20. ≡ est une relation d’équivalence, compatible avec les opérations.
Démonstration. (1) 0 ∈ I , d’où la réflexivité. Si on suppose x ≡ y , alors x−y ∈ I donc −(x−y) ∈ I et y ≡ x, la relation est symétrique. Enfin, x≡y x−y ∈I ⇒ ⇒ (x − y) + (y − z) ∈ I y≡z y−z ∈I et x ≡ z , la relation est transitive. (2) Si x ≡ x alors xy ≡ x y et si y ≡ y alors x y ≡ x y puisque l’idéal est bilatère. Et donc x ≡ x et y ≡ y ⇒ xy ≡ x y ≡ x y On vérifie de même que :
© Dunod. La photocopie non autorisée est un délit.
x ≡ x et y ≡ y ⇒ x + y ≡ x + y Il est alors possible de considérer l’ensemble des classes d’équivalence, c’est ce qu’on appelle l’anneau quotient, noté A/I , et de le munir d’une structure d’anneau : Théorème 2.21.
• Les classes d’équivalence sont de la forme a + I , abrégé en a s’il n’y a pas d’ambiguïté. • Si on pose a + b = a + b et a b = ab, ces opérations sont bien définies. • A/I est alors un anneau d’éléments neutres 0 et 1. • L’application π : A → A/I définie par a → a est appelée projection. C’est un morphisme surjectif dont le noyau est I .
i
i i
i
i
i
i
i
2 • Anneaux et corps
32
Démonstration. • Si b ≡ a alors il existe i ∈ I tel que b − a = i d’où b ∈ a + I , et réciproquement. • La proposition précédente montre que : a = a et b = b ⇒ a + b = a + b ce qui montre bien la cohérence de la définition de la somme de deux classes. Il en va de même pour la définition du produit. • C’est une simple écriture : les propriétés d’associativité, de distributivité, etc. de l’anneau A sont transmises au quotient. • La surjectivité découle de la définition du quotient. De plus, l’image réciproque de 0 est l’ensemble des a tels que a ≡ 0, c’est I .
On vient de voir que le noyau de cette projection est l’idéal bilatère I ; c’est un fait beaucoup plus général, le théorème suivant fait le lien entre morphismes et idéaux. Théorème 2.22. Soit f : A → B un morphisme d’anneaux. Alors, et les deux
premiers énoncés concernent soit les idéaux à droite, soit les idéaux à gauche, soit les idéaux bilatères : • Si I ⊂ A est un idéal de A, alors f (I) est un idéal de l’anneau f (A). • Si J ⊂ B est un idéal de B , alors f −1 (I) est un idéal de A. • En particulier, le noyau d’un morphisme d’anneaux est toujours un idéal bilatère.
Démonstration. Attention à la différence entre les deux cas, image directe et image réciproque. Regardons le premier cas : Si j et j sont dans f (I), b dans f (A), alors il existe i et i dans I et a dans A tels que : j = f (i), j = f (i ), b = f (a) Comme f est un morphisme et I un idéal, on a :
j − j = f (i − i ) ∈ f (I), bj = f (ai) ∈ f (I) pour le cas idéal à gauche. Remarquer pourquoi l’image de I n’est pas forcément un idéal de B . La suite de la démonstration est immédiate. Enfin, le dernier point découle de ce que {0} est manifestement un idéal bilatère. Nous allons terminer cette étude des anneaux quotients par deux théorèmes importants. Le premier appelé théorème de correspondance permet de décrire les idéaux d’un quotient. Théorème 2.23. Théorème de correspondance. Soit A/I un anneau quotient, où
I est bilatère. Alors, si on note π la projection, les idéaux (à gauche, à droite, bilatères) de A/I sont les π(J ), J décrivant l’ensemble des idéaux (à gauche, à droite, bilatères) de A contenant I .
i
i i
i
i
i
i
i
2.1 Anneaux, sous-anneaux, idéaux
33
Démonstration. Ce sont des idéaux, car π est un morphisme surjectif. Si maintenant K est un idéal de l’anneau quotient, alors π −1 (K) est un idéal de A ; il contient I car K contient 0. De plus, comme π est surjective, K = π(π −1 (K)). Enfin, si J est un idéal de A contenant I , on a π −1 (π(J )) = J : si a ∈ π −1 (π(J )), alors π(a) ∈ π(J ), donc il existe j ∈ J tel que a ≡ j , soit a − j ∈ I , mais on en déduit que a est somme de deux éléments de J puisque J contient I . On a donc π −1 (π(J )) ⊂ J , l’autre inclusion est immédiate. En définitive, la correspondance décrite est bijective. Et le second théorème : Théorème 2.24. Théorème d’isomorphisme. Si f : A → B est un morphisme
d’anneau, alors :
A/ Ker(f ) Im(f ) ( désigne un isomorphisme d’anneaux).
Démonstration. Décrivons cet isomorphisme, noté f : on pose f (a) = f (a). Il faut vérifier que cela de dépend pas du représentant choisi pour la classe de a : a = b ⇒ a − b ∈ Ker(f ) ⇒ f (a − b) = 0 ⇒ f (a) = f (b) f (a + b) = f (a + b) = f (a) + f (b) = f (a) + f (b)
© Dunod. La photocopie non autorisée est un délit.
idem pour le produit et pour l’image de 1 A/ Ker f : c’est bien un morphisme d’anneaux. Il est surjectif par choix de l’ensemble d’arrivée, et injectif car son noyau est l’ensemble des a pour tous les a ∈ Ker f , c’est donc {0}. Donnons un exemple. L’application P → P (i) de R[X] dans C est un morphisme d’anneaux ; il est surjectif (prendre un polynôme P du premier degré). Un polynôme P est dans le noyau si P (i) = 0. Mais comme P est à coefficients réels, s’il admet i comme racine, il admet aussi −i, conjugué de i comme racine. Il est donc divisible par (X − i)(X + i) = X 2 + 1, et réciproquement tout polynôme multiple de X 2 + 1 est dans le noyau. L’ensemble des multiples de X 2 + 1 est tout simplement noté (X 2 + 1). On en déduit que :
R[X]/(X 2 + 1) C Cet exemple est très important, il est à la base de l’étude des corps, et nous aurons l’occasion d’y revenir dans le chapitre suivant.
2.1.7. Caractéristique d’un anneau Puisque 1A est un élément de l’anneau A, celui-ci contient aussi 1 A +1A , 1A +1A +1A , ..., et leurs opposés. Ces éléments sont notés 2.1A , 3.1A ou par abus 2, 3,..., mais ils ne sont pas forcément distincts. Plus précisément :
i
i i
i
i
i
i
i
2 • Anneaux et corps
34
Définition 2.25. Si A est un anneau, l’application k → k.1 A de Z dans A
est un morphisme d’anneaux. Son noyau est de la forme nZ et n s’appelle la caractéristique de A. L’application est un morphisme,
k.1A + k .1A = (k + k ).1A
et
(k.1A )(k .1A ) = (kk ).1A
et ce morphisme est rarement surjectif (quand l’est-il ?). On peut démontrer les propriétés suivantes : Proposition 2.26. Soit A un anneau de caractéristique n. Alors,
(i)
si n = 0, alors A est infini,
(ii) si A est intègre alors n = 0 ou n = p nombre premier. (iii) si A est commutatif et n = p premier, alors :
f : A −→ A a −→ ap est un morphisme d’anneaux (appelé « morphisme de Frobenius »).
Démonstration. (i) Le théorème d’isomorphisme dit que notre morphisme a une image isomorphe à Z, qui est infini ; on dit que Z s’injecte dans A. (ii) Cette fois, en raisonnant par l’absurde, on voit que si A est de caractéristique non nulle et non première, il contient un sous-anneau isomorphe à Z/nZ, qui n’est intègre que si n est premier. (iii) On commence par le lemme : p(p − 1) . . . (p − k + 1) p 0 < k < p ⇒ p divise = k k! p En effet, dans l’égalité k! = p(p − 1) . . . (p − k + 1), le nombre p divise le k second membre, et il est premier à k! lorsque k < p. On applique alors le lemme de Gauss. Si maintenant on considère l’application a → a p , on a p p p−k k p (a + b) = a b = ap + bp k k=0
tandis que (ab)p = ap bp . Remarquons que pour ces deux propriétés on utilise la commutativité de l’anneau.
i
i i
i
i
i
i
i
2.1 Anneaux, sous-anneaux, idéaux
35
2.1.8. Anneaux produits Définition 2.27. Si A et B sont deux anneaux, on appelle anneau produit le produit cartésien A × B muni des opérations :
(a, b) + (a , b ) = (a + a , b + b )
et
(a, b)(a , b ) = (aa , bb )
Il faut bien sûr vérifier que c’est un anneau. Cela n’offre pas de difficulté, et on peut définir de même le produit d’une famille d’anneaux. Attention, le produit de deux corps n’est pas un corps : chercher les inversibles du produit R × R. Dans le même ordre d’idées, A × {0B } est un idéal bilatère de A × B , a une structure d’anneau (isomorphe à A), mais n’est pas un sous-anneau de A × B , car il n’a pas le même élément neutre pour le produit.
Exercice 2.1. Soit A un anneau et a ∈ A. Montrer que a est régulier à gauche si et seulement si l’application x → ax est injective. En déduire que, dans les anneaux finis, la notion d’élément régulier coïncide avec la notion d’élément inversible.
Exercice 2.2. Déterminer dans l’anneau M n (K) les diviseurs de zéro, à gauche ou à droite. On pourra utiliser des endomorphismes associés. Comparer l’ensemble des inversibles et l’ensemble des réguliers.
© Dunod. La photocopie non autorisée est un délit.
Exercice 2.3. Soit A un anneau et a un de ses éléments. On appelle annulateur à droite
de a l’ensemble des éléments x de A tels que ax = 0. Montrer que c’est un idéal à droite de A. Décrire l’annulateur d’un élément k de Z/nZ, puis l’annulateur à droite d’une matrice M ∈ Mn (K), décrire également l’annulateur à gauche.
Exercice 2.4. Dans l’anneau Mn (K), montrer que les seuls idéaux bilatères sont l’idéal nul et l’anneau tout entier. On pourra utiliser les matrices de base E ij .
Exercice 2.5. Décrire les idéaux de Z/nZ.
Exercice 2.6. Dans l’anneau Z/nZ, rechercher s’il existe des éléments nilpotents,
c’est-à-dire dont une puissance est nulle.
i
i i
i
i
i
i
i
2 • Anneaux et corps
36
2.2 DIVISIBILITÉ 2.2.1. Vocabulaire Examinons maintenant la relation de divisibilité dans un anneau commutatif ; à partir de maintenant, on préférera se limiter à un anneau commutatif intègre A : certaines notions pourront être définies dans des anneaux plus généraux, mais elles ont moins d’intérêt et des propriétés différentes. Définition 2.28.
– On dit que a et b sont associés s’il existe une unité u telle que a = bu. Cette relation est une relation d’équivalence. – On dit que a | b (a divise b) s’il existe c tel que b = ac. Ce n’est pas une relation d’ordre : si a | b et b | a, alors a et b sont associés. – On dit que a ∈ A \ (A× ∪ {0}) est irréductible si :
∀(b, c) ∈ A2 , (a = bc) ⇒ b ∈ A× ou c ∈ A× – On dit que a ∈ A \ (A× ∪ {0}) est premier si :
∀(b, c) ∈ A2 ,
(a | bc) ⇒ (a | b ou a | c)
Une affirmation à vérifier dans cette définition : si a | b et b | a, alors a et b sont associés. En effet, il existe alors c et c tels que b = ca et a = bc . On en déduit a = acc . Si a est nul, b aussi, et a et b sont associés, sinon, par intégrité, cc = 1 et a et b sont associés. Dans Z un nombre premier est irréductible (c’est la définition) mais aussi premier dans le sens que nous venons de définir : c’est le lemme d’Euclide, voir 1.14 p. 14. C’est heureux.
Remarque : Dans le cas général, les deux notions sont différentes (voir par exemple l’exercice 2.9. Cependant, un élément premier est toujours irréductible : si a est premier et a = bc, alors a | bc. Donc, a | b (par exemple) et b = ad. On en déduit : a = adc et l’intégrité prouve que 1 = dc, donc c est une unité, et a est irréductible. La relation de divisibilité peut aussi s’exprimer à l’aide des idéaux.
2.2.2. Idéaux principaux Dans un anneau commutatif A tous les idéaux sont bilatères : on pourra se contenter de parler d’idéaux, sans plus de précision. Comme l’intersection d’une famille d’idéaux est un idéal, on peut définir l’idéal engendré par une partie S non vide de A : c’est le plus petit idéal contenant les éléments de S , intersection de tous les idéaux qui contiennent S . On peut le décrire explicitement :
i
i i
i
i
i
i
i
2.2 Divisibilité
37
Proposition 2.29. L’idéal engendré par S est l’ensemble des b =
k
i=1 ai si où (si ) et (ai ) sont des suites finies quelconques d’éléments de S et de A. On le note souvent (S).
Démonstration. Indiquons seulement les étapes : on vérifie que (S) ainsi défini est bien un idéal de A, qu’il contient S , et que tout idéal contenant S contient (S). Remarquer l’analogie avec les sous-espaces vectoriels et les combinaisons linéaires. En particulier, si S est réduit à un élément s, l’idéal qu’il engendre sera appelé idéal principal. On le notera (s) ou plus explicitement sA. On retrouve ainsi la notation déjà rencontrée dans Z, par exemple 2Z est l’idéal principal engendré par 2. Proposition 2.30. Si A est un anneau commutatif intègre,
• a | b ⇐⇒ (b) ⊂ (a). • a et b sont associés si et seulement si (a) = (b). • a ∈ A \ (A× ∪ {0}) est irréductible si et seulement si (a) est maximal dans l’ensemble des idéaux principaux différents de A. • a ∈ A \ (A× ∪ {0}) est premier si et seulement si :
© Dunod. La photocopie non autorisée est un délit.
∀(b, c) ∈ A2 ,
(bc ∈ (a)) ⇒ (b ∈ (a) ou c ∈ (a))
Démonstration. • b = ac ⇒ bA = acA ⊂ aA et réciproquement, si (b) ⊂ (a), b ∈ (a) donc il existe c dans A tel que b = ac. • On a déjà vu que a et b associés équivaut à a | b et b | a simultanément, donc équivaut à (a) = (b) par ce qui précède. • Soit (b) tel que (a) ⊂ (b). Alors b | a. Comme a est irréductible, soit b est une unité, soit b est associé à a. Dans le premier cas (b) = A, dans le second (b) = (a). La réciproque se traite de la même manière. • Supposons donc a premier. Alors, si bc ∈ (a), il existe m dans A tel que bc = am et a | bc. Comme a est premier, a | b, par exemple, et donc b ∈ (a). La démonstration de la réciproque est analogue, c’est un simple jeu de traduction. La proposition précédente amène naturellement à deux définitions : Définition 2.31. Un idéal I de A est dit premier s’il est différent de A et vérifie
la propriété :
∀(b, c) ∈ A2 ,
bc ∈ I ⇒ (b ∈ I ou c ∈ I)
Définition 2.32. Un idéal I de A est dit maximal s’il est maximal dans
l’ensemble des idéaux stricts de A.
i
i i
i
i
i
i
i
2 • Anneaux et corps
38
Ainsi, si a est premier, l’idéal (a) est un idéal premier. Un idéal (a) maximal est forcément celui d’un irréductible. On peut alors énoncer le théorème : Théorème 2.33.
• Un idéal I est maximal si et seulement si A/I est un corps. • Un idéal I est premier si et seulement si A/I est intègre. • Tout idéal maximal est aussi un idéal premier.
Démonstration. Dans le premier cas, on se sert du théorème de correspondance (théorème 2.23, page 32) : comme I est maximal, il n’y a pas d’idéal strictement entre I et A, donc A/I ne contient pas d’idéal non trivial, c’est un corps. Dans le second cas, on fait un petit travail de traduction. L’intégrité dans le quotient, qui s’écrit ∀(a, b) ∈ (A/I)2 ,
⇒
(a b = 0)
(a = 0 ou b = 0)
est équivalente à
∀(a, b) ∈ A2 ,
(ab ∈ I)
⇒
(a ∈ I ou b ∈ I)
Il faut remarquer qu’un corps et un anneau intègre sont par définition non réduits à {0}, dans les deux cas I est différent de A. La troisième assertion du théorème découle de ce qu’un corps est nécessairement intègre.
2.2.3. Le théorème chinois Voici un exemple important d’utilisation des quotients ; on commence par définir une opération dans l’ensemble des idéaux. Définition 2.34. Si A est un anneau commutatif, I et J deux idéaux, leur somme I + J est l’ensemble des sommes d’un élément quelconque de I et d’un élément quelconque de J .
Cette somme, analogue à la somme de sous-espaces vectoriels, est de façon immédiate un idéal. Théorème 2.35. Théorème chinois. Soit A un anneau commutatif, I et J deux idéaux tels que I + J = A. On a alors un isomorphisme d’anneaux
A/(I ∩ J ) A/I × A/J
Démonstration. On part de l’application a → (a + I, a + J ) de A dans A/I × A/J qui est un morphisme d’anneaux car obtenue à l’aide des projections. Son noyau est formé des éléments de A qui se projettent en (0, 0), c’est-à-dire qui sont dans I et
i
i i
i
i
i
i
i
2.3 Anneaux principaux, euclidiens et factoriels
39
dans J . C’est donc l’idéal I ∩ J . Reste à montrer la surjectivité. Soit (α + I, β + J ), on cherche a de A tel que a vérifie a ≡ α (mod I) a ≡ β (mod J ) On utilise I + J = A pour écrire 1 = x + y où x ∈ I et y ∈ J ; on a donc y ≡ 1 (mod I) et x ≡ 1 (mod J ) il suffit alors de prendre a = xβ + yα.
Remarque : La condition I + J = A s’exprime en disant que les idéaux sont étrangers. Par analogie avec le cas de Z, les relations d’équivalence modulo un idéal s’appellent des congruences. Le théorème chinois revient donc à résoudre un système de congruences simultanées, c’est effectivement ce qu’on trouve dans les mathématiques chinoises. Nous verrons une version particulière de ce théorème dans le cas où A est un anneau principal.
Exercice 2.7. Opérations dans l’ensemble des idéaux. On suppose que A est un anneau commutatif. Si I et J sont deux idéaux de A, montrer que : √ I = {x ∈ A | ∃n ∈ N, xn ∈ I}
I : J = {x ∈ A | xJ ⊂ I} définissent des idéaux. Comment définir le produit IJ de deux idéaux ? Examiner le cas particulier des idéaux principaux. Montrer que si I + J = A, on a
IJ = I ∩ J © Dunod. La photocopie non autorisée est un délit.
Donner des exemples, par exemple dans Z.
Exercice 2.8. Montrer, à l’aide du théorème de Zorn, que dans un anneau non nul,
tout idéal est inclus dans un idéal maximal. Ce résultat est parfois appelé théorème de Krull.
2.3 ANNEAUX PRINCIPAUX, EUCLIDIENS ET FACTORIELS Continuons à étudier des cas particuliers d’anneaux, toujours en rapport avec la notion de divisibilité.
i
i i
i
i
i
i
i
2 • Anneaux et corps
40
2.3.1. Anneaux euclidiens Les anneaux euclidiens sont ceux pour lesquels il existe une division semblable à la division euclidienne des entiers. Définition 2.36. Un anneau A est euclidien s’il est commutatif, intègre et s’il
existe φ : A \ {0} → N telle que :
(1) b | a ⇒ φ(b) φ(a) (2) ∀a ∈ A, ∀b ∈ A \ {0}, ∃q, r ∈ A a = bq + r r = 0 ou φ(r) < φ(b)
Remarque : L’application φ porte le nom de stathme (du mot grec signifiant mesure) : on prend la valeur absolue pour Z, le degré pour K[X]. Notons que la définition de la division euclidienne ne demande pas forcément l’unicité du couple (q, r) (que l’on appelle quotient et reste). Avec notre définition, il n’y a pas unicité dans le cas de Z. 17 = 3 × 5 + 2 = 3 × 6 − 1 sont deux divisions euclidiennes de 17 par 3. Il y aura unicité si on impose au reste d’être positif. Outre Z, un exemple d’anneau euclidien est fourni par K[X] l’anneau des polynômes sur un corps commutatif, nous aurons l’occasion d’y revenir dans le chapitre suivant. Proposition 2.37. Dans un anneau euclidien, tous les idéaux sont principaux.
Démonstration. On mime la démonstration que l’on fait pour Z (cf. 2.19). Soit I un idéal, différent de l’idéal nul, et x 0 un élément non nul de I de stathme minimal (ne pas oublier que les stathmes sont à valeurs entières). Si maintenant x est un élément quelconque de I , on peut écrire x = x 0 q + r avec r = 0 ou φ(r) < φ(x0 ) ; comme r = x−x0 q ∈ I , le choix de x0 impose que r = 0. En définitive x = x0 q et I = (x0 ). Cette propriété des anneaux euclidiens est essentielle, et conduit à la définition qui suit.
2.3.2. Anneaux principaux Définition 2.38. Un anneau (qui n’est pas un corps) est principal s’il est
intègre, commutatif, et si tout idéal est principal, c’est-à-dire engendré par un élément. Les idéaux triviaux {0} = (0) et A = (1) sont en particuliers principaux, et nous venons de voir que tout anneau euclidien est nécessairement principal. Il n’est pas facile de trouver des exemples d’anneaux principaux qui ne sont pas euclidiens : voir néanmoins l’exercice 2.17.
i
i i
i
i
i
i
i
2.3 Anneaux principaux, euclidiens et factoriels
41
Un premier résultat qui concerne les anneaux principaux. Théorème 2.39. Dans un anneau principal, un élément est irréductible si et seulement
si il est premier.
Démonstration. On sait déjà qu’un élément premier est toujours irréductible. Soit A un anneau principal, et p irréductible. Supposons que p | ab et soit I l’idéal engendré par p et a. On peut écrire : I = {z ∈ A | ∃x ∈ A, ∃y ∈ A, z = xp + ya} Comme l’anneau est principal, I est principal, et il existe d tel que I = dA. Donc p et a qui sont dans I sont des multiples de d. Comme p est irréductible, d est soit une unité, soit un associé de p. Si c’est un associé de p, p divise a et c’est terminé ; si c’est une unité, alors I = A et 1 = xp + ya pour un x et un y de A. En multipliant par b on voit que p divise b. Remarquer la ressemblance de la démonstration avec celle du lemme de Gauss dans Z. Dans les anneaux principaux, les notions de premier et d’irréductible coïncident. Nous allons voir que c’est encore vrai dans la catégorie suivante d’anneaux, encore plus générale.
2.3.3. Anneaux factoriels Rappelons que dans l’ensemble des entiers, tout nombre se décompose de façon unique en produit de nombres premiers. C’est ce qu’on appelle parfois le « théorème fondamental de l’arithmétique ». Les anneaux qui ont cette propriété s’appellent anneaux factoriels. Plus précisément :
© Dunod. La photocopie non autorisée est un délit.
Définition 2.40. Un anneau commutatif intègre est factoriel si tout élément non nul et non inversible se décompose de façon unique en produit d’irréductibles.
L’unicité s’entend à l’ordre près et aux unités près : par exemple dans Z, on ne distingue pas 2 × 3 × 3 et −3 × 2 × (−3). Commençons par remarquer : Proposition 2.41. Dans un anneau factoriel, un élément est irréductible si et seulement si il est premier.
Démonstration. On sait déjà que tout premier est un irréductible ; soit A un anneau factoriel et a ∈ A un élément irréductible. Supposons que a | bc ; cela signifie que dans la décomposition en irréductibles de bc, il y a l’irréductible a (à une unité près) et donc que la décomposition en irréductibles de b ou de c contient a, et donc a divise b ou c. Nous terminons par le théorème principal de cette section : on sait déjà que tout anneau euclidien est principal, nous allons démontrer que tout anneau principal est factoriel, ce qui montre la hiérarchie entre les trois notions.
i
i i
i
i
i
i
i
2 • Anneaux et corps
42
Théorème 2.42. Tout anneau principal A est factoriel.
Démonstration. La démonstration est un peu délicate. Faisons un raisonnement par l’absurde : soit E l’ensemble des éléments x de A, non nuls ni inversibles, qui ne se décomposent pas en irréductibles, et supposons que E soit non vide. Alors, F = {(x) | x ∈ E} est un ensemble non vide. Montrons que cet ensemble, muni de la relation d’inclusion, admet (au moins un) élément maximal. En effet, (nouveau raisonnement par l’absurde), si ce n’était pas vrai, on pourrait construire une chaîne infinie : (x1 ) (x2 ) . . . (xn ) . . . où les xi sont dans E . Alors l’ensemble U = n1 (xn ) est un idéal : si a et b sont dans U , il existe un certain n tel que a et b soient tous les deux dans (x n ), donc a + b ∈ (xn ) ⊂ U , même raisonnement pour l’autre propriété. U est donc principal, c’est-à-dire qu’il existe x ∈ A tel que U = n1 (xn ) = (x). Mais alors, x est dans n1 (xn ), donc x ∈ (xn0 ) pour un n0 , et donc alors (x) = (xn0 ) et n1 (xn ) = (xn0 ), ce qui est absurde au vu des hypothèses. Soit donc (x0 ) maximal dans F. Alors x0 n’est pas inversible, ni irréductible (sinon il se décomposerait en produit d’irréductibles) dont il peut s’écrire x 0 = ab et donc (x0 ) ⊂ (a), (x0 ) ⊂ (b). Les inclusions sont strictes puisque ni a ni b ne sont associés à x0 . Par maximalité, a et b ne sont pas dans E , donc se décomposent en irréductibles, mais alors x0 aussi se décompose en irréductibles, il y a contradiction. Il faut maintenant montrer l’unicité. Commençons par remarquer que si p est irréductible et si u est une unité, alors pu est irréductible. Supposons maintenant que : p1 p2 . . . ps = q 1 q 2 . . . q r Notre objectif est de montrer que r = s et que les p i sont égaux, à l’ordre et à des unités près aux q j . Pour cela nous allons utiliser le théorème qui dit que dans un anneau principal, tout irréductible est premier. On peut alors en effet dire que q 1 divisant le produit p1 . . . ps , divise un des pi , et, par irréductibilité des pi , on peut écrire que q1 = pi u où u est une unité. On peut alors simplifier et reprendre le même raisonnement. À la fin, on aura r = s car un irréductible n’est pas un produit d’unités. Nous sommes maintenant au sommet de la hiérarchie : les anneaux pour lesquels le théorème fondamental de l’arithmétique est vrai sont les anneaux factoriels. Dans le chapitre suivant, on rencontrera des anneaux qui sont factoriels sans être principaux ; ainsi les trois notions anneaux euclidiens, anneaux principaux, anneaux factoriels sont bien distinctes. Venons-en maintenant aux propriétés arithmétiques des anneaux principaux et factoriels.
i
i i
i
i
i
i
i
2.3 Anneaux principaux, euclidiens et factoriels
43
2.3.4. P.g.c.d, p.p.c.m., relation de Bezout Définition 2.43. Si A est un anneau commutatif intègre, on dit que a et b
admettent un p.g.c.d. d si d est un diviseur commun de a et de b et si
∀δ ∈ A,
(δ | a et δ | b)
⇒
(δ | d)
On dit que a et b admettent un p.p.c.m. m si m est un multiple commun de a et de b et si ∀µ ∈ A, (b | µ et a | µ) ⇒ (m | µ)
Remarque : • Il n’y a pas en général unicité du p.g.c.d. et du p.p.c.m. : si d est un p.g.c.d. de a et b, les autres sont les associés de d, idem pour le p.p.c.m. On note néanmoins d = a ∧ b, et m = a ∨ b, en ayant choisi un représentant ; dans le cas de Z par exemple on choisit le représentant positif, dans le cas de K[X] on peut choisir le représentant unitaire. • Le p.g.c.d. et le p.p.c.m. n’existent pas toujours, mais si le p.p.c.m. existe, alors le p.g.c.d. aussi : voir exercice 2.10. • On définit de la même façon le p.g.c.d. et le p.p.c.m. de plusieurs éléments. L’existence des p.g.c.d. et des p.p.c.m. est assurée dans les anneaux principaux et factoriels. On pourrait se contenter d’étudier le cas factoriel, mais l’étude du cas principal est intéressante pour elle-même. Proposition 2.44.
• a et b admettent m comme p.p.c.m. si et seulement si (a) ∩ (b) = (m). • S’il existe d tel que (a) + (b) = (d), alors a et b admettent d comme p.g.c.d.
© Dunod. La photocopie non autorisée est un délit.
• En particulier, si A est un anneau principal, il existe toujours p.p.c.m. et p.g.c.d.
Démonstration. Remarquer que les énoncés concernant p.p.c.m. et p.g.c.d. diffèrent. Pour le p.p.c.m, l’ensemble (a) ∩ (b) est exactement l’ensemble des multiples communs de a et de b. S’il est de la forme (m), m est un multiple commun et tout multiple commun est multiple de m, qui est donc bien le p.p.c.m. Réciproquement, l’existence du p.p.c.m. dit exactement que l’ensemble des multiples communs de a et de b est de la forme (m). Supposons que (a) + (b) = (d). Alors a ∈ (a) + (b) = (d), donc a est un multiple de d, de même b est un multiple de d. De plus, d ∈ (a) + (b) donc il existe deux éléments u et v de A tels que d = au + bv et si δ divise a et divise b, alors δ divise d. Il n’y a pas équivalence : dans l’anneau Z[X], 2 et X on pour p.g.c.d. 1 mais (2) + (X) n’est pas égal à (1) = Z[X], puisqu’il est formé des polynômes dont le terme constant est pair. Cela montre en particulier que l’anneau Z[X] n’est pas principal. Nous verrons dans le chapitre suivant qu’il est néanmoins factoriel. Dans un anneau principal, (a) ∩ (b) et (a) + (b) sont des idéaux, donc sont principaux et l’existence des p.p.c.m. et p.g.c.d. est assurée.
i
i i
i
i
i
i
i
2 • Anneaux et corps
44
Plaçons nous dans un anneau principal. L’égalité au + bv = d de la démonstration précédente s’appelle relation de Bezout. Proposition 2.45. Propriété de Bezout. Si A est principal, alors
(a ∧ b = d)
⇒
(∃(u, v) ∈ A2 ,
au + bv = d)
De plus,
(a ∧ b = 1)
⇐⇒
(∃(u, v) ∈ A2 ,
au + bv = 1)
Démonstration. Compte-tenu de la démonstration précédente, il reste à démontrer que, s’il existe u et v tels que au + bv = 1, alors a ∧ b = 1. Si en effet d est un diviseur commun de a et de b, on a a = a d, b = b d et 1 = d(a u + b v), d est donc inversible. Les seuls diviseurs communs sont les inversibles, dont 1 est un représentant. Comme dans le cas des entiers, si a ∧ b = 1 on dit que a et b sont premiers entre eux. On observera que cela équivaut à dire que les idéaux (a) et (b) sont étrangers, voir 2.2.3.. Corollaire 2.46. Lemme de Gauss. Soit A un anneau principal. Alors
a | bc a∧b = 1
⇒
a|c
Démonstration. On utilise une relation de Bezout au + bv = 1 et en multipliant par c, acu + bcv = c, a divise le premier membre donc a divise c. Regardons maintenant ce qu’il se passe si l’anneau A est factoriel. On a encore : Proposition 2.47.
• Si A est factoriel, le p.g.c.d. et le p.p.c.m. existent toujours. • Si A est factoriel, le lemme de Gauss est satisfait.
Démonstration. Commençons par utiliser un vocabulaire très pratique. Dans un anneau factoriel A, si p est un irréductible, on appelle valuation associée à p l’application vp de A\{0} dans N qui à tout x ∈ A associe l’exposant de p dans la décomposition de x en irréductibles. Notons P l’ensemble des irréductibles, la factorialité de A permet d’affirmer : ∀(x, y) ∈ A2 ,
(x | y)
⇐⇒
(∀p ∈ P, vp (x) vp (y))
On peut alors démontrer le théorème. • On utilise la décomposition en irréductibles de a, b et a=u pvp (a) , b = u pvp (b) p∈P
p∈P
i
i i
i
i
i
i
i
2.3 Anneaux principaux, euclidiens et factoriels
45
où u et u sont des unités. P est la réunion des irréductibles intervenant dans la décomposition de a et b . Alors, par unicité de la décomposition en irréductibles, si δ est un diviseur de a, il s’écrit δ = u p∈P pvp (δ) où vp (δ) vp (a). Si δ est un diviseur commun, on aura donc v p (δ) inf(vp (a), vp (b)), et le cas où vp (δ) = inf(vp (a), vp (b)) pour tout p ∈ P , donne un diviseur commun qui a les propriétés du p.g.c.d. De même, le choix sup(vp (a), vp (b)) donne le p.p.c.m. • Prenons les mêmes conventions de notation. On suppose que a | bc et a ∧ b = 1. Il faut montrer que a | c. Comme a | bc, on a v p (a) vp (b) + vp (c) pour tout p. Si p divise a, vp (a) > 0, mais comme a ∧ b = 1, on a alors vp (b) = 0 et l’inégalité précédente implique v p (a) vp (c). On a bien vp (a) vp (c) pour tous les diviseurs irréductibles de a et a divise c.
Dans le cas d’un anneau principal, on a donc deux démonstrations différentes, l’une utilisant les propriétés des idéaux principaux, l’autre utilisant la décomposition en irréductibles. Il existe une circonstance où l’on peut comparer ces deux approches, c’est le cas où l’anneau est non seulement principal mais euclidien : on sait qu’on peut alors déterminer le p.g.c.d. (et les coefficients d’une relation de Bezout) grâce à l’algorithme d’Euclide, extrêmement efficace (le nombre d’étapes dans l’algorithme d’Euclide pour le couple (a, b), a > b, est de l’ordre de ln(b)). Alors que la décomposition en irréductibles peut être un problème très compliqué, et souvent d’un coût en calcul élevé, même dans le cas de Z.
√
√
Exercice 2.9. Soit Z[i 3] le sous-anneau de C engendré par i 3. © Dunod. La photocopie non autorisée est un délit.
(1) Montrer que
√ √ Z[i 3] = {z ∈ C | ∃a ∈ Z, ∃b ∈ Z, z = a + ib 3} √ et généraliser aux sous-anneaux engendrés par d où d est un entier (positif ou négatif) qui n’est pas un carré. √ (2) Montrer que l’application N définie par N : z = a + ib 3 → |z|2√est un morphisme pour le produit, à valeurs dans N. En déduire les unités de Z[i 3]. (3) Montrer que 4 admet dans √ cet anneau deux décompositions distinctes en irréductibles. Vérifier que 1 + i 3 est irréductible mais pas premier.
Exercice 2.10. Soit A un anneau commutatif intègre. On suppose que a et b non nuls ont un p.p.c.m. m. Montrer qu’ils ont un p.g.c.d. d et que md = ab (à une unité près).
i
i i
i
i
i
i
i
2 • Anneaux et corps
46
Exercice 2.11. Soit A un anneau principal et a 1 , a2 , . . . , an des éléments premiers entre eux deux à deux. Montrer le théorème chinois (version anneau principal) :
A/(a1 a2 . . . an ) ≡ A/(a1 ) × A/(a2 ) × . . . × A/(an ) On sera conduit à démontrer que l’hypothèse implique k k (ai ) = ai i=1
i=1
EXERCICES Exercice 2.12. Soit A l’anneau des fonctions continues de R dans R, muni de l’ad-
dition et du produit des fonctions. Déterminer quel est l’ensemble des éléments inversibles, donner un exemple de diviseur de 0 et de fonction qui n’est ni inversible, ni diviseur de zéro. Exercice 2.13. Soit A un anneau non nul tel que x 2 = x pour tout x de A. On dit que
A est un anneau de Boole. (1) Montrer que pour tout x de A, on a : x + x = 0 (A est de caractéristique 2), puis que A est commutatif. (2) Montrer que A ne peut avoir exactement 3 éléments. Quel peut-être le nombre d’éléments d’un anneau de Boole fini ? (3) Trouver des exemples d’anneaux de Boole.
Exercice 2.14. A est un anneau commutatif intègre, S est un sous-ensemble stable
pour le produit et ne contenant pas 0 mais contenant 1. On dit alors que S est multiplicatif, et on définit une relation dans A × S par
(a, s)R(a , s ) ⇐⇒ as − a s = 0 (1) Montrer que c’est une relation d’équivalence. (2) On note S −1 A l’ensemble quotient et as la classe de (a, s). Montrer que S −1 A est un anneau pour les lois + et × définies par :
at + bs ab a b a b + = × = et s t st s t st (ne pas oublier de vérifier que ces opérations sont bien définies).
i
i i
i
i
i
i
i
Exercices
47
(3) Vérifier que S = A \ {0} est une partie multiplicative, et qu’alors S −1 A est un corps contenant un sous-anneau isomorphe canoniquement à A. Reconnaître le cas A = Z et A = K[X]. On dit alors que S −1 A est le corps des fractions de A. (4) Montrer que si I est un idéal premier de A, S = A\I est une partie multiplicative. Décrire le cas où A = Z et où I = (2). Exercice 2.15. On rappelle que les inversibles de Z/nZ sont les classes k où k est
premier à n. Le nombre des entiers k tels que 1 k n − 1 et k ∧ n = 1 est noté φ(n), c’est l’indicateur d’Euler. Rechercher les inversibles de Z/p k Z. En utilisant le théorème chinois (cf. l’exercice 2.11), dénombrer les inversibles de Z/nZ, et donner une formule explicite pour φ(n).
√
Exercice 2.16. Soit A l’anneau Z[i 5]. (cf. l’exercice 2.9). Si z ∈ A, on rappelle que
l’application norme N : z → |z|2 est un morphisme multiplicatif de A dans N. (1) Chercher les éléments inversibles (unités). (2) Déterminer les diviseurs de 9. Préciser lesquels sont irréductibles.
(3) Trouver des éléments irréductibles qui ne sont pas premiers. En déduire que A n’est ni principal ni factoriel. (4) Trouver deux éléments qui admettent un p.g.c.d. mais qui n’ont pas de p.p.c.m. (5) Trouver deux éléments qui n’ont ni p.g.c.d., ni p.p.c.m. √
Exercice 2.17. Soit β = 1+i2 19 et A = Z[β], le sous-ensemble de C formé des
combinaisons linéaires à coefficients entiers de 1 et de β .
© Dunod. La photocopie non autorisée est un délit.
(1) Montrer que
(2) (3)
(4) (5)
β2 − β + 5 = 0 et que A est un sous-anneau de C stable par conjugaison. Chercher les unités (éléments inversibles) de A. On veut montrer que A n’est pas euclidien. Pour cela, on suppose qu’il existe une division euclidienne associée à une application (stathme) φ. Montrer qu’il existe z0 différent de 0 et de ±1 tel que φ(z 0 ) soit minimum. Démontrer que A/(z0 ) est de cardinal 2 ou 3. Montrer que l’équation x2 − x + 5 = 0 n’a pas de racine dans F 2 ou F3 . En déduire que A n’est pas euclidien. Remarque : on peut démontrer que A est cependant principal. Voir par exemple [21].
i
i i
i
i
i
i
i
2 • Anneaux et corps
48
PROBLÈMES Les corrigés de ces problèmes sont disponibles sur le site de Dunod : www.dunod.com.
2.1. LES ENTIERS DE GAUSS On note G l’ensemble Z[i] = {z ∈ C | ∃a ∈ Z, ∃b ∈ Z, z = a + bi}. (1) Vérifier que G est un anneau commutatif isomorphe au quotient Z[X]/(X 2 + 1). (2) Montrer que z = a + bi → N (z) = |z|2 = a2 + b2 est un morphisme pour le produit de G dans N. En déduire les unités (éléments inversibles) de G. On pourra se référer à l’exercice 2.9. (3) Montrer que G est un anneau euclidien pour le stathme N . On pourra montrer que si a et b = 0 sont dans G, il existe q dans G tel que : a − q < 1 b Puis on posera r = a − bq . On pourra s’aider d’une représentation graphique. Y a t-il unicité du quotient et du reste ? (4) Soit a ∈ G∗ . Montrer que si N (a) est un nombre premier, alors a est un irréductible de G. (5) Soit z = α + iβ un irréductible de G, où ni α ni β ne sont nuls. Montrer que p = α2 + β 2 est premier dans Z. On pourra utiliser le fait que p = zz et vérifier que z est aussi irréductible dans G. (6) Montrer que les irréductibles de G sont : • Les α + iβ tels que α2 + β 2 = p soit un nombre premier de Z. • Les premiers de Z qui ne peuvent s’écrire comme somme de deux carrés (il en existe : 3, 7,...), et leurs associés. (7) Montrer l’équivalence des trois énoncés, pour p premier différent de 2 : • p ≡ 1 (mod 4) • p non premier dans G. • −1 carré dans Z/pZ. • p est somme de deux carrés dans Z. (8) Déterminer parmi les éléments de G de partie réelle et de partie imaginaire dans [0, 3], lesquels sont irréductibles. Donner une décomposition des réductibles.
2.2. LES SOUS-ANNEAUX DE Q Ce problème a pour objectif de décrire tous les sous-anneaux de Q. On note A un tel sous-anneau (non nul), et D l’ensemble des dénominateurs des éléments de A dans leur écriture irréductible. C’est un sous-ensemble de N ∗ .
i
i i
i
i
i
i
i
Solutions des exercices
49
(1) Quel est l’ensemble D lorsque A = D, anneau des nombres décimaux ? (2) Montrer que d ∈ D si et seulement si (3) (4)
(5)
(6)
(7)
∈ A. Montrer que D est stable pour le produit (propriété 1), puis montrer que si d est un élément de D , alors tous les diviseurs (dans N) de d sont dans D (propriété 2). On suppose que D est une partie de N ∗ qui a les propriétés 1 et 2. Vérifier que p A = x ∈ Q | ∃p ∈ Z, q ∈ D, p ∧ q = 1 et x = q est bien un sous-anneau de Q. Soit P l’ensemble des nombres premiers. Si D est associé à un anneau A, on note Q l’ensemble des diviseurs premiers des éléments de D . Montrer que d ∈ D si, et seulement si ses facteurs premiers sont dans Q. On note Q un sous-ensemble non vide de P . Montrer que l’ensemble des entiers dont les facteurs premiers sont dans Q vérifie les propriétés 1 et 2. Donner la description des sous-anneaux de Q. Reconnaître les anneaux associés à Q = {2, 5} puis Q = P \ {2}. 1 d
SOLUTIONS DES EXERCICES Solution 2.1. x → ax est injective équivaut à
∀(x, y) ∈ A2 ,
(ax = ay)
⇒
(x = y)
© Dunod. La photocopie non autorisée est un délit.
c’est donc exactement la régularité à gauche de a. Si de plus A est fini, on dispose d’une application injective d’un ensemble fini dans lui-même : elle est forcément bijective. Donc 1A admet un antécédent unique et a admet un inverse à droite. Un élément régulier est donc inversible, et comme on sait que tout inversible est régulier les deux notions coïncident dans le cas des anneaux finis. Application : un anneau intègre fini est un corps. Solution 2.2. Si M est un diviseur de zéro, il existe N non nul tel que M N = 0. Supposons que M représente un endomorphisme f de K n , alors N représente g telle que f ◦ g = 0. Cette égalité équivaut à Im g ⊂ Ker f . Comme g = 0 équivaut à Im g = 0, on voit qu’il est nécessaire que Ker f = 0. Réciproquement, si cette condition est réalisée, il est facile de construire un endomorphisme non nul dont l’image est incluse dans Ker f , par exemple la projection sur Ker f suivant un supplémentaire de Ker f . Les diviseurs de zéro à gauche sont donc les matrices de déterminant nul. Cherchons les diviseurs de zéro à droite : le même raisonnement montre qu’il existe f non nul tel que f ◦ g = 0 seulement si Im g est un sous-espace vectoriel strict de E , donc si g n’est pas bijective, les diviseurs de zéro à droite sont encore les matrices non inversibles. Dans l’anneau des matrices sur un corps, les notions d’éléments réguliers et inversibles coïncident.
i
i i
i
i
i
i
i
2 • Anneaux et corps
50
Soit I = {x ∈ A | ax = 0}. Alors, si x et y sont dans I , a(x + y) = ax + ay = 0 et si z ∈ A, a(xz) = (ax)z = 0 donc I est un idéal à droite de A. Bien sûr, il est non trivial (ni nul, ni A) lorsque a est diviseur de zéro à gauche. Si k ∈ Z/nZ, alors kx = 0 équivaut à kx ∈ nZ. Si on introduit le p.g.c.d. de k et de n n, cette condition équivaut à x multiple de n∧k . L’annulateur de k est l’idéal engendré n par la classe de n∧k . Dans le cas de l’annulateur à droite d’une matrice, il suffit d’utiliser l’exercice précédent : l’annulateur à droite d’une matrice de noyau F et d’image G est formé des matrices dont l’image est incluse dans F , l’annulateur à gauche est formé des matrices dont le noyau contient G. On peut montrer que ces annulateurs sont les seuls types d’idéaux de Mn (K). Solution 2.3.
Solution 2.4. Soit I un idéal bilatère de M n (K) et M une matrice de I . Supposons que M ne soit pas nulle, alors un de ses coefficients, par exemple m 11 n’est pas nul. Comme I est un idéal bilatère, la matrice E i1 M E1j = m11 Eij est dans I . Si on multiplie à gauche par m111 In , on voit que Eij est dans I pour tout couple (i, j), I est donc l’anneau tout entier.
Solution 2.5. Il suffit d’utiliser le théorème de correspondance. Les idéaux de Z/nZ
sont en bijection avec les idéaux dZ de Z tels que nZ ⊂ dZ ⊂ Z et d doit donc être un diviseur de n, l’idéal est engendré par la classe de d modulo n. L’ensemble des idéaux de Z/nZ est donc en bijection avec l’ensemble des diviseurs positifs de n, l’idéal nul étant engendré par n = 0, l’anneau tout entier est engendré par 1.
Solution 2.6. Soit k ∈ Z/nZ un élément nilpotent. Si on suppose k
r
= 0, cela
équivaut à
∃ ∈ N, kr = n Tout diviseur premier de n est un diviseur de k r donc de k, et donc k est multiple de p1 p2 . . . ps où p1 , p2 , . . ., ps sont les diviseurs premiers de n. Réciproquement, si k est multiple de ce produit, il existe une puissance de k qui sera multiple de n, il suffit de choisir le plus grand des exposants des p i dans la décomposition de n. En revenant dans Z/nZ, on constate qu’il n’y aura pas de nilpotent non nul lorsque n est égal à p1 p2 . . . ps . On dit alors que n est sans facteur carré.
Solution 2.7. Si x et y sont dans
√
I , on aura xk ∈ I et y ∈ I pour un certain k et
un certain . Donc
(x + y)n =
n n n−i i x y i i=0
i
i i
i
i
i
i
i
Solutions des exercices
51
sera dans I dès que n k + car alors n − i k ou i pour tout i entre 0 et n. Par ailleurs, si a est dans A, (ax)k = ak xk est dans l’idéal I . On a bien démontré que √ I est un idéal. Si I est l’idéal nul, cet idéal est formé des éléments nilpotents de A. Soit maintenant x et y dans I : J , alors
(x + y)J ⊂ xJ + yJ ⊂ I + I = I et donc I : J est un idéal. Si I est l’idéal nul, on retrouve la notion d’annulateur. Donnons un exemple dans l’anneau Z : si n = p a11 . . . pakk où les pi sont des nombres premiers et où les exposants sont non nuls, on a : √ nZ = p1 p2 . . . pk Z En effet, si xk est un multiple de n, tout premier qui divise n doit diviser x. Et si un nombre est multiple de p 1 p2 . . . pk , sa puissance k, pour k assez grand, sera multiple a (examiner à part les cas de n. On montrera de même que aZ : bZ = a Z où a = a∧b où a ou b est nul). Comment définir le produit de deux idéaux ? En règle générale, si I et J sont deux idéaux d’un anneau commutatif A, l’ensemble des produits d’un élément de I par un élément de J n’est pas un idéal. On définira IJ comme l’idéal engendré par les produits, c’est donc
IJ = {x ∈ A | ∃k ∈ N, ∃(xi ) ∈ I , ∃(yi ) ∈ J , x = k
k
k
xi yi }
i=1
Cas particulier : si I = (a) et J = (b) alors il est immédiat que IJ = (ab). Supposons maintenant que les idéaux I et J sont étrangers, c’est-à-dire que leur somme est A.
© Dunod. La photocopie non autorisée est un délit.
• IJ ⊂ I ∩ J puisque si zi = ai bi où ai ∈ I et bi ∈ J , alors zi ∈ I ∩ J d’après la seconde propriété des idéaux. Les sommes d’éléments de la forme z i sont donc dans I ∩ J . On n’a pas utilisé l’hypothèse. • I ∩ J ⊂ IJ . L’hypothèse A = I + J implique qu’il existe i ∈ I et j ∈ J tels que 1 = i + j . Si x ∈ I ∩ J , alors x = xi + xj est somme de deux produits formés d’un élément de I avec un élément de J , on a montré que x est dans IJ . Dans Z, les idéaux (a) et (b) sont étrangers si et seulement si a et b sont premiers entre eux. De plus, (a)(b) = (ab) et l’égalité (a)(b) = (ab) = (a) ∩ (b) traduit alors que le p.p.c.m. de a et de b est leur produit ab. Solution 2.8. Soit J un idéal de A, différent de A. On se place dans l’ensemble E
des idéaux différents de A qui contiennent J . E est non vide car il contient au moins J . Soit C un ensemble totalement ordonné (pour l’inclusion) d’éléments de E . Alors montrons que U = I∈C I est un majorant de C ; c’est un idéal, car si x et y sont dans U , on a x ∈ I1 et y ∈ I2 , mais comme l’ensemble C est totalement ordonné, on a par exemple, I1 ⊂ I2 et x ∈ I2 , donc x + y ∈ I2 ⊂ U . La seconde propriété se vérifie encore plus directement. Il faut montrer que U est bien dans E , donc que c’est un idéal
i
i i
i
i
i
i
i
2 • Anneaux et corps
52
différent de A. Sinon, en effet, 1A ∈ U , donc il existe I ∈ C tel que 1A ∈ I . Mais alors I serait A, ce qui est contraire à l’hypothèse. Enfin, U contient I qui contient J . En appliquant le théorème de Zorn, on a montré que E avait au moins un élément maximal K. Une subtilité : il faut montrer que K est bien un idéal maximal de A. Si en effet l’idéal L vérifie K ⊂ L A, il contient J comme K et c’est donc un élément de E . Comme K est maximal dans E , on a L = K. En appliquant ce résultat à J = {0}, on obtient que tout anneau non nul admet un idéal maximal. Bien entendu, ces démonstrations s’appliquent aux idéaux à gauche, à droite ou bilatères.
Solution 2.9.
√ √ (1) Z[i 3] doit contenir 1 et i 3, les sommes et les opposés de ces éléments donc √ tous les a + bi 3 où a et b sont dans Z. Mais l’ensemble ainsi construit est un anneau. Il est stable pour la somme, et pour le produit car : √ √ √ (a + bi 3)(a + b i 3) = aa − 3bb + (ab + a b)i 3 √ c’est donc un sous-anneau√ de C, le plus petit qui contienne i 3. Le même calcul fonctionne dans le cas de d, où d est un entier √ positif qui n’est pas un carré, √ il y a unicité de l’écriture sous la forme a + b d avec a et b entiers, car d est irrationnel. √ (2) |a + ib 3|2 = a2 + 3b2 ∈ N. C’est un morphisme pour le produit, car c’est déjà vrai dans C. Si z est inversible d’inverse z dans notre anneau, on aura zz = 1, donc N (z)N (z ) = N (1) = 1. Comme √ N (z) et N (z ) sont dans √ N, ils sont √ égaux à 1. Et si N (z) = 1, avec z = a+ bi 3, on a N √(z) = (a+ bi 3)(a− bi 3) = 1, l’inverse de z est son conjugué, il est dans Z[i 3]. Le problème se réduit à trouver tous les entiers relatifs tels que a 2 + 3b2 = 1, b est nul et a = ±1. Seuls 1 et −1 sont inversibles dans notre anneau. √ √ (3) On a N (1 + i 3) = 4. Supposons z = 1 + i 3 réductible sous la forme z = xy ; ni x ni y n’étant inversible, on doit avoir N (x) = N (y) = 2. Mais a 2 +√3b2 ne peut prendre la valeur 2 lorsque a et b sont entiers. De même, z = 1 − i 3 et 2 sont irréductibles, et ces irréductibles sont non associés. Donc √ √ 4 = 2 × 2 = (1 + i 3)(1 − i 3) donne deux décompositions distinctes en irréductibles. N (a)N (b) = 4. On voit également que z divise 2 × 2 mais il ne divise pas 2, car z = 2x impliquerait que N (x) = 1 soit x = ±1.
Solution 2.10. Soit a et b dans A. On suppose qu’il existe un p.p.c.m., noté m.
Comme ab est évidemment un multiple commun de a et de b, il existe d tel que ab = md. Mais, comme a divise m, da divise dm = ab . Donc d est un diviseur de b. En échangeant les rôles, d est aussi un diviseur de a.
i
i i
i
i
i
i
i
Solutions des exercices
53
Soit maintenant δ un diviseur commun de a et de b. Alors a = a δ et b = b δ et a b δ est un multiple commun de a et de b. C’est donc un multiple de m, et il existe k tel que a b δ = km. Mais, en multipliant par d :
a b δd = kmd = kab = ka b δ2
⇒
d = kδ
tout diviseur commun est un diviseur de d, on a prouvé l’existence du p.g.c.d. de a et b.
Solution 2.11. On va utiliser la même démonstration que le théorème chinois vu dans le cours. Soit φ le morphisme de A dans A/(a 1 ) × A/(a2 ) × . . . A/(ak ) qui à a ∈ A associe le k−uple de ses classes. C’est un morphisme d’anneau. De plus,
a ∈ Ker φ ⇐⇒ ∀i, a ∈ (ai ) ⇐⇒ a ∈
k
(ai )
i=1
k Montrons maintenant ki=1 (ai ) = a sous l’hypothèse que les (a i ) sont i i=1 premiers entre eux deux à deux. C’est vrai pour k = 2, en utilisant une relation de Bezout : a1 u1 + a2 u2 = 1 ⇒ (a1 a)u1 + (a2 a)u2 = a et si a est multiple de a1 et de a2 , cette égalité montre qu’il est multiple de leur produit. Et bien sûr, tout multiple de a 1 a2 est multiple commun de a 1 et de a2 . On a donc : a1 ∧ a2 = 1 ⇒ (a1 ) ∩ (a2 ) = (a1 a2 )
© Dunod. La photocopie non autorisée est un délit.
On pourra bien sûr faire le lien avec l’exercice 2.7. Utilisons pour continuer le résultat : a1 ∧ a3 = 1 ⇒ a1 a2 ∧ a3 = 1 a2 ∧ a3 = 1 qui s’obtient par le produit de deux relations de Bezout a 1 u + a3 v = 1 et a2 u + a3 v = 1 qui s’écrit a1 a2 uu + a3 (a3 vv + a2 u v + a1 uv ) = 1. On a donc ((a1 ) ∩ (a2 )) ∩ (a3 ) = (a1 a2 ) ∩ (a3 ) = (a1 a2 a3 ) et ainsi de suite. Pour conclure en appliquant le théorème d’isomorphisme, il faut montrer la surjectivité de φ ; cela se fait également par récurrence. Si (x, y) ∈ A × A, alors, en utilisant une relation de Bezout a1 u + a2 v = 1, on voit que a = a1 uy + a2 vx a pour image (x + (a1 ), y + (a2 )), et on traite le cas général de proche en proche. Solution 2.12. Une fonction f est inversible s’il existe une fonction g telle que
∀x ∈ R, f (x)g(x) = 1. Il est donc nécessaire que f ne s’annule jamais, et on sait alors que la fonction g = f1 est continue sur R comme f . Une fonction f sera un diviseur de zéro s’il existe une fonction g continue telle que ∀x ∈ R, f (x)g(x) = 0. Si, par exemple, f est nulle sur l’intervalle [0, 1], on peut prendre g nulle sur ] − ∞, 0]
i
i i
i
i
i
i
i
2 • Anneaux et corps
54
et [1, +∞[ et égale à x(1 − x) sur [0, 1]. Si par contre f est nulle seulement en un point isolé x0 , ce n’est ni un élément inversible, ni un diviseur de zéro. Soit en effet g continue telle que f g = 0. Alors, on doit avoir g(x) = 0 pour tout x = x 0 , et, par continuité, g(x0 ) = lim g(x) = 0 x→x0
et g est la fonction constante nulle.
Solution 2.13.
(1) Pour tout x de A,
(x + 1)2 = x + 1 ⇐⇒ x2 + x + x + 1 = x + 1
d’où
x + x = 0,
et A est de caractéristique 2. Si x et y sont quelconques dans A,
(x + y)2 = x + y ⇐⇒ x + xy + yx + y = x + y
et donc
xy = −yx
comme A est de caractéristique 2, −yx = yx, l’anneau est commutatif. (2) Supposons que A ait trois éléments distincts, 0, 1 et x. Alors 1 + x est distinct de ces trois éléments car 1 + x = 0 puisque x = 1, 1 + x = 1 puisque x = 0 et 1 + x = x puisque 1 = 0. Remarquons au passage que x(1 + x) = x + x = 0, un anneau de Boole qui a plus de deux éléments ne peut être intègre. Prolongeons encore : tout anneau de Boole A peut être muni d’une structure d’espace vectoriel sur F 2 , en posant 0.x = 0 et 1.x = x, les vérifications sont faciles, et utilisent que A est de caractéristique 2. Si donc A est fini, il est isomorphe (en tant qu’espace vectoriel) à F n2 pour un certain n, et le cardinal de A est de la forme 2n . (3) Fn2 donne des exemples d’anneaux de Boole à 2 n éléments, de même que P(E), muni de ∆ et ∩ : voir l’exercice 1.13, p. 14, qui montre que ces deux exemples ne sont pas très différents...
Solution 2.14.
(1) (a, s)R(a, s) ⇐⇒ as − as = 0, la relation est réflexive. Si (a, s)R(a , s ), alors a s − as = −(as − as) = 0 donc (a , s )R(a, s), la relation est symétrique, enfin (a, s)R(a , s ) ⇐⇒ as − a s = 0 ⇒ as s = a ss = a ss (a , s )R(a , s ) ⇐⇒ a s − a s = 0 d’où as = a s et (a, s)R(a , s ), la relation est transitive. On a utilisé l’intégrité de l’anneau. (2) Il faut vérifier que les opérations sont compatibles avec les lois. Faisons-le pour la somme : si (a, s)R(a , s ) et (b, t)R(b , t ) alors (at + bs, st)R(a t + b s , s t ) puisque
(at + bs)s t − (a t + b s )st = (as − a s)tt + (bt − b t)ss = 0
i
i i
i
i
i
i
i
Solutions des exercices
55
Le reste des vérifications est immédiat, avec le modèle des fractions en tête. Par exemple, l’élément neutre pour le produit est la classe ss = 1 où s est un élément quelconque de S , l’élément neutre pour l’addition est la classe 0s . (3) Comme A est intègre, si s et s sont non nuls, alors ss aussi, S = A \ {0} est multiplicatif. Si a n’est pas nul, as × as = 1, donc S −1 A est un corps. Enfin, a → a1 est un isomorphisme de A sur un sous-anneau de S −1 A. Le corps des fractions de Z est bien sûr Q, le corps des fractions de K[X] est le corps des fractions rationnelles à coefficients dans K , noté K(X). (4) Soit S = A \ I où I est un idéal premier. S ne contient pas 0 puisque 0 ∈ I et par définition,
∀(a, b) ∈ A2 ,
(ab ∈ I) ⇒ (a ∈ I ou b ∈ I)
et par contraposition,
∀(a, b) ∈ A2 ,
(a ∈ S et b ∈ S) ⇒ (ab ∈ S)
S est donc multiplicatif. On a donc un anneau S −1 A. Dans le cas où A = Z et I = 2Z, cet anneau s’identifie à l’ensemble des rationnels qui s’écrivent ab où b est impair. C’est donc un sous-anneau de Q ; on vérifie en particulier que l’ensemble des éléments non inversibles est l’idéal engendré par 2.
Solution 2.15. Dans l’anneau Z/pk Z, x est inversible si et seulement si x est premier
à pk , donc x non multiple de p. Pour compter les inversibles, comptons les p tels que 0 p < pk . Il vient 0 < pk−1 . On a donc
φ(pk ) = pk − pk−1
© Dunod. La photocopie non autorisée est un délit.
Dans le cas général, commençons par observer qu’on a
(A × B)× = A× × B × car, pour la loi produit, (a, b) est inversible si et seulement si a et b sont inversibles. αk 1 α2 Ce résultat s’étend à un produit quelconque. Si maintenant n = p α 1 p2 . . . pk , où les pi sont des nombres premiers. Le théorème chinois permet d’obtenir l’isomorphisme :
Z/nZ Z/pα1 1 Z × . . . × Z/pαk k Z et donc
φ(n) =
k
i=1
pαi i
−
pαi i −1
=
k i=1
pαi i
1 1− pi
=n
k i=1
1 1− pi
On retrouve un résultat obtenu à la fin du problème du premier chapitre.
i
i i
i
i
i
i
i
2 • Anneaux et corps
56
Solution 2.16.
√ (1) Soit (a, b) ∈ Z2 . Si z = a + ib 5 est inversible dans A, alors N (z)N (z −1 ) = N (1) = 1 Comme les normes des éléments de A sont des entiers positifs, il est nécessaire que N (z) = a2 + 5b2 = 1. Les seules solutions en entiers de cette équation sont a = 1, b = 0 et a = −1, b = 0. On a donc A× = {−1, 1}. √ (2) Si z = a + bi 5 est un diviseur de 9, N (z) est un diviseur de N (9) = 81 dans N. Si N (z) = 1, on a les solutions 1 et −1. N (z) = 3 est impossible, et N (z) = 9 donne a = ±2 et b = ±1, ou bien a = ±3 et b = 0. N (z) = 27 ne peut se produire, car le second facteur z vérifierait N (z ) = 3. Enfin les diviseurs tels que N (z) = 81 sont 9 et −9 puisque le second facteur est de norme 1. En définitive, on a √ √ 9 = 3 × 3 = (2 + i 5)(2 − i 5) √ à une unité près. Les diviseurs ±3 et ±2 ± i 5 sont irréductibles : leur norme est 9 et il n’y a pas d’élément de norme 3. (3) C’est √ la question √ précédente qui nous guide : 3 est irréductible, mais 3 divise √ (2+i 5)(2−i 5) = 9 sans diviser un des facteurs. En effet, si 3 divisait 2+i 5 par exemple, le quotient serait de norme 1, donc serait ±1, qui ne conviennent pas. Le nombre 3 est irréductible sans être premier, et ce seul fait montre que A n’est ni principal, ni factoriel. Remarquons également que dans la question précédente on a obtenu deux factorisations différentes de 9 en produit d’irréductibles, ce qui confirme que A n’est pas factoriel. √ (4) 3 et 2+i 5 sont premiers entre eux, leurs seuls diviseurs√communs sont √les unités. Ils ont √ comme multiple commun 9, mais aussi 3(2 + i 5) = 6 + 3i 5. Or 9 et 6 + 3i 5 ont même norme, 81. Ils ne sont pas multiples d’un même élément de A, comme le montre la question précédente. √ √ (5) Même situation : 9 et 6 + 3i 5 ont des diviseurs communs, 1, 3 , 6 + 3i 5 et leurs associés. Mais, parmi ces diviseurs, il n’y en a pas de « plus grand » (au sens de la relation divise). Ces deux éléments n’ont pas de p.g.c.d. Ils ne peuvent avoir de p.p.c.m., car un exercice précédent montre que des éléments qui ont un p.p.c.m. ont nécessairement un p.g.c.d.
Solution 2.17.
(1) On peut résoudre l’équation x 2 − x + 5 = 0 dans C. Les solutions sont √ √ 1 − i 19 1 + i 19 , x2 = =β x1 = 2 2
i
i i
i
i
i
i
i
Solutions des exercices
57
Montrons que A = Z[β] est stable pour le produit. Soit z = a+bβ et z = a +b β , alors
zz = (a + bβ)(a + b β) = aa + (a b + ab )β + bb β 2 = aa − 5bb + (a b + ab + bb )β qui est bien dans A. A est aussi stable pour l’addition et contient 1, c’est un sousanneau de C. Enfin, β et β sont les racines de l’équation x 2 − x + 5, leur somme est donc 1, ce qui prouve que β est dans A et donc que A est stable pour la conjugaison. (2) La méthode est toujours la même : on considère N (z) = zz . Si z = a + bβ , on a
N (z) = (a + bβ)(a + bβ) = (a + bβ)(a + b − bβ) = a2 + ab + 5b2 z inversible demande que N (z) = 1, puisque N (z)N (z −1 ) = 1 et que ces deux normes sont des entiers positifs. Mais, en multipliant par 4, 4N (z) = 4a2 + 4ab + 20b2 = (2a + b)2 + 19b2 = 4 impose b = 0 donc a = ±1. Seuls z = 1 et z = −1 conviennent. (3) Supposons qu’il existe une division euclidienne, associée au stathme φ. L’ensemble des valeurs prises par l’application stathme restreinte à A \ {0, 1, −1} est un sous-ensemble de N qui a un plus petit élément. Ce plus petit élément est atteint pour un certain z0 de A.
© Dunod. La photocopie non autorisée est un délit.
(4) Soit alors (z0 ) l’idéal principal engendré par z 0 . Comme la division par z0 ne peut avoir comme reste que 0, 1 ou −1, ce quotient a deux ou trois éléments, selon que 1 et −1 sont ou non dans la même classe. C’est un anneau : ce ne peut donc être que F2 ou F3 : il est en effet facile de vérifier qu’il n’existe qu’une structure de groupe à deux (resp. trois) éléments, et qu’on ne peut alors construire qu’une multiplication qui en fasse un anneau. (5) Si p est la projection de A sur A/(z 0 ), l’image α = p(β) doit vérifier, comme β , l’équation α2 − α + 5 = 0. Or cette égalité, qui s’écrit α2 + α + 1 = 0 dans F2 , et α2 − α + 2 = 0 dans F3 n’a pas de solution, dans l’un et l’autre cas. L’anneau A ne peut être euclidien. On montre néanmoins qu’il est principal, en utilisant une « division » qui ressemble à la division euclidienne : voir par exemple le livre [21].
i
i i
i
i
i
i
i
i
i i
i
i
i
i
i
Chapitre 3
Polynômes
3.1 L’ANNEAU DES POLYNÔMES A[X] 3.1.1. Généralités
© Dunod. La photocopie non autorisée est un délit.
Si A est un anneau commutatif, on définit l’anneau des polynômes à coefficients dans A comme dans le cas d’un corps : ce sont des suites d’éléments de A « presque tous nuls », avec une opération de somme et de produit. L’anneau des polynômes A[X] est l’ensemble des suites P = (an )n∈N où les an sont dans A, et sont nuls sauf un nombre fini. Il est muni des opérations + et × définies par : Définition 3.1.
(an )n∈N + (bn )n∈N = (an + bn )n∈N (an )n∈N × (bn )n∈N = (cn )n∈N avec
cn =
n
ai bn−i
i=0
On vérifie que c’est un anneau commutatif. Le sous-ensemble des suites de la forme (a, 0, 0, . . .) est un sous-anneau isomorphe à A, et on l’identifie à A. Il contient les deux éléments neutres 0 et 1. Si on note X la suite (0, 1, 0, 0, . . .), on constate que
i
i i
i
i
i
i
i
3 • Polynômes
60
X × X = (0, 0, 1, 0, 0, . . .), et que la suite des polynômes (X k )k∈N est génératrice en ce sens que ∞ P = ai X i i=0
Cette somme est en réalité finie puisque la suite des coefficients est presque nulle. On définit comme dans le cas usuel la notion de degré, et on appelle coefficient dominant le coefficient du terme de plus haut degré, et un polynôme est dit unitaire si son coefficient dominant est 1. Le degré du polynôme nul est, par convention, −∞. Attention... en toute généralité, le degré du produit de deux polynômes est inférieur ou égal à la somme des degrés. Dans un anneau non intègre comme Z/6Z, on a par exemple (2X 2 + 1)(3X 3 + X + 2) = 5X 3 + 4X 2 + X + 2 Proposition 3.2. Si A est intègre, deg(P Q) = deg(P ) + deg(Q).
A[X] est intègre si et seulement si A est intègre.
Démonstration. La première propriété est immédiate, avec des conventions naturelles dans le cas du polynôme nul. Pour la seconde propriété, la condition est nécessaire, à cause des polynômes constants ; réciproquement, si A est intègre, la première propriété du théorème assure que A[X] est intègre. 3.1.2. Division euclidienne, racines Définition 3.3. Soit D un polynôme de A[X] dont le coefficient dominant est inversible. Alors, pour tout P ∈ A[X], il existe Q et R de A[X] tels que :
P (X) = D(X)Q(X) + R(X), avec R = 0 ou deg R < deg D On dit que c’est la division euclidienne de P par D , la démonstration se fait facilement par récurrence sur le degré de D . La division euclidienne est toujours possible si A est un corps (et si D n’est pas le polynôme nul), et donc Proposition 3.4. Si K est un corps commutatif, K[X] est euclidien.
Si A n’est pas un corps, la division euclidienne n’est pas toujours possible. On ne peut diviser un polynôme unitaire par un polynôme de degré inférieur et dont le coefficient dominant est non inversible : considérer les termes de plus haut degré. On verra même en exercice ( cf. exercice 3.4 ) que lorsque A n’est pas un corps, A[X] n’est pas principal. Néanmoins, la division euclidienne reste un outil fondamental pour l’étude des anneaux A[X]. Si α est un élément de A, on définit P (α) comme étant P (α) = ai αi , et si P (α) = 0, on dit que α est une racine du polynôme P . Si B est un anneau contenant A, on peut encore définir P (α) avec α ∈ B .
i
i i
i
i
i
i
i
3.1 L’anneau des polynômes A[X]
61
Proposition 3.5. Dans A[X], P (a) = 0 ⇐⇒ X − a | P . Si A est intègre, un
polynôme P non nul a au maximum deg P racines.
Démonstration. Il suffit d’utiliser la division euclidienne par X − a qui est toujours définie et s’écrit P (X) = (X − a)Q(X) + P (a) On démontre la seconde propriété par récurrence sur le degré. Si P est de degré n + 1 et s’il a une racine a, alors, pour tout b différent de a, P (b) = (b − a)Q(b), avec deg Q = n, et b est une racine de P si et seulement si c’est une racine de Q puisque A est intègre. Attention au cas où A n’est pas intègre. Par exemple, le polynôme X 2 a 4 racines dans Z/16Z. On définit les racines multiples, en disant que a est racine multiple d’ordre (exactement) k si P (X) = (X − a)k Q(X) et Q(a) = 0 Exercice 3.1. Soit P ∈ A[X], P (X) =
n
P (X) =
i i=0 ai X . On n iai X i−1 i=1
définit P par
© Dunod. La photocopie non autorisée est un délit.
et on a les propriétés habituelles de la dérivation. Montrer que a est racine simple de P si et seulement si P (a) = 0 et P (a) = 0. Généraliser à des racines multiples. Exercice 3.2. Soit P (X) un polynôme de R[X]. On suppose que la décomposition en irréductibles de P est de la forme P (X) = ki=1 Pi (X)αi , où les Pi sont irréductibles distincts. Comment calculer le polynôme R(X) = ki=1 Pi (X) ? Bien sûr, cela sans connaître les Pi . On utilisera le p.g.c.d. P ∧ P et on fera l’application au polynôme P défini par
X 10 −7X 9 +2X 8 +15X 7 +87X 6 +140X 5 +207X 4 +183X 3 +146X 2 +65X +25 Il est conseillé d’utiliser un logiciel de calcul formel. Exercice 3.3. Soit P un polynôme de Z[X]. On suppose que P a une racine ration-
nelle. Montrer qu’on peut la trouver avec un nombre fini d’essais. Application : trouver les racines rationnelles du polynôme P défini par
P (X) = 8X 5 + 78X 3 + 52X 4 + 3X 2 + 70X − 49 et le factoriser en irréductibles. On pourra également chercher à factoriser le polynôme obtenu dans l’exercice précédent.
i
i i
i
i
i
i
i
3 • Polynômes
62
Exercice 3.4. Soit A un anneau commutatif. Démontrer que A[X] est principal si
et seulement si A est un corps. On pourra considérer l’idéal (a, X) engendré par a élément non inversible de A et par X .
3.2 POLYNÔMES IRRÉDUCTIBLES 3.2.1. Corps algébriquement clos Pour étudier les questions de divisibilité, il est important de connaître les polynômes irréductibles de A[X]. La question n’est pas facile à résoudre en général, même lorsque A est un corps, et nous nous limiterons au cas d’un anneau commutatif intègre. Commençons par un cas élémentaire : Proposition 3.6. Pour tout a ∈ A, X − a est irréductible.
L’outil de base est le degré : on commence par observer qu’un polynôme est une unité si et seulement si c’est un polynôme constant égal à une unité de A. Ensuite, puisque deg QR = deg Q + deg R, les diviseurs de X − a sont de degré 0 ou 1, ce sont les unités ou les associés de X − a. Il est un cas où on obtient ainsi tous les irréductibles. Définition 3.7. Le corps K est algébriquement clos si tout polynôme non constant admet (au moins) une racine. Théorème 3.8. Si K est algébriquement clos, tous les polynômes de K[X] se facto-
risent en polynômes du premier degré. On dit qu’ils sont scindés. Les polynômes irréductibles de K[X] sont les polynômes du premier degré.
Démonstration. La démonstration se fait par récurrence sur le degré. Comme K[X] est euclidien donc factoriel, la factorisation obtenue est la décomposition en irréduc tibles. Voici maintenant un théorème qui prouve qu’il existe des corps algébriquement clos. Nous n’en faisons pas la démonstration (on en trouve dans les ouvrages d’analyse, comme par exemple celui de cette collection). Théorème 3.9.
Théorème de d’Alembert-Gauss. Le corps C est algébriquement
clos. On en déduit : Théorème 3.10. Les polynômes irréductibles de R[X] sont les polynômes de degré 1
et les polynômes du second degré sans racines réelles.
i
i i
i
i
i
i
i
3.2 Polynômes irréductibles
63
Démonstration. Tout polynôme P de R[X] peut être considéré comme un polynôme de C[X]. De plus, si α est une racine non réelle de P , on a P (α) = P (α) = 0, donc α est racine de P avec la même multiplicité. On termine en observant que (X − α)(X − α) est alors un polynôme du second degré à coefficient réels, sans racine réelle. On peut démontrer (c’est le théorème de Steinitz) que tout corps est inclus dans un corps algébriquement clos, le plus petit s’appelant sa clôture algébrique (il est unique à isomorphisme près).
3.2.2. Factorialité des anneaux de polynômes Si A est un anneau, sans être un corps, A[X] n’est pas euclidien, et A[X] n’est pas principal même si A l’est (cf. l’exercice 3.4). Par contre, la factorialité s’hérite : Théorème 3.11. Si A est un anneau factoriel, alors l’anneau des polynômes A[X]
est factoriel.
Démonstration. Soit P un polynôme (non nul, comme dans tout le théorème) de A[X] et c = p.g.c.d.(a0 , a1 , . . . , an ) où les ai sont ses coefficients. On dit parfois que c est le contenu de P , il est défini à une unité près. Si c = 1 (en fait donc une unité), on dit que le polynôme P est primitif ; tout polynôme peut s’écrire P = c(P )P où P est primitif. Montrons d’abord le lemme de Gauss. Lemme 3.12. de Gauss
• Si P1 et P2 sont primitifs, alors P1 P2 est primitif.
© Dunod. La photocopie non autorisée est un délit.
• Le contenu du produit de deux polynômes est le produit des contenus.
Démonstration. [du lemme] Notons (a i ), (bj ) et (ck ) les coefficients respectifs de P 1 , P2 et P1 P2 . Soit p un irréductible. Il peut diviser a 1 , a2 ,... mais pas tous les ai . Soit h le premier indice tel que p ne divise pas a h . De même, soit k le premier indice tel que p ne divise pas bk . Alors, le coefficient ch+k = a bh+k− n’est pas divisible par p puisqu’il s’écrit comme un multiple de p plus a h bk . En conclusion, aucun irréductible ne divise tous les coefficients de P 1 Q1 qui est donc primitif. Pour la deuxième partie du lemme, écrivons P = c(P )P , Q = c(Q)Q , alors P Q = c(P )c(Q)P Q et P Q est primitif, donc c(P Q) = c(P )c(Q). Appelons K le corps des fractions l’anneau intègre A (voir l’exercice 2.14), et démontrons un autre lemme : Lemme 3.13. Si P ∈ A[X] se factorise dans K[X], sous la forme P = QR, alors
il existe deux polynômes Q et R de A[X], de mêmes degré respectif que Q et R, tels que P = Q R .
i
i i
i
i
i
i
i
3 • Polynômes
64
Démonstration. [du nouveau lemme] Commençons par le cas où P est primitif. Dans le corps des fractions de l’anneau A, on peut trouver des «dénominateurs communs» pour les coefficients et donc écrire Q et R sous la forme : Q=
n ∗ n Q et R = R∗ d d
où Q∗ et R∗ sont dans A[X] et sont primitifs. Mais on a alors : dd P = nn Q∗ R∗ et donc dd = nn en regardant les contenus de chaque membre, et donc P = Q ∗ R∗ . Passons maintenant au cas où P est quelconque. On écrit P = c(P )P ∗ , mais alors QR ∗ P ∗ = c(P ) et on applique ce qui précède, P se factorise dans A, c’est donc aussi le cas de P . On peut remarquer qu’une conséquence de ce lemme est que, pour un polynôme primitif, être irréductible sur A ou être irréductible sur K sont équivalents. Plus précisément, les irréductibles de A[X] sont les constantes irréductibles de A et les polynômes primitifs qui sont irréductibles dans K[X]. Montrons maintenant que A[X] est factoriel. Un polynôme P s’écrit P = c(P )P ∗ où P ∗ est primitif. Le contenu est dans A, donc il se factorise de façon unique en irréductibles de A. Le polynôme P ∗ se factorise dans l’anneau principal K[X] : P ∗ = P1 P2 . . . Pk . Mais les Pi se peuvent écrire : Pi = ndii Pi∗ et le même raisonnement que ci-dessus montre que P ∗ est produit des Pi∗ qui sont irréductibles dans A[X]. Reste à montrer l’unicité de la décomposition. Plutôt que de faire la démonstration, on va montrer que tout irréductible est premier, puisque c’est cela qui fait tout marcher. Supposons donc que P soit irréductible et divise QR. Alors il existe un polynôme S tel que P S = QR. Si P est constant, il est irréductible donc premier (dans A factoriel) et, en prenant les contenus, il divise soit le contenu de Q, soit le contenu de R. S’il n’est pas constant, on se place dans K[X], et P y divise, par exemple R. Mais alors on fait comme dans le lemme, on écrit la factorisation de R :
R=
n LP d
où L et P sont primitifs, n et d dans A. En multipliant par d et en prenant les contenus, on voit que n est un multiple de d, d’où le résultat. Insistons sur les résultats obtenus au cours de la démonstration, avec A factoriel et K son corps des fractions (par exemple A = Z et K = Q) : • Un polynôme de A[X] réductible dans K[X] est aussi réductible dans A[X]. • Les irréductibles de A[X] sont : – les polynômes constants P (X) = a où a est irréductible dans A. – les polynômes primitifs qui sont irréductibles dans K[X].
i
i i
i
i
i
i
i
3.2 Polynômes irréductibles
65
3.2.3. Critères d’irréductibilité Nous allons donner quelques exemples de critères d’irréductibilité pour les polynômes à «réduire» le polynôme modulo un entier n : si de Z[X]. Le plus simple consiste P ∈ Z[X], avec P (X) = ni=0 ai X i , on note P le polynôme de (Z/nZ)[X] dont les coefficients sont les classes modulo n des coefficients de P . Si P est unitaire et réductible dans Z[X], alors P est réductible dans (Z/nZ)[X], pour tout n : en effet, la factorisation d’un polynôme unitaire de Z[X] donne forcément deux polynômes unitaires, dont la réduction n’est jamais nulle ou constante. Par contraposition : Proposition 3.14. Soit P unitaire dans Z[X]. S’il existe n tel que sa réduction modulo
n est irréductible, alors P est irréductible dans Z[X].
Ainsi, X 5 − 2X 4 − 4X 3 + 3X 2 + 6X + 5 se réduit modulo 2 à X 5 + X 2 + 1, qui est irréductible : il y a un nombre fini (et petit) d’essais de factorisation à faire, qui tous échouent. Notre critère de réduction modulo n est loin de tout régler. Il existe en effet des cas de polynômes irréductibles, mais dont la réduction modulo p est réductible pour tout p premier. Un autre critère : Proposition 3.15. Critère d’Eisenstein. Si P ∈ Z[X] s’écrit P (X) =
et s’il existe un nombre premier p tel que :
p | a0 , p | a1 , . . . , p | an−1 ,
p an ,
n
i=0 ai X
i
p2 a0
© Dunod. La photocopie non autorisée est un délit.
alors P est irréductible dans Q[X].
Démonstration. D’après les hypothèses, la réduction modulo p de P (X) est P (X) = an X n . Si P était réductible sur Q, il serait réductible sur Z et on aurait P = QR, avec Q et R non constants. Donc Q(X) = bX r et R(X) = cX s , puisque l’anneau Fp [X] est factoriel. Mais alors les termes constants de R et de Q seraient tous les deux divisibles par p, et le terme constant de P , qui est leur produit, serait divisible par p2 : contraire à l’hypothèse. Exemple : P (X) = X n − 12 et, plus généralement P (X) = X n − pk où p est premier ne divisant pas k, sont des polynômes irréductibles sur Q. C’est un cas où la méthode de réduction ne donne rien. Un exemple moins direct : Proposition 3.16. Si p est premier, le polynôme Φ p (X) = 1 + X + X 2 + . . . + X p ,
p-ième polynôme cyclotomique est irréductible sur Q.
Démonstration. On considère le polynôme composé Q(Y ) = P (Y + 1). Alors si P est réductible sur Z, Q l’est également, et réciproquement puisque P (X) = Q(X −1).
i
i i
i
i
i
i
i
3 • Polynômes
66
Or
p−1 1 p p Q(Y ) = 1+(Y +1)+(Y +1) +. . .+(Y +1) = ((Y + 1) − 1) = Yi Y i i=0
Or (voir dans la démonstration de la proposition 2.26) tous les coefficients pi , pour i = 1 à p − 1, sont divisibles par p, le dernier étant p n’est pas divisible par p 2 . On peut appliquer le critère d’Eisenstein, Φ p (X) est irréductible sur Q[X]. 2
p−1
Les polynômes cyclotomiques ont beaucoup d’intérêt en arithmétique. On regardera par exemple le premier problème, en fin de chapitre.
3.2.4. Corps finis Commençons par un théorème difficile, dont nous admettrons la démonstration (voir par exemple [21]). Théorème 3.17. de Wedderburn. Tout corps fini est commutatif.
On sait par contre qu’il existe des corps non commutatifs infinis, comme le célèbre corps des quaternions H. Un autre résultat, élémentaire cette fois : Proposition 3.18. Le cardinal d’un corps fini K est de la forme q = p n où p est un
nombre premier, n ∈ N.
Démonstration. Rappelons en effet que K , en tant qu’anneau intègre fini, a pour caractéristique un nombre premier p ; il contient donc un sous-corps identifié à Fp = Z/pZ, image du morphisme canonique de Z dans K . Par ailleurs, l’addition des éléments de K et le produit d’un élément de F p par un élément de K font de K un espace vectoriel sur F p . Comme K est fini, cet espace vectoriel est de dimension finie n, et K est isomorphe (en tant qu’espace vectoriel) à F np . Il a donc pour cardinal celui de Fnp , soit q = pn . Et comment obtient-on des corps de cardinal q = p n ? On sait déjà qu’il existe un corps de cardinal p, c’est F p , mais on peut affirmer beaucoup plus : Théorème 3.19. Pour tout p premier et pour tout n ∈ N, il existe un corps de cardinal
q = pn . De plus, ce corps est unique, à isomorphisme près, on le note F q .
Nous ne démontrons pas ce théorème, qui demande notamment pour l’unicité de connaître les débuts de la théorie de Galois ; cependant, montrons comment on peut, dans des cas concrets, obtenir une description de F q . L’idée est la même que celle qui consiste à construire le corps des complexes comme quotient R[X]/(X 2 + 1).
i
i i
i
i
i
i
i
3.2 Polynômes irréductibles
67
Proposition 3.20. Soit k un corps, P un polynôme irréductible de k[X] de degré n, alors k[X]/(P (X)) est un corps, contenant un sous-corps identifié à k, et c’est un k-espace vectoriel de dimension n.
Démonstration. Le début est bien connu : dans l’anneau principal k[X], l’idéal engendré par un irréductible est maximal, donc le quotient K = k[X]/(P (X)) est un corps. Il contient les classes des polynômes constants que l’on identifie à k. Si on note α la classe de X , les éléments de K sont de la forme x0 + x1 α + . . . + xn−1 αn−1 puisque tout polynôme est congru à son reste modulo P (X). K est alors un k-espace vectoriel de base 1, α, . . . , αn−1 . Si le polynôme P s’écrit
P (X) = X n + an−1 X n−1 + · · · + a0 les calculs de produits dans K se font en utilisant
αn = −an−1 αn−1 − an−2 αn−2 − . . . − a0 En définitive, tout se passe comme si on ajoutait au corps k un élément α «imaginaire» qui est une racine de P . Outre C déjà évoqué, les exemples sont innombrables, comme
√ Q[X]/(X 2 − 2) ≡ {x ∈ R | ∃a ∈ Q, ∃b ∈ Q, x = a + b 2} √ en «notant» 2 la classe de X . Avec un corps fini F p et un polynôme de degré n, on obtient donc un corps de cardinal q = p n . Par exemple,
© Dunod. La photocopie non autorisée est un délit.
F4 = F2 [X]/(1 + X + X 2 ) car le polynôme 1 + X + X 2 est irréductible sur F 2 puisqu’il n’a pas de racine. F4 a quatre éléments qui sont 0, 1, α et 1 + α. Le seul produit à calculer est α(1 + α) = α + α2 = 1 puisque 1 + α + α2 = 0 et que l’on est en caractéristique 2. Les éléments non nuls sont bien inversibles, c’est un corps.
Exercice 3.5. Soit K un corps commutatif. Montrer qu’un polynôme irréductible de degré d > 1 dans K[X] n’a pas de racine dans K . Montrer qu’un polynôme de degré 2 ou 3 qui n’a pas de racine dans K est irréductible dans K[X]. Application : donner la liste des irréductibles de degré 1, 2, 3 et 4 dans F 2 [X].
Exercice 3.6. Décrire un corps à neuf éléments.
i
i i
i
i
i
i
i
3 • Polynômes
68
3.3 POLYNÔMES À PLUSIEURS INDÉTERMINÉES 3.3.1. Définitions Soit K un corps commutatif. On construit par récurrence l’anneau des polynômes à n variables sur K par :
A = K[X1 , X2 , . . . , Xn ] = K[X1 , . . . , Xn−1 ][Xn ] On vérifie que l’ordre des variables n’a guère d’importance (un changement dans l’ordre conduit à un anneau canoniquement isomorphe). Attention, dès que n 2, c’est un anneau qui n’est ni euclidien ni principal, mais c’est toujours un anneau factoriel, en utilisant le théorème 3.11 et une récurrence immédiate. Proposition 3.21. L’anneau A = K[X1 , X2 , . . . , Xn ] est un K -espace vectoriel de dimension infinie. Une base est constituée des monômes de la forme X1α1 X2α2 . . . Xnαn .
On pourra parfois utiliser la notion de multi-indice ou multi-exposant : si on pose α = (α1 , . . . , αn ), le monôme ci-dessus sera noté X α . Son degré total, noté |α| est par définition la sommes des α i qui sont les degrés partiels. Ainsi, un polynôme de degré total inférieur à n sera de la forme P = aα X α |α|n
Un petit résultat bien utile. Proposition 3.22. P ∈ K[X1 , X2 , . . . , Xn ] est divisible par X1 − X2 si et seulement
si P (X1 , X1 , X3 , . . . , Xn ) est le polynôme nul.
Démonstration. Clairement, si P = (X 1 − X2 )Q, alors P (X1 , X1 , X3 , . . . , Xn ) est le polynôme nul. Pour la réciproque, proposons deux approches. Première démonstration : on pose A = K[X 3 , . . . , Xn ] et on considère P comme élément de A[X1 , X2 ]. Alors : P (X1 , X2 ) = ai,j X1i X2j , P (X1 , X1 ) = ai,j X1i X1j = 0 (i,j)∈I
(i,j)∈I
où I est un ensemble fini de couples d’indices. Par soustraction : P (X1 , X2 ) = ai,j X1i (X2j − X1j ) (i,j)∈I
et il ne reste plus qu’à observer que
X2j − X1j = (X2 − X1 )
j−1
X2j−1−k X1k
k=0
i
i i
i
i
i
i
i
3.3 Polynômes à plusieurs indéterminées
69
pour j non nul. On en déduit que P est divisible par X 1 − X2 . Seconde démonstration : on pose A = K[X 2 , X3 , . . . , Xn ] et on considère P comme élément de A[X1 ]. On peut alors écrire la division euclidienne de P par X 1 − X2 , qui est un polynôme unitaire du premier degré en l’indéterminée X 1 :
P = (X1 − X2 )Q(X1 , . . . , Xn ) + R R est nul ou de degré 0 en X1 , c’est donc un élément de A, c’est la valeur de P lorsque X1 prend la valeur X2 . Donc P (X1 , X2 , . . . , Xn ) = (X1 − X2 )Q(X1 , . . . , Xn ) + P (X2 , X2 , X3 , . . . , Xn )
d’où le résultat.
3.3.2. Polynômes symétriques Commençons par définir une «action» de groupe, celle du groupe symétrique S n sur l’anneau des polynômes. Soit σ une permutation des n entiers 1, 2, . . . , n. Si P est un polynôme à n variables, on peut lui associer le polynôme :
(σ.P )(X1 , . . . , Xn ) = P (Xσ(1) , Xσ(1) , . . . , Xσ(1) ) Par exemple, si σ est la transposition qui échange 1 et 2 (notée (1, 2)), on aura :
(1, 2).(X12 + X2 + 3X3 X1 ) = X22 + X1 + 3X3 X2 On dit alors qu’un polynôme est symétrique si :
∀σ ∈ Sn , σ.P = P Par exemple :
P (X, Y, Z) = X 2 Y Z + XY 2 Z + XY Z 2
© Dunod. La photocopie non autorisée est un délit.
On notera S l’ensemble des polynômes symétriques. Proposition 3.23. S est un sous-anneau de K[X 1 , X2 , . . . , Xn ].
Il suffit de l’écrire. C’est un sous-anneau strict dès qu’il y a plus d’une variable. Il existe des polynômes symétriques plus simples que d’autres, ce sont les n polynômes symétriques élémentaires : Définition 3.24. On appelle k -ième polynôme symétrique élémentaire de n
variables le polynôme :
σk =
Xi1 Xi2 . . . Xik
1i1
i
i i
i
i
i
i
i
3 • Polynômes
70
En toute rigueur, on devrait écrire σ k,n pour faire figurer le nombre n des indéterminées. La somme porte sur tous les k-uplets tels que la condition 1 i 1 < i2 < . . . < ik n soit satisfaite. Ainsi :
σ1 = X1 + X2 + . . . + Xn , σ2 = X1 X2 + X1 X3 + . . . + Xn−1 Xn , ... σn = X1 X2 . . . Xn On pose parfois σ0 = 1. Une partie de l’intérêt qu’apportent les polynômes symétriques élémentaires est le lien qu’il y a avec la théorie des équations polynômiales. Pour être plus précis, et en introduisant une nouvelle indéterminée que nous appellerons T : n n (T − Xi ) = (−1)i σi T n−i i=1
i=0
la démonstration se fait par récurrence sur le nombre des indéterminées, en utilisant :
σi,n+1 (X1 , X2 , . . . , Xn+1 ) = σi,n (X1 , . . . , Xn ) + σi−1,n (X1 , . . . , Xn )Xn+1 pour i vérifiant 0 < i < n. En appliquant cette identité à des polynômes en T scindés, on obtient le lien entre les racines de ce polynôme et les coefficients. Notons également que cette relation permet de démontrer que les polynômes symétriques élémentaires sont bien symétriques, car le premier membre est invariant par toute permutation des indéterminées X i . Le théorème principal est : Théorème 3.25. L’anneau des polynômes symétriques est engendré algébriquement
par les polynômes symétriques élémentaires. De plus, ces polynômes symétriques élémentaires sont algébriquement indépendants. Ce théorème signifie que tout polynôme symétrique est un polynôme en les polynômes symétriques élémentaires, avec la précision que cette écriture est unique. Précisons également que des polynômes P 1 , P2 ,...,Pm sont algébriquement indépendants si : ∀Q ∈ K[T1 , T2 , . . . , Tm ], Q(P1 , P2 , . . . , Pm ) = 0 ⇒ Q = 0 Et quelle est la signification de Q(P 1 , P2 , . . . , Pn ) ? On peut utiliser la notion de composition de polynômes, ou dire que c’est la valeur de la fonction polynôme associée à Q en un élément de l’anneau K[X 1 , X2 , . . . , Xn ]m . Avant de faire la démonstration, un ou deux exemples faciles :
X 2 + Y 2 + Z 2 = (X + Y + Z)2 − 2(XY + Y Z + ZX) = σ12 − 2σ2 XY 2 + X 2 Y + Y Z 2 + Y 2 Z + XZ 2 + X 2 Z = (X + Y + Z)(XY + Y Z + ZX) −3XY Z = σ1 σ2 − 3σ3
i
i i
i
i
i
i
i
3.3 Polynômes à plusieurs indéterminées
71
Passons maintenant à la démonstration du théorème.
Démonstration. Commençons par ordonner les monômes d’un polynôme symétrique P en suivant l’ordre dit lexicographique ou alphabétique. On dit que aX1α1 X2α2 . . . Xnαn > bX1β1 X2β2 . . . Xnβn si et seulement si αm > βm où m = min{k | αk = βk }. Cet ordre est total, voir l’exercice 1.17.Notons que les coefficients a et b n’interviennent pas (et ne sont pas nuls). Soit alors aX1α1 X2α2 . . . Xnαn le plus grand des monômes de P . Alors nécessairement α1 α2 . . . αn , car le polynôme est symétrique et P contient tous les α α α monômes de la forme aX1 σ(1) X2 σ(2) . . . Xn σ(n) . Et si par exemple on avait α2 > α1 , on aurait une contradiction en prenant la permutation qui échange 1 et 2. Soit alors Q le polynôme : αn−1 −αn αn Q = σ1α1 −α2 σ2α2 −α3 . . . σn−1 σn Il est somme de monômes, et le plus grand de ces monômes est :
X1α1 −α2 (X1 X2 )α2 −α3 (X1 X2 X3 )α3 −α4 . . . (X1 . . . Xn )αn = X1α1 X2α2 . . . Xnαn Donc P −aQ contient uniquement des monômes plus petits que le plus grand monôme de P . Il est encore symétrique, on a enlevé un polynôme symétrique à un polynôme symétrique. On réitère le processus avec le polynôme P − aQ. Le processus s’arrête en un nombre fini d’étapes : pour le dire de façon abstraite, c’est parce que l’ordre lexicographique est un bon ordre. Le processus décrit est algorithmique en ce sens qu’il décrit un procédé effectif. Montrons maintenant que les σ i sont algébriquement indépendants. Soit Ψ l’application linéaire de K[X1 , X2 , . . . , Xn ] dans lui-même qui à X1i1 X2i2 . . . Xnin associe
© Dunod. La photocopie non autorisée est un délit.
X1i1 +i2 +...+in X2i2 +...+in . . . Xnin Raisonnons par l’absurde, et supposons que Q soit un polynôme reliant les σ i . Pour fixer les idées, ce serait par exemple : Q(X 1 , X2 , X3 ) = αX12 X2 + βX1 X2 X3 , ce qui supposerait ασ12 σ2 + βσ1 σ2 σ3 = 0. On suppose bien sûr que les coefficients ne sont pas nuls. Alors soit alors aX 1i1 X2i2 . . . Xnin le monôme de Q dont l’image par Ψ est la plus grande pour l’ordre lexicographique (dans notre exemple, c’est βX 1 X2 X3 dont l’image est X13 X22 X3 ). Dans Q(σ1 , . . . , σn ), il y le terme aσ1i1 σ2i2 . . . σnin . Mais en développant ce terme, le monôme le plus grand est
aX1i1 +i2 +...+in X2i2 +...+in . . . Xnin = Ψ(aX1i1 . . . Xnin ) Mais ce monôme est alors le plus grand des monômes de Q(σ 1 , . . . , σn ). Comme ce polynôme est nul, le coefficient a est nul, ce qui est absurde. Maintenant un exemple. En utilisant la démonstration du théorème, étudions P (X1 , X2 , X3 ) = X13 + X23 + X33 . Le plus grand monôme est X13 , on soustrait donc σ13 = (X1 + X2 + X3 )3 ce qui donne :
P − σ13 = −3(X12 X2 + X1 X22 + . . .) − 6X1 X2 X3
i
i i
i
i
i
i
i
3 • Polynômes
72
Le plus grand monôme est alors X 12 X2 , on soustrait donc −3σ1 σ2 et en définitive P = σ13 − 3σ1 σ2 + 3σ3 . Un corollaire du théorème est le suivant : Corollaire 3.26. L’anneau K[X1 , X2 , . . . , Xn ] est isomorphe à l’anneau S .
C’est donc un exemple de sous-anneau strict isomorphe à l’anneau tout entier.
Démonstration. On définit l’isomorphisme par : Φ(P )(X1 , X2 , . . . , Xn ) = P (σ1 , σ2 , . . . , σn ) Par exemple, pour n = 3, Φ(X 2 − 2Y ) = X 2 + Y 2 + Z 2 . Il est immédiat que Φ est un morphisme d’anneau : Φ(P + Q) = Φ(P ) + Φ(Q), Φ(P Q) = Φ(P )Φ(Q) et Φ(1) = 1. De plus, le théorème annonce bien que Φ est surjectif, et que son noyau est réduit à 0. Exercice 3.7. Dans A = K[X, Y ] décrire l’idéal engendré par X et Y et justifier qu’il
n’est pas principal. Exercice 3.8. Montrer que tout polynôme symétrique est de même degré partiel
en chacune des indéterminées. Comment se caractérisent alors les polynômes symétriques élémentaires ? Exercice 3.9. Soit X 3 + 2X 2 − X − 3 un polynôme de C[X]. On note α, β et γ ses
trois racines. Déterminer un polynôme du troisième degré dont les trois racines sont α2 , β 2 et γ 2 . Exercice 3.10. À l’aide des polynômes symétriques élémentaires, écrire le polynôme
P (X1 , X2 , . . . , Xn ) =
Xi2 Xj Xk
i,j,k∈I
la somme portant sur les triplets (i, j, k) distincts.
EXERCICES Exercice 3.11. Petite révision de l’équation de Bezout dans l’anneau (euclidien) des
polynômes. Chercher dans Q[X] des polynômes A et B tels que :
(X 5 + 2)A(X) + (X 2 + X + 1)B(X) = 1
i
i i
i
i
i
i
i
Exercices
73
puis trouver les polynômes V tels que :
V (X) ≡ 3X 3 + 9 (mod X 5 + 2) et
V (X) ≡ 3X + 7 (mod X 2 + X + 1) Chercher un générateur de l’idéal engendré par X 4 − 3X + 1 et X 2 + 2. Exercice 3.12. La méthode de Kronecker Soit P un polynôme de Z[X], de degré
n. On a vu dans un exercice (3.3) qu’il était possible de déterminer toutes les racines rationnelles de P . On va montrer maintenant qu’il est possible, au moins en théorie, de décomposer P en irréductibles de Z[X]. On pose d = n2 où [x] désigne la partie entière du réel x, et on suppose que P est réduit. (1) Soient a0 , . . . , ad des entiers relatifs distincts et b 0 , . . . , bd des entiers relatifs. Montrer qu’il existe un seul polynôme Q de Q[X], de degré inférieur ou égal à d tel que, pour tout i, Q(ai ) = bi . (2) Montrer que si P est réductible, il admet un diviseur D ∈ Z[X] non constant de degré inférieur ou égal à d. (3) Montrer que les listes (D(a 0 ), . . . , D(ad )) forment un sous-ensemble fini de Zd+1 . Conclure.
Exercice 3.13. On dit qu’un polynôme de K[X 1 , . . . , Xn ] est antisymétrique s’il
vérifie :
∀σ ∈ Sn , σ.P = (σ)P où (σ) est la signature de la permutation σ . Vérifier que le polynôme V (X1 , X2 , . . . , Xn ) = (Xj − Xi ) (polynôme de Vandermonde) © Dunod. La photocopie non autorisée est un délit.
1i<jn
est antisymétrique. Montrer que tout polynôme antisymétrique P peut s’écrire :
P (X1 , . . . , Xn ) = V (X1 , . . . , Xn )Q(X1 , . . . , Xn ) où Q est un polynôme symétrique.
Sommes de Newton. Dans l’anneau A = K[X 1 , X2 , . . . , Xn ], où K est un corps commutatif, on appelle sommes de Newton les polynômes S k définis par : n Sk (X1 , X2 , . . . , Xn ) = Xik Exercice 3.14.
i=1
Ce sont bien sûr des polynômes symétriques. (1) Calculer S0 , S1 , S2 et S3 en fonction des polynômes symétriques élémentaires σ i .
i
i i
i
i
i
i
i
3 • Polynômes
74
(2) On suppose que k n. En introduisant le polynôme n (U − Xi ) = U n − σ1 U n−1 + σ2 U n−2 + . . . + (−1)n σn i=1
Montrer que :
0 = Sk − σ1 Sk−1 + σ2 Sk−2 + . . . + (−1)n σn Sk−n (3) Dans le cas où k < n, montrer que :
Sk − σ1 Sk−1 + σ2 Sk−2 + . . . + (−1)k−1 σk−1 S1 + (−1)k kσk = 0 On pourra évaluer les produits σ p Sk−p . (4) Montrer que réciproquement on peut calculer les polynômes symétriques élémentaires (σi ) en fonction des sommes de Newton S i . Faire le calcul pour i = 0 à 4.
Exercice 3.15. Soit M la matrice à coefficients dans K[X 1 , X2 , . . . , Xn ] définie par
M = (Xij−1 )i=1..n,j=1..n (1) Calculer le déterminant de M (déterminant de Vandermonde). (2) Exprimer les coefficients de la matrice t M M en fonction des sommes de Newton. (3) Application : si x1 , x2 et x3 sont les trois racines complexes du polynôme X 3 + pX + q , calculer
∆ = (x2 − x1 )2 (x3 − x1 )2 (x3 − x2 )2 que l’on appelle discriminant du polynôme.
PROBLÈMES Les corrigés de ces problèmes sont disponibles sur le site de Dunod : www.dunod.com.
3.1. POLYNÔMES CYCLOTOMIQUES Soit Un l’ensemble des racines n-ièmes de l’unité dans C, c’est-à-dire l’ensemble des complexes z tels que z n = 1. (1) Montrer que Un est un groupe cyclique. On appelle racine primitive n-ième de l’unité un de ses générateurs. (2) Déterminer les racines primitives de l’unité pour n = 1 à 10. (3) On note Φn (X) le polynôme dont les racines sont exactement les racines primitives n-ièmes de l’unité. Déterminer Φ n pour n = 1 à 10. Ce polynôme Φn est appelé n-ième polynôme cyclotomique. (4) Quel est le degré de Φ n ? Déterminer Φn pour n premier.
i
i i
i
i
i
i
i
Solutions des exercices
75
(5) Montrer que
Xn − 1 =
Φd (X)
d|n
(6) En déduire
Φn (X) =
µ( n ) d Xd − 1 d|n
où µ est la fonction de Möbius, présentée dans le problème du premier chapitre. On rappelle que µ(1) = 1, µ(p1 p2 . . . pk ) = (−1)k si les pi sont des irréductibles distincts, µ(n) = 0 si n n’est pas produit d’irréductibles distincts. (7) Montrer que les polynômes Φ n sont unitaires à coefficients dans Z. On peut démontrer qu’ils sont irréductibles sur Q, pour tout n. Voir le cas où n est premier dans l’application du critère d’Eisenstein page 65.
3.2. POLYNÔMES IRRÉDUCTIBLES SUR LES CORPS FINIS Le but de ce problème est d’étudier les polynômes irréductibles de F p [X] où p est un nombre premier. On prouvera en particulier qu’il existe toujours au moins un polynôme irréductible de degré n, et donc un corps fini de cardinal q = p n . (1) Soit q = pn . On suppose qu’il existe un corps K de cardinal q . Montrer que les éléments de K sont les racines du polynôme X q − X ∈ K[X]. (2) On note N (n, p) le nombre des polynômes unitaires irréductibles de degré n dans Fp [X]. Calculer N (1, p) et N (2, p). (3) Soit P un polynôme irréductible de F p [X], de degré d. Si K = Fp [X]/(P (X)), n montrer que P est un diviseur du polynôme X p − X , pour tout n multiple de d. (4) Réciproquement, montrer que les facteurs irréductibles unitaires de X p − X sont exactement les polynômes unitaires irréductibles de F p [X] dont le degré est un diviseur de n.
© Dunod. La photocopie non autorisée est un délit.
n
(5) Montrer que X p − X n’a pas de facteurs irréductibles multiples. n
(6) En déduire
pn =
dN (d, p)
d|n
puis
N (n, p) =
1 d n p µ n d d|n
(voir la formule d’inversion de Möbius, vue à la fin du problème du chapitre 1). (7) Vérifier cette formule pour n = 1 ou 2, ainsi que pour p = 2, n = 3 et n = 4. (8) Montrer que N (n, p) > 0.
i
i i
i
i
i
i
i
3 • Polynômes
76
SOLUTIONS DES EXERCICES Solution 3.1. Par définition, a est racine simple de P si P (X) = (X − a)Q(X) avec
Q(a) = 0. On a donc P (X) = Q(X) + (X − a)Q (X), donc P (a) = Q(a) d’où la propriété annoncée. Dans le cas des anneaux de polynômes sur un corps, cela se généralise en : a racine multiple d’ordre k
⇐⇒
P (a) = P (a) = . . . = P (k−1) (a) = 0, P (k) (a) = 0
et cela se démontre aisément, avec par exemple l’identité de Taylor pour les polynômes. Mais ce résultat ne subsiste pas en caractéristique non nulle. Par exemple, P (X) = X 2 admet 0 comme racine double, mais en caractéristique deux, toutes ses dérivées successives sont identiquement nulles. En caractéristique non nulle, on peut néanmoins trouver une relation entre racines multiples et dérivées successives ; il suffit, tout simplement, de changer la définition d’un polynôme dérivé. On pourra par exemple consulter [10]. Solution 3.2. Soit D = P ∧ P . Un diviseur irréductible de D est nécessairement un
diviseur irréductible de P . Choisissons un indice i et écrivons P = P iαi Q où Pi est un irréductible qui ne divise pas Q. Alors P = Piαi −1 (αi Pi Q + Pi Q ), et comme Pi , irréductible, ne divise ni Pi ni Q, Pi ne divise pas αi Pi Q + Pi Q donc Piαi −1 est facteur de D avec l’exposant maximum. Ainsi,
D(X) = P (X) ∧ P (X) =
k
Pi (X)αi −1
i=1
P (X) . Dans le cas de l’application P (X) ∧ P (X) proposée, on trouve avec l’algorithme d’Euclide :
Le polynôme cherché est donc R(X) =
P (X) ∧ P (X) = X 5 − 3X 4 − 7X 3 − 13X 2 − 9X − 5 R(X) = X 5 − 4X 4 − 3X 3 − 9X 2 − 4X − 5 Le polynôme P a donc cinq racines distinctes.
n Solution 3.3. Supposons que le rationnel pq soit racine de P (X) = i=0 ai X i , avec an non nul. On peut supposer que c’est aussi le cas de a 0 , si on a au préalable éliminé la racine nulle. En multipliant par q n , a0 q n + a1 pq n−1 + . . . + an−1 pn−1 q + an pn = 0
i
i i
i
i
i
i
i
Solutions des exercices
77
donc
q(a0 q n−1 + a1 pq n−2 + . . . + an−1 pn−1 ) = −an pn et, comme p et q sont premiers entre eux, le théorème de Gauss permet d’affirmer que q est un diviseur de an . De même, on voit que p est un diviseur de a 0 . Il y a donc un nombre fini d’essais à faire pour rechercher d’éventuelles racines rationnelles. Ainsi, pour le polynôme P (X) = 8X 5 + 78X 3 + 52X 4 + 3X 2 + 70X − 49 on doit tester p = ±1, ±7, ±49 et q = ±1, ±2, ±4, ±8. Avec un peu de patience, on trouve les solutions 12 et − 72 . Donc
P (X) = (2X − 1)(2X + 7)(2X 3 + 7X 2 + 2X + 7) À nouveau − 72 est racine et P (X) = (2X − 1)(2X + 7)2 (X 2 + 1), on a obtenu une factorisation en irréductibles sur Z. De même, pour le polynôme R obtenu dans l’exercice précédent, a0 = −5 et a5 = 1, on trouve une racine rationnelle qui est 5, d’où
R(X) = X 5 − 4X 4 − 3X 3 − 9X 2 − 4X − 5 = (X − 5)(X 4 + X 3 + 2X 2 + X + 1) et, mais là il faut de l’imagination...
X 4 + X 3 + X 2 + X 2 + X + 1 = (X 2 + 1)(X 2 + X + 1) on a factorisé en irréductibles.
© Dunod. La photocopie non autorisée est un délit.
Solution 3.4. Si A est un corps, A[X] est un anneau euclidien donc un anneau prin-
cipal. Supposons A[X] principal (donc intègre), alors A est nécessairement intègre. Si A n’est pas un corps, soit a = 0 un non inversible de A. On va montrer que l’idéal (a, X) = aA[X] + XA[X] n’est pas principal. En effet, si (a, X) = (P ), P serait un diviseur de X et de a. Pour des raisons de degré, ce serait un élément b de A, et on aurait X = bQ(X) Mais alors Q serait du premier degré de la forme cX +d et bc = 1, b serait inversible. L’idéal (a, X) serait l’anneau tout entier, ce qui est absurde car les polynômes constants de (a, X) sont seulement les éléments de aA, qui ne contiennent aucun inversible. La démonstration faite prouve en particulier que (2, X) n’est pas principal dans Z[X] ; concrètement, c’est l’ensemble des polynômes dont le terme constant est pair.
Solution 3.5. Tout polynôme ayant une racine a et un degré strictement supérieur à
1 est factorisable par X − a, avec un facteur non constant, il est donc réductible. Par contraposition, un polynôme irréductible de degré supérieur ou égal à deux n’a pas de racine. Si P est réductible dans K[X], on a P = QR, et deg P = deg Q + deg R. De plus, Q et R ne sont pas des unités, donc sont de degré non nul. Si donc deg P = 2 ou deg P = 3, les seules possibilités sont 2 = 1 + 1 et 3 = 2 + 1, un des facteurs est donc de degré 1 et P à une racine dans K . Par contre, un polynôme de degré 4 peut
i
i i
i
i
i
i
i
3 • Polynômes
78
ne pas avoir de racine et être néanmoins réductible. C’est le cas par exemple sur R du polynôme (X 2 + 1)2 mais aussi, de façon plus cachée : √ √ P (X) = X 4 + 1 = (X 2 + X 2 + 1)(X 2 − X 2 + 1) Sur le corps F2 , les polynômes du premier degré, X et X + 1 1 sont irréductibles. Les polynômes du second degré sont X 2 , X 2 +X , X 2 +1, X 2 +X +1. Les trois premiers sont réductibles car ils ont une ou deux racine(s), par exemple X 2 + 1 = (X + 1)2 . Par contre X 2 + X + 1 n’a pas de racine, il est irréductible. Pour le degré 3, les polynômes sans racine sont X 3 + X 2 + 1, X 3 + X + 1, ils sont irréductibles. Enfin, pour le degré 4, les polynômes sans racines sont
X 4 + X 3 + X 2 + X + 1, X 4 + X 3 + 1, X 4 + X + 1, X 4 + X 2 + 1 Un polynôme du quatrième degré sans racine ne peut être réductible que s’il est produit de deux polynômes irréductibles du second degré. Or,
(X 2 + X + 1)2 = X 4 + X 2 + 1 Il y a donc trois polynômes du quatrième degré irréductibles. Solution 3.6. Un corps à 9 éléments est nécessairement de caractéristique 3. Cher-
chons un polynôme du second degré irréductible sur F 3 [X] : X 2 + 1 convient car il n’a pas de racine. K = F3 [X]/(X 2 + 1) est donc un corps à 9 éléments. Si on note 0, 1 et −1 les éléments de F3 et α la classe de X , les neuf éléments seront
0, 1, −1, α, −α, α + 1, −α + 1, α − 1, −α − 1 les calculs de sommes se font sans difficultés, car K = vect F3 (1, α) ; pour les produits, montrons un exemple α(α + 1) = α2 + α = α − 1 On pourra remarquer que K ∗ , qui a huit éléments, est un groupe cyclique pour le produit. Il est engendré par exemple par 1+α. Ce n’est pas un hasard : voir le théorème 5.16, p. 127. Tout polynôme de (K[X])[Y ] = K[X, Y ] s’écrit sous la forme P0 (X)+P1 (X)Y +P2 (X)Y 2 +. . .+Pn (X)Y n avec P0 (X) = a0 +a1 X+. . .+ak X k . Il est dans l’idéal (X, Y ) si et seulement si a 0 est nul. C’est idéal n’est pas principal... On l’a déjà démontré dans l’exercice 3.4, tout repose sur le fait que X n’est pas inversible dans K[X]. Solution 3.7.
Solution 3.8. Soit P (X1 , X2 , . . . , Xn ). Son degré partiel en X1 est le maximum
des degrés partiels en X1 de chacun de ses monômes. Mais si aX 1α1 X2α2 . . . Xnαn est un monôme de P , il y aura aussi aX 1α2 X2α1 . . . Xnαn , donc le degré partiel en X2 est égal au degré partiel en X 1 . Les polynômes symétriques élémentaires sont ainsi les polynômes symétriques dont le degré partiel en chacune des variables est 1. 1. On note 1 la classe de 1.
i
i i
i
i
i
i
i
Solutions des exercices
79
Solution 3.9. Si P (X) = X 3 + 2X 2 − X − 3 a pour racines α, β et γ , on a
⎧ ⎪ ⎨α + β + γ = −2 αβ + βγ + γα = −1 ⎪ ⎩αβγ = 3
d’où l’on tire
α2 + β 2 + γ 2 = (α + β + γ)2 − 2(αβ + βγ + γα) = 4+2=6 2 2 2 2 2 2 α β + β γ + γ α = (αβ + βγ + γα)2 − 2α2 βγ − 2αβ 2 γ − 2αβγ 2 = (αβ + βγ + γα)2 − 2αβγ(α + β + γ) = 1 − 2 × 3 × (−2) = 13 α2 β 2 γ 2 = (αβγ)2 = 9 et les trois nombres α2 , β 2 et γ 2 sont les racines de Q(X) = X 3 − 6X 2 + 13X − 9 Solution 3.10. L’algorithme décrit dans la démonstration conduit à ôter du polynôme
P le produit σ1 σ3 . Or ce produit se développe en : ⎞ ⎛ σ1 σ3 = Xi ⎝ Xi Xj Xk ⎠ = Xi2 Xj Xk + 4 Xi Xj Xk X i
i,j,k
i,j,k
i,j,k,
Les sommes portent sur des listes d’indices distincts, et il est important de comprendre d’où provient le second terme du résultat ainsi que le coefficient 4 (choisir un parmi quatre...). Et donc Xi2 Xj Xk = σ1 σ3 − 4σ4
© Dunod. La photocopie non autorisée est un délit.
i,j,k∈I
Bien sûr, cette formule se simplifie s’il n’y a que trois indéterminées, en ce cas σ 4 disparaît. Signalons néanmoins que, même avec notre algorithme, les calculs deviennent rapidement fastidieux : il suffit de prendre X i3 au lieu de Xi2 dans notre exemple pour s’en rendre compte. Solution 3.11. On écrit l’algorithme d’Euclide :
X 5 + 2 = (X 2 + X + 1)(X 3 − X 2 + 1) − X + 1 X 2 + X + 1 = (−X + 1)(−X − 2) + 3 Il est alors possible de «remonter» cet algorithme, en écrivant
3 = (−X + 1)(X + 2) + (X 2 + X + 1)
= (X + 2) X 5 + 2 − (X 2 + X + 1) (X 3 − X 2 + 1) + (X 2 + X + 1) = (X + 2)(X 5 + 2) − (X 4 + X 3 − 2X 2 + X + 1)(X 2 + X + 1)
i
i i
i
i
i
i
i
3 • Polynômes
80
d’où une solution
X 4 + X 3 − 2X 2 + X + 1 X +2 , B(X) = − 3 3 Pour la seconde question, cherchons une solution. D’après la question précédente, le polynôme suivant sera solution : A(X) =
V0 (X) = (3X 3 + 9)(X 2 + X + 1)B(X) + (3X + 7)(X 5 + 2)B(X) On trouve
1 V0 (X) = (19 + 8X + 6X 2 − 4X 5 − 3X 3 − 6X 4 + 4X 6 + 3X 7 − 6X 8 − 3X 9 ) 3 On peut réduire modulo (X 5 + 2)(X 2 + X + 1) et on trouve toutes les solutions sous la forme : 1 V (X) = (1 − 4X + 9X 3 − 13X 5 − 2X 6 ) + Q(X)(X 5 + 2)(X 2 + X + 1) 3 où Q est un polynôme quelconque. Quant à la dernière question, ça va plus vite. Les deux polynômes sont premiers entre eux, l’idéal qu’ils engendrent est dont l’anneau tout entier.
Solution 3.12.
(1) La classique théorie des polynômes de Lagrange permet de résoudre cette question. Si on définit les Li par j=i (X − aj ) Li (X) = j=i (ai − aj ) on obtient un polynôme à coefficients rationnels tel que
Li (aj ) = δi,j où δi,j est le symbole de Kronecker qui vaut 0 en général et 1 lorsque i = j . Notre polynôme solution sera ainsi Q = di=0 bi Li (X). Il est de degré inférieur ou égal à d. (2) Si P est non constant et réductible sur Z[X], il admet une factorisation P = P1 P2 avec deg P1 + deg P2 = deg P . Il est impossible que l’on ait à la fois deg P1 < deg2 P et deg P2 < deg2 P , d’où l’affirmation de l’énoncé. (3) Lorsque les ai sont fixés, les nombres P (a0 ) , . . . , P (ad ) sont en nombre fini. L’ensemble de leurs diviseurs est également fini. Si donc D est un diviseur de P , les valeurs possibles des listes (D(a 0 ), . . . , D(ad )) sont en nombre fini. Mais, si on se donne une telle liste de valeurs, on peut trouver par la méthode de Lagrange un seul polynôme de degré inférieur ou égal à d qui prenne exactement ces valeurs en les ai . Il y a donc un nombre fini de diviseurs D à essayer : le problème de la factorisation d’un polynôme dans Z[X] est donc algorithmiquement résoluble. Au moins en théorie. En pratique, on utilise des algorithmes beaucoup plus performants, basés sur une réduction modulo p. Voir par exemple l’ouvrage [8].
i
i i
i
i
i
i
i
Solutions des exercices
81
Solution 3.13. Si V est le polynôme de Vandermonde, et σ = (i, j) une transposition,
alors
σ.V (X1 , . . . , Xn ) =
(Xσ(k) − Xσ() )
k>
change de signe un nombre impair de fois, et est donc multiplié par la signature de cette transposition. Pour le cas général, il suffit de dire qu’une permutation est composée de transpositions, et que la signature est un morphisme. Supposons maintenant P antisymétrique. Alors
P (X1 , . . . , Xi , . . . , Xj , . . . , Xn ) = −P (X1 , . . . , Xj , . . . , Xi , . . . , Xn ) et donc
P (X1 , . . . , Xi , . . . , Xi , . . . , Xn ) = 0 ce qui prouve que P est divisible par X j − Xi . On écrit alors P = (Xj − Xi )Q, et on répète le même argument pour toutes les autres transpositions, d’où le résultat (on peut être plus formel, et faire une démonstration par récurrence sur le nombre des indéterminées.) Solution 3.14.
(1) On a immédiatement :
S0 = X10 + X20 + . . . + Xn0 = nσ0 S1 = X1 + X2 + . . . + Xn = σ1 S2 = X12 + X22 + . . . + Xn2 = σ12 − 2σ2 S3 = X13 + X23 + . . . + Xn3 = σ13 − 3σ1 σ2 + 3σ3 (2) On commence par substituer X i à U :
0 = Xin − σ1 Xin−1 + σ2 Xin−2 + . . . + (−1)n σn © Dunod. La photocopie non autorisée est un délit.
puis on multiplie par Xik−n :
0 = Xik − σ1 Xik−1 + σ2 Xik−2 + . . . + (−1)n σn Xik−n enfin on somme pour tous les i de 1 à n :
0 = Sk − σ1 Sk−1 + σ2 Sk−2 + . . . (−1)n σn Sk−n (3) Soit k fixé inférieur à n. On a
σ1 Sk−1 = =
Xi
Xik +
Xik−1
Xik−1 Xj
les indices étant distincts. Plus généralement, Si p est un entier inférieur à k − 2, σp Sk−p = Xi1 . . . Xik Xik−p k−p k−p+1 Xi2 . . . Xik + Xi1 Xi2 . . . Xik+1 = Xi1
i
i i
i
i
i
i
i
3 • Polynômes
82
mais il y a un cas particulier si la somme de Newton est S 1 : σk−1 S1 = Xi1 . . . Xik−1 Xi Xi1 Xi2 . . . Xik = Xi21 Xi2 . . . Xik−1 + k = Xi21 Xi2 . . . Xik−1 + kσk La formule de Newton demandée s’obtient alors en sommant, on trouve
Sk − σ1 Sk−1 + σ2 Sk−2 + . . . (−1)k σk = 0 il y a «télescopage». (4) La forme même des formules de Newton montre que l’on peut calculer les polynômes symétriques élémentaires en fonction des polynômes de Newton. Ainsi
σ1 = S 1 1 2 S1 − S2 σ2 = 2 1 2S3 + S13 − 3S1 S2 σ3 = 6 Solution 3.15. On peut considérer qu’on se place sur le corps des fractions rationnelles en les n indéterminées.
(1) En développant par rapport à la dernière ligne, on voit que le déterminant de M est un polynôme V (X1 , . . . , Xn ) de degré n − 1 en Xn , les coefficients étant dans Z[X1 , X2 , . . . , Xn ]. De plus, le coefficient de Xnn−1 est V (X1 , X2 , . . . , Xn−1 ). Enfin, on a V (X1 , . . . , Xi , . . . , Xi ) = 0 pour tout i < n par les propriétés des determinants (deux lignes identiques). On a donc :
V (X1 , X2 , . . . , Xn ) = V (X1 , X2 , . . . , Xn−1 )
n−1
(Xn − Xi )
i=1
et une récurrence donne alors :
V (X1 , X2 , . . . , Xn ) =
(Xj − Xi )
1i<jn
(2) Soit P la matrice t M M . SI on appelle pi,j son coefficient général :
pi,j =
n
Xki−1 Xkj−1 = Si+j−2
k=1
les coefficients de la matrice sont donc des sommes de Newton. (3) Dans le cas où n = 3, on a donc
3 S1 S2 det t M M = V (X1 , X2 , X3 )2 = (X2 −X1 )2 (X3 −X1 )2 (X3 −X1 )2 = S1 S2 S3 S2 S3 S4
i
i i
i
i
i
i
i
Solutions des exercices
83
Si on applique cette relations aux racines du polynôme X 3 +pX +q , on commence par observer que
S 1 = σ1 = 0 S2 = (σ1 ) − 2σ2 = −2p S3 = −pS1 − 3q = −3q S4 = −pS2 − 3qS1 = 2p2 2
et donc
3 0 −2p 2 2 2 −2p −3q = −4p3 − 27q 2 ∆ = (x2 − x1 ) (x3 − x1 ) (x3 − x1 ) = 0 −2p −3q 2p2
© Dunod. La photocopie non autorisée est un délit.
c’est ce qu’on appelle le discriminant de l’équation. Il est nul si et seulement si il y a une racine multiple, mais il a d’autres propriétés intéressantes...
i
i i
i
i
i
i
i
i
i i
i
i
i
i
i
Chapitre 4
Algèbre linéaire
© Dunod. La photocopie non autorisée est un délit.
Dans ce chapitre, on va donner une réponse « définitive » à la question : quand deux matrices sont-elles semblables ? Dans le cas du corps des nombres complexes, la réponse sera : elles ont même réduite de Jordan. Nous donnerons également quelques indications sur une autre méthode, la réduction de Frobenius. Signalons que notre approche sera souvent « géométrique », en ce sens que nous utiliserons plutôt des propriétés des endomorphismes que des calculs matriciels.
4.1 DIAGONALISATION ET TRIGONALISATION 4.1.1. Polynôme caractéristique et polynôme minimal Commençons par des rappels rapides. Dans tout ce qui suit K est un corps commutatif et E est un K -espace vectoriel de dimension finie, l’ensemble des endomorphismes de E est noté L(E). Il est muni d’une structure de K -algèbre. Si on choisit une base B de E , il y a un isomorphisme
L(E) −→ Mn (K) u −→ MB (u) de l’algèbre L(E) dans l’algèbre des matrices carrées M n (K). Rappelons également qu’un scalaire λ de K est valeur propre de l’endomorphisme u s’il existe un vecteur x non nul tel que u(x) = λx
i
i i
i
i
i
i
i
4 • Algèbre linéaire
86
On dit alors que x est un vecteur propre associé à la valeur propre λ. On notera Spec(u) (lire spectre de u) l’ensemble des valeurs propres de u et E λ désignera Eλ = Ker(u − λ idE ) = {x ∈ E | u(x) = λx} il contient les vecteurs propres associés à la valeur propre λ ainsi que le vecteur nul. Définition 4.1. Soit u ∈ L(E).
• χu (X) = det(u − X idE ) est un polynôme de degré n en X , appelé polynôme caractéristique de u. • L’application définie par
φu : P (X) =
K[X]i −→ L(E) −→ P (u) = i ai ui i ai X
est un morphisme de K -algèbres. Le générateur unitaire de son noyau s’appelle polynôme minimal de u, on le note µ u (X).
Remarques • Commençons par observer que pour définir le polynôme caractéristique, on utilise une matrice contenant l’indéterminée X . On peut convenir qu’on travaille dans Mn (K(X)) où K(X) est le corps des fractions rationnelles à coefficients dans K . • Un point important également : en dimension finie le polynôme minimal n’est pas nul. Il suffit d’appliquer le théorème d’isomorphisme : l’image de φu , que l’on note K[u] est incluse dans L(E) donc est de dimension finie. Elle est isomorphe au quotient K[X]/(µ u (X)), donc l’idéal engendré par µu n’est pas nul. Cet idéal est formé des polynômes P pour lesquels P (u) = 0, on les appelle polynômes annulateurs. En dimension infinie, un endomorphisme peut avoir un polynôme minimal nul. • K[u] est donc une sous-algèbre commutative de L(E). Comme elle est isomorphe à K[X]/(µu (X)), c’est un espace vectoriel de dimension deg µ u . Les premières propriétés de ces polynômes sont réunies dans ce théorème : Théorème 4.2.
• Les racines du polynôme caractéristique sont les valeurs propres de u, elles forment le spectre de u. • Toute valeur propre est racine d’un polynôme annulateur. • χu est un multiple de µu (c’est le théorème de Cayley-Hamilton). • χu et µu ont les mêmes facteurs irréductibles.
i
i i
i
i
i
i
i
4.1 Diagonalisation et trigonalisation
87
Démonstration. • On utilise les équivalences : (∃x = 0, u(x) = λx) ⇐⇒ Ker(u − λid) = 0 ⇐⇒ det(u − λid) = 0 qui prouvent que les valeurs propres sont les racines du polynôme caractéristique. • Par ailleurs, si u(x) = λx, alors pour tout k de N, uk (x) = λk x par une récurrence immédiate. On en déduit par linéarité que P (u)(x) = P (λ)x, et toute valeur propre est forcément racine d’un polynôme annulateur. • Il faut démontrer que χu est dans l’idéal engendré par le polynôme minimal, autrement dit que c’est un polynôme annulateur. Fixons un vecteur non nul x, on va montrer que χu (u)(x) = 0. Ce sera vrai pour tout x, et donc le résultat sera démontré. On est en dimension n, la famille (x, u(x), . . . , u n (x)) est liée. Soit k le plus grand des indices i tels que (x, u(x), . . . , u i (x)) soit libre, on a 0 k < n. Soit alors F le sous-espace engendré par (x, u(x), . . . , u k (x)), (il est de dimension k + 1) et soit G un supplémentaire de F . On complète (x, u(x), . . . , u k (x)) par une base de G, et dans cette base, la matrice de u est du type : C B 0 A où C est une matrice carrée de taille (k + 1) × (k + 1), B une matrice rectangle, A une matrice carrée de taille (n − k − 1) × (n − k − 1), 0 représente une matrice bloc nulle. De plus, la matrice C a la forme ⎛ ⎞ 0 ... 0 α0 .. .. ⎟ ⎜ ⎜1 0 . . . . . ⎟ ⎜ ⎟ 0 ⎜0 1 ⎟ ⎜. ⎟ . . ⎜ .. ⎟ .. .. ⎜ ⎟ ⎜. ⎟ ⎝ .. 1 0 α ⎠ k−1
© Dunod. La photocopie non autorisée est un délit.
0
0
...
0
1
αk
puisque u(ui (x)) = ui+1 (x) pour i < k et que uk+1 (x) est de la forme k αi ui (x). On a donc : i=0
χu (X) = det(C − XI) det(A − XI) Le premier déterminant se calcule par récurrence ou, plus directement, en développant par rapport à la dernière colonne et : χu (X) = (−1)k+1 X k+1 − αi X i det(A − XI) = G(X)F (X)
où G(X) = (−1)k+1 X k+1 − αi X i et F (X) = det(A − XI) mais alors
χu (u) = G(u) ◦ F (u) = F (u) ◦ G(u)
et
χu (u)(x) = F (u)(G(u)(x))
i
i i
i
i
i
i
i
4 • Algèbre linéaire
88
et
G(u)(x) = (−1)k+1 uk+1 (x) − αi ui (x) = 0
On a bien χu (u)(x) = 0. Comme le même calcul peut être fait pour tout vecteur x, le théorème de Cayley-Hamilton est démontré. • Commençons par l’observation suivante : si u est un endomorphisme de E , on peut le représenter par sa matrice M dans une base de E . Le polynôme caractéristique de u est det(M − λI). Si on considère un corps L contenant K , ce polynôme ne change pas lorsqu’on considère la matrice M comme élément de M n (L). Par ailleurs, le polynôme minimal de u peut être vu comme le polynôme unitaire de plus bas degré tel que µ u (M ) = 0. Il n’est pas alors évident que ce polynôme ne change pas si on considère la matrice M comme élément de M n (L). Appelons Q le polynôme unitaire de plus bas degré de L[X] tel que Q(M ) = 0. Alors Q divise µu , car Q est le générateur de l’idéal des polynômes annulateurs de L[X]. Mais le degré de Q est aussi le rang du système I, M, . . . , M n−1 , dans l’espace vectoriel Mn (L), le degré de µu est le rang de ce même système dans M n (K). Si on utilise la base canonique, ce rang se calcule comme taille maximal d’un déterminant extrait non nul, et ce calcul est le même que les coefficients soient vus comme éléments de K ou comme éléments de L. On en déduit que le polynôme minimal ne change pas si on « agrandit » le corps de base. La démonstration du théorème suit : on se place dans le cas d’un corps algébriquement clos ; µu et χu sont scindés, et µu divise χu . L’ensembles des racines de µu est inclus dans l’ensemble des valeurs propres, mais comme toute valeur propre doit être racine du polynôme annulateur µ u , ces deux ensembles coïncident, on peut écrire :
µu (X) =
k
(X − λi )
i=1
βi
k et χu (X) = (−1) (X − λi )αi n
i=1
où 1 βi αi pout tout i. Les deux polynômes ont mêmes facteurs irréductibles. Dans le cas général, on peut montrer que de même les deux polynômes ont mêmes facteurs irréductibles.
Remarque : Une matrice de la forme de C s’appelle matrice compagnon, i elle « accompagne » le polynôme P (X) = X k − k−1 i=0 αi X . On la notera C(P ). 4.1.2. Diagonalisation Si λi est une valeur propre de u, on a noté E λi = Ker(u − λi id) le sous-espace propre correspondant. On va montrer que les sous-espaces propres sont en somme directe, et on rappelle que u est dit diagonalisable lorsque cette somme directe est égale à E .
i
i i
i
i
i
i
i
4.1 Diagonalisation et trigonalisation
89
Donnons une généralisation de cette définition. Définition 4.3. Soit u un endomorphisme de E et k 2. S’il existe k sousespaces Ei non nuls stables par u et tels que :
E = E1 ⊕ E2 ⊕ . . . ⊕ Ek on dit que u est diagonalisable par blocs. Si on note u i la restriction de u à Ei , on écrira : u = u1 ⊕ u2 ⊕ . . . ⊕ uk Ce vocabulaire se justifie facilement ; si B i est une base de Ei , alors la succession des Bi est une base B de E , et la matrice de u dans cette base est diagonale par blocs, de la forme ⎛ ⎞ M1 M2 ⎜ ⎟ ⎟ = diag(M1 , M2 , . . . , Mk ) MB (u) = ⎜ .. ⎝ ⎠ .
Mk Le reste de la matrice est constitué de blocs nuls. Revenons au cas ordinaire : un endomorphisme u est donc diagonalisable s’il est somme directe d’homothéties. Proposition 4.4. Soient λ1 , λ2 , . . . , λk des valeurs propres distinctes d’un endomorphisme u, alors les sous-espaces propres sont en somme directe : k
Eλi =
i=1
k !
Eλi
i=1
© Dunod. La photocopie non autorisée est un délit.
On dit parfois que ces sous-espaces propres sont indépendants. Rappelons que, par définition cela signifie que dans la somme, la décomposition d’un vecteur en somme de vecteurs propres est unique. Un critère pour cela est que, pour tout i : Eλi Eλj = {0} j=i
Démonstration. Procédons par récurrence sur k. Si k = 2, soit x ∈ E λ1 ∩ Eλ2 . Alors u(x) = λ1 x = λ2 x et donc x = 0. Supposons la propriété vraie pourk − 1 valeurs propres distinctes et prenons x ∈ Eλi ∩ j=i Eλj . Alors si x = j=i xj , en appliquant u on trouve : u(x) = λi x = λi xj mais aussi u(x) = u(xj ) = λj xj j=i
Par soustraction,
j=i
j=i
(λi − λj )xj = 0 j=i
Par hypothèse de récurrence et définition de la somme directe, tous les x j sont nuls, et x aussi.
i
i i
i
i
i
i
i
4 • Algèbre linéaire
90
Nous savons que les valeurs propres sont les racines du polynôme caractéristique ; on va préciser ce qu’on peut dire a priori de la dimension des sous-espaces propres et énoncer un premier critère de diagonalisabilité. Théorème 4.5. Soit u ∈ L(E) et χu son polynôme caractéristique. Alors :
(i)
λ est racine de χu de multiplicité mλ ⇒ dim(Eλ ) mλ
(ii)
u diagonalisable ⇐⇒ (χu scindé sur K et mλ = dim(Eλ ) pour tout λ ∈ Spec(u)) On rappelle qu’un polynôme est scindé s’il est factorisable en polynômes du premier degré (distincts ou non), et chaque racine a alors une multiplicité.
Démonstration. (i) Supposons que la dimension de E λ est k ; on peut alors considérer une de ses bases e1 , e2 , . . . , ek et la compléter en une base B de E . La matrice de u dans cette base s’écrit alors : λIk A1 0 A2 où Ik est la matrice de l’identité de vect(e 1 , . . . , ek ) et A1 , A2 des matrices. Le polynôme caractéristique de u s’écrit : χ u (X) = (λ − X)k χA2 (X), ce qui prouve que k mλ . (ii) Pour l’implication ⇒, il suffit d’écrire la matrice de u dans une base de diagonalisation : le nombre d’occurrences de chaque valeur propre est à la fois la dimension du sous-espace propre associé et la multiplicité de la valeur propre dans le polynôme caractéristique. Pour l’autre implication, on sait que Eλ =
"
λ∈Spec(u)
!
Eλ
λ∈Spec(u)
donc la dimension de λ∈Spec(u) Eλ est la somme des mλ . À cause de l’hypothèse sur le polynôme caractéristique cette somme est égale à n, dimension de E . On a montré que E est somme directe de sous-espaces propres.
Corollaire 4.6. Si χu est un polynôme ayant n racines distinctes, où n est la dimension de E , alors u est diagonalisable.
Démonstration. La dimension d’un sous-espace propre est inférieure ou égale à 1, donc est égale à 1 car elle est strictement positive. Il y a n sous-espaces propres indépendants et de dimension 1, leur somme directe est donc E tout entier.
i
i i
i
i
i
i
i
4.1 Diagonalisation et trigonalisation
91
Ce cas est « très » fréquent, dans le cas d’un corps algébriquement clos comme C. On peut en effet vérifier que l’ensemble des matrices ayant n valeurs propres distinctes est dense dans l’ensemble des matrices.
Remarque : Sur R, le polynôme caractéristique peut ne pas être scindé (cf. 0 −1 ) et l’endomorphisme ne sera pas diagonalisable, mais il existe des 1 0 endomorphismes dont le polynôme caractéristiqueest scindé et qui ne sont a 1 pas diagonalisables ; l’exemple le plus simple est : il y a une valeur 0 a propre a de multiplicité 2 mais le sous-espace propre associé est de dimension 1.
© Dunod. La photocopie non autorisée est un délit.
Un premier résultat non immédiat est que la propriété de diagonalisabilité passe aux restrictions. Théorème 4.7. Soit u ∈ L(E) diagonalisable et F un sous-espace vectoriel stable par u. Alors la restriction de u à F est diagonalisable. " Démonstration. On va montrer que F = ki=1 (Eλi ∩ F ) où les λi sont les valeurs propres. On peut d’abord remarquer que la somme est bien directe, avec le critère rappelé ci-dessus, et cette somme est incluse dans F . Prenons x ∈ F , décomposons-le " dans la somme directe E = ki=1 Eλi et appliquons k − 1 fois l’endomorphisme u. On obtient x = x1 + x2 + · · · + xk u(x) = λ1 x1 + λ2 x2 + · · · + λk xk u2 (x) = λ21 x1 + λ22 x2 + · · · + λ2k xk ... k−1 k−1 uk−1 (x) = λk−1 1 x1 + λ2 x2 + · · · + λk xk Ce système a un déterminant non nul (déterminant de Vandermonde), on peut donc le résoudre et exprimer chacun des x i comme combinaison linéaire de u i (x). Comme x est dans F et que F est u-stable, les x i sont dans F : on a démontré l’autre inclusion, u restreint à F est diagonalisable. Attention, certains des ces sous-espaces peuvent être réduits au nul, cela n’a pas d’importance dans la démonstration.
Encore un théorème sur les sous-espaces propres. Théorème 4.8. Soient deux éléments u et v de L(E) qui commutent. Alors tout sous-
espace propre de u est v -stable.
Démonstration. Soit Eλ un sous-espace propre de u, et x un vecteur de E λ : u(v(x)) = v(u(x)) = v(λx) = λv(x) et cette égalité prouve que v(x) est soit nul, soit vecteur propre pour u (avec la même valeur propre), il est donc dans le sous-espace E λ .
i
i i
i
i
i
i
i
4 • Algèbre linéaire
92
On peut se demander si un sous-espace u-stable quelconque est aussi toujours v -stable (quand u et v commutent) : prendre u = id E pour un contre-exemple.
4.1.3. Trigonalisation Définition 4.9. Soit u un endomorphisme de E , espace vectoriel de dimension
n et k un entier tel que 2 k n. On dit que u est trigonalisable par blocs s’il existe une suite {0} F1 F2 . . . Fk = E
formée de sous-espaces vectoriels stables par u. Si k = n, on dit que cette suite est un drapeau de E et que u est trigonalisable. Expliquons d’abord le dernier cas : si la suite contient n espaces vectoriels, c’est que chaque Fi est de dimension i, puisque la suite des dimensions est une suite strictement croissante d’entiers. On peut construire une base B = (e i )1in telle que, pour tout i, Fi = vect(e1 , . . . , ei ) ; si M est la matrice de u dans la base B , elle est triangulaire supérieure, puisque u(ei ) ∈ vect(e1 , . . . , ei ). Dans le cas général, si on construit une base B telle que vect(e1 , . . . , eki ) = Fi alors la matrice de u dans cette base sera de la forme ⎛ ⎞ ∗ ∗ M1 ∗ ⎜ 0 M2 ∗ ⎟ ⎜ . ⎟ .. .. ⎝ .. ⎠ . .
0
...
0
Mk
où les Mi sont des matrices carrées les ∗ représentent des matrices quelconques. Le résultat important est le suivant. Théorème 4.10. Soit E un K -espace vectoriel de dimension finie. Un endomorphisme
u de E est trigonalisable si et seulement si le polynôme caractéristique est scindé.
Démonstration. • Supposons u trigonalisable. Alors sa matrice dans une base B de trigonalisation est triangulaire supérieure et le polynôme caractéristique qui s’écrit : ⎞ ⎛ λ1 − X ∗ ∗ ∗ n λ2 − X ∗ ⎟ ⎜ 0 ⎟= χu (X) = det ⎜ (λi − X) . ⎠ ⎝ .. 0
...
0 λn − X
i=1
est scindé.
i
i i
i
i
i
i
i
4.1 Diagonalisation et trigonalisation
93
• L’hypothèse est que le polynôme caractéristique est scindé. On procède par récurrence sur n. Si la dimension est 1, la matrice est triangulaire supérieure ( !). Supposons que la propriété du théorème soit vraie en dimension n − 1 et soit λ une racine du polynôme caractéristique ; il lui correspond un vecteur propre e 1 . Si on complète e1 en une base B = (e1 , e2 , . . . , en ) de E , la matrice de u est de la forme : λ U 0 M et χu (X) = (λ − X)χM (t) prouve que M a un polynôme caractéristique scindé. En utilisant (hypothèse de récurrence) une base de trigonalisation pour M , dans vect(e2 , . . . , en ) on obtient une trigonalisation de la matrice de f . On peut être plus précis, en écrivant que : 1 0 λ LP λ L 1 0 = 0 M 0 P 0 P −1 0 P −1 M P
Exercice 4.1. Déterminer les endomorphismes u qui commutent avec tous les autres, c’est ce qu’on appelle le centre de l’algèbre L(E). Exercice 4.2. Soit A = (aij ) une matrice de Mn (C). Montrer que l’on a n
Spec(A) ⊂
B(aii ,
i=1
| aij |)
j=i
En déduire que si, pour tout i de 1 à n on a : |aii | > |aij | © Dunod. La photocopie non autorisée est un délit.
j=i
alors la matrice A est inversible. C’est le théorème de Hadamard.
Exercice 4.3. Soient u et v deux endomorphismes de E , espace vectoriel de dimension
finie. Démontrer que χu◦v = χv◦u . On pourra commencer par le cas où l’un des deux est inversible, et utiliser les matrices A et B de u et v dans une base. Montrer par un contre-exemple qu’on n’a pas, en général, µ u◦v = µv◦u . Exercice 4.4. Soit u un endomorphisme et E = E 1 ⊕ E2 une décomposition de E en
sous-espaces supplémentaires qui sont u-stables. On note u 1 et u2 les restrictions de u à E1 et E2 . Montrer que :
χu (X) = χu1 (X)χu2 (X)
et
µu (X) = p.p.c.m.(µu1 (X), µu2 (X))
i
i i
i
i
i
i
i
4 • Algèbre linéaire
94
Exercice 4.5. Montrer que si u et v sont deux endomorphismes de E qui commutent et sont diagonalisables, alors ils sont simultanément diagonalisables : c’est-à-dire qu’il existe une base commune de diagonalisation. Même question avec trigonalisable à la place de diagonalisable.
4.2 DÉCOMPOSITION DE DUNFORD ET RÉDUCTION DE JORDAN 4.2.1. Le lemme des noyaux Dans ce paragraphe, nous allons proposer des « réductions » d’endomorphismes, et donc écrire des endomorphismes sous forme de sommes directes de restrictions à des sous-espaces stables. Commençons par observer le petit résultat suivant : Proposition 4.11. Soit u ∈ L(E) et P ∈ K[X]. Alors Ker P (u) et Im P (u) sont des sous-espaces u-stables.
Démonstration. Si x ∈ Ker P (u), alors P (u) ◦ u(x) = u ◦ P (u)(x) = u(0) = 0 donc u(x) ∈ Ker P (u). De même, si x ∈ Im P (u), il existe y tel que x = P (u)(y) et
u(x) = u ◦ P (u)(y) = P (u) ◦ u(y) ∈ Im P (u) Remarquons qu’il peut exister des sous-espaces u-stables qui ne sont pas de cette forme, prendre par exemple u = id E . Passons maintenant au lemme des noyaux ; c’est une tradition de parler de « lemme », alors que le résultat que nous allons énoncer mériterait certainement d’être promu au rang de théorème... Lemme 4.12. des noyaux. Soit u ∈ L(E) et (Pi )i=1 à k une suite de polynômes de
K[X]. On suppose que les Pi sont premiers entre eux deux à deux. Alors : k k ! Ker Pi (u) = Ker Pi (u) En particulier, si P =
k
i=1 Pi
i=1
i=1
est un polynôme annulateur
E=
k !
Ker Pi (u)
i=1
i
i i
i
i
i
i
i
4.2 Décomposition de Dunford et réduction de Jordan
95
Démonstration. On définit des polynômes Q i par Qi (X) = Pj (X) j=i
et par l’hypothèse, les polynômes Q i sont premiers entre eux dans leur ensemble. Il existe donc des polynômes A i tels que ki=1 Ai Qi = 1, et donc k
Ai (u) ◦ Qi (u) = id
i=1
Si un vecteur est dans l’ensemble ki=1 Ker Pi (u), on a directement, en calculant son k k image par i=1 Pi (u) qu’il est dans Ker i=1 Pi (u). Réciproquement, soit x un k vecteur de Ker i=1 Pi (u). D’après la relation précédente, on peut écrire x=
k
Ai (u) ◦ Qi (u)(x) =
i=1
k
xi
où
xi = Ai (u) ◦ Qi (u)(x)
i=1
Mais alors, pour un entier j fixé quelconque,
Pj (u)(xj ) = Pj (u) ◦ Aj (u) ◦ Qj (u)(x) = Aj (u) ◦
k
Pi (u)(x) = 0
i=1
k et donc xj ∈ Ker Pj (u). On a donc montré que Ker i=1 Pi (u) est égal à k i=1 Ker Pi (u), il reste à montrer que cette somme est directe. Soit en effet une égalité x 1 + · · · + xk = 0 où les xi sont respectivement dans Ker Pi (u). D’après la relation de Bézout, x1 =
k
Ai (u) ◦ Qi (u)(x1 )
© Dunod. La photocopie non autorisée est un délit.
i=1
= A1 (u) ◦ Q1 (u)(x1 ) = A1 (u) ◦ Q1 (u) −
k
xi
i=2
= −
k
A1 (u) ◦ Q1 (u)(xi )
i2
= 0 car Q1 (u)(xi ) = 0 pour tous les i supérieurs ou égal à 2. Ce calcul peut se faire pour tous les autres indices, on a démontré que la somme est directe. Donnons maintenant un nouveau critère de diagonalisabilité, qui utilise les polynômes annulateurs. Ce critère se révèle être redoutablement efficace.
i
i i
i
i
i
i
i
4 • Algèbre linéaire
96
Théorème 4.13.
• u est diagonalisable si et seulement si il existe P ∈ K[X] annulateur pour u et scindé à racines simples. • u est diagonalisable si et seulement si µ u est scindé à racines simples. Dans cet énoncé, toutes les racines doivent être simples, on dira, pour aller plus vite, que le polynôme est scindé simple. C’est le cas par exemple des deux polynômes X 2 − 1, X 2 − X , qui annulent respectivement les symétries et les projections. Toute symétrie, toute projection est donc diagonalisable.
Démonstration. [du théorème] Commençons par la première équivalence : ⇒ Si λ1 , . . . , λk sont les valeurs propres distinctes l’hypothèse u diagonalisable donne " E = ki=1 Eλi et si on pose P (X) = ki=1 (X − λi ), alors P (u)(x) = 0 car en décomposant x dans la somme directe, toutes ses composantes sont annulées par P (u). On a donc un polynôme annulateur, qui par construction est scindé simple. ⇐ Si P (X) = ki=1 (X − λi ) où les λi sont deux à deux distincts, est un polynôme " annulateur pour u, alors Ker P (u) = E = ki=1 Ker(u − λid) par application du lemme des noyaux. Passons à la seconde équivalence :
⇒ Si u est diagonalisable, il existe un polynôme scindé simple annulant u, ce polynôme est dans l’idéal engendré par le polynôme minimal, qui est donc scindé simple. ⇐ Si le polynôme minimal est scindé simple, c’est un polynôme annulateur de u, qui est donc diagonalisable.
Remarque : On peut maintenant faire une nouvelle démonstration du théorème 4.7 p. 91 : si u est diagonalisable et si µ u est son polynôme minimal, alors toute restriction de u a pour polynôme minimal un diviseur de µ u , qui est donc également scindé simple, toute restriction de u est diagonalisable. 4.2.2. Sous-espaces caractéristiques Revenons au polynôme caractéristique, notamment dans le cas où il est scindé mais non forcément scindé simple. Théorème 4.14. Soit u ∈ L(E), E étant de dimension finie. Supposons que χ u (X)
soit scindé, de la forme :
χu (X) =
k
(X − λi )αi
i=1
où les λi sont deux à deux distincts ;
i
i i
i
i
i
i
i
4.2 Décomposition de Dunford et réduction de Jordan
97
alors : " • E = ki=1 Ker(u − λi id)αi • Les Ker(u − λi id)αi sont u-stables, de dimension α i , et si on note ui la restriction de u à ces sous-espaces, on a :
χui (X) = (−1)αi (X − λi )αi Les sous-espaces Ker(u− λi id)αi s’appellent les sous-espaces caractéristiques de u. À titre d’abréviation, on n’hésitera pas à parler de s.e.c.
Démonstration. • Par le théorème de Cayley-Hamilton, le polynôme caractéristique de u est annulateur. En appliquant le lemme des noyaux, et compte-tenu de ce que les (X − λ i )αi sont premiers entre eux deux à deux, on obtient le résultat souhaité. • La stabilité est immédiate, car un s.e.c. est de la forme Ker P (u). On peut ensuite écrire la matrice de u sous forme diagonale par blocs, et on a alors χ u = ki=1 χui . Pour montrer la fin du théorème, on peut se placer dans le cadre suivant : si χu = P1 P2 où P1 ∧ P2 = 1, en notant ui la restriction de u à Ker Pi (u), on va montrer que χui = Pi (à un scalaire multiplicatif près), et une récurrence immédiate donnera alors le résultat. On a donc E = Ker P1 (u) ⊕ Ker P2 (u), décomposition en sous-espaces u-stables, donc χu (X) = P1 (X)P2 (X) = χu1 (X)χu2 (X) en utilisant une matrice diagonale par blocs. Soit maintenant µ u1 le polynôme minimal de u 1 . Alors P1 (u1 ) = 0 implique µu1 | P1 , et donc µu1 ∧ P2 = 1. Mais alors χu1 ∧ P2 = 1 puisque le polynôme minimal et le polynôme caractéristique ont mêmes facteurs irréductibles. Le lemme de Gauss permet alors d’affirmer que χ u1 | P1 . De même χu2 | P2 . Mais comme P1 P2 = χu1 χu2 , on conclut
χu1 (X) = P1 (X)
et
χu2 (X) = P1 (X)
© Dunod. La photocopie non autorisée est un délit.
(à un scalaire près).
4.2.3. Décomposition de Dunford Il est maintenant possible de donner une théorème important de décomposition, qui offre de nombreuses applications théoriques et pratiques, c’est la décomposition de Dunford. Théorème 4.15. Pour tout u ∈ L(E) dont le polynôme caractéristique est scindé, il existe un unique couple (d, n) d’endomorphismes de E tel que :
u = d + n,
n ◦ d = d ◦ n,
n est nilpotent, d est diagonalisable.
Bien sûr, l’unicité affirmée dans le théorème laisse entendre que si u est diagonalisable, on aura n = 0 et si u est nilpotent on aura d = 0.
i
i i
i
i
i
i
i
4 • Algèbre linéaire
98
Démonstration. (1) Existence k αi où les On écrit le polynôme caractéristique χ u (X) = i=1 (X − λi ) λi sont distincts, et E est donc somme des sous-espaces caractéristiques Ci = Ker(u − λi id)αi . Pour tout i, soit ui la restriction de u à Ci et ni = ui − λi idCi . Soit alors ! d= λi idCi et soit de même n la « somme directe » des n i . Rappelons, pour être plus précis, que d et n sont définis par :
n(x) =
k
ni (xi ),
d(x) =
i=1
k
λi xi
i=1
k où x = i=1 xi est la décomposition de x dans la somme directe des sousespaces caractéristiques. Mais alors d est diagonalisable comme somme directe d’homothéties sur les sous-espaces caractéristiques qui sont supplémentaires. De plus n est nilpotent. En effet, on a n2 (x) =
k
n2i (xi )
i=1
puisque n(x) = i ni (xi ) est l’écriture de n(x) dans la somme directe. On peut calculer de même n et on en déduit que n est nilpotent. Enfin k k n ◦ d(x) = ni (λi xi ) = λi ni (xi ) = d ◦ n(x) i=1
i=1
(2) Unicité Soit u = d + n une autre décomposition, où d commute avec n . Alors d commute avec u = d + n , donc avec (u − λi id)αi et
d (Ci ) = d (Ker(u − λi id)αi ) ⊂ Ci il suffit de l’écrire. Mais comme d est diagonalisable, d est diagonalisable sur le sous-espace Ci qu’il stabilise. Soit alors x un vecteur propre pour d pris dans Ci , et λ la valeur propre associée :
d (x) = λx ⇒ u(x) = (d + n )(x) = λx + n (x) Si on prend l’entier le plus grand tel que n (x) = 0, alors :
u ◦ n (x) = n ◦ u(x) = n ◦ (d + n )(x) = n ◦ d (x) = λn (x) et donc λ est valeur propre de u. Mais comme C i est stable par u et d , il est stable
i
i i
i
i
i
i
i
4.2 Décomposition de Dunford et réduction de Jordan
99
par n , donc le vecteur n (x) est dans Ci = Ker(u − λi )αi et la valeur propre λ est λi (voir le polynôme caractéristique de u restreint à C i ). On en conclut que d = d et donc n = n.
La décomposition de Dunford a de nombreuses applications pratiques : par exemple le calcul de uk = (d + n)k est aisé, puisque • On peut appliquer la formule du binôme de Newton car d et n commutent. • Les puissances de d se calculent facilement dans une base de diagonalisation. • Le puissances de l’endomorphisme nilpotent n sont rapidement nulles... On peut également calculer l’exponentielle de u, et donc, par exemple, résoudre des systèmes différentiels à coefficients constants.
4.2.4. Réduite de Jordan
© Dunod. La photocopie non autorisée est un délit.
Nous allons maintenant utiliser la décomposition de Dunford pour obtenir une nouvelle réduction des endomorphismes dont le polynôme caractéristique est scindé. Théorème 4.16. Soit u ∈ L(E). On suppose que χu est scindé. Il existe des bases de E dans laquelle la matrice de u est diagonale par blocs, les blocs diagonaux étant du type : ⎞ ⎛ λ 1 0 ... 0 .. ⎟ ⎜ ⎜0 λ 1 .⎟ ⎟ ⎜. . . J = (Ji,j )1i,jp = ⎜ . ⎟ .. .. ⎟ ⎜. ⎝ 1⎠ 0 ... λ avec donc Ji,i = λ pour tout i et Ji,i+1 = 1 pour tout i < p, les autres coefficients sont nuls. De plus, il y a unicité d’une telle décomposition, à l’ordre près des blocs. Définition 4.17. Une matrice de la forme donnée dans le théorème est une
réduite élémentaire de Jordan. On la note J(λ, p) où p est le nombre de lignes et de colonnes. Le nombre p = 1 est autorisé. Une matrice diagonale par blocs, dont les blocs sont des réduites élémentaires est appelée réduite de Jordan. Tout repose sur un lemme, qui envisage le cas d’un endomorphisme nilpotent. Lemme 4.18. Soit u un endomorphisme nilpotent d’un espace vectoriel de dimension
n. Si uk = 0 où k ∈ N∗ (u est donc non nul), alors il existe une base de E dans laquelle la matrice de u est diagonale par blocs, les blocs étant de la forme J(0, p), avec p k.
i
i i
i
i
i
i
i
4 • Algèbre linéaire
100
Démonstration. [du lemme] Supposons que k soit l’ordre de nilpotence (c’est-àdire que uk = 0, tandis que uk−1 = 0). Pour commencer, remarquons que les « noyaux itérés » Ker ui sont emboîtés, et forment une suite croissante. Soit alors S k un supplémentaire de Ker u k−1 . Alors : ⎧ k−1 ⎪ ⎨u(Sk ) ⊂ Ker u k−2 u(Sk ) ∩ Ker u = {0} ⎪ ⎩dim S = dim u(S ) = . . . = dim uk−1 (S ) k k k La première inclusion est due à la k-nilpotence de u. Montrons la seconde propriété : Si x ∈ u(Sk ) ∩ Ker uk−2 , alors il existe y ∈ Sk tel que x = u(y). Mais alors
0 = uk−2 (x) = uk−1 (y)
donc
y ∈ Ker uk−1 ∩ Sk = {0}
y donc x est nul. Enfin, u restreinte à S k est bien sûr bijective de S k sur u(Sk ) car Sk ne contient aucun vecteur de Ker(u), et de même pour les autres sous-espaces. On a donc dans Ker uk−1 , deux sous-espaces supplémentaires, et l’on peut compléter par un sous-espace S k−1 (éventuellement nul cette fois) de sorte que : Ker uk−1 = Sk−1 ⊕ u(Sk ) ⊕ Ker uk−2 À l’étape suivante, on vérifie immédiatement que u(S k−1 ), u2 (Sk ) et Ker uk−3 sont dans Ker uk−2 . Il y a donc un sous-espace S k−2 pour compléter. Par récurrence, on construit donc une suite de sous-espaces vectoriels S k−1 , Sk−2 , . . ., S0 tels que : ⎛ ⎞ k−i−1 ! Ker ui+1 = ⎝ uj (Si+j+1 )⎠ ⊕ Ker ui j=0
En définitive, on a :
E Ker uk−1 Ker uk−2 ... Ker u
= Sk ⊕ Ker uk−1 = u(Sk ) ⊕ Sk−1 ⊕ Ker uk−2 = u2 (Sk ) ⊕ u(Sk−1 ) ⊕ Sk−2 ⊕ Ker uk−3 = uk−1 (Sk ) ⊕ uk−2 (Sk−1 ) ⊕ . . . ⊕ u(S2 ) ⊕ S1
D’où la décomposition de E lui même :
E=
j k ! !
ui (Sj )
j=1 i=0
que l’on peut écrire :
E = Sk ⊕ Sk−1 ⊕ · · · ⊕ S2 ⊕ S1 ⊕ u(Sk ) ⊕ u(Sk−1 ) ⊕ · · · ⊕ u(S2 ) ··· ⊕ uk−2 (Sk ) ⊕ uk−2 (Sk−1 ) ⊕ uk−1 (Sk ).
i
i i
i
i
i
i
i
4.2 Décomposition de Dunford et réduction de Jordan
101
Si maintenant on prend un vecteur e n non nul de Sk et ses images successives, en−1 = u(en ), en−2 = u(en1 ), . . . en−k+1 = u(en−k+2 ), alors (en−k+1 , . . . , en ) est libre et la restriction de u à ce sous-espace a pour matrice J(0, k). Si on continue avec (s’il en existe) un vecteur de S k indépendant de en , on obtiendra un autre sous-espace u−stable, avec une matrice J(0, k). De même, des vecteurs indépendants de S k−1 donneront des blocs J(0, k − 1). Remarquons que : la taille maximum d’un bloc de Jordan est k. Dans chaque base correspondant à un bloc, il y a un seul vecteur du noyau de u, et ces bases sont « indépendantes », donc la dimension du noyau est égale au nombre des blocs. En utilisant des bases des S i et de leurs images, on obtient une réduction de Jordan. Et maintenant, démontrons le théorème.
Démonstration. Si on suppose χ u scindé, alors d’après le lemme des noyaux, E peut s’écrire : k E= Ker(u − λi id)αi i=1
et dans chacun de ces sous-espaces, la restriction de u − λ i id est nilpotente. On peut donc « Jordaniser » la matrice de u. On obtiendra des blocs de Jordan de la forme J(λi , p). Voici maintenant un théorème de bilan et d’application de cette réduction de Jordan, que nous énoncerons en terme de matrices. Théorème 4.19.
• Toute matrice de Mn (C) est semblable à une réduite de Jordan.
© Dunod. La photocopie non autorisée est un délit.
• Si A et B deux matrices de Mn (C) sont semblables, alors elles ont même polynôme caractéristique et même polynôme minimal. • Deux matrices A et B de Mn (C) sont semblables si et seulement si elles ont même réduite de Jordan (à permutation des blocs près). • Pour toute matrice A de Mn (C), A et t A sont semblables. Pour commencer, montrons que la réciproque de la deuxième affirmation est fausse. Pour cela, il faut un contre-exemple de dimension suffisante. Prenons U matrice nilpotente d’ordre 3 et construisons deux matrices blocs A et B de la façon suivante : ⎛ ⎞ 0 1 0 U 0 U 0 ⎝ ⎠ U= 0 0 1 A= B= 0 U 0 0 0 0 0 Le polynôme caractéristique de U est X 3 , et c’est aussi le polynôme minimal de U , puisque U 2 = 0. Quant à A et B , ces matrices ont même polynôme caractéristique (X 6 ), et même polynôme minimal (X 3 ), et pourtant elles ne sont pas semblables (car, par exemple, elles n’ont pas le même rang.)
i
i i
i
i
i
i
i
4 • Algèbre linéaire
102
Donnons maintenant la démonstration du théorème :
Démonstration. (1) Tout polynôme à coefficients complexes est scindé. (2) C’est déjà fait pour le polynôme caractéristique. Et on voit facilement que si P annule une matrice A, alors P annule toute matrice semblable à A. (3) En définitive, il s’agit de vérifier une unicité, à permutation des blocs près. Tout repose sur le fait que les blocs sont déterminés par les dimensions des noyaux itérés : leur taille et leur nombre dépendent seulement des propriétés géométriques de l’endomorphisme, non de la matrice qui les représente. (4) Il suffit de montrer que c’est vrai pour un bloc ; facile, il suffit d’inverser les vecteurs de base, avec par exemple la matrice de passage ⎛ ⎞ 0 ... ... 0 1 ⎜ ⎟ ⎜ ⎟ 1 ⎜ ⎟ ⎝ ⎠ 1
0
... ... 0
Exercice 4.6. Soit A une matrice de Mn (K), triangulaire supérieure. On l’écrit sous la forme A = D + T , où D est la matrice diagonale formée des éléments diagonaux de A. Montrer que T est nilpotente, mais que cette écriture n’est pas forcément la décomposition de Dunford de A.
Exercice 4.7. Soit E de dimension 2, 3, 4, 5 ou 6 : combien y a-t-il de classes de
similitude d’endomorphismes nilpotents ?
4.3 RÉDUCTION DE FROBENIUS Cette nouvelle réduction s’applique dans tous les cas, même si le polynôme caractéristique n’est pas scindé. Notre théorie pourra donc s’adapter à n’importe quel corps, pas forcément algébriquement clos.
4.3.1. Sous-espace stable et quotient On est souvent placé devant la situation suivante : F est un sous-espace u-stable de E qui n’admet pas de supplémentaire u-stable. On ne peut donc écrire une diagonalisation par blocs de la matrice de u, mais seulement une trigonalisation par blocs. L’utilisation de sous-espaces vectoriels quotients est adaptée à ce cas.
i
i i
i
i
i
i
i
4.3 Réduction de Frobenius
103
Si E est un K -espace vectoriel et F un sous-espace de E , on peut définir le quotient E/F issu de la relation d’équivalence x ≡ y (mod F ) ⇐⇒ x − y ∈ F . Ce quotient est naturellement muni d’une structure de K -espace vectoriel, si on pose
x+y =x+y
et λx = λx
où x désigne la classe d’équivalence de x. Si u est un endomorphisme et si F est u-stable, on peut dire davantage. Proposition 4.20. Soit u ∈ L(E) et F un sous-espace vectoriel u-stable. Alors il existe un seul endomorphisme u de E/F tel que :
u(x) = u(x) De plus, si B1 = (e1 , . . . , ek ) est une base de F , que l’on complète en une base B = (e1 , . . . , en ) de E , alors B = (ek+1 , . . . , en ) est une base de E/F . Enfin, la matrice de u s’écrit dans la base B sous la forme : A B MB (u) = 0 C où
A = MB1 (u) = A
C = MB (u)
et
Démonstration. Il faut vérifier que si x = y alors u(x) = u(y). C’est le cas puisque F est u-stable et : x − y ∈ F ⇒ u(x) − u(y) = u(x − y) ∈ F La linéarité se montre sans difficulté. Si x est un vecteur quelconque, n n n x= xi ei donc x= xi ei = xi ei
© Dunod. La photocopie non autorisée est un délit.
i=1
i=1
i=k+1
De plus, si cette somme est nulle, le vecteur i>k xi ei est dans F et dans vect(ek+1 , . . . , en ), il est donc nul. Enfin, l’affirmation concernant la matrice A est due à la stabilité de F , l’affirmation concernant C résulte de n n n u(ej ) = mi,j ei donc u(ej ) = mi,j ei = mi,j ei i=1
i=1
i=k+1
4.3.2. Sous-espaces cycliques Soit u un endomorphisme de E , K -espace vectoriel de dimension finie. On va étudier une décomposition de E en sous-espaces stables par u, différente de celle vue dans le paragraphe précédent, et qui permet cependant de « classer » les endomorphismes. Si a ∈ E est un vecteur quelconque, l’application φ u,a
P (X) =
K[X]i −→ E −→ P (u)(a) = i ai ui (a) i ai X
i
i i
i
i
i
i
i
4 • Algèbre linéaire
104
est linéaire. Le générateur unitaire de son noyau s’appelle polynôme minimal de u en a, on le note µu,a (X). Pour donner un exemple élémentaire, si a est un vecteur propre de u associé à la valeur propre λ, son polynôme minimal est X − λ. Une première propriété s’obtient facilement. Proposition 4.21. Pour tout a ∈ E , µu,a | µu .
Démonstration. En effet, puisque µ u (u) = 0 (endomorphisme nul), on a µu (u)(a) = 0 et le polynôme µu (X) appartient à Ker φu,a . Le résultat suivant est moins banal, et moins facile à obtenir. Théorème 4.22. Pour tout endomorphisme de E , il existe un vecteur a ∈ E tel que
µu = µu,a.
Démonstration. Commençons par supposer que µ u est primaire, c’est-à-dire puissance d’un irréductible P i : µu (X) = Pik (X). Alors, si on prend a dans E \ Ker Pik−1 (u) (qui est non vide, par définition du polynôme minimal), le théorème est satisfait. En effet, µu,a (X) est un diviseur du polynôme minimal P ik (X) et c’est donc une puissance de Pi puisque Pi est irréductible. Par ailleurs, par définition de a, Pik−1 (u)(a) = 0, et donc µu,a = Pik . Si maintenant le polynôme minimal s’écrit µu (X) =
k
Piki (X)
i=1
où les Pi sont irréductibles, on peut choisir a i dans Ker Piki (u) \ Ker Piki −1 (u), et a = a1 + . . . + ak vérifiera µu,a = µa . Soit toujours u un endomorphisme. Si a est un vecteur de E , on appellera sousespace cyclique engendré par a, le sous-espace vectoriel vect(a, u(a), . . . , u k (a), . . .). Ce sous-espace sera noté a s’il n’y a pas risque de confusion. Si µ u,a est le polynôme minimal de u en a, il permet d’obtenir la plus courte relation de liaison entre les u k (a). Le degré de ce polynôme minimal est donc la dimension de a, dont une base est (a, u(a), . . . , uk−1 (a)) où k est le degré de µu,a . De plus Proposition 4.23.
• Tout sous-espace cyclique a est u-stable. Si u a est la restriction de u à a, alors µua = µu,a et χua = ±µu,a . • Si F est un sous-espace u-stable tel que µ u|F = ±χu|F , alors F est cyclique. • F est cyclique si et seulement si il existe une base C de F telle que la matrice de u|F dans cette base soit une matrice compagnon.
i
i i
i
i
i
i
i
4.3 Réduction de Frobenius
105
Démonstration. • Si x est un vecteur de a, il est de la forme P (u)(a) où P est un polynôme. Alors, en posant R(X) = XP (X), on a u(x) = u ◦ P (u)(a) = R(u)(a) et u(x) est aussi dans a qui est ainsi stable par u. Si Q est un polynôme tel que Q(u a ) = 0, il vérifie Q(u) ◦ P (u)(a) = 0 pour tout polynôme P , donc Q est un multiple de µu,a , et réciproquement. De plus, la dimension de a est le degré de µ u,a , donc le polynôme caractéristique χ ua , qui est de même degré et qui est dans l’idéal (µ ua ), est proportionnel à µua . • Si F est un sous-espace u-stable et si µ u|F est le polynôme minimal de u |F , il existe a de F tel que son polynôme minimal (dans F ) soit µ u|F . Mais alors le sous-espace engendré par les P (u)(a) a même dimension que le degré de µ u|F = χu|F , donc même dimension que F , c’est F . • Si F = a, F de dimension k, alors une base de F est (a, u(a), . . . , u k−1 (a)) et i si µu,a (X) = X k − k−1 i=1 αi X alors la matrice de u |F est de la forme : ⎛ ⎞ 0 ... 0 α0 .. .. ⎟ ⎜ . . ⎟ ⎜1 0 . . . ⎜ ⎟ 0 C(P ) = ⎜0 1 ⎟ ⎜. ⎟ ⎝ .. ⎠ 0 0 ... 1 αk qui est bien la matrice compagnon (voir la remarque page 88) de µ u,a(X). Enfin, la forme même d’une matrice compagnon montre que l’espace engendré par C = (e1 , e2 , . . . , ek ) est de la forme vect(e1 , u(e1 ), . . . , u(ek−1 )), donc est cyclique.
© Dunod. La photocopie non autorisée est un délit.
On dit alors que l’endomorphisme u est cyclique s’il existe un vecteur a tel que a = E . D’après la proposition précédente, E est cyclique pour u si et seulement si le polynôme minimal de u est égal (au signe près) au polynôme caractéristique de u. On sait que u est cyclique si et seulement si sa matrice est de la forme compagnon dans une certaine base. Donnons un autre exemple. Proposition 4.24. Tout endomorphisme dont la matrice dans une base B est un bloc
de Jordan, est cyclique.
Démonstration. Si M ∈ Mk (K) est de la forme ⎞ ⎛ λ 1 0 ... 0 .. ⎟ ⎜ .⎟ ⎜0 λ 1 ⎟ ⎜ .. M = ⎜ .. ⎟ . ⎟ ⎜. ⎝ 1⎠ 0 ... λ alors un calcul facile montre que M − λI est nilpotente d’indice k. Le polynôme minimal de M est de la forme (X − λ) k , de même degré que la dimension, il est égal au polynôme caractéristique.
i
i i
i
i
i
i
i
4 • Algèbre linéaire
106
4.3.3. Décomposition en sous-espaces cycliques Le théorème de décomposition de Jordan permet d’affirmer que tout endomorphisme est somme directe d’endomorphismes cycliques, mais dans le cas d’un polynôme caractéristique scindé. Nous allons donner une autre décomposition en sous-espaces cycliques et préciser des conditions qui permettront d’assurer l’unicité. Théorème 4.25. Soit u ∈ L(E), où E est un K -espace vectoriel de dimension finie. Il existe des sous-espaces cycliques (non nuls) E 1 = a1 , E2 = a2 ,...,Ek = ak tels que, si on note ui la restriction de u à Ei on ait :
E = E1 ⊕ E2 ⊕ . . . ⊕ Ek
et
u = u1 ⊕ . . . ⊕ uk
avec
µuk | µuk−1 | . . . | µu1 = µu et
χu =
k
µui
i=1
Unicité : les polynômes µ ui sont entièrement déterminés par u, on les appelle diviseurs élémentaires de u.
Démonstration. Certaines parties de la démonstration sont délicates. Distinguons les étapes. • On procède par récurrence sur la dimension de E , le résultat étant banal en dimension 1. • Il existe un sous-espace cyclique de dimension maximale. En effet, si µ u est le polynôme minimal, il existe a1 ∈ E tel que µu,a1 = µu , et le sous-espace E1 = a1 est cyclique de dimension maximale, égale au degré de µ u . • Comme E1 est u-stable, il existe un morphisme quotient u de E/E 1 dans luimême : voir la proposition 4.20. Par hypothèse de récurrence, E/E1 = E 2 ⊕ E 3 ⊕ · · · ⊕ E k où les E i sont u-cycliques, de la forme y i , et où les polynômes minimaux des u restreints aux E i vérifient les propriétés du théorème. On va chercher des « bons » représentants des y i . Choisissons un indice i 2, et notons, pour simplifier P le polynôme minimal de y i , qui est aussi le polynôme minimal de u restreinte à E i . Alors : P divise µu . En effet, µu (u) = 0 implique, par définition de u, que µu (u) = 0. Il existe donc un polynôme Q tel que µ u (X) = Q(X)P (X). Soit maintenant xi un représentant quelconque de y i . Alors P (u)(y i ) = 0 implique P (u)(xi ) ∈ E1 , et, par définition de E1 , il existe un polynôme R tel que
P (u)(xi ) = R(u)(a1 ) Mais on a alors
0 = µu (u)(xi ) = Q(u) ◦ P (u)(xi ) = Q(u) ◦ R(u)(a1 )
i
i i
i
i
i
i
i
4.3 Réduction de Frobenius
107
et le polynôme Q(X)R(X), annulateur par u de a 1 est multiple de
µu (X) = Q(X)P (X). On en déduit que R est multiple de P . Si on pose R(X) = P (X)S(X), on aura alors :
P (u)(xi ) = R(u)(a1 ) = P (u) ◦ S(u)(a1 )
d’où
P (u) (xi − S(u)(a1 )) = 0
Posons ai = xi − S(u)(a1 ). Ce vecteur est bien sûr dans la même classe que x i modulo E1 . On a alors µu,ai = P . En effet, nous venons d’écrire que P (u) annule a i , donc µu,ai | P . Ensuite,
µu,ai (u)(ai ) = 0
implique
µu,ai (u)(ai ) = 0
donc µu,ai divise P . Si on pose Ei = ai , pour i 2, on vient de voir que les polynômes minimaux de u restreints à ces sous-espaces ont la propriété du théorème. Reste à montrer qu’ils sont en somme directe, et que cette somme est un supplémentaire de E 1 . Soit donc F la somme ki=2 Ei . Alors, il existe un morphisme de F = ki=2 Ei " dans ki=2 E i = E/E1 défini par la somme des projections : k
© Dunod. La photocopie non autorisée est un délit.
i=2
Si (u)(ai ) →
k
Si (u)(ai )
i=2
où les Si sont des polynômes quelconques. Il est surjectif par définition des a i . C’est un morphisme, et il est injectif car si ki=2 Si (u)(ai ) = 0 alors Si (u)(ai ) = 0, puisque les E i sont en somme directe, donc pour tout i 2, le polynôme minimal de u restreint à E i divise Si . Or ce polynôme minimal est aussi µ u,ai , polynôme minimal de u restreint à Ei . On en déduit que Si (u)(ai ) = 0 pour tout i 2, donc que l’application est bijective. En conclusion, les E i sont en somme directe. Le lecteur aura bien sûr remarqué que les µ ui sont des diviseurs de µ u , puisque ce sont des polynômes minimaux d’éléments de E . • Nous ne prouverons pas l’unicité des polynômes que l’on appelle facteurs invariants de u. Il est clair que celui de plus haut degré, multiple de tous les autres, est bien déterminé puisque c’est le polynôme minimal de u. De même le produit des facteurs invariants de u est bien déterminé puisque c’est le polynôme caractéristique de u, mais cela n’implique pas, en général, l’unicité de la liste des autres facteurs invariants. Terminons en remarquant que les (a i ) eux ne sont pas uniquement déterminés par u : si u = id, les polynômes sont
µ1 (X) = µ2 (X) = . . . = µn (X) = X − 1 et on peut prendre pour (a i ) n’importe quelle base de E .
i
i i
i
i
i
i
i
4 • Algèbre linéaire
108
Les polynômes ainsi définis s’appellent donc les diviseurs élémentaires de u. Si A est une matrice carrée, on peut la considérer comme matrice d’un endomorphisme par exemple d’un endomorphisme de K n dans la base canonique, et on parlera alors des diviseurs élémentaires de la matrice. Une conséquence de ce théorème, mais qui utilise l’unicité que nous n’avons pas prouvée, est donnée par le corollaire suivant : Corollaire 4.26. Deux matrices sont semblables si et seulement si elles ont les mêmes
diviseurs élémentaires.
Démonstration. Il suffit d’observer que notre approche montre que les diviseurs élémentaires d’une matrice sont ceux d’un endomorphisme qu’elle représente. Or deux matrices sont semblables lorsqu’elles représentent le même endomorphisme dans deux bases différentes, si donc elles ont les mêmes diviseurs élémentaires. Remarque : On trouvera une démonstration de l’unicité par exemple dans [15]. On trouvera également dans cet ouvrage, et d’autres, des algorithmes permettant de calculer rapidement les diviseurs élémentaires d’une matrice, par de simples calculs de déterminants et de p.g.c.d de polynômes.
1 0 Exercice 4.8. Soit u de matrice et a un vecteur quelconque. Déterminer les 0 2 sous-espaces a. Donner la décomposition de Frobenius de u. Exercice 4.9. On suppose que u a pour matrice un bloc de Jordan J(λ, n). Trouver,
dans une base de Jordanisation, un vecteur a tel que E = a.
Exercice 4.10. On suppose que u est diagonalisable, de valeurs propres λ 1 , λ2 , . . .,
λk . Quels sont ses diviseurs élémentaires ? Quand u est-il cyclique ? Exercice 4.11. On suppose que u est cyclique. Montrer que l’ensemble des endomor-
phismes v de E qui commutent avec u coïncide avec l’ensemble des polynômes en u. Est-ce une propriété caractéristique des endomorphismes cycliques ?
EXERCICES Exercice 4.12. Sous-espaces stables, dualité. Soit u ∈ L(E), où E est un K espace vectoriel de dimension finie. On note E ∗ le dual de E , et on rappelle que t u est l’endomorphisme de E ∗ défini par : t u(φ) = φ ◦ u.
i
i i
i
i
i
i
i
Exercices
109
(1) Soit B = (e1 , . . . , en ) une base de E , on note B ∗ = (e∗1 , . . . , e∗n ) la base duale. Si M est la matrice de u dans la base B , déterminer la matrice de t u dans la base B ∗ . (2) Lorsque H est un sous-espace vectoriel de E , on note H o son orthogonal défini par : H o = {φ ∈ E ∗ | ∀x ∈ H, φ(x) = 0} On note également, lorsque G est un sous-espace de E ∗ :
Go = {x ∈ E | ∀φ ∈ G, φ(x) = 0} Montrer alors que H oo = H On pourra commencer par démontrer que dim H o = dim E − dim H . (3) Montrer que H est stable par u si et seulement si H o est stable par t u. (4) On suppose que K = C. Montrer qu’un endomorphisme u a des hyperplans stables et donner un moyen pratique de les obtenir. Application : trouver tous les sous-espaces stables de l’endomorphisme u dont la matrice dans une base B s’écrit : ⎛ ⎞ 1 2 −1 M = ⎝2 3 −1⎠ 0 3 0
Exercice 4.13. On suppose que le polynôme caractéristique de u est scindé. Montrer
que si u = d + n est sa décomposition de Dunford, d et n peuvent s’exprimer sous forme de polynômes en u. On utilisera la démonstration du « lemme des noyaux ».
Soit u un endomorphisme de E , de dimension finie, et soit (Ker(u)k )k∈N la suite des noyaux itérés. Montrer qu’elle est d’abord strictement croissante puis stationnaire. Montrer qu’il existe un morphisme injectif naturel de Exercice 4.14.
© Dunod. La photocopie non autorisée est un délit.
Ker(uk+2 )/ Ker(uk+1 )
dans
Ker(uk+1 )/ Ker(uk )
et en déduire que la suite (d i ) où di = dim Ker ui croit « de moins en moins vite » en ce sens que dk+2 − dk+1 dk+1 − dk . Soit maintenant u un endomorphisme nilpotent. On note j k le nombre des blocs de taille k dans sa décomposition de Jordan. Quelle relation y a t-il entre la suite (d i ) et la suite (jk ) ?
Exercice 4.15. Soit u un endomorphisme dont le polynôme caractéristique est scindé.
On considère une valeur propre λ et (Ker(u − λid) k )k∈N . On suppose que la multiplicité de λ dans le polynôme caractéristique χ u est α et que la multiplicité de λ dans le polynôme minimal µ u est β . Montrer que la suite des noyaux itérés est stationnaire à partir de l’indice β , et que la dimension des derniers noyaux itérés est α.
i
i i
i
i
i
i
i
4 • Algèbre linéaire
110
PROBLÈME Le corrigé de ce problème est disponible sur le site de Dunod : www.dunod.com.
4.1. QUESTIONS DE TOPOLOGIE On suppose que le corps de base est R ou C et que l’espace vectoriel E est muni d’une norme. On rappelle qu’en dimension finie, toutes les normes sont équivalentes. (1) Soit une norme de E , on note S la sphère unité, c’est-à-dire l’ensemble des vecteurs de norme 1. Si u est un endomorphisme de E , montrer que
u = sup u(x) x∈S
définit une norme sur L(E). On dit que c’est la norme subordonnée à la norme de E dont elle est issue. (2) Montrer que toute norme subordonnée vérifie
∀(u, v) ∈ L(E), u ◦ v u v On dit que cette norme est sous-multiplicative. On se placera toujours dans ce cas, pour la fin du problème. (3) On suppose qu’une base de E a été fixée, il y a alors isomorphisme entre E et Mn,1 (K), entre L(E) et Mn (K). À toute norme dans Mn,1 (K) on peut ainsi associer une norme subordonnée dans M n (K). Décrire les normes subordonnées associées aux trois normes suivantes : Si t X = x1 , x2 , . . . , xn , alors :
x1 =
n i=1
|xi |,
x2 =
n
1 2
|xi |2
,
i=1
n
x∞ = sup |xi i=1
(4) On a choisit une norme sous-multiplicative quelconque. Soit λ une valeur propre réelle ou complexe de u. Montrer que |λ| u. (5) Montrer que GL(E) est un ouvert dense de L(E). (6) On suppose K = C. Montrer que l’ensemble des endomorphismes diagonalisables est dense dans L(E). Que dire dans le cas réel ? (7) On suppose toujours K = C. Montrer que l’ensemble des endomorphismes ayant n valeurs propres distinctes est dense dans L(E). (8) En utilisant des arguments de densité, prouver que u◦v et v◦u ont même polynôme caractéristique.
i
i i
i
i
i
i
i
Solutions des exercices
111
SOLUTIONS DES EXERCICES
Soit (ei )i∈I une base de E , (finie ou infinie) et u qui commute avec tous les endomorphismes. Alors, pour tout j , u(e j ) = i∈I aij ei , avec Card{i | aij = 0} < ∞. Soit alors g l’endomorphisme défini par : gi (ej ) = 0 si i = j gi (ei ) = ei Solution 4.1.
( Si on est en dimension finie, la matrice de g i est la matrice Eii de la base canonique). Alors, u ◦ gi = gi ◦ u implique u(ei ) = aii ei pour tout i, donc tous les aij pour i = j sont nuls. Reste à étudier les coefficients a ii . Si Card I > 2, il existe deux indices distincts i et j , et si l’on définit gij par : ⎧ ⎪ ⎨gij (ei ) = ej gij (ej ) = ei ⎪ ⎩g (e ) = 0 ij k alors
u ◦ gij = gij ◦ u ⇒ u ◦ gij (ei ) = gij ◦ u(ei ) ⇒ u(ej ) = gij (aii ei ) et donc ajj ej = aii ej et, pour tout i, j l’égalité de ai,i et de aj,j , et u est de la forme λid. En dimension finie, on en déduit que les matrices qui commutent avec toutes les autres sont les matrices de la forme λI , où I est la matrice de l’identité. Ce sont les matrices dites scalaires.
© Dunod. La photocopie non autorisée est un délit.
Solution 4.2. Dire que λ est valeur propre, c’est dire qu’il existe x non nul dans
Ker(A − λId). Si x a pour coordonnées (z1 , z2 , . . . , zn ) aij zj = (λ − aii )zi ∀i, j=i
Soit alors i tel que |zi | = max{|zk | | k = 1, 2, . . . , n} alors l’égalité précédente, permet d’écrire : |λ − aii | | aij | j=i
Les valeurs propres se trouvent donc à l’intérieur de n disques. Si maintenant |aii | > j=i |aij |, pour tout i, alors la matrice est inversible. Dans ce cas en effet, 0 ne peut être valeur propre. Comme l’hypothèse de ce corollaire le fait comprendre, on parle alors de matrice à diagonale fortement dominante.
i
i i
i
i
i
i
i
4 • Algèbre linéaire
112
Solution 4.3. On suppose que dim E = n ; ayant choisi une base, on note A et B les matrices respectives de u et de v . Si par exemple A est inversible, on peut écrire
BA = A−1 (AB)A et les matrices AB et BA sont semblables, elles ont même polynôme caractéristique (et également même polynôme minimal). Pour les cas où ni A ni B ne sont inversibles, on peut procéder ainsi : dans M 2n (K), −λI −A AB − λI −A I 0 I 0 −λI −A = = −λB −λI 0 −λI B I B I 0 BA − λI Les déterminants sont égaux et valent respectivement (−λ) n χAB et (−λ)n χBA . Par ailleurs, il est possible que AB et BA ne soient pas semblables : il suffit de prendre AB = 0 et BA = 0, par exemple 0 1 1 1 A= et B = 0 0 0 0 On fabrique cet exemple en prenant l’image de v incluse dans le noyau de u et l’image de u non incluse dans le noyau de v . Dans cette situation, les polynômes minimaux de AB et de BA sont distincts, ce sont respectivement X et X 2 .
Solution 4.4. B1 et B2 sont des bases de E1 et E2 , les matrices de u1 et u2 sont notées
M1 et M2 . La réunion (ordonnée) de ces deux bases est une base B de E , puisque E 1 et E2 sont supplémentaires. On a donc M1 0 MB (u) = 0 M2 0 = χu1 (X)χu2 (X) M2 − XI On a utilisé des déterminants de « matrices-blocs » : le lecteur vérifiera par exemple par un raisonnement par récurrence que si A B M= 0 C d’où
M − XI χu (X) = 1 0
où A et C sont des matrices carrées, on a bien det M = (det A)(det C). Pour ce qui est du polynôme minimal, il faut raisonner plus géométriquement. Si x = x1 +x2 est la décomposition de x dans la somme directe, et si P est un polynôme,
P (u)(x) = P (u)(x1 + x2 ) = P (u)(x1 ) + P (u)(x2 ) = P (u1 )(x1 ) + P (u2 )(x2 ) Puisque E1 et E2 sont u-stables, cette écriture est la décomposition de P (u)(x) dans la somme directe, et donc P (u) est l’endomorphisme nul si et seulement si P (u 1 ) = 0 et P (u2 ) = 0. On en déduit bien :
µu (X) = p.p.c.m.(µu1 (X), µu2 (X))
i
i i
i
i
i
i
i
Solutions des exercices
113
Solution 4.5. On utilise le résultat du théorème 4.8, page 91. Soit E λ un sous-espace propre de u. Il est stable par v . La restriction de v à E λ est diagonalisable, puisque v est diagonalisable sur E . Il existe donc une base de E λ qui est une base de diagonalisation pour v , mais comme u restreinte à E λ est l’homothétie de rapport λ, cette base est aussi une base de diagonalisation pour u restreint à E λ . En réunissant de tels bases pour tous les sous-espaces propres de u, on forme une base de diagonalisation simultanée pour u et v .
Le cas trigonalisable est basé sur les mêmes idées. On observe d’abord que u et v ont un vecteur propre commun : on sait en effet que u admet au moins une valeur propre λ puisque son polynôme caractéristique est scindé. Si B 1 = (e1 , e2 , . . . , ek ) est une base de Eu,λ , on peut la compléter en une base (e 1 , . . . , en ) de l’espace tout entier ; d’autre part, on sait que E u,λ est stable par v puisque u et v commutent. Notons u1 et v1 les restrictions de u et de v à ce sous-espace. La matrice de v dans la base complétée est de la forme : MB1 (v1 ) ∗ 0 A d’où on déduit que χv (X) = χv1 (X)χA (X). Comme v est trigonalisable, son polynôme caractéristique est scindé, et celui de sa restriction aussi : il existe donc un vecteur propre pour v dans E u,λ , c’est notre vecteur propre commun. Ayant pris ce vecteur propre commun comme premier vecteur de base, les matrices de v et de v ont comme allure : λ ∗ µ ∗ et 0 M1 0 M2 et on remarque que si u et v commutent, alors M 1 et M2 commutent aussi, on peut appliquer une récurrence.
© Dunod. La photocopie non autorisée est un délit.
Solution 4.6. T est une matrice triangulaire supérieure de diagonale nulle. Elle est
nilpotente ; cela résulte d’un calcul matriciel : on voit que pour T 2 , les coefficients ti,i+1 sont nécessairement nuls, puis pour T 3 , les coefficients ti,i+2 , etc. Mais plus efficacement, le polynôme caractéristique de T est (−X) n et on applique le théorème de Cayley-Hamilton. On n’a pas forcément DT = T D , donc ce n’est pas forcément la décomposition de Dunford de A. Pour un contre-exemple, prendre A triangulaire supérieure à éléments diagonaux tous distincts. Alors elle est diagonalisable, et sa décomposition de Dunford est A = A + 0.
Solution 4.7. Les blocs de Jordan sont de la forme J(0, p), mais la somme de leur dimension doit être n. Donc, 0 1 • n = 2, 2 = 1 + 1, c’est l’endomorphisme nul, 2 = 2, c’est la classe de . 0 0
i
i i
i
i
i
i
i
4 • Algèbre linéaire
114
• n = 3, 3 = 1 + 1 + 1, endomorphisme nul, 3 = 1 + 2, l’ordre de nilpotence est 2, et 3 = 3, l’ordre de nilpotence est 3. • n = 4, 4 = 1 + 1 + 1 + 1, 4 = 1 + 1 + 2, 4 = 1 + 3, 4 = 2 + 2, 4 = 4. Cette fois il y a deux classes différentes pour lesquelles les endomorphismes ont même ordre de nilpotence (donc même polynôme minimal). • Pour n = 5, on trouve 7 classes, pour n = 6 il y en a 11. C’est ce qu’on appelle le nombre des partions de l’entier n, nombre rapidement croissant avec n (par exemple, pour n = 20, on en trouve 627).
Solution 4.8. Notons (e1 , e2 ) la base. Si a = 0, a = {0}. Si a est un vecteur propre, donc a ∈ vect(e1 ) ou a ∈ vect(e2 ), alors a = vect(a). Sinon, a est donc nécessairement E tout entier. L’endomorphisme est cyclique. Si on prend la base (a, u(a)) où a n’est pas propre (par exemple e 1 + e2 ), la matrice de u est : 0 −2 matrice compagnon du polynôme X 2 − 3X + 2 1 3
Solution 4.9. La solution se trouve dans l’examen (attentif) de la démonstration du
théorème 4.16. Si (e1 , . . . , en ) est une base de Jordan de u, on a e n = E . En effet, u(en ) = en−1 + λen donc vect(en , en−1 ) = vect(en , u(en )) et ainsi de suite.
k
− λi ). Le Si µ | . . . | µ2 | µ1 est la suite des polynôme caractéristique est i=1 (X − λi k diviseurs élémentaires, on a µ 1 (X) = i=1 (X − λi ). Notons E1 ⊕ E2 ⊕ . . . ⊕ E la suite des sous-espaces cycliques, µ 1 est le polynôme minimal de la restriction de u à E1 . On cherche maintenant µ 2 polynôme minimal de la restriction u 2 de u à E2 ⊕ . . . ⊕ E qui est bien sûr u-stable, donc u 2 est diagonalisable (puisque u est diagonalisable). Ce polynôme minimal est donc scindé simple, et comme Solution 4.10. Le polynôme minimal est scindé simple, c’est
k
i=1 (X
)αi .
χu (X) = (X − λi )αi −1 µu (X) k
χu2 (X) = k
i=1
on a µ2 (X) = i∈I1 (X − λi ) où I1 est l’ensemble des indices des valeurs propres de multiplicité supérieure à 1. On continue de même, et on aura µ 2 (X) = ki∈I2 (X −λi ), le produit portera sur les valeurs propres de multiplicité supérieure à 2. Bien sûr, u sera cyclique si et seulement si il y a n valeurs propres distinctes. Solution 4.11. Notons C(u) l’ensemble des endomorphismes qui commutent avec
u, c’est une sous-algèbre de L(E), qui contient K[u], algèbre des polynômes en u. Supposons E = a et soit g ∈ C(u). Alors g(a) ∈ E peut s’écrire sous la forme
i
i i
i
i
i
i
i
Solutions des exercices
115
g(a) = P (u)(a) où P est un polynôme. Mais alors, si x est quelconque dans E , il peut aussi s’écrire x = Q(u)(a) où Q est un polynôme et g(x) = (g◦Q(u))(a) = (Q(u)◦g)(a) = Q(u)◦P (u)(a) = P (u)◦Q(u)(a) = P (u)(x) et on a démontré que g = P (u), donc que C(u) = K[u]. La réciproque est vraie, mais la démonstration est moins directe : on suppose que C(u) = K[u] et on considère E1 et E2 ⊕ . . . ⊕ Ek de la décomposition en sousespaces cycliques. Soit alors p la projection sur le second sous-espace, suivant E 1 . Alors p commute avec u. C’est un polynôme P (u), mais p = P (u) restreint à E 1 est nul donc P doit être multiple du polynôme minimal de u restreint à E 1 . Mais ce polynôme est aussi le polynôme minimal de u pour E tout entier. Donc P (u) = p = 0, la seul possibilité est E1 = E , donc u est cyclique. Solution 4.12. Rappelons comment « fonctionne » la base duale (e ∗i ). On a par défi-
nition e∗i (ej ) = δi,j , symbole de Kronecker qui vaut 1 si i = j , 0 sinon.
(1) Notons M = (mi,j ) et M = MB∗ (t u) = (mi,j ). Alors, n t ∗ ∗ ∗ mi,j = u(ej )(ei ) = ej (u(ei )) = ej mk,i ek = mj,i k=1
M
=t
M ... C’était prévisible. , ek ) une base de H , complétée en (e1 , . . . , en ) base de E . Alors, en (2) Soit (e1 , . . . posant φ = ni=1 φi e∗i , et donc
φ ∈ H o ⇐⇒ ∀i k, φ(ei ) = 0 ⇐⇒ ∀i k, φk = 0 ⇐⇒ φ ∈ vect(e∗k+1 , . . . , e∗n )
© Dunod. La photocopie non autorisée est un délit.
donc dim H o = dim E − dim H . Si maintenant x ∈ H et φ ∈ H o , alors φ(x) = 0 prouve que x ∈ H oo . On a donc H ⊂ H oo . Mais ces espaces vectoriels ont même dimension, il y a donc égalité. Les mêmes arguments montrent que E et E ∗∗ sont canoniquement isomorphes : à x ∈ E correspond la forme linéaire de E ∗ définie par φ → φ(x). Ainsi, t (t u) = u. (3) Soit φ ∈ H o et x ∈ H , quelconque. Si H est u-stable, t
Ho
t u-stable.
et est u(H) ⊂ H .
u(φ)(x) = φ(u(x)) = 0
Si maintenant t u(H o ) ⊂ H o alors t (t u)(H oo ) ⊂ H oo soit
(4) Soit u endomorphisme d’un C-espace vectoriel. Un hyperplan H est u-stable si et seulement si son orthogonal H o est t u-stable. Mais H o est de dimension 1, il est donc stable si c’est une droite propre de t u. Rechercher les hyperplans ustables revient donc à chercher les valeurs propres de t u. Dans l’exemple proposé, M admet trois valeurs propres distinctes, il y a donc trois droites stables. Mais t M admet alors également trois valeurs propres distinctes, il y a donc trois plans stables. On pourra vérifier, bien sûr, que chacun de ces plans contient deux des droites propres.
i
i i
i
i
i
i
i
4 • Algèbre linéaire
116
Solution 4.13. Dans la démonstration du lemme des noyaux, on obtient une décomposition d’un vecteur x dans la somme directe sous la forme :
x=
k
xi
où
xi = Ai (u) ◦ Qi (u)(x)
i=1
et cela s’applique aux cas des sous-espaces caractéristiques. On en déduit que les projections sur un sous-espace caractéristique suivant la somme des autres sont des polynômes en u (ce sont les projecteurs spectraux). Dans la décomposition de Dunford, on a : k d= λi pi et n = u − d i=1
donc d et n sont des polynômes en u. On peut souvent en déduire rapidement la décomposition de Dunford d’un endomorphisme. Solution 4.14. Ker uk ⊂ Ker uk+1 car uk (x) = 0 implique u(uk (x)) = u(0) = 0.
De plus, si on suppose Ker uk = Ker uk+1 et que x ∈ Ker uk+2 , alors
0 = uk+2 (x) = uk+1 (u(x)) ce qui prouve que u(x) ∈ Ker uk+1 = Ker uk . Donc uk (u(x)) = 0 et x ∈ Ker uk+1 . On a montré que Ker uk+1 = Ker uk+2 , la suite des noyaux itérés est donc définitivement stationnaire. Remarquons également qu’en dimension finie, la suite des dimensions est majorée par n, elle est donc nécessairement stationnaire à partir d’un certain rang. Commençons par considérer le morphisme u restreint à Ker u k+2 . Si x est dans cet espace, u(x) est dans Ker uk+1 , on peut donc restreindre l’ensemble d’arrivée à Ker uk+1 . Soit alors u : x → x, classe modulo le sous-espace vectoriel Ker u k . Un vecteur x est dans le noyau de u lorsque u(x) ∈ Ker u k c’est-à-dire lorsque x ∈ Ker uk+1 . On en déduit, par le théorème d’isomorphisme, qu’il y a un morphisme injectif de
Ker(uk+2 )/ Ker(uk+1 )
dans
Ker(uk+1 )/ Ker(uk )
et, en prenant les dimensions, dk+2 − dk+1 dk+1 − dk . Supposons maintenant que u soit nilpotent d’indice p, dans un espace de dimension n. Notons d0 = 0, d1 ,. . . ,dp = n la suite des dimensions des noyaux, puis e 1 = d1 − d0 , e2 = d2 − d1 , . . . ep = dp − dp−1 la suite (décroissante) des « écarts » entre les dimension des noyaux. On sait que le nombre de k blocs est la dimension des sousespaces notés Sk dans la démonstration du théorème. Donc j p = ep , jp−1 = ep−1 −ep , etc... On pourra vérifier par exemple que
n = pjp + (p − 1)jp−1 + . . . + j1 ce qui est « logique ».
i
i i
i
i
i
i
i
Solutions des exercices
117
Solution 4.15. On considère la restriction u i de u au sous-espace caractéristique
© Dunod. La photocopie non autorisée est un délit.
Ci = Ker(u − λi id)α . On sait que (X − λ)α est le polynôme caractéristique de u i , le degré α de ce polynôme est donc la dimension de C i . Mais, par ailleurs, la restriction de u − λi id à Ci est nilpotente, et l’ordre de nilpotence est le plus petit exposant β tel que Ker(u − λi id)β = Ci . La suite des noyaux itérés est donc stationnaire à partir de cet entier β , qui est l’ordre de multiplicité de λ i dans le polynôme minimal.
i
i i
i
i
i
i
i
i
i i
i
i
i
i
i
Chapitre 5
Groupes
© Dunod. La photocopie non autorisée est un délit.
La notion de groupe a été rencontrée à de multiples reprises les années précédentes. Ce chapitre reprend rapidement les notions générales, puis propose de s’intéresser au cas particulier des groupes commutatifs finis. Il se termine en exposant les théorèmes de Sylow, première étape vers une classification des groupes finis. Par convention, et sauf cas particuliers, le composé de deux éléments a et b sera noté ab, l’élément neutre sera e, aa sera écrit a2 , etc. On supposera connus les exemples classiques : groupe additif Z/nZ des entiers modulo n, groupe symétrique S n et groupe alterné A n .
5.1 SOUS-GROUPES, MORPHISMES 5.1.1. Sous-groupes Soit G un groupe. Si H est un sous-ensemble non vide de G, on dit que c’est un sousgroupe de G lorsque c’est aussi un groupe pour la même loi : cela se produit si et seulement si H est stable pour le produit et pour la prise d’inverse.
∀(x, y) ∈ H 2 , xy ∈ H et x−1 ∈ H On écrit alors H G. L’intersection de sous-groupes de G est un sous-groupe de G, ce qui permet de définir le sous-groupe engendré par une partie A de G : c’est le plus petit sous-groupe de G qui contient A, et c’est l’intersection de tous les sous-groupes de G qui contiennent A. On le notera A.
i
i i
i
i
i
i
i
5 • Groupes
120
Définition 5.1. Si H est un sous-groupe de G, la relation R définie dans G
par :
xRy ⇐⇒ x−1 y ∈ H est une relation d’équivalence. Les classes d’équivalence sont les ensembles de la forme xH , l’ensemble quotient de G par cette relation est noté G/H . La vérification est en tout point similaire à ce qui a été fait avec les anneaux et les idéaux et xRy ⇐⇒ y ∈ xH , avec bien sûr xH = {g ∈ G | ∃h ∈ H g = xh}. On peut définir une autre relation d’équivalence, par xR y ⇐⇒ yx−1 ∈ H , et les classes sont alors les ensembles de la forme Hx, appelées classes à droite. On peut alors énoncer le premier théorème de la théorie des groupes. Théorème 5.2. théorème de Lagrange. Toute classe à gauche ou à droite est en
bijection avec H . Si G est fini, le cardinal d’un sous-groupe H et le cardinal du quotient G/H sont des diviseurs associés du cardinal de G :
Card(G) = Card(H) × Card(G/H)
Démonstration. Il suffit de vérifier que l’application h → xh est une bijection : c’est parce qu’il y a une application réciproque g → x −1 g. Et donc toutes les classes (à gauche ou à droite) sont en bijection avec H . G est la réunion disjointe des classes à gauche ; si donc G est fini, son cardinal est la somme des cardinaux des classes, d’où la formule. Remarque : Dans le cas où G est infini, le cardinal de H ou le cardinal de G/H peuvent être finis. On note parfois [G : H] (indice de H dans G), le cardinal de G/H . Dans le cas fini, le cardinal d’un sous-groupe H est donc un diviseur du cardinal n du groupe G. Réciproquement, si d | n, il n’existe pas toujours un sous-groupe de G qui a ce cardinal. Ainsi le groupe alterné A 4 a pour cardinal 12, il n’a pas de sous-groupe à 6 éléments. 5.1.2. Morphismes Définition 5.3. Une application f du groupe G dans le groupe H est un
morphisme de groupes si
∀(g, g ) ∈ G2 ,
φ(gg ) = φ(g)φ(g ).
Il est alors immédiat que l’image d’un sous-groupe de G est un sous-groupe de H , (c’est le cas en particulier de Im f = f (G)) et il en va de même pour l’image réciproque d’un sous-groupe de H . On appelle noyau du morphisme l’image réciproque de l’élément neutre : Ker f = {x ∈ G | f (x) = eH }
i
i i
i
i
i
i
i
5.1 Sous-groupes, morphismes
121
et on introduit, comme en algèbre linéaire le vocabulaire : endomorphisme, isomorphisme, automorphisme de groupe. Comme pour les anneaux ou les espaces vectoriels : Proposition 5.4. Soit f un morphisme du groupe G dans le groupe H . Alors f est
surjectif si f (G) = Im(f ) = H , f est injectif si f −1 (eH ) = Ker f = {eG }. Si f est un morphisme bijectif, son application réciproque est aussi un morphisme de groupes. On parle d’isomorphisme de groupes.
5.1.3. Ordre, groupes cycliques L’ordre de x élément d’un groupe g est le plus petit entier non nul n tel que x n = e ; si un tel entier n’existe pas, on dit que x est d’ordre infini. Proposition 5.5.
Si x ∈ G est d’ordre n fini alors : ∀m ∈ N ∗ ,
(xm = e ⇒ n | m). (ii) Si x est d’ordre n fini, le groupe x engendré par x est (i)
x = {e, x, x2 , . . . , xn−1 } et x est isomorphe au groupe (Z/nZ, +). Si x est d’ordre infini, le groupe engendré par x est isomorphe à (Z, +). (iii) Si G est fini, tout élément de G est d’ordre fini et cet ordre est un diviseur de Card G. (iv) Si x ∈ G est d’ordre n, et si k est un entier, alors x k est d’ordre
n n∧k .
© Dunod. La photocopie non autorisée est un délit.
Démonstration. (i) Le morphisme φ : k → xk de (Z, +) dans G a pour noyau un sous-groupe de Z. D’après la définition de l’ordre de x ce noyau est nZ. Et donc tous les entiers m alors tels que xm = e sont des multiples de n. (ii) Si xi = xj , alors i − j est un multiple de n. Si donc Ker φ = {0}, n = 0, l’ensemble des puissances positives et négatives de x est formé d’éléments distincts ; ces éléments forment un groupe isomorphe à (Z, +). Si Ker φ = nZ, e, x, x2 , . . . , xn−1 sont distincts, et toute puissance de x de la forme x m peut s’écrire xm = xnq+r = xr où r est le reste de la division euclidienne de m par n et vaut 0, 1,. . . ou n − 1. L’ensemble {e, x, . . . , xn−1 } forme un groupe isomorphe à (Z/nZ, +). L’isomorphisme est défini par xk → k où k est la classe de k modulo n. (iii) C’est un cas particulier du théorème de Lagrange, x est un sous-groupe de G : son ordre, qui est l’ordre de x, divise l’ordre de G. (iv) Posons n = n d et k = k d où d = n ∧ k est le p.g.c.d. de n et k, et où n et k sont premiers entre eux. Alors
(xk )n = xk dn = (xn )k = e
i
i i
i
i
i
i
i
5 • Groupes
122
donc l’ordre de xk divise n et par ailleurs (xk )m = e donc n = n d divise km = k dm et donc n | k m et donc m est un multiple de n =
n n∧k
par le théorème de Gauss.
Remarques De la dernière partie de ce théorème, il ressort que pour tout groupe cyclique C n , et pour tout diviseur d de n, il existe un sous-groupe d’ordre d (et on montre facilement un seul). À comparer avec les remarques qui ont suivi le théorème de Lagrange. De la proposition, il ressort également que tous les groupes engendrés par un élément d’ordre n sont isomorphes. On dit qu’il s’agit d’un groupe cyclique d’ordre n. On notera Cn un groupe cyclique d’ordre n quelconque. Un modèle de Cn , en notation additive, est le groupe additif Z/nZ des entiers modulo n. Un autre modèle est le sous-groupe multiplicatif U n des racines n-ièmes de l’unité dans C. Exercice 5.1. Démontrer qu’un groupe d’ordre p premier est cyclique.
Exercice 5.2. Soit H et K des sous-ensembles d’un groupe G. On note HK et H −1
les ensembles définis par :
HK = {g ∈ G | ∃h ∈ H, ∃k ∈ K, g = hk}
H −1 = {h−1 | h ∈ H}
et
Montrer que H est un sous-groupe de G si et seulement si HH = H et H −1 = H . Exercice 5.3. Montrer qu’un groupe G est commutatif si et seulement si x → x −1 est
un automorphisme de G. Exercice 5.4. Soit φ un morphisme du groupe G dans le groupe H . Si x ∈ G est
d’ordre n, que dire de l’ordre de φ(x) ? Et si φ est injectif ? Exercice 5.5. Soit D8 le groupe engendré par les matrices
a=
0 −1 1 0
et
b=
0 1 1 0
Montrer qu’il a huit éléments. Déterminer ses sous-groupes. On l’appelle groupe diédral d’ordre huit.
i
i i
i
i
i
i
i
5.2 Groupe quotient et groupe produit
123
5.2 GROUPE QUOTIENT ET GROUPE PRODUIT 5.2.1. Sous-groupe distingué Soit G un groupe et H un sous-groupe. Nous avons déjà défini l’ensemble des classes à gauche noté G/H . Il est possible, sous certaines conditions, que cet ensemble quotient soit muni d’une structure de groupe héritée en quelque sorte de la structure de groupe de G. Il faut et il suffit pour cela que H soit d’un type particulier, qu’il soit distingué dans G. On retrouve ici la même type de situation que pour les anneaux : le quotient d’un anneau par un idéal est muni d’une structure d’anneau lorsque l’idéal est bilatère. Définition 5.6. On dit que H est un sous-groupe distingué de G lorsque
∀x ∈ G, xH = Hx On écrit alors : H G. Autrement dit, les classes à gauche et à droite de n’importe quel élément de G coïncident. Bien sûr, si G est commutatif, tout sous-groupe est distingué, comme pour les anneaux : dans un anneau commutatif tous les idéaux sont bilatères. Théorème 5.7. Si H G, l’ensemble G/H est un groupe pour la loi définie par
xH. yH = xyH
© Dunod. La photocopie non autorisée est un délit.
L’application p de G sur G/H qui à x associe sa classe xH est alors un morphisme surjectif de groupe, de noyau H . On l’appelle projection de G sur son quotient G/H .
Démonstration. Comme pour le quotient d’un anneau par un idéal bilatère, tout repose sur le fait que la congruence modulo H est compatible avec l’opération de groupe, lorsque H est distingué dans G. En effet, Si x ≡ x et y ≡ y , alors xy ≡ x y puisque (xy)−1 x y = y −1 x−1 x yy −1 y ∈ H car x−1 x ∈ H et que H est distingué dans G. Le fait que la projection soit un morphisme résulte de la définition de l’opération dans le quotient : x y = xy où l’on a noté x la classe d’un élément modulo H , au lieu de xH . La classe e de l’élément neutre de G est eH = H , c’est l’élément neutre du quotient G/H et H est le noyau du morphisme p. Plus généralement : Proposition 5.8. Un sous-groupe H d’un groupe G est distingué dans G si et seulement si c’est le noyau d’un morphisme de source G.
Démonstration. Tout sous-groupe H distingué dans G est le noyau de la projection p. Réciproquement, soit φ : G → K un morphisme de groupes. Alors, si g est quelconque dans G et h ∈ Ker φ, on a φ(ghg−1 ) = φ(g)φ(h)φ(g−1 ) = φ(g)eK φ(g−1 ) = φ(gg−1 ) = eK
i
i i
i
i
i
i
i
5 • Groupes
124
Comme dans le cas des anneaux quotients, on peut énoncer un théorème d’isomorphisme et un théorème de correspondance. Théorème d’isomorphisme. Soit φ : G → H un morphisme de groupes. Il existe un isomorphisme canonique φ de G/ Ker φ sur Im φ.
Théorème 5.9.
Théorème 5.10. Théorème de correspondance. Soit H G. La projection p de G
sur G/H induit une bijection de l’ensemble des sous-groupes K tels que H K G dans l’ensemble des sous-groupes de G/H Les démonstrations sont en tous points semblables à celles faites dans le cas des anneaux, nous ne les reprendrons pas. Signalons de plus que la bijection du second théorème transforme les groupes distingués dans G contenant H en les groupes distingués dans G/H .
5.2.2. Groupe produit Soient H et K deux groupes. Dans l’ensemble H × K , il est possible de définir une structure de groupe particulièrement simple. Proposition 5.11. L’ensemble H × K est un groupe pour la loi définie par :
(h, k)(h , k ) = (hh , kk ) où h et h sont dans H , k et k dans K . On dit que c’est le produit direct des groupes H et K .
Démonstration. Les vérifications sont immédiates. On constate en particulier que l’élément neutre est le couple (e H , eK ) et que (h, k)−1 = (h−1 , k−1 ). À titre d’exemple, on peut bien sûr considérer le produit cartésien C n × Cm de deux groupes cycliques. En reprenant l’étude faite dans le chapitre sur les anneaux, on vérifiera que ce produit de groupes cycliques est cyclique si et seulement si m ∧ n = 1 et qu’il est alors isomorphe à C mn . On dira que c’est le théorème chinois « version groupe », par opposition avec la version anneau. Le plus petit de ces produits est le groupe C2 × C2 , qui est commutatif, non cyclique, de cardinal 4. On l’appelle groupe de Klein, ou, pour des raisons géométriques, groupe du rectangle : il est isomorphe au groupe des isométries qui conservent un rectangle non carré (l’identité, les réflexions par rapports aux axes de symétrie, la symétrie centrale de centre le centre du rectangle). Toujours aussi élémentaire l’isomorphisme C ∗ R∗ × U (pour la loi produit) est la traduction des propriétés de l’écriture trigonométrique d’un complexe non nul. Il est bien sûr possible de généraliser, on peut définir le produit direct d’un nombre fini de groupes, ou même le produit direct d’une famille de groupes. On retrouve dans G = H × K une copie de H et une copie de K . Plus précisément.
i
i i
i
i
i
i
i
5.2 Groupe quotient et groupe produit
125
Proposition 5.12. Si G est le produit direct de H et K alors
# = H × {eK } H
# = {eH } × K K
sont des sous-groupes de G isomorphes respectivement à H et à K . De plus :
# G, H
# G, K
# ∩K # = eG , H
#K # =K #H # G=H
avec encore une précision
# ∃!k ∈ K, # ∀g ∈ G, ∃!h ∈ H,
g = hk = kh
Démonstration. Les isomorphismes sont définis par h → (h, e K ) et k → (eH , k). De plus, d’après les règles de calcul # donc H # G (h, k)(h , eK )(h, k)−1 = (hh h−1 , eK ) ∈ H # . Si (h, k) est dans H # , alors k = eK , et s’il est aussi dans K # , c’est et de même pour K eG = (eH , eK ). Enfin, (h, k) = (h, eK )(eH , k) = (eH , k)(h, eK ), donc tout élément # et d’un élément de K # . L’unicité de de G s’écrit comme produit d’un élément de H l’écriture résulte du même calcul. Soit maintenant G un groupe , H et K deux sous-groupes. Il est intéressant de savoir si on peut « décomposer » G à l’aide de H et de K , de sorte que G soit isomorphe au produit direct H × K . Il est bien sûr nécessaire que H et K vérifient au moins les # et K # dans la proposition précédente. On peut (et il y a plusieurs propriétés de H possibilités) montrer que certaines de ces conditions sont suffisantes. L’analogie avec des sous-espaces vectoriels supplémentaires est un guide, et voici un exemple de ce que l’on peut énoncer. Proposition 5.13. Si HK = G, si H et K sont distingués dans G et si H ∩ K = {e}.
© Dunod. La photocopie non autorisée est un délit.
alors G est isomorphe à H × K .
Démonstration. Supposons H G, K G, et G = HK . Commençons par observer que, h et k étant respectivement dans H et dans K , hkh−1 k−1 = (hkh−1 )k−1 = h(kh−1 k−1 ) ∈ H ∩ K puisque H et K sont distingués dans G. On a donc, pour tout couple (h, k) de H × K ,
hkh−1 k−1 = eG
⇒
hk = kh
Considérons maintenant φ : (h, k) → hk de H × K dans G. Par hypothèse, c’est une application surjective entre deux groupes. Montrons que c’est un morphisme :
φ((h, k)(h , k )) = hh kk et φ(h, k)φ(h , k ) = hkh k = hh kk Examinons l’injectivité : hk = e implique h = k −1 et cet élément est dans H ∩ K donc est le neutre, on a h = k = eG . Le noyau de φ est donc réduit au neutre, φ est bien un isomorphisme.
i
i i
i
i
i
i
i
5 • Groupes
126
Attention : le fait que hk = kh pour (h, k) ∈ H × K n’implique pas que le groupe G soit commutatif... ne serait-ce que parce que ni H ni K n’ont nécessité à l’être. On peut trouver d’autres critères et il est possible de généraliser à un nombre fini de sous-groupes (Hi )i=1 à n : comme pour des sous-espaces vectoriels en somme directe, il faut prendre l’hypothèse Hi ∩ Hj = {e} j=i
Exercice 5.6. Montrer que le centre Z(G) d’un groupe (c’est-à-dire l’ensemble des éléments de G qui commutent avec tous les éléments de G), est un sous-groupe distingué dans G. Exercice 5.7. Montrer qu’on peut avoir K H G mais K G. On cherchera un contre-exemple dans le groupe A 4 . Exercice 5.8. Soient H et K deux sous-groupes de G. Montrer que HK est un sousgroupe de G si et seulement si HK = KH . On suppose que l’un des deux est distingué dans G. Montrer que cette condition est réalisée. Exercice 5.9. Soit G le groupe diédral (cf. 5.5), et H = a, K = b. Montrer que
H ∩ K = {e}, H G, HK = KH = G. Pourquoi G n’est-il pas isomorphe au produit direct de H par K ?
5.3 GROUPES COMMUTATIFS FINIS Nous allons maintenant étudier les groupes commutatifs finis. Il se trouve que cette étude est assez simple, (disons les résultats, plus que les démonstrations...) et le lecteur attentif remarquera des ressemblances certaines avec des théorèmes obtenus dans le cadre de l’algèbre linéaire.
5.3.1. Exposant d’un groupe commutatif fini Si G est un groupe fini de cardinal n, le théorème de Lagrange permet d’assurer que tout élément a un ordre d qui est un diviseur de n. On appelle exposant le plus grand ordre des éléments de G. Proposition 5.14. Si G est commutatif d’exposant e, l’ordre de tout élément est un
diviseur de e.
i
i i
i
i
i
i
i
5.3 Groupes commutatifs finis
127
Démonstration. Commençons par un petit résultat Lemme 5.15. Si a et b commutent et sont d’ordre n et m premiers entre eux, alors ab
est d’ordre nm.
Démonstration. [du lemme] On a tout de suite (ab) nm = anm bnm = e. Par ailleurs, (ab)k = e ⇒ (ab)kn = e ⇒ bkn = e ⇒ m | kn et donc, par le théorème de Gauss, k est un multiple de m. On démontre de même que k est un multiple de n, donc du p.p.c.m. de ces deux nombres, soit mn. L’ordre de ab est donc exactement mn. Soit donc maintenant x ∈ G d’ordre maximum e. Supposons qu’il existe y d’ordre d, inférieur à e mais non diviseur de e. Alors le p.p.c.m. µ de d et de e est un multiple strict de e donc est plus grand que e. De plus, il existe deux entiers d et e diviseurs respectifs de d et e tels que µ = d e : cela se voit en utilisant la décomposition en facteurs premiers de µ : on sait que si d= pdi i et e = pei i i∈I
i∈I
alors µ est le produit des mêmes premiers, avec pour exposant le maximum de d i et ei . Il suffit d’appeler J l’ensemble des i tels que d i ei et on aura : d = pdi i et e = pei i i∈J
i∈I\J
Et si on prend a = xe/e et b = y d/d , ab est d’ordre µ. Il y a contradiction, et donc l’ordre de tout élément de G est un diviseur de e.
© Dunod. La photocopie non autorisée est un délit.
Un application intéressante, que nous avons déjà signalée (et utilisée) dans le chapitre sur les polynômes : Théorème 5.16. Si K est un corps fini (donc commutatif) de cardinal q , alors
K ∗ = K \ {0} est un groupe multiplicatif cyclique.
Démonstration. Soit e l’exposant de K ∗ . D’après le théorème, c’est un multiple de l’ordre de tous les éléments de K ∗ , donc xe − 1 = 0 pour tous les éléments de K ∗ . Mais dans un corps, une équation de degré e a au maximum e racines, C’est donc que e = q − 1, et il existe un élément d’ordre q − 1, K ∗ est cyclique. On peut remarquer qu’on n’utilise que l’intégrité. 5.3.2. Facteurs invariants Bien sûr, si G est un groupe commutatif fini d’ordre n et d’exposant n, il est cyclique. Le théorème qui vient prouve que tout groupe commutatif fini est isomorphe à un produit de groupes cycliques.
i
i i
i
i
i
i
i
5 • Groupes
128
Théorème 5.17. Si G est un groupe commutatif fini, il existe une suite d’entiers a 1 ,
a2 ,. . . , ak telle que : a1 | a2 | · · · | ak et G Ca1 × Ca2 × · · · × Cak La suite des (ai ) est unique et les (ai ) sont appelés facteurs invariants du groupe G. De plus, ak est l’exposant de G et le cardinal de G est le produit des a i .
Démonstration. Avertissement, cette démonstration est un peu laborieuse. Elle peut être omise en première lecture. Il est clair que ak doit être l’exposant m de G car c’est l’ordre maximal d’un élément du groupe produit donné par le théorème. On considère donc H = x le groupe cyclique engendré par un élément d’ordre m = a k . On va montrer qu’il existe un sous-groupe K de G tel que G = HK H × K . Soit donc K un sous-groupe d’ordre maximal parmi ceux pour lesquels H ∩K = {e}, raisonnons par l’absurde en supposant que HK , qui est isomorphe à H × K d’après le théorème 5.13, est différent de G ; c’est la partie la plus « technique » de la démonstration. Commençons par observer qu’il existe un élément g de G dont la classe est d’ordre premier p dans le quotient G/HK : si on part d’un élément d’ordre non premier, une de ses puissances a pour ordre un diviseur premier de cet ordre (cf. théorème 5.5, (iv)). / HK et g p ∈ HK donc : On a donc g ∈ gp = xr k avec xr dans H et k dans K . Le nombre p est un diviseur de l’exposant m de G, sinon, par Bezout on aurait pu + mv = 1 et g = g pu+mv = gpu ∈ HK . Donc, il existe p tel que pp = m et e = g pp = xrp kp . Comme H ∩ K = {e}, xrp = e, et comme x est d’ordre m = pp , r = p. On a obtenu :
gp = xp k Posons y = gx− , alors y p = k. Si y est dans H = x, alors g aussi, contradiction. Si y n’est pas dans HK , le groupe engendré par y et K rencontre H ailleurs qu’en e (par maximalité de K ), et il existe donc un entier q tel que y q = k h , avec h = e et q non multiple de p (k h = e équivaut à k = h = e). En définitive, y q ∈ HK , y p ∈ HK , par Bezout on en déduit y ∈ HK donc g ∈ HK contradiction... On a donc G = x × G , et on peut itérer le processus. L’ordre de tout élément de G est un diviseur de m, exposant de G , et comme on part d’un groupe fini, on construit ainsi un isomorphisme de G avec un produit de groupes cycliques. Nous n’allons pas montrer l’unicité de la suite des facteurs invariants ; si
b1 | b2 | . . . | bk et G Cb1 × Cb2 × . . . × Cbk alors l’exposant de ce produit de groupe cyclique est clairement b k donc également ak . Il faudrait continuer, en montrant que a k−1 est égal à bk −1 , mais la démonstration complète est un peu longue. Remarquons pour conclure ce paragraphe qu’il en résulte un critère d’isomorphisme pour des groupes commutatifs finis. Il suffit qu’ils aient la même suite de facteurs invariants.
i
i i
i
i
i
i
i
5.3 Groupes commutatifs finis
129
5.3.3. Diviseurs élémentaires La décomposition obtenue dans le paragraphe précédent est la plus économique, en ce sens qu’il n’est pas possible de trouver un isomorphisme avec un produit de groupes cycliques contenant moins de facteurs (voir les exercices en fin de chapitre). Par contre, il existe une façon intéressante de décomposer un groupe commutatif fini, en produit de groupes cycliques « primaires ». Théorème 5.18. Soit G un groupe commutatif fini. Il existe une unique suite de groupes cycliques de la forme C pai i , où pi est un nombre premier, telle que : G Cpai i i∈J
Il y a unicité de cette suite. Un groupe cyclique de la forme C pai i est appelé groupe primaire. Les entiers pai i sont les diviseurs élémentaires du groupe G.
Démonstration. L’existence repose uniquement sur le théorème chinois (version groupe). En effet, si n est un entier dont la décomposition en facteurs premiers est n=
ki
pai i
i=1
alors on a l’isomorphisme
Cn =
ki
Cpai i
© Dunod. La photocopie non autorisée est un délit.
i=1
et, en utilisant la décomposition en groupes cycliques vue auparavant, on obtient une décomposition en groupes cycliques primaires. Et si on part d’une telle décomposition, on peut lui associer une seule suite de facteurs invariants : l’exposant du groupe produit est l’ordre maximum d’un élément, c’est le produit des puissances d’exposant maximum, pour chacun des facteurs premiers. En prenant successivement les exposants immédiatement inférieurs, on obtient la suite des facteurs invariants. Mais il est plus clair de raisonner sur un exemple : supposons que la suite des diviseurs élémentaires est 2, 2, 2, 23 , 24 , 3, 3, 32 , 52 , 52 , on construit la table :
2 2 2 23 1 1 3 3 1 1 1 52
24 32 52
et les facteurs invariants sont les produits des colonnes successives :
2, 2, 6, 600, 3600 L’unicité admise de la suite des facteurs invariants permet d’en déduire l’unicité de la suite des diviseurs élémentaires. On aura fait le lien avec la décomposition de Frobenius faite dans le chapitre précédent. Ce n’est pas un hasard, les deux développements sont des cas particuliers d’une
i
i i
i
i
i
i
i
5 • Groupes
130
théorie qui les « chapeaute », celle des modules de type fini sur un anneau principal. Donnons quelques éléments de traduction : • Le groupe commutatif fini — l’espace E muni d’un endomorphisme u. • L’ordre d’un élément de G — le polynôme minimal µ u,a d’un vecteur. • L’exposant du groupe — le polynôme minimal de u. • Le cardinal du groupe — le polynôme caractéristique de u. • Un groupe cyclique primaire — un sous-espace cyclique.
Exercice 5.10. Dans un groupe G commutatif, x est d’ordre 30 et y d’ordre 12. Donner un élément d’ordre 60.
Exercice 5.11.
Déterminer les facteurs invariants et diviseurs élémentaires de C10 × C144 × C18 . Exercice 5.12. Soit V = Z/2Z×Z/2Z que l’on appelle groupe du rectangle ou groupe de Klein. Montrer qu’il existe trois sous-groupes A, B et C distincts et cycliques d’ordre 2 tels que V = A × B = B × C = A × C .
Exercice 5.13. Déterminer le nombre des groupes commutatifs ayant 60 éléments, à
isomorphisme près.
Exercice 5.14. Soit G un groupe commutatif, n un entier. On pose :
Gn = {g ∈ G | gn = e},
Gn = {g ∈ G | ∃h ∈ G, g = hn }
Sont-ce des sous-groupes de G ? Les déterminer dans le cas où on connaît les facteurs invariants de G.
5.4 ACTIONS DE GROUPES 5.4.1. Définitions générales Il s’agit en quelque sorte d’un retour à la source : les groupes ont été introduits en tant que groupes de permutations des racines d’une équation. Et c’est aussi dans le cadre de la géométrie que s’est développée la théorie des groupes. On va donc préciser ce qu’on appelle l’action d’un groupe sur un ensemble. Soit G un groupe, X un ensemble non vide.
i
i i
i
i
i
i
i
5.4 Actions de groupes
131
Définition 5.19. On dit que G agit sur X si on a défini une application
G × X −→ X (g, x) −→ g.x et que, pour tout (g, g ) de G2 et x dans X ,
g.(g .x) = (gg ).x
eG .x = x
D’une façon intuitive, g agit sur un élément x en le transformant en g.x. Donnons une définition équivalente : on note S X le groupe des bijections de X dans lui-même. Définition 5.20. Une action du groupe G sur l’ensemble X est un morphisme
Φ de G dans SX .
Et donc Φ(g)(x) = g.x. Commençons par donner des exemples. • G agit sur lui même par translation à gauche : g.x = gx, ou par translation à droite : g.x = xg−1 . Il s’agit bien d’actions. Par exemple, pour la translation à droite, on écrit g.(g .x) = g.(xg −1 ) = xg −1 g−1 = x(gg )−1 = (gg ).x • Un mélange des deux : g.x = gxg −1 ; c’est l’action par conjugaison, que nous rencontrerons souvent. • Si G = GL(E) est le groupe linéaire d’un espace vectoriel, alors G agit sur E , mais aussi sur D l’ensemble des droites vectorielles, ou sur B l’ensemble des bases. On posera g.x = g(x), g.D = g(D) et, dans le dernier cas :
g.B = g.(e1 , e2 , . . . , en ) = (g(e1 ), g(e2 ), . . . , g(en )) Les vérifications nécessaires sont immédiates.
© Dunod. La photocopie non autorisée est un délit.
Une action peut avoir différentes propriétés. Définition 5.21.
(1) Une action est fidèle si :
∀g ∈ G,
(∀x ∈ X, (g.x = x)) ⇒ (g = eG )
autrement dit, le noyau de Φ est réduit à e G . (2) Une action est transitive si :
∀(x, y) ∈ X 2 , ∃g ∈ G,
y = g.x
Si une action n’est pas fidèle, on peut faire agir G/ Ker Φ sur X , et l’action induite sera fidèle. Si par contre une action est fidèle, et ce sera souvent le cas en géométrie, Φ identifie G à un sous-groupe du groupe des bijections de X dans X . On peut dire que G est un groupe de transformations de X . Par ailleurs, le défaut de transitivité se mesure ainsi.
i
i i
i
i
i
i
i
5 • Groupes
132
Définition 5.22. On appelle orbite d’un x dans X l’ensemble des g.x où g
parcourt G. L’orbite de x est notée Ox ou parfois Gx. Une action est transitive si et seulement si il n’y a qu’une orbite. Être dans la même orbite est une relation d’équivalence, et les orbites partitionnent l’ensemble X . Enfin, si x est un élément de X , on définit son stabilisateur par : Définition 5.23.
Gx = {g ∈ G | g.x = x}
C’est un sous-groupe de G comme on le vérifie facilement. Et voici le premier, et seul théorème de toute cette introduction. Théorème 5.24.
Ox G/Gx
où représente une bijection. Cette bijection n’a, a priori, aucune raison d’être un morphisme, puisque ni Ox ni G/Gx n’ont de structure de groupe en général.
Démonstration. On pose g.Gx → g.x. C’est bien défini car si g.Gx = g .Gx , on a g −1 g ∈ Gx et g.x = g .x, c’est surjectif par choix de l’ensemble d’arrivée, et le calcul qu’on vient de faire montre que c’est injectif. Dans le cas où X est fini, on en déduit la formule des classes : Théorème 5.25.
Card(X) =
n
Card(G/Gxi )
i=1
où (xi ) sont des représentants des n orbites.
Démonstration. C’est la conséquence de ce que des classes d’équivalence forment une partition de X . 5.4.2. Applications aux groupes Examinons l’action par translation. Théorème 5.26. Théorème de Cayley. Tout groupe G est isomorphe à un sousgroupe du groupe symétrique S G .
Démonstration. L’action par translation est fidèle, puisque gx = x pour tout x (et même pour seulement un x) implique que g = e G . Il y a donc un morphisme injectif de G dans SG .
i
i i
i
i
i
i
i
5.4 Actions de groupes
133
Dans le cas fini, un groupe de cardinal n est donc isomorphe à un sous-groupe du groupe symétrique Sn . En théorie, la connaissance des groupes S n et de leurs sousgroupes suffit à connaître tous les groupes finis. En pratique... il n’est pas si « pratique » que ça d’étudier le groupe S 4 à 4! = 24 éléments pour étudier les groupes à quatre éléments. Continuons avec l’action par conjugaison. Si a est dans G, alors l’application définie par g → a.g = aga−1 est non seulement une bijection de G dans G, mais aussi un morphisme de groupe donc un automorphisme de G. On dit que c’est un automorphisme intérieur de G. Si on examine un peu plus précisément comment fonctionnent ces automorphismes intérieurs, on obtient la proposition L’ensemble Int(G) des automorphismes intérieurs est un sous-groupe distingué du groupe Aut(G) des automorphismes de G. De plus, Int(G) G/Z(G) où Z(G) est le centre de G. Proposition 5.27.
Démonstration. Si on note ia l’application définie par i a (x) = axa−1 , on sait déjà que c’est une bijection de G, c’est un morphisme : ia (gg ) = agg a−1 = aga−1 ag a−1 = ia (g)ia (g ) De plus, l’application a → ia est un morphisme du G dans Aut(G) :
ia ◦ ib (g) = a(bgb−1 )a−1 = (ab)g(ab)−1 = iab (g) On en déduit que l’image de ce morphisme, ensemble des automorphismes intérieurs, est un sous-groupe de Aut(G). De plus, aga −1 = g ⇐⇒ ag = ga et le noyau de ce morphisme est donc Z(G), le théorème d’isomorphisme donne Int(G) G/Z(G). Enfin, si φ est un automorphisme de G
φ ◦ ia ◦ φ−1 = iφ(a)
© Dunod. La photocopie non autorisée est un délit.
et donc Int(G) Aut(G).
Une application importante concerne les groupes finis de cardinal p n , que l’on appelle p-groupes. Théorème 5.28. Le centre d’un p-groupe n’est jamais trivial.
Démonstration. On applique la formule des classes, en distinguant les orbites réduites à un élément : si on note Z(G) le centre de G, alors tout x de Z(G) vérifie gxg −1 = x pour tout g ; il est donc seul dans son orbite, et Card(G) = Card(Z(G)) + Card(Oxi ) i
où les orbites Oxi sont celles qui ont plus d’un élément ; elles ont pour cardinal celui de G/Gxi , qui est une puissance de p puisque G est de cardinal une puissance de p et que tout sous-groupe a pour cardinal une puissance de p. On en déduit que le cardinal du centre est divisible par p, et donc que ce centre contient un autre élément que l’élément neutre (en réalité donc, il contient au moins p éléments).
i
i i
i
i
i
i
i
5 • Groupes
134
En particulier un groupe de cardinal p n (n > 1) n’est jamais simple : il a au moins un sous-groupe distingué, son centre. Exercice 5.15. Soit dans Sn un k -cycle σ . Montrer que l’ensemble des conjugués de
σ est l’ensemble des k-cycles. Généraliser à l’étude des conjugués d’une permutation quelconque. Combien y a-t-il de classes de conjugaison dans S n pour n = 3, 4, 5... ? Exercice 5.16. Un groupe G agit sur un ensemble X . Montrer que si x et y sont dans
la même orbite, alors leurs stabilisateurs sont conjugués. Exercice 5.17. On dit qu’une action est simplement transitive si
∀x ∈ X, ∀y ∈ X, ∃!g ∈ G,
y = g.x
Montrer que si l’action est fidèle, transitive et si G est commutatif, alors l’action est simplement transitive. On rencontrera des actions simplement transitives dans les chapitres de géométrie.
5.5 THÉORÈMES DE SYLOW Les théorèmes de Sylow font partie des théorèmes les plus célèbres de la théorie des groupes finis ; leur importance est due à ce qu’il s’agit de théorèmes généraux, qui s’appliquent à n’importe quel groupe fini, et affirment l’existence de sous-groupes dont l’ordre est une puissance d’un nombre premier. C’est une réponse partielle au problème soulevé par le théorème de Lagrange : si n est le cardinal d’un groupe et si d est un diviseur de n, existe-t-il un sous-groupe de G de cardinal d ? Mais c’est surtout un premier pas vers la classification des groupes finis. Cette classification est maintenant achevée, plus de cent ans après la démonstration des théorèmes de Sylow.
5.5.1. Conjugués d’un sous-groupe Si G est un groupe, il agit sur l’ensemble de ses sous-groupes par conjugaison. Les conjugués d’un sous-groupe H sont de la forme gHg −1 où g est dans G. Ils sont isomorphes à H puisque tout automorphisme intérieur est.. un automorphisme. Et un sous-groupe est distingué dans G s’il coïncide avec tous ses conjugués, il est seul dans son orbite. On peut compléter ces observations par la proposition : Si H est un sous-groupe de G, l’ensemble des g tels que gHg−1 = H est un sous-groupe de G contenant H , on l’appelle normalisateur de H dans G, et on le note NG (H). Le nombre des conjugués de H est égal à l’indice de son normalisateur. Proposition 5.29.
i
i i
i
i
i
i
i
5.5 Théorèmes de Sylow
135
Démonstration. On utilise l’action par conjugaison de G sur l’ensemble des sousgroupes de G : le normalisateur de H est le stabilisateur de H pour cette action, c’est donc un sous-groupe de G et il contient bien sûr H . Le cardinal de l’ensemble des conjugués de H , c’est-à-dire de son orbite, est l’indice du normalisateur. On a également H NG (H) G, et si H est distingué dans G, c’est que N G (H) = G. 5.5.2. Les théorèmes de Sylow Nous allons les rassembler en un seul énoncé : Théorème 5.30. Soit G un groupe fini de cardinal n. On suppose que p est un nombre premier diviseur de n et on pose n = p α m où m ∧ p = 1.
• G admet des sous-groupes d’ordre p α , que l’on appelle p-Sylow de G. • Tout sous-groupe de G d’ordre d’ordre une puissance de p (plus rapidement tout p-sous-groupe de G) est inclus dans un p-Sylow. Tous les p-Sylow de G sont conjugués. • Le nombre s des p-Sylow de G vérifie : s ≡ 1 (mod p) et s | m.
Démonstration.
© Dunod. La photocopie non autorisée est un délit.
• Soit X l’ensemble des sous-ensembles de G ayant p α éléments. Le groupe G agit sur X par translation à gauche. Le cardinal de X n’est pas divisible par p. Une façon de le voir est de l’écrire ainsi : α pα m − pα + 1 p m pα m pα m − 1 . . . = pα pα − 1 1 pα et chaque fraction se simplifie : pour la première par p α , mais pα m − i ≡ pα − i (mod pα ), donc les autres fractions se simplifient par la même puissance de p, de sorte que le coefficient restant est un entier non divisible par p. Comme les orbites forment une partition de X , il existe au moins une orbite dont le cardinal n’est pas divisible par p. Soit O une telle orbite. Si X est un élément de O, il est formé de pα éléments du groupe G. Sous l’action, son stabilisateur S est un sous-groupe de G dont l’indice n’est pas divisible par p (c’est le cardinal de O ) ; le cardinal de S est donc de la forme p α m où m est un diviseur de m. On va montrer que S est un p-Sylow de G. Considérons en effet X . C’est un ensemble de p α éléments de G, x1 , . . . , xpα . Et si g ∈ S , on a gX = X donc gx1 = xi soit g = xi x−1 1 , où l’indice i est entre 1 et pα . Il y a donc au maximum p α possibilités pour g, donc le cardinal de S est inférieur ou égal à p α . Compte-tenu de ce qui précède, ce cardinal est égal à pα , on a obtenu un p-Sylow. • Soit maintenant H un groupe dont le cardinal est une puissance de p. On peut considérer l’action de H sur l’ensemble G/S , définie par h.gS = (hg)S . Dans cette action, les orbites ont pour cardinal une puissance de p mais G/S est de cardinal m, non divisible par p. Il y a donc au moins une orbite ayant un seul élément, disons gS . On a donc, pour tout h ∈ H , hgS = gS , et donc H ⊂ gSg −1 .
i
i i
i
i
i
i
i
136
5 • Groupes
Tout p-groupe est inclus dans un conjugué du p-Sylow S . En particulier, tout pSylow est un conjugué de S . • Commençons par la remarque : d’après la question précédente, si un p-Sylow d’un groupe est distingué dans ce groupe, il est le seul p-Sylow. Faisons ensuit agir S sur l’ensemble des p-Sylow de G, par conjugaison : les orbites ont encore comme cardinal une puissance de p, et S est seul dans son orbite. Mais si S est un autre pSylow seul dans son orbite, xS x−1 = S pour tout x de S , donc S est un p-Sylow du normalisateur de S , d’après la remarque, S = S . L’ensemble des p-Sylow est donc réunion d’orbites dont une a un seul élément, les autres ont pour cardinal une puissance de p, on a donc s ≡ 1 (mod p). Par ailleurs, le nombre des p-Sylow est donc le nombre des conjugués de S . C’est donc l’indice du normalisateur de S , et c’est donc un diviseur du cardinal de G, et donc c’est un diviseur de m.
La démonstration est un peu délicate... Mais le résultat est important : au vu du seul cardinal d’un groupe, on peut faire certaines déductions sur ses éventuels sousgroupes. Donnons quelques exemples simples : • Soit G un groupe ayant 42 éléments. Alors il admet au moins un sous-groupe distingué. En effet, G admet un 7-Sylow. Le nombre de ses conjugués, qui sont les éventuels autres p-Sylow est un diviseur de 6 qui est congru à 1 modulo 7, c’est 1. Ce 7-Sylow est donc distingué dans G. • Le groupe Z/24Z × Z/10Z n’a qu’un seul sous-groupe à 16 éléments. En effet, un 2-Sylow a 16 éléments, et puisque le groupe est commutatif, il coïncide avec ses conjugués, il n’y a pas d’autre 2-Sylow.
Exercice 5.18. Vérifier que le normalisateur de H est le plus grand groupe dans lequel
H est distingué. Chercher le normalisateur des sous-groupes à quatre éléments et à deux éléments du groupe diédral D 8 (cf. exercice 5.5). Si deux sous-groupes d’un groupe G sont isomorphes, sont-ils conjugués ?
Exercice 5.19. Chercher les 2-Sylow de S 4 .
Exercice 5.20. Montrer que si p divise le cardinal de G, alors il existe au moins un élément d’ordre p (c’est le théorème de Cauchy).
i
i i
i
i
i
i
i
Exercices
137
EXERCICES
Exercice 5.21. Décrire l’ensemble des morphismes de C n dans lui-même ; lesquels sont des isomorphismes ?
Exercice 5.22. On note H8 le groupe engendré par les matrices
a=
0 −1 1 0
et
b=
0 i i 0
Montrer qu’il a huit éléments et déterminer ses sous-groupes. Vérifier qu’il n’est pas isomorphe au groupe diédral D 8 . On l’appelle groupe quaternionique.
Exercice 5.23. Soit G un groupe fini dont tous les éléments (hormis le neutre) sont d’ordre p premier. Démontrer que G est isomorphe au produit direct de groupes cycliques d’ordre p. On montrera que G est muni d’une structure d’espace vectoriel sur le corps Fp .
Exercice 5.24.
(1) Soit G un groupe, H un sous-groupe, On considère l’action de H sur G/H définie par
© Dunod. La photocopie non autorisée est un délit.
h.gH = hgH Montrer que le noyau de cette action est le plus grand sous-groupe distingué de G inclus dans H . (2) On suppose que G est fini et que p le plus petit entier divisant le cardinal de G. On suppose qu’il existe H sous-groupe de G d’indice p. Montrer que H est distingué dans G. (3) Démontrer directement que si H est d’indice 2 dans G alors H est distingué dans G.
Exercice 5.25. Montrer que si G est un groupe fini de cardinal p α m où p est premier
et m ∧ p = 1, alors il existe un sous-groupe d’ordre p β pour tout entier β α.
i
i i
i
i
i
i
i
5 • Groupes
138
PROBLÈMES Les corrigés de ces problèmes sont disponibles sur le site de Dunod : www.dunod.com.
5.1. PROBLÈME Soit G un groupe. Si x et y sont des éléments de G, on appelle commutateur de x et de y l’élément xyx−1 y −1 que l’on note [x, y]. Le nom de cet élément s’éclaircit si on remarque que [x, y] = e ⇐⇒ xy = yx Le but de ce problème est d’étudier certaines propriétés des commutateurs. On appelle groupe dérivé le sous-groupe de G engendré par les commutateurs. On le note G . (1) Montrer que le conjugué d’un commutateur est un commutateur. En déduire que G est distingué dans G. (2) Soit H distingué dans G. Montrer que G/H est commutatif si et seulement si H contient G . (3) D’après la question précédente, G/G est le plus « grand » quotient commutatif de G. On l’appelle l’abélianisé de G. Déterminer le groupe dérivé de S n . Déterminer l’abélianisé du groupe diédral D 8 , du groupe quaternionique. (4) Montrer que tout sous-groupe H vérifiant G H G est distingué dans G.
5.2. PROBLÈME Le groupe symétrique S n est le groupe des permutations de I n = {1, 2, . . . , n} dans lui-même. Nous allons retrouver des résultats connus sur ce groupe symétrique en utilisant les idées de style « action de groupe ». (1) Soit σ ∈ Sn . Le groupe σ agit naturellement sur I n . on dit que σ est un r -cycle si il y a une orbite de cardinal r , (que l’on appelle support de σ ) et si toutes les autres orbites sont de cardinal 1. Montrer que les éléments du support peuvent être ordonnés en une suite (a i )i=1 à r telle que
σ(ai ) = ai+1 pour i < r, σ(ar ) = a1 On écrit alors σ = (a1 , a2 , . . . , ar ). (2) Montrer que deux cycles de supports disjoints commutent, et que toute permutation se décompose de façon unique en produit de cycles de support disjoints. (3) On suppose que σ = c1 c2 . . . ck où ci est un ri -cycle, les supports étant disjoints. Montrer que l’ordre de σ est le p.p.c.m. des r i . (4) Si σ est une permutation quelconque, on note (σ) = (−1) n−k , où k est le nombre total des orbites de l’action de σ sur I n . Ce nombre est la signature de σ . Calculer la signature d’un r -cycle.
i
i i
i
i
i
i
i
Solutions des exercices
139
(5) On rappelle qu’une transposition τ = (i, j) est un 2-cycle. Montrer qu’un r cycle est composé de r transpositions, et donc que les transpositions engendrent le groupe Sn . (6) En déduire que la signature est un morphisme de S n dans le groupe multiplicatif {1, −1}. Le noyau de ce morphisme est le groupe alterné A n des permutations paires. (7) Y a-t-il d’autres morphismes de S n dans le groupe multiplicatif {1, −1} ?
SOLUTIONS DES EXERCICES
Solution 5.1. Soit G un groupe d’ordre p, premier et x ∈ G, différent du neutre. Alors x est un sous-groupe de G, non réduit au neutre et d’ordre diviseur de p : cet ordre est donc égal à p et x est un générateur de G, qui est donc cyclique. Il existe à isomorphisme près, un seul groupe d’ordre p, le groupe cyclique C p . Cette situation est assez exceptionnelle : il existe par exemple une quinzaine de groupes d’ordre 24, un seul d’ordre 15 ou 33, des centaines de milliers d’ordre 512, à isomorphisme près, bien sûr.
Solution 5.2. Commençons par observer que :
∀(h, h ) ∈ H 2 , hh ∈ H ⇐⇒ HH ⊂ H et
© Dunod. La photocopie non autorisée est un délit.
∀h ∈ H, h−1 ∈ H ⇐⇒ H −1 ⊂ H donc, si HH = H et H −1 = H , alors H est un sous-groupe de G. Réciproquement, si H est un sous-groupe de G, on a donc HH ⊂ H , mais comme 1 G ∈ H , h = 1G h implique que H ⊂ HH . Par ailleurs, H −1 ⊂ H , mais h = (h−1 )−1 prouve que H ⊂ H −1 lorsque H est un sous-groupe de G.
Commençons par observer que dans un groupe G, l’application φ : x → x−1 est bien définie et bijective : son application réciproque est elle-même car (x−1 )−1 = x. Supposons G commutatif : (xy)−1 = y −1 x−1 = x−1 y −1 , pour tous x et y . Cela s’écrit φ(xy) = φ(x)φ(y), et φ est bien un morphisme. La réciproque résulte du même argument : Solution 5.3.
xy = φ(x−1 )φ(y −1 ) = φ(x−1 y −1 ) = φ((yx)−1 ) = yx
i
i i
i
i
i
i
i
5 • Groupes
140
Solution 5.4. Si x ∈ G est d’ordre p et si φ est un morphisme de source G, alors
φ(x)p = φ(xp ) = φ(eG ) = eH . On en déduit que φ(x) est d’ordre fini, diviseur de p. Mais si φ est injectif, φ(x)m = eH ⇒ φ(xm ) = φ(eG ) ⇒ xm = eG prouve qu’alors l’ordre de φ(x) est un multiple de p : un morphisme injectif conserve l’ordre des éléments. Même type de résultat si x est d’ordre infini.
Solution 5.5. Un calcul simple montre que a est d’ordre 4, et que b est d’ordre 2. Par ailleurs, ab = ba3 , a2 b = ba2 , a3 b = ba, ces trois matrices étant distinctes. Ces formules montrent également que tous les produits successifs de puissances de a par des puissances de b se ramènent à huit éléments distincts :
D8 = {e, a, a2 , a3 , b, ab, a2 b, a3 b} Les quatre premiers éléments forment un groupe cyclique, qui contient un sous-groupe d’ordre 2, {e, b2 } ; les quatre autres éléments sont d’ordre 2, ils engendrent chacun un groupe d’ordre 2. On peut se demander s’il existe d’autres sous-groupes : si c’est le cas, ce sont des groupes non cycliques, d’ordre diviseur strict de huit : ce ne peut être que des groupes d’ordre 4. On constate qu’il y en a 2, a 2 , b et a2 , ab. Ces groupes sont isomorphes à C2 × C2 (voir le paragraphe suivant). L’étude du groupe diédral est facilitée quand on en fait une interprétation géométrique : il est isomorphe au groupe des isométries qui conservent un carré.
Solution 5.6. Le centre n’est jamais vide car il contient toujours l’élément neutre. Si
z et z sont dans le centre de G, alors, pour tout x de G :
(zz )x = z(z x) = z(xz ) = (zx)z = x(zz ) et
z −1 x = (x−1 z)−1 = (zx−1 )−1 = xz −1 donc Z(G) est un sous-groupe de G. De plus, xzx −1 = z donc Z(G) est distingué dans G. Le centre d’un groupe est une sorte de mesure de sa commutativité, par exemple, si Z(G) = G, alors G est commutatif. Il existe des groupes pour lesquels le centre se réduit au neutre, c’est le cas de S n , pour n 3. Solution 5.7. Rappelons que A4 est le groupe des permutations paires de 4 élé-
ments. Il contient les doubles transpositions u = (1, 2)(3, 4), v = (1, 3)(2, 4) et w = (1, 4)(2, 3). Avec le neutre, ces quatre doubles transpositions forment un groupe, V , qui est distingué dans A4 : on vérifie en effet que, si σ est une permutation,
σ ◦ (1, 2)(3, 4) ◦ σ −1 = (σ(1), σ(2))(σ(3), σ(4))
i
i i
i
i
i
i
i
Solutions des exercices
141
De plus, comme V est commutatif, son sous-groupe u est distingué dans V . Mais u n’est pas distingué dans A 4 , il suffit de calculer le conjugué de u par (1, 2, 3), par exemple. La relation n’est pas transitive, alors que c’est le cas de la relation (est un sous-groupe).
Solution 5.8. On suppose que H et K sont des sous-groupes et que HK = KH . Alors HKHK = HHKK = HK et (HK)−1 = K −1 H −1 = KH = HK . Donc HK est un sous-groupe. Supposons maintenant que H , K et HK sont des sous-groupes de G. Alors
HK = (HK)−1 = K −1 H −1 = KH On a bien prouvé HK = KH . Si par exemple H est distingué dans G, alors, quelque soient h et k dans H et K respectivement, khk −1 = h ∈ H et KH ⊂ HK . On a aussi k −1 hk = h ∈ H et HK ⊂ KH . On peut aussi utiliser que HK est la réunion des classes à droites modulo H , et KH est la réunion des classes à gauche. Solution 5.9. On a d’abord H = a = {e, a, a2 , a3 } et K = b = {e, b}. L’étude
faite de ce groupe dans l’exercice 5.5 permet de vérifier facilement les propriétés indiquées. Pourquoi G n’est-il pas isomorphe au produit direct de H par K ? On peut argumenter en disant que K n’est pas distingué dans G où, plus rapidement, que H et K étant commutatifs, on vérifie immédiatement que leur produit direct est commutatif. On peut trouver dans l’ensemble H × K une structure de groupe telle que ce groupe soit isomorphe à G : voir la notion de produit semi-direct, par exemple dans [6].
© Dunod. La photocopie non autorisée est un délit.
Solution 5.10. C’est une simple application des idées de la démonstration du théo-
rème 5.14. Si x est d’ordre 30 et y d’ordre 12, le p.p.c.m. est 60 ; mais 60 = 15 × 4 donc x2 qui est d’ordre 15 et y 3 qui est d’ordre 4 commutent et ont des ordres premiers entre eux, l’ordre de x2 y 3 est 60.
Solution 5.11. D’après le théorème chinois :
C10 × C144 × C18 (C2 × C5 ) × (C16 × C9 ) × (C2 × C9 ) Les facteurs invariants sont 2,2,24 ,32 ,32 ,5 et les diviseurs élémentaires sont 2 | 6 | 720. Le groupe de départ est isomorphe à C 2 × C6 × C720 . Solution 5.12. Il suffit d’observer qu’il y a trois éléments d’ordre 2, (1, 0), (0, 1) et
(1, 1) et de prendre pour A, B et C les groupes engendrés par chacun de ces trois éléments : il n’y a pas unicité de la décomposition en sous-groupes primaires, mais unicité de la liste des facteurs invariants.
i
i i
i
i
i
i
i
5 • Groupes
142
Solution 5.13. 60 = 22 × 3 × 5, il y a seulement 2 types de groupes commutatifs à 60
éléments, celui de facteurs invariants 2 2 , 3, 5 et celui de facteurs invariants 2, 2, 3, 5. Le nombre de possibilités sera plus important s’il existe des exposants élevés dans la décomposition en facteurs premiers du cardinal du groupe. On pourra faire le lien avec le nombre de façons d’écrire un entier comme somme d’autres entiers... et se reporter à la situation analogue en algèbre linéaire.
Solution 5.14. Soit x et y dans Gn . Alors (xy)n = xn y n = e et (x−1 )n = (xn )−1 = e.
Gn est un sous-groupe, il est formé des éléments dont l’ordre est un diviseur de n. Si par exemple G = C∗ muni du produit, c’est le groupe cyclique des racines de l’unité. Supposons G commutatif fini. Pour que G n ne soit pas réduit au neutre, il est nécessaire que n et le cardinal de G ne soient pas premiers entre eux. De même, Gn est un sous-groupe de G, puisque si x et y en font partie, on a x = h n et y = k n donc xy = (hk)n et x−1 = (h−1 )n . Si G est un produit de groupes commutatifs, G = G 1 × . . . × Gk , alors la définition de la loi dans le groupe produit permet de vérifier facilement que Gn = G1,n × . . . × Gk,n et Gn = Gn1 × . . . × Gnk . Il suffit donc de déterminer Gn et Gn lorsque G est un groupe cyclique de la forme C pα . Mais les éléments de ce groupe sont d’ordre un diviseur de p α et, en notant x un générateur de C pα , on aura α−β Gpβ = xp .
Solution 5.15. Si σ = (i1 , i2 , . . . , ik ), alors on vérifie directement que
s ◦ σ ◦ s−1 = (s(i1 ), s(i2 ), . . . , s(ik )) Comme le choix de σ est libre, l’ensemble des conjugués d’un k-cycle est l’ensemble des k-cycles. On sait que toute permutation se décompose en cycles de supports disjoints : les mêmes calculs prouvent que l’ensemble des conjugués d’une permutation est l’ensemble des permutations qui ont même structure (type de décomposition en cycle). Ainsi, dans S3 il y a trois classes de conjugaison : celle qui contient l’identité, celle qui contient les transpositions, celle qui contient les 3-cycles, cela correspond aux décompositions en cycles du type :
3 = 1+1+1 = 1+2 = 3
et de même
4= 1+1+1+1 = 2+1+1+1 = 2+2= 3+1 permet de dire qu’il y a quatre classes de conjugaison, et plus généralement le nombre des classes de conjugaison de S n est le nombre des partitions de n, déjà rencontré.
i
i i
i
i
i
i
i
Solutions des exercices
143
Solution 5.16. Supposons que x et y sont dans la même orbite. Il existe g tel que
y = g.x. En notant Gx et Gy les stabilisateurs de x et de y , on a : g ∈ Gy ⇐⇒ g.y = y ⇐⇒ g.(h.x) = h.x ⇐⇒ h−1 gh ∈ Gx ⇐⇒ g ∈ hGx h−1 et donc Gy est un sous-groupe conjugué de G x . Tous les stabilisateurs sont conjugués, donc en particulier sont isomorphes. Solution 5.17. Soit x et y deux éléments quelconques de X . Comme l’action est transitive, il existe g ∈ G tel que : y = g.x. Supposons que y = h.x, et soit z quelconque ; il existe k tel que z = k.x et
g.z = (gk).x = (kg).x = k.y = (kh).x = (hk).x = h.z
© Dunod. La photocopie non autorisée est un délit.
(en utilisant la commutativité). On a donc, pour tout z , (h −1 g).z = z , et, puisque l’action est fidèle, h−1 g = e et en définitive h = g. L’action est simplement transitive. La situation décrite se rencontre fréquemment en géométrie, par exemple pour l’action par translation des vecteurs sur un espace affine. Solution 5.18. C’est pratiquement la définition : le normalisateur de H est l’ensemble de tous les g tels que gHg −1 = H , et donc H est inclus dans son normalisateur NG (H) et il y est distingué. Et tout groupe dans lequel H est normal doit être formé d’éléments g tels que gHg −1 = H , il est inclus dans le normalisateur. Si bien sûr le normalisateur est G, H est distingué dans G ; il arrive que H soit égal à son normalisateur, on parle de sous-groupe « autonormalisant ». Dans le cas du groupe diédral D8 , le groupe a est distingué dans D 8 : son normalisateur est donc lui-même. Les sous-groupes a2 , b et a2 , ab qui ont également quatre éléments sont également distingués, ils ont quatre éléments mais ne sont pas cycliques. Occupons-nous des sous-groupes à deux éléments. Le sous-groupe a 2 est le centre, il est distingué. Le sous-groupe b n’est pas distingué, et comme b ne commute qu’avec lui-même et le neutre, il est égal à son normalisateur. Il a donc quatre conjugués, lui-même et les trois derniers sous-groupes à 2 éléments, ab, a 2 b, a3 b. Si deux sous-groupes de G sont conjugués, alors ils sont isomorphes, puisque x → gxg−1 est un isomorphisme. Mais deux sous-groupes de G qui sont isomorphes ne sont pas forcément conjugués : l’exemple ci-dessus des sous-groupes à deux éléments du groupe diédral le prouve. Solution 5.19. Le groupe S4 a 24 éléments. Ses 2-Sylow ont donc 8 éléments, et d’après le théorème de Sylow, il y en a 1 ou 3. Les éléments d’un 2-Sylow sont d’ordre 1, 2 ou 4 (il n’y a pas d’élément d’ordre 8). Si par exemple on part d’un élément d’ordre 4 comme σ = (1, 2, 3, 4), on obtient un sous-groupe d’ordre 8 en prenant les composés avec un élément d’ordre 2 comme τ = (1, 3). On a alors τ στ = σ −1 et on peut vérifier que le groupe σ, τ est isomorphe au groupe diédral D 8 . On vérifiera qu’il y a d’autres Sylow (deux autres donc) construit sur le même modèle. Ces trois 2-Sylow sont autonormalisant (voir l’exercice précédent).
i
i i
i
i
i
i
i
5 • Groupes
144
Solution 5.20. Il suffit d’utiliser le théorème de Sylow : si p divise le cardinal de
G, il existe un p-Sylow S , qui est d’ordre pα. Tout élément x de S est d’ordre une puissance de p. Et dans le groupe (cyclique) engendré par x, il existe donc un élément d’ordre exactement p. (cf. la remarque à la fin du théorème 5.5). Cauchy n’a pas démontré son théorème à l’aide du théorème de Sylow, ne serait-ce que pour des raisons chronologiques... Par contre, certaines démonstrations du théorème de Sylow utilisent le théorème de Cauchy (qu’il faut donc démontrer autrement). Solution 5.21. Comme Cn est monogène, un morphisme est entièrement déterminé
si on se donne l’image du générateur x. On aura donc n morphismes φ k définis par x → xk et donc x → xk . De plus φk sera bijectif si xk engendre Cn , donc si k est premier à n. On vérifiera facilement que φ k → k est un morphisme de l’ensemble des φk (muni de la loi ◦, dans le groupe additif (Z/nZ, +). Et qu’alors l’ensemble des automorphismes de Cn est isomorphe à l’ensemble des inversibles de l’anneau Z/nZ. Solution 5.22. Il faut calculer... a est d’ordre 4, b2 = a2 , ba = a3 b et les éléments du
groupe engendré par a et b sont huit :
e, a, a2 , a3 , b, ab, a2 b, a3 b Ce groupe n’est pas isomorphe au groupe diédral car il a un seul élément d’ordre 2, a2 = b2 . Il a donc un seul sous-groupe d’ordre 2. On vérifiera que a, b et ab engendrent les trois groupes d’ordre 4 (qui sont donc cycliques). On l’appelle groupe quaternionique car il est relié au corps H des quaternions. Solution 5.23. Montrons que G peut être muni d’une structure d’espace vectoriel :
c’est un groupe commutatif pour la loi du groupe (que l’on notera additivement). Si k ∈ Fp (on rappelle que c’est le corps Z/pZ), on définit k.x = x + x + · · · + x avec k termes dans la somme. Cette définition est cohérente, puisque k.x = k .x si et seulement si k ≡ k (mod p), car x est d’ordre p. On vérifie alors facilement que G est un Fp -espace vectoriel. Comme il est fini, il est isomorphe à une puissance finie de Fp , en tant qu’espace vectoriel mais donc aussi en tant que groupe. Solution 5.24.
(1) h ∈ H est dans le noyau de l’action lorsque, pour tout g de G, hgH = gH ce qui équivaut à g −1 hg ∈ H , donc h ∈ gHg −1 . L’ensemble K des h est donc l’intersection des conjugués de H , c’est un sous-groupe distingué de H (car noyau d’un morphisme). Si K ⊂ H est un sous-groupe distingué de G, pour tout g de G on a gK g−1 = K ⊂ gHg−1 et donc K est inclus dans l’ensemble des conjugués de H . K contient donc tous les sous-groupes distingués de G qui sont inclus dans H . Il joue un rôle analogue à celui du normalisateur dans G de H .
i
i i
i
i
i
i
i
Solutions des exercices
145
(2) Soit K comme dans la question précédente. Soit φ le morphisme de G dans le groupe symétrique de G/H défini par l’action de translation à gauche. K est le noyau de ce morphisme et par le théorème d’isomorphisme G/K est isomorphe à un sous-groupe du groupe symétrique de G/H . Or ce groupe symétrique à pour cardinal p!, et G/K a pour ordre un diviseur du cardinal de G, c’est donc que G/K a pour ordre 1 (exclu car K est inclus dans H ), la seule solution est que G/K soit de cardinal p, que K soit égal à H et donc que H soit distingué dans G. (3) On peut appliquer le théorème précédent, mais il est plus rapide de remarquer que si H est d’indice 2 dans G, il y a seulement deux classes à gauche, H et une classe / H , et ces classes forment une partition de G. Mais comme de la forme xH , où x ∈ il y a seulement deux classes à droite, H et Hx, on a nécessairement xH = Hx ce pour tout x. Le sous-groupe H est distingué dans G.
Solution 5.25. Soit S un p-Sylow de G, de cardinal p n Un argument déjà utilisé : il
© Dunod. La photocopie non autorisée est un délit.
existe dans S un élément d’ordre p, car tout élément est d’ordre une puissance de p. Mais on peut utiliser le théorème qui dit que le centre de S (qui est un p-groupe) est non trivial. Il existe donc dans le centre un élément x d’ordre p. Puisque x est dans le centre, x est distingué dans S . Alors S/x est un groupe d’ordre p n−1 , l’hypothèse de récurrence montre qu’il a des sous-groupes d’ordre p β , qui sont les images de sousgroupes d’ordre pβ+1 , avec β est inférieur à α − 1. Le théorème est démontré.
i
i i
i
i
i
i
i
i
i i
i
i
i
i
i
Chapitre 6
Algèbre bilinéaire
Nous revenons à l’algèbre linéaire, et ce chapitre est consacré aux formes bilinéaires. Il s’agit donc d’associer à un couple de vecteurs un « scalaire » (c’est pour cela qu’on parle de « forme »). Comme cas particulier, nous retrouverons le produit scalaire de la géométrie. Dans tout le début du chapitre, on se place dans le cadre général d’un corps commutatif K , de caractéristique différente de 2.
© Dunod. La photocopie non autorisée est un délit.
6.1 FORMES BILINÉAIRES 6.1.1. Définitions Une forme bilinéaire sur un K -espace vectoriel E est une application φ de E ×E dans K qui vérifie les propriétés :
∀(x, x , y, y ) ∈ E 4 , ∀λ ∈ K,
φ(x + λx , y) = φ(x, y) + λφ(x , y) φ(x, y + λy ) = φ(x, y) + λφ(x, y )
Lorsque E est le corps K , les seules formes bilinéaires possibles sont données par φ(x, y) = axy . Dans l’espace vectoriel des fonctions continues sur [0, 1], l’application $1 (f, g) → 0 f (t)g(t) dt est une forme bilinéaire. Théorème 6.1. L’ensemble noté L 2 (E, K) des formes bilinéaires sur le K -espace
vectoriel E est un K -espace vectoriel. En dimension finie n, il est isomorphe à l’espace vectoriel Mn (K).
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
148
Démonstration. La structure d’espace vectoriel est celle qu’ont tous les ensembles d’applications à valeurs dans K . Si (e i )i∈I est une base de E , la bilinéarité implique qu’une forme bilinéaire φ est déterminée par les scalaires φ(e i , ej ). En dimension n, notons B = (e1 , e2 , . . . , en ) une base. La matrice A = (φ(ei , ej ))i,j ∈ Mn (K) suffit donc à déterminer φ. On la notera M B (φ), et on a immédiatement : MB (φ + λψ) = MB (φ) + λMB (ψ) Si on note alors X (resp. Y ) la matrice des coordonnées de x (resp. de y ) dans la base B , on aura : ⎛ ⎞ φ(x, y) = φ ⎝ xi ei , yj ej ⎠ = xi φ(ei , ej )yj = tXAY i
j
i,j
On a bien sûr décidé de considérer qu’une matrice 1 × 1 se confond avec un scalaire de K .
6.1.2. Rang À partir de ce paragraphe, nous nous limiterons au cas de la dimension finie. C’est dans le cours d’analyse que l’étude de la dimension infinie sera reprise. La bilinéarité d’une forme φ peut se formuler autrement. On définit les deux applications partielles :
φ(x, ·) : E −→ K y −→ φ(x, y)
et
φ(·, y) : E −→ K x −→ φ(x, y)
Alors φ est bilinéaire si, et seulement si ces deux applications partielles sont des formes linéaires, donc éléments du dual E ∗ . Et on peut alors introduire
Lφ : E −→ E ∗ x −→ φ(x, ·)
et
Rφ : E −→ E ∗ y −→ φ(·, y)
deux applications qui sont encore, grâce à la bilinéarité, des morphismes d’espaces vectoriels. Théorème 6.2. Lorsque E est de dimension finie, L φ et Rφ sont de même rang, que
l’on appelle rang de la forme bilinéaire φ. On dit que φ est non dégénérée si l’une des applications L φ ou Rφ est bijective 1.
Démonstration. Soit A la matrice de φ par rapport à une base B . Nous allons commencer par rechercher la matrice de L φ et de Rφ par rapport aux bases B et B ∗ (base duale) : Lφ (ej )(ei ) = φ(ej , ei ) et ce nombre est la i-ème coordonnée de Lφ (ej ) donc c’est le coefficient d’indice (i, j) de la matrice de L φ . De même, Rφ (ej )(ei ) = φ(ei , ej ). On en déduit que les matrices de L φ et de Rφ sont respectivement tA et A, d’où le résultat, car une matrice et sa transposée ont même rang. 1. Plus précisément, si l’une est bijective, l’autre l’est également.
i
i i
i
i
i
i
i
6.1 Formes bilinéaires
149
Une forme bilinéaire est donc non dégénérée lorsque sa matrice A est inversible. Les deux applications L φ et Rφ ont donc même rang, mais elles sont bien distinctes, en particulier leurs noyaux sont en général distincts.
6.1.3. Changements de base Si E est rapporté à la base B , et si φ est une forme bilinéaire de matrice A par rapport à cette base, quelle est la matrice A de φ lorsque on se place dans une base C ? Proposition 6.3. Si P est la matrice de passage de la base B à la base C , on a
A = tP AP (formule de changement de base pour les formes bilinéaires)
Démonstration. Si C = (ei ) alors, par définition de P = (pi,j ), ej = i pi,j ei et : φ(ej , ek ) = pi,j φ(ei , e )p,k = pj,i φ(ei , e )p,k i,
On a noté
pi,j
i,
les coefficients de la matrice
tP .
D’où le produit matriciel annoncé.
6.1.4. Matrice congruentes, formes congruentes Comme dans le cas des applications linéaires ou des endomorphismes, on peut maintenant se poser un problème de classification des formes bilinéaires. • Une forme bilinéaire est donnée : peut-on trouver une base dans laquelle l’écriture de la forme bilinéaire est particulièrement simple ? • Comment reconnaître si deux matrices représentent (par rapport à deux bases) la même forme bilinéaire ? • Quand deux formes bilinéaires ont-elles la même « signification » géométrique ?
© Dunod. La photocopie non autorisée est un délit.
Les trois questions sont liées, donnons des précisions de vocabulaire : Définition 6.4. Deux matrices symétriques (ou antisymétriques) A et A sont
congruentes s’il existe une matrice P de GL(n, K) telle que :
A = tP AP Autrement dit deux matrices congruentes représentent la même forme bilinéaire dans des bases différentes. Deux formes bilinéaires φ et φ sont congruentes s’il existe un automorphisme de E tel que : ∀x, y ∈ E, φ(x, y) = φ (u(x), u(y))
φ et φ sont congruentes lorsque leur matrice, par rapport à la même base, sont congruentes, et la congruence est une relation d’équivalence. On voit tout de suite que deux matrices congruentes ont même rang.
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
150
Pour continuer l’étude des formes bilinéaires, nous allons nous spécialiser dans deux cas particuliers essentiels, et c’est dans ces cas que l’on obtiendra des résultats de classification.
6.2 FORMES BILINÉAIRES SYMÉTRIQUES ET ANTISYMÉTRIQUES 6.2.1. Généralités Définition 6.5. Soit φ une forme bilinéaire. On dit que c’est une forme bilinéaire symétrique si
∀x, y ∈ E, φ(x, y) = φ(y, x) On dit que c’est une forme bilinéaire antisymétrique lorsque :
∀x, y ∈ E, φ(x, y) = −φ(y, x) Voici quelques exemples : • En dimension 1, (x, y) → xy est symétrique. La seule forme antisymétrique est constante nulle. • Dans l’espace vectoriel K 2 , ((x1 , y1 ), (x2 , y2 )) −→ a(x1 y2 − x2 y1 ) où a est un scalaire quelconque, est une forme antisymétrique. Les formes symétriques sont données par :
((x1 , x2 ), (y1 , y2 )) −→ ax1 y1 + b(x1 y2 + x2 y1 ) + cx2 y2 où a, b et c sont des scalaires. • Une forme bilinéaire est symétrique si sa matrice A dans n’importe quelle base est une matrice symétrique : A = tA. Elle est antisymétrique si sa matrice est antisymétrique, A = −tA. • Comme nous sommes en caractéristique différente de 2, on a l’équivalence :
∀x, y ∈ E, φ(x, y) = −φ(y, x) ⇐⇒ ∀x ∈ E, φ(x, x) = 0 Montrons la première implication :
φ(x, x) = −φ(x, x)
⇒
2φ(x, x) = 0
⇒
φ(x, x) = 0
en tenant compte de la caractéristique. Pour l’autre,
φ(x + y, x + y) = 0
⇐⇒ ⇐⇒
φ(x, x) + φ(x, y) + φ(y, x) + φ(y, y) = 0 φ(y, x) = −φ(x, y)
i
i i
i
i
i
i
i
6.2 Formes bilinéaires symétriques et antisymétriques
151
6.2.2. Noyau d’une forme bilinéaire symétrique ou antisymétrique Dans le cadre des formes bilinéaires symétriques ou antisymétriques,
φ(x, y) = 0 ⇐⇒ φ(y, x) = 0 et les applications Lφ et Rφ ont même noyau : Définition 6.6. Soit φ une forme bilinéaire symétrique ou antisymétrique. On
appelle noyau de φ le noyau commun de L φ et de Rφ :
Ker φ = {x ∈ E | ∀y ∈ E, φ(x, y) = 0} et une forme bilinéaire symétrique est non dégénérée si et seulement si son noyau est réduit au vecteur nul.
Remarques. • Dans le cas où φ est dégénérée, on peut introduire dans l’espace vectoriel quotient E/ Ker φ la forme bilinéaire φ définie par : φ(x, y) = φ(x, y)
Après avoir vérifié la cohérence de la définition, on montre que φ est non dégénérée. • Il est remarquable que dans le cas non dégénéré : L φ (ou Rφ ) permet de réaliser un isomorphisme entre E et son dual : toute forme linéaire f est représentée par un unique vecteur a tel que : ∀x ∈ E, f (x) = φ(a, x)
Voir par exemple la notion de gradient, ou le théorème de représentation de Riesz, en analyse.
© Dunod. La photocopie non autorisée est un délit.
6.2.3. Orthogonalité L’orthogonalité se définit comme dans le cas du produit scalaire de la géométrie élémentaire. Définition 6.7. Soit φ une forme bilinéaire symétrique ou antisymétrique sur
E . Alors : • Si φ(x, y) = 0, on dit que x est orthogonal à y , et on écrit parfois x ⊥ y . • Si F est inclus dans E , F ⊥ = {x ∈ E | ∀y ∈ F φ(x, y) = 0} est appelé l’orthogonal de F . La bilinéarité permet de prouver facilement que les orthogonaux sont des sousespaces vectoriels et on peut aussi remarquer que S ⊥ = (vect(S))⊥ .
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
152
Par ailleurs,
Ker φ = E ⊥ et donc on pourra dire qu’une forme est non dégénérée si et seulement si le vecteur nul est le seul qui est orthogonal à tous les autres. Donnons quelques propriétés de l’orthogonalité des sous-espaces. Théorème 6.8. Si F et G sont des sous-espaces vectoriels de E , alors on a :
• • • • •
F ⊂ G ⇒ G⊥ ⊂ F ⊥ F ⊂ (F ⊥ )⊥ (F + G)⊥ = F ⊥ ∩ G⊥ F ⊥ + G⊥ ⊂ (F ∩ G)⊥ dim F + dim F ⊥ = dim E + dim(F ∩ Ker φ)
Dans le cas où φ est non dégénérée, on a : • dim F + dim F ⊥ = dim E • F = (F ⊥ )⊥ • F ⊥ + G⊥ = (F ∩ G)⊥
Démonstration. • Soit x ∈ G⊥ quelconque, il est orthogonal à tout élément de G, en particulier aux éléments de F , il est donc dans F ⊥ . • Si x ∈ F et y ∈ F ⊥ , alors φ(x, y) = 0 peut s’interpréter comme x ∈ (F ⊥ )⊥ . • Une inclusion résulte de la première propriété démontrée : F ⊂ F + G, G ⊂ F + G ⇒ (F + G)⊥ ⊂ F ⊥ ∩ G⊥ Et si z ∈ F ⊥ ∩ G⊥ , alors z, f + g = z, f + z, g = 0 prouve l’autre inclusion. • On a encore, en utilisant la première propriété, F ⊥ ⊂ (F ∩ G)⊥ et G⊥ ⊂ (F ∩ G)⊥ et, comme (F ∩G)⊥ est un sous-espace vectoriel, le plus petit sous-espace vectoriel qui contient F ⊥ et G⊥ , c’est-à-dire F ⊥ + G⊥ , est inclus dans (F ∩ G)⊥ . • Soit (e1 , . . . , ek ) une base de F ∩Ker φ. On la complète en une base (e k+1 , . . . , ep ) de F . Alors un vecteur x est dans F ⊥ si et seulement si, pour tout i de k + 1 à p, φ(x, ei ) = 0, puisque φ(x, ei ) = 0 est automatique lorsque i k. Or ces p − k équations linéaires sont indépendantes, car : p i=k+1
λi φ(·, ei ) = 0 ⇒
p
λi ei ∈ Ker φ
i=k+1
Et donc les λi sont nuls. Donc x est dans F ⊥ si et seulement si x vérifie ces p − k équations indépendantes :
dim F ⊥ = dim E − (p − k) ⇒ dim F + dim F ⊥ = dim E + k = dim E + dim F ∩ Ker φ
i
i i
i
i
i
i
i
6.2 Formes bilinéaires symétriques et antisymétriques
153
Passons maintenant aux trois dernières affirmations. • Si φ est non dégénérée, Ker φ se réduit à {0} donc la formule précédente devient dim F + dim F ⊥ = dim E . • On a alors
dim(F ⊥ )⊥ = dim E − dim F ⊥ = dim E − (dim E − dim F ) = dim F compte-tenu de l’inclusion F ⊂ (F ⊥ )⊥ , on obtient l’égalité F = (F ⊥ )⊥ . • Appliquons la relation (F + G)⊥ = F ⊥ ∩ G⊥ à F ⊥ et à G⊥ :
(F ⊥ + G⊥ )⊥ = F ∩ G ⇒ F ⊥ + G⊥ = (F ∩ G)⊥ Dans certains cas, les résultats précédents se simplifient un peu. Définition 6.9. Soit φ une forme bilinéaire symétrique ou antisymétrique. Un
vecteur x est isotrope lorsque φ(x, x) = 0. Un sous-espace F de E est non isotrope si la restriction de φ à F est non dégénérée. Il est isotrope si cette restriction est dégénérée, et totalement isotrope si elle est nulle. Contrairement au cas des endomorphismes, on peut toujours définir la restriction d’une forme bilinéaire à un sous-espace. Et il faut bien noter que la restriction d’une forme non dégénérée peut être dégénérée. Exemple : si
φ((x1 , x2 ), (y1 , y2 )) = x1 y1 − x2 y2 la restriction aux droites vect(1, 1) et vect(1, −1) est nulle. Ces droites sont donc totalement isotropes, elle sont engendrées par des vecteurs isotropes. Remarquons également que, en reprenant la définition :
© Dunod. La photocopie non autorisée est un délit.
Ker φ|F = F ∩ F ⊥ et donc qu’on peut réécrire :
F est non isotrope ⇐⇒ F ∩ F ⊥ = {0} F est totalement isotrope ⇐⇒ F ⊂ F ⊥ Dans le cas d’un sous-espace non isotrope, on a donc : Proposition 6.10. F est non isotrope si et seulement si E = F ⊕ F ⊥ .
Démonstration. Si F est non isotrope, F ∩Ker φ ⊂ F ∩F ⊥ = {0}, et on a donc dim F +dim F ⊥ = dim E . On en déduit que F et son orthogonal sont supplémentaires. La réciproque est immédiate, puisque le fait qu’il y ait somme directe implique F ∩ F ⊥ = {0}.
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
154
Exercice 6.1. Montrer que LS 2 (E), ensemble des formes bilinéaires symétriques et LA2 (E), ensemble des formes bilinéaires antisymétriques sont deux sous-espaces supplémentaires de L 2 (E). Si la dimension de E est n, donner leur dimension.
Exercice 6.2. Démontrer que si φ est une forme bilinéaire non dégénérée, avec E de dimension supérieure ou égale à 2, telle que :
∀x ∈ E, ∀y ∈ E, φ(x, y) = 0 ⇐⇒ φ(y, x) = 0 alors φ est symétrique ou antisymétrique.
⎛ ⎞ 1 0 0 Exercice 6.3. On considère la forme φ définie sur R 3 par la matrice ⎝0 1 0 ⎠. 0 0 −1 Déterminer l’orthogonal d’une droite vectorielle quelconque. Préciser quelles droites sont isotropes. Déterminer de même l’orthogonal d’un plan, et décrire les différentes possibilités.
Exercice 6.4. Montrer qu’en dimension impaire, une forme bilinéaire antisymétrique
est toujours dégénérée.
Exercice 6.5. Montrer, par un contre-exemple, que l’inclusion F ⊥ + G⊥ ⊂ (F ∩ G)⊥
peut être stricte. Soit F une droite vectorielle. Montrer que si elle est non isotrope, alors elle est totalement isotrope. Donner un exemple de sous-espace qui est non isotrope sans être totalement isotrope. Montrer qu’un sous-espace non isotrope contient un sous-espace totalement isotrope (non réduit à {0}). Est-ce que la réciproque est vraie ?
i
i i
i
i
i
i
i
6.3 Formes quadratiques
155
6.3 FORMES QUADRATIQUES. CLASSIFICATIONS DES FORMES BILINÉAIRES SYMÉTRIQUES RÉELLES ET COMPLEXES 6.3.1. Forme quadratique, cône isotrope Nous allons dans ce paragraphe, nous limiter aux formes bilinéaires symétriques sur un corps K , et bien sûr encore à la dimension finie. L’étude de l’application x → φ(x, x) est essentielle. Définition 6.11. On appelle forme quadratique associée à la forme bilinéaire symétrique φ l’application q : E → K définie par q(x) = φ(x, x). Pour tout vecteur x et tout scalaire λ, q(λx) = λ 2 q(x) et q(0) = 0.
Il est remarquable que la donnée de la forme quadratique suffise pour déterminer la forme bilinéaire symétrique φ, c’est ce qu’on appelle la polarisation : Proposition 6.12.
1 φ(x, y) = (q(x + y) − q(x) − q(y)) 2
Démonstration. Calcul immédiat : q(x + y) = φ(x + y, x + y) = q(x) + 2φ(x, y) + q(y) Par contre, toute application q de E dans K qui vérifie q(λx) = λ 2 q(x) n’est pas une forme quadratique ; voir par exemple q défini dans R par q(x) = |x|.
© Dunod. La photocopie non autorisée est un délit.
L’ensemble des vecteurs qui annulent la forme quadratique q n’est pas, en général, un sous-espace vectoriel. Il a cependant la propriété remarquable d’être stable par le produit par un scalaire. On dit que c’est un cône. Définition 6.13. Un vecteur x est dit isotrope si q(x) = 0. L’ensemble des
vecteurs isotropes s’appelle le cône isotrope de q (ou de φ). Il contient le noyau de φ. On le notera C(q). L’inclusion du noyau dans le cône peut s’exprimer ainsi : les vecteurs du noyau sont orthogonaux à tous les vecteurs, les vecteurs du cône sont orthogonaux à eux-mêmes. Il arrive que le cône isotrope ne contienne que le vecteur nul, on le verra dans le cas réel pour la forme quadratique associée à un produit scalaire, mais cela peut se produire dans d’autres cas. Définition 6.14. Une forme quadratique (et la forme bilinéaire associée) est
définie si le cône isotrope est réduit au vecteur nul.
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
156
Et bien sûr, si q est définie, elle est non dégénérée. Qu’est-ce que « réduire » une forme bilinéaire symétrique ? L’idée est, comme pour les endomorphismes, de se ramener à une matrice diagonale. Définition 6.15. On dit qu’une base B = (ei )1in est orthogonale si
∀(i, j),
i = j ⇒ φ(ei , ej ) = 0
Cela équivaut à dire que la matrice de φ par rapport à une base orthogonale est diagonale.
Théorème 6.16. Toute forme bilinéaire symétrique φ admet une base orthogonale.
Démonstration. Si φ est nulle, toute base est orthogonale. Si φ n’est pas nulle, la proposition 6.12 prouve que la forme quadratique q n’est pas identiquement nulle non plus, il existe e1 tel que q(e1 ) = 0. Alors la droite engendrée par e 1 est non isotrope, et F = e⊥ 1 est un supplémentaire de vect(e 1 ). On répète le même argument avec la restriction de φ à F . Remarque : Ce théorème permet de montrer que toute matrice symétrique est congruente à une matrice diagonale. Il est cependant moins profond que tout les théorèmes qui concerne les endomorphismes. En tout cas, il est obtenu très facilement... 6.3.2. Classification, théorème de Sylvester On a donc obtenu une base telle que la matrice de φ soit diagonale. Remarquons qu’alors les termes diagonaux de la matrice de φ sont les q(e i ). Comme q(λe) = λ2 q(e), on peut aller plus loin dans la réduction, par exemple dans le cas d’un corps algébriquement clos comme C. Théorème 6.17. Soit φ une forme bilinéaire symétrique d’un C-espace vectoriel, q
la forme quadratique associée. Il existe une base orthogonale (e i ) telle que, si r est le rang de φ,
q(ei ) = 1, pour 1 i r,
q(ei ) = 0, pour i > r
Les formes bilinéaires symétriques complexes sont classées par leur rang.
Démonstration. On part du théorème précédent pour dire que φ admet une base orthogonale (ei ). Comme dans C, tout complexe est un carré, on peut remplacer chacun des ei qui n’est pas isotrope par un vecteur colinéaire e i tel que q(ei ) = 1. Quitte à renuméroter, on obtient la forme indiquée et le nombre des vecteurs de base pour lesquels q(ei ) = 1 est une constante puisque c’est le rang de φ. Résultat supplémentaire, on a prouvé que toutes les formes bilinéaires symétriques de même rang sont équivalentes ; il y a donc n+1 classes d’équivalences de formes bilinéaires symétriques, puisque deux formes de rangs différents ne peuvent être congruentes.
i
i i
i
i
i
i
i
6.3 Formes quadratiques
157
Dans le cas réel, la forme quadratique prend des valeurs positives ou négatives : si elle ne prend que des valeurs positives sur une base orthogonale, alors elle ne prend que des valeurs positives (utiliser la matrice). Dans les cas intermédiaires, on peut classer les formes bilinéaires symétriques sur R par le théorème suivant : Théorème 6.18.
Théorème d’inertie de Sylvester. Pour toute forme bilinéaire symétrique sur un R-espace vectoriel, il existe une base orthogonale (e i ) et un entier s inférieur au rang s de φ ⎧ ⎪ ⎨q(ei ) = 1 pour 1 i s q(ei ) = −1 pour s + 1 i r ⎪ ⎩q(e ) = 0 pour i > r i De plus, les entiers s et p = r−s ne dépendent que de φ, et non de la base orthogonale trouvée. Le couple (s, p) s’appelle la signature de la forme bilinéaire symétrique réelle. Les formes bilinéaires symétriques réelles sont classées par leur signature.
Démonstration. La première partie du théorème est immédiate. Partant d’une base orthogonale (ei ), comme les q(ei ) sont des réels positifs, négatifs ou nuls, on peut les multiplier par des constantes adéquates. Il reste à démontrer que la signature ne dépend que de φ et non de la base. Supposons donc que (ei ) et (ei ) sont deux bases orthogonales telles que q(ei ) = 1 pour 1 i s,
© Dunod. La photocopie non autorisée est un délit.
q(ei ) = 1 pour 1 i s ,
q(ei ) = −1 pour s < i s + p = r q(ei ) = −1 pour s < i s + p = r
On a utilisé que le rang est constant. Soit alors F + = vect(e1 , . . . , es ) et G− = vect(es , . . . , en ). Alors F+ ∩ G− = {0} car la restriction de q à F+ ne peut prendre que des valeurs strictement positives pour un vecteur non nul, et pour G− que des valeurs négatives ou nulles. On en déduit que ces deux sous-espaces sont en somme directe, et donc que s + (n − s ) n, soit s s . En échangeant les rôles, s s, d’où s = s et p = p (puisque s + p = s + p = r ). La classification des formes bilinéaires symétriques n’est pas toujours aussi simple : dans le cas de Q en particulier, elle conduit à des problèmes d’arithmétique assez fins.
6.3.3. Réduction de Gauss d’une forme quadratique La méthode de Gauss permet, dans le cas d’une forme bilinéaire symétrique, d’obtenir de façon automatique (plus précisément algorithmique) une base orthogonale. Elle n’est que la systématisation de la méthode dite de la « forme canonique » pour les polynômes du second degré.
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
158
Théorème 6.19. Réduction de Gauss. Si q est une forme quadratique de rang r sur
un corps K , il existe r formes linéaires indépendantes ( i ) telles que : r q(x) = λi i (x)2 i=1
où les λi sont dans K .
Démonstration. Donnons une description de la méthode. Notons (x i ) les coordonnées d’un vecteur x, on suppose que q(x) est exprimée en fonction des coordonnées, lesquelles seront éventuellement renumérotées. • Si un terme de la forme x2i apparaît avec un coefficient a non nul, on peut supposer que c’est pour l’indice 1, et on met a en facteur dans tous les termes de q(x) qui contiennent x1 ; on peut alors faire apparaître le carré d’une première forme linéaire : 2 b c 2 a(x1 + bx1 x2 + cx1 x3 + . . .) = a x1 + x2 + x3 + . . . + ψ(x) 2 2 où ψ est une forme quadratique qui ne contient pas x 1 : il suffit de corriger en tenant compte des termes en x 2 , x3 , ... • Si q(x) ne contient aucun terme en x 2i et si, par exemple, x1 x2 apparaît avec un coefficient a non nul, on met a en facteur dans tous les termes qui contiennent x 1 et x2 et on écrit :
a(x1 + bx3 + . . .)(x2 + cx3 + . . .) + ψ(x) = a1 (x)2 (x) + ψ(x) où ψ est une forme quadratique qui ne contient ni x 1 , ni x2 , et il suffit alors d’écrire : 1 (1 (x) + 2 (x))2 − (1 (x) − 2 (x))2 1 (x)2 (x) = 4 et d’observer que les deux formes linéaires sont indépendantes. On répète le processus, et toutes les formes ainsi obtenues sont indépendantes, puisque ψ ne contient plus x1 . On peut alors se placer dans une base telle que les r premières coordonnées soient X1 = 1 (x),. . . , Xr = r (x). On posera ensuite Xr+1 = xr+1 . . . et la matrice de q dans la nouvelle base ainsi définie est diagonale, ses r premiers coefficients étant non nuls. Le nombre r des formes linéaires est bien égal au rang de la forme quadratique. Exercice 6.6. Donner la signature des formes quadratiques suivantes :
(1) q(x, y, z) = x2 + y 2 + z 2 − 2(xy + yz + zx) dans R3 . (2) q(x) = x1 x2 + x2 x3 + . . . + xn x1 , dans Rn , avec x = (x1 , x2 , . . . , xn ). Exercice 6.7. Soit φ une forme bilinéaire symétrique dans un R-espace vectoriel. Montrer que la forme quadratique a un signe constant si, et seulement si, le cône isotrope coïncide avec le noyau.
i
i i
i
i
i
i
i
6.4 Espaces vectoriels euclidiens et hermitiens
159
Exercice 6.8. Soit φ une forme bilinéaire symétrique non dégénérée sur un corps K
(de caractéristique différente de 2). On suppose qu’il existe un vecteur isotrope v = 0. Montrer que, pour tout a ∈ K , il existe un vecteur w tel que q(w) = a. Exercice 6.9. Montrer que les deux formes quadratiques définies sur Q 2 par
q1 (x1 , x2 ) = x21 + x22 ,
q2 (x1 , x2 ) = x21 + 2x22
ne sont pas congruentes.
6.4 ESPACES VECTORIELS EUCLIDIENS ET HERMITIENS 6.4.1. Produit scalaire C’est un aboutissement : la situation qui va nous intéresser est la plus proche de la géométrie. On suppose que l’espace vectoriel E est muni d’une forme bilinéaire symétrique. Définition 6.20. Une forme bilinéaire φ symétrique telle que, pour tout x,
φ(x, x) 0 est dite positive. Si le cône isotrope est réduit à {0}, φ(x, x) = 0 si et seulement si x est nul et φ est définie. Une forme bilinéaire symétrique définie positive est appelée produit scalaire. E est appelé espace vectoriel euclidien (on dit préhilbertien réel en dimension infinie). Notations : % % φ(x, y) = x, y, x = x, x = q(x)
© Dunod. La photocopie non autorisée est un délit.
x est la norme euclidienne du vecteur x.
6.4.2. Inégalité de Cauchy-Schwarz On peut majorer la valeur du produit scalaire, c’est la célèbre inégalité de CauchySchwarz, qu’on peut d’ailleurs énoncer dans un cadre un peu plus général. Théorème 6.21. Inégalité de Cauchy-Schwarz. Soit φ une forme bilinéaire symé-
trique positive, q la forme quadratique associée
∀(x, y) ∈ E 2 ,
(φ(x, y))2 q(x)q(y)
Si φ est un produit scalaire, on écrit :
∀(x, y) ∈ E 2 ,
x, y x × y
De plus, dans le cas du produit scalaire, il y a égalité si et seulement si les vecteurs sont liés.
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
160
Démonstration. • Soit φ une forme bilinéaire symétrique positive. Alors, pour tout couple (x, y) de vecteurs et pour tout réel λ, on a : 0 q(x + λy) = q(x) + 2λφ(x, y) + λ2 q(y) Si q(y) = 0, cette inégalité n’est possible pour tout λ que si φ(x, y) = 0. Sinon, ce polynôme en λ ne peut avoir un signe constamment positif que si son discriminant est négatif. Dans les deux cas, on a donc
φ(x, y)2 q(x)q(y) ce qui donne, dans le cas du produit scalaire, l’inégalité demandé. • Supposons de plus φ définie. Alors en supposant y non nul, q(y) = 0 et le polynôme en λ a un discriminant nul ; il a une racine double, λ 0 , donc q(x + λ0 y) = 0 ce qui implique x + λ0 y = 0, x et y sont liés. Si y = 0, bien sûr, x et y sont liés, et, par ailleurs, si x et y sont liés, l’inégalité de Cauchy-Schwarz est vérifiée. Un produit scalaire est forcément non dégénéré : comme il n’y a pas de vecteur isotrope, le noyau est réduit au vecteur nul. Et grâce à l’inégalité de Cauchy-Schwarz, on va montrer qu’une forme bilinéaire positive non dégénérée est un produit scalaire. Corollaire 6.22. Soit φ une forme bilinéaire symétrique sur le R-espace vectoriel E .
Alors
φ définie et positive ⇐⇒ φ non dégénérée positive
Démonstration. Comme dit ci-dessus, si φ est définie, elle est forcément non dégénérée. Si par contre x est dans le cône isotrope et y quelconque, l’inégalité de CauchySchwarz assure que |φ(x, y)| q(x)q(y) = 0, donc x est orthogonal à y et est dans le noyau de φ. Une application de l’inégalité de Cauchy-Schwarz est l’inégalité de Minkowski. Théorème 6.23. Inégalité de Minkowski. Si E est un R-espace vectoriel muni d’un
produit scalaire, alors
∀(x, y) ∈ E 2 ,
x + y x + y
et il n’y a égalité que si x et y sont positivement liés. La dernière assertion signifie qu’il existe λ réel positif tel que y = λx ou que x est nul.
Démonstration. L’inégalité à démontrer équivaut a x + y, x + y (x + y) 2 , en développant cela donne 2x, y 2x y qui est impliquée par l’inégalité de Cauchy-Schwarz, puisque pour tout réel a, a |a|. Pour qu’il y ait égalité, il est nécessaire que x et y soient liés. En remplaçant, on voit que pour avoir égalité dans l’inégalité de Minkowski, il faut et suffit que x et y soit positivement liés.
i
i i
i
i
i
i
i
6.4 Espaces vectoriels euclidiens et hermitiens
161
Application : ces propriétés font que l’application x → x a bien les propriétés d’une norme, c’est la norme euclidienne associée au produit scalaire.
6.4.3. Produit scalaire hermitien a) Sesquilinéarité
Dans le cas où le corps de base est le corps des complexes, les formes bilinéaires symétriques et les formes quadratiques associées ne sont pas les bonnes généralisations du produit scalaire : une forme quadratique est à valeurs complexes et ne peut permettre de définir une norme. La bonne généralisation est celle des formes sesquilinéaires hermitiennes et des formes hermitiennes associées, où le carré du module remplace le carré. Soit E un C-espace vectoriel. Une forme sesquilinéaire hermitienne sur E est une application φ de E × E dans C qui vérifie :
Définition 6.24.
(i) ∀(x, y, y ) ∈ E 3 , ∀λ ∈ C, φ(x, y + λy ) = φ(x, y) + λφ(x, y ) (ii) ∀(x, x , y) ∈ E 3 , ∀λ ∈ C, φ(x + λx , y) = φ(x, y) + λφ(x , y) φ(y, x) = φ(x, y) (iii) ∀(x, y) ∈ E 2 , L’application q définie par q(x) = φ(x, x) est la forme hermitienne associée à φ.
© Dunod. La photocopie non autorisée est un délit.
La seconde propriété s’appelle semilinéarité, d’où le nom « sesquilinéaire », ce qui signifie « une fois et demi » linéaire...La troisième propriété est parfois appelée symétrie hermitienne. Nous n’allons pas étudier longuement les formes sesquilinéaires hermitiennes, leur étude est très semblable à celle des formes bilinéaires symétriques : on peut par exemple définir le rang, étudier la notion d’orthogonalité... Il est possible de récupérer une forme sesquilinéaire hermitienne à partir de la forme hermitienne associée par une formule de polarisation un peu plus compliquée que dans le cas réel : 1 φ(x, y) = (q(x + y) − q(x − y) + iq(x − iy) − iq(x + iy)) 4 Donnons également l’écriture matricielle : Proposition 6.25. Si φ est une forme sesquilinéaire hermitienne sur E rapporté à la base B = (ei ), la matrice de φ est la matrice M = (φ(ei , ej )), et on a :
φ(x, y) = t XM Y De plus, la matrice M vérifie tM = M . On dit qu’elle est hermitienne. La vérification est immédiate. Les matrices vérifiant la propriété du théorème sont dite matrices hermitiennes, elles sont faciles à construire et donnent donc des
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
162
exemples de produit scalaire hermitien. On introduira désormais la notation : t
M = M∗
et on dira que cette matrice est l’adjointe de la matrice M . Dans le cas où M est à coefficients réels, cela désignera donc la transposée de M , et bien sûr les matrices symétriques réelles sont des exemples de matrices hermitiennes. Le changement de base, avec P matrice de passage, conduit à la relation :
M = P ∗M P lorsque M désigne la matrice dans la première base, M dans la seconde. b) Espace vectoriel hermitien
Comme dans le cas réel, on va définir des produits scalaires. Mais on commence par remarquer que Lemme 6.26. Si φ est une forme sesquilinéaire hermitienne, la forme hermitienne
associée prend ses valeurs dans R.
Démonstration. Par symétrie hermitienne, q(x) = φ(x, x) = φ(x, x) = q(x) donc q(x) est réel. On a alors, avec la même démonstration, un pendant du théorème de Sylvester : dans une base orthogonale, la matrice de φ est diagonale avec pour coefficients diagonaux λ1 , λ2 , . . . , λn où les λi sont réels. Si le nombre des λ i positifs est noté s, le nombre des λi négatifs est noté p et le couple (s, p) est la signature de la forme sesquilinéaire. Il est indépendant de la base orthogonale choisie. On peut ensuite définir : Définition 6.27.
Une forme sesquilinéaire hermitienne est positive si la forme hermitienne associée ne prend que des valeurs positives. Une forme sesquilinéaire hermitienne est définie si le seul vecteur qui annule q(x) est le vecteur nul. Un produit scalaire hermitien est une forme sesquilinéaire hermitienne définie positive. On notera φ(x, y) = x, y puis q(x) = x 2 , et x désignera la norme hermitienne du vecteur x. Un produit scalaire hermitien satisfait l’inégalité de Cauchy-Schwarz, et l’inégalité de Minkowski, x → x fait bien de E un C-espace vectoriel normé. Les démonstrations sont très semblables ; par exemple pour l’inégalité de Cauchy-Schwarz, on pose
P (t) = q(x + λy) = |λ|2 q(y) + λφ(x, y) + λφ(y, x) + q(x) 0 Si φ(x, y) = 0, l’inégalité est satisfaite. Sinon, on écrit φ(x, y) = ρe iθ (ρ réel) et on prend pour λ la valeur λ = se−iθ (s réel). Alors :
P (seiθ ) = s2 q(y) + 2sρ + q(x) 0
i
i i
i
i
i
i
i
6.4 Espaces vectoriels euclidiens et hermitiens
163
pour tout réel s. On regarde alors deux cas. Si q(y) = 0, l’expression ne peut être toujours positive que si ρ = 0 donc φ(x, y) = 0. Si que q(y) = 0 le discriminant du polynôme doit être négatif. L’inégalité est démontrée. Un C-espace vectoriel de dimension finie muni d’un produit scalaire hermitien s’appelle un espace hermitien. Dans le cas de la dimension infinie, on parle d’espace préhilbertien complexe, mais nous nous cantonnerons ici à la dimension finie.
6.4.4. Bases orthonormales Nous traitons maintenant en même temps le cas des produits scalaires euclidiens ou hermitiens. Définition 6.28. On appelle base orthonormale une base orthogonale dont
tous les vecteurs sont unitaires, c’est-à-dire de norme 1. Il existe « beaucoup » de bases orthonormales. Proposition 6.29. Tout espace vectoriel euclidien ou hermitien admet des bases orthonormales. Si (ei ) est une telle base et si X = t (x1 , . . . , xn ) et Y = t (y1 , . . . , yn ) désignent les matrices de coordonnées des vecteurs x et y dans ces bases, on a : n x, y = t X Y = xi yi (cas euclidien)
x, y = X ∗ Y =
i=1 n
xi yi
(cas hermitien)
i=1
© Dunod. La photocopie non autorisée est un délit.
De plus, xi = ei , x
Démonstration. L’existence d’une base orthogonale est assurée dans le cas général d’une forme bilinéaire symétrique. Dans le cas euclidien ou hermitien, le rang est égal à la dimension, la forme quadratique ne prend que des valeurs strictement positives sur les vecteurs non nuls, ce qui permet d’obtenir une base orthonormale à partir d’une base orthogonale. Le reste suit, en observant néanmoins que dans le cas hermitien, ei , x et x, ei sont conjugués. Si B et B sont deux bases orthonormales d’une espace vectoriel hermitien, alors la matrice de passage de B vers B est dite unitaire. Dans le cas euclidien, on dit orthogonale. Proposition 6.30.
(1) Une matrice Ω de Mn (R) est orthogonale si et seulement si t ΩΩ = I . L’ensemble des matrices orthogonales est un groupe pour le produit, appelé groupe orthogonal, et noté O(n, R). (2) Une matrice U de Mn (C) est unitaire si et seulement si U ∗ U = I . L’ensemble des matrices unitaires est un groupe pour le produit, appelé groupe unitaire, et noté U(n, C).
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
164
Exercice 6.10. Généraliser la méthode de Gauss au cas des formes hermitiennes :il s’agit de prouver que toute forme sesquilinéaire hermitienne peut se décomposer en une combinaison (à coefficients réels) de carrés de module de formes linéaires indépendantes. On observera que 1 |1 + 2 |2 − |1 − 2 |2 1 2 + 1 2 = 2 Traiter le cas de :
q(z1 , z2 ) = |z1 |2 − iz1 z 2 + iz 1 z2 + |z2 |2 et de
q(z1 , z2 , z3 ) = z1 z 2 + z 1 z2 − z2 z 3 − z 2 z3
Exercice 6.11. Dans un espace euclidien ou hermitien, muni d’une base orthonormale B = (ei ), montrer que n x= ei , xei i=1
Si u est un endomorphisme de matrice (u i,j ) dans la base B , alors
tij = ei , u(ej )
6.5 ADJOINT, DIAGONALISATION DES ENDOMORPHISMES AUTOADJOINTS 6.5.1. Adjoint d’un endomorphisme Soit E un espace vectoriel euclidien ou hermitien. On va définir une sorte de symétrie entre les endomorphismes de E , liée au produit scalaire. Théorème 6.31. Soit E un espace vectoriel euclidien ou hermitien, u ∈ L(E).
• Il existe un et un seul endomorphisme u ∗ vérifiant
∀(x, y) ∈ E 2 ,
u(x), y = x, u∗ (y)
• Si u et v sont des endomorphismes et λ un scalaire, (u + v)∗ = u∗ + v ∗ , (λu)∗ = λu∗ , u∗∗ = u,
(u ◦ v)∗ = v ∗ ◦ u∗ .
• Si B est une base orthonormale, alors
MB (u∗ ) = MB∗ (u) On dit alors que u∗ est l’adjoint de u.
i
i i
i
i
i
i
i
6.5 Adjoints
165
Démonstration. Pour définir f ∗, on peut utiliser une base : ei , u∗ (ej ) = u(ei ), ej = ej , u(ei ) la première égalité montre que les coordonnées des vecteurs u ∗ (ej ) sont bien déterminées, la seconde permet de prouver que la matrice de u ∗ , dans la base (ei ) est l’adjointe de la matrice de u (dans la même base). Ayant ainsi défini u ∗ à l’aide d’une base, on vérifie qu’il satisfait la définition, grâce à la sesquilinéarité (ou la bilinéarité). Les autres propriétés se démontrent à l’aide de la définition ou grâce aux matrices. Donnons une propriété importante de l’adjoint d’un endomorphisme f . Proposition 6.32. Si F est un sous-espace vectoriel de E , alors
u(F ) ⊂ F ⇒ u∗ (F ⊥ ) ⊂ F ⊥
Démonstration. On commence par observer que ∀(x, y) ∈ E 2 ,
u∗ (x), y = x, u(y)
puisque u∗∗ = u. Si on prend x dans F ⊥ et y dans F :
u∗ (x), y = x, u(y) = 0 car u(y) est dans F , donc u∗ (x) est dans F ⊥ .
Cas particulier : si F est u-stable, son orthogonal F ⊥ est u∗ -stable.
© Dunod. La photocopie non autorisée est un délit.
Parmi les endomorphismes, certains ont la propriété de coïncider avec leur adjoint. On les appelle endomorphismes autoadjoints. Dans le cas réel, on parle plutôt d’endomorphismes symétriques, et signalons que l’on emploie souvent le mot opérateur à la place d’endomorphisme. Les exemples d’endomorphismes autoadjoints sont faciles à trouver, puisque le théorème que nous venons de démontrer permet d’assurer : Proposition 6.33. f est autoadjoint si et seulement si sa matrice, dans une base orthonormale est égale à son adjointe. On dit qu’elle est auto-adjointe (hermitienne dans le cas complexe, symétrique dans le cas réel).
À ce stade de notre étude, on peut observer la situation suivante. Si E est un espace vectoriel euclidien, une matrice symétrique peut s’interpréter de deux façons : • Soit comme la matrice d’une forme bilinéaire symétrique, par rapport à une base. • Soit comme la matrice d’un endomorphisme autoadjoint par rapport à une base orthonormale. Et dans le cas hermitien, une matrice hermitienne est soit la matrice d’une forme sesquilinéaire hermitienne, soit la matrice d’un endomorphisme autoadjoint dans une base orthonormale. Cette double interprétation peut se décrire sans l’intermédiaire des matrices, en résumé :
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
166
Proposition 6.34. Soit E un espace vectoriel euclidien (resp. hermitien). À toute
forme bilinéaire symétrique (resp. sesquilinéaire hermitienne) φ, on peut associer un endomorphisme autoadjoint unique u par :
∀x, y ∈ E,
φ(x, y) = x, u(y)
Réciproquement, cette même formule permet d’associer une forme bilinéaire (resp. sesquilinéaire) à un endomorphisme autoadjoint. On peut alors utiliser ce point de vue pour définir les endomorphismes autoadjoints positifs ou définis positifs : Un endomorphisme autoadjoint u d’un espace vectoriel euclidien ou hermitien E est positif (resp. défini positif) si la forme quadratique x → x, f (x) est positive (resp. définie positive). L’ensemble des matrices ++ de ces endomorphismes, dans une base orthonormale, est noté S + n (resp. Sn + ++ dans le cas euclidien). Dans le cas complexe, on notera H n (resp. Hn ). Définition 6.35.
On dit parfois strictement positif au lieu de défini positif.
6.5.2. Diagonalisation des endomorphismes autoadjoints Le résultat qui nous intéresse le plus, pas immédiat à démontrer, est énoncé ainsi : Théorème 6.36. Théorème spectral. Soit E un endomorphisme autoadjoint dans un espace vectoriel hermitien (resp. euclidien) E . Alors ses valeurs propres sont réelles, il est diagonalisable, et on peut trouver une base orthonormale de vecteurs propres.
Démonstration. Il y a plusieurs étapes, et nous commençons par le cas hermitien. • Si λ est une valeur propre de u, alors λ est réel. En effet, en notant x un vecteur propre, u(x), x = λx, x = x, u(x) = λx, x La valeur propre λ est égale à son conjugué, donc est réelle. • D’après le théorème 6.32, si F est u-stable alors F ⊥ est u-stable puisque u = u∗ . • Raisonnons maintenant par récurrence sur la dimension. En dimension 1, la matrice d’un endomorphisme autoadjoint est un réel, le théorème est vrai. Supposons le théorème vrai pour tout endomorphisme autoadjoint en dimension strictement inférieure à n, et soit u autoadjoint en dimension n. Alors, comme le corps de base est C, u admet une valeur propre, qui est donc réelle. Si F est le sous-espace propre associé, on peut choisir une base orthonormale dans F . Comme F est u-stable, son orthogonal est aussi u-stable et on peut appliquer l’hypothèse de récurrence à la restriction de u à F ⊥ . (En effet, cette restriction reste autoadjointe). En réunissant ces deux bases, on obtient une base orthonormale de vecteurs propres.
i
i i
i
i
i
i
i
6.5 Adjoints
167
• Pour le cas réel, raisonnons matriciellement : une matrice réelle symétrique A est aussi hermitienne si on la considère comme matrice à coefficients complexes. Il existe donc une matrice P telle que P −1 AP = D où D est diagonale réelle. Le problème est qu’à priori, P est une matrice de passage à coefficients complexes. Notons P = S + iT où S et T sont réelles. Il est possible qu’aucune de ces deux matrices ne soit inversible, mais il existe t ∈ R telle que det(S + tT ) soit non nul, puisque ce déterminant est un polynôme en t 2 et que R est infini. On a alors :
P −1 AP = D ⇒ AP = DP ⇒ AS = SD, AT = T D et donc
A(S + tT ) = (S + tT )D d’où le résultat. Ce n’est pas terminé : on dispose d’une base de vecteur propres, mais nous savons que les sous-espaces propres sont en somme directe. De plus, deux sous-espaces propres distincts sont orthogonaux ; on peut donc construire une base orthonormale de vecteurs propres. Remarquons que notre méthode permet aussi d’énoncer : deux matrices réelles qui sont semblables sur C sont aussi semblables sur R. Ce théorème a beaucoup d’applications. Donnons-en quelques unes : • Si u est autoadjoint, sa signature est (s, p) où s est le nombre des valeurs propres strictement positives, p le nombre des valeurs propres strictement négatives. • En particulier, une matrice symétrique est positive (resp. définie positive) si et seulement si ses valeurs propres sont positives (resp. strictement positives). Ce résultat vaut également pour les matrices hermitiennes. • Si φ et ψ sont deux formes bilinéaires symétriques définies sur E , espace vectoriel réel. On suppose que φ est définie positive. Alors il existe une base orthonormale pour φ qui est orthogonale pour ψ .
© Dunod. La photocopie non autorisée est un délit.
Pour le dernier alinéa, il suffit de munir l’espace vectoriel de la structure euclidienne définie par φ.
6.5.3. Diagonalisation des endomorphismes normaux Plaçons nous maintenant dans le cas hermitien seulement. Nous allons alors généraliser le théorème fondamental du paragraphe précédent. Commençons par définir une nouvelle catégorie d’endomorphismes. Définition 6.37. Un endomorphisme est normal lorsqu’il commute avec son
adjoint. Bien sûr, tout endomorphisme autoadjoint est normal, mais il y a d’autres types d’endomorphismes normaux. 2. Il est non identiquement nul car non nul en i.
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
168
Théorème 6.38. Soit E un C espace vectoriel hermitien, alors un endomorphisme est diagonalisable dans une base orthonormale si et seulement s’il est normal.
Démonstration. Supposons qu’il existe une base orthonormale (e i ) formée de vecteurs propres pour u. La matrice de u dans cette base est diagonale, celle de u ∗ est aussi diagonale, et ces deux matrices commutent donc. Supposons maintenant que u soit normal. On raisonne par récurrence sur la dimension, le résultat étant immédiat en dimension 1. Puisque nous sommes sur le corps de base C, il existe une valeur propre λ. Soit E λ le sous-espace propre associé. Si c’est E tout entier, u est une homothétie et c’est fini. Sinon, son supplémentaire orthogonal E ⊥ est stable par u. En effet, il est stable par u ∗ , par propriété de l’adjoint (cf. la proposition 6.32), et, comme u∗ et u commutent, il est stable par u, rappelons l’argument. u ◦ u∗ (x) = u∗ ◦ u(x) = λu∗ (x) pour tout vecteur propre x, donc u ∗ (x) ∈ Eλ . Le même raisonnement montre que u stabilisant Eλ , son adjoint u∗ stabilise Eλ⊥ , on peut donc définir les restrictions de u et de u∗ à Eλ⊥ . De plus, en considérant les définitions, ∗ u∗ |Eλ⊥ = u |Eλ⊥ et donc sur Eλ⊥ la restriction de u est normale : la récurrence marche.
Les principaux endomorphismes normaux sont : • les endomorphismes autoadjoints, u = u ∗ , qui ont des valeurs propres réelles. • les endomorphismes antihermitiens, u ∗ = −u, qui ont des valeurs propres imaginaires pures. • les endomorphismes unitaires, u −1 = u∗ , qui ont des valeurs propres de module 1. Il est facile de vérifier que ces propriétés sur les valeurs propres les caractérisent parmi les endomorphismes normaux. Mise en garde : le théorème ne subsiste pas dans le cas réel. On le verra dans les chapitres suivant pour les rotations, par exemple. Exercice 6.12. Soit E un espace hermitien. Montrer que tout u ∈ L(E) s’écrit de façon unique u = u1 +u2 où u1 est auto-adjoint et u2 est « anti » auto-adjoint (c’est-àdire u∗2 = −u2 ). Montrer qu’alors u est normal si et seulement si u 1 et u2 commutent. Que devient cet exercice en dimension 1 ? Exercice 6.13. Soit E un espace hermitien, u un endomorphisme de E . Montrer que
(1) Si ∀x ∈ E, u(x), x = 0 alors u est nul. (Indication : déduire u(x), y = 0 en appliquant l’hypothèse à x + y et x + iy ). Ce résultat subsiste-t-il dans le cas réel ? (2) u = u∗ ⇐⇒ u(x), x ∈ R pour tout x ∈ E .
i
i i
i
i
i
i
i
Exercices
169
EXERCICES Exercice 6.14. Soit E un espace vectoriel de base B = (e 1 , e2 , . . . , en ). On note (e∗i )
la base duale. Si f et g sont deux formes linéaires, on note f ⊗ g la forme définie par :
(f ⊗ g)(x, y) = f (x)g(y) (1) Montrer que f ⊗ g est une forme bilinéaire. Est-elle symétrique ? Quel est son rang ? (2) Montrer que les n 2 formes e∗i ⊗ e∗j forment une base de l’espace vectoriel des formes bilinéaires. Faire le lien avec les matrices et proposer une base pour l’espace vectoriel des formes bilinéaires symétriques. (3) Si f est une forme linéaire et v un vecteur, on note f ⊗ v l’application (f ⊗ v)(x) = f (x)v , où v est un vecteur. Montrer que c’est un endomorphisme. Quel est son rang ? En déduire également une base de L(E) et faire le lien avec les matrices. Exercice 6.15. Soit E = C considéré comme R-espace vectoriel.
(1) Montrer que
z|w = (zw) définit un produit scalaire euclidien sur E ; et donner un isomorphisme d’espace vectoriel euclidien entre E et R 2 (muni du produit scalaire canonique). (2) Soit mγ défini par : mγ (z) = γz Montrer que mγ est linéaire. Chercher l’adjoint de m γ . Quand mγ est-il symétrique, orthogonal ?
Exercice 6.16. Soit A une matrice de Mn (C).
© Dunod. La photocopie non autorisée est un délit.
(1) On suppose qu’il existe une matrice unitaire U telle que :
A∗ = AU Montrer que AU = U A puis que A est une matrice normale. (2) Réciproquement, on suppose que la matrice A est normale. Montrer qu’il existe une matrice unitaire U telle que A ∗ = AU . On pourra commencer par traiter le cas où A est diagonale. Exercice 6.17.
(1) Soit A une matrice de M n (R). Montrer que tAA est symétrique positive. Quand est-elle définie positive ? (2) Soit S une matrice symétrique positive. Montrer qu’il existe une matrice A telle que S = tAA. (3) Reprendre le même exercice dans le cas hermitien.
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
170
PROBLÈMES Les corrigés de ces problèmes sont disponibles sur le site de Dunod : www.dunod.com.
6.1. PROBLÈME Dans ce problème, on s’intéresse aux formes bilinéaires antisymétriques. Soit φ une forme bilinéaire antisymétrique définie sur un K -espace vectoriel E , de dimension finie. On suppose que K est un corps de caractéristique différente de 2. (1) On suppose que E est de dimension 2. Montrer que, si φ n’est pas nulle, il existe une base (u, v) telle que la matrice de φ dans cette base est : 0 1 T = −1 0 (2) On se place maintenant en dimension finie n. Montrer qu’il existe une base B de la forme B = (u1 , v1 , u2 , v2 , . . . , uk , vk , w1 , . . . , wn−2k ) telle que la matrice de φ dans cette base soit diagonale par blocs, avec k blocs de la forme T , le reste de la matrice étant nul. (3) En déduire que le rang d’une forme bilinéaire antisymétrique est pair. Déterminer également les classes de congruence d’une forme bilinéaire antisymétrique. (4) Montrer que le déterminant d’une matrice antisymétrique est toujours un carré. (5) On suppose que A = (aij ) est une matrice antisymétrique quelconque de taille 2n. Montrer que le déterminant de A est le carré d’un polynôme en les a ij , où on ne prend que les indices tels que i < j . Déterminer ce polynôme (que l’on appelle le Pfaffien), lorsque n = 1, n = 2 et n = 3.
6.2. PROBLÈME Soit E un espace vectoriel de dimension finie sur corps K de caractéristique = 2. Soit f : E × E −→ K une forme bilinéaire symétrique et soit q la forme quadratique associée (q(x) = f (x, x)). On note C(q) l’ensemble des vecteurs tels que q(x) = 0. (1) Un sous-espace vectoriel F de E est dit totalement isotrope si pour tout x de F on a q(x) = 0. Montrer que F est totalement isotrope si, et seulement si, F ⊂ F ⊥ . (2) Supposons que F soit un sous-espace vectoriel totalement isotrope. Soit x ∈ F ⊥ ∩ C(q). Montrer que F + Kx est un sous-espace vectoriel totalement isotrope.
i
i i
i
i
i
i
i
Problèmes
171
(3) On dit que F est un sous-espace totalement isotrope maximal s’il n’existe aucun sous-espace vectoriel totalement isotrope G tel que F ⊂ G et F = G. Montrer que si F est un sous-espace vectoriel totalement isotrope maximal, alors :
F = F ⊥ ∩ C(q) (4) Soient F1 et F2 sont deux sous-espaces vectoriels totalement isotropes maximaux. On pose F = F1 ∩ F2 . Soit S1 un sous-espace vectoriel supplémentaire de F dans F1 :
F1 = F ⊕ S1 Soit de même S2 un supplémentaire de F dans F 2 :
F2 = F ⊕ S2 On se propose de montrer que S 1 ∩ S2⊥ = {0}. Pour cela, soit :
x0 ∈ S1 ∩ S2⊥ (a) Montrer que x0 ∈ F2⊥ . (b) Montrer successivement x 0 ∈ C(q), x0 ∈ F2 , x0 ∈ F . (c) Conclure en constatant que x 0 ∈ F ∩ S1 . (5) Pour tout sous-espace vectoriel U de E , montrer que :
dim U ⊥ dim E − dim U
© Dunod. La photocopie non autorisée est un délit.
(si la forme f est non dégénérée, on a égalité). À l’aide de la question précédente, en déduire dim S1 = dim S2 , puis dim F1 = dim F2 . (6) D’après la question précédente, tous les sous-espaces totalement isotropes maximaux ont la même dimension. Ce nombre s’appelle l’indice de la forme bilinéaire f (ou de la forme quadratique q ). Soit en particulier E = R3 . Sur E , on définit les six formes quadratiques suivantes : • q1 (x) = x21 + x22 + x23 • q2 (x) = x21 + x22 − x23 • q3 (x) = x21 + x22 • q4 (x) = x21 − x22 • q5 (x) = x21 • q6 (x) = 0 Calculer l’indice de ces six formes quadratiques.
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
172
SOLUTIONS DES EXERCICES
Solution 6.1. Si φ et ψ sont des formes bilinéaires symétriques, aloes φ+ψ et λφ sont
encore des formes bilinéaires symétriques. Cela résulte de calculs (ou d’écritures...) évidents, comme
(φ + ψ)(x, y + µy ) = φ(x, y + µy ) + ψ(x, y + µy ) = φ(x, y) + ψ(x, y) + µ(φ(x, y ) + ψ(x, y )) = (φ + ψ)(x, y) + µ(φ + ψ)(x, y) qui prouve que la somme de deux applications linéaires pour leur deuxième argument est elle-même linéaire pour le second argument. Les ensembles LS 2 (E) et LA2 (E) sont donc des sous-espaces de l’espace des formes bilinéaires L2 (E). Une forme qui serait à la fois symétrique et antisymétrique vérifierait ∀(x, y) ∈ E 2 , φ(x, y) = φ(y, x) = −φ(x, y)) et serait identiquement nulle. Par ailleurs, si f est une forme bilinéaire, si on désire écrire f = s + a où s est symétrique et a antisymétrique, on trouve que la seule solution est 1 1 a(x, y) = (f (x, y) − f (y, x)) s(x, y) = (f (x, y) + f (y, x)) 2 2 On peut donc conclure que l’espace vectoriel des formes bilinéaires est somme directe du sous-espace vectoriel des formes bilinéaires symétriques et du sous-espace vectoriel des formes bilinéaires antisymétriques. En dimension finie n, l’examen des matrices montre que les dimensions de ces sous-espaces vectoriels sont respectivement n(n+1) n(n−1) et 2 . 2
Solution 6.2. Si φ est symétrique φ(x, y) = φ(y, x) et s’il est antisymétrique
φ(x, y) = −φ(y, x) donc la nullité de l’un implique celle de l’autre. Supposons donc que φ soit une forme bilinéaire telle que, pour tout couple (x, y) φ(x, y) = 0
⇒
φ(y, x) = 0
Alors x → φ(x, y) et x → φ(y, x) sont deux formes linéaires qui ont même noyau. Il existe donc une constante, a priori dépendant de y telle que, pour tout x, φ(x, y) = λy φ(y, x). On va montrer que λy est en fait indépendant de y . Soient en effet L et M les applications de E dans E ∗ définies par y → φ(·, y) et y → φ(y, ·) ( voir le paragraphe 6.1.2.). Alors L et R sont bijectives puisque φ est non dégénérée, et l’égalité ci-dessus prouve :
∀y ∈ E, L−1 ◦ R(y) = λy y
i
i i
i
i
i
i
i
Solutions des exercices
173
On sait qu’en dimension supérieure ou égale à 2, cela implique que L −1 ◦ R est une homothétie, (voir l’exercice 4.1.) donc λ y est une constante, indépendante de y . Mais on peut alors écrire :
φ(x, y) = λφ(y, x) = λ2 φ(x, y) d’où λ = ±1 (en choisissant x et y de sorte que φ(x, y) ne soit pas nul) Solution 6.3. Soit D = vect(ae1 + be2 + ce3 ). Alors un vecteur de coordonnées x 1 ,
x2 , x3 est orthogonal à D si et seulement si : ax 1 + bx2 − cx3 = 0. L’orthogonal de D est donc un plan P (car a, b et c ne sont pas tous nuls.) Une droite est isotrope si son intersection avec son orthogonal n’est pas réduite à {0}, donc si elle est incluse dans ce plan, donc si a2 + b2 − c2 = 0. Ce vecteur est alors isotrope, la droite est totalement isotrope. Il y a une infinité de solutions qui, géométriquement, sont les génératrices du cône défini par l’équation précédente. L’orthogonal du plan P d’équation ux1 + vy1 + wz1 = 0 est la droite vect(ue1 + ve2 − we3 ). Il est isotrope si cette droite est une génératrice du cône. En géométrie, on peut démontrer que le plan est alors tangent au cône.
Solution 6.4. Soit φ antisymétrique. Sa matrice A est antisymétrique, t A = −A.
Donc
det(A) = det(t A) = (−1)n det A où n est la dimension de l’espace vectoriel. Si n est impair, on en déduit que det A est nul, le noyau de A qui est aussi le noyau de la forme bilinéaire n’est pas réduit au vecteur nul.
Solution 6.5. Pour trouver un contre-exemple, il faut une forme bilinéaire symétrique dégénérée. Plaçons-nous sur R 2 , et prenons la forme bilinéaire définie par :
© Dunod. La photocopie non autorisée est un délit.
φ((x1 , x2 ), (y1 , y2 )) = x1 y1 Si F et G sont deux droites distinctes, différentes du noyau K = vect((0, 1)). Alors F ⊥ = G⊥ = K et (F ∩ G)⊥ = R2 . L’inclusion est stricte. D est une droite isotrope si D ∩ D ⊥ = {0}. Comme D est de dimension un, cette intersection est D elle-même, donc D ⊂ D ⊥ et D est totalement isotrope. Pour dire la même chose de façon différente, en dimension 1, une forme bilinéaire dégénérée est forcément nulle. Pour trouver un exemple de sous-espace isotrope sans être totalement isotrope, il faut au moins prendre un plan. Dans l’exercice 6.3, on a bien un plan (tangent au cône) qui est isotrope sans être totalement isotrope. Si un sous-espace F est isotrope, il contient un vecteur non nul qui est à la fois dans F et dans F ⊥ : ce vecteur est orthogonal à lui-même, il est isotrope. Si un sous-espace contient un vecteur isotrope, il n’est pas forcément isotrope. Prendre l’exemple de E tout entier, lorsque la forme bilinéaire admet des vecteurs isotropes (cône isotrope non nul) mais est non dégénérée (noyau réduit à {0}).
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
174
Solution 6.6. Pour le premier exemple, la méthode de Gauss conduit à :
q(x, y, z) = (x − y − z)2 + (y − 2z)2 − 3z 2 et la signature est (2, 1). On considère ensuite
q(x1 , x2 , x3 ) = x1 x2 + x2 x3 + x3 x1 = (x1 + x3 )(x2 + x3 ) − x23 1 1 (x1 + x2 + 2x3 )2 − (x1 − x2 )2 − x23 = 4 4 le signature est (1, 2), puis
q(x1 , x2 , x3 , x4 ) = x1 x2 + x2 x3 + x3 x4 + x4 x1 = (x1 + x3 )(x2 + x4 ) − x3 x4 + x3 x4 1 1 (x1 + x2 + x3 + x4 )2 − (x1 − x2 + x3 − x4 )2 = 4 4 la signature est (1, 1). Le lecteur poursuivra. Solution 6.7. Si q est de signe constant, on peut suivre la démonstration de l’inégalité de Cauchy-Schwarz, énoncée dans le cas positif. On a donc φ(x, y) 2 q(x)q(y) pour tout (x, y) et donc si x est dans le cône isotrope, il est dans le noyau. Comme l’autre inclusion est automatique, le cône isotrope est égal au noyau. Si maintenant le cône isotrope est égal au noyau, supposons que q(x) < 0 et q(y) > 0, et x et y sont nécessairement indépendant (puisque q(ax) = a 2 q(x). Alors q(x + λy) est un polynôme du second degré en λ qui a deux racines distinctes, il existe dans le plan engendré par x et y deux vecteurs indépendants isotropes. Mais alors ces deux vecteurs sont dans le noyau, la restriction de la forme à ce plan est nulle, ce qui est absurde vu le choix de x et y .
Solution 6.8. Si φ est non dégénérée et admet un vecteur v isotrope, la dimension est au moins égale à 2. Soit v un vecteur indépendant de v et non orthogonal à v (il en existe car φ n’est pas dégénérée). Si λ ∈ K , on pose w = v + λv . Alors q(w) = q(v ) + 2λφ(v , v) et il existe λ tel que q(w) = α. On a montré que q est surjective, même en se restreignant au plan vect(v, v ). En particulier, il existe une seconde droite de vecteurs isotropes dans ce plan.
Solution 6.9. Le corps de base est celui des rationnels, montrons que les deux formes ne sont pas congruentes. Si elles l’étaient, leurs matrices seraient congruentes et il 1 0 . existerait une matrice de passage P à coefficients rationnels tels que t P P = 0 2 En particulier, det(P )2 = 2, ce qui est impossible puisque det P est un rationnel.
i
i i
i
i
i
i
i
Solutions des exercices
175
Solution 6.10. On part des termes en z 1 :
q(z1 , z2 ) = (z1 − iz2 )(z 1 + iz 2 ) = Z1 Z 1 la forme est de rang 1 et de signature (1, 0). Traitons le cas suivant :
q(z1 , z2 , z3 ) = z2 (z 1 − z 3 ) + z 2 (z1 − z3 ) 1 |z1 + z2 − z3 |2 − | − z1 + z2 − z3 |2 = 4 La forme est de signature (1, 1). Solution 6.11. Si on pose x =
n
i=1 xi ei , n
ej , x =
alors
xi ej , ei = xj
i=1
d’où le résultat. On a tenu compte de la linéarité à droite et on a donc x = ni=1 ei , xei . Attention, dans le cas hermitien, il faut tenir compte de l’ordre. Soit maintenant u un endomorphisme. Si (ui,j ) est sa matrice dans une base orthonormale, u(ej ) =
n
ui,j ei =
i=1
n ei , u(ej )ei i=1
et donc la matrice de u est la matrice (e i , u(ej )).
© Dunod. La photocopie non autorisée est un délit.
Solution 6.12. On cherche u1 et u2 tels que u = u1 + u2 , u∗1 = u1 et u∗2 = −u2 .
Nécessairement, u∗ = u∗1 + u∗2 = u1 − u2 et donc 1 1 u1 = (u + u∗ ) et u2 = (u − u∗ ) 2 2 Réciproquement, ces deux endomorphismes vérifient les conditions de départ. On ne peut parler de somme directe, car l’ensemble des endomorphismes auto-adjoints n’est pas un C-espace vectoriel. Par ailleurs,
u◦u∗ − u∗ ◦u = (u1 + u2 )◦((u1 − u2 )− (u1 − u2 )◦(u1 + u2 ) = 2(u2 ◦u1 − u2 ◦u2 ) d’où la seconde affirmation. En dimension 1, bien sûr, on retrouve la décomposition d’un complexe en un réel et en imaginaire pur. Solution 6.13.
(1) On a u(x + y), x + y = 0 pour tout x, y , donc
u(x), x+u(y), x+u(x), y+u(y), y = 0
d’où
u(y), x+u(x), y = 0
De même, on a u(x + iy), x + iy = 0
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
176
u(x), x−iu(y), x+iu(x), y+u(y), y = 0 d’où u(y), x−u(x), y = 0 On en déduit que, pour tout (x, y), u(x), y = 0, et donc, puisque qu’un produit scalaire est non dégénéré, ∀x ∈ E , u(x) = 0, u est l’endomorphisme nul. Le résultat n’est pas vrai dans le cas euclidien : prendre pour u l’endomorphisme 0 −1 dont la matrice dans une base orthonormale est . Le lecteur géomètre 1 0 reconnaît la matrice d’une rotation d’angle droit. (2) D’après les définition
u(x), x = x, u∗ (x) = u∗ (x), x et donc u(x), x ∈ R équivaut à
u(x), x = u∗ (x), x ⇐⇒ (u − u∗ )(x), x = 0 et ce sera vrai pour tout x si et seulement si u est autoadjoint.
Solution 6.14.
(1) On a
(f ⊗ g)(x + λx , y) = (f (x) + λf (x ))g(y) = f ⊗ g(x, y) + λf ⊗ g(x , y) les autres vérifications sont immédiates. Ce sera une forme symétrique lorsque, pour tout (x, y), f (x)g(y) = f (y)g(x). Si l’une ou l’autre des forme est nulle, le composé est nul donc symétrique. Comme f et g ne sont pas nul, il existe un (y0 ) y0 tel que ni g(y0 ), ni f (y0 ) ne sont nuls, et donc f (x) = fg(y g(x), les deux 0) formes sont nécessairement proportionnelles. Et si g = kf où k est un scalaire, f ⊗ g(x, y) = kf (x)f (y) est symétrique. Pour terminer, le rang est 1, lorsque ni f ni g n’est nul. En effet,
{x ∈ E | ∀y ∈ E, f (x)g(y) = 0} = Ker f est un hyperplan (2) Si x a pour coordonnées (x i ), y a pour coordonnées (y i ), alors
(e∗i ⊗ e∗j )(x, y) = xi yj . Et donc pour toute forme bilinéaire φ φ(ei , ej )(e∗i ⊗ e∗j )(x, y) = xi yj φ(x, y) = i,j
les coordonnées de φ dans cette base sont les φ(e i , ej ), donc sont les coefficients de la matrice de φ. Si on est en caractéristique différente de 2, une base de l’espace vectoriel des formes bilinéaires symétriques sera formée des 12 (e∗i ⊗ e∗j + e∗j ⊗ e∗i ). (3) Les vérifications sont similaires. On obtient alors une base de L(E) en considérant les endomorphismes de la forme e ∗i ⊗ ej définis par :
(e∗i ⊗ ej )(x) = xi ej
i
i i
i
i
i
i
i
Solutions des exercices
177
Les coordonnées d’un endomorphisme dans cette base sont les coefficients de sa matrice. Cet exercice est le point de départ d’une étude unifiée des applications linéaires, bilinéaires, multilinéaires, au moyen de ce qu’on appelle le produit tensoriel. Solution 6.15.
(1) La bilinéarité est facile à prouver par la définition, ou bien en écrivant z, w = z1 x1 + z2 w2 où z = z1 + iz2 et w = w1 + iw2 . C’est un produit scalaire pour lequel (1, i) est une base orthonormale. L’isomorphisme est naturellement z → (z1 , z2 ). (2) Il s’agit de R-linéarité : m γ (z + λz ) = γ(z + λz ) = γz + λγz , avec λ réel. Il est noté qu’ici il y a également C-linéarité. Cherchons l’adjoint de m γ . Par définition,
mγ (z), z = z, m∗γ (z ) ⇐⇒ (γzz ) = (zm∗γ (z )) On en déduit
m∗γ (z) = γz et m∗γ = mγ Et donc mγ est symétrique si et seulement si γ = γ , donc si γ est réel. De même, il est orthogonal lorsque γ = γ −1 donc si γ est de module 1. Solution 6.16.
(1) Puisque A∗ = AU , on en déduit A∗∗ = U ∗ A∗ soit A = U −1 AU et donc U A = AU . On a alors AA∗ = AAU = AU A = A∗ A, A est une matrice normale. (2) Commençons par observer que si λ = |λ|e iθ alors λ = λe−2iθ . Supposons donc que D = diag(λk ), alors
© Dunod. La photocopie non autorisée est un délit.
D ∗ = diag(λk ) = diag(λk )diag(e−2iθk ) = DU1 où U1 est unitaire (on a évidemment U 1∗ = U1−1 ). Soit maintenant A une matrice normale. Elle est diagonalisable dans une base orthonormale, et il existe donc V unitaire telle que D = V ∗ AV , avec D diagonale. On en déduit D ∗ = V ∗ AV U ∗ et donc A∗ = A(V U V ∗ ), la proposition est démontrée. Solution 6.17.
(1) t (t AA) = tAtt A = tAA, la matrice est donc symétrique. Si X est la matrice colonne des coordonnées d’un vecteur x, la forme quadratique définie par t AA est : q(x) = t X t AAX = t (AX)AX = yi2 i
si on note (yi ) les coefficients de la matrice colonne AX . La forme quadratique q est donc positive, et si A est inversible elle est définie positive.
i
i i
i
i
i
i
i
6 • Algèbre bilinéaire
178
(2) Montrons qu’il y a une solution avec A symétrique. On utilise que S est semblable à une matrice diagonale D , avec une matrice de passage O qui est orthogonale. On a alors D = t OSO ⇐⇒ S = ODt O Puisque S est positive, les valeurs propres de S sont positives et les éléments diagonaux de D sont positifs ou nuls. Il existe une matrice diagonale ∆ telle que ∆2 = D . Alors, si A = O∆t O
alors
t
A = O∆t O = A
et
t
AA = D∆2 t O = S
Si S est définie positive, on obtient le même résultat en disant que la forme bilinéaire associée admet une base orthonormale et donc que S est congruente à la matrice I . (3) Le cas hermitien se traite de façon symétrique...
i
i i
i
i
i
i
i
Chapitre 7
Groupes classiques
7.1 LES GROUPES LINÉAIRES ET SPÉCIAL LINÉAIRES
© Dunod. La photocopie non autorisée est un délit.
Quand on étudie un groupe, il est très utile de connaître des générateurs qui soient le plus simple possible. Ainsi, les transpositions sont les générateurs privilégiés du groupe symétrique. Pour l’étude du groupe alterné, on utilise les 3-cycles. Une idée qui va nous guider : les transpositions sont, parmi les permutations différentes de l’identité, celles qui ont le plus de points fixes.
7.1.1. Les dilatations et les transvections Soit E un K -espace vectoriel de dimension finie n, et H un hyperplan. On s’intéresse aux endomorphismes de E qui fixent tous les éléments de H ; il y en a de deux sortes, comme le précise le théorème suivant. Théorème 7.1. H est un hyperplan d’un K -espace vectoriel, et u un endomorphisme différent de l’identité qui fixe les vecteurs de H . Alors
• soit u est diagonalisable, de valeurs propres 1 et λ = 1, on dit que u est une dilatation de rapport λ. • soit u est non diagonalisable et admet 1 pour seule valeur propre ; on dit que f est une transvection.
i
i i
i
i
i
i
i
7 • Groupes classiques
180
Démonstration. Il suffit d’observer que, puisque H est formé de vecteurs invariants, le sous-espace propre E 1 est au moins de dimension n − 1 et (X − 1) n−1 est facteur du polynôme caractéristique. On a donc χu (X) = (−1)n (X − 1)n−1 (X − λ) Alors, si λ n’est pas égal à 1, il existe une droite propre E λ et u est diagonalisable avec E = H ⊕ Eλ . Si λ est égal à 1 et si E1 = E , u est l’identité (donc diagonalisable). Il reste le cas où λ = 1 et E1 = H , u est non diagonalisable. On peut être plus précis, et caractériser géométriquement les dilatations et les transvections. On en profite pour donner une forme canonique à la matrice de ces transformations. • Si u est une dilatation autre que l’identité, on note (e 1 , . . . , en−1 ) une base de H et en un vecteur propre associé à la valeur propre λ. On dit alors que u est la dilatation d’hyperplan H , de direction vect(e n ) et de rapport λ. Dans la base (e1 , e2 , . . . , en ), sa matrice prend la forme bloc : ⎞ ⎛ . In−1 .. 0 ⎟ ⎜ . . .⎠ ⎝ ... .. . λ 0 où In−1 est la matrice de l’identité dans un espace vectoriel de dimension n − 1. • Si u est une transvection, H = E1 est de dimension n − 1 donc Im(u − id) est de dimension un, par le théorème du rang. Notons a un vecteur de base de Im(u − id). Alors a = u(b) − b où b n’est pas dans H (sinon a serait nul) et
u(a) = u(u(b)) − u(b) = (u − id)(u(b)) ∈ Im(u − id) Comme Im(u − id) est de dimension un, il existe un scalaire λ tel que u(a) = λa. Mais nécessairement λ = 1, car 1 est la seule valeur propre de u. En conclusion, a est dans H , l’image Im(u − id) est incluse dans Ker(u − id). Prenons a = e n−1 , b = en et (e1 , . . . , en−2 ), de sorte que (e1 , . . . , en−1 ) soit une base de H . La matrice de u dans cette base prend la forme : ⎞ ⎛ . 0 In−2 .. ⎟ ⎜ ... ⎟ ⎜ ... ⎝ .. 1 1 ⎠ . 0 0 1 Toute les formes linéaires dont le noyau est H sont proportionnelles, on en choisit une, φ, celle pour laquelle φ(b) = 1. Alors, tout vecteur x de E se décompose dans la somme directe H ⊕ vect(b), par x = x 1 + kb. Comme φ(x) = φ(x1 ) + kφ(b), on a k = φ(x) et x = x1 + φ(x)b. Et donc :
u(x) = u(x1 ) + φ(x)u(b) = x1 + φ(x)(a + b) = x + φ(x)a
i
i i
i
i
i
i
i
7.1 Les groupes linéaires et spécial linéaires
181
Réciproquement, si φ est une forme linéaire nulle pour le vecteur a non nul, la transformation définie par
τφ,a (x) = x + φ(x)a est une transvection d’hyperplan le noyau H de φ. Il n’y a pas unicité de cette écriture, mais 1 ∗ (τφ,a = τψ,a ) ⇐⇒ ∃k ∈ K , ψ = kφ et a = a k
7.1.2. Le groupe spécial linéaire On appelle groupe spécial linéaire le sous-groupe de GL(E) formé des endomorphismes de déterminant 1. Plus précisément Proposition 7.2. L’ensemble des automorphismes de E de déterminant 1 est un sous-
groupe distingué de GL(E) noté SL(E). Le quotient est isomorphe à (K ∗ , ×).
GL(E)/SL(E) K ∗
Démonstration. Il suffit en effet d’appliquer le théorème d’isomorphisme au morphisme « déterminant », qui est surjectif (prendre une matrice diagonale avec tous les coefficients diagonaux égaux à 1, sauf un). Et le noyau est le groupe spécial linéaire. Arrivons maintenant au théorème principal.
© Dunod. La photocopie non autorisée est un délit.
Théorème 7.3. Le groupe spécial linéaire est engendré par les transvections, le groupe linéaire est engendré par les transvections et les dilatations.
Démonstration. Commençons par donner deux propriétés géométriques des transvections : • Étant donnés deux vecteurs distincts non nuls u et v , il existe une transvection, ou un produit de deux transvections qui transforment u en v . En effet, si u et v sont indépendants, il suffit de prendre une transvection définie par τ (x) = x+φ(x)(v −u) où φ est une forme linéaire nulle pour v − u et valant 1 pour u. On a alors en effet τ (u) = u + (v − u) = v Si u et v sont dépendants et distincts, il ne peut y avoir une seule transvection (car l’image de u serait v colinéaire à u et distinct de u, or une transvection n’a pas de valeur propre différente de 1). On choisit alors un troisième vecteur w indépendant des deux premiers, et on compose deux transvections, transformant u en w puis w en v . • Étant donnés u non nul et H , H deux hyperplans distincts ne contenant pas u, il existe une transvection qui fixe u et qui transforme H en H . En effet, les deux hyperplans ont pour intersection un sous-espace F de dimension n − 2 ; une transvection d’hyperplan H = F ⊕ Ku va fixer le vecteur u. Soit maintenant y ∈ H \ F .
i
i i
i
i
i
i
i
182
7 • Groupes classiques
On peut décomposer y en x + z où x est dans H et z dans H (puisque la somme H + H est l’espace tout entier). Comme précédemment, il existe donc une transvection d’hyperplan H qui transforme x en y : on prend τ (x) = x + φ(x)z , où φ est une forme linéaire nulle sur H et valant 1 en x. Comme H = (H ∩ H ) ⊕ Kx et H = (H ∩ H ) ⊕ Ky cette transvection transforme H en H . Venons en à la démonstration du théorème. Soit f un élément du groupe linéaire et B = (e1 , . . . , en ). Si f (e1 ) = e1 , il existe une transvection t (ou deux transvections t et t telles que g = t ◦ f (ou g = t ◦ t ◦ f ) fixe le vecteur e1 . Si H = g(vect(e2 , e3 , . . . , en )) est distinct de H = vect(e2 , e3 , . . . , en ), il existe une transvection τ qui fixe e1 et qui envoie H sur H 1. Et donc h = τ ◦g laisse e1 fixe et stabilise H . On continue le processus avec la restriction de h à H , les transvections de H se prolongent à des transvections de E qui laissent fixe le vecteur e 1 . On arrivera en définitive à une application dont la matrice dans la base B est de la forme diag(1, 1, . . . , 1, λ). Comme les transvections ont pour déterminant 1, λ est le déterminant de f . Conclusion : cette matrice est celle de l’identité si on est dans SL(n, K), ou la matrice d’une dilatation sinon. Comme l’application réciproque d’une transvection est une transvection, on a bien démontré le théorème. Cette démonstration « géométrique » peut aussi être faite matriciellement : la première étape décrite peut s’interpréter ainsi : si M est une matrice inversible, on peut la multiplier par des matrices de transvections pour obtenir une matrice N de sorte que l’élément n11 soit égal à 1, tous les autres de la première ligne et de la première colonne étant nuls. On peut également n’utiliser que des matrices de transvection de la forme I + λEij , et on aboutit donc au même résultat par une méthode de pivot. Donnons maintenant quelques propriétés supplémentaires des transvections. Proposition 7.4. Le conjugué d’une transvection de E par un automorphisme de E
est une transvection, et toutes les transvections sont conjuguées.
Démonstration. Soit τφ,a la transvection d’hyperplan H = Ker φ et de vecteur a ∈ H . Alors, si g est un automorphisme de E ,
g ◦ τφ,a ◦ g−1 (x) = g g−1 (x) + φ(g−1 (x))a = x + φ ◦ g−1 (x)g(a) = τψ,g(a) (x) où ψ = φ ◦ g −1 , ce qui définit une transvection de plan g(H) et de vecteur g(a), puisque Ker(φ◦g −1 ) = g(Ker φ) comme on le vérifie aisément. On déduit également de ce calcul que deux transvections sont toujours conjuguées dans GL(E), puisque, si on se donne H et H d’équations respectives φ et ψ , a dans H et b dans H , on peut construire g de sorte que g(a) = b et g(H) = H , en complétant a et b en une base de H (resp. de H ), et en complétant la base de H (resp. de H ) par un vecteur en tel que φ(en ) = 1 (resp. en tel que ψ(en ) = 1) en une base de E . On aura alors φ ◦ g −1 = ψ , puisque ces applications coïncident pour les vecteurs de H et pour e n . 1. e1 = g(e1 ) n’est pas dans H car le rang de g est n.
i
i i
i
i
i
i
i
7.2 Le groupe orthogonal
183
Une petite application (déjà obtenue dans l’exercice 4.1) : Proposition 7.5. Le centre de GL(E) est formé des homothéties.
Démonstration. Si g est dans le centre de GL(E), g doit commuter à toutes les transvections, d’après le calcul précédent, on doit avoir g(a) colinéaire à a pour tout a, ce qui impose que g est une homothétie. Réciproquement, toute homothétie commute aux éléments de GL(E). Mais la seconde partie du théorème est plus intéressante : on en déduit que si un sous-groupe distingué de GL(E) contient une transvection, il les contient toutes, donc il contient tout le groupe spécial linéaire.
Exercice 7.1. Montrer que l’ensemble des transvections ayant un hyperplan donné
H (auxquelles on joint l’identité) est un groupe G pour la composition, isomorphe au groupe (H, +). Montrer que la réunion de ce groupe avec l’ensemble des dilatations ayant le même hyperplan H est encore un groupe G , et montrer que G est distingué dans G . Exercice 7.2. Soit K = Fq un corps fini ayant q éléments. Déterminer le nombre d’éléments de GL(n, K), de SL(n, K) : on remarquera qu’il suffit, pour se donner un élément de GL(E), de se donner l’image d’une base. Montrer que le groupe SL(n, F2 ) est isomorphe à S3 .
7.2 LE GROUPE ORTHOGONAL © Dunod. La photocopie non autorisée est un délit.
7.2.1. Généralités Soit E un espace vectoriel euclidien, de dimension n. L’objectif de ce paragraphe est d’étudier le groupe orthogonal O(E) des automorphismes de E qui conservent le produit scalaire. On peut commencer par rappeler Théorème 7.6. Un élément f de GL(E) est une transformation orthogonale (ou
une isométrie) si et seulement si l’une des conditions suivantes est réalisée : • ∀(x, y) ∈ E 2 ,
f (x), f (y) = x, y (c’est la définition.) f (x) = x • ∀x ∈ E, • L’image d’une base orthonormale est une base orthonormale. L’ensemble des transformations orthogonales de E est un sous-groupe de GL(E). On le note O(E), c’est le groupe orthogonal de E .
i
i i
i
i
i
i
i
7 • Groupes classiques
184
Démonstration. Si f conserve le produit scalaire, f conserve la norme. Réciproquement, la relation de polarisation montre qu’une application linéaire qui conserve la norme conserve le produit scalaire : 1 f (x) + f (y)2 − f (x) − f (y)2 2 1 f (x + y)2 − f (x − y)2 = 2 1 x + y2 − x − y2 = 2 = x, y
f (x), f (y) =
Par ailleurs, si f conserve norme et produit scalaire, alors f transforme toute base orthonormale en une base orthonormale. Réciproquement, si (e i ) est une base orthonormale et si f est une application linéaire telle que (f (e i )) soit aussi orthonormale, alors pour tout x de E : & &2 &2 & & & & & & & & & f (x)2 = &f xi ei & = & xi f (ei )& = x2i = x2 & & & & i
i
i
De plus, on a immédiatement, pour f et g dans O(E)
f ◦ g(x) = g(x) = x
et
f −1 (x) = f ◦ f −1 (x) = x.
Si B est une base orthonormale, la matrice O d’une transformation orthogonale est... orthogonale, c’est-à-dire qu’elle vérifie t OO = I . En particulier,
det(tOO) = det(tO) det(O) = det(O)2 = 1 Donc le déterminant d’une transformation orthogonale est ±1. Définition 7.7. L’ensemble des transformations orthogonales de déterminant
+1 est un sous-groupe distingué de O(E) ; c’est le groupe spécial orthogonal, noté SO(E). Ses éléments sont aussi appelées transformations orthogonales directes. [note : les autres transformations orthogonales sont dites indirectes]
La démonstration est analogue celle vue pour le groupe spécial linéaire : le groupe spécial orthogonal est le noyau du morphisme déterminant, restreint au groupe orthogonal. Remarquons que le groupe spécial orthogonal contient au moins l’identité. Nous verrons dans un paragraphe suivant que O(E)\SO(E) = O − (E) est non vide : le groupe spécial orthogonal est donc d’indice 2. Terminons ce paragraphe par l’exemple immédiat de la dimension 1 : le groupe orthogonal ne contient que ±id E , la seule transformation directe est id E .
i
i i
i
i
i
i
i
7.2 Le groupe orthogonal
185
7.2.2. Images de sous-espaces Parmi les propriétés des transformations orthogonales, l’une est particulièrement utile, car elle permet souvent de décrire une transformation en se restreignant à des sousespaces. Proposition 7.8. Soit f une transformation orthogonale de E . Alors, si F est stable
par f , son supplémentaire orthogonal F ⊥ est aussi stable par f .
Démonstration. ∀x ∈ F, ∀y ∈ F ⊥ ,
f (y), f (x) = x, y = 0
et, par hypothèse f (x) parcourt F = f (F ), donc l’image de F ⊥ est incluse dans F ⊥ , il y a égalité puisque f est bijective. On peut aussi se rappeler des résultats concernant l’adjoint d’un endomorphisme. Parmi les sous-espaces stables d’un endomorphisme, il y a les sous-espaces propres. Pour une transformation orthogonale f , les seules valeurs propres possibles sont 1 et −1, puisque f (x) = x. On a alors : Proposition 7.9. Si f est une transformation orthogonale,
Ker(f − id) ⊕ Im(f − id) = E et cette somme est orthogonale.
Démonstration. Soit x ∈ Ker(f − id) et y ∈ Im(f − id). Il existe z ∈ E tel que y = f (z) − z et : x, y = x, f (z) − z = f (x), f (z) − x, z = x, z − x, z = 0
© Dunod. La photocopie non autorisée est un délit.
Les sous-espaces sont donc orthogonaux, le théorème du rang permet d’affirmer qu’ils sont supplémentaires orthogonaux.
7.2.3. Les réflexions Comme dans tout groupe, il est intéressant d’étudier les éléments dont l’ordre est petit ; on sait déjà que les éléments d’ordre deux du groupe linéaire sont les symétries vectorielles. Dans le cas euclidien, on peut dire : Proposition 7.10.
• Un automorphisme involutif s de E est une transformation orthogonale si et seulement si c’est une symétrie par rapport à un sous-espace vectoriel F , suivant son orthogonal F ⊥ . Dans le cas où F est un hyperplan, on dit que s est une réflexion, dans le cas où F est de codimension 2, on dit que s est un retournement. • Les symétries sont dans le groupe spécial orthogonal lorsque la codimension de F est paire. En particulier, les réflexions sont toujours dans O − (E), les retournements dans SO(E)
i
i i
i
i
i
i
i
7 • Groupes classiques
186
Démonstration. On se donne E = F ⊕ F , s est la symétrie par rapport à F suivant F . Alors, si x = x1 + x2 est l’écriture d’un vecteur x quelconque dans cette somme directe, s(x)2 − x2 = x1 − x2 2 − x1 + x2 2 = −4x1 , x2 et s sera une transformation orthogonale si et seulement si tout vecteur de F est orthogonal à tout vecteur de F . Enfin, l’écriture dans une base de diagonalisation (que l’on peut prendre d’ailleurs orthonormale), prouve que le déterminant de s est ⊥ (−1)dim F . Muni de ce vocabulaire, on peut donner maintenant des générateurs du groupe orthogonal et du groupe spécial orthogonal. Théorème 7.11. Le groupe O(E) est engendré par les réflexions, et toute isométrie peut s’écrire comme composée de k réflexions où k = n − dim(Ker(f − id E )). Le groupe SO(E) est engendré par les retournements, quand la dimension de E est supérieure ou égale à trois.
Démonstration. Commençons par noter l’analogie avec le groupe S n qui est engendré par les transpositions, tandis que le groupe A n est engendré par les 3-cycles (n 3). Cas du groupe orthogonal. On procède par récurrence sur la dimension, le résultat étant immédiat en dimension 1 puisque la seule réflexion est s = −id et s ◦ s = id. Supposons le théorème vrai pour la dimension n et soit f une transformation orthogonale de E de dimension n + 1. • Si f admet un vecteur invariant non nul x, l’hyperplan H = {x} ⊥ est stable par f , et la restriction f de f à cet hyperplan est composée de k réflexions s i . On peut prolonger ces réflexions de l’hyperplan H en des réflexions σ i de l’espace tout entier, il suffit de poser σi (x) = x et σi|H = si . Ainsi f est composé de k réflexions. De plus,
k = n − dim(Ker(f − idH )) = (n + 1) − (dim(Ker(f − idH )) + 1) = (n + 1) − dim(Ker(f − idE )) puisque Ker(f − idE ) = Ker(f − idH ) ⊕ vect(x) • Si f n’admet aucun vecteur invariant non nul, soit x quelconque non nul et y = f (x). Alors il existe une réflexion s telle que s(y) = x ; il suffit de prendre la réflexion d’hyperplan {y − x} ⊥ : en effet, cet hyperplan contient alors x + y puisque :
x − y, x + y = x − f (x), x + f (x) = x, x − f (x), f (x) = 0 d’où
1 1 1 1 x = (x + y) + (x − y) donc s(x) = (x + y) − (x − y) = y 2 2 2 2 On considère alors la transformation orthogonale g = s ◦ f . Elle admet x comme vecteur invariant, donc est composée de réflexions. De plus, Ker(g − id E ) est de
i
i i
i
i
i
i
i
7.3 La dimension deux
187
dimension 1, car si g admettait au moins un plan de vecteurs invariants, il y aurait un vecteur invariant non nul dans l’hyperplan de s, et ce vecteur serait invariant par g et par s donc par f . En utilisant la première partie de la démonstration, g est composé de n réflexions, donc f = s ◦ g est composé de n + 1 réflexions. Cas du groupe spécial orthogonal. Tout élément de SO(E) est composé d’un nombre pair de réflexions. Nous allons montrer que le composé de deux réflexions distinctes est égal au composé de deux retournements. En dimension 3, si s H est la réflexion de plan H , alors −s H est le retournement d’axe H ⊥ : en effet, le rôle des valeurs propres 1 et −1 est échangé. On a donc s H ◦ sH = (−sH ) ◦ (−sH ) et le résultat est démontré. En dimension supérieure, on se ramène à ce cas : si H = {x}⊥ et H = {y}⊥ sont deux hyperplans distincts, et z un vecteur non nul de leur intersection, alors L = vect(x, y, z) est un sous-espace de dimension 3, stable par les réflexions. Le composé de ces restrictions est égal au composé des deux retournements d’axes vect(x) et vect(y). En prolongeant ses retournements par id de L⊥ , on obtient deux retournements de l’espace tout entier, dont le composé est égal au composé des réflexions. Bien entendu, le résultat est faux en dimension deux (il n’y a qu’un seul retournement, −id, qui n’engendre pas le groupe spécial orthogonal).
Exercice 7.3. Soit E un espace vectoriel euclidien et u un vecteur non nul. Démontrer
que l’application s définie par
∀x ∈ E
s(x) = x − 2
u, x u u, u
est la réflexion d’hyperplan {u} ⊥ . Application : en dimension 3, écrire la forme générale de la matrice d’une réflexion, en base orthonormale.
© Dunod. La photocopie non autorisée est un délit.
Exercice 7.4. Soit E = R muni de sa structure euclidienne canonique. Trouver une
application u de E dans E qui conserve la norme mais qui n’est pas une transformation orthogonale.
7.3 LA DIMENSION DEUX 7.3.1. Rotations et réflexions planes On a vu que le groupe orthogonal d’une droite euclidienne est simplissime puisqu’il se réduit à ±idE . Le groupe orthogonal d’un plan vectoriel euclidien est plus riche, mais on peut le décrire explicitement assez facilement. Théorème 7.12. Si E est de dimension 2, le groupe SO(E) est commutatif. Ses éléments sont appelés rotations. L’ensemble des transformations orthogonales indirectes est formé de toutes les réflexions.
i
i i
i
i
i
i
i
7 • Groupes classiques
188
Démonstration. Le théorème général prouve que, puisque la dimension est deux, toute transformation orthogonale est composée de une ou de deux réflexions. Le composé de deux réflexions est forcément un élément du groupe spécial orthogonal, d’où la seconde affirmation du théorème. Soit maintenant r ∈ SO(E), et s une réflexion. Alors, s ◦ r ◦ s = r −1 . En effet, s ◦ r est un élément de O(E) \ SO(E), donc est une réflexion, donc est involutive : s ◦ r = (s ◦ r)−1 = r −1 ◦ s d’où s ◦ r ◦ s = r −1 Si maintenant r = s ◦ s est une rotation quelconque,
r ◦ r ◦ r −1 = s ◦ (s ◦ r ◦ s−1 ) ◦ s = s ◦ r −1 ◦ s = r et donc r et r commutent.
Remarque : Toute rotation est composée de deux réflexions. Il peut être utile de remarquer que l’une des deux peut être choisie arbitrairement. En effet, si on se donne r rotation et s réflexion, alors r ◦ s est une isométrie indirecte donc une réflexion s , on a alors r ◦ s = s d’où r = s ◦ s. On peut faire le même calcul en échangeant les rôles de s et de s . 7.3.2. Matrices orthogonales en dimension deux Dans le cas du plan on peut donner la forme explicite des matrices orthogonales. Proposition 7.13. Les éléments de O(2, R) sont de la forme
M=
cos θ − sin θ sin θ cos θ
où θ est un réel. De même, les éléments de O(2, R) \ SO(2, R) sont de la forme cos θ sin θ N= , θ∈R sin θ − cos θ
Démonstration. Soit B = (e1 , e2 ) une base orthonormale. Si f est un élément de O(E), r(e1 ) est un vecteur unitaire, dont les coordonnées (a, b) dans la base B vérifient a2 + b2 = 1. Il existe donc un réel θ tel que a = cos θ et b = sin θ . Comme f (e2 ) est orthogonal à f (e1 ), il a pour coordonnées (a , b ) tels que aa + bb = 0. Donc (a , b ) est proportionnel à (−b, a). Comme de plus (a , b ) doit être unitaire, il y a deux possibilités seulement, (a , b ) = (−b, a) = (− sin θ, cos θ) ou (a , b ) = (b, −a) = (sin θ, − cos θ). Dans le premier cas, la matrice est de déterminant 1, c’est la matrice d’un élément de SO(E), dans le second cas, c’est la matrice d’une réflexion. Les deux ensembles de matrices ainsi décrits se notent SO(2, R) et O − (2, R), groupe des matrices orthogonales directes, ensemble des matrices orthogonales indirectes respectivement.
i
i i
i
i
i
i
i
7.3 La dimension deux
189
7.3.3. Orientation du plan Examinons plus précisément la matrice d’une rotation donnée, en base orthonormale. Si M est la matrice de r dans une base B et M sa matrice dans une autre base C , également orthonormale, alors la matrice de passage P est orthogonale et M = P −1 M P . Mais si P est orthogonale directe, les matrices P et M commutent et M = M . Si par contre P est indirecte, le calcul fait plus haut montre que M = M −1 = tM . On décide donc la convention suivante. Définition 7.14. On dit que l’on a orienté le plan vectoriel euclidien si on a
choisi une base orthonormale. Les bases qui s’en déduisent par un élément de SO(E) seront appelées directes, les autres seront indirectes. à chaque rotation une unique matrice orthogonale, de la forme On peut alors attacher cos θ − sin θ celle qui la représente dans toutes les bases directes. sin θ cos θ
Remarque : La situation est très différente pour les réflexions : si s est une réflexion, sa matrice en base orthonormale est orthogonale indirecte, mais change lorsqu’on change de base orthonormale. En particulier, il existe toujours une base orthonormale telle que la matrice de s prenne la forme 1 0 , c’est une base de diagonalisation de s. 0 −1 Rappelons maintenant le résultat d’Analyse suivant : l’application θ → e iθ est un morphisme surjectif du groupe (R, +) sur le groupe multiplicatif U des nombres complexes de module 1. Son noyau est 2πZ. On a donc :
(R/2πZ, +) (U, ×) On utilise ce résultat pour obtenir la proposition L’application de R dans SO(E) donnée par θ → rot(θ) où rot(θ) est la rotation dont la matrice dans une base orthonormale directe est cos θ − sin θ est un morphisme surjectif de groupes, de noyau 2πZ. On dit que sin θ cos θ θ (ou sa classe modulo 2π .) est l’angle de la rotation, et on a
© Dunod. La photocopie non autorisée est un délit.
Proposition 7.15.
rot(θ) ◦ rot(θ ) = rot(θ + θ )
Démonstration. Il suffit d’observer que le groupe SO(2, R) est isomorphe à U. Cela résulte de ce que l’ensemble des matrices de la forme a −b 1 0 0 −1 =a +b = aI + bJ, a, b ∈ R b a 0 1 1 0 est un corps isomorphe au corps C des complexes, en associant à une telle matrice le complexe a + bi, car la matrice J a pour carré −I . Tout nombre complexe de la forme cos θ − sin θ iθ e correspond à la matrice . sin θ cos θ
i
i i
i
i
i
i
i
7 • Groupes classiques
190
7.3.4. Les angles de vecteurs en dimension deux La notion d’angle est fondamentale en géométrie. Dans ce paragraphe nous allons nous contenter d’une introduction, en restant dans le cadre d’un espace vectoriel euclidien de dimension 2 ou 3. On peut s’aider d’une analogie, en regardant le cours de géométrie, entre le cas des rotations et des vecteurs unitaires d’un côté, des translations et des points d’un autre côté. Théorème 7.16. Le groupe des rotations agit simplement transitivement sur l’en-
semble des vecteurs unitaires du plan vectoriel.
Démonstration. Soit u et v deux vecteurs unitaires du plan vectoriel. On peut compléter u par u , de sorte que (u, u ) soit une base orthonormale. Il est alors possible de trouver une rotation unique qui transforme u en v , celle dont la matrice dans la base (u, v) a pour première colonne les coordonnées de v dans la base (u, v). Il y a alors unicité, car la seconde colonne est imposée. Remarquons qu’il y a aussi unicité de la réflexion qui transforme u en v . Si u et v sont deux vecteurs unitaires du plan, il existe donc une seule rotation r telle que v = r(u). Dans le cas où le plan est orienté, on peut donc énoncer : Définition 7.17. Soit u et v deux vecteurs unitaires. Si la rotation qui transforme u en v est d’angle θ , on dit que θ est l’angle du couple (u, v) et on écrit : θ = (u, v) L’ensemble R/2πZ est noté A, c’est le groupe des angles.
On notera 0 (angle nul), l’élément neutre de A, c’est l’angle de l’identité, et donc (u, u) = 0 pour tout u. Dans le même ordre d’idées, l’angle plat est l’angle de la rotation −idE = rot(π). La proposition suivante donne des propriétés importantes des angles. Proposition 7.18.
∀u, v, w ∈ E, (u, v) + (v, w) = (u, w) ∀u, v ∈ E, (u, v) = −(v, u) , v ) ⇐⇒ (u, v) = (u u ) = (v, v ) ∀u, v, u , v ∈ E, (u,
Démonstration. La première propriété est connue sous le nom de « relation de Chasles ». Soit r telle que v = r(u) et r telle que w = r (v). On a donc w = r (r(u)) et il suffit d’appliquer la définition ci-dessus concernant la somme des angles. La seconde propriété résulte de l’équivalence v = r(u) ⇐⇒ u = r −1 (v), les angles (u, v) et (v, u) correspondent donc à des angles opposés.
i
i i
i
i
i
i
i
7.3 La dimension deux
191
Montrons la troisième propriété. Soit r et r les rotations telles que v = r(u) et , v ), on a u = r (u). Alors, si (u, v) = (u
v = r(u ) = r ◦ r (u) = r ◦ r(u) = r (v) et on a donc bien (u, v ). On peut remarquer le rôle décisif de la commutau ) = (v, tivité du groupe des rotations. Les transformations orthogonales conservent les produits scalaires : quelle est leur action sur les angles ? Proposition 7.19. Les rotations conservent les angles de vecteurs, les réflexions les
opposent.
Démonstration. Soient (u, v) un angle de vecteurs unitaires, r la rotation telle que v = r(u) et s une réflexion. Alors, comme nous l’avons vu dans la démonstration du théorème 7.12, s ◦ r ◦ s = r −1 d’où s(v) = s(r(u)) = r −1 (s(u)) et donc (s(u), s(v)) = −(u, v). Comme une rotation est composée des deux réflexions, en appliquant deux fois de suite ce résultat, on obtient qu’une rotation conserve les angles. Terminons en remarquant que pour les angles, on confond souvent un élément de R/2πZ avec un de ses représentants, que l’on appelle une de ses mesures. Ainsi l’angle nul est l’angle dont une mesure est de la forme 2kπ , avec k ∈ Z, ou dont les mesures sont congrues à 0 modulo 2π . Le représentant qui est dans l’intervalle ] − π, π] s’appelle souvent mesure principale de l’angle.
© Dunod. La photocopie non autorisée est un délit.
7.3.5. Autres angles La notion d’angle peut être généralisée, mais il n’est pas toujours possible de faire de l’ensemble des angles un groupe comme nous l’avons fait pour l’ensemble des angles orientés de vecteurs unitaires. Donnons seulement des pistes qui seront prolongées dans les chapitres de géométrie. • Angle orienté de vecteurs non nuls u, v du plan. C’est par définition l’angle (orienté) u v et v . Comme pour les vecteurs unitaires, un tel angle des vecteurs unitaires u (confondu avec une mesure θ ) est caractérisé par le cosinus et le sinus : ⎧ u,v ⎨ cos θ = u v (u, v) = θ ⇐⇒ detB (u, v) ⎩ sin θ = u v où B est orthonormale directe. En particulier, le déterminant des deux vecteurs est indépendant de la base orthonormale directe.
i
i i
i
i
i
i
i
192
7 • Groupes classiques
• Angle orienté de droites vectorielles D et D du plan. Si u et v sont des vecteurs v) directeurs respectifs de D et de D , l’angle (D, D ) est la réunion des angles (u, et (u, −v). Ces angles ont des mesures qui diffèrent de π , et le groupe A des angles de droites est isomorphe au groupe R/πZ muni de l’addition. On vérifie facilement qu’un tel angle orienté est caractérisé par sa tangente. • Angle non orienté de vecteurs non nuls u et v d’un espace vectoriel euclidien (de dimension quelconque). C’est le réel u, v u ' , v = arccos u v qui est donc dans l’intervalle [0, π]. Si u et v sont non colinéaires et si le plan qu’ils engendrent est orienté, il existe une mesure de l’angle orienté dans ] − π, π], et ' , v = v' , u, ce l’angle non orienté est la valeur absolue de cette mesure. On a ainsi u qui justifie le vocabulaire « angle non orienté ». L’ensemble des angles non orientés ne peut être muni d’une structure de groupe de sorte que la relation de Chasles soit satisfaite. Terminons en remarquant que l’on peut orienter un espace vectoriel euclidien de dimension quelconque comme nous l’avons fait en dimension 2, en choisissant une base orthonormale. Mais cette orientation n’induit pas une orientation des sousespaces. Même si un espace de dimension 3 a été orienté, il n’en résulte pas d’orientation canonique des plans, on ne peut alors définir l’angle orienté d’un couple de vecteurs de l’espace.
Exercice 7.5. Soit D = vect(u) une droite vectorielle du plan vectoriel euclidien orienté. On suppose que u a pour coordonnées (cos φ, sin φ) dans une base orthonormale directe B . Donner la matrice de la réflexion s D d’axe D . Avec les hypothèses précédentes, on suppose que D est dirigée par u de coordonnées (cos φ , sin φ ), déterminer la rotation s D ◦ sD .
Exercice 7.6. Montrer que l’application θ → θ + θ est un isomorphisme entre le
groupe des angles orientés de droites et le groupe des angles orientés de vecteurs. Lien avec l’exercice précédent ?
Exercice 7.7. Déterminer, dans le groupe des angles, les éléments d’ordre 2 et les
éléments d’ordre 4.
i
i i
i
i
i
i
i
7.4 Décomposition des transformations orthogonales
193
7.4 DÉCOMPOSITION DES TRANSFORMATIONS ORTHOGONALES 7.4.1. La dimension trois Nous allons maintenant examiner le cas des transformations orthogonales d’un espace vectoriel euclidien de dimension trois. Moins simple qu’en dimension deux, cette étude est néanmoins très importante pour les applications à la géométrie. Le théorème fondamental sur les transformations orthogonales se précise : Théorème 7.20. Soit E un espace vectoriel euclidien de dimension 3. Si f = id est un élément de SO(E), l’ensemble des ses vecteurs invariants est une droite vectorielle D , et la restriction de f à D ⊥ est une rotation d’angle non nul. On dit que f est une rotation d’axe D . Si f est un élément de O(E) \ SO(E), soit c’est une réflexion, soit c’est le composé commutatif d’une rotation d’axe D et de la réflexion par rapport à D⊥.
© Dunod. La photocopie non autorisée est un délit.
Démonstration. On sait qu’une transformation orthogonale f est la composée d’une, de deux ou de trois réflexions : si elle est directe, c’est la composée de deux réflexions. Examinons ce cas. Si les réflexions sont les mêmes, c’est l’identité. Sinon, f = s H ◦sH et D = H ∩ H est formée de vecteurs invariants. De plus, H = D ⊥ est un plan, stable par f . La restriction de f à ce plan est composée des deux réflexions par rapport aux droites H ∩ H et H ∩ H , c’est donc une rotation. On peut observer que toute isométrie admettant pour ensemble de vecteurs invariants une droite D est réciproquement composée de deux réflexions, car la restriction à H = D ⊥ est une transformation orthogonale n’ayant pas de vecteurs invariants, donc composée de deux réflexions de ce plan : il est alors aisé de reconstruire les plans H et H . De même, une transformation orthogonale admettant pour ensemble de vecteurs invariants un plan H est une réflexion, car la restriction à H ⊥ ne peut être que −id. Reste à examiner le cas où f est composée de trois réflexions, et dans ce cas f ne peut avoir aucun vecteur invariant autre que 0. Comme on est en dimension 3, le polynôme caractéristique admet au moins une valeur propre réelle, qui ne peut être que −1. Soit D la droite engendrée par un vecteur propre. Alors la restriction de f à D ⊥ est une transformation orthogonale du plan sans vecteur invariant, c’est une rotation. Si on note s la réflexion de plan D ⊥ et r la rotation de l’espace ayant pour axe D et même restriction que f à D ⊥ , il est facile de vérifier que f = r ◦ s = s ◦ r . Sauf dans le cas de −id, il y a unicité de r et de s.
Remarque : Il est intéressant de remarquer que l’application f → −f est une bijection de SO(E) sur O(E) \ SO(E) (cela est vrai plus généralement en dimension impaire).
i
i i
i
i
i
i
i
7 • Groupes classiques
194
Autre remarque : supposons que f soit une rotation d’axe D et que l’espace E soit orienté ; alors on peut orienter D (i.e. choisir une base orthonormale B1 = (k)) et décider d’orienter D ⊥ en choisissant une base orthonormale B2 = (i, j) de sorte que B = (i, j, k) soit directe. Il est alors possible de mesurer l’angle de la rotation f en disant que c’est l’angle (orienté) de sa restriction dans le plan orienté D ⊥ . 7.4.2. Cas général On peut donner des résultats qui généralisent les études en dimension 2 et 3. Proposition 7.21. Soit f une transformation orthogonale de l’espace vectoriel euclidien E . Il existe des sous-espaces E 1 , E−1 , P1 ,. . . ,Pk tels que :
(1) Les Pi sont de dimension 2. (2) E est somme directe orthogonale de tous ces sous-espaces. (3) Ces sous-espaces sont stables par f et : la restriction de f à E 1 est l’identité, la restriction de f à E−1 est −id, la restriction de f à Pk est une rotation d’angle ni nul, ni plat.
Démonstration. On procède par récurrence sur la dimension. Les sous-espaces E 1 et E−1 sont les sous-espaces propres associés à la valeur propre 1 (resp. −1), ou bien sont réduits au vecteur nul. Si donc on admet que la proposition est vraie en dimension strictement inférieur à n, on a : • Soit f admet la valeur propre réelle 1 et E = E 1 ⊕ E1⊥ , on applique l’hypothèse de récurrence à la restriction de f à E 1⊥ . • Même démarche si f a la valeur propre réelle −1. • Reste le cas où f n’a pas de valeur propre réelle. Montrons qu’il existe un plan stable : on sait que le polynôme minimal de f peut s’écrire µf (X) = (X 2 + aX + b)R(X) où X 2 + aX + b est sans racine réelle. Soit alors x ∈ Ker(f 2 + af + bidE ), x non nul. Alors x et f (x) engendrent un plan P puisque x n’est pas vecteur propre, et f 2 (x) = −af (x) − bx est dans P . Donc l’image de tout vecteur combinaison de x et de f (x) est dans P . Ce plan est stable, la restriction de f à P est une rotation (il n’y a pas de vecteur propre), différente de ±id. On applique ensuite l’hypothèse de récurrence au supplémentaire orthogonal de P . Une remarque : il n’ y a pas unicité en général de la suite des plans P i , mais les cos θi sont déterminés.
i
i i
i
i
i
i
i
Exercices
195
EXERCICES Exercice 7.8. Soit E un espace vectoriel euclidien. Soit f une transformation antisymétrique, c’est-à-dire telle que f ∗ = −f .
(1) Montrer que f + id et f − id sont bijectives. (2) On pose u = (id − f ) ◦ (id + f )−1 . Montrer que u est dans SO(E). Vérifier que −1 n’est pas valeur propre de u. (3) Préciser u en fonction de la matrice de f dans une base orthonormale, dans les cas de la dimension 2 et de la dimension 3. (4) On se donne v de SO(E) n’admettant pas la valeur propre −1. Trouver f antisymétrique telle que v = (id − f ) ◦ (id + f )−1 . Exercice 7.9.
(1) Soit r ∈ SO(E) où E est euclidien de dimension 3. Montrer qu’il existe une base orthonormale B telle que la matrice de r dans cette base soit de la forme ⎛ ⎞ 1 0 0 MB (r) = ⎝0 cos θ − sin θ⎠ 0 sin θ cos θ (2) Soit A une matrice orthogonale directe en dimension 3. Montrer que c’est la matrice en base orthonormale d’un retournement (on dit aussi demi-tour) si et seulement si sa trace est -1.
© Dunod. La photocopie non autorisée est un délit.
(3) Déterminer la nature de l’isométrie dont la matrice dans une base orthonormale est : √ √ ⎞ ⎛ 2 − 6 − 6 1 ⎝√ A= 6 3 −1 ⎠ 4 √ 6 −1 3 Exercice 7.10. E est un espace vectoriel euclidien de dimension 3. Si s et s sont des
réflexions de plans H et H , montrer que s ◦ s = s ◦ s si, et seulement si, H et H sont confondus ou perpendiculaires 2. Exercice 7.11. Soit B = (e1 , e2 , e3 ) une base orthonormale d’un espace vectoriel
euclidien de dimension 3. On considère l’ensemble G des transformations orthogonales qui laissent stable l’ensemble {±e 1 , ±e2 , ±e3 }. Combien G a-t-il d’éléments ? Montrer que G est un groupe et décrire les trois cas suivants : • g(e1 ) = e2 , g(e2 ) = e1 , g(e3 ) = e3 . • h(e1 ) = e2 , h(e2 ) = e3 , h(e3 ) = e1 . • k(e1 ) = −e1 , k(e2 ) = e3 , k(e3 ) = e2 . 2. Deux plans sont dits perpendiculaires lorsque l’orthogonal de l’un est inclus dans l’autre.
i
i i
i
i
i
i
i
7 • Groupes classiques
196
PROBLÈME Le corrigé de ce problème est disponible sur le site de Dunod : www.dunod.com.
7.1. DÉCOMPOSITIONS MATRICIELLES (1) La décomposition LU. On suppose que A est une matrice carrée inversible, et que chaque étape de la méthode de Gauss donne un pivot non nul. Montrer qu’il existe deux matrices triangulaires L (triangulaire inférieure) et U (triangulaire supérieure) telles que A = LU . On utilisera la méthode du pivot de Gauss, en observant que chaque opération élémentaire de la forme L i −→ Li + λLj où j < i, revient à multiplier A par une matrice de transvection, triangulaire inversible, et que le résultat du pivot est une matrice triangulaire supérieure inversible. On parle de décomposition LU (lower, upper). ⎛ ⎞ 5 2 1 Traiter l’exemple de A est la matrice ⎝ 5 −6 2⎠, −4 2 1 (2) Montrer qu’une matrice A a une décomposition LU si et seulement si ses mineurs principaux sont non nuls. On rappelle que les mineurs principaux de A sont les n déterminants det(ai,j )1i,jk pour k = 1 à n. (3) La décomposition polaire. Il s’agit de décomposer un endomorphisme dans un espace vectoriel réel E , muni d’une structure euclidienne, ou dans un espace vectoriel complexe E , muni d’une structure hermitienne. Montrer que tout élément u de GL(E) s’écrit de façon unique comme composé d’une transformation orthogonale o et d’un endomorphisme symétrique défini positif s (resp. d’une transformation unitaire et d’un endomorphisme autoadjoint défini positif). Matriciellement, on aura M = OS ou M = S O . On commencera par trouver S en calculant t M M (resp. M ∗ M ) Examiner le cas de la dimension 1 (dans le cadre réel ou dans le cadre complexe). (4) Montrer qu’un endomorphisme non inversible admet aussi une décomposition polaire, mais on perd l’unicité de O, et S n’est pas définie positive. (5) La décomposition QR. L’idée est encore de faire apparaître une matrice triangulaire, en multipliant M par des matrices convenables. Montrer que toute matrice inversible peut s’écrire M = QR où Q est (orthogonale)(unitaire) et R est triangulaire supérieure. Il y a unicité si les coefficients diagonaux de R sont positifs. On emploiera une méthode de « pivot », avec l’idée que si a est un vecteur non nul, il est facile de trouver une réflexion qui transforme a en un vecteur colinéaire à e 1 ; il suffit de déterminer un vecteur normal, a − ||a||e 1 convient. Multipliant M de première colonne a par la matrice de la réflexion correspondante, on obtient une première colonne colinéaire à e1 et on poursuit.
i
i i
i
i
i
i
i
Solutions des exercices
197
(6) La décomposition d’Iwasawa. Montrer que toute matrice inversible s’écrit comme produit d’une matrice orthogonale, d’une matrice diagonale à coefficients strictement positifs, d’une matrice unipotente triangulaire supérieure 3. On pourra s’inspirer du procédé dit de GramSchmidt qui permet d’obtenir une base orthonormale à partir d’une base quelconque. (7) La décomposition de Cartan. Montrer que toute matrice de SL(E) s’écrit KAK où K et K sont dans SO(E) et A est diagonale à coefficients positifs.
SOLUTIONS DES EXERCICES Solution 7.1. Soit φ une forme linéaire de noyau H . Alors toute transvection τ
d’hyperplan H a une expression de la forme : τ (x) = x + φ(x)a où a ∈ H . Si on autorise a = 0, on a aussi l’identité. On peut alors composer τ et τ :
τ ◦ τ (x) = τ (x + φ(x)a) = x + φ(x)a + φ(x + φ(x)a)a = x + φ(x)(a + a )
© Dunod. La photocopie non autorisée est un délit.
puisque φ(a) = 0. Cette relation prouve que τ → a est un morphisme de l’ensemble des transvections d’hyperplan H (auquel on ajoute l’identité) avec le groupe additif (H, +). Il est vite vérifié que c’est un isomorphisme de cet ensemble G avec le groupe H . Si on ajoute à cet ensemble de transvections les dilatations d’hyperplan H , on obtient nécessairement un groupe G , qui est le stabilisateur de H dans l’action du groupe linéaire. Attention, le composé de deux dilatations de même hyperplan H est tantôt une dilatation, tantôt une transvection (lorsque le produit des rapports est égal à 1). Il suffit, pour s’en convaincre, d’utiliser une représentation matricielle. Par ailleurs, en considérant le morphisme déterminant, G est distingué dans G .
Solution 7.2. Soit K un corps fini ayant q éléments, et E un espace vectoriel de
dimension n sur K . On va dénombrer les bases de E : ayant choisi un vecteur e 1 non nul parmi q n − 1 (on a enlevé le vecteur nul), il faut choisir un vecteur e 2 qui n’est pas dans les q vecteurs colinéaires à e 1 , cela donne q n − q choix, puis on doit choisir un vecteur qui n’est pas dans le plan engendré par les deux vecteurs précédemment choisi, cela laisse q n − q 2 choix, et donc le cardinal de l’ensemble des bases de E est :
B = (q n − 1)(q n − q)(q n − q 2 ) . . . (q n − q n−1 ) Un élément de GL(n, Fq ) est déterminé par l’image d’une base, donc le cardinal de ce groupe est le nombre B écrit plus haut. Pour dénombrer l’ensemble SL(n, F q ), il suffit d’utiliser le théorème d’isomorphisme : comme le morphisme déterminant de GL(n, F q ) dans F× q est surjectif et que 3. C’est une matrice triangulaire supérieure dont tous les éléments diagonaux sont égaux à 1.
i
i i
i
i
i
i
i
7 • Groupes classiques
198
son noyau est SL(n, Fq ), le cardinal de ce groupe est
(q n − 1)(q n − q)(q n − q 2 ) . . . (q n − q n−1 ) q−1 En particulier SL(2, F2 ) a pour cardinal 6. Ce groupe se confond avec GL(2, F 2 ), puisque la seule valeur possible d’un déterminant non nul est 1 (F 2 = Z/2Z). C’est un groupe non commutatif à six éléments, il est donc nécessairement isomorphe à S 3 , et on peut réaliser cet isomorphisme en regardant l’action sur les trois droites vect(e 1 ), vect(e2 ) et vect(e1 +e2 ). À noter, le groupe SL(2, F3 )) est de cardinal 24 mais il n’est pas isomorphe à S4 . Voir par exemple [6].
Solution 7.3. Commençons par déterminer la projection orthogonale p(x) de x sur la
droite vect(u). C’est un vecteur de la forme λu, et x − λu doit être orthogonal à u :
x − λu, u = 0 ⇐⇒ λ =
u, x u, u
Maintenant, si on considère la somme directe vect(u) ⊕ {u} ⊥ , on a x = p(x) + x2 et s(x) = −p(x) + x2 donc s(x) = x − 2p(x) d’où le résultat. Dans le cas de la dimension 3, prenons pour simplifier les écritures u de coordonnées a, b, c telles que a2 + b2 + c2 = 1. On a alors : ⎛ ⎞ ⎛ ⎞ x1 a s(x) = ⎝x2 ⎠ − 2(ax1 + bx2 + cx3 ) ⎝ b ⎠ x3 c ⎞ ⎛ ⎞ ⎛ −2ac 1 − 2a2 −2ab x1 = ⎝ −2ab 1 − 2b2 −2bc ⎠ ⎝x2 ⎠ x3 −2ac −2bc 1 − 2c2 et l’on a la forme générale des matrices de réflexion en dimension 3.
Solution 7.4. La norme « canonique » sur R est la valeur absolue. Prenons alors tout simplement f (x) = |x|. Alors |f (x)| = |x|, et f n’est pas linéaire.
Solution 7.5. On peut utiliser la méthode de l’exercice 7.3, en remarquant qu’un
vecteur normal à D est (− sin φ, cos φ). x1 − sin φ sD (x) = − 2(−x1 sin φ + x2 cos φ) x2 cos φ x1 1 − 2 sin2 φ 2 sin φ cos φ = x2 2 sin φ cos φ 1 − 2 cos2 φ
i
i i
i
i
i
i
i
Solutions des exercices
199
Cette matrice peut aussi s’écrire
MB (sD ) =
cos 2φ sin 2φ sin 2φ − cos 2φ
qui est bien orthogonale indirecte. Si maintenant on fait le produit des matrices de s D et de sD , on obtient : cos 2(φ − φ) − sin 2(φ − φ) MB (sD ◦ sD ) = sin 2(φ − φ) cos 2(φ − φ) c’est la matrice de la rotation d’angle
2(φ − φ) = 2((e 1 , u ) − (e1 , u)) = 2(u, u )
Solution 7.6. Soit A le groupe des angles de droites, identifié au groupe quotient
R/πZ. Comme 2πZ est inclus dans πZ, l’application θ → 2θ est un morphisme. Ainsi, le double d’un angle de droites est un angle de vecteurs. Plus géométriquement, à un angle de droites correspond deux angles de vecteurs selon le choix qu’on fait des vecteurs directeurs, et ces deux angles diffèrent de π donc ils ont même double. Pour l’exercice précédent, on peut dire que la rotation s D ◦ sD a pour angle le « double » de l’angle (D, D ).
© Dunod. La photocopie non autorisée est un délit.
Solution 7.7. Dans le groupe des angles A, un angle α est d’ordre 2 s’il est non nul et si α + α = 0. C’est l’angle d’une rotation involutive. Si on utilise les mesures, la seule solution est π modulo 2π , mais on peut aussi utiliser les rotations, on trouve la rotation −idE . Cet angle représente les couples (u, −u), c’est l’angle plat. De même, les angles d’ordre 4 sont les deux angles droits, de mesure π2 et − π2 , et plus généralement les angles d’ordre n sont les arguments des racines primitives n-ièmes de l’unité.
Solution 7.8.
(1) Si x est vecteur propre de f , associé à la valeur propre λ, on a :
f (x), x = x, f ∗ (x)
donc
λx2 = −f (x), x) = −λx2
et la seule valeur propre possible d’un endomorphisme antisymétrique est 0. On en déduit que id + f et id − f sont bijectives. (2) Calculons u∗ :
u∗ = (id + f )∗−1 ◦ (id − f )∗ = (id − f )−1 ◦ (id + f ) = u−1 On en déduit que u est orthogonale. De plus, le déterminant d’un endomorphisme et de son transposé étant égaux,
det(u) = det(id − f ) det(id + f )−1 = det(id − f ) det(id − f )−1 = 1
i
i i
i
i
i
i
i
7 • Groupes classiques
200
puisque (id + f )∗ = id − f ; u est donc dans SO(E). Par ailleurs, si on calcule (id + u) ◦ (id + f ), on trouve :
(id + u) ◦ (id + f ) = (id − f ) ◦ (id + f )−1 ◦ (id + f ) + id + f = 2id et donc id + u est inversible, −1 n’est pas valeur propre de u.
2, la matrice de f dans une base orthonormale prend la forme (3) En dimension 0 a et on trouve que la matrice de u se présente sous la forme −a 0 1−a2 2a 1+a2 − 1+a2 2a 1+a2
1−a2 1+a2
qui est bien la matrice d’une rotation (penser à la tangente de l’arc moitié), l’angle plat (et donc la valeur propre −1) étant exclus. Dans le cas de la dimension 3, on part d’une matrice antisymétrique de la forme ⎛ ⎞ 0 a b ⎝−a 0 c⎠ −b −c 0 et on obtient
⎛
⎞ 2 − a2 − b2 −2bc − 2a −2b + 2ac 1 + c 1 ⎝ −2c − 2ab ⎠ 2a − 2bc 1 + b2 − a2 − c2 2 1 + a + b2 + c2 2b + 2ac 2c − 2ab 1 + a2 − b2 − c2 Le lecteur courageux pourra vérifier qu’il s’agit bien d’une matrice orthogonale directe. (4) Il suffit de « calculer » f en fonction de u. On trouve que nécessairement,
f = (id − u) ◦ (id + u)−1 qui existe car −1 n’est pas valeur propre de u. Des calculs immédiats montrent alors que f est antisymétrique.
Solution 7.9.
(1) Soit r un élément de SO(E), où E est euclidien de dimension 3. La transformation r est donc une rotation, il existe une droite de vecteurs invariants. Si e 1 est un vecteur unitaire qui dirige cette droite, on peut le compléter en (e 1 , e2 , e3 ) base orthonormale. Mais alors, vect(e2 , e3 ) est stable et la restriction v de r à ce plan est orthogonale directe, puisque detr= 1 × det v . On en déduit qu’il existe un réel θ tel que la matrice de u dans la base B = (e 1 , e2 , e3 ) soit ⎛ ⎞ 1 0 0 MB (r) = ⎝0 cos θ − sin θ ⎠ 0 sin θ cos θ
i
i i
i
i
i
i
i
Solutions des exercices
201
(2) La trace de la matrice précédente est 1 + 2 cos θ . Or r est un retournement si et seulement si sa restriction au plan orthogonal à l’axe est la rotation d’angle π . Puisque la trace est un invariant de similitude, on en déduit que les demi-tours sont les rotations dont la matrice a pour trace −1. (3) On vérifie rapidement que t AA = I , il s’agit bien d’une matrice orthogonale. L’ensemble des vecteurs invariant est vect(e 2 − e3 ), et la trace de la matrice est 2. On en déduit qu’il s’agit d’une rotation d’angle θ tel que 2 cos θ + 1 = 2 soit cos θ = 12 , soit un angle géométrique de mesure π3 . Solution 7.10. Soient u et u des vecteurs unitaires directeurs de H ⊥ et H ⊥ res-
pectivement. Alors si s ◦ s = s ◦ s , s ◦ s(u) = −s (u) = s(s (u)) prouve que s (u) ∈ vect(u), puisque c’est un vecteur propre pour la valeur −1. Comme s est une isométrie, on aura • soit s (u) = u, et l’orthogonal de H est inclus dans H , les deux plans sont perpendiculaires ; • soit s (u) = −u, H et H ont même orthogonal, ils coïncident.
Soit u un endomorphisme qui transforme la base (e 1 , e2 , e3 ) en (±ei , ±ej , ±ek ). Ce sera une base (orthonormale) si les (i, j, k) sont distincts, donc forment une permutation de (1, 2, 3). Il y a donc 2 3 × 6 = 48 possibilités. G est un groupe par sa définition même, c’est le stabilisateur de l’ensemble des 6 vecteurs (e1 , e2 , e3 , −e1 , −e2 , −e3 ). Les géomètres verront également que c’est le groupe des isométries qui conserve le cube dont les huit sommets sont les points de coordonnées (±1, ±1, ±1) : voir le chapitre 10. Examinons les trois cas proposés. • La matrice de g a un déterminant négatif, g est une transformation orthogonale indirecte. De plus, e1 + e2 et e3 sont invariants, il s’agit de la réflexion de plan vect(e1 + e2 , e3 ). • C’est cette fois une transformation orthogonale directe puisque le déterminant est 1. De plus h3 = idE , donc h est une rotation d’angle géométrique de mesure 2π 3 . La recherche des vecteurs invariants montre que l’axe est vect(e 1 + e2 + e3 ).
© Dunod. La photocopie non autorisée est un délit.
Solution 7.11.
• On a det(k) = 1 et k 2 = id. C’est un demi-tour, d’axe vect(e 2 + e3 ).
i
i i
i
i
i
i
i
i
i i
i
i
i
i
i
Chapitre 8
Espaces affines euclidiens
Ce chapitre propose un modèle mathématique de l’espace physique qui nous est familier : l’espace affine euclidien de dimension 3. La première section se développe dans un cadre purement affine. Les notions métriques (distance, orthogonalité, angles, etc.) sont ensuite introduites.
© Dunod. La photocopie non autorisée est un délit.
8.1 NOTIONS AFFINES 8.1.1. Espaces affines La terminologie de l’algèbre linéaire a une connotation géométrique (espace vectoriel, dimension, droite vectorielle, plan vectoriel, orthogonalité, etc.). Cependant, même si l’on développe en l’étudiant des images mentales géométriques, il s’agit plus d’algèbre, c’est-à-dire de calcul, que de géométrie. L’espace vectoriel R 3 rapporté à sa base canonique (1, 0, 0), (0, 1, 0), (0, 0, 1) n’est pas un bon modèle de l’espace physique, dans lequel il n’y a pas d’addition naturelle : qu’est-ce que la somme de deux points ? L’espace physique n’est pas muni d’un point particulier jouant le rôle du vecteur nul (0, 0, 0). On va dégager la notion d’espace affine, formé de points et non de vecteurs, où tous les points jouent le même rôle.
i
i i
i
i
i
i
i
8 • Espaces affines euclidiens
204
Définition 8.1. On appelle espace affine la donnée
• d’un ensemble E formé de points, • d’un R-espace vectoriel E formé de vecteurs, • d’une action simplement transitive du groupe additif (E, +) sur E ,
E × E −→ E , → → (− v , M) −→ M + − v Dans ce triplet de données, l’objet géométrique est l’ensemble E des points. Contrairement aux premiers chapitres de ce livre, les vecteurs sont notés par des lettres sur→ − montées d’une flèche, le vecteur nul étant noté 0 . On dit que E est l’espace affine et que E est son espace vectoriel associé. Le signe + est donc employé dans deux contextes : • pour additionner deux vecteurs de E , • pour additionner un vecteur de E à un point de E . Le fait qu’il s’agit d’une action se traduit par → → → → → → (1) ∀M ∈ E, ∀(− u ,− v ) ∈ E × E, M + (− u +− v ) = (M + − u)+− v → − (2) ∀M ∈ E, M+ 0 =M → → − Pour tout v ∈ E , l’application E −→ E , M −→ M + − v s’appelle la translation de → − →. vecteur v , elle est notée T− v
Proposition 8.2. Les translations sont des bijections de E sur lui-même et forment
un groupe commutatif T (E) pour la loi ◦ de composition des applications. L’appli→ → v → T− cation − v est un isomorphisme du groupe additif (E, +) sur le groupe des translations (T (E), ◦).
Démonstration. Exprimons les conditions (1) et (2) : → → → u,− v , on a T− (1) pour deux vecteurs quelconques −
→ v +− u
→ → = T− u ◦ T− v.
→ = IE (2) la translation de vecteur nul est l’identité : T − 0 → − → → → → → = IE , donc toute translation Pour tout v ∈ E , on a T− v = T −− v ◦ T− v ◦ T −− v = T− 0 −1 → → T− . → v = T− v est bijective et T −− v D’après la condition (1), l’ensemble T (E) des translations est un sous-groupe com→ → v → T− mutatif du groupe des bijections de E sur lui-même et l’application − v est un morphisme de groupes de (E, +) vers T (E), surjectif par définition de T (E). → − Montrons que le noyau se réduit à { 0 }, ce qui donnera l’injectivité, donc la bijectivité. → v ∈E L’action étant simplement transitive, pour tout couple de points (M, N), il existe − → − → − → unique tel que N = M + v = T− (M) . En particulier, pour tout M , l’unique tel que v v → − → M = T− v (M) est le vecteur nul. Donc 0 est l’unique vecteur dont la translation associée est l’identité.
i
i i
i
i
i
i
i
8.1 Notions affines
205
− → Pour tout couple de points (M, N), on note MN le vecteur de l’unique translation envoyant M en N. La simple transitivité de l’action se traduit ainsi : pour tout point O, on a des bijections inverses l’une de l’autre E E −→ E et → − → − → − v −→ O + v = T v (O) M → − → − En particulier, pour tout point O, on a OO = 0 .
−→ E − → −→ OM
Contrairement à l’espace E des points, l’espace vectoriel E donne prise au calcul. Pour étudier une configuration dans E où un point O joue un rôle particulier (par exemple l’isobarycentre d’un système de points), on peut vectorialiser E en O : on − → transpose dans E le problème posé par la bijection E → E , M → OM pour tenter une solution par calcul vectoriel ; on retraduit ensuite dans E les résultats obtenus par la → → v → O + − v. bijection inverse − Proposition 8.3. Relation de Chasles. Étant donné trois points A, B, C de E , on a la
− → − → − → relation vectorielle AC = AB + BC.
Démonstration. En effet
→ (A) = C = T− → (B) = T− → ◦ T− → (A) = T− → − → (A) T− AC BC BC AB BC + AB
→ = T− → − → , donc Comme il existe une seule translation transformant A en C, on a T − AC BC + AB − → − → − → − → − → AC = BC + AB = AB + BC.
→ − − − → − → → − → − → En particulier, 0 = AA = AB + BA, donc BA = −AB. Proposition 8.4. Règle duparallélogramme. Soit A, A , B, B quatre points de E . On
© Dunod. La photocopie non autorisée est un délit.
→ −→ −→ − → −− a l’équivalence AB = A B ⇐⇒ AA = BB .
S’il en est ainsi, on dit que A, A , B , B forment un parallélogramme. → −→ − → −→ −→ −− Démonstration. L’égalité AB = AB + BB = AA + A B est toujours vraie (relation de Chasles). On en déduit l’équivalence. Définition 8.5. Étant donné deux points P, Q, on appelle milieu de (P, Q) le
− → − → point I défini par PI = 12 PQ.
− → − → − → − → − → − → − → − → On a alors QI = QP + PI = QP + 12 PQ = QP − 12 QP = 12 QP donc I est aussi milieu de (Q, P). On écrira I = P+Q 2 (notation expliquée au chapitre 9). Proposition 8.6. Pour que quatre points A, A , B , B forment un parallélogramme, il
faut et il suffit que (A, B ) et (A , B) aient même milieu.
i
i i
i
i
i
i
i
8 • Espaces affines euclidiens
206
−→ − → Démonstration. Soit I = A+B 2 . On a AB = 2AI, d’où −→ −→ − −→ − → −→ → → − → −→ −→ − → −− A B − 2A I = (A A + AB) − 2(A A + AI) = AB − A A − AB = AB − A B Pour que A, B , A , B soit un parallélogramme, il faut et il suffit que ce vecteur soit nul, donc que I soit aussi milieu de (A , B). Définition 8.7. On appelle dimension de l’espace affine E la dimension de
l’espace vectoriel E et on écrit dim E = dim E .
Le plus souvent dans la suite, la dimension sera égale à 2 en géométrie plane, 3 en géométrie dans l’espace. Définition 8.8. Pour dim E = n, on appelle repère de E la donnée d’un → → e1 , . . . , − en ) de E . Le repère point O ∈ E dit origine et d’une base B = ( − → − → − R = (O, B) = (O, e1 , . . . , en ) détermine la bijection ⎛ ⎞ x1 n → n ⎝ ... ⎠ −→ M = O + R −→ E, xi − ei 1 xn
On dit que x1 , . . . , xn sont les coordonnées de M dans le repère R. En choisissant un repère, on transpose un problème géométrique dans R n pour le résoudre par calcul numérique. Le choix du repère s’appuie souvent sur des considérations géométriques pour que les calculs soient simples. La vectorialisation en un point et le calcul vectoriel évitent parfois la lourdeur de calculs numériques dans un repère.
8.1.2. Sous-espaces affines Soit F une partie non vide de E . Pour tout A ∈ F , on note F A l’ensemble des vecteurs − → AM où M décrit F . Proposition 8.9. On a équivalence entre
(i) il existe A ∈ F tel que F A soit un sous-espace vectoriel de E , (ii) pour tout A ∈ F , F A est un sous-espace vectoriel de E . S’il en est ainsi, les sous-espaces vectoriels F A sont tous égaux à un même sous-espace noté F ⊂ E . On dit alors que F est un sous-espace affine de E et que le sous-espace vectoriel F ⊂ E est la direction de F .
Démonstration. L’implication (ii) ⇒ (i) est claire. Inversement, supposons que F A est un sous-espace vectoriel de E pour un certain point A ∈ F . Soit B un point quel− → → → → v = A+AB+− v, v , on a B+− conque de F . Il suffit de montrer que F A = F B . Pour tout − d’où les équivalences − → → − → → → → (− v ∈ F ) ⇔ (B + − v ∈ F) ⇔ (A + AB + − v ∈ F) ⇔ (AB + − v ∈F ) B
A
i
i i
i
i
i
i
i
8.1 Notions affines
207
− → Comme B ∈ F , AB ∈ F A et puisque F A est un sous-espace vectoriel de E , on peut − → → → v ∈ F A ) ⇔ (− v ∈ F A ), d’où l’équivalence : écrire (AB + − − → → → → (− v ∈ F ) ⇔ (AB + − v ∈ F ) ⇔ (− v ∈F ) B
A
A
On en déduit l’égalité cherchée F B = F A .
Inversement, étant donné un sous-espace vectoriel F ⊂ E et un point A ∈ E , l’ensemble ( ) ( ) − → → → A + F = M ∈ E | ∃− v ∈ F, M = A + − v = M ∈ E | AM ∈ F est l’unique sous-espace affine passant par A de direction F . Étant donné un sous-espace affine F ⊂ E de direction F ⊂ E , la restriction à → → F × F ⊂ E × E de l’action (− v , M) → M + − v définit une action F × F → F faisant de F un espace affine d’espace vectoriel associé F . Exemples : (1) Pour tout A ∈ E , E = A + E , donc E est le seul sous-espace affine de direction E . (2) Pour tout A, l’ensemble {A} réduit au point A est le sous-espace affine passant par → − A de direction { 0 }. Sa dimension est 0.
© Dunod. La photocopie non autorisée est un délit.
(3) On appelle droite affine tout sous-espace affine de dimension 1, sa direction est une droite vectorielle. → − → v = 0 , on appelle droite passant par A de vecteur directeur Pour A ∈ E et − → − → → − → v }. L’application λ → A + λ− v v l’ensemble A + R v = {M | ∃λ ∈ R, M = A + λ− est une bijection de R sur cette droite. On dit que c’est une représentation paramétrique de cette droite. Étant donné deux points distincts A et B, l’unique droite affine passant par A et − → B, notée (AB), est A + RAB. (4) On appelle plan affine tout sous-espace affine de dimension 2. Par trois points non alignés A, B, C passe un unique plan affine notée (ABC) : celui passant par A (ou B, ou C) de direction le plan vectoriel − → − → − → − → − → − → Vect(AB, AC) = Vect(BC, BA) = Vect(CA, CB) (5) Si dim E = n, on appelle hyperplan affine tout sous-espace affine de dimension n − 1, c’est-à-dire du type H = A + H où H = H est un hyperplan vectoriel. En géométrie plane (resp. dans l’espace), les hyperplans sont les droites du plan (resp. les plans de l’espace). → → e1 , . . . , − en ), donnons A par ses coordonnées (a 1 , . . . , an ) et H Dans un repère (O, − comme noyau de la forme linéaire de matrice (u 1 , . . . , un ). Pour qu’un point M de − → coordonnées x1 , . . . , xn soit dans H, il faut et il suffit que AM ∈ H , donc que n 1
ui (xi − ai ) =
n 1
ui xi + h = 0 où h = −
n
ai
1
i
i i
i
i
i
i
i
8 • Espaces affines euclidiens
208
Ainsi, u1 x1 + · · · + un xn + h = 0 est une équation de H dans le repère. Inversement, toute équation de ce type où (u 1 , . . . , un ) n’est pas le n-uplet nul, est l’équation d’un hyperplan. Un hyperplan a une infinité d’équations, toutes proportionnelles. Définition 8.10. Deux sous-espaces affines sont dits parallèles s’ils ont même
direction F ⊂ E .
Ils sont de la forme A + F et B + F où A et B sont des points de E . Ce sont les orbites de A et B pour l’action du groupe additif (F, +) sur E : → → F × E −→ E, (− v , M) −→ M + − v Ils sont donc, ou confondus, ou d’intersection vide. Proposition 8.11. Droites parallèles d’un plan. Soit P un plan affine de plan vectoriel associé P . Pour que deux droites distinctes de P soient parallèles, il faut et il suffit que leur intersection soit vide. → → Démonstration. Soit deux droites distinctes A = A + R − u et B = B + R− v . Par ce
qui précède, si elles sont parallèles, leur intersection est vide. → → u ,− v ) est base de P . On cherche un point C Supposons-les non parallèles. Alors ( − → − → commun à A et B ; alors C = A+x u = B+y − v . Ceci revient à chercher (x, y) ∈ R×R − → → → → → tel que AB = x− u,− v ) est base de P , il existe un unique tel couple u − y− v . Comme (− (x, y), d’où un unique point commun.
8.1.3. Applications affines Soit E et E deux espaces affines, f : E → E une application. Soit A ∈ E . On définit −−−−−−→ − → f A : E → E par f A (AM) = f (A)f (M) pour tout M ∈ E . Proposition 8.12. On a équivalence entre
(i) il existe A ∈ E tel que f A soit une application linéaire, (ii) pour tout A ∈ E , f A est une application linéaire. S’il en est ainsi, les applications linéaires f A sont toutes égales à une même application linéaire notée f : E → E . On dit alors que f est une application affine de E vers E et que f est l’application linéaire (ou vectorielle) associée à f .
Démonstration. Supposons f A linéaire pour un certain A ∈ E . Soit B un autre point. − → − → − → Montrons que f A = f B . Pour M ∈ E , on a BM = AM − AB, donc −−−−−−→ −−−−−−→ −−−−−−→ − → f B (BM) = f (B)f (M) = f (A)f (M) − f (A)f (B) − → − → − → − → − → = f A (AM) − f A (AB) = f A (AM − AB) = f A (BM) Ceci montre que f B = f A , d’où la linéarité de f B .
i
i i
i
i
i
i
i
8.1 Notions affines
209
Ainsi, une application affine f : E → E est déterminée par la donnée • de l’image f (A) ∈ E d’un point A fixé dans E , • de l’application linéaire associée f : E → E .
− → L’image d’un point M ∈ E est alors f (M) = f (A) + f ( AM). Autrement dit, pour tout → − A ∈ E et tout u ∈ E , on a → → f (A + − u ) = f (A) + f (− u ). Proposition 8.13. Soit une application affine f : E → E .
a) Soit A ∈ E . L’image de f est Im f = f (A) + Im f , sous-espace affine de E . L’application f est surjective si et seulement si f l’est. b) Soit M ∈ E , l’ensemble des N ∈ E tels que f (N) = f (M) est M + Ker f , sous-espace affine de E . L’application f est injective si et seulement si f l’est.
© Dunod. La photocopie non autorisée est un délit.
Démonstration. → → → → a) L’image de f est formée des f (A + − v ) = f (A) + f (− v ), où − v ∈ E . Si − v décrit → → → E , f (− v ) décrit Im f , donc f (A + − v ) = f (A) + f (− v ) décrit Im f = f (A) + Im f , sous-espace affine de E . Pour que f soit surjective, il faut et il suffit que Im f = f (A) + Im f = E . Comme le seul sous-espace affine de E de direction E est E lui-même, il faut et il suffit que E = Im f , donc que f soit surjective. − → b) Pour tout N ∈ E , on a f (N) = f (M) + f (MN). On a f (N) = f (M) si et seulement si → − − → − → f (MN) = 0 , donc si et seulement si MN ∈ Ker f . Pour que f soit injective, il faut et il suffit que M + Ker f soit réduit au singleton → − {M} pour tout M, donc que Ker f = { 0 }, i.e. que f soit injective. Le lecteur montrera de même que pour un sous-espace vectoriel F ⊂ E et un point A ∈ E , l’image par f du sous-espace affine F = A + F est le sous-espace affine f (F) = f (A) + f (F ) ⊂ E . Proposition 8.14. Translations. Pour qu’une application affine T : E → E ait pour application linéaire associée l’identité de E , il faut et il suffit que T soit une translation.
Démonstration. Soit T : E → E affine, O ∈ E , O = T (O). Pour tout M ∈ E , on note M −− → − → l’image de M par T . On a O M = T (OM). Pour que T = IE , il faut et il suffit que pour −→ −− → − → − → tout M ∈ E , on ait O M = OM, soit MM = OO (règle du parallélogramme, p. 205). Ainsi, la translation T−→ est l’application affine E → E transformant O en O d’application OO linéaire associée IE .
i
i i
i
i
i
i
i
8 • Espaces affines euclidiens
210
Définition 8.15. Soit O ∈ E et λ ∈ R non nul. On appelle homothétie de centre
O et de rapport λ l’application
HO,λ : E −→ E − → M −→ O + λOM C’est l’application affine transformant O en O d’application linéaire associée l’homothétie vectorielle λI E de rapport λ. Proposition 8.16. Homothéties. Étant donné λ ∈ R distinct de 0 et 1, pour qu’une
application affine h soit une homothétie de rapport λ, il faut et il suffit que h soit l’homothétie vectorielle λI E .
Démonstration. Par définition des homothéties, la condition est nécessaire. Inversement, soit h : E → E affine telle que h = λI E . La seule chose à montrer est que h a −→ − → un point fixe O. Soit M et M = h(M) tel que M = M. Cherchons O tel que M O = λMO. − → −→ − → − → − → 1 M M. On Comme M O = M M + MO, le seul point O possible est donné par MO = λ−1 vérifie que ce point là convient. Définition 8.17. Soit E = F ⊕G une décomposition de E en somme directe de → u ∈ E se décompose de façon unique deux sous-espaces supplémentaires. Tout − → → → − → − → − → − → − u → − v est la projection en u = v + w , v ∈ F , w ∈ G. L’application π : − de E sur F parallèlement à G, elle est linéaire. Soit F un sous-espace affine de direction F et O ∈ F . L’application affine p définie par p(O) = O et p = π est appelée la projection de E sur F parallèlement à G.
(i) On a Im p = p(O) + Im π = O + F = F (8.13, p. 209). Pour tout M ∈ F , − → − → − → OM ∈ F , donc p(M) = p(O) + π(OM) = O + OM = M, donc la restriction de p à F est l’identité de F . Tout point de F joue le même rôle que O. (ii) Soit M ∈ E . L’ensemble des N tels que p(N) = p(M) est G M = M+Ker π = M+G. D’après (i), p p(M) = p(M), donc p(M) ∈ GM ∩ F . Inversement, si M ∈ GM ∩ F , p(M ) = M car M ∈ F , p(M ) = p(M) car M ∈ GM . Donc M = p(M) est l’unique point commun à G M et à F . Les figures page suivante illustrent cette construction de p(M) comme intersection de GM et de F . Pour tout O ∈ E , notons Fix(O) l’ensemble des f : E → E tels que f (O) = O. Proposition 8.18. a) La composée h = g ◦ f de deux applications affines E → E est
une application affine d’application linéaire associée h = g ◦ f .
b) Pour tout O ∈ E , la restriction à Fix(O) de l’application f → f est une bijection de Fix(O) sur L(E).
i
i i
i
i
i
i
i
8.1 Notions affines
211
dim E = 3, dim F = 1, dim G = 2
dim E = 3, dim F = 2, dim G = 1 M
F
A A
M`
` A
A A
AA` p(M) ` ` ` ` ` AA
GM = M + G
A A
F
A AA` p(M) ` ` ` ` ` AA GM = M + G
Démonstration. a) Soit A ∈ E et B = f (A). Pour M ∈ E , soit N = f (M), alors − → − → BN = f (AM). Soit C = g(B) = h(A) et P = g(N) = h(M), alors
− − → → − → CP = g(BN) = g ◦ f (AM) Comme g ◦ f est linéaire, h = g ◦ f est l’application affine transformant A en C d’application linéaire associée g ◦ f . b) Soit ϕ ∈ L(E) et O ∈ E . La donnée de f (O) = O et de f = ϕ détermine l’unique antécédent f ∈ Fix(O) de l’application linéaire ϕ. L’application f → f est donc surjective car pour tout ϕ ∈ L(E) et tout O ∈ E , ϕ a un antécédent dans Fix(O). Mais il se peut que ϕ ait des antécédents sans point fixe. Par exemple, toute translation est un antécédent de l’identité I E . On verra (pb.4) que ϕ a des antécédents sans point fixe si et seulement si 1 est valeur propre de ϕ.
© Dunod. La photocopie non autorisée est un délit.
8.1.4. Expression analytique d’une application affine Soit f une application affine E → F où les dimensions de E et F sont n et p. Rap→ → → → e1 , . . . , − en ) et (Ω, − ε1 , . . . , − ε portons E et F aux repères (O, − p ). Alors f est déterminée par l’image f (O) de coordonnées (b 1 , . . . , bp ) et la matrice ai,j de f . Il est facile de voir que f opère comme il est indiqué ci-dessous : ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎛ ⎞ ⎛ ⎞ x1 y1 a1,1 · · · a1,n x1 b1 .. ⎠ ⎝ .. ⎠ + ⎝ .. ⎠ M ⎝ ... ⎠ → f (M) ⎝ ... ⎠ = ⎝ ... . . .
xn
yp
ap,1 · · · ap,n
xn
formule s’écrivant Y = AX + B avec les notations ci-dessous : ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ x1 y1 a1,1 · · · a1,n .. ⎠ , B = ⎝ X = ⎝ ... ⎠ , Y = ⎝ ... ⎠ , A = ⎝ ... . xn yp ap,1 · · · ap,n
bp ⎞ b1 .. ⎠ . bp
i
i i
i
i
i
i
i
8 • Espaces affines euclidiens
212
Proposition 8.19. Étant donné un espace affine E d’espace vectoriel associé E ,
l’ensemble GA(E) des endomorphismes affines bijectifs est un groupe. L’application f → f est un morphisme surjectif de groupes GA(E) → GL(E) dont le noyau est le sous-groupe T (E) des translations. Cela résulte des propositions 8.13, 8.14, 8.18 (p. 209 à 210).
8.1.5. Théorème de conjugaison Comme on l’a vu sur les exemples (translations, homothéties, projections, etc.), les applications affines ne sont pas toutes de même nature géométrique. Le théorème de conjugaison précise cette notion. Étant donné f : E → E et g ∈ GA(E), rappelons que la conjuguée de f par g est l’application g ◦ f ◦ g −1 . Théorème 8.20. théorème de conjugaison. Étant donné un repère R de E , la conjuguée f = g ◦ f ◦ g−1 a même expression analytique dans le repère R = g(R) que f dans le repère R.
→ → Démonstration. Soit O l’origine et B = ( − e1 , . . . , − en ) la base de R. À tout M ∈ E de coordonnées x1 , . . . , xn correspond f (M) = N de coordonnées y 1 , . . . , yn . On a la relation matricielle ⎛ ⎞ ⎛ ⎞⎛ ⎞ ⎛ ⎞ y1 a1,1 · · · a1,n x1 b1 .. ⎠ ⎝ .. ⎠ + ⎝ .. ⎠ ⎝ ... ⎠ = ⎝ ... . . . yn an,1 · · · an,n xn bn
où A = ai,j est la matrice de f dans la base B , b 1 , . . . , bn les coordonnées de f (O). → → Soit le repère R = g(R) d’origine O = g(O), de base B = (g(− e1 ), . . . , g(− en ) , M de coordonnées x1 , . . . , xn et M = g(M). On a − −→ − → − → − → xi → xi g(− ei ) ei donc O M = g(OM) = OM = i
Donc
M
i
R
= g(M) a mêmes coordonnées dans que M dans R. De plus,
f (M ) = g ◦ f ◦ g−1 g(M) = g ◦ f (M) = g(N)
d’où f (M ) = g(N) a mêmes coordonnées y 1 , . . . , yn dans R que f (M) = N dans R. Ainsi, f = g ◦ f ◦ g−1 opère relativement au repère R = g(R) de la même façon que f relativement à R. Ceci justifie et précise l’assertion : f et f = g ◦ f ◦ g−1 ont même nature géométrique. La relation « f et f sont conjuguées » est une relation d’équivalence sur l’ensemble des applications affines de E dans lui-même. Les classes d’équivalence s’appellent les classes de conjugaison. Elles rassemblent les applications affines de mêmes propriétés géométriques.
i
i i
i
i
i
i
i
8.1 Notions affines
213
→ • Conjuguée d’une translation La conjuguée par g de la translation de vecteur − v → − −1 → − → est la translation de vecteur g( v ) : g ◦ T− ◦ g = T . Les translations de g( v ) v vecteur non nul constituent donc une classe de conjugaison. En effet, soit M un point, N = g −1 (M). On a
→ → −1 → → − ◦ g (N) = g(N + − v ) = g(N) + g(− v) g ◦ T− (M) = g T v v → → (M) v)=T − = M + g(− g( v )
• Conjuguée d’une homothétie La conjuguée par g de l’homothétie de centre O et de rapport λ est l’homothétie g ◦ H O,λ ◦ g−1 = Hg(O),λ de centre O = g(O) et de même rapport λ. Les homothéties de même rapport λ forment donc une classe de conjugaison. En effet, posons h = g ◦ HO,λ ◦ g−1 . On a h(O ) = O car
h(O ) = g ◦ HO,λ ◦ g−1 g(O) = g ◦ HO,λ (O) = g(O) = O L’application linéaire associée à h est h = g ◦ λI E ◦ g −1 . L’homothétie vectorielle λIE commutant avec toute application linéaire, h = λI E ◦ g ◦ g −1 = λIE est l’homothétie vectorielle de rapport λ. D’où h = H g(O),λ (8.16, p. 210). • Conjuguée d’une projection Le lecteur vérifiera que la conjuguée par g de la projection E → F ⊂ E parallèlement à un supplémentaire G de F est la projection E → g(F) parallèlement à g(G).
© Dunod. La photocopie non autorisée est un délit.
8.1.6. Groupe des homothéties-translations Le groupe des homothéties vectorielles λI E , λ = 0, est sous-groupe distingué de GL(E), isomorphe au groupe multiplicatif R × des réels non nuls. Son image réciproque par le morphisme GA(E) → GL(E) (8.19, p. 212) est le sous-groupe distingué de GA(E) formé des translations et des homothéties affines (8.14 p. 209 et 8.16, p. 210), noté H(E). Pour tout h ∈ H(E), le rapport λ(h) de l’homothétie vectorielle h est appelé rapport de h. L’application h → λ(h) est un morphisme de groupes H(E) → R× de noyau le sous-groupe T (E) des translations. Pour tout h ∈ H(E) distinct de IE , soit ∆(h) l’ensemble des droites stables par h. On vérifie facilement que : → → − − → − → → • si h = T− v , v = 0 , ∆(T− v ) est l’ensemble des droites de vecteur directeur v , • si h = HO,λ , λ = 1, ∆(HO,λ ) est l’ensemble des droites passant par O.
i
i i
i
i
i
i
i
214
8 • Espaces affines euclidiens
Proposition 8.21. a) Soit les homothéties, distinctes de l’identité, de centres distincts
f = HA,α et g = HB,β . Les composées g ◦ f et f ◦ g sont alors : • pour αβ = 1, des homothéties de rapports αβ et de centres distincts situés sur la droite (AB), − → • pour αβ = 1, des translations de vecteurs distincts colinéaires à AB. → b) Soit une homothétie f = HA,α et une translation g = T− v , distinctes de l’identité. Les composées g ◦ f et f ◦ g sont alors des homothéties de rapport α et de centres → v. distincts situés sur la droite A + R −
Démonstration. Soit f et g dans H(E) avec les rapports α et β , h 1 = f ◦ g et h2 = g ◦ f . Les homothéties vectorielles f = αI E et g = βIE commutent, d’où h1 = h2 = αβIE . Donc h1 et h2 sont dans H(E) et ont même rapport αβ . Ce sont des homothéties si αβ = 1, des translations si αβ = 1. On suppose que f = HA,α est une homothétie de centre A et de rapport α = 1. Montrons que si g(A) = A, i.e. si g n’est pas une homothétie de centre A, alors h1 = f ◦ g et h2 = g ◦ f sont distinctes. Par l’absurde, supposons h1 = f ◦ g = g ◦ f = h2 , alors f = g ◦ f ◦ g −1 . Or g ◦ f ◦ g−1 admet g(A) = A pour point fixe. Comme A est l’unique point fixe de f , on a g ◦ f ◦ g −1 = f , donc h2 = h1 . a) Supposons que f = HA,α et g = HB,β sont des homothéties de centres distincts A et B. La droite D = (AB) est commune à ∆(f ) et ∆(g). C’est donc une droite stable pour h1 = f ◦ g et h2 = g ◦ f . • Si αβ = 1, h1 et h2 sont des homothéties de même rapport αβ ayant (AB) pour droite stable. Leurs centres sont donc situés sur (AB). Ils sont distincts car h 2 et h1 sont distinctes, de même rapport. • Si αβ = 1, h1 et h2 sont des translations ayant (AB) pour droite stable, donc − → de vecteurs colinéaires à AB. Ces vecteurs sont distincts car h 1 et h2 sont des translations distinctes. → b) Supposons que f = HA,α est une homothétie et g = T − v est une translation. Alors → h1 et h2 sont des homothéties distinctes de même rapport α. La droite D = A + R − v appartient à ∆(f ) ∩ ∆(g), donc est stable pour h 1 et h2 . Les centres de h1 et h2 sont sur D , distincts car h1 et h2 sont des homothéties distinctes de même rapport α.
L’énoncé ne précise pas la localisation exacte sur D des centres de g ◦f et f ◦g si ce sont des homothéties. Si ce sont des translations, leurs vecteurs colinéaires à D ne sont pas non plus précisés. Ces renseignements complémentaires ne sont pas inaccessibles, mais sont d’intérêt secondaire.
Remarque : Si f ∈ GA(E) admet une droite stable D , l’application D → D induite par f est une homothétie ou une translation. En effet, l’application induite par f appartient au groupe GA(D), réduit aux homothéties et translation car GL(D) se réduit aux homothéties vectorielles. Si f a deux points fixes A, B distincts, tout point de (AB) est fixe.
i
i i
i
i
i
i
i
8.1 Notions affines
215
8.1.7. Rapports de mesures algébriques − Définition 8.22. Soit D une droite affine et → u ∈ D non nul. Si P, Q sont deux
− → → u . Ceci points de D , la mesure algébrique PQ est le réel défini par PQ = PQ − → − dépend du choix de u . En revanche, les rapports de mesures algébriques sont → u. intrinsèques, c’est-à-dire indépendants du choix de − ne dépend Ainsi A, B, C, D étant quatre points de D , (C, D distincts), le rapport AB CD → − AB pas du vecteur directeur u . Plus généralement, on définit le rapport si (AB) et (CD) CD
sont parallèles (en convenant de les munir du même vecteur directeur). Par exemple, si A, B sont les transformés de C, D par l’homothétie H O,λ , on aura AB = λ. CD Étant donné A, B distincts sur une droite D , l’application
D \ {B} → R \ {1} MA M → MB est bijective : au rapport λ = 1 correspond le point M = A +
→ λ − λ−1 AB.
Théorème 8.23. Étant donné deux espaces affines E et E d’espaces vectoriels as-
sociés E et E , une application f : E → E est affine si et seulement si elle conserve l’alignement et les rapports de mesures algébriques.
Démonstration. Précisons la propriété « f conserve l’alignement et les rapports de mesures algébriques». Soit A, B, C trois points alignés distincts de E d’images A , B , C . Alors A , B , C sont alignés et
© Dunod. La photocopie non autorisée est un délit.
ou bien A , B , C sont distincts avec
A C A B
=
AC , AB
ou bien A , B , C sont confondus. −− → −− → A B englobe ces deux cas. L’unique condition A C = AC AB Si f est affine, la propriété est facile à vérifier. Inversement, supposons que f a cette propriété. Soit O ∈ E et O = f (O). Il suffit de montrer que l’application f O : E → E est linéaire. → → → v , N = O + λ− v , O , M , N les images v ∈ E non nul, M = O + − Étant donné λ ∈ R, − de O, M, N. La propriété de f donne
λ=
ON O N = OM OM
soit
−− → − −→ O N = λO M
donc
→ → f O (λ− v ) = λf O (− v)
→ → → → → → Montrons que pour − u +− v ) = f O (− u ) + f O (− v ). On pose u,− v dans E , f O (− → → → → P = O+− u,Q = O+− v,R = O+− u +− v . Alors O, P, R, Q est un parallélogramme, donc (O, R) et (P, Q) ont même milieu I. Notant O , P , Q , R les images de O, P, Q, R, la propriété de f donne que (O , R ) et (P , Q ) ont même milieu f (I), donc que
i
i i
i
i
i
i
i
8 • Espaces affines euclidiens
216
O , P , R , Q est un parallélogramme, donc que − −→ −− → − −→ − → − → − → → → → → f O (− u +− v ) = f O (OR) = O R = O P + O Q = f O (OP) + f O (OQ) = f O (− u ) + f O (− v) Proposition 8.24. de Thalès. Soit P un plan affine de plan vectoriel associé P , X et
Y deux droites de P , δ une droite vectorielle distincte de X et Y , A 1 , A2 , A3 des points de X , B1 , B2 , B3 les points où les droites passant par A 1 , A2 , A3 de direction δ coupent Y . Alors on a A1 A3 B1 B3 = A1 A2 B1 B2
Démonstration. En effet, la projection de P sur Y parallèlement à δ transforme A1 , A2 , A3 en B1 , B2 , B3 et conserve les rapports des mesures algébriques. Inversement, cette égalité de rapports n’implique pas le parallélisme des droites (Ai Bi ) car une application affine X → Y conserve les rapports des mesures algébriques, mais peut ne pas être restriction à X d’une projection P → Y . Pour un contreexemple, prendre X , Y parallèles, O un point non sur les droites X , Y , B i l’intersection 1 de (OAi ) avec Y . L’homothétie de centre O et de rapport OB transforme Ai en Bi et OA1 conserve les rapports algébriques. On a égalité des rapports et pourtant les droites (Ai Bi ) se coupent en O.
X A1 A2 A3
Y
@
A1 = B1
O
@ @B1 A1 A2@ A3 X @
@ @ B
@ @2 @ Y
B B B@ B @
3 1 2 3@ @
@ @ B2
@
@
A2
A3
X
@ B3 @ @
Y
En revanche, si on a égalité des rapports et si A 1 = B1 , alors (A2 B2 ) et (A3 B3 ) sont parallèles. En effet, la projection p parallèlement à (A 2 B2 ) sur Y transforme A1 , A2 en B1 , B2 . Comme p conserve les rapports des mesures algébriques, p(A 3 ) = B3 , d’où le parallélisme de (A2 B2 ) et de (A3 B3 ).
8.1.8. Divisions harmoniques Définition 8.25. Étant donné deux points A, B distincts d’une droite D , on dit
que les points distincts M et N de D , distincts de A et B, sont harmoniquement conjugués par rapport à A et B si on a la relation
MA NA =− MB NB
i
i i
i
i
i
i
i
8.1 Notions affines
217
L’application N →
NA NB
étant une bijection de D \ {B} sur R \ {1}, on voit que tout
point M ∈ D , distinct de A, B et du milieu de (A, B) (pour − MA = 1) admet un unique MB conjugué harmonique N ∈ D . Cette relation est clairement équivalente aux relations
NA MA AM BM AN BN =− =− =− ou ou NB MB AN BN AM BM Autrement dit, A et B jouent le même rôle, de même que M et N. De plus, M et N sont conjugués harmoniques par rapport à A et B si et seulement si A et B sont conjugués harmoniques par rapport à M et N. Il s’agit donc d’une relation où les paires de points {A, B} et {M, N} jouent le même rôle l’une par rapport à l’autre, les deux points d’une même paire jouant aussi le même rôle et pouvant être intervertis. On dit alors que les quatre points alignés A, B, M, N forment une division harmonique. C’est une configuration qu’on rencontre souvent en géométrie. a`
a`
a`
a`
A M B N On a alors la relation MA · NB + MB · NA = 0 qui n’a de sens que si on a choisi un vecteur directeur de D pour définir les mesures algébriques. → Étant donné une origine O ∈ D et un vecteur directeur − v , posons OA = α, OB = β ,
OM = x et ON = y . La relation précédente devient
2(αβ + xy) − (α + β)(x + y) = 0 Cette relation garde un sens si trois de ces points sont confondus, par exemple M et N avec A ou B, ce qui permet de dire qu’étant donné deux points A, B, le conjugué harmonique de A relativement à A et B est A lui-même. Enfin, il est immédiat (8.23, p. 215) que les applications affines conservent les divisions harmoniques. Proposition 8.26. Relation de Newton. Soit A, B, M, N quatre points alignés, I et J © Dunod. La photocopie non autorisée est un délit.
les milieux de (A, B) et de (M, N). On a équivalence entre
(i) Les quatre points A, B, M, N sont en division harmonique. 2
2
2
2
(ii) IA = IB = IM × IN, (iii)JM = JN = JA × JB.
Démonstration. Il suffit de placer l’origine O en I ou J.
Plus généralement, on définit le birapport de quatre points alignés distincts A, B, M, N comme étant
AM BM MA NA AM BN : = : = × AN BN MB NB BM AN où le signe : signifie divisé par. Ainsi, A, B, M, N sont en division harmonique si et seulement si [A, B, M, N] = −1. On a [A, B, M, N] = [B, A, N, M] = [M, N, A, B] = [N, M, B, A]. [A, B, M, N] =
i
i i
i
i
i
i
i
8 • Espaces affines euclidiens
218
En revanche, pour d’autres ordonnancements, le birapport change. Par exemple, 1 [A, B, N, M] = [A,B,M,N] . Faisceaux harmoniques. Dans un plan P , soit quatre droites distinctes, concourantes ou parallèles, A, B, M, N . S’il existe une sécante D coupant A, B, M, N en quatre points distincts A, B, M, N formant une division harmonique, il en est de même pour toute autre sécante D coupant ces droites en quatre points distincts. On dit alors que A, B, M, N forment un faisceau harmonique ce qu’on indique par la notation [A, B, M, N ] = −1. Proposition 8.27.
Démonstration. a) Si A, B, M, N ont même direction δ, on utilise la conservation des rapports des mesures algébriques par projection suivant δ d’une sécante D sur l’autre D . b) Supposons A, B, M, N sécantes en O et les sécantes D et D parallèles. On conclut en utilisant la conservation des rapports des mesures algébriques par l’homothétie de centre O transformant D en D . c) Supposons A, B, M, N sécantes en O et D, D de directions distinctes coupant A, B A, B, M, N et A ,B , M , N . On doit prouver l’équivalence , M, N en respectivement [A, B, M, N] = −1 ⇔ [A , B , M , N ] = −1 . O
A
A A A A A A M B AN P A AA A A A A A M A NA D B AA A AA Q
Soit D1 la parallèle à D passant par M coupant A, B , M, N en respectivement A 1 , B1 , M1 = M, N1 . D’après b), [A , B , M , N ] = −1 est équivalent à [A1 , B1 , M1 , N1 ] = −1. On est donc ramené à prouver l’équivalence [A, B, M, N] = −1 ⇔ [A1 , B1 , M1 , N1 ] = −1 Soit la parallèle à N passant par M coupant A, B en P, Q. Considérant les homothéties de centres A et B transformant (PQ) en N , on a les égalités :
AM MP BM MQ = , = AN NO BN NO On a [A, B, M, N] = −1 si et seulement si ces rapports sont opposés, i.e. si M est milieu de (P, Q). Le même raisonnement appliqué à D 1 permet de conclure.
i
i i
i
i
i
i
i
8.1 Notions affines
219
La preuve précédente permet de compléter ainsi cet énoncé : quatre droites A, B, M, N concourantes forment un faisceau harmonique si et seulement si une parallèle à N coupe A, B, M en P, Q, M de sorte que M soit milieu de (P, Q). Exemple : On verra (8.40, p. 227) qu’étant donné deux droites A et B d’un plan 'B), alors affine euclidien sécantes en O, si M et N sont les bissectrices de ( A, [A, B, M, N ] = −1.
8.1.9. Théorèmes de Ménélaüs et de Céva Ce sont des théorèmes de géométrie plane. La scène se passe dans un plan affine P de plan vectoriel associé P . Proposition 8.28. Soit un triangle ABC, P, Q, R des points de (BC), (CA), (AB) distincts
des sommets.
(i) Les points P, Q, R sont alignés si et seulement si PB QC RA × × = +1 PC QA RB (ii) Les droites (AP), (BQ), (CR) sent concourantes ou parallèles si et seulement si PB QC RA × × = −1 PC QA RB
Démonstration. Les propriétés (i) et (ii) sont les théorèmes de, respectivement, Ménélaüs et Céva.
© Dunod. La photocopie non autorisée est un délit.
(i) Théorème de Ménélaüs. Supposons P, Q, R alignés. Soit les homothéties H P , HQ de centres P, Q de rapports PC et QA . Elles transformant respectivement B en C et C en A. PB QC @ A @ @
@ PP @ P @ R PPP PP @ PP @PQ P @PPP C@ P P B
Si HQ ◦ HP était une translation, ce serait − → − → → ; c’est impossible car BA et PQ sont T− BA non colinéaires. C’est donc une homothétie de centre sur (PQ) et aussi sur (AB) car transformant B en A. Son centre est donc R et son rapport est RA PC QA = × RB PB QC d’où l’on déduit la relation. Inversement, supposons la relation véri− → − → fiée. Comme RA = RB,
PC QA RA PC QC × = = 1 donc = PB QC RB PB QA
i
i i
i
i
i
i
i
8 • Espaces affines euclidiens
220
La droite (PQ) n’est donc pas parallèle à (AB) et la coupe en un point R qui d’après la partie directe vérifie
R A PC QA = × PB QC RB La relation donnée implique donc alignés.
R A R B
=
RA , RB
d’où R = R . Les points P, Q, R sont donc
(ii) Théorème de Céva. a) Supposons (AP), (BQ), (CR) concourantes en I. L’application du théorème de Ménélaüs aux triangles ABP et APC munis respectivement des sécantes (CR) et (BQ) donne : IA RB CP IP BC QA × × = 1, × × =1 IP RA CB IA BP QC On obtient le résultat annoncé en multipliant ces deux relations.
b) Supposons (AP), (BQ), (CR) parallèles. Par projection sur (BC), on a QA BP RB CB = , = QC BC RA CP d’où le résultat en multipliant ces égalités. @ A @ L L@ L @ L @ @ HH L R H @Q HHL @ LH I L HH @ H @ HH L @ H L H @ LL P C@ B
Q
R
@ CC @ CC C @ C @ C C @ A C C @ C C C C CC@ C C C @ C @ C C @ C C C @C C C
B
P
C
Réciproquement, supposons la relation satisfaite.
c) Supposons (BQ) et (CR) sécantes en I. Montrons que (AI) et (BC) ne peuvent pas être parallèles. Supposons qu’elles le soient. Soit les homothéties H Q et HR de centres Q et R transformant C en A et A en B. On aurait H Q (B) = I et HR (I) = C. Alors HR ◦ HQ échangerait B et C et serait une symétrie centrale, donc une homothétie de rapport −1. On aurait donc PB QA RB = × = −1 − PC QC RA ce qui est impossible car B = C.
i
i i
i
i
i
i
i
8.1 Notions affines
221
Donc (AI) coupe (BC) en un point P . Par la partie directe, on a
P B QC RA PB QC RA × × = −1 = × × PC QA RB P C QA RB On en déduit
PB PC
=
P B , P C
d’où P = P .
d) Supposons enfin (BQ) et (CR) de même direction δ. La droite passant par A de direction δ coupe (BC) en P . On voit de même que P = P .
8.1.10. Géométrie sur une droite affine réelle → Soit D une droite affine de direction D , trois points distincts A, B, C de D , − u un vecteur − → − → directeur de D . On dit que C est entre A et B si les vecteurs colinéaires AC et CB sont de même sens : les mesures algébriques AC et CB ont même signe, soit AC > 0. Le point C CB est entre A et B si et seulement s’il est entre B et A. En effet, les rapports inverses, donc de même signe.
AC CB
et
BC CA
sont
Proposition 8.29. Étant donné trois points distincts A, B, C de D , il en est un et un
seul qui est entre les deux autres.
Démonstration. On a → − − → − → − → → u = 0 AC + CB + BA = (AC + CB + BA)− d’où AC + CB + BA = 0. Les réels AC, CB, BA ne sont donc pas de même signe. Si BA est d’un signe et AC, CB de l’autre signe, alors C est entre A et B.
© Dunod. La photocopie non autorisée est un délit.
Définition 8.30. Étant donné deux points A, B de D , on appelle segment
d’extrémités A et B l’ensemble, noté [A, B] ou [B, A], formé de A, de B et des points M ∈ D qui sont entre A et B. Un point A ∈ D détermine deux demi-droites : étant donné un vecteur directeur → − u , les demi-droites sont − → → → • la demi-droite du sens de − u formée des M ∈ D tels que AM et − u soient de même sens, − → → → u formée des M ∈ D tels que AM et − u soient • la demi-droite du sens opposé à − de sens opposés. La bijection, représentation paramétrique de D ,
R −→ D − → λ −→ M = A + λAB − → − → − → − → envoie [0, 1] ⊂ R sur le segment [A, B] de D , car AM = λAB et MB = (1 − λ)AB ont même sens si et seulement si λ et 1 − λ ont même signe, i.e. λ ∈ [0, 1]. De même, elle envoie ] − ∞, 0] et [1, +∞[ sur les demi-droites d’origine A ne contenant pas B et d’origine B ne contenant pas A.
i
i i
i
i
i
i
i
222
8 • Espaces affines euclidiens
Exercice 8.1. Montrer que deux droites d’un espace de dimension 3 peuvent avoir une
intersection vide sans être parallèles Exercice 8.2. Étant donné deux sous-espaces affines F et G de dimensions p et q avec
p q . On dit que F et G sont parallèles si F ⊂ G .
1) Soit F et G deux sous-espaces vectoriels de E , A et B deux points de E . Montrer − → que A + F et B + G sont d’intersection non vide si et seulement si AB ∈ F + G. 2) En déduire que deux sous-espaces affines de dimensions p et q comprises entre 1 et n − 2 peuvent être d’intersection vide sans être parallèles. 3) Montrer que si un sous-espace affine F et un hyperplan affine G sont d’intersection vide, alors ils sont parallèles. Exercice 8.3. Dans E affine de dimension 3, quelles sont les configurations possibles
pour que trois droites distinctes D 1 , D2 , D3 soient deux à deux coplanaires ?
Exercice 8.4. Soit un triangle ABC, une droite D coupant (BC), (CA), (AB) en A , B , C
distincts des sommets, les milieux A , B , C de (A, A ), (B, B ), (C, C ). Montrer que A , B , C sont alignés (utiliser la commutativité des homothéties h et h de centre C transformant respectivement B en A et B en A et considérer les symétriques P et Q de C par rapport à A et B ).
8.2 GÉOMÉTRIE EUCLIDIENNE 8.2.1. Distance et produit scalaire Un espace affine euclidien de dimension n est la donnée d’un espace affine E de dimension n dont l’espace vectoriel associé E est muni d’un produit scalaire euclidien (et donc d’une norme euclidienne) → → → → E × E → R, (− v ,− w ) → − v ·− w L’espace affine euclidien de dimension 3 est un modèle mathématique de l’espace physique ambiant. Dans la suite, l’espace euclidien est supposé orienté. Pour l’espace physique ambiant, la convention d’orientation communément employée est celle du « bonhomme d’Ampère» ou des « trois doigts de la main droite» : pouce, index, majeur, pour une base directe. De la norme euclidienne de E , on déduit la distance sur E − → E × E → R+ , (M, N) → MN = MN
i
i i
i
i
i
i
i
8.2 Géométrie euclidienne
223
L’inégalité triangulaire prend alors la forme suivante : étant donné trois points A, B, C, on a AC AB + BC, car, par la relation de Chasles, on a − → − → − → − → − → AC = AC = AB + BC AB + BC = AB + BC − → − → Cette inégalité large est une égalité si et seulement si AB et BC sont : • colinéaires, c’est-à-dire A, B, C alignés, • de même sens, auquel cas B appartient au segment [A, C]. Proposition 8.31. Étant donné trois points A, B, C, on a les inégalités
|AB − BC| AC AB + BC
Démonstration. Il suffit de prouver l’inégalité de gauche. On a AB AC + BC, donc AB − BC AC. De même BC − AB AC, d’où l’inégalité. Inversement, étant donné a, b, c positifs vérifiant |c − a| b c + a, existe-t-il des points A, B, C tels que a = BC, b = CA, c = AB ? La réponse est oui, mais la démonstration n’est pas évidente (Corollaire 11.6, p. 286) → → Définition 8.32. La mesure de l’angle non orienté − v ,− w de deux vecteurs non
© Dunod. La photocopie non autorisée est un délit.
→ → v et − w est l’unique nombre de [0, π] tel que nuls − → − → v ·− w → → cos − v ,− w = − → → v × − w
Dans l’espace physique, les notions d’angle et d’orthogonalité sont intrinsèques et ne résultent pas d’une convention alors que la distance dépend de l’unité de longueur choisie. L’espace vectoriel E est donc muni d’une famille de formes quadratiques définies positives proportionnelles. Les produits scalaires associés définissent les mêmes notions d’orthogonalité et d’angle. Le choix de l’un d’eux correspond au choix d’une unité de longueur. Dans la suite, ce choix est supposé fait une fois pour toutes : E est donc muni d’une norme euclidienne et du produit scalaire associé.
8.2.2. Orthocentre, droite d’Euler, cercle des neuf points Proposition 8.33. Identité du produit scalaire. Soit A, B, C, D quatre points. On a
− → − → − → − → − → − → DA · BC + DB · CA + DC · AB = 0
Démonstration. En développant l’expression X suivante, on trouve 0 : − → − → − → − → − → − → X = DA · BC + DB · CA + DC · AB − → − → − → − → − → − → − → − → − → = DA · (DC − DB) + DB · (DA − DC) + DC · (DB − DA)
i
i i
i
i
i
i
i
8 • Espaces affines euclidiens
224
Soit un triangle ABC, P, Q, R les projections orthogonales de A, B, C sur les côtés (BC), (CA), (AB), I, J, K les milieux de (B, C), (C, A), (A, B), Γ le cercle circonscrit à ABC de centre O, point de concours des médiatrices de (B, C), (C, A), (A, B). Proposition 8.34. (i) Les hauteurs (AP), (BQ) et (CR) concourent en un point D appelé
orthocentre . − → − → − → − → (ii) On a OD = OA + OB + OC.
(iii) Les symétriques A , B , C de A, B, C relativement aux côtés (BC), (CA), (AB) sont sur le cercle circonscrit.
Démonstration. (i) Soit P, Q, R les pieds des hauteurs issues de A, B, C. Les droites (AP) et (BQ) ne sont pas parallèles car elles sont orthogonales à (BC) et (CA) qui ne sont − → − → pas parallèles. Soit D le point où elles se coupent. Il suffit de prouver que DC · AB = 0 : − → − → − → − → cela vient de l’identité du produit scalaire et de ce que DA · BC = DB · CA = 0. (ii) Soit H le point défini par − → − → − → − → A.......................................................................... . . . . . . . OH = OA + OB + OC. Montrons que H = D. ....... .. ..... ....... ..... ...... . @ . . − → − → − → − → − → − → .... .. ..... .... .... On a AH = OH − OA = OB + OC = 2OI où I est .... @ .... Q .. ... . ... ... ... ... milieu de (B, C). Comme O est sur la médiatrice @ ... ... RH ... ... − → − → .... ... @ H`H D ... ... de (B, C), AH = 2OI est orthogonal à (BC), donc H . .. .. ... @ H ... .. . .. .. est sur la hauteur (AP). Il est de même sur (BQ) et .. .. `H HH@ ... α` .. O .. .. ... (CR), donc H = D. ... @ H . ... H ..... ... .. @ H ` ` . . . . B ..... C (iii) Soit p la projection orthogonale du plan sur ... ... P I ... ... .. ... la hauteur (AP). Il suffit de montrer que O est sur la .. . . .... . .... .... .... .... ..... médiatrice de (A, A ), donc que p(O) = α est milieu ..... . ...... . . ...... ...... − → − → − → − → ....... ...... . . . . . .........`.. . . ....................... .......... de (A, A ). L’égalité OD = OA+ OB+ OC devient (car ................................... A P est milieu de (D, A )) → − → − → − → − → − → −→ − → −→ − αD = αA + 2αP = αA + αD + αA d’où αA + αA = 0 Proposition 8.35. (i) Il existe une homothétie de rapport − 12 transformant A, B, C, D
en I, J, K, O. Soit G son centre. (ii) Les homothéties h = HG,− 1 et h = HD, 1 transforment le cercle Γ circonscrit à 2 2 ABC en un cercle γ passant par I, J, K, P, Q, R, les milieux A , B , C de (D, A), (D, B), (D, C).
Démonstration. (i) L’homothétie H A, 1 transforme B et C en K et J, donc 2 − → − → − → KJ = 12 BC = − 12 CB. On a donc une homothétie h de rapport − 12 transformant B, C en J, K (8.6, p. 233). Son centre G est commun aux médianes (BJ) et (CK). On a − → − → − → − → de même KI = − 12 CA et IJ = − 12 AB, donc h (A) = I. Les médianes (AI), (BJ), (CK) joignent chaque sommet à son image par h , donc concourent en le centre G de h . On dit que G est centre de gravité ou isobarycentre (voir chap.9) du triangle.
i
i i
i
i
i
i
i
8.2 Géométrie euclidienne
225
La hauteur (AP) se transforme par h en la parallèle passant par I, qui est donc la médiatrice de (B, C). Les deux autres hauteurs se transforment de même en les deux autres médiatrices. Donc h (D) = O, point de concours des médiatrices. Le centre de gravité G, l’orthocentre D et le centre du cercle circonscrit O sont alignés car h (D) = O. La droite portant ces points est la droite d’Euler du triangle. (ii) L’homothétie h transforme Γ de rayon R et de centre O en le cercle circonscrit γ à IJK de rayon 12 R et de centre Ω, milieu de (D, O) . Il en est de même de h = HD, 1 . Les symétriques A , B , C de D relativement aux côtés sont sur Γ (8.34) 2 donc h (A ) = P, h (B ) = Q, h (C ) = R sont sur γ = h (Γ). Enfin γ passe par A = h (A), B = h (B), C = h (C), milieux de (D, A), (D, B), (D, C). Le cercle γ s’appelle le cercle des neuf points du triangle ABC. A γ
A D K
J Ω
G
O
© Dunod. La photocopie non autorisée est un délit.
B
P
I
C
A
Définition 8.36. Soit un triangle ABC non rectangle d’orthocentre D. On a quatre points et quatre triangles, chaque point étant orthocentre du triangle formé par les trois autres. On a six droites : les côtés et les hauteurs d’un quelconque des quatre triangles. On dit que A, B, C, D sont en situation orthocentrique. Les pieds des hauteurs P, Q, R sont les mêmes pour les quatre triangles et sont sommets du triangle orthique de la configuration orthocentrique. Le cercle des neuf points est le même pour les quatre triangles.
i
i i
i
i
i
i
i
8 • Espaces affines euclidiens
226
8.2.3. Isométries Une application affine f : E → E est une isométrie si l’application linéaire associée f : E → E est une isométrie vectorielle. Autrement dit, l’ensemble des isométries de E est image réciproque du sousgroupe O(E) ⊂ GL(E) par le morphisme f → f , GA(E) → GL(E). C’est un sous-groupe O(E) ⊂ GA(E). Une isométrie f est un déplacement (resp. un antidéplacement) si det f = +1 (resp. det f = −1). Les déplacements forment un sous-groupe distingué SO(E) d’indice 2 de O(E). Définition 8.37.
Une isométrie f conserve les distances : pour M et N d’images f (M) = M et −− → − → − → f (N) = N , on a MN = MN = f (MN) = M N = M N . On montre plus généralement que toute application E → E (non supposée a priori affine) conservant les distances est une application affine, donc est une isométrie au sens précédent. Réflexions. Étant donné un hyperplan affine H, il existe une unique isométrie, notée σH , dont l’ensemble des points fixes est H. Son application linéaire associée est la réflexion vectorielle autour de l’hyperplan vectoriel H. On dit que σH est la réflexion d’hyperplan H. Proposition 8.38.
Démonstration. Supposons qu’une telle isométrie σ existe. Alors σ laisse fixes les vecteurs de H et n’est pas I E car σ n’est pas une translation. Donc σ est nécessairement la réflexion vectorielle sH . L’application linéaire associée σ = sH et l’image de tout point de H étant imposés, σ est unique. Inversement, soit un point O et un hyperplan vectoriel H . L’application affine d’application linéaire associée s H et conservant O est une isométrie dont l’ensemble des points fixes est l’hyperplan affine H = O + H . ⊥
La droite vectorielle δ = H est propre pour sH pour la valeur propre −1. Soit un point M ∈ / H et H la projection orthogonale de M sur H, intersection de la droite affine −→ − → − → M + δ avec H. L’image M = σH (M) est donnée par HM = sH (HM) = −HM. Ceci décrit l’action de la réflexion σ H . Proposition 8.39. Les réflexions affines engendrent le groupe des isométries affines
O(E).
Démonstration. Montrons que toute isométrie f est composée de réflexions. −−−→ − → 1) Cas où f a un point fixe O. On vectorialise en O. Pour tout M, Of (M) = f (OM). On sait qu’il existe des réflexions vectorielles s 1 , . . . , sp d’hyperplans vectoriels H 1 , . . . , Hp telles que f = s1 ◦ · · · ◦ sp . Pour tout i, soit σi la réflexion affine d’hyperplan O + H i . Alors σ1 ◦ · · · ◦ σp = f car c’est l’application affine laissant O fixe d’application linéaire associée σ1 ◦ · · · ◦ σp = f .
i
i i
i
i
i
i
i
8.2 Géométrie euclidienne
227
2) Cas où f n’a pas de point fixe. Soit O ∈ E , O = f (O) et H l’hyperplan médiateur de (O, O ) : hyperplan orthogonal à (OO ) passant par le milieu de (O, O ). Alors g = σH ◦ f est une isométrie laissant O fixe. Il suffit d’appliquer ce qui précède à g puis d’utiliser la relation f = σ H ◦ g. Comme en algèbre linéaire, cette décomposition d’une isométrie en composée de réflexions f = σ1 ◦ · · · ◦ σp n’est pas unique, mais la parité de p est un invariant. En effet, f = σ1 ◦ · · · ◦ σp , det(f ) = (−1)p , d’où p est pair pour un déplacement, impair pour un antidéplacement. Proposition 8.40. Bissectrices. A, B sont deux droites d’un plan, sécantes en O. Il existe deux réflexions qui les échangent, et leurs axes M, N sont caractérisées par les propriétés : (i) M et N sont orthogonales, (ii) le faisceau A, B, M, N est harmonique.
Démonstration. Supposons que X est axe d’une réflexion σ échangeant A et B . Comme {O} = A ∩ B , {σ(O)} = σ(A) ∩ σ(B) = B ∩ A = {O} ce qui implique → → O ∈ X . Soit − u et − v des vecteurs unitaires de A = A et B = B. Nécessairement − → → − σ( u ) = ± v , et donc deux possibilités pour σ : → → → → → → → → → → u +− v)=− u +− v et σ(− u −− v ) = −(− u −− v ), u et − v , σ(− • ou bien σ échange − → → u +− v , non nul car alors X est la droite M passant par O de vecteur directeur −
A = B , → → → → → → → → → → v , σ(− u −− v)=− u −− v et σ(− u +− v ) = −(− u +− v ), u et −− • ou bien σ échange − → − → − alors X est la droite N passant par O de vecteur directeur u − v , non nul car A = B .
© Dunod. La photocopie non autorisée est un délit.
P
H HH
HH M H H H O H HH H Q HH
N
A
M
HH B H
Inversement, les réflexions d’axes M et N conservent O et échangent les droites vectorielles A et B , donc échangent les droites affines A et B . Ce sont les deux réflexions annoncées. Comme → → → → → → (− u +− v )·(− u −− v ) = − u 2 − − v 2 = 0, M et N sont orthogonales. Soit P ∈ A, Q = σM (P). Alors (PQ) est parallèle à N et coupe M en M milieu de (P, Q). On en déduit que [A, B, M, N ] = −1 (8.27, p. 218)
Réciproquement, soit M, N orthogonales en O telles que [A, B, M, N ] = −1. Pour tout P ∈ A, la parallèle à N passant par P coupe B en Q et M en M tels que M soit milieu de (P, Q). Donc Q = σM (P) et σM échange bien A et B . 'B). On dit que M, N sont les bissectrices de ( A,
i
i i
i
i
i
i
i
228
8 • Espaces affines euclidiens
8.2.4. Classification des isométries À une isométrie affine f , on associe le sous-espace Fix(f ) = E 1 des vecteurs fixes → − par f , sous-espace propre de f pour la valeur 1 (réduit à { 0 } si 1 non valeur propre). Deux cas se présentent : • ou bien f est à points fixes : l’ensemble Fix(f ) des points fixes par f est non vide, • ou bien f est sans points fixes : aucun point de E n’est fixe par f (cas des translations par exemple). Le cas où f a un point fixe O est plus facile à imaginer. Par vectorialisation en O, f −−−→ − → opère comme f : pour tout M, Of (M) = f (OM). Le b) de la proposition suivante montre comment f opère si elle est sans point fixe : Proposition 8.41. a) Si f est à points fixes, l’ensemble Fix(f ) est un sous-espace
affine de direction E1 et tout sous-espace de direction E 1⊥ est stable. → b) Si f est sans point fixe, il existe un unique vecteur − v et une unique isométrie affine → → → − ◦ f = f ◦ T ; de plus, − v ∈ E1 et la restriction à points fixes f1 tels que f = T− 1 1 v v → . de f à Fix(f1 ) est la translation T− v c) L’entier n − dim E1 est pair ou impair selon que f est un déplacement ou un antidéplacement.
Démonstration. On sait (voir la proposition 7.9, p. 185) que E 1 = Ker(IE − f ) et Im(IE − f ) sont supplémentaires orthogonaux. −−−→ − → a) Supposons f à points fixes. Soit O ∈ Fix(f ). Pour tout M, Of (M) = f (OM), donc − → − → − → f (M) = M si et seulement si f (OM) = OM, i.e. OM ∈ E1 , i.e. M ∈ O + E1 . Ainsi, Fix(f ) = O + E1 est sous-espace affine de direction E 1 . Un sous-espace F de direction E 1⊥ coupe Fix(f ) en un point H fixe (p. 210). On a f (F) = f (H) + f (E1⊥ ) = F car f (H) = H et f (E1⊥ ) = E1⊥ . → → b) Supposons f sans point fixe. On est ramené à chercher − u = −− v vérifiant deux conditions : → (1) d’une part T− u doit commuter avec f , → (2) d’autre part f1 = T− u ◦ f doit être à points fixes. → → → 1) La translation T− u commute avec f si et seulement si T − u ◦ f = f ◦ T− u , donc −1 . La conjuguée de T − −1 = T → → − → → − si T− = f ◦ T ◦ f par f étant f ◦ T ◦ f → u u u u f (− u) → − → − → − (p. 213), il faut et il suffit que u = f ( u ), donc que u ∈ E . 1
2) Soit A fixé dans E . Pour tout point O ∈ E , on a
−−−→ − → − → → − → − → − → T− u ◦ f (O) = f (O) + u = f (A) + f (AO) + u = A + Af (A) + f (AO) + u −−−→ − → − → → Pour que O soit fixe par T − u ◦f , il faut et il suffit que O = A+ Af (A)+f (AO)+ u , donc − −−−→ → → → que Af (A) = IE − f (AO) − − u . Donc T− u ◦ f aura un point fixe si et seulement si −
−−−→ → → − → − Af (A) est somme de v = − u appartenant à E1 et d’un vecteur du type IE −f (AO) de Im(IE − f ) = E1⊥ .
i
i i
i
i
i
i
i
8.2 Géométrie euclidienne
229
En utilisant la décomposition en somme directe orthogonale E = E 1 ⊕⊥ E1⊥ , on voit −−−→ → que Af (A) se décompose de façon unique en somme d’un vecteur − − u ∈ E1 et d’un ⊥ vecteur de E1 = Im(IE − f ).
c) Le polynôme caractéristique de f est χf (X) = (X − 1)p (X + 1)q Q(X) où p = dim E1 et Q n’a pas de racine réelle, donc est de degré pair. Alors q = n − p − deg Q a la même parité que n − p. → − → − → → Les isométries sans point fixe, du type f = T − v ◦ f1 = f1 ◦ T− v ( v = 0 , → − Fix(f1 ) = φ) sont les isométries glissées, v ∈ E1 est le vecteur de glissement. Les isométries à points fixes sont à glissement nul. On classe les isométries affines dans un tableau selon qu’elles sont ou non glissées (2 cas) et selon la valeur de dim E1 ∈ {0, 1, . . . , n} (n + 1 cas). Voici quelques cas particuliers : • Cas où 1 n’est pas valeur propre. En ce cas dim E 1 = 0 et IE − f est bijective de E sur lui-même. Soit A un point de E . Pour que O ∈ E soit fixe, il faut et il suffit −−−→ − → que Af (A) = (IE − f )(AO). Comme IE − f est bijective, il existe un unique point
−−−→ fixe O = A + (IE − f )−1 Af (A) . Un cas sur les 2n + 2 recensés ne se produit pas : il n’existe pas d’isométrie glissée si dim E 1 = 0. • Cas où dim E1 = n. On a f = IE , – ou bien f = IE est l’identité, → – ou bien f = T− v est une translation. • Cas où dim E1 = n − 1. Alors E1 est un hyperplan et f est la réflexion autour de l’hyperplan E1 .
© Dunod. La photocopie non autorisée est un délit.
– ou bien f est une réflexion d’hyperplan affine H de direction E 1 , – ou bien f est composée commutative d’une réflexion f 1 d’hyperplan H de direc→ − → tion H = E1 et d’une translation T − v où v ∈ E1 . On dit que f est la réflexion → − glissée d’hyperplan H et de vecteur v . En dimension 2, on a cinq types d’isométries : • dim E1 = 2, les déplacements identité et translations, • dim E1 = 1, les antidéplacements réflexions et réflexions glissées autour d’une droite, • dim E1 = 0, les déplacements rotations dotées d’un centre et d’un angle. Rappelons qu’étant donné deux droites A et B d’un plan, la composée de réflexions σB ◦ σA est le déplacement : → → si A et B sont parallèles, B étant image de A par la translation de vecteur 1 − • T− v v
orthogonal à ces droites,
2
• rot(O, θ) si A et B sont sécantes en O, B étant image de A par la rotation de centre O et d’angle 12 θ .
i
i i
i
i
i
i
i
230
8 • Espaces affines euclidiens
8.2.5. Isométries en dimension 3 On a sept types d’isométries : • dim E1 = 3, les déplacements identité et translations, • dim E1 = 2, les antidéplacements réflexions et réflexions glissées autour d’un plan, • dim E1 = 1, les déplacements rotations et vissages (rotations glissées) autour d’un axe, • dim E1 = 0, les antidéplacements isométries à point fixe unique, dont les symétries centrales sont un cas particulier. L’espace E de dimension 3 étant orienté, les données nécessaires pour définir une rotation f sont : • un axe D muni d’une orientation donnée par un de ses deux vecteurs unitaires → w, directeurs − • un angle θ défini modulo 2π .
→ w déterminant l’orientation de D permet de définir une La donnée du vecteur − ⊥ → → u ,− v ) orthonormale orientation sur le plan vectoriel orthogonal D = P : une base (− → − − → − → de P sera dite directe si la base orthonormale ( u , v , w ) de E est directe. Pour tout Ω ∈ D , le plan PΩ = Ω + P est stable et f induit sur PΩ la rotation de centre Ω et d’angle θ . → → Si on remplace − w et θ par −θ , on obtient la même rotation 1. w par −− → Un vissage d’axe D est composé d’une rotation d’axe D et d’une translation T − v → où − v ∈ D. Le vecteur de glissement peut servir à orienter D .
Définition 8.42. Soit une droite D . La rotation d’axe D et d’angle π est le retournement (ou symétrie axiale) d’axe D , noté ρ D . Comme π et −π sont congrus modulo 2π , il n’est pas besoin en ce cas d’une orientation sur D . Proposition 8.43. En dimension 3, tout déplacement f est un composé de deux
retournements.
Démonstration. Soit f un déplacement. Alors f est une rotation vectorielle d’axe une droite vectorielle D orientée et d’angle θ . Soit D 1 une droite vectorielle orthogonale à D , D2 l’image de D1 par la rotation vectorielle d’axe D et d’angle 2θ , r1 et r2 les retournements vectoriels d’axes D 1 et D2 , on sait alors que f = r2 ◦ r1 . → a) Cas où f = T− v est une translation. Alors f = I E . Ce qui précède est encore → v ), D1 = D2 = δ orthogonale à D . Soit O1 un point, valable en prenant D = Vect(− → − 1 O2 = O1 + 2 v , D1 = O1 + δ, D2 = O2 + δ, ρ1 et ρ2 les retournements affines 1. C’est une difficulté de ne pas pouvoir choisir canoniquement l’orientation de D . Alors qu’en géométrie plane, une rotation est définie de façon unique par son centre et son angle, il n’en est pas ainsi en dimension 3.
i
i i
i
i
i
i
i
8.2 Géométrie euclidienne
231
d’axes D1 et D2 . Alors ρ2 ◦ ρ1 a r2 ◦ r1 = IE pour application linéaire associée, −−→ → donc est une translation. L’image de O 1 est ρ2 (O1 ) = O1 + 2O1 O2 = T− v (O1 ), donc → ρ2 ◦ ρ1 = T− = f . v b) Cas où f est une rotation d’axe D . Soit un point O ∈ D , les droites affines D1 = O + D1 et D2 = O + D2 , ρ1 et ρ2 les retournements affines autour de D 1 et D2 . Alors ρ2 = r2 , ρ1 = r1 , donc ρ2 ◦ ρ1 laisse O = f (O) fixe et admet r2 ◦ r1 = f comme application linéaire associée. On a donc f = ρ 2 ◦ ρ1 (p. 209). → → c) Cas où f est un vissage : f = T − v ◦ g = g ◦ T− v où g est une rotation d’axe D → ayant − v pour vecteur directeur. Soit D 3 une droite coupant D orthogonalement et ρ 3 le retournement d’axe D 3 . Par b), on peut écrire g = ρ3 ◦ ρ1 où ρ1 est le retournement dont l’axe D 1 se déduit de D3 par la rotation d’axe D et d’angle − θ2 . → Par a), on peut écrire T− v = ρ2 ◦ ρ3 où ρ2 est le retournement d’axe D 2 où D2 se → déduit de D3 par la translation T 1 − v. 2
→ On en déduit f = T− v ◦ g = (ρ2 ◦ ρ3 ) ◦ (ρ3 ◦ ρ1 ) = ρ2 ◦ ρ1 .
Les isométries ayant un unique point fixe O sont des antidéplacements. La symétrie centrale SO de centre O (homothétie H O,−1 ) est un exemple. Soit f une isométrie distincte de SO de seul point fixe O. Alors g = S O ◦ f = f ◦ SO est un déplacement ayant O pour point fixe ; g est distinct de l’identité car f est différent de S O . Par la classification des déplacements, g est une rotation d’axe D passant par O. Ainsi f se décompose de façon unique en f = S O ◦ g = g ◦ SO où g est une rotation d’axe passant par O.
© Dunod. La photocopie non autorisée est un délit.
8.2.6. Similitudes en dimension 2 Définition 8.44. Soit P un plan affine euclidien orienté de plan vectoriel associé P . Étant donné k > 0, on appelle similitude de rapport k toute application affine f ayant la propriété : pour tout couple (M, N) de points de transformés M = f (M) et N = f (N), on a M N = k × MN. Autrement dit, f multiplie les longueurs par k.
• Les isométries sont les similitudes de rapport 1. • Une homothétie de rapport ±k est une similitude de rapport k. Lemme 8.45. Soit f une similitude de rapport k . Alors f est composée (d’une infinité
de façons) d’une homothétie h de rapport ±k et d’une isométrie u. On a det f = ±k 2 .
Démonstration. Soit h une homothétie de rapport ±k. Alors f ◦ h −1 = u est une isométrie et f = u ◦ h. On a f = u ◦ h = u ◦ (±kIP ), d’où det f = det u × det(±kIP ) = det u × k2 . Comme det u = ±1 selon que u est directe ou indirecte, det f = ±k 2 .
i
i i
i
i
i
i
i
232
8 • Espaces affines euclidiens
Définition 8.46. On dit que f est une similitude directe si det f > 0, indirecte
si det f < 0. • Une isométrie est une similitude directe ou indirecte selon qu’elle est directe ou indirecte comme isométrie. • Les homothéties sont des similitudes directes. L’énoncé suivant est immédiat : Les similitudes forment un groupe Sim(P). L’application associant à une similitude son rapport f → k(f ) est un morphisme Sim(P) → R×+ dont le noyau est le sous-groupe des isométries O(P). Les similitudes directes forment un sous-groupe Sim + (P) d’indice 2. Proposition 8.47. Soit une similitude f de rapport k = 1. Alors :
a) f a un unique point fixe O, b) il existe un unique couple (h, u) d’une homothétie h de rapport positif et d’une isométrie u tels que f = h ◦ u = u ◦ h. L’homothétie h est de rapport k et de centre O. L’isométrie est • une rotation de centre O si f est directe, • une réflexion d’axe passant par O si f est indirecte. c) f conserve les angles ou les change en leurs opposés selon que f est directe ou indirecte.
Démonstration. a) Soit A ∈ P . Pour tout M ∈ P , on a −−−→ −−−→ −−−−−−→ −−−→ − → Mf (M) = Mf (A) + f (A)f (M) = Mf (A) + f (AM) − −−−→ − → → − → −−−→ = MA + Af (A) − f (MA) = Af (A) − IP − f (AM) −−−→ − → Un point O est fixe si et seulement si Af (A) = IP − f (AO). Comme k = 1, 1 n’est pas valeur propre de f , donc I P − f est bijective. L’unique point fixe O est donc défini
−−−→ − → par AO = (IP − f )−1 Af (A) .
b) Supposons qu’il existe un couple (h, u) d’une homothétie positive h et d’une rotation u tel que f = h ◦ u = u ◦ h. Alors k(f ) = k(h)k(u) = k(h), donc l’homothétie positive h est nécessairement de rapport k. Soit Ω le centre de h. Alors h = u ◦ h ◦ u −1 est de centre Ω = u(Ω) (p. 213). Donc Ω est fixe par h et u, donc par f , d’où Ω = O est l’unique point fixe de f . Nécessairement, h = H O,k . Inversement, f ◦ HO,k ◦ f −1 est l’homothétie de même rapport et de centre f (O) = O. −1 Donc HO,k commute avec f . L’application u = f ◦ H −1 O,k = HO,k ◦ f est une isométrie commutant avec HO,k .
i
i i
i
i
i
i
i
Exercices
233
On a det f = k 2 det u, donc f est directe ou indirecte selon que u est un déplacement ou un antidéplacement. Comme u(O) = O, u est une rotation de centre O si f est directe, une réflexion d’axe passant par O si f est indirecte.
c) Comme les homothéties conservent les angles, f = H O,k ◦ u et u ont même action sur les angles. Si f est directe, on dit que f est la similitude directe de centre O, de rapport k et d’angle θ , elle est notée sim(O, k, θ).
EXERCICES Exercice 8.5. Soit dans un plan affine P trois droites distinctes A, B, C et deux droites vectorielles F et G distinctes des directions de A, B, C . Au point M ∈ A, on associe le point N = f (M) où la droite M + F coupe B et le point P = g(N) = h(M) où la droite N + G coupe C . Les droites (MN) et (NP) sont donc de directions fixes F et G si M décrit A. La question est : la direction de la droite (MP) reste-t-elle fixe ?
1) Montrer que c’est le cas si A, B, C sont concourantes ou parallèles. 2) On suppose que les droites A = (BC), B = (CA) et C = (AB) forment un véritable triangle de sommets ABC. Montrer que (MP) a une direction fixe si et seulement si F = G.
Exercice 8.6. Dans un plan affine, soit A 1 , B1 distincts, λ ∈ R, distinct de 0, 1, −1,
© Dunod. La photocopie non autorisée est un délit.
−−→ −−→ A2 , B2 tels que A2 B2 = λA1 B1 .
1) Montrer qu’il existe exactement deux homothéties H et H transformant la paire de points {A1 , B1 } en la paire de points {A 2 , B2 }. 2) Soit O et O les centres de H et H , I1 et I2 les milieux de (A1 , B1 ) et (A2 , B2 ). Montrer que O , O , I1 , I2 sont alignés et que [O , O , I1 , I2 ] = −1. Exercice 8.7. Soit un triangle ABC, P, Q, R les milieux de (B, C), (C, A), (A, B), A , B , C
des points de (BC), (CA), (AB), A , B , C leurs symétriques respectifs par rapport à P, Q, R.
Montrer que s (AA ), (BB ), (CC ) sont concourantes ou parallèles si et seulement s’il en est ainsi pour (AA ), (BB ), (CC ). Montrer que A , B , C sont alignés si et seulement s’il en est ainsi pour A , B , C .
i
i i
i
i
i
i
i
8 • Espaces affines euclidiens
234
Exercice 8.8. Soit ABC un triangle, A , B , C des points de (BC), (CA), (AB). Les
parallèles à (AC) passant par A , (BC) passant par B , (CA) passant par C coupent respectivement (CA) en B , (AB) en C , (BC) en A . Montrer que (AA ), (BB ), (CC ) sont concourantes ou parallèles si et seulement s’il en est ainsi pour (AA ), (BB ), (CC ). Montrer que A , B , C sont alignés si et seulement s’il en est ainsi pour A , B , C .
Exercice 8.9. Soit un triangle ABC, une droite ne passant ni par les sommets, ni par les milieux des côtés coupant (BC), (CA), (AB) en A , B , C . Soient A , B , C les conjugués harmoniques de A , B , C par rapport à (B, C), (C, A), (A, B). Donner les relations d’alignement entre A , B , C , A , B , C et de concours ou parallélisme entre (AA ), (BB ), (CC ), (AA ), (BB ), (CC ).
Soit un triangle ABC, A , B , C sur (BC), (CA), (AB) alignés. On suppose que les droites (AA ), (BB ) (resp. (BB ), (CC ), resp. (CC ), (AA )) sont sécantes en R (resp. P, resp. Q). Montrer que Exercice 8.10. Quadrilatère complet.
[A, A , Q, R] = [B, B , R, P] = [C, C , P, Q] = −1 Exercice 8.11. Soit A, B deux points distincts, I le milieu de (A, B) et D la droite (AB).
À tout M ∈ D , on associe son conjugué harmonique N relativement à A et B.
1) Montrer que pour que M soit entre A et B, il faut et il suffit que N ne soit pas entre A et B. 2) Montrer que l’application M → N induit une bijection entre le segment [I, B] privé − → de I et la demi-droite limitée par B du sens de AB. Exercice 8.12. Soit P un plan euclidien orienté, O un point de P , θ un angle. Montrer que la conjuguée de la rotation f = rot(O, θ) de centre O et d’angle θ par une isométrie g est la rotation de centre g(O) et d’angle θ ou −θ selon que g est un déplacement ou un antidéplacement. Exercice 8.13. Soit une rotation f d’axe une droite D orientée par un vecteur unitaire
− → k et d’angle θ . Déterminer l’ensemble des isométries commutant avec f .
Exercice 8.14. Soit dans un plan euclidien P des points A, B, A , B tels que A = B et
A = B . Montrer qu’il existe une unique similitude directe s telle que s(A) = A et s(B) = B .
i
i i
i
i
i
i
i
Problèmes
235
PROBLÈMES Les corrigés de ces problèmes sont disponibles sur le site de Dunod : www.dunod.com.
8.1. PROBLÈME Soit un espace affine E . On donne trois vecteurs colinéaires distincts de même sens → − → → → vi . v1 , − v2 , − v3 , trois points A1 , A2 , A3 de E et les trois points B1 , B2 , B3 où Bi = Ai + − → − → − Pour deux indices distincts i, j de {1, 2, 3}, on définit λ j,i > 0 par vj = λj,i vi . Soit (resp. H ) l’homothétie de rapport λ Hj,i j,i (resp. −λj,i ) de centre Oj,i (resp. Oj,i ) j,i transformant Ai , Bi en Aj , Bj (resp. Bj , Aj ) (8.6, p. 233). 1) Montrer que Oi,j = Oj,i et Oi,j = Oj,i . On notera ces points Ok et Ok où k est le troisième indice de {1, 2, 3} distinct de i et j . 2) Quels alignements a-t-on entre les six points O 1 , O2 , O3 , O1 , O2 , O3 ? 3) Faire une figure où seront représentés les six points O 1 , O2 , O3 , O1 , O2 , O3 et les milieux I1 de (A1 , B1 ), I2 de (A2 , B2 ), I3 de (A3 , B3 )
8.2. PROBLÈME Soit E affine de dimension au moins 2, f : E → E , M → f (M) = M 1 , une application − → −−→ (non supposée a priori affine) telle que, pour tout couple de points M, N, MN et M1 N1 soient colinéaires. Il s’agit de montrer que si f n’est pas constante, alors c’est une homothétie ou une translation. 1) Montrer que si f n’est pas une application constante, alors elle est injective, ce qu’on supposera dans la suite. 2) Montrer que si f a un point fixe O, c’est une homothétie de centre O.
© Dunod. La photocopie non autorisée est un délit.
3) Montrer que si f n’a pas de point fixe, c’est une translation.
8.3. PROBLÈME Dans un plan affine P de plan vectoriel associé P , on donne une droite affine D de direction D = D . Soit GD le groupe des f ∈ GA(E) induisant l’identité sur D . 1) Soit O ∈ D . Montrer que pour qu’une application affine f appartienne à G D , il faut et il suffit que f (O) = O et que l’application linéaire f soit une dilatation ou une transvection d’axe D . 2) On dit alors que l’application affine f est une dilatation d’axe D si l’application linéaire f est une dilatation. Décrire alors l’action de f . 3) On dit que f est une transvection affine si l’application linéaire f est une transvection. Montrer que les droites parallèles à D sont stables et que la restriction de f à chacune de ces droites est une translation.
i
i i
i
i
i
i
i
236
8 • Espaces affines euclidiens
4) Montrer que l’ensemble des transvections de G D auquel on adjoint l’identité est un sous-groupe commutatif distingué de G D . 5) Une application affine f dont l’application linéaire associée est une transvection est-elle toujours une transvection affine ?
8.4. PROBLÈME Soit f une application affine d’un espace affine E dans lui-même. 1) On forme les sous-espaces vectoriels E 1 = Ker(IE − f ) et F1 = Im(IE − f ). −−−→ Soit A ∈ E . Montrer que Fix(f ) est non vide si et seulement si Af (A) ∈ F1 . En déduire que l’ensemble des points fixes Fix(f ) est réduit à un unique point si et seulement si 1 n’est pas valeur propre de f . 2) On dira que f admet une décomposition canonique si et seulement s’il → v , f1 ) où f1 est affine avec Fix(f1 ) non vide tel que existe un unique couple (− → → f = T− v ◦ f1 = f1 ◦ T− v . Montrer qu’il en est ainsi si et seulement si E 1 et F1 sont en somme directe. → v ∈ E. 3) Soit E un plan affine, D une droite, τ une transvection d’axe D (pb. 8.3), −
→ La composée f = T− v ◦ τ a-t-elle une décomposition canonique ?
8.5. PROBLÈME (groupes diédraux et polygones réguliers) Soit P un plan affine euclidien de plan vectoriel associé P . 1) Soit G un groupe d’isométries ne contenant pas de translation, G + = G∩SO(P) le sous-groupe des déplacements de G. Montrer qu’il existe un point O ∈ P tel que, pour tout f ∈ G, on ait f (O) = O (pour f, g dans G+ , considérer f ◦ g ◦ f −1 ◦ g−1 ). 2) Désormais, on suppose G de cardinal fini non réduit à G + . Montrer que Card(G) = 2n est pair et que G+ est cyclique de cardinal n. 3) Montrer que l’ensemble des antidéplacements de G est formé de n réflexions σ p pπ d’axes Dp passant par O (0 p n − 1), avec (D 0 , Dp ) = n . 4) Soit M distinct de O. Montrer que l’orbite G(M) de M par G est formée • de 2n points distincts si M n’est sur aucune des droites D p , • de n points distincts, coïncidant avec l’orbite G + (M) de M pour G+ si M est sur l’une des droites Dp . 5) Montrer que le centre de G est {I P } si n impair, {IP , SO } si n pair. 6) On fait opérer G sur l’ensemble Σ des réflexions de G par conjugaison : à (f, σ) ∈ G×Σ, on associe f ◦σ ◦f −1 . Montrer que les actions de G et G + définissent les même orbites.
i
i i
i
i
i
i
i
Solutions des exercices
237
En conclure que les réflexions de G se groupent en deux classes de conjugaison si n est pair, une seule si n est impair. Proposer une interprétation géométrique pour les polygones réguliers d’ordre n. 7) Montrer que si n est impair, tout sous-groupe distingué non trivial de G est contenu dans G+ . Qu’en est-il si n est pair ?
SOLUTIONS DES EXERCICES → → Solution 8.1. On suppose dim E = 3. Soit − v1 et − v2 non colinéaires, D1 une droite de
→ → → → / A1 + Vect(− v1 , − v2 ), la droite D2 = A2 + R− v2 v1 , A1 ∈ D1 . Si A2 ∈ vecteur directeur − ne rencontre pas D1 , mais ne lui est pas parallèle. Solution 8.2. 1) Supposons (A + F ) ∩ (B + G) non vide. Soit M un point de l’inter− → − → − → − → − → section. Alors AM ∈ F et BM ∈ G, d’où AB = AM − BM ∈ F + G. − → − → → − → − → v ∈ G tels que AB = − u +→ v. Inversement, supposons AB ∈ F +G. Il existe u ∈ F et − → − Alors M = B − v ∈ B + G. On a − → − → − → → → → → AM = AB + BM = (− u +− v)−− v =− u ∈F
© Dunod. La photocopie non autorisée est un délit.
donc M ∈ A + F , d’où (A + F ) ∩ (B + G) = φ. → ε un vecteur non dans G 2) Soit G ⊂ E de dimension q , H ⊂ G de dimension p − 1, − → − → − et F = H ⊕R ε . Alors F +G = G⊕R ε , de dimension q +1 n−1 est strictement − → → / G + R− ε . Alors F = A + F et contenu dans E . Prenons A, B dans E tel que AB ∈ − → G = B + G ne sont pas parallèles car F ⊂ G et F ∩ G = φ puisque AB ∈ / F + G. 3) Supposons F = A + F et G = B + G d’intersection vide, dim G = n − 1. Alors − → AB ∈ / F + G d’après a). Comme dim G = n − 1, ceci impose G = F + G, donc F ⊂ G. D’où F et G sont bien parallèles. Solution 8.3. Supposons ces droites deux à deux coplanaires et montrons que néces-
sairement, D1 , D2 , D3 ou bien sont dans un même plan, ou bien passent par un même point, ou bien ont même direction. Soit les plans P 1 = (D2 , D3 ), P2 = (D3 , D1 ), P3 = (D1 , D2 ). Cas où les plans ne sont pas distincts. Supposons P 1 = P2 . Ce plan contient les deux droites de P3 , donc est aussi confondu avec P 3 . Les trois droites sont bien dans ce même plan. Cas où les plans sont distincts. On a P i ∩ Pj = Dk , i, j, k étant distincts dans {1, 2, 3}. • Si D2 ∩ D3 = {M}, alors M ∈ P2 ∩ P3 = D1 , les trois droites passent par M. • Si D2 et D3 sont de direction δ, droite vectorielle contenue dans chacun des P i , δ = P 2 ∩ P 3 = D 1 . Les trois droites sont parallèles.
i
i i
i
i
i
i
i
8 • Espaces affines euclidiens
238
Solution 8.4.
En considérant des parallélogrammes évidents, les droites (B Q),
(BCA ), (AP) sont parallèles, de même que les droites (BQ), (ACB ), (A P). L’homothétie
h ◦ h = h ◦ h transforme (B Q) en (AP) et (BQ) en (A P). L’intersection Q de (B Q) et (BQ) est transformée en l’intersection P de (A P) et (AP). Cette homothétie composée étant de centre C , on a prouvé l’alignement de P, Q, C . Faisant opérer HC, 1 , on a 2 l’alignement de A , B , C . Solution 8.5. Soit M0 ∈ A tel que les points M0 , N0 = f (M0 ), P0 = g(N0 ) soient
distincts. La question est : les droites (MP) et (M 0 P0 ) sont-elles parallèles ? −−→ • Supposons A, B, C parallèles. La translation de vecteur M0 N0 transforme A en B et − → −−→ − → −−→ M en N. On a donc MN = M0 N0 ∈ F et de même NP = N0 P0 ∈ G. On en déduit − → − → − → −−→ −−→ −−→ MP = MN + NP = M0 N0 + N0 P0 = M0 P0 La droite (MP) est donc de direction fixe.
• Supposons A, B, C sécantes en O. Par le théorème de Thalès, on a
OM ON OP = = OM0 ON0 OP0 Par la remarque sur la réciproque du théorème de Thalès, on en déduit que (M 0 P0 ) et (MP) sont parallèles. • Soit ϕ (resp. ψ) la projection de P sur B (resp. C ) parallèlement à F (resp. G). Alors f (resp. g) est la restriction de ϕ à A (resp. de ψ à B ). La question est : h = g ◦ f est-elle la restriction à A d’une projection de P sur C ? S’il en est ainsi, B = A ∩ C est fixe par h. La droite B + F coupe B en f (B) = B et la droite B + G coupe la droite C en B. La droite (BB ) a donc F et G pour direction. On a donc F = G. Inversement, si F = G, le résultat est clair.
Solution 8.6. 1) Soit H l’application affine transformant A 1 en A2 , d’application li-
néaire associée l’homothétie vectorielle de rapport λ. C’est une homothétie de rapport −−→ −−→ λ, H (B1 ) = H (A1 ) + λA1 B1 = A2 + A2 B2 = B2 . Son centre est l’intersection O des droites (A1 A2 ) et (B1 B2 ). Inversement, une homothétie transformant A 1 en A2 et B1 en B2 est nécessairement H = HO ,λ . De même, l’application affine H transformant A1 en B2 , d’application linéaire associée l’homothétie vectorielle de rapport −λ, est une homothétie transformant B 1 en −−→ −−→ H (A1 ) − λA1 B1 = B2 + B2 A2 = A2 . Son centre est l’intersection O des droites (A1 B2 ) et (B1 A2 ). Inversement, une homothétie transformant A 1 en B2 et B1 en A2 est nécessairement H = HO ,−λ .
i
i i
i
i
i
i
i
Solutions des exercices
239
2) Comme H , H respectent les rapports de mesures algébriques, elles transforment toutes deux I 1 en I2 . On a donc l’alignement de O , O , I1 , I2 et
O I2 O I2 = λ = − O I1 O I1 Solution 8.7. En faisant opérer les symétries centrales de centres P, Q, R, on obtient
les égalités :
BA CA CB AB AC BC = , = , = CA BA AB CB BC AC BA CB AC CA AB BC × × = × × CA AB BC BA CB AC Les théorèmes de Ménélaüs et Céva donnent les résultats demandés. Solution 8.8. Le théorème de Thalès donne
B A A B = , B C A C donc
C B B C = , C A B A
A C C A = , A B C B
B A C B A C A B B C C A × × = × × B C C A A B A C B A C B
On applique alors les théorèmes de Ménélaüs et Céva. Solution 8.9. En considérant les égalités de conjugaison harmonique et l’égalité de
© Dunod. La photocopie non autorisée est un délit.
Ménélaüs
A B A B B C B C C A C A A B B C C A = − , = − , = − , × × =1 A C A C B A B A C B C B A C B A C B on obtient l’alignement de (A , B , C ), (A , B , C ), (A , B , C ) de même que le ), (BB ), (CC ) , concours ou le parallélisme de chacun des triplets de droites (AA
(AA ), (BB ), (CC ) , (AA ), (BB ), (CC ) et (AA ), (BB ), (CC ) . Solution 8.10. On applique le théorème de Ménélaüs aux triangles CAA et BAA
coupés respectivement par les droites (RBB ) et (QCC ). Ceci donne
RA B C BA QA CB C A × = 1 = × × × BC QA RA B A CA C B D’autre-part, (toujours d’après Ménélaüs) A B B C C A CB × × = 1, = −1 BC AC BA CB
i
i i
i
i
i
i
i
8 • Espaces affines euclidiens
240
En multipliant les deux premières relations, on obtient le résultat
QA RA × = −1 QA RA
soit
QA RA =− QA RA − →
− →
− →
Solution 8.11. 1) L’égalité AM = − AN montre que AM et MB = −BM sont de même BM BN
− → − → − → sens si et seulement si AN et NB = −BN sont de sens opposés. − → 2) Prenons IB pour vecteur unitaire. On pose x = IM et y = BN. La relation de Newton donne 2
1 = IB = IM × IN = IM × (IB + BN) = x(1 + y) L’application [0, +∞[→]0, 1], y → x =
Solution 8.12. On a g ◦ rot(O, θ) ◦ g −1
1 1+y
est bijective, d’où le résultat.
g(O) = g ◦ rot(O, θ) (O) = g(O), donc
g(O) est fixe par g ◦ rot(O, θ) ◦ g −1 . → → → → → → Soit − e2 une base orthonormale directe. La base − e1 ), − ε2 = g(− e2 ) est e1 , − ε1 = g(− orthonormale, directe ou indirecte selon que g est une isométrie directe ou indirecte. cos θ − sin θ − → → − . La matrice la rotation vectorielle rot(θ) dans la base e1 , e2 est sin θ cos θ → → C’est aussi la matrice de g ◦ rot(θ) ◦ g −1 dans la base orthonormale − ε (p. 212). ε ,− 1
2
Donc g ◦ rot(θ) ◦ g −1 est la rotation vectorielle d’angle θ ou −θ selon que la → → ε2 est directe ou indirecte, c’est-à-dire selon que g est un ε1 , − base orthonormale − déplacement ou un antidéplacement. Solution 8.13. Soit R(f ) l’ensemble des repères orthonormés tels que f soit d’ex-
pression analytique
⎛
⎞ ⎛ ⎞ x x cos θ − y sin θ f: ⎝ y ⎠− → f (M) ⎝ x sin θ + y cos θ ⎠ z z
Si f n’est pas un retournement, les repères orthonormés directs de R(f ) sont ceux de − → → → ı ,− j , k ) où O ∈ D . L’ensemble des déplacements qui commutent avec la forme (O, − f est formé des vissages d’axes D . Si f est un retournement, il faut ajouter à cet ensemble les repères orthonormés directs → − → → (O, − j ,− ı , − k ). L’ensemble des déplacements qui commutent avec f est formé des vissages d’axes D et des retournements d’axes rencontrant D orthogonalement. Si f n’est pas un retournement, les repères orthonormés indirects de R(f ) sont ceux → − → → de la forme (O, − ı ,− j , − k ). L’ensemble des antidéplacements qui commutent avec f est formé des symétries centrales autour de points de D .
i
i i
i
i
i
i
i
Solutions des exercices
241
Si f est un retournement, il faut ajouter à l’ensemble précédent les repères orthonor→ − → → ı ,− j , k ) où O ∈ D . més indirects (O, − Il faut ajouter à cet ensemble d’antidéplacements les réflexions glissées par un vecteur de D autour d’un plan passant par D .
− →
−− →
Solution 8.14. L’unique similitude vectorielle directe σ transformant AB en A B est de
© Dunod. La photocopie non autorisée est un délit.
−−→ − → rapport k = AABB et d’angle θ = (AB, A B ). L’application affine s définie par s(A) = A et s = σ est l’unique similitude directe transformant (A, B) en (A , B ).
i
i i
i
i
i
i
i
i
i i
i
i
i
i
i
Chapitre 9
Calculs barycentriques
© Dunod. La photocopie non autorisée est un délit.
L’introduction dans la section 1 de l’espace vectoriel E# des points pondérés d’un espace affine E permet l’application à la géométrie affine du calcul de l’algèbre linéaire. Des applications en géométrie plane sont présentées : aire algébrique dans un plan euclidien (9.2.1), problèmes de régionnement (9.2.2), géométrie du triangle (9.2.3). Les exercices proposés ont pour but de convaincre le lecteur de l’efficacité des méthodes calculatoires de l’algèbre linéaire. Et par exemple pour les problèmes de régionnement, l’étude du signe de certaines entités permet d’éviter de fastidieuses discussions.
9.1 ESPACE VECTORIEL DES POINTS PONDÉRÉS 9.1.1. Barycentres Soit un espace affine E de dimension n d’espace vectoriel associé E . Soit (α i , Mi )i une famille finie de couples d’un coefficient α i ∈ R et d’un point Mi ∈ E . Deux cas sont à distinguer pour l’application
E −→ E −→ P −→ i αi PMi Proposition 9.1. (i) Si
i αi = 0, cette application est constante et le vecteur −→ i αi PMi ne dépend pas du point P ∈ E . (ii) Si i αi = 0, cette application est une bijection de E sur lui-même.
i
i i
i
i
i
i
i
9 • Calculs barycentriques
244
Démonstration. En effet, étant donné deux points P et O, on a −→ −→ − → αi PMi − αi OMi = αi PO i
i
i
−→ −→ (i) Si αi = 0, i αi PMi = i αi OMi est indépendant de P (et de O). → (ii) Supposons i αi = 0. Soit − v ∈ E . Pour tout P ∈ E , on a −→ −→ − → αi OMi − ( αi )OP αi PMi = −→ − − −→ αi OMi − → v → → − donc αi PMi = v ⇔ OP = αi −→ − → Il existe bien un unique point P ∈ E tel que α PM = v .
i
i
−→ − → Si αi = 0, l’unique point M tel que i αi MMi = 0 est appelé barycentre des M i affectés des αi . Par ce qui précède, O étant donné quelconque, le barycentre M est caractérisé par la relation − → −→ αi OM = αi OMi Définition 9.2.
i
i
9.1.2. L’espace vectoriel E# Soit l’ensemble produit R × × E des couples (λ, M) où λ ∈ R× , ensemble des réels non nuls, et M ∈ E . Considérant R× × E et E comme disjoints, soit la réunion E# :
E E# = R× × E le signe (au lieu de ∪) rappelant que ces ensembles sont disjoints. On va munir E# d’une structure d’espace vectoriel de dimension n + 1 sur R. • Addition Soit x, y deux éléments de E#. On définit x + y ainsi : (1) Si x = (α, A), y = (β, B) où α, β sont non nuls et vérifient α + β = 0,
(α, A) + (β, B) = (α + β, C) avec C barycentre de α, A et β, B. (2) Si x = (α, A), y = (−α, B) où α = 0,
− → (α, A) + (−α, B) = αBA → (3) Si x = (α, A) où α = 0, y = − v, → → (α, A) + − v =− v + (α, A) = (α, A ) → −
→ −
où A = A + αv est le translaté de A par la translation de vecteur αv . → → − → (4) Si x = − u,y = − v sont deux vecteurs, la somme x + y est la somme → u +− v au sens de l’addition de E .
i
i i
i
i
i
i
i
9.1 Espace vectoriel des points pondérés
245
• Multiplication scalaire Soit x ∈ E# et λ ∈ R. On définit λx ainsi : → − (1) Si λ = 0 , pour tout x ∈ E#, 0x = 0 (2) Si x = (α, A) où α = 0 et si λ = 0, λ(α, A) = (λα, A) → − → − (3) Si x = v ∈ E , λ v est à entendre au sens de la structure d’espace vectoriel de E . Théorème 9.3. L’ensemble E# muni de ces opérations est un espace vectoriel sur R
de dimension n + 1.
Démonstration. Cet énoncé remplace les énoncés habituels sur l’associativité, la commutativité de l’opération barycentre. La démonstration est facile. Pour l’associativité de l’addition α, β, γ étant dans R × et A, B, C dans E , on doit distinguer plusieurs cas pour prouver la formule
(α, A) + (β, B) + (γ, C) = (α, A) + (β, B) + (γ, C) α+β +γ α+β +γ α+β +γ α+β +γ
= 0, = 0, = 0, = 0,
α+β α+β α+β α+β
= 0, = 0, = 0, = 0,
β+γ β+γ β+γ β+γ
= 0 = 0 = 0 =0
Traitons par exemple le cas où α + β + γ = 0, α + β = 0, β + γ = 0. On définit P, Q, R, S par les formules :
© Dunod. La photocopie non autorisée est un délit.
(α, A) + (β, B) = (α + β, P) (β, B) + (γ, C) = (β + γ, Q)
(α + β, P) + (γ, C) = (α + β + γ, R) (α, A) + (β + γ, Q) = (α + β + γ, S)
Il s’agit de prouver que R = S. Soit M un point quelconque. On a − → − → − → − → − → − → (α + β + γ)MR = (α + β)MP + γ MC = αMA + β MB + γ MC − → − → − → − → − → − → (α + β + γ)MS = αMA + (β + γ)MQ = αMA + β MB + γ MC Comme α + β + γ = 0, on a R = S, barycentre de (α, A), (β, B), (γ, C). Le lecteur est invité à faire d’autres vérifications pour se familiariser avec l’espace vectoriel un peu inhabituel des points pondérés. Le couple (λ, M) est le point M pondéré par le coefficient λ appelé masse de (λ, M). On vérifie immédiatement que l’application masse
µ : E# −→ R (λ, M) −→ λ → − v −→ 0 est une forme linéaire. Le noyau E est donc un hyperplan vectoriel de E#, d’où dim E# = dim E + 1 = n + 1.
i
i i
i
i
i
i
i
246
9 • Calculs barycentriques
9.1.3. Nouvelles notations L’espace affine E s’injecte canoniquement dans E# par l’injection M → (1, M). Identifiant E à son image, E est l’ensemble des éléments de E# de masse 1, on note λM au lieu de (λ, M) le point M pondéré par la masse λ. Explicitons ces nouvelles notations : − → → , ce qui v est le translaté de M par la translation T − v ∈ E, M + → • Pour M ∈ E et − v
éclaire la notation introduite au chapitre 8 (p. 204) − → • Si A, B sont deux points, on peut écrire AB = B − A
• Si (αi Mi )i est une famille de points pondérés telle que αi = 0, de barycentre M, on écrit : αi Mi A+B αi )M ou M = , ainsi est milieu de (A, B) αi Mi = ( 2 αi • Si (αi Mi )i est une famille de points pondérés telle que αi = 0, le vecteur −→ αi PMi , indépendant de P, est noté αi Mi .
9.1.4. Sous-espaces vectoriels de E# et sous-espaces affines de E Soit F un sous-espace affine de E de direction F . On voit immédiatement que F# = (R× × F) F est sous-espace vectoriel de E#.
# est une bijection de l’ensemble des sousProposition 9.4. L’application F → F
espaces affines de E sur l’ensemble des sous-espaces vectoriels de E# non contenus dans E .
Démonstration. Montrons qu’un sous-espace vectoriel Z ⊂ E de dimension d est du type F#. Posons F = Z ∩ E , sous-espace de dimension d − 1 de E . Il existe z ∈ Z tel z , on se ramène à z ∈ E . Soit F = z + F . On a que µ(z) = 0. Remplaçant z par µ(z) F# ⊂ Z , F = F , dim F# = d = dim Z , d’où F# = Z . On a donc deux sortes de sous-espaces vectoriels dans E# : • les sous-espaces vectoriels non contenus dans l’hyperplan E , du type F# où F est sous-espace affine de E , • les sous-espaces vectoriels contenus dans l’hyperplan E de E#. Les phénomènes d’incidence (alignement, coplanarité, etc.) dans E sont des phénomènes de dépendance linéaire dans E# et peuvent être traités par des techniques d’algèbre linéaire (nullité de déterminants, etc.). Par exemple, trois points A, B, C d’un espace affine E sont alignés si et seulement si A, B, C sont liés en tant que vecteurs de E#. Définition 9.5. On appelle isobarycentre d’un système de points M 1 , . . . , Mk le
point M = k1 (M1 + · · · + Mk ). Pour k = 2, le milieu de M1 , M2 est 12 (M1 + M2 ).
i
i i
i
i
i
i
i
9.1 Espace vectoriel des points pondérés
247
9.1.5. Exemple Soit un triangle ABC, A , B , C les milieux de (B, C), (C, A), (A, B), G l’isobarycentre ou centre de gravité de A, B, C. On a
1 1 1 1 G = (A + B + C) = (A + 2A ) = (B + 2B ) = (C + 2C ) 3 3 3 3 Ainsi, A, A , G est lié dans E#, donc G est sur la médiane (AA ). Il est de même sur (BB ) et (CC ). Donc les médianes concourent en G.
−→ − → − → On a aussi GA + 2GA = 0 et deux autres relations analogues, d’où GA GB GC = = = −2 GA GB GC
9.1.6. Repères barycentriques → → Soit un repère affine d’origine O et de base ( − e1 , . . . , − en ). À tout M ∈ E correspond son système (x1 , . . . , xn ) de coordonnées avec − → − → xi → xi − ei ou M = O + ei OM = n
n
i=1
i=1
→ → → → Comme (− e1 , . . . , − en ) est base de E et O ∈ / E , (O, − e1 , . . . , − en ) est base de E# et 1, x1 , . . . , xn sont les composantes de M ∈ E ⊂ E# dans cette base.
© Dunod. La photocopie non autorisée est un délit.
Définition 9.6. Un repère barycentrique ou simplexe est la donnée de n + 1
points (A0 , A1 , . . . , An ) non dans un même hyperplan affine de E , donc non dans un même hyperplan vectoriel de E# (par exemple, trois points non alignés d’un plan, ou quatre points non coplanaires d’un espace de dimension 3). C’est donc une base de E#. # Un point M ∈ E étant considéré comme vecteur de En , il existe un unique système de n + 1 scalaires ξ0 , . . . , ξn de R tel que M = 0 ξi Ai . Autrement dit M est barycentre des A i affectés des ξi , avec la relation i ξi = 1, obtenue en écrivant l’égalité des masses des deux membres : n n 1 = µ(M) = µ ξi A i = ξi
0
0
Pour tout λ = 0, λM = i (λξi )Ai . On dit que (λξ0 , λξ1 , . . . , λξn ) est un système de coordonnées barycentriques de M dans ce repère. Le point M a une infinité de systèmes de coordonnées barycentriques tous proportionnels. Parmi eux, (ξ0 , . . . , ξn ) est le seul dont la somme des coordonnées est 1
i
i i
i
i
i
i
i
9 • Calculs barycentriques
248
→ → Si − v ∈ E , on pourra écrire, de façon unique − v = i λi Ai et on a n n → − 0 = µ( v ) = µ λA = λ i i
0
i
0
9.1.7. Applications affines et applications linéaires Soit E, E deux espaces affines, µ, µ les formes linéaires masses. Étant donné une application affine f : E → E , on définit l’application f#: E# → E# ainsi : → → → ∀M ∈ E, ∀λ ∈ R, λ = 0, f#(λM) = λf (M) ; ∀− v ∈ E, f#(− v ) = f (− v) Proposition 9.7. Pour toute f : E → E affine, f# est linéaire. L’application f → f#
est une bijection de l’ensemble des applications affines E → E sur l’ensemble des applications linéaires ϕ : E# → E# telles que µ ◦ ϕ = µ.
Démonstration. Montrons la linéarité de f#. Par définition, on a f#(λx) = λf#(x) pour tout λ ∈ R et tout x ∈ E#. Montrons que f#(x + y) = f#(x) + f#(y) pour tout (x, y) ∈ E# × E#. Comme pour le théorème 9.3, p. 245, on distingue plusieurs cas. On se bornera au cas où x = αA, y = βB, A, B étant dans E , α, β des réels non nuls tels que α + β = 0, les autres cas se → − → − → − vérifiant facilement. Soit P le barycentre de A, α et B, β . On a α PA + β PB = 0 . Soit P = f (P), A = f (A) et B = f (B). On est ramené à prouver que P est barycentre de A , α et B , β . Comme f est affine d’application linéaire associée f , on a −−→ − −→ → − → − − → − → − → − → αP A + β P B = αf (PA) + βf (PB) = f (αPA + β PB) = f ( 0 ) = 0
Soit x ∈ E#. Montrons que µ(x) = µ f#(x) .
Si x = αA ∈ R× × E , on a f#(x) = αf (A) et α = µ(x) = µ f#(x) .
→ → v ∈ E , alors f#(x) = f (− v ) ∈ E , on a 0 = µ(x) = µ f#(x) . Si x = − Inversement, soit ϕ : E# → E# linéaire telle que µ ◦ ϕ = µ. Comme E (resp. E ) est l’ensemble des éléments de E# (resp. E# ) de masse 1, on a ϕ(E) ⊂ E . On vérifie alors, en utilisant la linéarité de ϕ, que l’application f : E → E induite par ϕ est affine et que ϕ = f#.
9.2 APPLICATION EN GÉOMÉTRIE PLANE Dans cette section P est un plan affine euclidien orienté de plan vectoriel associé P . → → v ,− w et une base orthonormale On sait qu’étant donné un système de deux vecteurs − → → → → ı ,− j ), la valeur du déterminant det B (− v ,− w ) ne dépend pas de la base directe B = (− orthonormale directe B . (Voir 7.3.5., page 191). On peut donc ne pas la mentionner. La → → v ,− w ) désignera le déterminant de ces vecteurs relativement à n’importe notation det(− quelle base orthonormale directe.
i
i i
i
i
i
i
i
9.2 Application en géométrie plane
249
9.2.1. Aires algébriques Lemme 9.8. Étant donné trois points A, B, C de P , on a les égalités de déterminants
− → − → − → − → − → − → det(AB, AC) = det(BC, BA) = det(CA, CB). Leur valeur commune sera notée [A, B, C].
Démonstration. Il suffit de prouver une des égalités, les autres se montrant de la même façon. On a − → − → − → − → − → − → − → − → − → det(BC, BA) = det(AC − AB, −AB) = det(AC, −AB) = det(AB, AC) Le lemme montre que [A, B, C] ne varie pas si on fait une permutation circulaire sur A, B, C et se change en son opposé si on transpose deux des lettres A, B, C : [A, B, C] = [B, C, A] = [C, A, B] = −[A, C, B] = −[C, B, A] = −[B, A, C]. Définition 9.9. On appelle aire algébrique du triangle orienté ABC la quantité
1 1 1 1 − → − → − → − → − → − → [A, B, C] = det(AB, AC) = det (BC, BA) = det (CA, CB) 2 2 2 2 ABC étant direct si [A, B, C] est positif, inverse sinon. S’il en est ainsi, les triangles ABC, BCA, CAB sont directs, les triangles ACB, CBA, BAC étant inverses. Voyons en quoi la notion précédente se raccroche à la notion d’aire d’un triangle des classes élémentaires. Considérons un triangle direct ABC. Soit ∆ la parallèle à (BC) passant par A, H la projection orthogonale de A sur (BC), A la projection ∆ b Z b Z orthogonale de B sur ∆. Selon la notion élémentaire, bbZ l’aire du triangle ABC est bZ bZ 1 1 bZ S = BC × AH = BC × BA b 2 2 Z b b Z D’autre part, en prenant les déterminants relativement B C H → → → → ı ,− j ) où − ı et − j à la base orthonormale directe ( − − → − → sont colinéaires de même sens à BC et BA , on a − → − → − → −→ −→ [A, B, C] = [B, C, A] = det(BC, BA) = det(BC, BA + A A) − → −→ = det(BC, BA ) = BC × BA = 2S
© Dunod. La photocopie non autorisée est un délit.
A
A
Théorème 9.10. Soit A, B, C un repère barycentrique de P et M un point.
Alors [M, B, C], [A, M, C], [A, B, M] est l’unique système de coordonnées barycentriques de M vérifiant [M, B, C] + [A, M, C] + [A, B, M] = [A, B, C]
i
i i
i
i
i
i
i
9 • Calculs barycentriques
250
Démonstration. Soit x, y, z le système de coordonnées barycentriques de M tel que − → − → − → x + y + z = 1. On a M = xA + yB + zC, d’où AM = y AB + z AC et − → − → − → − → [A, M, C] = det(AM, AC) = y det(AB, AC) = y[A, B, C] On a de même [M, B, C] = x[A, B, C] et [A, B, M] = z[A, B, C]. Ainsi, [M, B, C], [A, M, C], [A, B, M] sont proportionnels à x, y, z et
[M, B, C] + [A, M, C] + [A, B, M] = (x + y + z)[A, B, C] = [A, B, C]
9.2.2. Aires algébriques et déterminants dans l’espace P# → → Soit B = (− ı ,− j ) une base orthonormale directe et O un point origine. Alors → → # de dimension 3 des points (O, B) = (O, − ı ,− j ) est base de l’espace vectoriel P pondérés. # Proposition 9.11. Pour tout triangle ABC, on a dans l’espace vectoriel P [A, B, C] = det O,B (A, B, C) − → − → − → → → → → −ı + t− → Démonstration. Posons OA = α− ı + β− j , AB = x− ı + y− j et AC = z → j. #, alors Considérons A, B, C comme vecteurs de P − → → → A = O + OA = O + α− ı + β− j − → − → → → B = O + OA + AB = O + (α + x)− ı + (β + y)− j − → − → → → C = O + OA + AC = O + (α + z)− ı + (β + t)− j det O,B (A, B, C) = =
1 1 1 1 0 0 α α + x α + z = α x z β β+y β+t β y t − → − → x z = det B (AB, AC) = [A, B, C] y t
On a retranché la première colonne des deux autres dans le premier déterminant, puis développé par rapport à la première ligne.
9.2.3. Régionnement Définition 9.12. Étant donné un plan affine euclidien P de plan vectoriel
associé P , une fonction affine est une application affine non constante f : P → R. Autrement dit, f est déterminée par (p. 209) 1) l’image f (O) ∈ R d’un point O de P , 2) la forme linéaire associée f : P → R. − → Pour tout point M, on a alors f (M) = f (O) + f (OM).
i
i i
i
i
i
i
i
9.2 Application en géométrie plane
251
Voici trois aspects sous lesquels se présente souvent une fonction affine : → − − → (1) Analytiquement.
Soit(O, ı , j ) un repère. Supposons f (O) = c et → → Mat− ı ,− j (f ) = a b = 0 0 , alors
f: M
x −→ f (M) = ax + by + c y
− (2) Comme produit scalaire. Soit un point O et un vecteur non nul → v , l’application − → − → M → OM · v est une fonction affine. (3) Comme aire algébrique. Soit deux points distincts A, B, l’application M → [A, B, M] est une fonction affine. Définition 9.13. Si f est une fonction affine, les ensembles
∆λ = {M ∈ P|f (M) = λ} où λ ∈ R forment une famille de droites affines parallèles de direction Ker f . La donnée de f permet de partager le plan en • le demi-plan ouvert supérieur P f+ des M tels que f (M) > 0,
• le demi-plan ouvert inférieur P f− des M tels que f (M) < 0, • la droite V(f ) des M tels que f (M) = 0. On définit les demi-plans fermés +
P f = {M | f (M) 0},
−
P f = {M | f (M) 0}
© Dunod. La photocopie non autorisée est un délit.
Proposition 9.14. a) La donnée d’une droite ∆ détermine une unique partition de P
en la droite ∆ et deux demi-plans ouverts. b) Deux points A et B non sur ∆ sont dans le même demi-plan si et seulement si l’intersection du segment [A, B] avec ∆ est vide.
Démonstration. a) Soit des fonctions affines f, g déterminant la même droite ∆ = V(f ) = V(g). Les formes linéaires f et g sont proportionnelles car Ker f = Ker g . Il existe λ = 0 tel que g = λf . Soit O ∈ ∆. Pour tout M, on a − → − → g(M) = g(OM) = λf (OM) = λf (M). Si λ > 0, Pg+ = Pf+ et Pg− = Pf− . Si λ < 0, Pg− = Pf+ et Pg+ = Pf− . Les notions de demi-plan supérieur et demi-plan inférieur ne dépendent pas seulement de la droite ∆, mais aussi des fonctions affines déterminant ∆. En revanche, la partition du complémentaire de ∆ en deux demi-plans ouverts est intrinsèque, ne dépendant que de la droite ∆.
i
i i
i
i
i
i
i
9 • Calculs barycentriques
252
∆
a A A A A M Aa A A A Aa B
b) Soit f fonction affine nulle sur ∆ et A, B distincts non sur ∆. On a vu (chap. 8, p. 221) que l’application − → t → A + tAB = (1 − t)A + tB envoie R sur la droite (AB) et l’intervalle fermé [0, 1] sur le segment [A, B]. Pour M = tA+(1−t)B ∈ (A, B), on a (9.7, p. 248)
f (M) = f tA + (1 − t)B = tf (A) + (1 − t)f (B)
Si t varie de 0 à 1, M décrit le segment [A, B], f (M) décrit l’intervalle [f (A), f (B)]. Donc [A, B] rencontre ∆ si et seulement si 0 ∈ [f (A), f (B)], c’est-à-dire si et seulement si f (A) et f (B) sont de signes contraires, donc si et seulement si A et B ne sont pas dans le même demi-plan ouvert défini par ∆.
→ → Proposition 9.15. Soit (O, − ı ,− j ) un repère orthonormé, ∆ une droite d’équation ax + by + c = 0. La distance d’un point M0 (x0 , y0 ) à ∆ est d(M0 , ∆) =
|ax0 + by0 + c| √ a2 + b2
a M0 B B B H B ∆HHH B H a HH B H0 H H B HH Ba M O x H HH H
y
→ → → Démonstration. La droite vectorielle ∆ est l’ensemble des − v = ξ− ı + η− j tels que → − → − → aξ + bη = 0. C’est donc la droite vectorielle orthogonale à N = a ı + b− j . Soit M(x, y) ∈ ∆ et H0 la projection orthogonale de M 0 sur ∆. On a ax + by = −c car M(x, y) ∈ ∆. La formule se déduit alors des égalités : → −→ − MM0 · N = a(x0 − x) + b(y0 − y) = ax0 + by0 + c % → − → − −→ → −→ − |MM0 · N | = |MH0 · N | = MH0 × N = d(M0 , ∆) × a2 + b2 ax√0 +by0 +c a2 +b2
est la distance algébrique de M 0 à ∆. Son signe dépend du − → ⊥ sens du vecteur N définissant l’orientation de ∆ . Toutes les fonctions affines f telles que V(f ) = ∆ lui sont proportionnelles. La quantité
i
i i
i
i
i
i
i
9.2 Application en géométrie plane
253
9.2.4. Régionnement relatif à un triangle Soit un triangle direct ABC. Pour tout M, notons x(M), y(M), z(M) les coordonnées barycentriques de M telles que x(M) + y(M) + z(M) = 1. On a (9.10, p. 249)
x(M) =
[A, M, C] [A, B, M] [M, B, C] , y(M) = , z(M) = [A, B, C] [A, B, C] [A, B, C]
Les trois droites (AB), (BC), (CA) déterminent 6 demi-plans ouverts :
A+ = {M | [M, B, C] > 0} A− = {M | [M, B, C] < 0} B + = {M | [A, M, C] > 0} B − = {M | [A, M, C] < 0} C + = {M | [A, B, M] > 0} C − = {M | [A, B, M] < 0} AA A
++− B −+−
+−−
A A A A +−+ A A +++ A C A A −−+ −++ A A
On a donc 8 régions qui sont :
© Dunod. La photocopie non autorisée est un délit.
A+ ∩ B + ∩ C + A− ∩ B + ∩ C + A+ ∩ B − ∩ C + A+ ∩ B + ∩ C − A+ ∩ B − ∩ C − A− ∩ B + ∩ C − A− ∩ B − ∩ C + A− ∩ B − ∩ C − La relation [M, B, C] + [A, M, C] + [A, B, M] = [A, B, C] > 0 (9.10, p. 249) impose que la région A− ∩ B − ∩ C − est vide. Les autres régions ne sont pas vides. Par exemple, A + B − C ∈ A + ∩ B + ∩ C − et 3A − B − C ∈ A+ ∩ B − ∩ C − . La région A+ ∩ B + ∩ C + s’appelle l’intérieur du triangle. L’isobarycentre G = 13 (A + B + C) en fait partie. L’interprétation géométrique du théorème 9.10 (p. 249) est que si M est intérieur au triangle, l’aire de ABC est somme des aires des triangles MBC, AMC, ABM, ce qu’on voit sur la figure. Si M n’est pas à l’intérieur, le théorème 9.10 énonce que c’est encore vrai à condition de considérer les aires algébriques.
i
i i
i
i
i
i
i
9 • Calculs barycentriques
254
9.3 APPLICATION EN GÉOMÉTRIE DU TRIANGLE A
c B
ZZ Z
Z
b
Z
Z
a
Z Z C
On donne un triangle non aplati ABC. Les longueurs des côtés sont notées a = BC, b = CA, c = AB. On A, * B, * C les mesures comprises note respectivement * − → − → entre −π et +π des angles orientés ( AB, AC), − → − → − → − → (BC, BA), (CA, CB).
Proposition 9.16. a) Les mesures des trois angles * A, * B, * C sont de même signe,
positives si le triangle est direct, négatives dans le cas contraire. b) On a la formule [A, B, C] = bc sin * A = ca sin * B = ab sin * C. c) La somme S = * A+* B+* C est égale à π ou à −π selon que le triangle ABC est direct ou inverse.
Démonstration. Comme les signes de * A, * B, * C sont ceux de leur sinus, il suffit de prouver b) pour obtenir a). − → − → On a [A, B, C] = det(AB, AC). Il est clair que b) est conséquence du lemme suivant : Lemme 9.17. Expression du déterminant.
→ → v et − w deux vecteurs non nuls. On a Soit −
→ → → → → → det(− v ,− w ) = − v × − w × sin(− v ,− w ). → → → Soit − ı le vecteur unitaire colinéaire de même sens que − v et − j le vecteur unitaire directement orthogonal. On a → − → → → → → → → → → → v = − v − ı ,− w = − w cos(− v ,− w )− ı + sin(− v ,− w )− j
→ − → − → − → − v w cos( v , w ) → → → → → → det(− v ,− w ) = det = − v × − w × sin(− v ,− w) − → → 0 → w sin(− v ,− w) c) Par la relation de Chasles, on a les congruences d’angles modulo 2π − → − → − → − → − → − → S ≡ (AB, AC) + (BC, BA) + (CA, CB) − → − → − → − → − → − → − → − → ≡ (AB, AC) + (AC, BC) + (BC, BA) ≡ (AB, BA) ≡ π Donc S est de la forme S = (2k + 1)π où k ∈ Z. Si le triangle est direct, * A, * B, * C sont dans l’intervalle ouvert ]0, π[, donc S = (2k + 1)π est dans l’intervalle ouvert ]0, 3π[. La seule valeur possible est k = 0 d’où S = π . Le cas où le triangle est inverse se traite de même.
i
i i
i
i
i
i
i
9.4 Fonction de Leibnitz
255
Dans la suite, ABC est direct, p est le demi-périmètre, ( 2p = a + b + c ), O est centre du cercle circonscrit et R le rayon. Nous utiliserons le résultat suivant, conséquence du théorème de l’angle inscrit (11.15, p. 292) : − → − → − → − → − → − → (OB, OC) ≡ 2* A, (OC, OA) ≡ 2* B, (OA, OB) ≡ 2* C modulo 2π Proposition 9.18. Avec les notations précédentes, on a
a2 = b2 + c2 − 2bc cos * A , a = 2R sin * A 2 2 2 * * b = c + a − 2ca cos B , b = 2R sin B C , c = 2R sin * C c2 = a2 + b2 − 2ab cos *
Démonstration. Pour commencer − → − → − → − → − → a2 = BC2 = AC − AB2 = AC2 − 2AC · AB + AB2 = b2 + c2 − 2bc cos * A On a de même − → − → − → − → − → a2 = BC2 = OC− OB2 = OC2 −2OC· OB+OB2 = 2R2 −2R2 cos 2* A = 4R2 sin2 * A d’où l’on déduit a = 2R sin * A. Les autres formules s’obtiennent de la même façon.
9.4 FONCTION DE LEIBNITZ Proposition 9.19. Fonction de Leibnitz. Soit (αi , Ai ) une famille de points pondérés.
On appelle fonction de Leibnitz l’application
ϕ : E −→ R,
M −→
αi MA2i
© Dunod. La photocopie non autorisée est un délit.
i
(i) Si αi = 0, pour tout point M, on a ϕ(M) = ( αi )MA2 + ϕ(A) où A est barycentre des (αi , Ai ). → − → (ii) Si i αi = 0 et − v = αi Ai = 0 , pour tout couple de points M, M 0 dans P , −→ → v. on a ϕ(M) = ϕ(M0 ) + MM0 · − → − → (iii) Si α = 0 et − v = α A = 0 , la fonction ϕ est constante. i
i
i i
Démonstration. (i) Dans le cas αi = 0, le point A vérifie αi A = αi Ai , et pour tout M, −→ − → −→ − → −→ ϕ(M) = αi MAi 2 = αi MA + AAi 2 = αi MA2 + 2MA · AAi + AA2i i
=
i
i
i
− → −→ αi MA2 + 2MA · αi AAi + αi AA2i = αi MA2 + ϕ(A) i
i
i
La fonction ϕ a donc un maximum ou minimum en A selon le signe de αi . L’ensemble des M où ϕ(M) = λ est un cercle de centre A, ou est vide selon la place de λ par rapport à ϕ(A).
i
i i
i
i
i
i
i
9 • Calculs barycentriques
256
→ (ii) et (iii) Dans le cas où αi = 0, αi Ai est un vecteur constant − v . Soit M et M0 deux points, alors −→ −→ −−→ −→ −−→ ϕ(M) = αi MAi 2 = αi MM0 + M0 Ai 2 = αi MM20 + 2MM0 · M0 Ai + M0 A2i i
=
αi MM20
i
i
−→ −−→ −→ → + 2MM0 · αi M0 Ai + v + ϕ(M0 ) αi M0 A2i = 2MM0 · −
i
i
i
→ − → v = 0 , ϕ prend toute valeur de R, l’ensemble des M où αi Ai = − (ii) Si → ϕ(M) = λ est une droite orthogonale à − v. → − (iii) Si αi Ai = 0 , la fonction ϕ est constante.
EXERCICES Exercice 9.1. Théorème de Gergonne Soit un triangle ABC, un point M tel que (MA),
(MB), (MC) coupent (BC), (CA), (AB) en A , B , C , x, y, z le système de coordonnées barycentriques de M tel que x + y + z = 1. Montrer que A M B M C M + + =1 A A B B C C Exercice 9.2. Soit ABC un triangle, M non sur les côtés du triangle de coordonnées
barycentriques x, y, z telles que x + y + z = 1, A , B , C les points où (MA), (MB), (MC) coupent (BC), (CA), (AB), A , B , C les milieux de (B , C ), (C , A ), (A , B ). Montrer que (AA ), (BB ), (CC ) sont concourantes ou parallèles.
Exercice 9.3. Soit A, B deux points distincts d’une droite D , x, y deux scalaires non xA−yB nuls distincts et non opposés. Montrer que les points P = xA+yB x+y et Q = x−y sont conjugués harmoniques relativement à A et B.
Exercice 9.4. Soit (fi ) une famille finie d’applications affines de E dans lui-même et
(λi ) une famille de réels tels que
λi = 1. λi fi : E → E , M → i λi fi (M) est affine. 1) Montrer que l’application f =
2) Soit quatre points A, B, C, D d’un plan P tels qu’il n’y ait pas alignement de trois d’entre eux. À tout P ∈ (AB), on associe Q ∈ (BC) tel que (PQ) soit parallèle à (AC) et − → − → − → S ∈ (AD) tel que (PS) soit parallèle à (BD). On définit R par PR = PQ + PS. Quel est le lieu géométrique de R ?
i
i i
i
i
i
i
i
Exercices
257
Exercice 9.5. Soit un triangle ABC, S = [A, B, C], des points P, Q, R sur (BC), (CA),
(AB), A , B , C les milieux de (A, P), (B, Q), (C, R), A , B , C les points donnés par −→ − → − → −→ − → − → −→ − → − → AA = AQ + AR, BB = BR + BP, CC = CP + CQ. Comparer [P, Q, R], [A , B , C ] et [A , B , C ]. Exercice 9.6. Dans un plan affine orienté, soit un triangle ABC direct, ∆ une droite
coupant (BC), (CA), (AB) en respectivement P, Q, R.
1) Montrer que [A, Q, R] + [P, B, R] + [P, Q, C] = −[A, B, C]. 2 Montrer que parmi les quantités [A, Q, R], [P, B, R], [P, Q, C], deux sont négatives et une est positive. Exercice 9.7. On appelle quadrilatère une suite de quatre points d’un plan. Soit Q un
quadrilatère P, Q, R, S tel que trois quelconques de ces points ne sont pas alignés. Montrer que [P, Q, R] + [Q, S, R] + [P, R, S] + [S, Q, P] = 0.
En déduire que pour la convexité, il existe deux cas de figure pour le quadrilatère
Q. Exercice 9.8. Étant donné un triangle direct ABC, pour tout M non sur les côtés, on note
− → − → − → − → − → − → α(M), β(M), γ(M) les mesures des angles (MB, MC), (MC, MA), (MA, MB) comprises entre −π et +π . Montrer que (i) si M est intérieur au triangle, on a α(M) + β(M) + γ(M) = 2π ,
© Dunod. La photocopie non autorisée est un délit.
(ii) si M est extérieur au triangle, on a α(M) + β(M) + γ(M) = 0. Exercice 9.9. Soit un triangle ABC.
Montrer que (sin 2* A, sin 2* B, sin 2* C) est un système de coordonnées barycentriques du centre O du cercle circonscrit au triangle. À quelle condition O est intérieur au triangle ? Quelle expression de la surface peut-on déduire ?
Exercice 9.10. Soit un triangle ABC, I le centre du cercle inscrit et r son rayon,
J, K, L les centres et rA , rB , rC les rayons des cercles exinscrits relatifs aux sommets A, B, C. Montrer que (a, b, c), (−a, b, c), (a, −b, c), (a, b, −c) sont des systèmes de coordonnées barycentriques pour I, J, K, L. En déduire r r r + + =1 rA rB rC
i
i i
i
i
i
i
i
9 • Calculs barycentriques
258
Exercice 9.11. Soit un triangle ABC de cercle circonscrit de centre O et de rayon R.
Montrer que le cercle circonscrit est l’ensemble des points M tels que
MA2 sin 2* A + MB2 sin 2* B + MC2 sin 2* C = 4R2 sin * A sin * B sin * C=
abc 2R
Exercice 9.12. Dans un plan euclidien P , soit quatre points distincts A, B, C, D en
situation orthocentrique, PQR le triangle orthique (8.36, p. 225). − → − → − → − → − → − → 1) Montrer l’égalité AB · AC = AC · AD = AD · AB, la valeur commune de ces produits scalaires est notée α. On définit de même β, γ, δ. 2) Montrer que α + β = AB2 et cinq autres égalités analogues. 3) Montrer qu’un système de coordonnées barycentriques de D relativement à A, B, C est ( α1 , β1 , γ1 ).
# les égalités 4) Montrer dans R et P 1 1 1 1 + + + = 0, α β γ δ
1 1 1 1 → − A+ B+ C+ D= 0 α β γ δ
5) Que peut-on en déduire quant à la convexité ? Exercice 9.13. Soit un triangle ABC non rectangle et non équilatéral, D l’orthocentre,
O le centre du cercle circonscrit, G le centre de gravité, Ω le centre du cercle des neuf points, R le rayon du cercle circonscrit, a, b, c les longueurs des côtés. 1) Montrer que Ω est isobarycentre de A, B, C, D. 2) Montrer que la droite d’Euler de ABC est l’ensemble des M tels que
(b2 − c2 )MA2 + (c2 − a2 )MB2 + (a2 − b2 )MC2 = 0 3) Montrer que ΩA2 + ΩB2 + ΩC2 + ΩD2 = 3R2 . 4) En déduire que le cercle des neuf points est l’ensemble des M tels que
MA2 + MB2 + MC2 + MD2 = 4R2
i
i i
i
i
i
i
i
Solutions des exercices
259
PROBLÈME Le corrigé de ce problème est disponible sur le site de Dunod : www.dunod.com.
9.1. CONVEXES Soit P un plan euclidien. Une partie C ⊂ P est dite convexe si, pour tout couple (P, Q) de points de C , le segment [P, Q] est contenu dans C .
1) Montrer qu’une partie C de P est convexe si et seulement si, pourtoute famille C et toute famille de coefficients λ i 0 telle que λi = 1, le de points Mi de λi Mi appartient à C . barycentre M = 2) Montrer qu’un demi-plan est convexe. 3) Montrer que l’intérieur d’un cercle est convexe. 4) Montrer que l’adhérence d’un convexe est convexe. Dans la suite, C désigne un convexe fermé.
5) Soit un point A ∈ / C . Montrer qu’il existe un unique point A ∈ C tel que, pour tout M ∈ C distinct de A , on ait AA < AM (commencer par le cas où C est compact). On dit que A est la projection de A sur C . 6) Dans ces conditions, soit ∆ la droite orthogonale en A à (AA ). Montrer que C est situé dans le demi-plan fermé limité par ∆ ne contenant pas A. 7) En déduire que les convexes fermés distincts de P sont les intersections de familles de demi-plans fermés. 8) On considère l’application projection A → A du complémentaire de C dans C . Montrer que cette application est contractante.
© Dunod. La photocopie non autorisée est un délit.
SOLUTIONS DES EXERCICES Solution 9.1. On a M = xA+yB+zC. Les plans vectoriels Vect(A, M) et Vect(B, C) se coupent suivant la droite vectorielle Vect(A ). On a donc M−xA = yB+zC = (y+z)A , d’où −→ − −→ A M → A M − xA A = 0 soit = x AA et deux autres formules analogues. Il suffit d’additionner ces trois formules. Solution 9.2. On a M − xA = yB + zC = (y + z)A et de même zC + xA = (z + x)B .
Donc
2(y + z)(z + x)C = (z + x)(yB + zC) + (y + z)(zC + xA) = (y + z)xA + (z + x)yB + (x + y + 2z)zC
i
i i
i
i
i
i
i
9 • Calculs barycentriques
260
2(y + z)(z + x)C − 2z 2 C = (y + z)xA + (z + x)yB + (x + y)zC et deux autres formules analogues. Les droites (AA ), (BB ), (CC ), • ou bien concourent au point de coordonnées barycentriques (yx + zx, zy + xy, xz + yz) si la somme de ces coefficients est non nulle, → v ayant ces nombres pour coordonnées • ou bien ont la direction du vecteur − barycentriques si la somme en est nulle. Comme M n’est pas sur les côtés (BC), (CA), (AB), x, y, z sont non nuls. Comme x + y + z = 1, les trois quantités → − → yx + zx, zy + xy, xz + yz ne sont pas toutes nulles et − v = 0 .
Solution 9.3. Comme x + y et x − y sont non nuls, ces points P, Q existent. On a
→ → − → − → − − → − → − xPA + y PB = 0 et xQA − y QB = 0 . On en déduit [A, B, P, Q] = −1 : y PA QA =− =− x PB QB
λi f#i linéaire de E# dans lui-même. Comme λi = 1, on a µ ◦ ϕ = ϕ. Donc f est affine et ϕ = f# (9.7, p. 248).
Solution 9.4. 1) Soit l’application ϕ =
2) On a R = Q + S − P. Soit u (resp. v ) la projection de P sur (BC) parallèlement à (AC) (resp. (AD) parallèlement à (BD)). L’application u + v − I envoie P en R. Le lieu de R est l’image de (AB), donc est une droite. Si P = B, alors Q = B et S = D, donc R = D. Si P = A, alors Q = C et S = A, donc R = C. Le lieu de R est donc la droite (DC). Solution 9.5. Soit les coordonnées barycentriques de P, Q, R par rapport à (A, B, C)
⎛
⎞ 0 P⎝ λ ⎠, 1−λ
⎛
⎞ ⎛ ⎞ 1−µ ν Q⎝ 0 ⎠, R ⎝1 − ν ⎠ µ 0 ⎛ ⎞ 0 1−µ ν 0 1 − ν ⎠ S = (1 − λ − µ − ν + µν + νλ + λµ)S [P, Q, R] = det ⎝ λ 1−λ µ 0
a) On a A = Q + R − A, B = R + P − B, C = P + Q − C, donc A , B , C ont pour coordonnées barycentriques ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ν−µ ν 1−µ A ⎝ 1 − ν ⎠ , B ⎝λ − ν ⎠ , C ⎝ λ ⎠ µ 1−λ µ−λ
i
i i
i
i
i
i
i
Solutions des exercices
261
⎛
⎞ ν−µ ν 1−µ λ ⎠ S = (1 − λ − µ − ν + µν + νλ + λµ)S [A , B , C ] = det ⎝ 1 − ν λ − ν µ 1−λ µ−λ Les aires de ces triangles sont donc égales. En particulier, si P, Q, R sont alignés, il en est de même de A , B , C . b) On a 2A = A + P, 2B = B + Q, 2C = C + R, donc A , B , C ont pour coordonnées barycentriques ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 1−µ ν 2A ⎝ λ ⎠ , 2B ⎝ 1 ⎠ , 2C ⎝1 − ν ⎠ 1−λ µ 1
⎛ ⎞ 1 1−µ ν 1 1 1 1 − ν ⎠ S = (1−λ−µ−ν +µν+νλ+λµ)S [A , B , C ] = det ⎝ λ 8 4 1−λ µ 1 En particulier, si P, Q, R sont alignés, il en est de même de A , B , C .
Solution 9.6. a) On définit α, β, γ par P = αB + (1 − α)C, Q = βC + (1 − β)A,
R = γA + (1 − γ)B. On a ⎛ ⎞ 1 1−β γ 0 1 − γ ⎠ [A, B, C] = β(γ − 1)[A, B, C] [A, Q, R] = det ⎝0 0 β 0
et deux autres formules analogues. Le théorème de Ménélaüs s’écrit (p. 219)
© Dunod. La photocopie non autorisée est un délit.
β γ α × × = +1 α−1 β−1 γ−1
soit
α + β + γ − βγ − γα − αβ = 1
En additionnant les expressions de [A, Q, R], [P, B, R], [P, Q, C], on obtient le résultat.
b) En multipliant ces aires algébriques, on obtient [A, Q, R] × [P, B, R] × [P, Q, C] = αβγ(α − 1)(β − 1)(γ − 1)[A, B, C]3 β γ α × × (α − 1)2 (β − 1)2 (γ − 1)2 [A, B, C]3 = α−1 β−1 γ−1 = (α − 1)2 (β − 1)2 (γ − 1)2 [A, B, C]3 > 0 Comme la somme est −[A, B, C] < 0, deux de ces quantités sont négatives et la troisième positive. Et cela quelle que soit la position de la droite ∆ relativement au triangle. Le lecteur est invité à faire des figures.
i
i i
i
i
i
i
i
9 • Calculs barycentriques
262
Solution 9.7. Il existe 24 = 6 paires de points et 3 partitions de Q en 2 paires dis
jointes : {P, Q}, {R, S} , {P, R}, {Q, S} , {P, S}, {Q, R} . Une structure de quadrilatère sur Q est la donnée de 2 paires disjointes appelées diagonales du quadrilatère, les 4 autres étant appelées côtés. Considérant (P, Q, R) comme repère barycentrique, on a
[P, Q, R] = [S, Q, R] + [P, S, R] + [P, Q, S] d’où la formule : Pour tout sommet X ∈ {P, Q, R, S}, on forme [Y, Z, T] où Y, Z, T sont les autres sommets rangés de sorte que les permutations X, Y, Z, T de Q aient toutes même signature. La somme des quatre aires algébriques obtenues est nulle. Pour la convexité, on a deux possibilités : (1) Le cas non convexe : parmi les quatre aires de somme nulle, trois [Q, S, R], [P, R, S], [S, Q, P], sont d’un signe, [P, Q, R] étant de l’autre signe. Le sommet S se singularise comme intérieur au triangle PQR. En revanche, les trois quadrilatères sont de même type avec une diagonale intérieure ayant S pour extrémité et l’autre extérieure. (2) Le cas convexe : Parmi ces aires de somme nulle, deux, [P, Q, R] et [Q, S, R], sont d’un signe, les deux autres, [P, R, S] et [S, Q, P], de l’autre signe. Comme [P, Q, R] et [S, Q, R] sont de signes contraires, P et S sont de part et d’autre de (QR). De même Q et R sont de part et d’autre de (PS). Les segments [P, S] et [Q, R] se coupent. Aucun des sommets ne se singularise, mais parmi les trois quadrilatères, il en est un convexe de diagonales sécantes. Les deux autres sont dits croisés.
Solution 9.8. Appliquons la relation de Chasles sur les angles orientés. Modulo 2π ,
− → − → − → − → − → − → − → − → α(M) + β(M) + γ(M) ≡ (MB, MC) + (MC, MA) + (MA, MB) ≡ (MB, MB) ≡ 0 Donc il existe k ∈ Z tel que α(M) + β(M) + γ(M) = 2kπ . Comme α(M), β(M), γ(M) sont dans l’intervalle ouvert ]−π, +π[, α(M)+β(M)+γ(M) est dans ] − 3π, +3π[. Donc les valeurs possibles de k sont −2, 0, 2. On sait que α(M) est du signe de [M, B, C] = MB × MC × sin α(M) (9.15, p. 252). De même, β(M) et γ(M) sont du signe de [A, M, C] et [A, B, M]. Par ce qu’on sait sur l’intérieur d’un triangle (p. 253),
(i) si M est intérieur, α(M), β(M), γ(M) sont tous trois positifs, donc la seule valeur possible pour k est 2, (ii) si M est extérieur, α(M), β(M), γ(M) ne sont pas tous de même signe. Supposons α(M) > 0 et β(M) < 0, alors −2π < β(M) + γ(M) < α(M) + β(M) + γ(M) < α(M) + γ(M) < 2π donc la seule valeur possible de k est 0.
i
i i
i
i
i
i
i
Solutions des exercices
263
− → − →
Solution 9.9. Par le théorème de l’angle inscrit, ( OB, OC) = 2* A. Le résultat se déduit
de
[O, B, C] = R2 sin 2* A,
[O, C, A] = R2 sin 2* B,
[O, A, B] = R2 sin 2* C
Le point O est intérieur si sin 2* A, sin 2* B, sin 2* C sont positifs, c’est-à-dire si les 3 angles sont aigus (p. 253). On obtient une expression de l’aire (9.10, p. 249)
1 1 [A, B, C] = R2 (sin 2* A + sin 2* B + sin 2* C). 2 2
Solution 9.10. Sachant que l’aire d’un triangle vaut, en valeur absolue, la moitié du
produit d’une hauteur par la base associée, on a
|[I, B, C]| = ar,
|[I, C, A]| = br,
|[I, A, B]| = cr
|[J, B, C]| = arA ,
|[J, C, A]| = brA ,
|[J, A, B]| = crA
|[K, B, C]| = arB ,
|[K, C, A]| = brB ,
|[K, A, B]| = crB
|[L, B, C]| = arC ,
|[L, C, A]| = brC ,
|[L, A, B]| = crC
On en déduit que des coordonnées barycentriques sont proportionnelles à des triplets de la forme (±a, ±b, ±c).
© Dunod. La photocopie non autorisée est un délit.
Soit les points I , J , K , L de coordonnées barycentriques (a, b, c), (−a, b, c), (a, −b, c), (a, b, −c). Les ensembles de points {I, J, K, L} et {I , J , K , L } sont nécessairement identiques. Comme les sommes ci-dessous sont positives (inégalité triangulaire),
2p = a + b + c, 2(p − a) = b + c − a, 2(p − b) = c + a − b, 2(p − c) = a + b − c I est intérieur au triangle, J , K , L sont dans les régions occupées respectivement par J, K, L (p. 253). On a donc bien I = I , J = J , K = K , L = L . On a de plus [A, B, C] = 2pr = 2(p − a)rA = 2(p − b)rB = 2(p − c)rC dont on déduit
3p − 2p r r (p − a) + (p − b) + (p − c) r = =1 + + = rA rB rC p p
i
i i
i
i
i
i
i
9 • Calculs barycentriques
264
Solution 9.11. Le centre du cercle circonscrit a pour coordonnées barycentriques
sin 2* A, sin 2* B, sin 2* C (9.9). Posons ϕ(M) = MA2 sin 2* A + MB2 sin 2* B + MC2 sin 2* C. Le cercle circonscrit est donc le lieu des points M tels que ϕ(M) = ϕ(A) = c2 sin 2* B + b2 sin 2* C. Comme b = 2R sin * B et c = 2R sin * C, on a dans un premier temps
ϕ(A) = 4R2 sin * B sin * C(sin * C cos * B + sin * B cos * C), soit
abc ϕ(A) = 4R2 sin * B sin * C sin(* B+* C) = 4R2 sin * B sin * C sin * A= 2R − → − →
− →
− →
− →
− → − →
− →
− →
Solution 9.12. 1) On a AB · AC = AB · (AD + DC) = AB · AD car AB et DC sont
orthogonaux. Les autres égalités s’obtiennent par le même calcul.
− → − → − → − → − → − → − → 2) De α = AB · AC, β = BA · BC, on déduit α + β = AB · (AC − BC) = AB2 et de même cinq autres égalités analogues. 3) Soit (u, v, w) un système de coordonnées barycentriques de D. Multipliant sca→ − → − → − → − − → lairement uAD + v BD + wCD = 0 par AB, on a uα = vβ . Donc uα = vβ = wγ , d’où le résultat. 4) Soit O un point quelconque du plan, on a 1 1 − 1− 1 → → 1− → 1− → + + OD = OA + OB + OC α β γ α β γ
1 1 1 1 + + + α β γ δ
1− − → → 1− → 1− → 1− → OD = OA + OB + OC + OD α β γ δ
Faisant jouer à A, B, C le rôle de D, on a trois égalités analogues. Les vecteurs − → − → − → − → OA, OB, OC, OD étant distincts, la seule possibilité est
1 1 1 1 + + + = 0, α β γ δ
1− → → 1− → 1− → 1− → − OA + OB + OC + OD = 0 α β γ δ
5) De 2) et 4), on déduit que parmi α, β, γ, δ, l’un est négatif, les trois autres positifs. Donc {A, B, C, D} n’est pas convexe. Parmi les quatre triangles extraits de A, B, C, D, un seul a ses trois angles aigus le quatrième point étant intérieur à ce triangle. Dans la configuration orthocentrique, ce point joue un rôle spécial pour la convexité.
i
i i
i
i
i
i
i
Solutions des exercices
265
Solution 9.13. 1) La disposition de D, G, Ω sur la droite d’Euler (8.35, p. 224) montre
que Ω = 3G + D. Comme G = A + B + C, on a le résultat.
2) L’ensemble ∆ des M tels que (b 2 − c2 )MA2 + (c2 − a2 )MB2 + (a2 − b2 )MC2 = 0 − → − → − → − → − → − → contient le centre du cercle circonscrit O. Puisque 3 AG = AC + AB, BC = AC − AB, − → − → − → − → 9GA2 = b2 + c2 + 2AC · AB, a2 = b2 + c2 − 2AC · AB d’où 9GA2 = 2b2 + 2c2 − a2 . En calculant de même GB 2 et GC2 , on voit que G ∈ ∆. ∆ est la droite d’Euler (OG). − → − → − → − → − → 3) On a ΩA = ΩO + OA, donc ΩA2 = ΩO2 + OA2 + 2ΩO · OA et − → − → ΩA2 + ΩB2 + ΩC2 = 3ΩO2 + 3R2 + 6ΩO · OG − → − → La disposition de Ω, G, D, O sur la droite d’Euler donne 3ΩO 2 + 6ΩO · OG = −ΩD2 , d’où le résultat. 4) Pour tout point M,
ϕ(M) = MA2 + MB2 + MC2 + MD2 donne
© Dunod. La photocopie non autorisée est un délit.
ϕ(M) = 4MΩ2 + ϕ(Ω) = 4MΩ2 + 3R2 Comme le cercle d’Euler est de rayon 12 R, on a bien le résultat annoncé.
i
i i
i
i
i
i
i
i
i i
i
i
i
i
i
Chapitre 10
Tétraèdres et parallélépipèdes
La géométrie du triangle a été développée aux chapitres 8 et 9. En dimension 3, tétraèdres et parallélépipèdes correspondent aux triangles et parallélogrammes. Mais la situation est plus compliquée. C’est ainsi que la notion d’orthocentre n’est pas toujours définie pour un tétraèdre quelconque. Dans ce chapitre, E est un espace affine euclidien de dimension 3 d’espace vectoriel associé E , orienté.
© Dunod. La photocopie non autorisée est un délit.
10.1 PRODUIT MIXTE, PRODUIT VECTORIEL 10.1.1. Volumes algébriques Définition 10.1. La formule de changement de base montre que le déterminant
− → − → − → d’un système de trois vecteurs V1 , V2 , V3 relativement à une base orthonormale − → − → − → directe B ne dépend pas de B . La quantité det B (V1 , V2 , V3 ) est appelée produit − → − → − → mixte de ce système, elle est notée ( V1 , V2 , V3 ). Un tétraèdre E est la donnée de quatre points A 0 , A1 , A2 , A3 . Il est dit aplati si ces quatre points sont coplanaires. → − → → ı ,− j , k ) une base orthonormale directe et O un point. Alors (O, B) est Soit B = (− base de l’espace vectoriel E# de dimension 4 des points pondérés (9.3, p. 245 et p. 247).
i
i i
i
i
i
i
i
10 • Tétraèdres et parallélépipèdes
268
Lemme 10.2. Étant donné un tétraèdre A 0 , A1 , A2 , A3 , on a
−−→ −−→ −−→ −−→ −−→ −−−→ (A0 A1 , A0 A2 , A0 A3 ) = det B (A0 A1 , A0 A2 , A0 A3 ) = det O,B (A0 , A1 , A2 , A3 )
Démonstration. Ce lemme correspond à la proposition 9.11 (p. 250) relative aux triangles. Dans l’espace vectoriel E# de dimension 4, on pose V = detO,B (A0 , A1 , A2 , A3 ), → − → − −→ → → → → ı + b− j + c k , A0 = 0 + a− ı + b− j + c k et pour 1 α 3 OA0 = a− → − −−→ → → ı + yα − j + zα k , A0 Aα = xα − → − −→ −−→ → → ı + (b + yα )− j + (c + zα ) k . Aα = O + OA0 + A0 Aα = O + (a + xα )− ⎛
V
1 ⎜a = det ⎝ b c ⎛ 1 ⎜a = det ⎝ b c ⎛ x1 = det ⎝ y1 z1
⎞ 1 1 1 a + x1 a + x2 a + x3 ⎟ b + y1 b + y2 b + y3 ⎠ c + z1 c + z2 c + z3 ⎞ 0 0 0 x1 x2 x3 ⎟ y1 y2 y3 ⎠ z1 z2 z3 ⎞ x2 x3 −−→ −−→ −−→ y2 y3 ⎠ = (A0 A1 , A0 A2 , A0 A3 ) z2 z3
en retranchant la première colonne du premier déterminant aux trois autres, puis en développant par rapport à la première ligne. On note [A0 , A1 , A2 , A3 ] cette quantité. On appelle volume algébrique du tétraèdre orienté A = (A 0 , A1 , A2 , A3 ) la quantité 1 6 [A0 , A1 , A2 , A3 ]. On dit que A est direct (resp. inverse) si [A 0 , A1 , A2 , A3 ] est positif, (resp. négatif). Une permutation des sommets conserve le volume algébrique ou le change en son opposé selon qu’elle est de signature 1 ou −1. Définition 10.3.
Proposition 10.4. Soit A0 , A1 , A2 , A3 un repère barycentrique et M un point.
Alors [M, A1 , A2 , A3 ], [A0 , M, A2 , A3 ], [A0 , A1 , M, A3 ], [A0 , A1 , A2 , M] est l’unique système de coordonnées barycentriques de M vérifiant
[M, A1 , A2 , A3 ] + [A0 , M, A2 , A3 ] + [A0 , A1 , M, A3 ] + [A0 , A1 , A2 , M] = [A0 , A1 , A2 , A3 ]
Démonstration. Cette proposition joue le rôle du théorème 9.10 (p. 249). Soit x 0 , x1 , x2 , x3 le système de coordonnées barycentriques de M tel que x0 + x1 + x2 + x3 = 1
i
i i
i
i
i
i
i
10.1 Produit mixte, produit vectoriel
269
On a M = x0 A0 +x1 A1 +x2 A2 +x3 A3 . Posons V0 = [M, A1 , A2 , A3 ], V1 = [A0 , M, A2 , A3 ], V2 = [A0 , A1 , M, A3 ], V3 = [A0 , A1 , A2 , M] et V = [A0 , A1 , A2 , A3 ]. Alors (lemme 10.2) + 3 , 3 V0 = [M, A1 , A2 , A3 ] = xi Ai , A1 , A2 , A3 = xi [Ai , A1 , A2 , A3 ] = x0 V i=0
i=0
Et de même V1 = x1 V , V2 = x2 V , V3 = x3 V . Donc V0 , V1 , V2 , V3 , proportionnel àx0 , x1 , x2 , x3 , est bien un système de coordonnées barycentriques de M. Comme x1 = 1, on a bien Vi = V .
Remarque : Ces résultats se généralisent en toute dimension. Il en est de même de 9.2.2 pour le régionnement (fonctions affines, demi-espaces, etc.). Les exercices 10.1 et 10.2 sont en dimension n. 10.1.2. Produit vectoriel Définition 10.5. Le produit scalaire étant une forme bilinéaire non dégénérée,
− → l’application de E vers son dual E ∗ associant à un vecteur W la forme linéaire → − − → − → → − − → X → W · X est bijective. Pour deux vecteurs U , V . L’application → − → − − → − → E −→ R, X −→ ( U , V , X ) − → − → − → est une forme linéaire. Donc il existe un unique vecteur W = U ∧ V , appelé → − − → produit vectoriel de U et V (dans cet ordre), tel que → − → − − → − → − → → − − → − → ∀ X ∈ E, (U ∧ V ) · X = W · X = (U , V , X) − →
→ −
→ −
→ −
→ −
© Dunod. La photocopie non autorisée est un délit.
Proposition 10.6. Soit le produit vectoriel W = U ∧ V de U et V .
→ − − → − → − − → → (i) U ∧ V = 0 si et seulement si ( U , V ) est lié, → − − → − → − → → − − → (ii) ( U , V , U ∧ V ) est une base directe de E si ( U , V ) est libre, → − − → → − − → (iii) U ∧ V est orthogonal à U et V , → − − → → − → − → − (iv) U ∧ V = U × V × sin θ où θ ∈ [0, π] est l’angle (non orienté) de U → − et V .
Démonstration. C’est une description complète du produit vectoriel. → − − → → − (i) Le produit scalaire étant une forme bilinéaire non dégénérée, U ∧ V = 0 si et → − − → − → → − − → − → → − → − − → seulement si ( U ∧ V ) · X = ( U , V , X ) = 0 pour tout X , donc si U , V ne fait → → − − partie d’aucune base, donc si U , V sont colinéaires. → − − → − → → − − → − → → − − → → − (ii) On a ( U ∧ V ) · U = ( U , V , U ) = 0, donc U ∧ V est orthogonal à U et de → − même à V .
i
i i
i
i
i
i
i
270
10 • Tétraèdres et parallélépipèdes
→ − − → (iii) Supposons U , V non colinéaires. On a → − − → − → − → → − − → − → − → → − − → ( U , V , U ∧ V ) = ( U ∧ V ) · ( U ∧ V ) = U ∧ V 2 > 0 → − − → − → − → donc ( U , V , U ∧ V ) est une base directe de E . → − − → (iv) Si U , V colinéaires, θ ∈ {0, π}, sin θ = 0, le résultat est clair. → − − → → − − → → − − → Supposons U , V non colinéaires. Orientons Π = Vect( U , V ) de sorte que ( U , V ) → → → → en soit une base directe. Soit la base orthonormale directe B = ( − u,− v ,− w ) où − u est → − − → → − colinéaire de même sens à U , v dans Π directement orthogonal à v . On déduit le résultat de
→ − − → U ∧ V 2
− → − → U | V cos θ 0 → → − − − → − → − → = det B ( U , V , U ∧ V ) = 0 V sin θ 0 → − − → 0 0 U ∧ V → − → − → − − → = U × V sin θ × U ∧ V
→ − − → − − → → Remarquons que U ∧ V est l’aire du parallélogramme associé à U et V . → − − →
→ −
→ −
Proposition 10.7. L’application E × E → E , ( U , V ) → U ∧ V est bilinéaire
alternée.
→ − − → − → Démonstration. Prouvons qu’elle est alternée. Pour tout U , V , X , → − − → − → → − − → − → → − − → − → → − − → − → ( V ∧ U ) · X = ( V , U , X ) = −( U , V , X ) = −( U ∧ V ) · X → − − → − → − → → − Donc V ∧ U + U ∧ V est nul car orthogonal à tout X . Il suffit de prouver que l’application est linéaire relativement à la première variable. → − → − → − → − Soit U1 , U2 ∈ E × E , λ1 , λ2 ∈ R × R, V ∈ E . Pour tout X , on a − → − → → − → → − → − − → − → − (λ1 U1 + λ2 U2 ) ∧ V · X = (λ1 U1 + λ2 U2 , V , X ) − → − → − → − → − → − → = λ1 (U1 , V , X ) + λ2 (U2 , V , X ) − → − → − → − → − → − → = λ1 (U1 ∧ V ) · X + λ2 (U2 ∧ V ) · X
− → → − → → − − → − = λ1 U1 ∧ V + λ2 U2 ∧ V · X → → → − → − → − − → − − → − → − d’où (λ1 U1 +λ2 U2 )∧ V −(λ1 U1 ∧ V +λ2 U2 ∧ V ) = 0 car ce vecteur est orthogonal → − à tout X . → − − → − → − → − → − → → − − →− → → − − →− → (A ∧ B ) ∧ C = (A · C )B − (B · C )A . → − − → → − → − − → − → → − − → Démonstration. Posons P = ( A ∧ B )∧ C . Si ( A , B ) est lié, P = 0 et la formule → − − → est vraie. Supposons A , B non colinéaires.
Proposition 10.8. Double produit vectoriel. Soit trois vecteurs A , B , C . On a
i
i i
i
i
i
i
i
10.1 Produit mixte, produit vectoriel
271
→ − − → → − → − − → → − → − − → Alors P , orthogonal à A ∧ B , est dans Vect( A , B ), donc de la forme P = x A +y B . → − → → − − → → − → − − Comme P est orthogonal à C , x A · C + y B · C = 0, donc il existe λ tel que → − − → → − − → x = −λ B · C et y = λ A · C , i.e. tel que − → − → − →− → → − − →− → P = λ (A · C )B − (B · C )A Étant donné λ ∈ R, soit l’application trilinéaire
− − − → → − → → − − → → − → − →− → → − − →− → Φλ : ( A , B , C ) → ( A ∧ B ) ∧ C − λ ( A · C ) B − ( B · C ) A
− → → → Soit (− ı ,− j , k ) une base orthonormale. Alors, pour λ = 1, on vérifie que → − − → − → − → → − − → − → → → Φ1 ( A , B , C ) = 0 dès que A , B , C sont pris dans l’ensemble { − ı ,− j , k }. Ceci montre que Φ1 est identiquement nulle.
Exercice 10.1. En dimension n, soit un simplexe (A 0 , . . . , An ), Fi la face opposée au
sommet Ai , c’est-à-dire l’hyperplan engendré par les A j pour j = i, Fi la direction de Fi , δ une droite vectorielle contenue dans aucun des F i . Pour tout i, la droite Ai + δ coupe Fi en Ai . Comparer les volumes des simplexes (A 0 , . . . , An ) et (A0 , . . . , An ).
© Dunod. La photocopie non autorisée est un délit.
Exercice 10.2. Les conditions sont les précédentes. Une droite affine ∆ coupe l’hyperplan Fi en Bi . Soit Ci le milieu de (Ai , Bi ). Montrer que les Ci sont dans un même hyperplan (observer que la matrice des B i est de rang 2, de trace nulle, de valeurs propres 1 et −1).
→ − − → − → − →
Exercice 10.3. Soit quatre vecteurs A , B , C , D . Montrer que
→ − − → → − − → → − − → − →− → → − − → − →− → ( A ∧ B ) ∧ ( C ∧ D) = ( A , C , D) B − ( B , C , D) A → − − → − →− → → − − → − →− → = ( A , B , D) C − ( A , B , C ) D → − − → − → − → → − − → − → − → → − − → − → − → ( A ∧ B ) · ( C ∧ D) = ( A · C )( B · D) − ( A · D)( B · C )
Exercice 10.4. On donne un triangle A 1 A2 A3 . Montrer que
−−→ −−→ −−→ −−→ −−→ −−→ A1 A2 ∧ A1 A3 = A2 A3 ∧ A2 A1 = A3 A1 ∧ A3 A2 −−−−−−→ Ce vecteur, noté [A1 , A2 , A3 ], est l’aire vectorielle du triangle orienté A 1 A2 A3 .
i
i i
i
i
i
i
i
10 • Tétraèdres et parallélépipèdes
272
Exercice 10.5. Soit A1 A2 A3 A4 un tétraèdre. Étant donné une permutation paire i, j, k, l
→ −−−−−−→ − de 1, 2, 3, 4, on pose (exercice 10.4) Fi = [Aj , Ak , Al ], et ce vecteur ne dépend que de l’indice i. Montrer que − → − → − → − → − → (i) F1 + F2 + F3 + F4 = 0 , → −−→ − (ii) Fi · Ai Aj = [A1 , A2 , A3 , A4 ], → − − → −−→ (iii) Fi ∧ Fj = [A1 , A2 , A3 , A4 ]Ak Al , → − − → − → (iv) (Fi , Fj , Fk ) = [A1 , A2 , A3 , A4 ]2 .
10.2 APPLICATIONS À DES CONFIGURATIONS 10.2.1. Tétraèdres et parallélépipèdes Proposition 10.9. Soit un tétraèdre A = (A1 A2 A3 A4 ) d’isobarycentre O, et soit
B = (B1 B2 B3 B4 ) le tétraèdre symétrique relativement à O. Les huit points A i et Bi forment un parallélépipède A ∪ B de centre O. Les six milieux M i,j des arêtes de A sont les centres des faces de A ∪ B . −−→ −−→ Démonstration. Les points A i et Bi étant symétriques autour de O, on a A3 B1 = A1 B3 −−→ −−→ et B2 A4 = B4 A2 . On déduit l’égalité de ces quatre vecteurs de → − −→ −→ −→ −→ −→ −→ −→ −→ −−→ −−→ B2 A4 − A3 B1 = (OA4 − OB2 ) − (OB1 − OA3 ) = (OA4 + OA2 ) − (−OA1 − OA3 ) = 0 car O est isobarycentre du tétraèdre A. On prouve de même −−→ −−→ −−→ −−→ −−→ −−→ −−→ −−→ A3 B2 = A2 B3 = B4 A1 = B1 A4 A3 B4 = A4 B3 = B1 A2 = B2 A1 , Il s’agit donc bien d’un parallélépipède.
A3
B1
A3
X ·· → − → A @ @ J· ·X· XXX − ·· e3 3 ·· XeX · J @ A@ · · ·· A4 · · AK XXXX A4 K A B 2 J X ·· @ ·· A A @ A ·· A ·· J A A · · → ·Aa Aa · -− e2 ·· − J A A O@ e2A O@ · · · · ··→ J R @ R @ → − A · A A · · · · · · · · · · · · · · · · · · · · · − → · e1 B4 e1 A·2··· A J @ A A2 · ··A J @A ··A J @ A ·
A1
B3
A1
i
i i
i
i
i
i
i
10.2 Applications à des configurations
273
→ → → Inversement, soit un repère (O, − e1 , − e2 , − e3 ) et le parallélépipède de sommets ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 −1 −1 1 −1 1 1 −1 A1 ⎝−1⎠ A2 ⎝ 1 ⎠ A3 ⎝−1⎠ A4 ⎝1⎠ B1 ⎝ 1 ⎠ B2 ⎝−1⎠ B3 ⎝ 1 ⎠ B4 ⎝−1⎠ −1 −1 1 1 1 1 −1 −1 Alors les tétraèdres A = A 1 A2 A3 A4 et B = B1 B2 B3 B4 sont bien symétriques autour de O et ont bien O pour isobarycentre. Proposition 10.10. Tétraèdre orthocentrique. Soit un tétraèdre (A 1 , A2 , A3 , A4 ) = A
d’isobarycentre O et (B 1 , B2 , B3 , B4 ) = B le symétrique de A autour de O. Les conditions suivantes sont équivalentes :
(i) il existe deux couples d’arêtes opposées formés d’arêtes orthogonales, (ii) les trois couples d’arêtes opposées sont formés d’arêtes orthogonales, (iii) il existe un sommet se projetant orthogonalement en l’orthocentre de la face opposée, (iv) tout sommet se projette orthogonalement en l’orthocentre de la face opposée, (v) les quatre hauteurs du tétraèdre A sont concourantes, (vi) A4 A21 + A2 A23 = A4 A22 + A3 A21 = A4 A23 + A1 A22 , (vii) les faces du parallélépipède A ∪ B sont des losanges.
© Dunod. La photocopie non autorisée est un délit.
Démonstration. On dit que A est orthocentrique s’il vérifie ces conditions. Le point de concours A0 des hauteurs est l’orthocentre de A. On a les implications (ii) ⇒ (i) et (iv) ⇒ (iii). On obtient (i) ⇒ (ii) par l’identité du produit scalaire (8.33, p. 223) : −−→ −−→ −−→ −−→ −−→ −−→ A4 A1 · A2 A3 + A4 A2 · A3 A1 + A4 A3 · A1 A2 = 0 Aa4 . D.
.@
.D . @
.D. @ . D . @
@
A0 .a. D. . .. D . @
. . D . @
. . . @a . . − − ..− D− . .− − −@ a. − Q. A2 A1 Q. . . .a DD . Q . . . Q H4 .D . .. a Q D Q D Q QDa
Q
A3
Soit H4 la projection orthogonale de A 4 sur −−→ −−→ −−→ −−→ (A1 A2 A3 ). On a A4 A1 · A2 A3 = H4 A1 · A2 A3 , donc (A4 A1 ) et (A2 A3 ) sont orthogonales si et seulement si H4 est sur la hauteur du triangle A1 A2 A3 issue de A1 . D’où H4 est orthocentre de A1 A2 A3 si et seulement si les couples d’arêtes opposées (A4 A1 ), (A2 A3 ) , (A4 A2 ), (A3 A1 ) , (A4 A3 ), (A1 A2 ) sont formés d’arêtes orthogonales. Ceci donne l’équivalence de (ii), (iii), (iv), donc l’équivalence des quatre premières conditions. Si elles sont remplies, les hauteurs issues de A1 et A4 sont dans le plan contenant (A 1 A4 ) et orthogonal à (A2 A3 ). N’étant pas parallèles
i
i i
i
i
i
i
i
10 • Tétraèdres et parallélépipèdes
274
car orthogonales à des plans de face non parallèles, elles se coupent. Les hauteurs du tétraèdre sont donc deux à deux concourantes. Étant trois à trois non coplanaires, les points communs à ces paires de hauteurs sont nécessairement confondus en un même point A0 . Inversement, si les quatre hauteurs de A concourent en A 0 , les droites (A0 A1 ) et (A0 A4 ) sont orthogonales respectivement aux plans (A 2 A3 A4 ) et (A1 A2 A3 ), donc l’intersection (A2 A3 ) de ces deux plans est orthogonale au plan (A 0 A1 A4 ), d’où l’orthogonalité des arêtes opposées (A1 A4 ) et (A2 A3 ). On fait de même pour les autres couples d’arêtes opposées. On a donc l’équivalence des cinq premières conditions. Pour prouver l’équivalence avec (vi), on utilisera l’identité vectorielle −−→ −−→ −−→ −−→ A1 A2 + A3 A4 = A1 A4 + A3 A2 −−→ −−→ −−→ −−→ −−→ −−→ −−→ −−→ obtenue ainsi : A1 A2 + A3 A4 = A1 A4 + A4 A2 + A3 A2 + A2 A4 = A1 A4 + A3 A2 . On a donc −−→ −−→ −−→ −−→ A1 A2 + A3 A4 2 = A1 A4 + A3 A2 2 , d’où
−−→ −−→ −−→ −−→ A1 A22 + A3 A24 + 2A1 A2 · A3 A4 = A1 A24 + A3 A22 + 2A1 A4 · A3 A2
Si (ii) est vérifié, on a A1 A22 + A3 A24 = A1 A24 + A3 A22 et deux autres égalités analogues aboutissant à (vi). Inversement, si (vi) est vérifié, on aura −−→ −−→ −−→ −−→ −−→ −−→ −−→ −−→ −−→ −−→ −−→ −−→ A1 A2 · A3 A4 = A1 A4 · A3 A2 , A2 A3 · A1 A4 = A2 A4 · A1 A3 , A3 A1 · A2 A4 = A3 A4 · A2 A1 Ces quantités sont nulles car deux à deux opposées, d’où (ii). −−→ −−→ −−→ −−→ On a A1 A4 = B4 B1 , A2 A3 = B3 B2 , car (A1 A4 ) et (B3 B2 ) sont des diagonales de la face A1 B2 A4 B3 du parallélépipède A ∪ B (10.9, p. 272). Elles sont orthogonales si et seulement si ce parallélogramme est un losange, d’où (ii) ⇔ (vii).
Remarque : Un tétraèdre A n’a d’orthocentre que s’il est orthocentrique. En revanche, de même qu’un triangle a un cercle circonscrit, un tétraèdre A = A1 A2 A3 A4 a une sphère circonscrite. En effet, soit Ω 4 le centre du cercle circonscrit au triangle A1 A2 A3 et ∆4 la droite orthogonale en Ω 4 au plan (A1 A2 A3 ). Pour tout M ∈ ∆4 , les quantités MA2i = MΩ24 + Ω4 A2i sont égales pour i ∈ {1, 2, 3} (Pythagore). Le plan médiateur de (A 4 , A1 ) coupe ∆4 en Ω équidistant des sommets de A. 10.2.2. Cube et tétraèdre régulier Définition 10.11. Un tétraèdre A est dit régulier si les arêtes ont même longueur, c’est-à-dire si les faces sont des triangles équilatéraux. Un parallélépipède est un cube si les faces sont des carrés.
i
i i
i
i
i
i
i
10.2 Applications à des configurations
275
Lemme 10.12. Un tétraèdre régulier A = A 1 A2 A3 A4 est orthocentrique et l’isobarycentre O est aussi orthocentre et centre de la sphère circonscrite.
Aa4 · D·
·@
·D · @
·D· @ · D · @
@ O ·a D· ·
··· D · @
· · D · @
· · · @a · · − − ··− D− · ·− − −@ a − ·Q · A2 A1 Q· · · ·a DD · Q · · Q H4 · ·D · ·· a Q D Q D Q QDa
Q
A3
Démonstration. L’orthocentre H 4 du triangle équilatéral A1 A2 A3 est en même temps l’isobarycentre et le centre du cercle circonscrit. On a O ∈ (A4 H4 ) car −→ 1 −→ −→ −→ −→ OH4 = 3 (OA1 + OA2 + OA3 ) = − 13 OA4 Comme A4 A1 = A4 A2 = A4 A3 , les points A1 , A2 , A3 sont sur une sphère de centre A 4 . La projection orthogonale de A 4 sur (A1 A2 A3 ) est donc le centre du cercle circonscrit à A 1 A2 A3 , i.e. H4 . Donc A est orthocentrique (10.10, (iii)) et O est sur la hauteur (A 4 H4 ). Il est de même sur les autres hauteurs, donc c’est l’orthocentre de A. On a OA21 = OH4 2 +H4 A21 = OH4 2 +H4 A22 = OA22 (Pythagore). D’où OA1 = OA2 , tous les OAi sont égaux d’où O est centre de la sphère circonscrite.
© Dunod. La photocopie non autorisée est un délit.
Théorème 10.13. Le groupe des isométries (resp. déplacements) laissant stable un tétraèdre régulier laisse fixe l’isobarycentre. Il est isomorphe, par action sur les quatre sommets, au groupe symétrique S 4 (resp. alterné A4 ).
Démonstration. Prenons les notations du lemme. Soit G (resp. G + ) le groupe des isométries (resp. déplacements) de E laissant A stable. Pour tout f ∈ G, f (O) est isobarycentre de f (A) = A, donc f (O) = O. Soit f /A la restriction de f ∈ G à l’ensemble des sommets de A. L’application f → f /A est un morphisme ϕ de G dans le groupe des bijections de A sur lui-même que l’on identifie à S4 . Par le lemme, la projection orthogonale de (A 4 A1 ) sur le plan (A1 A2 A3 ) est (H4 A1 ), médiatrice de (A2 , A3 ), donc A4 et A1 sont dans le plan médiateur P 2,3 de (A2 , A3 ). La réflexion σ2,3 autour de P2,3 laisse fixe A1 , A4 et échange A2 , A3 . Donc σ2,3 ∈ G et σ2,3 /A est la transposition de S4 échangeant A2 et A3 . De même toute transposition de S 4 est dans l’image de ϕ. Les transpositions engendrant S4 , ϕ est surjectif. Le noyau Ker ϕ est formé des isométries laissant fixes les quatre sommets. Comme ils forment un repère barycentrique, ce noyau se réduit à l’identité de E . Donc ϕ est un isomorphisme. L’application δ : f → det f est un morphisme G → {−1, 1} de noyau G + . Comme G contient des réflexions, δ est surjectif et G + est sous-groupe d’indice 2. Comme A 4 est le seul sous-groupe d’indice 2 de S 4 , ϕ induit un isomorphisme de G+ sur A4 .
i
i i
i
i
i
i
i
10 • Tétraèdres et parallélépipèdes
276 A2
B4
· · · · · · · · · · · ·
B1
·
· ··
··
B3
A2
A3
·············
A4
B2
cube C = A ∪ B
A1
H · H · · HH
·
·
H
·
H H A A3 · A · · · A · A · A ·
· AA A1 ·
A4
tétraèdre A
Lemme 10.14. Soit A = A1 A2 A3 A4 un tétraèdre, O l’isobarycentre, B = B 1 B2 B3 B4
le symétrique de A par rapport à O. Le tétraèdre A est régulier si et seulement si le parallélépipède A ∪ B est un cube.
Démonstration. Supposons que C = A ∪ B est un cube dont les arêtes A i Bj sont de longueur a. Les arêtes √ Ai Aj de A sont les diagonales des faces du cubes donc sont de même longueur a 2. Les faces de A sont des triangles équilatéraux, donc A est un tétraèdre régulier. Supposons que A est un tétraèdre régulier. Il est orthocentrique (10.12). Les faces de A ∪ B sont des losanges (10.10). Pour voir que ce sont des carrés, il suffit de voir par −→ −→ −−→ −→ −→ −→ −→ −−→ −→ −→ exemple que A1 B2 = OB2 − OA1 = −OA2 − OA1 et A1 B3 = OB3 − OA1 = −OA3 − OA1 sont orthogonaux. −→ −→ −→ −→ −−→ −−→ A1 B2 · A1 B3 = (−OA2 − OA1 ) · (−OA3 − OA1 ) −→ −→ −→ −→ −→ −→ −→ −→ = OA2 · OA3 + OA1 · OA3 + OA2 · OA1 + OA1 · OA1 −→ −→ −→ −→ −→ −→ −→ −→ −→ −→ = OA2 · OA3 + OA1 · (OA3 + OA2 + OA1 ) = OA2 · OA3 − OA1 · OA4 Soit l la longueur d’une arête de A et R le rayon de la sphère circonscrite. Pour tout couple d’indices (i, j), −→ −→ −→ −→ −→ −→ l2 = Ai A2j = OAj − OAi 2 = OA2j + OA2i − 2OAi · OAj = 2R2 − 2OAi · OAj −→ −→ −−→ −−→ Les produits scalaires OAi · OAj sont tous égaux, donc A1 B2 · A1 B3 = 0. Théorème 10.15. Le groupe des déplacements laissant stable un cube laisse fixe l’isobarycentre. Par son action sur l’ensemble des quatre diagonales, il est isomorphe au groupe symétrique S 4 .
Démonstration. Reprenons les mêmes notations. Soit G le groupe des déplacements laissant stable le cube A ∪ B . Comme pour 10.13, on montre que f (O) = O pour tout f ∈ G.
i
i i
i
i
i
i
i
Exercices
277
Le cube a quatre diagonales D i = [Ai , Bi ], chacune de milieu O. Comme O est laissé fixe, tout f ∈ G transforme une diagonale en une diagonale. On note f / D l’action ainsi induite par f ∈ G sur l’ensemble D = {D 1 , D2 , D3 , D4 } des quatre diagonales. On a ainsi un morphisme ϕ : f → f /D de G dans le groupe identifié à S 4 des bijections de D sur lui-même. Comme pour 10.13, on montre que ϕ est A2 B4 surjectif en montrant que toute transposition de S4 est dans l’image. Soit ∆1,4 la droite joi· · gnant les milieux de (A 1 , B4 ) et (A4 , B1 ) et ρ1,4 · · le retournement d’axe ∆ 1,4 . Il échange A1 , B1 · · B1 A3 b avec B4 , A4 , donc échange les diagonales D 1 · · et D4 . Les points A2 et B2 sont échangés, · b · de même que A3 et B3 , donc les diagonales · O b ·· D 2 et D3 sont stables. D’où ρ1,4 /D est la B3 transposition de D1 et D4 . De même, toute ∆1,4 · ··············· · transposition est dans l’image de ϕ, d’où la A 1 ·· · surjectivité. · A4 B2 Soit f ∈ G distincte de l’identité. Alors f est une rotation d’axe ∆. L’ensemble des droites stables se réduit à {∆} si f n’est pas un retournement, se compose de ∆ et des droites perpendiculaires à ∆ si f est un retournement. Si f ∈ Ker ϕ, f laisse stable les quatre diagonales. Comme trois quelconques d’entre elles n’ont pas de perpendiculaire commune, f est nécessairement l’identité, d’où l’injectivité. Remarquons que G contient le sous-groupe d’indice 2 des déplacements laissant stable chacun des tétraèdres A et B , isomorphe à A 4 d’après 10.13.
EXERCICES
© Dunod. La photocopie non autorisée est un délit.
Exercice 10.6. Soit un tétraèdre A = A1 A2 A3 A4 , O l’isobarycentre, B le tétraèdre
symétrique par rapport à O. Montrer (utiliser l’exercice 10.5) l’équivalence des conditions suivantes : (i) les faces ont même aire, (ii) toute arête a même longueur que l’arête opposée, (iii) le parallélépipède A ∪ B est rectangle. On dit alors que A est un tétraèdre équifacial. Que dire d’un tétraèdre équifacial et orthocentrique ?
Exercice 10.7. Soit A = A1 A2 A3 A4 un tétraèdre régulier d’isobarycentre O. Décrire le
sous-groupe distingué de cardinal 4 du groupe isomorphe à S 4 des isométries laissant A stable. Même question pour le sous-groupe distingué de cardinal 4 des déplacements laissant stable un cube.
i
i i
i
i
i
i
i
10 • Tétraèdres et parallélépipèdes
278
Exercice 10.8. Soit un cube C = A ∪ B où A, B sont deux tétraèdres réguliers
de même isobarycentre O, symétriques par rapport à O, G le groupe de toutes les isométries laissant C stable. 1) Montrer que G a trois sous-groupes d’indice 2 dont deux sont isomorphes à S 4 . 2) Montrer que G est isomorphe au produit direct S 4 × {−1, +1}. 3) Déterminer un sous-groupe distingué de G cardinal 8 laissant C stable.
Exercice 10.9. Soit un tétraèdre A = A1 A2 A3 A4 , Mi,j le milieu de (Ai , Aj ). Montrer que
A est équifacial si et seulement si les droites (M 1,2 M3,4 ), (M1,3 M2,4 ), (M1,4 M2,3 ) forment un trièdre trirectangle (montrer que A est équifacial si et seulement si le groupe des isométries laissant A stable contient le groupe de Klein)
PROBLÈMES Les corrigés de ces problèmes sont disponibles sur le site de Dunod : www.dunod.com.
10.1. PROBLÈME Soit A = (A1 A2 A3 A4 ) un tétraèdre, O l’isobarycentre, Ω le centre de la sphère circonscrite. À toute arête [A i , Aj ], on associe le plan Pi,j passant par le milieu de [Ai , Aj ] et orthogonal à l’arête opposée. 1) Montrer que les six plans P i,j concourent en un même point M appelé point de Monge du tétraèdre. 2) Montrer que O est milieu de (M, Ω) (on pourra projeter orthogonalement sur les arêtes). 3) Que dire du point de Monge si A est orthocentrique ? 4) Montrer que A est équifacial si et seulement si O, M, Ω sont confondus.
10.2. PROBLÈME Soit A = A1 A2 A3 A4 un tétraèdre, O l’isobarycentre, M i,j le milieu de (Ai , Aj ). 1) Montrer que A est orthocentrique si et seulement si les six points M i,j sont sur une sphère S1 de centre O. Dans la suite, on suppose A orthocentrique. Soit H l’orthocentre et S 2 le centre de la sphère circonscrite S 0 . 2) Montrer que S1 coupe chaque face (A i Aj Ak ) suivant les cercles des 9 points du triangle Ai Aj Ak . 3) Montrer que les isobarycentres et les orthocentres des faces sont sur une sphère S2 (considérer les homothéties de centre O et H de rapport − 13 et 13 et utiliser la question 2) du problème 10.1).
i
i i
i
i
i
i
i
Solutions des exercices
279
SOLUTIONS DES EXERCICES Solution 10.1. Soit B une base orthonormale de E et O une origine. Les déterminants de systèmes de vecteurs de E# seront évalués relativement à la base O, B de E#. Pour −−→ tout i on a Ai = Ai + (Ai − Ai ), les vecteurs Ai − Ai = Ai Ai étant tous dans δ, donc colinéaires, on a donc
[A0 , . . . , An ] = det A0 + (A0 − A0 ), . . . , An + (An − An ) n Di = det(A0 , . . . , An ) + i=0
où Di se déduit de det(A0 , . . . , Ai , . . . , An ) en remplaçant Ai par Ai − Ai . Comme Ai et les Aj , j = i sont dans le même hyperplan F#i , l’expression déduite de det(A0 , . . . , Ai , . . . , An ) en remplaçant Ai par Ai est nulle. On a donc
Di = − det(A0 , . . . , An ) d’où
[A0 , . . . , An ]
= −n[A0 , . . . , An ].
où βj,j = 0, i βi,j = 1. On a 2Cj = Aj +Bj . Pour voir que ces éléments sont liés dans E#, vérifions que le déterminant de la matrice ⎞ ⎛ 1 β0,1 · · · β0,n 1 · · · β1,n ⎟ ⎜ β1,0 C=⎜ .. .. ⎟ .. ⎝ ... . . . ⎠
© Dunod. La photocopie non autorisée est un délit.
Solution 10.2. Dans E#, on écrit Bj =
i βi,j Ai ,
βn,0 βn,1 · · · 1 est nul. L’alignement des B j se traduit par rg(B) = 2 où ⎞ ⎛ 0 β0,1 · · · β0,n 0 · · · β1,n ⎟ ⎜ β1,0 B=⎜ .. .. ⎟ .. ⎝ ... . . . ⎠ βn,0 βn,1 · · ·
0
Donc 0 est valeur propre, racine du polynôme caractéristique à l’ordre au moins n − 1. Le fait que i βi,j = 1 pour tout j montre que 1 est valeur propre de B . La dernière valeur propre de B est nécessairement −1 car Tr(B) = 0, d’où det C = 0.
Solution 10.3. Par la formule du double produit vectoriel, on a
− → − − → → − − → → − → − → − → − → − → − → − → (A ∧ B ) ∧ (C ∧ D) = A · ( C ∧ D) B − B · ( C ∧ D ) A → − − → − →− → → − − → − →− → = ( A , C , D ) B − ( B , C , D) A
La deuxième formule s’obtient de la même façon.
i
i i
i
i
i
i
i
10 • Tétraèdres et parallélépipèdes
280
On a aussi − → − − → − → − → → − − → − → − → → − → − → − → ( A ∧ B ) · ( C ∧ D) = ( A ∧ B , C , D ) = ( A ∧ B ) ∧ C · D puis on applique la formule du double produit vectoriel.
Solution 10.4. Il suffit d’écrire
−−→ −−→ −−→ −−→ −−→ −−→ −−→ −−→ −−→ A2 A3 ∧ A2 A1 = (A1 A3 − A1 A2 ) ∧ (−A1 A2 ) = −A1 A3 ∧ A1 A2 = A1 A2 ∧ A1 A3
Solution 10.5. (i) On a
− → −−→ −−→ −−→ −−→ −−→ −−→ F1 = A2 A3 ∧ A2 A4 = (A1 A3 − A1 A2 ) ∧ (A1 A4 − A1 A2 ) − → − → − → −−→ −−→ −−→ −−→ −−→ −−→ = A1 A3 ∧ A1 A4 − A1 A3 ∧ A1 A2 − A1 A2 ∧ A1 A4 = −F2 − F4 − F3 (ii) On a → −−→ − −−→ −−→ −−→ −−→ −−→ −−→ Fi · Ai Aj = (Aj Ak ∧ Aj Al ) · Ai Aj = −(Aj Ak , Aj Al , Aj Ai ) = −[Aj , Ak , Al , Ai ] = [Ai , Aj , Ak , Al ] = [A1 , A2 , A3 , A4 ] (iii) Par la formule du double produit vectoriel → → −−→ −−→ − → −−→ −−→ − → −−→ −−→ − → − − Fi ∧ Fj = Fi ∧ (Ak Ai ∧ Ak Al ) = (Fi · Ak Al )Ak Ai − (Fi · Ak Ai )Ak Al −−→ −−→ −−→ −−→ −−→ −−→ −−→ −−→ = (Ak Al , Ak Aj , Ak Al )Ak Ai − (Ak Al , Ak Aj , Ak Ai )Ak Al −−→ −−→ = −[Ak , Al , Aj , Ai ]Ak Al = [A1 , A2 , A3 , A4 ]Ak Al (iv) Par (iii), on a → − − → − → → − − → − → → −−→ − (Fi , Fj , Fk ) = (Fi ∧ Fj ) · Fk = [A1 , A2 , A3 , A4 ]Ak Al · Fk −−→ −−→ −−→ = [A1 , A2 , A3 , A4 ]( Ak Al · (Al Ai ∧ Al Aj ) −−→ −−→ −−→ = [A1 , A2 , A3 , A4 ](Ak Al , Al Ai , Al Aj ) = [A1 , A2 , A3 , A4 ]2
Solution 10.6. (ii) ⇒ (i). On suppose que pour toute permutation i, j, k, l de
1, 2, 3, 4, on a Ai Aj = Ak Al . Les triangles A1 A2 A3 et A1 A2 A4 ont leurs côtés égaux deux à deux : A1 A3 = A2 A4 , A2 A3 = A1 A4 et le côté A1 A2 est commun. Ces triangles sont donc égaux, donc ont même aire. → − (i) ⇒ (ii). Avec les notations de l’exercice 10.5, les Fi sont égaux à une même → − − → quantité F . Soit θi,j ∈ [0, π] l’angle non orienté de Fi et Fj . Pour i, j, k, l permutation → − → − → → − − de 1, 2, 3, 4, Fi + Fj = −Fk − Fl . Prenant les carrés des normes de chaque membre, on obtient cos θi,j = cos θk,l , d’où θi,j = θk,l .
i
i i
i
i
i
i
i
Solutions des exercices
281
→ → − − −−→ On a Fi ∧ Fj = [A1 , A2 , A3 , A4 ]Ak Al , d’où → − − → |[A1 , A2 , A3 , A4 ]|Ak Al = Fi ∧ Fj = F 2 sin θi,j Ak Al =
F 2 sin θk,l F 2 sin θi,j = = Ai Aj |[A1 , A2 , A3 , A4 ]| |[A1 , A2 , A3 , A4 ]|
L’équivalence (ii) ⇔ (iii) se déduit du fait qu’un parallélogramme est un rectangle si et seulement si ses diagonales ont même longueur. Un tétraèdre est à la fois équifacial et orthocentrique si et seulement si les faces du parallélépipède associé sont à la fois losanges et rectangles, donc carrées. Un tétraèdre équifacial et orthocentrique est régulier.
Solution 10.7. Le sous-groupe distingué de cardinal 4 de S 4 est le groupe de Klein, formé de l’identité et des trois paires de transpositions disjointes. L’isométrie échangeant A1 et A2 , A3 et A4 est le retournement autour de la droite joignant les milieux M 1,2 de (A1 , A2 ) et M3,4 de (A3 , A4 ).
Le groupe de Klein est donc formé de l’identité et des trois retournements autour des axes (Mi,j Mk,l ), i, j, k, l étant une permutation de 1, 2, 3, 4. Le composé de deux de ces retournements étant le troisième, les axes (M 1,2 M3,4 ), (M1,3 M2,4 ), (M1,4 M2,3 ) forment un système trirectangle de droites se rencontrant en l’isobarycentre O. Soit B le tétraèdre symétrique de A autour de O et C = A ∪ B le cube associé. Les trois droites précédentes sont les axes des faces du cube.
© Dunod. La photocopie non autorisée est un délit.
Solution 10.8. Le groupe G+ des déplacements laissant C stable est isomorphe à
S4 (10.15, p. 276). L’application f → det f est un morphisme G → {−1, 1}. Il est surjectif car la réflexion autour du plan médiateur d’une arête est un antidéplacement de G. Donc le noyau G+ est d’indice 2. Comme G+ ∼ S4 est de cardinal 24, G est de cardinal 48. Toute isométrie laissant stable A laisse fixe O donc laisse B stable : si f (A i ) = Aj , alors f (Bi ) = Bj . On a donc un sous-groupe A de G isomorphe à S 4 (10.13, p. 275), donc de cardinal 24, donc d’indice 2. L’intersection A ∩ G+ est formée des déplacements laissant stables les tétraèdres. C’est un sous-groupe distingué d’indice 4 isomorphe à A 4 . Le troisième sous-groupe d’indice 2 est formé des f qui • ou bien sont dans A∩G+ , donc sont des déplacements laissant stables les tétraèdres, • ou bien ne sont ni dans A, ni dans G+ , donc sont des antidéplacements échangeant les tétraèdres. Parmi ces isométries, la symétrie centrale S O .
i
i i
i
i
i
i
i
282
10 • Tétraèdres et parallélépipèdes
On vérifie que l’application associant à f ∈ G le couple • (1, f ) si f ∈ G+ ,
/ G+ , • (−1, SO ◦ f ) si f ∈ est un isomorphisme G → {−1, 1} × G+ {−1, 1} × S4 . On a de même un isomorphisme G → {−1, 1} × A {−1, 1} × S4 . Le sous-groupe distingué de cardinal 8 est formé de l’identité, de la symétrie S O , des trois retournements autour des axes des faces du cube, des composés de ces retournements avec S O qui sont les réflexions autour des plans médiateurs des arêtes du cube. Solution 10.9. Soit O l’isobarycentre et B le symétrique de A autour de O. On a
1 1 O = (A1 + A2 + A3 + A4 ) = (M1,2 + M3,4 ) 4 2 donc O est milieu des trois segments [M i,j , Mk,l ]. Les Mi,j sont les isobarycentres des faces du parallélépipède A ∪ B = C . Le tétraèdre A est équifacial si et seulement si C est rectangle, donc si et seulement si les trois droites (Mi,j Mk,l ) sont deux à deux orthogonales. Le groupe des isométries laissant A stable, identifié à un sous-groupe de S 4 , contient le groupe de Klein si seulement si A est équifacial.
i
i i
i
i
i
i
i
Chapitre 11
Géométrie des cercles
© Dunod. La photocopie non autorisée est un délit.
D’importantes propriétés sont développées dans les quatre premières sections : positions relatives de droites et cercles (11.1.1), puissance d’un point (11.2), propriété angulaire (11.3), lieu des points dont le rapport des distances à deux points est constant (11.4). Ceci amène à une première approche de la notion de faisceau de cercles, à points de base dans la section 11.3, à points limites dans la section 11.4. La section 11.5 introduit une extension de la notion de cercle : on ajoute les droites. On y installe également un point à l’infini. L’orthogonalité est définie à l’aide d’une forme quadratique de signature (3, 1) dans l’espace vectoriel de dimension 4 des fonctions circulaires. Ceci permet une approche plus générale de la notion de faisceau de cercles.
11.1 POSITIONS RELATIVES DE CERCLES ET DE DROITES Commençons par reprendre des notions intuitives. Définition 11.1. Soit C un cercle de centre Ω et de rayon R > 0, ensemble des
points M du plan tels que ΩM = R. Le complémentaire de C est formé de : 1) l’extérieur formé des M tels que MΩ > R, 2) l’intérieur formé des M tels que MΩ < R.
i
i i
i
i
i
i
i
11 • Géométrie des cercles
284
Proposition 11.2. Soit ∆ une droite, H la projection de Ω sur ∆. L’intersection ∆ ∩ C
est (i) formée de deux points distincts si H est intérieur à C , (ii) vide si H est extérieur à C , (iii)réduite au seul point H si H ∈ C . ....................................... ......... .............. ......... ...... . . . . . . ..... . . . . . .... .... .... . . ... ... ... .. .. ... .. ... ... ... .... ... ...a a a .... ... .. . . Ω H .. . 1 .. ... .. ... .. ... ... ... . . .... ... ..... .... ...... .... . . . ....... . . ..... ........... ..................................................
H3
a
H2
→ → Démonstration. Soit − u où t ∈ R. u un vecteur unitaire directeur de ∆ et M t = H + t− On a −→ − → −→ − → ΩMt 2 = ΩH2 + HMt 2 = ΩH2 + t2 . Donc Mt ∈ C si et seulement si t2 = R2 − ΩH2 . Une discussion immédiate aboutit au résultat. Définition 11.3. On dit que ∆ est sécante à C dans le premier cas, extérieure
à C dans le deuxième cas, tangente à C dans le troisième cas. Corollaire Soit M ∈ C . La perpendiculaire T en M à (ΩM) est tangente à C . Toute droite passant par M distincte de T est sécante.
Démonstration. Si T est la perpendiculaire en M à (ΩM), alors M est projection orthogonale de Ω sur T , donc T ∩ C = {M}. Si ∆, distincte de T , passe par M, la projection orthogonale H de Ω sur ∆ est distincte de M, donc ΩH < ΩM = R et ∆ est sécante à C . Proposition 11.4. Soit M un point. Alors
(i) M est intérieur à C si et seulement si toute droite passant par M est sécante ; (ii) M est extérieur à C si et seulement s’il passe par M (au moins) une droite extérieure.
Démonstration. a) Supposons M intérieur. Soit ∆ passant par M et H la projection orthogonale de Ω sur ∆. On a ΩH ΩM < R, donc H est intérieur à C et ∆ est sécante. b) Supposons M extérieur. Si ∆ est la perpendiculaire en M à (ΩM), alors M est projection orthogonale de Ω sur ∆, donc ∆ est extérieure à C .
i
i i
i
i
i
i
i
11.1 Positions relatives de cercles et de droites
285
c) Voyons la réciproque de a). Supposons que toute droite passant par M soit sécante. Alors M ne peut être extérieur d’après b). Et M ne peut être sur C car la perpendiculaire T en M à (ΩM) serait tangente. Donc M est intérieur. On voit de même la réciproque de b).
11.1.1. Positions relatives de deux cercles Proposition 11.5. Soit deux cercles C1 , C2 de centres Ω1 , Ω2 , de rayons R1 , R2 ,
d = Ω1 Ω2 .
(i) L’intersection C1 ∩ C2 est non vide si et seulement si |R1 − R2 | d R1 + R2 (ii) si |R1 − R2 | < d < R1 + R2 , C1 et C2 sont sécants : ils ont deux points communs distincts ; (iii) si d = R1 + R2 , C1 et C2 sont tangents extérieurement en H : tout point de l’un distinct de H est extérieur à l’autre ; (iv) si d = R1 − R2 , C1 et C2 sont tangents intérieurement en H : tout point de C 2 distinct de H est intérieur à C 1 .
Démonstration. (i) Supposons que C 1 ∩ C2 contienne un point M. L’inégalité triangulaire appliquée au triangle MΩ 1 Ω2 donne |R1 − R2 | = |MΩ1 − MΩ2 | d = Ω1 Ω2 MΩ1 + MΩ2 = R1 + R2
© Dunod. La photocopie non autorisée est un délit.
Réciproquement, supposons |R 1 − R2 | d R1 + R2 . Soit M quelconque. −→ −→ M ∈ C1 ∩ C2 ⇔ Ω1 M2 = R12 et Ω2 M2 = R22 −→ −→ ⇔ M ∈ C1 et Ω1 M2 − Ω2 M2 = R12 − R22 Soit H la projection orthogonale de M sur (Ω 1 Ω2 ) et I le milieu de (Ω1 , Ω2 ). −→ −→ −→ −→ −→ −→ −−→ − → Ω1 M2 − Ω2 M2 = (Ω1 M − Ω2 M) · (Ω1 M + Ω2 M) = 2Ω1 Ω2 · IM = 2Ω1 Ω2 · IH −−→ Orientons la droite (Ω 1 Ω2 ) par le vecteur Ω1 Ω2 . On a l’équivalence R2 − R22 M ∈ C1 ∩C2 ⇔ M ∈ C1 et 2Ω1 Ω2 ·IH = R12 −R22 ⇔ M ∈ C1 et IH = 1 2d R2 −R2
Définissons H ∈ (Ω1 Ω2 ) par IH = 12d 2 . Existe-t-il M ∈ C1 de projection orthogonale H ? Autrement dit, H est-il intérieur à C 1 ou sur C1 ? On a
Ω1 H = Ω1 I + IH =
d2 + R12 − R22 d R12 − R22 + = 2 2d 2d
i
i i
i
i
i
i
i
11 • Géométrie des cercles
286
........1........................ ..C ....... ........... ...... ..... M .... . . . ................. ...............C2 .... . ..... . .... ........ ... ... ...... ..... ... ... ... .... .... .. . . a .. .. a a .. a .. ... ... .. .. . . . ..I ... Ω H Ω . . . 1 2 . . .... .. ... .. ........ ... ..... .... .................................... . . ..... . ........ .... ............................................ .
R12 − Ω1 H2 = (R1 − Ω1 H)(R1 + Ω1 H) 2dR1 − d2 − R12 + R22 2dR1 + d2 + R12 − R22 × = 2d 2d (R1 + d)2 − R22 R22 − (R1 − d)2 × = 2d 2d (R2 − R1 + d)(R2 + R1 − d)(R1 + d − R2 )(R1 + d + R2 ) = 4d2 Par hypothèse, ces quatre facteurs sont positifs ou nuls. Donc H est intérieur à C 1 ou sur C1 et la perpendiculaire à (Ω 1 Ω2 ) en H coupe C1 en deux points distincts ou lui est tangente en H.
(ii) Si |R1 − R2 | < d < R1 + R2 , H est intérieur aux cercles donc C 1 et C2 ont deux points communs (11.2, p. 284). (iii) Si M = H est sur C2 , on a : MΩ1 + R2 = MΩ1 + MΩ2 Ω1 Ω2 = d = R1 + R2 , donc MΩ1 R1 . Comme M ∈ C2 et M = H, M n’est pas sur C1 , donc MΩ1 > R1 . (iv) On raisonne comme pour (iii).
Corollaire 11.6. Soit trois longueurs a, b, c. Il existe un triangle non aplati ayant
a, b, c pour longueurs des côtés si et seulement si |a − b| < c < a + b.
Démonstration. Par l’inégalité triangulaire, les côtés d’un triangle vérifient cette inégalité. Inversement, supposons cette inégalité et soit [A, B] un segment de longueur c. Les cercles de centres A et B, de rayons b et a sont sécants. Si C est un point commun, le triangle ABC répond à la question. Proposition 11.7. Soit un cercle C de centre Ω, de rayon R, P, Q diamétralement
− → − → opposés sur C . Un point M est sur C si et seulement si MP · MQ = 0. → − → − → − − → − → Démonstration. Comme ΩP + ΩQ = 0 , on a ΩP · ΩQ = −R2 et − → − → − → − → − → − → − → − → − → − → − → MP · MQ = (MΩ + ΩP) · (MΩ + ΩQ) = MΩ2 + MΩ · (ΩP + ΩQ) + ΩP · ΩQ = MΩ2 − R2 − → − → D’où les équivalences M ∈ C ⇔ MΩ2 = R2 ⇔ MP · MQ = 0
i
i i
i
i
i
i
i
11.2 Puissance d’un point
287
Proposition 11.8. Tangentes issues d’un point. Soit un cercle C de rayon R et de centre Ω. Par un point M extérieur passent deux tangentes.
Démonstration. Étant donné T ∈ C , (MT) est tangente à C si et seulement si (MT) et (TΩ) sont perpendiculaires, c’est-à-dire si T ∈ Γ, cercle de diamètre (Ω, M). La question est donc : les cercles C et Γ sont-ils sécants ? M Le centre I de Γ est le milieu de (M, Ω). La distance des centres est égale au rayon 12 MΩ de Γ. Les inégalités IΩ − R < IΩ < IΩ + R sont claires. Reste à vérifier R − IΩ < IΩ, soit R < 2IΩ = MΩ. Ceci est vrai si et seulement si M est extérieur à C . Remarquons que ceci donne une construction géométrique des tangentes à C issues de M : on prend les points T 1 , T2 communs à C et Γ.
1 ....... Γ...............................................T .....a........ .. ...................C . . . ...... .. . . . . . .... .... ....... .... .... .... .. .. . . ... . ... ... . . ... ... .... .... ... ... a a .... a... Ω .... ... ...HH . ... . . . . ... .. .. HHI ..... ... .... ... ... . .... . . . . . . . HH ...... .... ..... ..... ......a....... ....... . ................................ ..H ............. ............................ H T2 HH
11.2 PUISSANCE D’UN POINT La puissance d’un point par rapport à un cercle joue le rôle d’une distance.
11.2.1. Théorème fondamental Théorème 11.9. Soit C un cercle de centre Ω et de rayon R et M un point du plan.
Pour toute sécante passant par M coupant C en P et P et pour tout diamètre (P, Q) de − → − → C , on a MP · MQ = MP × MP = MΩ2 − R2 . Cette quantité notée C(M) est appelée puissance 1 de M par rapport à C .
© Dunod. La photocopie non autorisée est un délit.
" M "
" ...................................P ..." ..... ......... . . . " . ..... . . . . . " TT ..... ... " .. ... T ...... .... "" ...." a T..... Q P ... .. Ω ... ... ... . . ... . .... ... ..... ..... . ........ . . . . ........................................
Démonstration. Comme P, Q sont diamétralement −→ −→ opposés, P P et P Q sont orthogonaux (11.7, p. 286). On a : − → − → −→ MP×MP = MP · (MQ + QP ) → − → − → − → − → −→ − = MP · MQ + MP · QP = MP · MQ − → − → − → − → = (MΩ + ΩP) · (MΩ + ΩQ) = MΩ2 − R2
Le signe de C(M) détermine un régionnement du plan : • si C(M) < 0, M est intérieur, le minimum de C(M) étant atteint au centre avec C(Ω) = −R2 , • si C(M) = 0, M est sur C , 1. Les valeurs algébriques MP et MP dépendent du choix d’un des deux vecteurs unitaires opposés de la sécante, mais le produit MP × MP n’en dépend pas.
i
i i
i
i
i
i
i
11 • Géométrie des cercles
288
• si C(M) > 0, M est extérieur. Si T est point de contact d’une tangente issue de M, on a (d’après le théorème de Pythagore) C(M) = MΩ 2 − TΩ2 = MT2 . Proposition 11.10. Soit ∆1 , ∆2 , deux droites sécantes en O et M 1 ,N1 ,M2 ,N2 des points de ∆1 , ∆2 distincts de O. Pour qu’il existe un cercle ayant pour intersection M 1 et N1 avec ∆1 et M2 et N2 avec ∆2 , il faut et il suffit que
OM1 × ON1 = OM2 × ON2
Démonstration. La condition est nécessaire : s’il existe un tel cercle C , on a C(O) = OM1 × ON1 = OM2 × ON2 . Inversement, supposons cette relation satisfaite. Supposons M1 et N1 distincts. Le cercle C = (M1 N1 M2 ) recoupe ∆2 en N2 éventuellement confondu avec M 2 si ∆2 est tangente à C . On a OM2 × ON2 = OM1 × ON1 = C(O) = OM2 × ON2 d’où N2 = N2 et les points sont cocycliques. Si par contre M1 et N1 sont confondus ainsi que M 2 et N2 , alors OM1 = OM2 . Les droites orthogonales en M1 et M2 à ∆1 et ∆2 se coupent en Ω. On a
ΩM21 = OΩ2 − OM21 = OΩ2 − OM22 = ΩM22 = R2 Le cercle de centre Ω et de rayon R est tangent en M 1 et M2 à ∆1 et ∆2 .
11.2.2. Expression analytique → → Soit un repère orthonormé (O, − ı ,− j ), Ω de coordonnées a, b, R > 0 et C le cercle de − → centre Ω et de rayon R. Alors C est l’ensemble des points M(x, y) tels que ΩM2 = R2 , c’est-à-dire tels que (x − a)2 + (y − b)2 = R2 C’est une équation du cercle C . Un cercle a une infinité d’équations, toutes proportionnelles : soit γ = 0, α = −γa, β = −γb, δ = γ(a2 + b2 − R2 ), alors
γ(x2 + y 2 ) + 2αx + 2βy + δ = 0 est aussi une équation de C . Parmi ces équations, il en est une particulière : l’équation normale où le coefficient de x 2 + y 2 est 1. Définition 11.11. Un polynôme circulaire, est un polynôme du type
P (X, Y ) = γ(X 2 + Y 2 ) + 2αX + 2βY + δ Les polynômes circulaires forment un R-espace vectoriel de dimension 4. Étant donné un polynôme circulaire non nul P (X, Y ), l’ensemble V(P ) des M(x, y) tels que P (x, y) = 0 est-il un cercle ? Voici deux familles de cas :
i
i i
i
i
i
i
i
11.2 Puissance d’un point
289
(1) Cas où γ = 0, i.e. P est effectivement de degré 2. Remplaçons P par son polynôme normalisé
β δ P (X, Y ) α = X2 + Y 2 + 2 X + 2 Y + γ γ γ γ 2 2 2 β γδ − α − β 2 α + Y − + = X− γ γ γ2
P0 (X, Y ) =
Si α2 + β 2 − γδ > 0, V(P ) est le cercle de centre Ω(− αγ , − βγ ) et de rayon √
R=
α2 +β 2 −γδ . |γ| α2 + β 2 −
Si γδ = 0, V(P ) se réduit au point Ω(− αγ , − βγ ). On dit que V(P ) est le cercle-point {Ω}. Si α2 + β 2 − γδ < 0, aucun point ne vérifie l’équation, V(P ) est vide. (2) Cas où γ = 0, c’est-à-dire que P est de degré 1. Ces polynômes forment un sous-espace vectoriel de dimension 3 de l’espace des polynômes circulaires. Si α = β = 0 et δ = 0, aucun point ne vérifie l’équation, V(P ) est vide. Si (α, β) = (0, 0), V(P ) est la droite d’équation 2αx + 2βy + δ = 0. Expression analytique de la puissance. Soit le polynôme normal
P (X, Y ) = X 2 + Y 2 + 2αX + 2βY + δ où α2 + β 2 − δ > 0 % et le cercle V(P ) = C de centre Ω(−α, −β) et de rayon R = α2 + β 2 − δ . Pour tout M0 (x0 , y0 ), on a C(M0 ) = ΩM20 − R2 = (x0 + α)2 + (y0 + β)2 − (α2 + β 2 − δ) = P (x0 , y0 )
© Dunod. La photocopie non autorisée est un délit.
La puissance d’un point M 0 par rapport à un cercle C s’obtient en remplaçant x, y dans l’équation normale de C par les coordonnées x 0 , y0 de M0 .
11.2.3. Espace vectoriel des fonctions circulaires → → La discussion précédente est menée relativement à un repère orthonormé (O, − ı ,− j ). Reprenons la « intrinsèquement », c’est-à-dire sans utiliser de repère. Définition 11.12. Étant donné un point origine O, une fonction circulaire est
une application non identiquement nulle − → − − → − → → F : P → R , M → F (M) = γOM2 + 2VO · OM + F (O) où VO ∈ P L’expression de F relativement à une autre origine O est du même type avec la même constante γ ne dépendant que de F et notée γ(F ).
i
i i
i
i
i
i
i
11 • Géométrie des cercles
290
On a en effet :
−→ −→ − → −→ −→ F (M) = γO M − O O2 + 2VO · (O M − O O) + F (O) −→ −→ −→ − → = γO M2 + 2(VO − γ O O) · O M + F (O ) −→ − → −→ = γO M2 + 2VO · O M + F (O ) −→ → − → − où on pose VO = VO − γ O O Soit une fonction circulaire F non identiquement nulle, étudions l’ensemble V(F ) = {M | F (M) = 0} − → − → − → • Cas où γ(F ) = 0. Soit le point Ω = O − γ1 VO . C’est le point tel que VΩ = 0 appelé centre de F . On a donc − F (Ω) − → → F (M) = γΩM2 + F (Ω) = γ ΩM2 + γ F (Ω) F (Ω) Si γ < 0, V(F ) est le cercle de centre Ω et de rayon − γ . Si Si
F (Ω) γ F (Ω) γ
= 0, V(F ) se réduit au cercle-point {Ω}. > 0, aucun point n’annule F , donc V(F ) est vide.
Une fonction circulaire F est normale si γ(F ) = 1. Si γ(F ) = 0, on se ra1 mène à ce cas en remplaçant F par sa normalisée γ(F ) F . Pour F normale, on 2 + F (Ω). Si F (Ω) 0, V(F ) est le cercle de centre Ω, de rayon a F (M) = ΩM % R = −F (Ω) et F (M) est la puissance de M relativement à ce cercle.
− → − → • Cas où γ(F ) = 0. Alors F (M) = 2VO · OM + F (O) et F est une fonction affine (9.12, p. 250). − → − → Si VO = 0 , F est constante et V(F ) est vide. − → − − → → Si VO = 0 , V(F ) est une droite orthogonale à VO partageant le plan en V(F ) et les demi-plans ouverts {M | F (M) > 0} et {M | F (M) < 0}. Expression analytique Pour γ = 0, posons Φ(F ) = −γF (Ω), du signe de − F γ(Ω) . Ramenant P à un repère → → orthonormé (O, − ı ,− j ), la fonction circulaire F est de type « polynomial circulaire » x M → F (M) = γ(x2 + y 2) ) + 2αx + 2βy + δ y Un calcul immédiat donne
− → Φ(F ) = VO 2 − γF (O) = α2 + β 2 − γδ
i
i i
i
i
i
i
i
11.2 Puissance d’un point
291
Cette quantité, indépendante de O, ne dépend que de F . Elle existe aussi si γ = 0 et − → vaut alors VO 2 . La discussion précédente montre que V(F ) – a une infinité de points si Φ(F ) > 0 : c’est une droite ou un cercle selon que γ est nul ou non, – est réduit à un point si Φ(F ) = 0 et γ = 0, – est vide si Φ(F ) < 0 ou si Φ(F ) = γ = 0. Proposition 11.13. Les fonctions circulaires (en leur adjoignant la fonction nulle) constituent un R-espace vectoriel de dimension 4. On le note C .
Démonstration. Soit F et G deux fonctions circulaires définies par − → − → − → − → F (M) = γ(F )OM2 + VO (F ) · OM + F (O) , G(M) = γ(G)OM2 + VO (G) · OM + G(O) O étant une origine quelconque. Soit (λ, µ) un couple de réels, l’application
− − → − → → λF + µG : M → λγ(F ) + µγ(G) OM2 + λVO (F ) + µVO (G) · OM + λF (O) + µG(O) − → est une fonction circulaire. L’application F → γ(F ), VO (F ), F (O) est un isomorphisme de l’espace vectoriel C sur R × P × R de dimension 4. On peut aussi dire que la donnée d’un repère orthonormé détermine un isomorphisme entre C et l’espace des polynômes circulaires. Exemple : La fonction de Leibnitz F (p. 255) relative à un système de points pondérés (αi , Ai ) est une fonction circulaire telle que γ(F ) = αi . La discussion relative à cette situation est un cas particulier de la discussion menée plus haut pour les fonctions circulaires.
© Dunod. La photocopie non autorisée est un délit.
11.2.4. Axe radical de deux cercles Proposition 11.14. Soit deux cercles C1 , C2 de centres Ω1 , Ω2 distincts. L’ensemble
des points M ayant même puissance par rapport à ces cercles est une droite orthogonale à la droite des centres (Ω 1 Ω2 ). On l’appelle axe radical des deux cercles.
Démonstration. On suppose C 1 = V(F1 ) et C2 = V(F2 ) où F1 (M) = Ω1 M2 − R12 et F2 (M) = Ω2 M2 − R22 . On déduit le résultat de ce que F = F 1 − F2 est la fonction affine M → F (M) où, I étant milieu de (Ω 1 , Ω2 ), −→ −→ F (M) = Ω1 M2 − Ω2 M2 − R12 + R22 −→ −→ −→ −→ = (Ω1 M + Ω2 M) · (Ω1 M − Ω2 M) − R12 + R22 − → −−→ = 2IM · Ω1 Ω2 − R12 + R22
i
i i
i
i
i
i
i
11 • Géométrie des cercles
292
11.3 PROPRIÉTÉ ANGULAIRE DU CERCLE 11.3.1. Théorème fondamental Théorème 11.15. Soit C un cercle de centre Ω, A, B deux points de C .
(i) C \ {A, B} est l’ensemble des points M du plan tels que
− → − → 2(MA, MB) ≡ (ΩA, ΩB) mod(2π) (ii) Si (At) est la tangente en A à C , alors − → − → 2(A t, AB) ≡ (ΩA, ΩB) mod(2π)
Démonstration. (i1) Soit M ∈ C , distinct de A et B. Considérant les réflexions autour des A c c ................................c.....M médiatrices A de (A, M) et B de (B, M), on a, .... S c ............... D .......... S .. modulo 2π c .. ... B . D ...... S . c − → − → − → − → − → − → − → − → .. . . c . . (MA, MΩ) ≡ −(AM, AΩ) ≡ (AΩ, AM) ≡ (ΩA, MA) . S ... ca Ω D ...... .. S t ... D . − → − → − → − → − → − → − → − → . .. S...... (MΩ, MB) ≡ −(BΩ, BM) ≡ (BM, BΩ) ≡ (MB, ΩB) D .. . . c.. S.....c ..... .D.... − → − → − → − → − → − → ....... .... B AS . . . . par addition (MA, MB) ≡ (ΩA, MA) + (MB, ΩB), ............. . . ....... S .................... − → − → − → − → D soit 2(MA, MB) ≡ (ΩA, ΩB) d’où S S − → − → 2(MA, MB) ≡ (ΩA, ΩB). → → → τ . En faisant opérer les réflexions τ un vecteur unitaire de (At) et − τ1 = −− (ii) Soit − autour de (ΩA) et de la médiatrice D de (A, B), on a modulo 2π − → − → − → − → → → → → τ1 ) ≡ (ΩA, − τ) (− τ , AΩ) ≡ −(− τ1 , AΩ) ≡ (AΩ, − − → − → − → − → − → − → − → − → (AΩ, AB) ≡ −(BΩ, BA) ≡ (BA, BΩ) ≡ (AB, ΩB) − → − → − → − → − → − → − → → → → d’où (− τ , AB) ≡ (ΩA, − τ ) + (AB, ΩB) soit 2(− τ , AB) ≡ (ΩA, ΩB). On a donc − → − → 2(A t, AB) ≡ (ΩA, ΩB). (i2) Pour terminer la démonstration de (i), soit M un point non sur C . Montrons que → − → A, M B) ≡ (− 2(M ΩA, ΩB) modulo 2π . A, M B) ≡ 0. Si M ∈ (AB), alors 2(M / (AB), le cercle C = (ABM ) est de centre Ω = Ω. La perpendiculaire Si M ∈ (At ) en A à (Ω A) est distincte de (At). Par la partie directe, on a modulo π , A, M B) ≡ (At , AB) ≡ (A (M t, AB), donc
→ − → A, M B) ≡ (− 2(M ΩA, ΩB) modulo 2π.
i
i i
i
i
i
i
i
11.3 Propriété angulaire du cercle
293
Corollaire 11.16. Quatre points distincts A, B, C, D sont cocycliques ou alignés si et
CB) ≡ (DA, DB) mod(π). seulement si (CA,
Proposition 11.17. Complément au théorème de l’angle inscrit. Soit A, B deux points
MB) ≡ θ mod(π). La distincts, θ ∈]0, π[ et Cθ le cercle ensemble des M tels que ( MA, fonction affine M → [A, B, M] détermine un partage du plan en (9.13, p. 251) • la droite (AB), • le demi-plan ouvert P + des M tels que [A, B, M] > 0, • le demi-plan ouvert P − des M tels que [A, B, M] < 0, Le cercle Cθ privé des points A, B se compose des deux arcs de cercles − → − → Cθ+ = {M | (MA, MB) ≡ θ mod(2π)} = Cθ ∩ P + , − → − → Cθ− = {pM } | (MA, MB) ≡ θ + π mod(2π)} = Cθ ∩ P − .
− → − → − → − → Démonstration. On a [A, B, M] = MA × MB × sin(MA, MB), du signe de sin(MA, MB) (9.17, p. 254). Si θ ∈]0, π[, sin θ > 0, sin(θ + π) = − sin θ < 0, d’où − → − → Cθ+ = {M | (MA, MB) ≡ θ mod(2π)} = Cθ ∩ P + est l’ensemble des points M du cercle Cθ tel que le triangle ABM soit direct, − → − → Cθ− = {M | (MA, MB) ≡ θ + π mod(2π)} = Cθ ∩ P − est l’ensemble des points M du cercle Cθ tel que le triangle ABM soit inverse.
11.3.2. Applications
© Dunod. La photocopie non autorisée est un délit.
Proposition 11.18. Théorème de Simson . Soit un triangle ABC, C le cercle circonscrit, M de projections orthogonales U, V, W sur (BC), (CA), (AB). Pour que U, V, W soient alignés, il faut et il suffit que M ∈ C .
Démonstration. Par cocyclicité des groupes de points (M, A, V, W), (M, B, W, U), (M, C, U, V), on a, modulo π (UV, UW) ≡ (UV, UM) + (UM, UW) ≡ (CV, CM) + (BM, BW) ≡ (CA, CM) + (BM, BA) ≡ (CA, BA) − (CM, BM) Donc U, V, W sont alignés si et seulement si on a les propriétés équivalentes (UV, UW) ≡ 0 mod(π)) ⇔ (CA, BA) ≡ (CM, BM) mod(π) ⇔ M∈C La droite portant U, V, W s’appelle la droite de Simson de M.
M
Cr U
.....r...................................C..r.......C ......... C ........ ...... c . . . ccr C ......... .... . . ... .. ... V C ... ... ..... ... C ... ... . .. C .... ... . ... C .... ... C .... ... .... r... r C..r.. ..... B . . A ............. W . . . ...... ............ .......................................
i
i i
i
i
i
i
i
11 • Géométrie des cercles
294
11.4 FAISCEAUX DE CERCLES 11.4.1. Faisceaux à points de base Définition 11.19. Soit A, B deux points distincts. On appelle faisceau de cercles à points de base A, B l’ensemble des cercles passant par A, B. On convient de considérer la droite (AB) comme cercle dégénéré du faisceau.
Ces cercles sont centrés sur la médiatrice de (A, B). Comme A et B ont une puissance nulle par rapport à tout cercle du faisceau, l’axe radical de deux cercles distincts du faisceau est la droite (AB). Par tout M distinct de A, B passe un unique cercle du faisceau. On a une bijection de R/πZ sur le faisceau : à θ , on associe Cθ = {M | (MA, MB) ≡ θ mod(π)}. Le « cercle » associé à l’angle nul (modulo π ) est l’axe radical (AB).
11.4.2. Faisceaux de cercles à points limites Théorème 11.20. Théorème d’Appolonius. Soit A, B deux points distincts du plan et k un réel positif. L’ensemble C k des M tels que MA MB = k est • pour k = 1, la médiatrice de (A, B), • pour k = 1, un cercle centré sur (AB), coupant le droite (AB) en deux points I, J tels que [A, B, I, J] = −1.
L’axe radical de deux cercles C k et Ck distincts est la médiatrice de (A, B).
Démonstration. Pour que M ∈ C k , il faut et il suffit que MA2 − k2 MB2 = 0. L’application M → MA2 − k2 MB2 est une fonction de Leibnitz (9.19, p. 255). Pour k = 1, on a la médiatrice de (A, B). 2
B Pour k = 1, on a un cercle centré en le barycentre Ω = A−k 1−k 2 . Retrouvons ceci autrement. C1 Supposons k = 1. On a − → − → − → − → MA2 −k2 MB2 = (MA+kMB)·(MA−kMB) − → − → ..................................... M = (1+k)MI·(1−k)MJ ............ "............ ........ . . . . . .... "" T I, J étant les barycentres . T ......... . . . .... " A+kB A−kB .. T ...... " I = 1+k , J = 1−k . .. " . T ..... . .. " On a M ∈ Ck si et seule. . b T..... ..." − → − → . ... ment si MI · MJ = 0, c’est... B I .... A Ω .. J . . ... . à-dire si M est sur le cercle ... ... .... .... ..... . . . de diamètre (I, J) (11.7, .. ...... ......... ...... Ck ................................................... p. 286).
La division A, B, I, J est harmonique car
JA JB
= k = − IA . IB
i
i i
i
i
i
i
i
11.4 Faisceaux de cercles
295
La puissance d’un point M relativement à C k est → − → − → − → − MA2 − k2 MB2 − → − → MA + kMB MA − kMB · = Ck (M) = MI · MJ = 1+k 1−k 1 − k2 Pour tout M appartenant à la médiatrice de (A, B), on a C k (M) = MA2 = MB2 , quantité indépendante de k. Par extension, l’axe radical C 1 et les cercles points {A} = C0 et {B} = C∞ sont considérés comme faisant partie de cette famille de cercles, appelée faisceau de cercles à points limites A, B. On voit alors que par tout point M passe un unique cercle du faisceau à points limites A, B. Définition 11.21.
Questions : Deux cercles distincts C k , Ck d’un faisceau à points limites A, B n’ont pas de point MA commun car n’est pas égal à la fois à k et k . Inversement, deux cercles sans point MB commun appartiennent-ils à un même faisceau à points limites ? Pourquoi cette même terminologie de faisceau pour des situations apparemment dissemblables : faisceau à points limites, faisceau à points de base ? C’est à la section 11.5.2. qu’il est répondu à ces questions.
Exercice 11.1. On donne les cercles C 1 , C2 par des équations relativement à un repère
orthonormé pour C1 = V(P1 ) , P1 (x, y) = γ1 (x2 + y 2 ) + 2α1 x + 2β1 y + δ1 = 0 pour C2 = V(P2 ) , P2 (x, y) = γ2 (x2 + y 2 ) + 2α2 x + 2β2 y + δ2 = 0
© Dunod. La photocopie non autorisée est un délit.
Quelle est l’équation de leur axe radical ∆ ? Exercice 11.2. Sur un cercle C , on donne quatre points A, B, C, M distincts. Étant donné une direction X , les droites A + X , B + X , C + X recoupent C en A , B , C . Les droites (MA ), (MB ), (MC ) coupent (BC), (CA), (AB) en P, Q, R.
1) Montrer que M, P, Q, C sont cocycliques. 2) En déduire que P, Q, R sont alignés.
Exercice 11.3. Soit un triangle ABC, X , Y les bissectrices de ( CA, CB) coupant (AB) en I, J. Montrer que
JA CA IA = = IB JB CB
i
i i
i
i
i
i
i
11 • Géométrie des cercles
296
Exercice 11.4. 1) Soit ∆ une droite, O ∈ / ∆, A la projection orthogonale de O sur ∆,
A ∈ (OA) distinct de O, C le cercle de diamètre [O, A ]. Pour tout M ∈ ∆, (OM) recoupe C en M . Montrer que A, A , M, M sont cocycliques. 2) Soit O un point, k = 0. On appelle inversion de pôle O et de puissance k l’application Inv(O, k) de P privé de O sur lui-même associant à M le point M ∈ (OM) tel que OM × OM = k. Que deviennent par inversion les droites du plan ? Exercice 11.5. 1) Soit C un cercle, O ∈ / C , h une homothétie de centre O, C = h(C).
Étant donné deux droites ∆ 1 et ∆2 passant par O coupant C respectivement en M1 , N1 et M2 , N2 , soit M1 , N1 , M2 , N2 les transformés de M1 , N1 , M2 , N2 par h. Montrer que M1 , M2 , N1 , N2 sont cocycliques. 2) Que deviennent par une inversion de pôle O les cercles ne passant pas par O ?
11.5 L’ESPACE DES CERCLES DU PLAN 11.5.1. Orthogonalité entre cercles Considérons l’espace C de dimension 4 des fonctions circulaires (11.12, p. 289). Définition 11.22. Soit F définie par :
F : P −→ R − → − → − → M −→ γ(F )OM2 + 2VO (F ) · OM + F (O) où O est un point origine. À une fonction circulaire F , on associe l’ensemble V(F ) des points M tels que F (M) = 0. La quantité Φ(F ) ne dépendant que de F définit une forme quadratique sur C
Φ : C −→ R − → F −→ Φ(F ) = VO (F )2 − γ(F )F (O) (1) Si Φ(F ) > 0, l’ensemble V(F ) est infini : cercle si γ(F ) = 0, droite si γ(F ) = 0. Par extension, les droites sont considérées comme cercles particuliers. On l’a déjà fait en considérant l’axe radical d’un faisceau à points de base ou à points limites comme cercle particulier du faisceau. (2) Si Φ(F ) < 0, V(F ) est vide. (3) Si Φ(F ) = 0 et γ(F ) = 0, V(F ) est un cercle-point. On adjoint au plan P un élément supplémentaire : le point à l’infini ∞. Pour Φ(F ) = 0 et γ(F ) = 0, alors Φ est constante sur tout P . Par extension, on dit alors que V(F ) = {∞} est le cercle-point à l’infini. Les éléments isotropes de C sont les fonctions circulaires associées aux cercles-points. On y ajoute les fonctions constantes associées au cercle-point {∞}.
i
i i
i
i
i
i
i
11.5 L’espace des cercles du plan
297
Définition 11.23. On appellera cercle généralisé un ensemble V(F ) du type précédent. Un cercle au sens ordinaire est donc un cercle généralisé particulier appelé cercle à centre. L’ensemble Pˇ = P ∪ {∞} s’appelle le plan complété annalagmatique de P . Définition 11.24. Soit une origine O. L’application Φ : C → R est une forme quadratique sur C de forme polaire C × C → R (encore notée Φ) − → − → 1 F2 (O)γ(F1 ) + F1 (O)γ(F2 ) (F1 , F2 ) → Φ(F1 , F2 ) = VO (F1 ) · VO (F2 ) − 2 Deux cercles généralisés C 1 = V(F1 ) et C2 = V(F2 ) sont dits orthogonaux si F1 et F2 sont deux vecteurs de C orthogonaux pour la forme quadratique Φ.
Ceci ne dépend pas des fonctions circulaires F 1 et F2 définissant C1 et C2 qui sont les λ1 F1 et λ2 F2 (λ1 , λ2 non nuls). La nullité de Φ(F1 , F2 ) équivaut à la nullité de Φ(λ1 F1 , λ2 F2 ) = λ1 λ2 Φ(F1 , F2 ). L’orthogonalité entre cercles généralisés est donc bien définie. Décrivons géométriquement cette situation pour les différentes sortes de cercles généralisés.
© Dunod. La photocopie non autorisée est un délit.
(1) Cas de deux droites. On a − → − → − → − → F1 (M) = 2VO (F1 ) · OM + F1 (O) , F2 (M) = 2VO (F2 ) · OM + F2 (O) − → − → Φ(F1 , F2 ) = VO (F1 ) · VO (F2 ) − → − → V(F1 ) et V(F2 ) sont des droites orthogonales aux vecteurs VO (F1 ) et VO (F2 ) et deux droites sont orthogonales au sens précédent si et seulement elles sont orthogonales au sens ordinaire. (2) Cas d’un cercle ou droite et d’un cercle-point. On place l’origine en le centre O du cercle-point : V(F1 ) = {O}. Alors − → − → − → − → F1 (M) = γ(F1 )OM2 , F2 (M) = γ(F2 )OM2 + 2VO (F2 ) · OM + F2 (O)
1 Φ(F1 , F2 ) = − F2 (O)γ(F1 ) 2 Φ(F1 , F2 ) est nul si et seulement si F2 (O) = 0. Un cercle-point V(F1 ) = {O} et un cercle ou droite V(F2 ) sont orthogonaux si et seulement si O appartient à l’ensemble droite ou cercle V(F 2 ). (3) Cas d’un cercle ou droite et du cercle-point {∞}. L’origine est O quelconque. Alors − → − → − → F1 (M) = F1 (O) , F2 (M) = γ(F2 )OM2 + 2VO (F2 ) · OM + F2 (O)
1 Φ(F1 , F2 ) = − F1 (O)γ(F2 ) 2
i
i i
i
i
i
i
i
298
11 • Géométrie des cercles
Φ(F1 , F2 ) = 0 si et seulement si γ(F2 ) = 0. Le cercle-point {∞} et le cercle ou droite V(F2 ) sont orthogonaux si et seulement si V(F 2 ) est une droite. On peut donc énoncer : les droites sont les cercles généralisés passant par le point à l’infini. (4) Cas d’un cercle à centre et d’une droite. On place l’origine O en le centre du cercle V(F1 ). On a donc
− → − → − → F1 (M) = γ(F1 )OM2 + F1 (O) , F2 (M) = 2VO (F2 ) · OM + F2 (O) 1 Φ(F1 , F2 ) = − F2 (O)γ(F1 ) 2 Φ(F1 , F2 ) = 0 si et seulement si F2 (O) = 0. Un cercle à centre et une droite sont orthogonaux si et seulement si la droite passe par le centre du cercle. (5) Cas de deux cercles à centres. Cela fait l’objet de la proposition suivante : Proposition 11.25. Soit C1 , C2 deux cercles de centres Ω 1 , Ω2 , de rayons R1 , R2 ,
d = Ω1 Ω2 . On a Φ(F1 , F2 ) = 12 (R12 + R22 − d2 ) et il y a équivalence entre les énoncés suivants : a) C1 et C2 sont orthogonaux, b) C1 (Ω2 ) = R22 , (respectivement C2 (Ω1 ) = R12 ), c) C1 et C2 se coupent et, pour T ∈ C1 ∩C2 , (Ω1 T) et (Ω2 T) sont orthogonales, d) C1 et C2 se coupent et, pour T ∈ C1 ∩ C2 , (Ω1 T) est tangente à C2 (respectivement (Ω2 T) est tangente à C1 ), e) il existe une sécante passant par le centre de l’un coupant ces cercles en quatre points en division harmonique, f ) toute sécante passant par le centre de l’un coupe ces cercles en quatre points en division harmonique.
Démonstration. Soit F1 et F2 les fonctions circulaires normales définissant C 1 et C2 . Pour tout M et i = 1, 2, on a Ci (M) = Fi (M) = Ωi M2 − Ri2 . Si O est milieu de −→ − → (Ω1 , Ω2 ), on a Fi (M) = OM2 − 2OΩi · OM + Ωi O2 − Ri2 , d’où 1 1 1 Φ(F1 , F2 ) = (R12 + R22 − d) = R12 − F2 (Ω1 ) = R22 − F1 (Ω2 ) 2 2 2 Ceci donne l’équivalence de a), b1) et b 2). Ces cercles se coupent si et seulement si |R 1 − R2 | d R1 + R2 , donc si |Φ(F1 , F2 )| 2R1 R2 (11.5, p. 285). Si Φ(F1 , F2 ) = 0, l’inégalité est vérifiée et les cercles se coupent. Soit T un point commun. On a
−→ − → −→ − → F1 (M) = TM2 − 2TΩ1 · TM , F2 (M) = TM2 − 2TΩ2 · TM −→ −→ et Φ(F1 , F2 ) = TΩ1 · TΩ2 . On en déduit l’équivalence de a) et c). L’équivalence de c), d1) et d2) est claire.
i
i i
i
i
i
i
i
11.5 L’espace des cercles du plan
C
299
1 ..................................... ......... ...... T ........... C2 ..... ..... ............ ............. . . . .. ..... .. .... .... ..... .... ... ... ...... S ... ... ... S.... .... ... . ... Sa a ... . .... . . . .. ... . . . Ω Ω . . . 1 2 ... . . ... . . .... .. . ... ........ .... .... ..... ........... . . . ..... . . . . . . . . . . . ............. .. ....... ...... ............. ............................
..................................... ......... ...... ..... ..... .................................... . . . ..... M1..... .. .... .... ... HH ... ...... ..... ....a ... ... Ω2 .... .... HH ... . ... a Ω1 ... HaH . .... . . . .. ... . . . . . . Ha... .. . ... . .N .... H . M2H ... .........a 1 .... .... ..... .........H . . . ..... . . . . . . . . . . . . . ........H a .....H .. ....... ...... ............. ........................... N2
Soit D une sécante passant par Ω 1 coupant C1 en M1 , N1 et C2 en M2 , N2 ,
F2 (Ω1 ) = Ω1 M2 · Ω1 N2 , R12 = Ω1 M21 = Ω1 N21 Alors b2) équivaut à Ω1 M2 · Ω1 N2 = Ω1 M21 = Ω1 N21 , ce qui équivaut à
[M1 , N1 , M2 , N2 ] = −1 par la relation de Newton caractérisant les divisions harmoniques (8.26, p. 217), d’où l’équivalence de b), e) et f ). Proposition 11.26. La signature de Φ est (3, 1).
© Dunod. La photocopie non autorisée est un délit.
Démonstration. Soit C1 = V(F1 ), C2 = V(F2 ) deux cercles à centre orthogonaux, P1 , P2 les points communs. Alors {P 1 } et {P2 } sont orthogonaux à C1 et C2 . Posons ϕi (M) = Pi M2 pour tout point M. On a une base (F1 , F2 , ϕ1 , ϕ2 ) de C et la décomposition de C = Vect(F1 , F2 )⊕⊥ Vect(ϕ1 , ϕ2 ) en somme directe orthogonale. La matrice de Φ dans cette base est ⎞ ⎛ 0 0 0 Φ(F1 ) 0 0 0 Φ(F2 ) ⎟ ⎜ ⎝ 0 0 0 Φ(ϕ1 , ϕ2 ) ⎠ 0 0 0 Φ(ϕ1 , ϕ2 ) Les restrictions de Φ à Vect(F1 , F2 ) et Vect(ϕ1 , ϕ2 ) sont respectivement définie positive de signature (2, 0) et hyperbolique de signature (1, 1), d’où le résultat.
11.5.2. Faisceaux de cercles : nouvel éclairage. La donnée d’un plan vectoriel Π ⊂ C définit le faisceau de cercles F(Π) formé des cercles V(F ) où F décrit Π, avec Φ(F ) 0 pour que V(F ) soit un cercle généralisé non vide (11.22, p. 296). Si donc on choisit deux cercles généralisés C 1 = V(F1 ) et C2 = V(F2 ) on aura déterminé un faisceau F(C 1 , C2 ) correspondant au plan vectoriel Vect(F1 , F2 ). Proposition 11.27. Soit F un faisceau de cercles et M un point. Alors
• ou bien M appartient à tout cercle généralisé du faisceau, • ou bien M appartient à un unique cercle généralisé du faisceau.
i
i i
i
i
i
i
i
300
11 • Géométrie des cercles
Démonstration. Supposons F défini par C 1 = V(F1 ) et C2 = V(F2 ). On cherche les couples (λ1 , λ2 ) tels que λ1 F1 (M) + λ2 F2 (M) = 0. Si M ∈ C1 ∩ C2 , F1 (M) = F2 (M) = 0, donc tout couple (λ1 , λ2 ) convient. Si F1 (M) et F2 (M) ne sont pas tous deux nuls, les couples (λ 1 , λ2 ) cherchés sont proportionnels à F2 (M), −F1 (M) . L’unique cercle passant par M est donc V F2 (M)F1 − F1 (M)F2 .
Nous allons maintenant classer les faisceaux de cercles. Tout repose encore sur la forme quadratique Φ, dont la signature est (3, 1). Si F(Π) est un faisceau, il y a trois cas pour la restriction Φ |Π de Φ à Π : (1) Φ|Π est de signature (1, 1), les faisceaux définis par ces plans s’appellent faisceaux à points limites. (2) Φ|Π est de signature (2, 0), les faisceaux définis par ces plans s’appellent faisceaux à points de base. (3) Φ|Π est dégénérée, c’est-à-dire que le plan vectoriel Π est isotrope : on parle alors de faisceaux singuliers. Avant d’entrer dans l’étude géométrique de ces différents cas, parlons d’orthogonalité. Comme Φ est non dégénérée, l’application involutive Π → Π ⊥ établit une bijection entre : • l’ensemble des plans vectoriels P tels que Φ |P est de signature (1, 1), • l’ensemble des plans vectoriels Q tels que Φ |Q est de signature (2, 0). En effet, dans ces deux cas les plans sont non isotropes, la signature est imposée par le théorème de Sylvester (cf. 6.18). Définition 11.28. Si F(Π) est un faisceau de cercles, F(Π ⊥ ) s’appelle le
faisceau conjugué. Pour Π non isotrope, on a la décomposition en somme directe orthogonale C = Π ⊕ ⊥ Π⊥ . Donc F(Π⊥ ) est formé des cercles orthogonaux à tout cercle de F(Π). On notera F ⊥ le faisceau conjugué au faisceau F . Un cercle généralisé appartient à F ⊥ si et seulement s’il est orthogonal à deux cercles généralisés distincts de F .
a) Étude des faisceaux à points limites. On suppose Φ|Π de signature (1, 1). Alors Π a une base formée de deux vecteurs isotropes, fonctions circulaires f et g telles que Φ(f ) = Φ(g) = 0.
i
i i
i
i
i
i
i
11.5 L’espace des cercles du plan
301
• Cas général V(f ) = {A} et V(g) = {B} sont deux cercles-points distincts. Supposant f et g normalisées, f (M) = AM 2 et g(M) = BM2 pour tout M. Les fonctions circulaires de Vect(f, g) sont du type
F = λf + µg : M −→ λAM2 + µBM2 On a clairement V(F ) = φ si λ et µ sont non nuls de même signe. Pour λ, µ non nuls de signes contraires, . ( ) MA |µ| = k où k = V(F ) = M | λMA2 + µMB2 = 0 = M | MB |λ| On trouve la notion de faisceau de cercles à points-limites A, B au sens de la définition 11.21, p. 295. Ce faisceau est noté F(A, B). • Cas de cercles concentriques c’est le cas où g est constante, c’est-à-dire où V(g) = {∞}. On peut supposer que f (M) = MA2 et g(M) = 1. Les fonctions circulaires de Vect(f, g) sont du type
F = λf + µ : M → λAM2 + µ On a V(F ) = φ si λ et µ non nuls ont même signe. Pour λ, µ non nuls de signes contraires, . / 0 / 0 |µ| V(F ) = M | λMA2 + µ = 0 = M | MA = R où R = |λ|
© Dunod. La photocopie non autorisée est un délit.
On trouve l’ensemble des cercles de centres A. C’est un cas particulier de faisceau à points-limites, noté F(A, ∞). b) Étude des faisceaux à points de base. Un faisceau F = F(Π) à points de base est donc un faisceau tel que Φ |Π est de signature (2, 0), donc définie positive. Pour tout F ∈ Π, Φ(F ) > 0 donc le cercle généralisé V(F ) est défini pour tout F ∈ Π. Le faisceau conjugué est alors un faisceau à points limites A, B (avec éventuellement B = ∞). • Cas général : on a F ⊥ = F(A, B), donc F est formé des cercles généralisés orthogonaux aux cercles-points {A} et {B}, il s’agit donc des cercles passant par A et B. On retrouve la notion de faisceau à points de base de 11.19, p. 294. • Cas de droites concourantes : c’est le cas où F ⊥ = F(A, ∞) est formé des cercles de centre A. Alors F est formé des cercles généralisés orthogonaux à {A} et {∞}, c’est-à-dire des droites passant par A.
i
i i
i
i
i
i
i
11 • Géométrie des cercles
302
La figure suivante décrit ces deux situations. ...... ............. ................ ..... .... .. .. . ... .................................. . . . . . . . . . . . .. ... ....... A ................ ..... . . . . . . . . . . . . .............. . .....ca..... ... . . ..... ..... .... ...... .... ..... . .... ......... ... ....... ... ... . ........................... .... ... .. ... .. . ... . ... ... .. ......................... ... . . . . . . . ... . ...... ... .. ....... ... .... .... .........ca... ...... .... .......... .. ............. . .... . ..... . . . .................. ........ .... .. .............................................. B .. ... .. .... . . .. ....... .............................
faisceau à points-limites F(A, B)
faisceau à points de base F ⊥ (A, B)
........................... . ..............
@............. ................................ ............. .. ....... ......... ....... ..... ... @ ... ........... ............ ..... .... ..... ... @ .... ... .. .... ... ... ... .... ..... .... .. .. .. @a A ... ... .... ... ... ... . @ ...... ..... .... ... ... ..... ... ..... ..........................@ ... .... ... .... ...... .. ... ..... .......................................@ .... ....... ...... . . ............. . . . . . . . . . . . . ................. @
faisceau à points-limites F(A, ∞) faisceau à points de base F ⊥ (A, ∞)
c) Étude des faisceaux singuliers. Ce sont donc les faisceaux où F = F(Π), avec Π isotrope. Alors Φ |Π est de rang 1. Il existe dans Π une unique droite isotrope Φ-orthogonale à tout élément de Π. Soit f un générateur de cette droite isotrope. • Cas général d’un faisceau de cercles tangents On suppose f non constante, du type M → AM2 , associée au cercle-point {A}. Tout cercle de F est orthogonal au cercle-point {A}, donc passe par A. Deux cercles C, C distincts de F passent par A sans avoir un deuxième point B commun, sinon F serait à points de base A, B. Tous les cercles de F ont même tangente ∆ en A. Inversement, soit C un cercle tangent en A à ∆ (ou C = ∆) et M ∈ C distinct de A. L’unique cercle de F passant par M ne peut être que C , d’où C ∈ F (11.27, p. 299). Le faisceau conjugué est aussi singulier, formé des cercles tangents en A à la droite ∆ orthogonale à ∆. • Cas d’un faisceau de droites parallèles On suppose f = 1, associée au cerclepoint {∞}. Les cercles (généralisés) de F sont orthogonaux à {∞}, donc sont des droites. Deux droites de F n’ont pas de point commun B = ∞ sinon F serait le faisceau à points de base F(B, ∞) des droites passant par B. Donc F est formé de droites de même direction D et de {∞}.
i
i i
i
i
i
i
i
11.5 L’espace des cercles du plan
303
Inversement, soit C une droite de direction D et M ∈ C . L’unique cercle généralisé de F passant par M ne peut être que C , d’où C ∈ F . Le faisceau conjugué est formé des droites de direction D ⊥ , et les figures suivantes décrivent cette situation. ..................................... ......... . ..... . ∆ ............ . . ... ... .... ... .. ... .... ... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ......... ... ......... .... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .......... . ..... . . . . . . . . . . . . . . . . ..... . ... . .. .. .... ................................. ...... ... .. ... . . . . . . . . . . . ..... . . ....... .. . . ...... . . ... . . . . ..... ........ . . . ... .... .... . . . . . . . . . . . . . . . . . . . . ................................... ... . .. . . . . ..... ........ . . .. . . ... . ... . . ..... .... A ........ .. .... ....... ... . . . . . . ......... ... ... .. . . .... .. ....................... ........ .... ........ ..... ............ ..... ... .. . . . . . . . . . . . . . . . . . . . . ...... ............. .. ..... ........... .. .................................. ... .. .. . ... . . .... ...... .... .......... ..... . . . . . . . . . ....................
faisceaux conjugués
∆
de cercles tangents en A à ∆ et ∆
faisceaux conjugués de droites parallèles
© Dunod. La photocopie non autorisée est un délit.
de directions D et D ⊥
Proposition 11.29. Axe radical. Soit F un faisceau de cercles qui n’est formé, ni de cercles concentriques, ni de droites concourantes ou parallèles. L’axe radical ∆ de deux cercles de F est le même pour toute paire de cercles de F et est l’unique droite de F .
Démonstration. S’il existait deux droites ∆ et ∆ dans F , alors on aurait F = F(∆, ∆ ). Si ∆ et ∆ se coupent en A (resp. sont parallèles), F serait formé des droites passant par A (resp. parallèles à ∆ et ∆ ). Ces éventualités sont exclues. Soit C1 = V(F1 ) et C2 = V(F2 ) deux cercles à centre distincts de F où les fonctions circulaires F1 , F2 sont normalisées et O une origine − → − − → − → → ∀M , F1 (M) = OM2 + 2V1 · OM + F1 (O) , F2 (M) = OM2 + 2V2 · OM + F2 (O) L’axe radical de C1 et C2 est V(F1 − F2 ), cercle généralisé du faisceau.
i
i i
i
i
i
i
i
11 • Géométrie des cercles
304
11.6 PROJECTION STÉRÉOGRAPHIQUE Soit E un espace affine euclidien de dimension 3, E son espace vectoriel associé, P un plan de E , S une sphère de centre Ω. La perpendiculaire à P passant par Ω coupe S en deux points s, o avec s ∈ / P . Les points Ω, o, s ont même projection orthogonale O sur P . s On a une bijection π de la sphère S sur le .................a...................... ......... ...... . . . . . plan annalagmatique Pˇ ainsi définie : . . . . . . .. ..
m
... .. ... ... ... .... ... . ... a ....a .. ... Ω . . ... ... ... .... ... . . . ..... .... ...... ............ ...... ............a...................
o
a
S
1) à m ∈ S distinct de s, on associe le point π(m) = M où la droite (sm) coupe P, 2) à s on associe le point à l’infini ∞ de Pˇ .
a
Cette bijection s’appelle la projection P M O stéréographique de sommet s de la sphère S sur le plan P . Nous verrons que π établit une bijection entre cercles tracés sur S et cercles généralisés de Pˇ .
11.6.1. Plans et sphères Comme en géométrie plane pour les droites (9.13, p. 251) et cercles (11.12, p. 289), on décrit un plan (resp. une sphère) comme ensemble des points annulant une fonction affine (resp. circulaire). Étant donné une origine s, • une fonction affine est une application f : E → R − → → P → f (P) = − w · sP + f (s) Les fonctions affines forment un espace vectoriel de dimension 4 car isomorphe à → − E × R par l’isomorphisme f → w , f (s) . • une fonction circulaire est une application G : E → R − → − → P → G(P) = γsP2 + 2W · sP + G(s) Les fonctions circulaires forment un espace de vectoriel dimension 5 car isomorphe − → à R × E × R par l’isomorphisme G → γ, W , G(s) . → − → → Une fonction affine f donnée par un couple − w = 0 détermine le w , f (s) avec − plan V(f ) = {P | f (P) = 0} Inversement, tout plan est du type V(f ) où f est déterminée à facteur réel près. Comme pour les cercles, l’ensemble des points annulant une fonction circulaire n’est pas toujours une sphère. Ce peut être un plan (si γ = 0), un point unique, ou l’ensemble vide. Inversement, toute sphère est du type V(G) où G est déterminée
i
i i
i
i
i
i
i
11.6 Projection stéréographique
305
à facteur réel près. Comme pour les cercles, la condition pour que V(G) soit non vide et non réduit à un point (i.e. un plan ou une sphère de rayon non nul) est que − → Φ(G) = W 2 − γG(s) > 0.
11.6.2. Inversion en dimension 3 Nous avons rencontré la notion d’inversion en géométrie plane (11.4, p. 296). Cette notion n’est pas différente en dimension 3. Voici une autre approche. Définition 11.30. On appelle inversion de pôle s et de puissance k , scalaire non nul, la bijection involutive Inv(s, k) : P → Q de E \ {s} sur lui-même où P, Q, s sont alignés avec − → − → ksQ sP × sQ = k, autrement dit, sP = 2 sQ
Proposition 11.31. L’inversion Inv(s, k) établit une bijection entre l’ensemble des
plans ne passant pas par s et l’ensemble des sphères passant par s.
Il existe une bijection linéaire f → G de l’espace vectoriel des fonctions affines sur l’espace vectoriel des fonctions circulaires nulles en s telle que V(f ) et V(G) soient transformés l’un de l’autre par Inv(s, k). → − − → → → Démonstration. Soit le plan V(f ) où f (P) = − w · sP + f (s) avec − w = 0 . Pour que P ∈ V(f), il faut et il suffit que son inverse Q vérifie
© Dunod. La photocopie non autorisée est un délit.
− → − → → ksQ f (s)sQ2 + k− w · sQ − − → → → = w · + f (s) = − w · sP + f (s) = f (P) = 0 sQ2 sQ2 Soit G la fonction
− → → Q → G(Q) = f (s)sQ2 + k− w · sQ → − &− → k− w & &2 k2 w 2 &→ si f (s) = 0 = f (s) &sQ + & − 2f (s) 4f 2 (s) C’est une fonction circulaire nulle en s où V(G) est la sphère de centre I défini par → − − → w . On a l’équivalence sI = − 2fk (s)
P ∈ V(f ) ⇐⇒ Q ∈ V(G) Enfin, il est clair que cette application f → G est une bijection linéaire entre ces espaces vectoriels.
i
i i
i
i
i
i
i
11 • Géométrie des cercles
306
11.6.3. La projection stéréographique Reprenons les conditions du début de 11.6. Il est clair que la projection stéréographique π : S \ {s} → P est la restriction à S de l’inversion Inv(s, k) (k = so × sO) transformant S en Pˇ . Proposition 11.32. La projection stéréographique π établit une bijection entre l’ensemble des cercles γ tracés sur S et l’ensemble des cercles généralisés Γ de P .
Pour que Γ soit une droite, il faut et il suffit que γ passe par s. Il existe une bijection linéaire Ψ : f → F entre l’espace des fonctions affines f définies sur E et l’espace des fonctions circulaires F définies sur P telle que V(F ) = π V(f ) ∩ S .
ΠP PP
P
..... ....
P··················· ·a
M
s ..............a............. ........ @ ........... .. . . m .... a . ...P γ .
S......
PP @ .... . @ a` PP P.....a n . Ω ..@ ..
.... .... ..... ..... ........ .............a`.................
o
Γ
a
O
PP P P @ @ @ a @·························
N
Démonstration. Soit γ un cercle tracé sur S et Π le plan le contenant. Alors − → → Π = V(f ) où f est une fonction affine P → f (P) = − w · sP + f (s). L’inverse de Π est la sphère Σ = V(G) où − → → G : Q → G(Q) = f (s)sQ2 + k− w · sQ → → → → → Écrivons − v ∈ P . Soit m ∈ S, M = π(m) ∈ P , on a w =− u +− v où − u ∈ P ⊥, − − → − → − → → → → G(M) = f (s)sM2 + k− w · sM = f (s)(sO2 + OM2 ) + k(− u +− v ) · (sO + OM) − → − → → → v · OM + f (s)sO2 + k− u · sO = f (s)OM2 + k−
Autrement dit, la restriction de G au plan P est la fonction circulaire − → − → → → F : P → R, M → F (M) = f (s)OM2 + k− v · OM + f (s)sO2 + k− u · sO Pour que m ∈ γ = V(f ) ∩ S , il faut et il suffit que π(m) = M ∈ V(G) ∩ P , donc que M ∈ P et F (M) = 0. On a les équivalences → − → → → v = 0 ⇔ f (s) = 0 et − w = − u V(F ) est une droite ⇔ f (s) = 0 et − ⇐⇒ le plan V(f ) passe par s et n’est pas tangent à S L’application Ψ : f → F est bien linéaire, de l’espace des fonctions affines f : E → R vers l’espace des fonctions circulaires F : P → R. Si f ∈ Ker Ψ, F est nulle, donc
i
i i
i
i
i
i
i
11.6 Projection stéréographique
307
→ → − − → − → − → → → → f (s) = 0, − v = 0 et − u · sO = 0 ce qui implique − u = 0 car − u et sO sont → − → w = 0 et f est nulle. Comme ces espaces vectoriels sont tous deux colinéaires, donc − de dimension 4, l’injection Ψ est bien bijective. Remarquons que si le plan V(f ) est extérieur à S , γ est vide et Γ = V(F ) est aussi vide. Le lecteur vérifiera que la condition 1 − → → Φ(F ) = k2 v2 − f (s) f (s)sO2 + k− u · sO > 0 4 exprimant que V(F ) est non vide signifie que le plan V(f ) coupe S , c’est-à-dire que sa distance au centre Ω est inférieure au rayon de S .
11.6.4. Faisceaux de cercles dans P et S Soit a, b deux points distincts de S , ∆ 1 = (ab) la droite joignant ces points. On notera X1 l’ensemble des plans Π1 passant par ∆1 . Soit A et B les plans tangents en a et b à S . Deux cas sont à distinguer : • a) Si a et b ne sont pas diamétralement opposés sur S , les plans A et B ne sont pas parallèles et se coupent suivant une droite ∆ 2 . On notera X2 l’ensemble des plans Π2 passant par ∆2 . • b) Si a et b sont diamétralement opposés sur S , les plans A et B sont parallèles. On notera X2 l’ensemble des plans parallèles à A et B . Soit dans Pˇ les points distincts A = π(a) et B = π(b). Proposition 11.33. (i) Si Π1 décrit X1 , le cercle généralisé π(Π1 ∩ S) décrit le
faisceau à points de base A, B.
© Dunod. La photocopie non autorisée est un délit.
(ii) Si Π2 décrit l’ensemble des plans de X 2 coupant la sphère S , le cercle généralisé π(Π2 ∩ S) décrit le faisceau à points-limites A, B. Lemme 11.34. Soit deux plans distincts V(f ) et V(g) où f et g sont des fonctions affines sur E non proportionnelles. Si (λ, µ) décrit R 2 (privé du couple nul), V(λf +µg) décrit l’ensemble X de plans
• passant par ∆ = V(f ) ∩ V(g) si ces plans ne sont pas parallèles, • parallèles aux plans V(f ) et V(g) si ces plans sont parallèles.
Démonstration. [du lemme ] Il est facile de vérifier que tout plan du type V(λf +µg) est dans l’ensemble X . Inversement, soit Π un plan de X et P un point de Π non sur V(f ) ∩ V(g) (ce qui n’est pas une restriction si ces plans sont parallèles). Supposons par exemple P ∈ / V(f ), soit f (P) = 0. Alors Π est l’unique plan de X passant par P. Mais le plan V g(P)f − f (P)g est aussi un plan de X passant par P. C’est donc Π qui est bien du type indiqué.
i
i i
i
i
i
i
i
11 • Géométrie des cercles
308
Démonstration. [de la proposition ] Le point (i) est évident. Soit f et g des fonctions affines sur E telles que A = V(f ) et B = V(g), F = Ψ(f ) et G = Ψ(g) les fonctions circulaires sur P . Alors A ∩ S et B ∩ S sont les cercles-points {a} et {b} dont les images par π sont les cercles-points {A} = V(F ) et {B} = V(G). Si Π2 = V(λf + µg) ∈ X2 coupe S suivant γ2 , alors Γ2 = π(γ2 ) = V(λF + µG) appartient au faisceau F(A, B) à points-limites A, B. En revanche, si Π2 = V(λf + µg) ∈ X2 ne coupe pas S , V(λF + µG) est l’ensemble vide. Tout ceci est encore valable si l’un des points a, b est s. Alors A ou B est le point à l’infini ∞. On a un faisceau de droites concourantes et un faisceau de cercles concen triques.
EXERCICES Exercice 11.6. Soit deux cercles généralisés C 1 , C2 donnés par leurs équations dans un repère orthonormé
pour C1 = V(P1 ) , P1 (x, y) = γ1 (x2 + y 2 ) + 2α1 x + 2β1 y + δ1 = 0 pour C2 = V(P2 ) , P2 (x, y) = γ2 (x2 + y 2 ) + 2α2 x + 2β2 y + δ2 = 0 À quelle condition sur les coefficients sont-ils orthogonaux ?
Exercice 11.7. On donne les cercles C 1 , C2 par des équations relativement à un repère
orthonormé pour C1 = V(P1 ) , P1 (x, y) = γ1 (x2 + y 2 ) + 2α1 x + 2β1 y + δ1 = 0 pour C2 = V(P2 ) , P2 (x, y) = γ2 (x2 + y 2 ) + 2α2 x + 2β2 y + δ2 = 0 À quelle condition sur les coefficients ces cercles sont-ils tangents (resp. sécants, resp. sans point commun) ? Exercice 11.8. Réseaux de cercles. À un sous-espace vectoriel V ⊂ C de dimension
3, on associe le réseau R des cercles généralisés V(F ) où F décrit V avec Φ(F ) 0. 1) En considérant le Φ-orthogonal de V , montrer qu’il existe en général un point O ayant même puissance relativement à tous les cercles de R. Que se passe-t-il s’il n’en est pas ainsi ? 2) Discuter la nature de R suivant la nature de la restriction de Φ/ V . 3) Que dire de l’ensemble des cercles stables par une inversion Inv(O, k) (11.4, p. 296) ?
i
i i
i
i
i
i
i
Problèmes
309
PROBLÈMES Les corrigés de ces problèmes sont disponibles sur le site de Dunod : www.dunod.com.
11.1. PROBLÈME Soit un triangle ABC, P, Q, R sur (BC), (CA), (AB) distincts des sommets. 1) Montrer que les cercles (AQR), (BRP), (CPQ) concourent en un point M. 2) Inversement, étant donné M distinct des sommets, montrer qu’il existe P, Q, R sur (BC), (CA), (AB) tels que M soit sur les cercles (AQR), (BRP), (CPQ). Ces points P, Q, R sont-ils uniques ? 3) Montrer que M est sur (ABC) si et seulement si P, Q, R sont alignés. 4) Montrer que A, P, M sont alignés si et seulement si B, C, Q, R sont cocycliques. 5) Montrer que (AP), (BQ), (CR) concourent en M si et seulement si M est l’orthocentre de ABC.
11.2. PROBLÈME Soit un triangle T0 = A0 B0 C0 , P un point non situé sur les côtés. On définit par récurrence Tn = An Bn Cn où An , Bn , Cn sont projections orthogonales de P sur (B n−1 Cn−1 ), (Cn−1 An−1 ), (An−1 Bn−1 ). 1) Montrer que si P n’est pas sur le cercle (A 0 B0 C0 ), cette construction peut se réitérer indéfiniment.
© Dunod. La photocopie non autorisée est un délit.
2) Montrer que Tn+3 est transformé de Tn par une similitude directe de centre P. 3) Montrer que parmi les trois modèles de triangles T 0 , T1 , T2 obtenus, deux sont identiques si P occupe l’une des positions suivantes relative à T 0 : centre du cercle circonscrit, orthocentre, centre d’un cercle inscrit ou exinscrit.
11.3. PROBLÈME (Steiner) Soit ABC un triangle, C le cercle circonscrit, H l’orthocentre, M un point, P, Q, R les symétriques de M par rapport aux côtés. 1) Montrer que M ∈ C si et seulement si trois des points P, Q, R, H sont alignés. S’il en est ainsi, ils le sont tous les quatre. 2) Discuter suivant la position de M sur C la position relative de H relativement à P, Q, R.
i
i i
i
i
i
i
i
11 • Géométrie des cercles
310
11.4. PROBLÈME (situation orthocentrique) 1) Montrer qu’une base orthogonale de l’espace C des fonctions circulaires donne lieu à trois cercles généralisés orthogonaux deux à deux. 2) On suppose que ces cercles A, B, C ont des centres A, B, C. Quel rôle joue l’orthocentre D pour ces trois cercles ? 3) Montrer que le triangle ABC a ces trois angles aigus (9.12, p. 258). 4) Inversement, une configuration orthocentrique donne-t-elle lieu à trois cercles orthogonaux deux à deux ?
11.5. PROBLÈME Soit P un plan euclidien orienté de plan vectoriel associé P . Les déterminants sont évalués relativement à des bases orthonormales directes de P . 1) Soit la rotation vectorielle rot θ d’angle θ distinct de 0, π . Montrer que l’application − → − → → − P → R, V → det V , rotθ ( V ) est une forme quadratique proportionnelle à la forme quadratique euclidienne de P . 2) Soit A, B deux droites vectorielles, σ A , σB les réflexions vectorielles autour de A et B . À quelles conditions sur A et B l’application → − → − → − V → det σA ( V ), σB ( V ) est-elle une forme quadratique proportionnelle à la forme quadratique euclidienne ? 3) On donne un triangle ABC direct, O le centre du cercle circonscrit. On considère les côtés du triangle A = (BC), B = (CA), C = (AB) de directions A, B, C . On note α, β, γ les réflexions (affines) autour des droites A, B, C . Montrer que l’application
F : P → R, M → F (M) = [α(M), β(M), γ(M)] (voir notations du chapitre 9, 9.9, p. 249) est une fonction circulaire. 4) Quel est l’ensemble V(F ) des points où F s’annule ? (Utiliser le théorème de Simson.) 5) En déduire que l’ensemble des points M tels que l’aire algébrique du triangle α(M)β(M)γ(M) est constante est vide ou est un cercle de centre O. 6) Cette aire algébrique peut-elle prendre n’importe quelle valeur réelle ? 7) Discuter de l’orientation du triangle α(M)β(M)γ(M).
i
i i
i
i
i
i
i
Solutions des exercices
311
SOLUTIONS DES EXERCICES
Solution 11.1. Pour tout M(x, y), on a C1 (M) = γ11 P1 (x, y) et C2 (M) = γ12 P2 (x, y),
Pour que M(x, y) ∈ ∆, il faut et il suffit que C 1 (M) − C2 (M) = 0, soit, en multipliant par γ1 γ2
2(α1 γ2 − α2 γ1 )x + 2(β1 γ2 − β2 γ1 )y + δ1 γ2 − δ2 γ1 = 0 Si α1 γ2 − α2 γ1 = β1 γ2 − β2 γ1 = 0, les cercles sont concentriques et l’axe radical n’existe pas.
Solution 11.2. 1) La réflexion σ autour de la droite passant par le centre O de C et orthogonale à X échange A et A , B et B , C et C et laisse C stable. On en déduit les congruences modulo π , MB ) ≡ −(MA, MB) ≡ −(CA, CB) ≡ −(CQ, CP) = (CP, CQ) (MP, MQ) ≡ (MA
d’où la cocyclicité de M, P, Q, C. 2) On a les congruences modulo π
(PQ, X) ≡ (PQ, PC) + (PC, X) ≡ (MQ, MC) + (BC, X) , MC) + (BC, , BC) + (BC, , X) ≡ 0 X) ≡ (BB X) ≡ (BB ≡ (MB Les points P, Q, R sont donc alignés sur une droite de direction X .
© Dunod. La photocopie non autorisée est un délit.
Solution 11.3. On a [(CA), (CB), X , Y] = −1 donc [A, B, I, J] = −1 (8.40, p. 227).
Le cercle de diamètre (I, J) est le lieu des points M tels que MA MB = X , Y sont orthogonales, C appartient à ce cercle, d’où le résultat.
IA IB
=
JA JB .
Comme
Solution 11.4. 1) Comme [O, A ] est un diamètre de C , la droite (OM ) = (MM ) est
orthogonale à (A M ). Comme (AA ) est orthogonale à ∆ = (MA), les points A, A , M, M sont sur le cercle de diamètre [A , M].
2) Les droites passant par O sont stables. Soit ∆ ne passant pas par O, A la projection orthogonale de O sur ∆, A le transformé de A, C le cercle de diamètre [O, A ]. Pour tout M ∈ ∆, les points A, A , M, M sont sur le cercle Γ de diamètre [A , M] d’où k = OA × OA = OM × OM , donc le transformé de ∆ par Inv(O, k) est le cercle C . Les droites ne passant pas par O deviennent les cercles passant par O et inversement.
i
i i
i
i
i
i
i
11 • Géométrie des cercles
312
−−→ −−→ Solution 11.5. 1) Les vecteurs N1 N2 et N1 N2 sont colinéaires, d’où, par cocyclicité, les congruences modulo π (N1 N 2 , N1 M1 ) ≡ (N1 N2 , N1 M1 ) ≡ (M2 N2 , M2 M1 ) ≡ (M2 N2 , M2 M1 )
ce qui donne la cocyclicité demandée. 2) Soit C ne passant pas par O, N 1 ∈ C , ∆1 = (ON1 ) recoupant C en M1 , M1 le transformé de N1 par Inv(O, k), h l’homothétie de centre O transformant M1 en M1 , C = h(C). Soit ∆2 passant par O coupant C en M 2 et N2 , C en M2 = h(M2 ) et N2 = h(N2 ). Par ce qui précède, N1 , M1 , N2 , M2 sont cocycliques, donc k = ON1 × OM1 = ON2 × OM2 , donc M2 est transformé de N2 par Inv(O, k). Ainsi, C est transformé de C par Inv(O, k). L’inversion Inv(O, k) induit donc une bijection involutive de l’ensemble des cercles ne contenant pas O sur lui-même. Solution 11.6. On a C1 = V(F1 ) et C2 = V(F2 ) où, pour M(x, y),
−−→ − −−→ → F1 (M) = γ1 OM2 + 2V1,O · OM + δ1 où V1,O (α1 , β1 ) −−→ − −−→ → F2 (M) = γ2 OM2 + 2V2,O · OM + δ2 où V2,O (α2 , β2 )
La condition est alors Φ(F1 , F2 ) = 0, soit (11.24, p. 297) 1 α1 α2 + β1 β2 − (δ2 γ1 + δ1 γ2 ) = 0 2 Solution 11.7. Soit les fonctions circulaires F i : M(x, y) → Pi (x, y). On doit expri-
mer que le faisceau F(C1 , C2 ) est singulier (resp. à points de base, resp. à pointslimites), i.e. que la restriction de Φ au plan vectoriel Vect(F 1 , F2 ) est dégénérée (resp. de signature (2, 0), resp. (1, 1)). Supposons que C 2 n’est pas un cercle-point. On a
Φ(F1 + λF2 ) = λ2 Φ(F2 ) + 2λΦ(F1 , F2 ) + Φ(F1 ) La restriction de Φ à Vect(F1 , F2 ) est dégénérée (resp. de signature (2, 0), resp. (1, 1)) si on a une seule droite isotrope (resp. pas de droite isotrope, resp. deux droites isotropes), i.e. si ce polynôme en λ a une racine double (resp. pas de racine réelle, resp. deux racines réelles distinctes). La discussion porte donc sur le discriminant
∆(λ) = Φ(F1 , F2 )2 − Φ(F1 )Φ(F2 ) Φ(F1 ) = α21 + β12 − γ1 δ1 , Φ(F2 ) = α22 + β22 − γ2 δ2 1 Φ(F1 , F2 ) = α1 α2 + β1 β2 − (γ1 δ2 + γ2 δ1 ) 2 2 1 ∆(λ) = α1 α2 + β1 β2 − (γ1 δ2 + γ2 δ1 ) − α21 + β12 − γ1 δ1 α22 + β22 − γ2 δ2 2 C’est l’expression analytique de l’inégalité (i) de la proposition 11.5 (p. 285)
i
i i
i
i
i
i
i
Solutions des exercices
313
Solution 11.8. 1) Dans C , V ⊥ est une droite vectorielle engendrée par une fonction
circulaire f .
a) Supposons γ(f ) = 0. Remplaçant f par
1 γ(f ) f ,
on se ramène à γ(f ) = 1. Soit − → 2 O le centre pour f (11.12, p. 289), on a f (M) = OM + f (O). Soit F une fonction circulaire. −−−→ − − → → Pour F normale, F (M) = OM2 + 2VO(F ) · OM + F (O), d’où F ∈ V si et seulement si 0 = Φ(f, F ) = − 12 f (O) + F (O) , i.e. F (O) = −f (O). La puissance de O relativement aux cercles de R est la même : −f (O). On dit que O est le centre radical du réseau R. −−−→ − → Pour γ(F ) = 0, F (M) = 2VO (F ) · OM + F (O), d’où F ∈ V si et seulement si 0 = Φ(f, F ) = − 12 F (O). Les droites de R sont donc celles qui passent par O.
b) Si γ(f ) = 0, deux cas sont possibles : • V(f ) = ∆ est une droite. Alors R est formé des cercles centrés sur ∆ (y compris les cercles-points) et des droites orthogonales à ∆. • f = 1, soit V(f ) = {∞}. Alors R est l’ensemble des droites du plan. 2) Trois cas se présentent pour Φ/ V . (1) La signature de Φ/V est (2, 1), i.e. Φ(f ) > 0. • Dans le cas a), V(f ) est un cercle Γ de centre O et R est formé des cercles orthogonaux à Γ et des droites passant par O.
© Dunod. La photocopie non autorisée est un délit.
• Dans le cas b), V(f ) est une droite ∆ et R est formé des cercles centrés sur ∆ et des droites orthogonales à ∆. (2) La signature de Φ/V est (3, 0), i.e. Φ(f ) < 0. Alors aucun cercle généralisé ne correspond à f et le cas b) ne se produit pas. On a un centre radical O avec f (O) = −R2 < 0. Les cercles du réseau R sont les cercles C tels que C(O) = −R2 , c’est-à-dire les cercles qui coupent le cercle de centre O et de rayon R en deux points diamétralement opposés. Tous les faisceaux contenus dans R sont à points de base, donc deux cercles quelconques de R se coupent toujours. (3) ] Φ(f ) = 0, Φ/V est dégénérée. • V(f ) est un cercle-point {O} et R est formé des cercles et droites passant par O. • V(f ) = {∞} et R est l’ensemble des droites du plan (cas b). 3) Les cercles stables par Inv(O, k) forment un réseau de centre radical O qui a même puissance k relativement à chacun de ces cercles.
i
i i
i
i
i
i
i
i
i i
i
i
i
i
i
Chapitre 12
Coniques
Les coniques sont d’abord envisagées dans un cadre purement affine dans la section 12.1 (genre, positions relatives d’une droite et d’une conique), puis dans un cadre métrique dans la section 12.2 avec les deux points de vue foyer-directrice 12.2.3 et bifocal 12.2.4. Insistons sur l’équation donnée dans le théorème 12.17 (p. 328) qui montre un point de vue local englobant toutes les coniques propres. La scène se passe dans un plan affine P de plan vectoriel associé P , muni d’un produit scalaire euclidien dans la section 12.2.
© Dunod. La photocopie non autorisée est un délit.
12.1 CONIQUES DANS UN PLAN AFFINE 12.1.1. Les trois genres de coniques propres Définition 12.1. Une fonction quadratique affine, en abrégé f.q.a., est une
application F : P → R non identiquement nulle de la forme − → − → M → F (M) = Q(OM) + 2L(OM) + F (O)
où O est une origine, Q : P → R une forme quadratique, L : P → R une forme linéaire et F (O) un réel. On notera Φ : P × P → R la forme polaire de Q. Proposition 12.2. L’expression d’une f.q.a. F reste du même type si on change
l’origine O. La forme quadratique Q ne dépend pas de O. La forme linéaire, notée LO , en dépend. La formule de changement d’origine est −→ −→ LO = LO − Φ(O O, −) = LO + Φ(OO , −)
i
i i
i
i
i
i
i
12 • Coniques
316
Démonstration. Soit O une autre origine. On a −→ −→ −→ −→ F (M) = Q(OO + O M) + 2LO (OO + O M) + F (O) −→ −→ −→ −→ −→ −→ = Q(O M) + 2Φ(OO , O M) + 2LO (O M) + Q(OO ) + 2LO (OO ) + F (O) −→ −→ −→ = Q(O M) + 2LO (O M) + F (O ) où LO = LO + Φ(OO , −) → → Expression dans un repère. Soit un repère de P d’origine O et de base B = ( − ı ,− j ). La forme quadratique Q et la forme linéaire L O sont données par leurs matrices dans la base B :
a b MatB (Q) = , MatB (LO ) = e f , F (O) = g b c La f.q.a. F a alors pour expression M(x, y) → F (M) = p(x, y) où p est le polynôme de degré 2 p(X, Y ) = aX 2 + 2bXY + cY 2 + 2eX + 2f Y + g Si on adjoint à l’ensemble des f.q.a. l’application identiquement nulle, on obtient un → → ı ,− j ) définit un isomorphisme entre espace vectoriel Q. La donnée d’un repère (O, − Q et l’espace vectoriel de dimension 6 des polynômes p(X, Y ) de degré inférieur ou égal à 2. Définition 12.3. La conique associée à une f.q.a. F est l’ensemble
V(F ) = {M ∈ P | F (M) = 0} Si P est un plan euclidien et si Q est proportionnelle à la forme quadratique définie positive associée au produit scalaire, on trouve la notion de fonction circulaire (11.12, p. 289). Les cercles sont des coniques particulières. Deux f.q.a. proportionnelles ont même conique associée. La réciproque est fausse : si Q est définie positive, LO nulle et F (O) > 0, on a V(F ) = ∅, alors que ces conditions ne déterminent pas F à proportionnalité près. Voici quelques exemples de cas dégénérés. • V(F ) se réduit à un point si Q est définie positive, L O et F (O) nuls. • si F = f g est produit de deux fonctions affines (9.12, p. 250), V(F ) est réunion des deux droites V(f ) et V(g) (distinctes ou non), • si Q est nulle, V(F ) se réduit à une droite. Définition 12.4. Une f.q.a. F est dite à centre si la forme quadratique Q
associée est non dégénérée.
i
i i
i
i
i
i
i
12.1 Coniques dans un plan affine
317
Proposition 12.5. Soit F une f.q.a. à centre. Il existe un unique point Ω appelé centre de F , tel que LΩ soit nulle. Si V(F ) est non vide, Ω est centre de symétrie pour V(F ).
Démonstration. À la forme quadratique Q de forme polaire Φ correspond une appli→ → v → Φ(− v , −). La non-dégénérescence de Q équivaut à cation linéaire ϕ : P → P ∗ , − → → la bijectivité de ϕ. Étant donné O ∈ P , il existe − v0 , −) = LO v0 ∈ P unique tel que Φ(− → et Ω défini par Ω = O − − v0 est le centre cherché. → → ı ,− j ). Alors V(F ) est Soit un repère d’origine Ω et de base Q-orthogonale B = ( − formé des M(x, y) tels que p(x, y) = 0 où a 0 2 2 p(X, Y ) = aX + cY + p(0, 0) avec MatB (Q) = 0 c Comme p(−X, −Y ) = p(X, Y ), Ω est centre de symétrie pour V(F ).
Définition 12.6. La f.q.a. F est dite elliptique si Q est de signature (0, 2) ou
(2, 0), c’est-à-dire si Q est définie positive ou définie négative. Pour la conique associée, les cas de signature (2, 0) ou (0, 2) ne diffèrent pas car V(−F ) = V(F ). Soit Ω le centre. Supposons F définie positive. Si F (Ω) = p(0, 0) > 0, V(F ) est vide. Si F (Ω) = 0, V(F ) = {Ω}. Y
© Dunod. La photocopie non autorisée est un délit.
Ω
X
Supposons F (Ω) = p(0, 0) < 0. La forme polaire de Q peut être considérée comme produit scalaire euclidien. Munissant P de ce produit scalaire, V(F ) apparaît % comme le cercle de centre Ω et de rayon −F (Ω). Pour la norme euclidienne associée, V(F ) est fermé borné, donc compact. Toutes les normes de P étant équivalentes, V(F ) est compact pour la topologie déduite de n’importe quelle norme. On dit que V(F ) est une ellipse de centre Ω.
−1. Il existe En remplaçant F par − k1 F , on se ramène au cas où F (Ω) = une 1 0 → −j ), donc telle que Mat (Q) = base Q-orthonormale B = (− ı ,→ . Alors B 0 1 x2 + y 2 − 1 = 0 est équation de V(F ) dans le repère d’origine Ω et de base B . C’est l’équation réduite de V(F ). Définition 12.7. La f.q.a. F est dite hyperbolique si Q est hyperbolique, c’est-
à-dire de signature (1, 1).
i
i i
i
i
i
i
i
12 • Coniques
318
Y
. ..
Soit un repère d’origine le centre Ω de F et → → ı ,− j ) formée de vecteurs Q de base B = (− 0 1 . isotropes telle que Mat B (Q) = ........... 1 0 ........ ............. ........................ ...... Si F (Ω) = 0, V(F ), d’équation xy = 0, c .............................. .............. Ω dégénère en la réunion des droites X et Y X ......... ...... → → .... passant par Ω de vecteurs directeurs − ı et − j. ... ... Supposons F (Ω) = k = 0. On se ramène à .. .. .. F (Ω) = −1 en remplaçant F par − k1 F . On .... .. dit que V(F ) est une hyperbole. L’équation → − → − de V(F ) dans le repère (Ω, ı , j ) est xy − 1 = 0, équation réduite1 de l’hyperbole et V(F ) est représentation graphique de la fonction x → x1 . Les droites X et Y sont les asymptotes. L’hyperbole est image de l’application injective continue x R \ {0} −→ P , x −→ M 1 .....
.... ......
x
Les images des intervalles ] − ∞, 0[ et ]0, +∞[ sont les deux composantes connexes de V(F ) et sont les deux branches de l’hyperbole. Ce sont des parties fermées, mais non compactes de P . Définition 12.8. La f.q.a. F est dite parabolique si la forme quadratique Q est de rang 1, c’est-à-dire dégénérée non nulle.
Alors Q est du type Q = κL2 où L est une forme linéaire non nulle et κ√= 0 un réel. Comme V(F ) = V(−F ), on peut supposer κ > 0. Remplaçant L par κL, on se ramène à Q = L2 . Étant donné O ∈ P , la f.q.a. est F = L2 + 2LO + F (O) où L et LO sont deux formes linéaires. La forme polaire de Q = L 2 est
Φ : P × P −→ R → − − → → − − → ( X , Y ) −→ L( X )L( Y ) Lemme 12.9. Si L et LO sont proportionnelles, V(F ) est, ou bien vide, ou bien réunion de deux droites parallèles, distinctes ou confondues.
Démonstration. Il existe α tel que L O = αL et F = L2 + 2αL + F (O). Posons p(X) = X 2 + 2αX + F (O) de discriminant ∆ = α2 − F (O). On a
− → V(F ) = {M | p L(OM) = 0}. Si ∆ < 0, p(X) n’a pas de racine réelle et V(F ) est vide. Si ∆ 0, p(X) a deux racines x , x , distinctes ou non. Alors V(F ) est réunion des − → − → droites D = {M | L(OM) = x } et D = {M | L(OM) = x } parallèles, de direction la droite vectorielle D = Ker L. Si elles sont confondues en une même droite D , on dit que V(F ) est la droite double D . 1. Dans beaucoup d’ouvrages, l’équation réduite d’une hyperbole estx2 − y 2 − 1 = 0, l’origine étant le centre Ω et la base B Q-orthogonale telle que MatB (Q) =
1 0
0 −1
.
i
i i
i
i
i
i
i
12.1 Coniques dans un plan affine
319
Supposons les formes linéaires L et L O indépendantes, i.e. Ker L = Ker LO . La −→ formule de changement d’origine (12.2, p. 315) L O = LO + L(OO )L montre que cette indépendance a lieu pour toute origine de P . On dit alors que V(F ) est une −−→ parabole. On a LO = LO si et seulement si OO ∈ Ker L. La droite vectorielle Ker L s’appelle la direction asymptotique. Voir plus loin la raison de cette terminologie. Proposition 12.10. Toute droite de direction la droite vectorielle Ker L coupe la
parabole V(F ) en un point unique. → Démonstration. Soit − u un vecteur non nul de Ker L. On a
→ → → → F (O + t− u ) = t2 L2 (− u ) + 2tLO (− u ) + F (O) = 2tLO (− u ) + F (O) → − Comme Ker L = Ker L , on a L ( u ) = 0, donc la droite O + Ker L coupe V(F ) en O
O
l’unique point
F (O) → M 0 = O + t0 − u où t0 = − − 2LO (→ u) Comme O est quelconque, toute droite de direction Ker L coupe V(F ) en un unique point. Équation réduite d’une parabole . . Y .. ... .. ... . .... . ... . .. ... ..... ..... .... .. .... ..... . . .. .. ... .... .... ... . . . ... ... .... ... ..... . . ... . . . ..... ... .......... c ..................... ..............
© Dunod. La photocopie non autorisée est un délit.
O
X
→ → Soit un repère (O, − ı ,− j ) où O ∈ V(F ), → − → − ı ∈ Ker LO et j ∈ Ker L tels que → → L(− ı ) = −1 et LO (− j ) = 12 . Pour M(x, y), on a → → → → F (M) = L2 (x− ı + y− j ) + 2L (x− ı + y− j) O
=
−x2
+y
et V(F ) apparaît comme représentation graphique de la fonction x −→ x 2 et y − x2 = 0 est l’équation réduite.
La parabole est image de l’application
x R −→ P , x −→ M 2 x
injective continue. Elle est donc connexe, c’est un fermé non compact de P . Définition 12.11. Un ensemble V(F ) est une conique propre s’il est non vide, non réduit à un point et ne contient pas de droites. Lemme 12.12. Si deux f.q.a. F et F sont telles que V(F ) = V(F ) est une conique
propre, alors F et F sont proportionnelles.
Autrement dit, étant donné un repère, si deux polynômes p et q de degré 2 sont tels que p(x, y) = 0 et q(x, y) = 0 sont équations d’une même conique propre, alors p(X, Y ) et q(X, Y ) sont des polynômes proportionnels.
i
i i
i
i
i
i
i
12 • Coniques
320
Nous admettrons ce lemme, dont la démonstration est « technique ». Lors des discussions de 12.6, 12.7, 12.8, on a partagé l’ensemble des coniques propres en trois genres : (1) Le genre ellipse d’équation réduite x 2 + y 2 − 1 = 0. Une ellipse est connexe, compacte, possède un centre de symétrie. (2) Le genre hyperbole d’équation réduite xy − 1 = 0. Une hyperbole a deux composantes connexes (les branches) non compactes, deux asymptotes, possède un centre de symétrie. (3) le genre parabole d’équation réduite y − x 2 = 0. Une parabole est connexe, non compacte, a une direction asymptotique, n’a pas de centre de symétrie. Théorème 12.13. Le groupe affine du plan opère naturellement sur l’ensemble des coniques propres. Cette action détermine trois orbites qui sont les trois genres ellipse, parabole, hyperbole. → → Démonstration. a) Soit f : P → P bijective affine, R = (O, − ı ,− j ) un repère, → − → − → − → − O = f (O), f ( ı ) = ı , f ( j ) = j , M(x, y) un point et M = f (M). 1
1
1
1
− → −−→ → → → → → → ı + y− j ) = xf (− ı ) + yf (− j ) = x− ı1 + y − j1 O1 M1 = f (OM) = f (x− − → → − Donc M1 a mêmes coordonnées x, y dans le repère R 1 = (O1 , ı1 , j1 ) que M dans le → → ı ,− j ). repère R = (O, −
b) Soit C une conique propre d’équation réduite p(x, y) = 0 dans le repère → → → → R = (O, − ı ,− j ), f une bijection affine, R1 = f (R) = (O1 , − ı1 , − j1 ) le repère image. Pour tout M(x, y) ∈ C , p(x, y) = 0. Par a), f (M) = M1 est sur la conique C1 d’équation p(x, y) = 0 dans le repère R 1 . Donc f (C) ⊂ C1 . Par le même raisonnement appliqué à C 1 et f −1 , on a f −1 (C1 ) ⊂ C , d’où f (C) = C1 . Ces coniques sont de même genre car de même équation réduite. → → c) Inversement, soit C et C1 deux coniques de même genre, R = (O, − ı ,− j ) et − → → − R = (O , ı , j ) deux repères tels que C ait même équation réduite p(x, y) = 0 1
1
1
1
dans R que C1 dans R1 . Il existe une unique bijection affine f telle que f (O) = O 1 , → → → → f (− ı)=− ı1 , f (− j)=− j1 . Alors, par b), f (C) = C1 . Le groupe affine opère donc transitivement sur chacun des genres.
12.1.2. Positions relatives d’une conique et d’une droite On désigne par F une f.q.a. telle que V(F ) = C soit une conique propre. Soit O un − → − → point de C . Comme F (O) = 0, F est de la forme M → F (M) = Q( OM) + 2LO (OM). → − → → Faisons pivoter autour de O la droite D − u = O + R u . Les points de C ∩ D− u sont donnés par l’équation en λ → → → → → u ) + 2λLO (− u ) = λ λQ(− u ) + 2LO (− u) 0 = F (O + λ− u ) = λ2 Q(−
i
i i
i
i
i
i
i
12.1 Coniques dans un plan affine
. .. Y ... .. .. .... . . ... ... ... .. D− → . . . . u ... ... ... ... ... . . . . @ .. @ ... .... .... @ ..... . . . .. .. ... .... @ ... ..... . . . . ..@ .... .... .......@ ................ ............c.............
@ O@
TO
321 → La solution λ = 0 correspond à O ∈ C ∩ D − u. → est tangente si 0 est racine On dit que D− u double, sécante si 0 est racine simple. La tangente en O est donc la droite T O = O + Ker LO , de direction Ker LO .
→ u ∈ Ker LO non nul, Remarquons que pour − → − Q( u ) = 0 sinon C contiendrait la droite O + Ker LO et serait donc impropre. Dans ces conditions, O est l’unique point de C ∩ T O .
→ → En général, une sécante D− u coupe C en deux points distincts, sauf si D − u est la droite Y passant par O
• parallèle à une asymptote si C est une hyperbole, • de direction asymptotique si C est une parabole (12.10, p. 319),
→ u ) = 0, le polynôme en λ est de degré 1 et O est alors unique point car alors Q(− → commun de C et D− u. Proposition 12.14. Dans ces conditions, la symétrie oblique parallèlement à la tan-
gente TO autour de la droite passant par O et Q-orthogonale à T O laisse C stable. Cet axe Y de symétrie oblique s’appelle le diamètre passant par O.
• Si C est une ellipse ou hyperbole de centre Ω, c’est la droite (OΩ),
© Dunod. La photocopie non autorisée est un délit.
• Si C est une parabole de direction asymptotique Y , c’est la droite O + Y .
→ → Démonstration. Soit un repère (O, − τ ,− ν) → − → − où τ ∈ Ker LO et ν lui est Q-orthogonal. → → τ ) = 0 et D− Comme C est propre, Q(− τ = TO est la tangente en O à C . L’équation de C est M 2 2 ax + cy + 2ey = 0. La symétrie oblique est l’application M(x, y) → M (−x, y) qui laisse C stable. On a a = 0 sinon C est union de deux droites → T τ. de même direction R − O O 2 e e2 2 Si c = 0, l’équation s’écrit ax + c y + c − c = 0 et C est à centre Ω(0, − ec ). Le diamètre passant par O est bien (OΩ). Si c = 0, l’équation est ax2 +2ey = 0 et C est une parabole de direction asymptotique → ν. de vecteur directeur − .. .. Y .. ... ... .. . ... . .. .. ... .. ... . .... . ...c c.... .... M ... . . . .. .. .. .... ... .... . .. . . ... .... .... ... ...... ... . . . . ..... .. ......... ..................... ........c........
Représentation paramétrique. Dans ces conditions, on a aussi e = 0. En effet, si e = 0, l’équation est ax2 + cy 2 = 0 et C est impropre car C se réduit à {O} si a et c ont même signe, se réduit à une droite double si c = 0, se compose de deux droites si a et c ont des signes contraires.
i
i i
i
i
i
i
i
12 • Coniques
322
La droite Dt d’équation y = tx coupe C en O et en le point 2et2 2et Mt x(t) = − , y(t) = − a + ct2 a + ct2 C’est une représentation paramétrique de C . Si t = 0, D0 est tangente en O au sens des courbes paramétrées car x (0) = − 2e a et y (0) = 0. La notion de tangente à une conique entre dans le cadre de la notion générale de tangente. Si t est tel que a + ct2 = 0, le point Mt n’existe plus. C’est la cas si C est une parabole ou une hyperbole et Dt parallèle à une direction asymptotique.
. Y = D∞ ..... ... ... .... . . .... .. ... ... . Dt ..... . . ... ... ... .... . @ . . @ ... .. . .... Mt@c...... .... . . . ... .... @ ... .... ..... ....@ . . . . . ..... ....... .......@ .............c.......................
@ O@
La droite D∞ d’équation x = 0 est le diamètre.
D0 = TO
Proposition 12.15. Le complémentaire de C dans P se partage en :
(1) l’extérieur, ensemble des P par où passent deux tangentes distinctes, (2) l’intérieur, ensemble des P tels que toute droite passant par P soit sécante.
→ → Démonstration. Soit − u non nul et D− u la droite passant par P de vecteur directeur → − → − → est sur C si et seulement si u . Un point P + λ u de D− u → → → 0 = F (P + λ− u ) = λ2 Q(− u ) + 2λL (− u ) + F (P) P
→ → → La discussion porte sur le signe du discriminant ∆ P (− u ) = L2P (− u ) − Q(− u )F (P). → − C’est une forme quadratique en u . Discutons en la signature. → → → u ) = L2 (− u ) − L2 (− u )F (P). C’est une • Cas d’une parabole. On a Q = L2 et ∆ (− P
P
décomposition en somme de carrés dont le premier terme est positif et le deuxième du signe de F (P). – Si F (P) < 0, alors ∆P est définie positive, toute droite passant par P est sécante. Alors P est intérieur à C . – Si F (P) > 0, la signature est (1, 1), les deux directions isotropes pour ∆ P sont les directions des tangentes issues de P, point extérieur à C . − → • Cas d’une conique à centre Ω. On a F (M) = Q( ΩM) + F (Ω). La formule de − → changement d’origine (12.2, p. 315) donne L P = Φ(ΩP, −). La forme polaire de la forme quadratique ∆ P est − → → − → → → → → → δP : (− u,− v ) → Φ(ΩP, − u )Φ(ΩP, − v ) − Φ(− u,− v )F (P) → → → − → → dans Ker L , i.e. Q-orthogonal à − Prenons − u =− u v = ΩP. On a ΩP et − P P → − → − − → → →, − → − → − δP (− u P ΩP) = Φ(ΩP, uP )Q(ΩP) − Φ(uP , ΩP)F (P) = 0
i
i i
i
i
i
i
i
12.1 Coniques dans un plan affine
323
→ →, − car les deux termes sont nuls. La base ( − u P ΩP) est ∆P -orthogonale. Calculons la − → signature. Comme F (P) = Q(ΩP) + F (Ω), on a → → − → − → →) = −Q(− →)F (P) , ∆ (− 2 − ∆P (− u u P P P ΩP) = Q (ΩP) − Q(ΩP)F (P) = −Q(ΩP)F (Ω) – Cas d’une ellipse. Alors Q est définie positive et F (Ω) < 0. La signature est (1, 1) si et seulement si F (P) et F (Ω) sont de signes contraires. Le centre Ω est intérieur et P est extérieur si et seulement si F (P) > 0. → →) et Q(− – Cas d’une hyperbole. La signature de Q étant (1, 1), Q( − u ΩP) sont de P signes contraires. La signature de ∆ P est (1, 1) si et seulement si F (P) a le signe de F (Ω). Le centre Ω est extérieur à C et P est extérieur si et seulement si F (P) a le signe de F (Ω). Pour une hyperbole, l’énoncé n’est pas tout à fait exact car Ω est à l’extérieur, mais il ne passe aucune tangente par le centre. Les droites ∆ Ω -isotropes passant par Ω sont les asymptotes ce qui amène à les considérer comme des tangentes particulières, les points de contact étant « à l’infini ». La géométrie projective est le cadre propre pour une justification rigoureuse de ceci.
Exercice 12.1. Soit F une f.q.a. telle que V(F ) = ∅ et O ∈ V(F ). Montrer que V(F )
est une conique propre si et seulement si Ker L O est une droite vectorielle non isotrope pour Q
© Dunod. La photocopie non autorisée est un délit.
Exercice 12.2. Soit C une conique propre, P un point extérieur, D le diamètre passant par P, ∆ la parallèle passant par P aux tangentes en les points où D coupe C , T 1 , T2 les tangentes à C issues de P en les points M 1 et M2 .
Montrer que les droites ∆, D, T 1 , T2 forment un faisceau harmonique et que (M 1 M2 ) est parallèle à ∆. Exercice 12.3. polarité
Soit C = V(F ) une conique propre.
− → → / C . Une sécante D− 1) Soit P ∈ u passant par P de vecteur directeur u coupe C en Soit Q conjugué harmonique de P relativement à M , M . − → Montrer que LP (PQ) + F (P) = 0.
M , M .
→ Montrer que le lieu géométrique de Q si D − u pivote autour de P est porté par une droite ∆P appelée polaire de P relativement à C . Montrer que ∆ P est Q-orthogonale au diamètre passant par P.
Le lieu de Q est-il la polaire ∆ P dans son entier ?
i
i i
i
i
i
i
i
12 • Coniques
324
2) On dit que P et Q sont conjugués relativement à C si Q ∈ ∆ P . Montrer que c’est une relation symétrique. 3) Peut-on étendre la définition de la polaire aux points de C ?
Rappels sur la théorie des enveloppes Le plan P étant rapporté à un repère → → (O, − ı ,− j ) on donne une application d’un intervalle I ⊂ R dans l’ensemble des droites t → Dt où Dt est d’équation u(t)x + v(t)y + w(t) = 0. On suppose les fonctions u : t → u(t), v : t → v(t), w : t → w(t) de classe C1 , les dérivées u et v ne s’annulant pas simultanément. Supposons que D t soit tangente à une courbe C . Le point caractéristique M(t), point de contact de D t et C , est l’intersection des droites Dt et Dt (supposée distinctes) d’équation u (t)x + v (t)y + w (t) = 0.
Exercice 12.4. Dans ces conditions, on suppose que u(t), v(t), w(t) sont des polynômes de degré 2 en t :
u(t) = u2 t2 + 2u1 t + u0 , v(t) = v2 t2 + 2v1 t + v0 , w(t) = w2 t2 + 2w1 t + w0 1) Combien de droites du type D t passant par un point donné M(x, y) ? 2) En déduire qu’en général l’enveloppe des droites D t est la conique d’équation
(u1 x + v1 y + w1 )2 − (u2 x + v2 y + w2 )(u0 x + v0 y + w0 ) = 0 Exercice 12.5. Soit deux droites X et Y sécantes en O parcourues par deux points
mobiles P(t) et Q(t) animés de mouvements uniformes.
1) On
suppose que P et Q ne sont pas en O au même instant. Montrer que la droite Dt = P(t)Q(t) enveloppe une parabole tangente à X et Y en des points A et B à préciser. 2) Que se passe-t-il si P et Q sont tous deux en O au même instant t 0 ? Exercice 12.6. Soit A et B deux droites distinctes parallèles de direction D , A ∈ A,
→ − → B ∈ B, − v = 0 sur D . Des points P et Q décrivent les droites A et B de sorte que le produit AP × BQ = p reste constant. Que dire de l’enveloppe de la droite (PQ) ?
i
i i
i
i
i
i
i
12.2 Coniques dans un plan affine euclidien
325
12.2 CONIQUES DANS UN PLAN AFFINE EUCLIDIEN On suppose le plan vectoriel P muni d’un produit scalaire.
12.2.1. Axes d’une conique à centre Soit C = V(F ) une conique à centre Ω et Q la forme quadratique associée. → → Si Q est proportionnelle à la forme quadratique euclidienne − v → − v 2 , alors C est un cercle. Dans le cas contraire, il existe deux directions uniques orthogonales à la fois pour la forme quadratique euclidienne et pour Q. Munissons ces directions de vecteurs → → → → ı ,− j ) à la fois orthonormale et Q-orthogonale. Dans ı ,− j , on a une base (− unitaires − → − → − le repère orthonormé (Ω, ı , j ), l’équation de C est du type U x2 + V y 2 + W = 0 où U, V, W sont non nuls car C est propre. Y B
A
Ω
A
X
B
© Dunod. La photocopie non autorisée est un délit.
(1) On suppose Q définie positive, donc C est une ellipse. Alors U et V sont positifs et → → W négatif. En échangeant éventuellement − ı et − j , on peut supposer 0 < U < V . → − La droite X = Ω + R ı coupe C en les sommets A, A . L’équation devient
x2 y 2 + 2 −1=0 a2 b où a = − W −W U = ΩA = −ΩA , b = V . Comme C n’est pas un cercle, puisque b < a, les seuls axes de symétrie sont : → ı coupant C en A(a, 0) et A (−a, 0), • l’axe focal X = Ω + R− → j coupant C en B(b, 0) et B (−b, 0). • l’axe non focal Y = Ω + R− (2) On suppose Q de signature (1, 1), donc U, V de signes contraires, C est une → → ı et − j , on peut supposer U et W hyperbole. En échangeant éventuellement − → − de signes contraires, et donc que X = Ω + R ı coupe C en deux points : les sommets A, A . L’équation devient 1 1 W x2 y 2 W = ΩA = −ΩA , b = − 2 −1=0 où a= − a2 b U V
i
i i
i
i
i
i
i
12 • Coniques
326
Les seuls axes de symétrie sont : → ı coupant C • l’axe focal X = Ω + R− en A(a, 0) et A (−a, 0) → • l’axe non focal Y = Ω + R− j ne coupant pas C .
Y Q....... ....... Q .Q ...... ..... ..... Q ..
.. ....... . ..... . . . . .. ....
...Q .... ... ... Q ...... ... Q . .. QQc ...c.. ..c .. . ... . ...A Ω A..... ... Q ... . Q ......... .... . . . Q ........ .... Q........ ..... . . . . . Q ... ....... .. .. Q
X Ces processus ne sont pas ambigus. Les longueurs a, b sont donc intrinsèquement associées à C . Les équations obtenues sont les équations métriques réduites de C . Q À la différence de ce qui se passe pour le Q groupe affine (12.13, p. 320), l’opération du groupe des isométries détermine une infinité d’orbites, chacune d’elles correspondant à une équation métrique réduite.
12.2.2. Axe d’une parabole Soit C une parabole d’équation réduite (affine) y − x2 = 0. La dérivée x → 2x de x → x2 est une bijection R → R, donc pour toute direction T distincte de la direction asymptotique, il existe un unique point M ∈ C tel que la tangente en M ait la direction T . On appelle sommet de C l’unique point S ∈ C où la tangente est orthogonale à la direction asymptotique. L’unique axe de symétrie est la droite passant par le sommet parallèle à la direction asymptotique appelée axe de la parabole C . → → → → Soit un repère orthonormé (S, − ı ,− j ) où − ı ,− j sont unitaires et vecteurs directeurs
................ ................. ................. . . . . . . . . . . . . . . . .............. TS .............. ............ . . . . . . . . . . . ......... .......... ......... . . . . . . . ... ...... ..... ...... S ......c .... ..... ...... ....... ........ .......... ........... ............ ............ .............. ............... ............... ................. .................. ...................
de la direction asymptotique et de la tangente au sommet T S . L’équation de C est de → → ı , on peut supposer ı par −− la forme y 2 − 2px = 0. En remplaçant éventuellement − p > 0. On a alors l’équation métrique réduite de la parabole. Ici encore, l’action du groupe des isométries détermine sur l’ensemble des paraboles une infinité d’orbites, chacune d’elles correspondant à une valeur du paramètre p.
12.2.3. Définition par foyers et directrices Quels exemples connaît-on de f.q.a. ayant une description géométrique ? Étant donné un point O, la fonction M → OM 2 est une f.q.a. Une combinaison linéaires de telles f.q.a. est une fonction de Leibnitz (9.19, p. 255), donc une fonction circulaire (11.12, p. 289). Les coniques ainsi obtenues sont des droites ou des cercles. Il faut donc considérer d’autres f.q.a.
i
i i
i
i
i
i
i
12.2 Coniques dans un plan affine euclidien
327
Étant donné une droite D , la fonction associant à M le carré de sa distance à D est une f.q.a. (9.15, p. 252). En combinant des f.q.a. de ces deux types, on peut espérer obtenir n’importe quelle f.q.a., donc n’importe quelle conique. Essayons la plus simple de ces combinaisons. Définition 12.16. Soit e un réel strictement positif, F un point, D une droite
ne passant pas par F. La fonction F : M → MF 2 − e2 MH2 , où H est la projection orthogonale de M sur D , est une f.q.a. On dit que la conique associée MF = e} V(F ) = {M | MF2 − e2 MH2 = 0} = {M | MH est de foyer F, de directrice D et d’excentricité e. Plusieurs questions se posent : • la conique V(F ) est-elle propre ? • si oui, quel est son genre ? • toute conique propre est-elle de ce type ? Équation d’une conique donnée par foyer et directrice. Soit K la projection orthogonale de F sur D et A ∈ [K, F] tel que AF = −e. AK
D
© Dunod. La photocopie non autorisée est un délit.
H
K
Y a
a
A
......a ............ ........... M . . . . . . . . . ......... .......... ......... . . . . . . . . . . . . . . . ....... ..... ...... . . . . . . . . .... .... .... . . . . . .. ... .... ... .. a ..a
F
X
→ → → Soit un repère orthonormé (A, − ı ,− j ) où − ı est unitaire, colinéaire de même sens − → → que AF et X = A + R− ı est la droite passant par le foyer F orthogonale à la directrice D . Posant KA = k > 0, on a AF = ek. Pour M(x, y), de projection H sur D , on a MF2 − e2 MH2 = (x − ek)2 + y 2 − e2 (x + k)2 = (1 − e2 )x2 + y 2 − 2ek(1 + e)x Posons p = ek(1 + e). L’équation devient (1 − e2 )x2 + y 2 − 2px = 0 où p > 0 est une longueur et e > 0 un nombre pur.
i
i i
i
i
i
i
i
12 • Coniques
328
→ → Inversement, étant donné un repère orthonormé (A, − ı ,− j ), une longueur p > 0, un nombre pur e 0, soit Ce,p la conique d’équation (1 − e2 )x2 + y 2 − 2px = 0 Deux cas se présentent : p , 0), de directrice 1) Si e > 0, Ce,p est la conique d’excentricité e, de foyer F( e+1 p p D d’équation x = − e(e+1) . En effet, posant k = e(e+1) , soit la droite D d’équation x = −k et le point F(ek, 0). Le calcul précédent montre que C e,p est l’ensemble des M dont le rapport des distances à F et D est e. p , 0) et de rayon p. En effet, l’équation 2) Si e = 0, C0,p est le cercle de centre F( e+1 2 2 devient x + y − 2px = 0. La longueur k n’existe pas et D non plus, mais F(p, 0) est le centre et p est le rayon.
→ → Théorème 12.17. Étant donné un repère orthonormé (A, − ı ,− j ), une longueur p > 0 et un nombre pur e 0, soit Ce,p la conique d’équation
(1 − e2 )x2 + y 2 − 2px = 0 La conique Ce,p est propre, hyperbole si e > 1, parabole si e = 1, ellipse si 0 e < 1. → Pour e > 0, Ce,p admet A pour sommet et X = A + R − ı pour axe focal. → Pour e = 0, C0,p est un cercle de rayon p tangent en A à Y = A + R − j. Pour toute conique propre C , il existe un unique couple (e, p) tel que C soit isométrique à Ce,p .
Démonstration. Pour e = 1, C1,p est la parabole d’équation y 2 −2px = 0, de sommet A, d’axe X , de paramètre p. Toute parabole est bien isométrique à une unique parabole C1,p (12.2.2., p. 326). Pour e = 1, Ce,p est une conique à centre. L’équation s’écrit y2 p2 p 2 + − =0 x− 1 − e2 1 − e2 (1 − e2 )2 y12 p2 p − où x1 = x − , y1 = y x21 + 2 2 2 1−e (1 − e ) 1 − e2 x21 (1 − e2 )2 y12 (1 − e2 ) − −1 = 0 p2 p2 → → Le centre est donc Ω de coordonnées ( p , 0) dans le repère initial (A, − ı ,− j ). 1−e2
• Pour 0 e < 1, c’est l’équation réduite métrique d’une ellipse. Les longueurs a, b relatives à l’équation métrique réduite sont p p a= , b= √ , ba 2 1−e 1 − e2 Pour 0 < e < 1, on a b < a et l’axe focal est X .
i
i i
i
i
i
i
i
12.2 Coniques dans un plan affine euclidien
329
Inversement, la donnée de (a, b) permet de déterminer (e, p), donc toute ellipse est isométrique à une unique conique C e,p où 0 e < 1 : 1 b2 b2 e = 1− 2 , p= a a • Pour e > 1, c’est l’équation réduite métrique d’une hyperbole d’axe focal X . Les longueurs a, b relatives à l’équation métrique réduite sont p p , b= √ a= 2 e −1 e2 − 1 Inversement, la donnée de (a, b) permet de déterminer (e, p), donc toute hyperbole est isométrique à une unique conique C e,p où e > 1 : 1 b2 b2 e = 1+ 2 , p= a a p Dans les deux cas e < 1 et e > 1, le centre est donné par AΩ = 1−e 2 , à droite ou à gauche de A selon que C est ellipse ou hyperbole. Il résulte de ce qui précède que l’orbite d’une conique propre C pour l’action du groupe des isométries est déterminée par le couple (e, p).
© Dunod. La photocopie non autorisée est un délit.
Le paramètre p > 0 est une longueur, l’excentricité e 0 est un nombre pur. La → ı vient de ce que le ou les terminologie axe focal pour l’axe de symétrie X = A + R − foyers sont sur X .
Remarque : Dans l’étude des coniques propres, nous avons rencontré deux cas exceptionnels : les paraboles qui n’ont pas de centre, les cercles qui n’ont pas de directrice. En revanche, l’équation du théorème précédent est valable dans tous les cas et le couple (p, e) détermine une conique propre à isométrie près. C’est l’intérêt de cette équation. Supposons p donné et faisons varier e conti... ..... .............................. .. . . . . . . . . nûment de 0 à l’infini, Ce,p étant représentée . . ........ .......... ............... → → ................................................. . . TS . . . . . . ı ,− j ), par exemple dans le repère fixe (A, − ...... ....... ........... .................................... . . . . sur un écran d’ordinateur. Que l’observateur . . . . . . . . . . . . . .. .. ... ................. placé en l’origine ne s’attende pas à constater ................ ..... ..... dans la forme de Ce,p un changement brutal ..... .c . . quand e franchit la valeur 1. . S ... .... ....... Pour e = 1, le centre Ω est donné par ........ .............. p ................. AΩ = 1−e 2 . Si e croît de 0 à 1, le centre Ω .................. .................. ........................ s’éloigne à droite vers l’infini, n’existe plus ...... ....... ............ ...... ........ ............ ....... ......... ............. pour e = 1, reparaît à gauche et se rapproche ........ .......... . . . ......... .......... ................... ......... ........... de A si e tend vers +∞. Pour e très proche ...... ......... de 1, l’observateur ne pourra pas constater le genre de Ce,p sur son écran, le centre étant hors de l’écran tellement éloigné à gauche ou à droite qu’on ne verra pas de différence entre ellipse, parabole et hyperbole.
i
i i
i
i
i
i
i
12 • Coniques
330
12.2.4. Définition bifocale des coniques à centre Les deux couples foyer-directrice. Soit C une conique de paramètre p et d’excentricité e distincte de 0 et 1 : C est une conique à centre qui n’est pas un cercle. On → → ı ,− j ) tel que l’équation de C soit rapporte le plan à un repère orthonormé (A, −
(1 − e2 )x2 + y 2 − 2px = 0 Par les calculs de la preuve du théorème 12.17 (p. 328), le foyer F, la directrice D et le centre Ω sont donnés par (axe focal X orienté de A vers F) p p p , équation de D : x = − AΩ = , AF = 1 − e2 1+e e(e + 1) La symétrie autour du centre Ω transforme A, F, D en A , F , D , d’où un deuxième couple foyer-directrice F , D . Il n’en existe pas d’autre car C n’a que deux sommets A, A et les valeurs de l’excentricité e et du paramètre p déterminent le foyer et la directrice à partir du sommet A ou A choisi. Théorème 12.18. Soit C une conique de centre Ω, de foyers F, F , de sommets A, A ,
a = ΩA = ΩA . Alors C est l’ensemble des M tels que 1) MF + MF = 2a si C est une ellipse, 2) MF − MF = ±2a si C est une hyperbole.
Démonstration. a) Soit D et D les directrices relatives à F et F coupant l’axe focal X , orienté de A vers F, en K et K . Par les formules précédentes p p p ΩA − = = e(e + 1) 1 − e2 e(e2 − 1) e p p pe − = eΩA ΩF = AF − AΩ = − = 2 e + 1 1 − e2 e −1 Orientons maintenant l’axe focal X de Ω vers A. Alors a ΩA = a = −ΩA , ΩK = = −ΩK , ΩF = ea = −ΩF e ΩK = AK − AΩ = −
D
D
M M
H
H
Cas de l’ellipse : K
A
F
N
Ω
F
A K
X
i
i i
i
i
i
i
i
12.2 Coniques dans un plan affine euclidien
331
D
M
D
H
M
H
Cas de l’hyperbole : F A
K
Ω
K A F
N
b) Soit M un point, H et H ses projections orthogonales sur D et D . On a 2a = K K = H H = MH − MH e Deux cas se présentent : (1) M est entre H et H, c’est-à-dire intérieur à la bande du plan P limitée par D et D . Alors MH + MH = H H = 2a e . (2) M est extérieur au segment [H , H], c’est-à-dire extérieur à la bande du plan P limitée par D et D . Alors MH − MH = ±H H = ± 2a e .
© Dunod. La photocopie non autorisée est un délit.
→ → c) Soit M ∈ C . On a MF = eMH et MF = eMH . Soit le repère orthonormé (Ω, − ı ,− j ) où → − X = Ω + R ı est l’axe focal. (1) 0 < e < 1, C est une ellipse d’équation x2 y 2 + 2 −1=0 a2 b
2 Pour M(x, y) sur C , x2 a2 < ae , donc |x| a < bande limitée par D et D . On a donc
a e,
et M est intérieur à la
a e
et M est extérieur à la
MF + MF = e(MH + MH ) = 2a (2) 1 < e, C est une hyperbole d’équation
x2 y 2 − 2 −1=0 a2 b
2 Pour M(x, y) sur C , x2 a2 > ae , donc |x| a > bande limitée par D et D . On a donc MF − MF = e(MH − MH ) = ±2a
i
i i
i
i
i
i
i
12 • Coniques
332
d) Reste la réciproque : si C est une ellipse (resp. une hyperbole) et si MF + MF = 2a (resp. MF − MF = ±2a), a-t-on M ∈ C ? Soit M un point quelconque, N sa projection orthogonale sur X . On a MF2 − MF2 = (MF − MF )(MF + MF ) → −→ − → −→ − = (MF − MF ) · (MF + MF ) = 2F F · NΩ = 4eaNΩ (1) C est une ellipse. Supposons MF + MF = 2a. Alors 2a(MF − MF ) = 4eaNΩ, donc 2eΩN = |MF − MF | FF = 2ea, d’où ΩN a, donc N ∈ [A , A] est intérieur à C . La perpendiculaire M en N à X coupe C en deux points symétriques autour de X . Soit M1 celui de ces points situé sur la demi-droite limitée par N sur M contenant M et montrons que M = M1 . On a :
% NM2 + NF2 , MF = NM2 + NF2 , MF + MF = 2a M1 F = NM21 + NF2 , M1 F = NM21 + NF2 , M1 F + M1 F = 2a
MF =
%
% % L’application y → y 2 + NF2 + y 2 + NF2 est strictement croissante, donc injective. On en déduit NM = NM1 , d’où M = M1 appartient à C . (2) C est une hyperbole. Supposons MF − MF = ±2a. Alors ±2a(MF + MF ) = 4eaNΩ, / [A , A] est intérieur donc 2eΩN = MF + MF FF = 2ea, d’où ΩN a, donc N ∈ à C . La perpendiculaire M en N à X coupe C en deux points symétriques autour de X . Soit M1 celui de ces points situé sur la demi-droite limitée par N sur M contenant M et montrons que M = M 1 . On a :
% NM2 + NF2 , MF = NM2 + NF2 , MF − MF = 2εa 2 2 M1 F = NM1 + NF , M1 F = NM21 + NF2 , M1 F − M1 F = 2εa
MF =
%
ε = ±1 ne dépendant que de la place de la projection orthogonale N de M et M 1 sur X . L’application y →
%
y 2 + NF2 −
%
y 2 + NF2 = %
NF2 − NF2 % y 2 + NF2 + y 2 + NF2
est strictement monotone (dénominateur croissant), donc injective. On en déduit NM = NM1 , d’où M = M1 appartient à C .
i
i i
i
i
i
i
i
12.2 Coniques dans un plan affine euclidien
333
Théorème 12.19. Soit C une conique de centre Ω et de foyers F, F .
(i) La tangente TM en un point M de C est −→ − → • bissectrice extérieure de (MF, MF ) si C est une ellipse, −→ − → • bissectrice intérieure de (MF, MF ) si C est une hyperbole.
(ii) Le symétrique de F relativement à T M décrit le cercle F de centre F et de rayon 2a appelé cercle directeur de C relatif à F . (iii) Les projections orthogonales H et H de F et F sur TM décrivent le cercle Ω de centre Ω et de rayon a appelé cercle principal de C .
Démonstration. (i) Commençons par le lemme suivant : → −
Lemme 12.20. Soit une fonction vectorielle t → V (t) non nulle, dérivable, de
→ − → − d V (t) dt . Alors la fonction numérique t → V (t) est dérivable de dérivée → − → → − → − d V (t) − dt · U (t) où U (t) est le vecteur unitaire colinéaire à V (t) et de même
dérivée t → égale à sens.
© Dunod. La photocopie non autorisée est un délit.
→ − → − → − → − Soit f (t) = V (t) et g(t) = f 2 (t) = V (t)2 = V (t) · V (t). On a → − → − dg(t) d V (t) dt = 2 V (t) · dt , d’où l’on déduit le lemme : → − → − → − → dg(t) 1 V (t) d V (t) − d V (t) df (t) · = % = − = U (t) · → dt dt dt 2 g(t) dt V (t) − −− → → Soit une représentation paramétrique (p. 321) t → M(t). Alors − τ (t) = dFM(t) dt est un −− −→ − −− → − → −− − → − − − → → − d F M(t) d FM(t) → − vecteur tangent. On a F M(t) = F F + FM(t), d’où dt = dt = τ (t). Soit U (t) − → −−−→ −−−→ et U (t) les vecteurs unitaires colinéaires de même sens à FM(t) et F M(t) (attention, − → → − U (t) n’est pas la dérivée de U (t) !). Le lemme énonce que les fonctions numériques − → → − → → t → FM(t) et t → F M(t) sont dérivables de dérivées − τ (t) · U (t) et − τ (t) · U (t). une ellipse, on on obtient (1) Si C est a FM(t) + F M(t) = 2a. En dérivant, → − → − → − → − − → → − τ (t) · U (t) + U (t) = 0. D’où τ (t) est orthogonal à U (t) + U (t), −−−→ −−−→ → vecteur directeur de la bissectrice intérieure de ( FM(t), F M(t)). Donc − τ (t) est vecteur directeur de la bissectrice extérieure de cet angle.
on a FM(t) − F M(t) = ±2a. En dérivant2 on obtient (2) Si C est une hyperbole, − → − → → − → − − → → τ (t) · U (t) − U (t) = 0. D’où − τ (t) est orthogonal à U (t) − U (t), vec−−−→ −−−→ → teur directeur de la bissectrice extérieure ( FM(t), F M(t)). Donc − τ (t) est vecteur directeur de la bissectrice intérieure de cet angle. 2. L’ensemble de définition de cette fonction est union d’intervalles ouverts sur lesquels elle est constante : soit 2a, soit −2a, d’où la dérivabilité sur l’ensemble de définition.
i
i i
i
i
i
i
i
12 • Coniques
334
Y P
TM M
H
Cas de l’ellipse : Ω
F
F
X
Y M P H
Cas de l’hyperbole : Ω
F
F
X
TM
−−−→ −−−→ (ii) La tangente TM est donc bissectrice extérieure ou intérieure de ( FM(t), F M(t)) selon que C est ellipse ou hyperbole. La réflexion autour de T M transforme F en P ∈ (F M). (1) Si C est une ellipse, P est sur la demi-droite d’origine M ne contenant pas F , donc M est entre F et P. On a 2a = FM + F M = PM + F M = PF . (2) Si C est une hyperbole, P est sur la demi-droite d’origine M contenant F , donc M n’est pas entre F et P. On a 2a = |FM − F M| = |PM − F M| = PF . Dans les deux cas, P est sur le cercle directeur F de centre F et de rayon 2a. On a ainsi une application M → P de C vers Γ. Inversement, soit P ∈ F . En général, la médiatrice de (F, P) coupe (F P) en M, unique point, ce qui prouve l’injectivité de l’application C → F . Ces droites sont parallèles si (FP) et (F P) sont orthogonales, i.e. si (FP) est tangente en P à F . (1) Si C est une ellipse, FF < FM + F M = 2a, donc F est intérieur à F et ce cas ne se produit pas. L’application M → P est bijective de C sur F .
i
i i
i
i
i
i
i
12.2 Coniques dans un plan affine euclidien
335
(2) Si C est une hyperbole, F est extérieur à F . Il existe deux positions P 1 et P2 ne correspondant à aucun point de C . On démontre que les médiatrices A 1 et A2 sont les asymptotes de C .
(iii) Ce point se déduit de (ii) au moyen de l’homothétie de centre F et de rapport 1 2 qui transforme P en H et le cercle directeur F en le cercle principal Ω. L’assertion relative à la projection orthogonale H de F sur TM vient de ce que les deux foyers jouent le même rôle. Remarque : Dans cette section, l’excentricité a été supposée distincte de 0 et 1. Cependant, les cercles (excentricité 0) entrent dans ce cadre : les foyers sont confondus avec le centre et C coïncide avec son cercle principal. En revanche, le cas des paraboles échappe à ce point de vue.
12.2.5. Propriétés spéciales à la parabole Proposition 12.21. Soit une parabole C de foyer F, de directrice D et de sommet S.
© Dunod. La photocopie non autorisée est un délit.
Pour M ∈ C , soit H la projection orthogonale de M sur D et I le milieu de (F, H). (i) La tangente TM est la médiatrice de (H, F). (ii) Le symétrique de F relativement à T M décrit D si M décrit C . (iii) La projection orthogonale I de F sur T M décrit la tangente au sommet T S si M décrit C
Démonstration. Cette proposition est l’homologue du théorème 12.19 (p. 333). La droite passant par M et orthogonale à D joue le rôle de (MF ). La directrice D joue le rôle du cercle directeur de centre F . La tangente au sommet joue le rôle du cercle principal. (i) Soit une représentation paramétrique T T t → M(t) de C . Dans cette figure, les points D S M → − → M, H, I dépendent de t. Le vecteur dFM = − τ dt H M c c → − ......... . . est tangent. Soit un vecteur unitaire de j . . . . . . A ...... . ........ D et K la projection orthogonale de F sur ........ A . . . . . − → − → − → − → . A I............. D− . On a HM = FM + KF − KH. Comme . → . . . . c .... A → − dKH dt est colinéaire à j , il existe λ(t) tel que A ........ → − → − → − .. → − → − dHM dFM dKH ..A .. dt = dt − dt = τ − λ(t) j . Dérivons → − → .... A − → FM − → − HM ..c Ac FM2 −HM2 = 0. On a 2FM· ddt −2HM· ddt = 0, c − → − → − − → − → → K S F soit (FM − HM) · τ = 0, i.e. FH · τ = 0. La tangente TM est donc hauteur, donc axe de symétrie, du triangle isocèle FHM, c’est la médiatrice de (H, F). (ii) Par (i), la réflexion d’axe T M transforme F en H ∈ D . Inversement, l’application M → H étant bijective de C sur D (12.10, p. 319), H décrit D si M décrit C . (iii) Par (i), TS est médiatrice de (F, K) donc l’homothétie H F, 1 transforme D et H en 2 TS et I, d’où I décrit TS si M décrit C .
i
i i
i
i
i
i
i
12 • Coniques
336
Proposition 12.22. Dans les conditions précédentes, soit N M la normale en M à C , T
et N les points où TM et NM coupent l’axe X de C , M la projection orthogonale de M sur X . Alors
(i) le milieu de (T, N) est F, (ii) le milieu de (T, M ) est S, −→ − → (iii) on a M N = KF.
Démonstration. (i) Les droites N M = (MN) et (HF) sont parallèles car orthogonales à TM , de même que les droites X = (FN) et (MH). Donc HMNF est un parallélogramme, − → − → d’où HM = FN. La symétrie de centre I transforme F en H et X en (MH), donc M en T, d’où − → − → − → FN = HM = −FT et F est bien milieu de (N, T). D TS bH
NM
A
TM
M A b . . . . . . ..... ... A ........ A ...... . . . . . . A .... A ...... A A bI ..... . . . . A A....... A ... A . . Ab b b ...b Ab b T K S F X M NA A
(ii) Le théorème de Thalès donne TN TM TM = = 2= donc S est milieu TF TI TS du segment [T, M ] appelé sous-tangente en M. −→ − → − → → (iii) On a FN = HM = KM = − v . La
→ translation T− v transforme F et K en M −→ − → et N, d’où M N = KF. La longueur du segment [M , N], appelé sous-normale en M, est donc constante, égale au paramètre p de la parabole.
12.2.6. Propriétés spéciales à l’ellipse Soit Γ un cercle de centre Ω. Le transformé de Γ par une bijection affine f est une ellipse de centre f (Ω) et toute ellipse peut être considérée ainsi (12.13, p. 320). Ceci permet de retrouver certains résultats sur les ellipses à partir de propriétés du cercle. Définition 12.23. Soit une droite ∆ et un réel k = 0 ; on appelle affinité orthogonale d’axe ∆ et de rapport k l’application P → P suivante : étant donné M et sa projection orthogonale H sur ∆, le transformé M de M est défini −→ − → par HM = kHM.
→ → Proposition 12.24. Soit (O, − ı ,− j ) un repère orthonormé. L’ellipse C d’équation x2 y 2 + 2 −1=0 a2 b se déduit des cercles A et B de centre O et de rayons a et b par les affinités f et g → → d’axes X = O + R− ı et Y = O + R− j , de rapports ab et ab .
i
i i
i
i
i
i
i
12.2 Coniques dans un plan affine euclidien
337
Démonstration. Le cercle de centre O et de rayon a est d’équation x 2 + y 2 − a2 = 0. Un point M(x, y) de A devient par l’affinité d’axe X et de rapport ab le point M (x , y ) où x = x et y = ab y . On a donc a2 2 x2 y 2 y soit + 2 −1=0 b2 a2 b −1 On a donc f (A) ⊂ C . On a de même f (C) ⊂ A, d’où f (A) = C . On montre de même que f (B) = C . a2 = x2 + y 2 = x2 +
Proposition 12.25. Bande de papier Soit X et Y deux droites se coupant orthogonalement. Les points O, P et Q varient sur X et Y de sorte que la longueur PQ = d soit constante. Soit k un réel distinct de 0 et 1. Le point M ∈ (PQ) tel que PM = k décrit PQ une ellipse d’axes X et Y .
Ainsi, P, Q, M sont fixés sur une bande de papier mobile, P et Q étant assujettis à se déplacer sur les droites fixes X et Y . bQ Z Z
Y ZZ
Z . .....................................................................................................Z ............. ................ . . . . . . . . . b b .....b... M . . MZ Z ...... ....... . . . . H Z Z..... ..... ...Zb Zb ... .. P .... . . O . X ...... ..... ........ ....... ............ .......... . . ................. . . . . . . . . . . . . . .......................................................................................
© Dunod. La photocopie non autorisée est un délit.
............................................ ..... ....... ..... .... ... .... . . . ... ... ... .... ... ... ... ... ... .. .. .. ... ... . . ... ... ..... .... . ... .... ..... .... ..... ...... ..............................................
Démonstration. Soit H la projection orthogonale de M sur Y et M le point où la parallèle à (PQ) passant par O coupe (HM). La considération du parallélogramme OPMM −→ − → donne OM = PM. La longueur PM étant constante, égale à |k|d, M est sur le cercle de centre O et de rayon |k|d. L’homothétie de centre H transformant M en M transforme Q en O, d’où k−1 HM QM QM = = = k PM HM OM L’affinité orthogonale d’axe Y et de rapport k−1 k transforme le cercle de centre O et de rayon r = |k|d en l’ellipse de centre O, d’axes porté par Y de longueur 2|k|d, porté par X de longueur |1 − k|d. Pour k = 12 , M, milieu de [P, Q], décrit le cercle de centre O et de rayon 12 d.
12.2.7. Propriétés spéciales à l’hyperbole Parmi les coniques propres, la spécificité des hyperboles est d’avoir des asymptotes. La proposition suivante en est une illustration.
i
i i
i
i
i
i
i
12 • Coniques
338
Proposition 12.26. Soit X et Y deux droites sécantes en O, P et Q deux points décrivant X et Y de sorte que l’aire algébrique 12 [O, P, Q] = A soit constante. Alors le milieu M de (P, Q) décrit une hyperbole C et (PQ) est la tangente en M à C . → → Démonstration. Soit − ı et − j des vecteurs directeurs de X et Y tels que le déterminant → − − → de ı , j relativement à une base orthonormale directe soit 1. Y
Q M O
P
X
Soit P ∈ X , Q ∈ Y . Les coordonnées du milieu M de (P, Q) sont x = 12 OP et y = 12 OQ. On a (9.9, p. 249) [O, P, Q] = OP × OQ = 4xy et l’aire algébrique du triangle OPQ est → → 2xy . Alors M décrit l’hyperbole C d’équation 2xy = A dans le repère (O, − ı ,− j ). En A calculant la dérivée de la fonction x → 2x , on voit que (PQ) est la tangente en M à C .
EXERCICES Exercice 12.7. Soit C et C deux coniques propres. Montrer qu’il existe une similitude
directe transformant C en C si et seulement si C et C ont même excentricité. (utiliser l’exercice 8.14 p. 234) Exercice 12.8. Soit C une parabole, F son foyer, D sa directrice.
Montrer que par tout J ∈ D passent deux tangentes T , T à C et qu’elles sont orthogonales (considérer les réflexions σ et σ d’axes T et T ). Montrer que les points de contact M et M sont alignés avec F. Exercice 12.9. Soit C une conique de foyer F, directrice D , excentricité e > 0.
Montrer que F est intérieur à C et que pour toute sécante passant par F coupant C en M et M et D en I, on a une division harmonique [F, I, M, M ] = −1, autrement dit la directrice D est polaire du foyer F (12.3, p. 323).
i
i i
i
i
i
i
i
Exercices
339
Exercice 12.10. Soit C une conique de foyer F, de directrice D , d’excentricité e. Soit
− → M ∈ C . On suppose que la tangente T M coupe D en J. Montrer (par dérivation) que FJ − → et FM sont orthogonaux.
Exercice 12.11. Soit deux droites D et ∆ sécantes en I, A, B deux points distincts de
∆ non sur D .
1) Montrer que le lieu géométrique des foyers F des coniques C passant par A, B et de directrice D est un cercle Γ. 2) Soit A et B les cercles de centre A et B tangents à D . Montrer que A, B, Γ appartiennent à un même faisceau F de cercles (considérer des fonctions circulaires α, β, γ définissant les cercles A, B, Γ, voir Chap.11). 3) Discuter le genre de C selon la position de F sur Γ Exercice 12.12. Soit C une conique à centre de foyer F, F , de cercle principal Ω,
M ∈ C , H, H les projections orthogonales de F, F sur la tangente TM . Montrer que pour tout M ∈ C , FH × F H = a2 − c2 où a est rayon de Ω et c = ΩF. Exercice 12.13. Soit C une conique à centre de foyers F, F , F le cercle directeur de
centre F , A un point extérieur à C .
© Dunod. La photocopie non autorisée est un délit.
1) Construire les tangentes T 1 , T2 à C issues de A (considérer les intersections P 1 , P2 du cercle A de centre A passant par F et de F , voir 12.19, p. 333).
2) Montrer que les angles de droites ( T 1 , T2 ) et (AF, AF ) ont mêmes bissectrices (considérer les réflexions σ, σ , σ1 , σ2 d’axes (AF), (AF ), T1 , T2 ). 3) Quel est l’ensemble Γ des points A tels que les tangentes T 1 , T2 issues de A soient orthogonales ? 4) A-t-on des résultats semblables pour les paraboles ?
Exercice 12.14. Soit un triangle ABC. Montrer que les foyers des paraboles tangentes aux trois côtés sont sur le cercle circonscrit au triangle privé des sommets (utiliser le théorème de Simson 11.20, p. 294) et que les directrices passent par l’orthocentre (voir droite de Steiner – problème 11.3, p. 309)
i
i i
i
i
i
i
i
12 • Coniques
340
PROBLÈME Le corrigé de ce problème est disponible sur le site de Dunod : www.dunod.com.
12.1. PROBLÈME On donne deux points distincts A, A d’un plan affine P . 1) Soit ϕ : P → P une application linéaire, B une base de P . Montrer que l’application suivante est une f.q.a. − → −→ F : P −→ P, M −→ F (M) = det B ϕ(AM), A M 2) Montrer que V(F ) est non vide. En déduire que c’est une conique propre si et −→ seulement si ϕ est bijective et AA non vecteur propre de ϕ. Montrer que V(F ) passe par A et A et préciser les tangentes en ces points. 3) Soit f une bijection affine P → P transformant A en A et ne laissant pas la droite (AA ) stable. À une droite D passant par A, on associe l’intersection M de D et D = f (D). Quel est le lieu de M si D pivote autour de A ? 4) Soit χϕ (X) le polynôme caractéristique de ϕ. Montrer que • V(F ) est une ellipse si χϕ n’a pas de racine réelle. • V(F ) est une hyperbole si χϕ a deux racines réelles distinctes et que les directions asymptotiques sont les droites vectorielles propres. • V(F ) est une parabole si χϕ a une racine réelle double. 5) Montrer que l’application ϕ → F est une bijection linéaire de l’espace L(P ) des bijection linéaires P → P sur l’espace des f.q.a. nulles en A, A . En déduire que si C est une conique propre passant par A et A , alors C peut être générée de cette façon. 6) Soit C une conique propre, A, A deux points distincts, M1 , M2 , M3 , M4 quatre points distincts de C tels que (AM1 ), (AM2 ), (AM3 ), (AM4 ) forment un faisceau harmonique. Montrer que les quatre droites (A M1 ), (A M2 ), (A M3 ), (A M4 ) forment aussi un faisceau harmonique (Si A et Mi sont confondus, on convient que (AM i ) est la tangente en A). Montrer qu’on peut donner sens à la notion : quatre points d’une conique propre sont en division harmonique. On parle alors de quadrangle harmonique de C . Montrer que A, A , M1 , M2 sont en division harmonique sur C si et seulement si (M1 M2 ) et les tangentes en A et A concourent ou sont parallèles (utiliser 12.3, p. 323). 7) On suppose V(F ) propre. Montrer que le milieu O de (A, A ) est centre de V(F ) −→ si et seulement si ϕ2 = ϕ ◦ ϕ est une homothétie vectorielle (on montrera que AA doit être propre pour ϕ2 , puis que, n’étant pas propre pour ϕ, ϕ2 doit être une homothétie vectorielle).
i
i i
i
i
i
i
i
Solutions des exercices
341
8) On suppose P euclidien. Retrouver le théorème de l’angle inscrit (11.15, p. 292) en prenant pour ϕ une rotation vectorielle. 9) On suppose P euclidien. Montrer que V(F ) est une hyperbole équilatère de centre le milieu de (A, A ) si ϕ est une réflexion vectorielle. Préciser les asymptotes.
SOLUTIONS DES EXERCICES − →
− →
Solution 12.1. Pour tout M, F (M) = Q(OM) + 2LO (OM) car F (O) = 0.
1) Cas où Q est nulle. Alors V(F ) = O + Ker LO est une droite, donc est impropre. − → 2) Cas où LO est nulle, alors F (M) = Q(OM). • Si Q est hyperbolique, i.e. de signature (1, 1), alors Q = L 1 L2 (L1 , L2 formes linéaires) et V(F ) = (O + Ker L1 ) ∪ (O + Ker L2 ) est union de deux droites distinctes. • Si Q est dégénérée de rang 1, alors Q = L 2 (L forme linéaire) et V(F ) = O+Ker L est une droite (double). • Si Q est de signature (2, 0) ou (0, 2), V(F ) = {O}, singleton. Dans tous ces cas, V(F ) est impropre.
© Dunod. La photocopie non autorisée est un délit.
3) Cas où Ker LO est une droite vectorielle Q-isotrope. Alors V(F ) contient la droite O + Ker LO , donc est impropre. 4) Reste à montrer que si Ker L O est une droite vectorielle non Q-isotrope, alors V(F ) est propre. Si V(F ) était impropre, elle se réduirait à {O} ou se composerait d’une ou deux droites dont l’une passerait par O (voir 12.1.1 où tous → les cas ont été envisagés). Faisons pivoter autour de O une droite D − u de vecteur → − → − → − → directeur u = 0 . Les points de D− u ∩ V(F ) sont du type O + λ u , λ étant tel que → → P (λ) = λ2 Q(− u ) + 2λLO (− u ) = 0. → → → Or LO (− u ) = 0 ⇒ Q(− u ) = 0 , pour aucun − u , P (λ) n’est identiquement nul. Donc V(F ) ne contient pas de droite passant par O. Cette équation en λ a une solution → u ∈ / Ker LO donc V(F ) ne se réduit pas à {O}. D’où V(F ) est propre. non nulle si −
Solution 12.2. La symétrie oblique d’axe D , de direction ∆, laisse P fixe et C stable (12.14, p. 321). Elle échange donc T 1 , M1 et T2 , M2 , d’où (M1 M2 ) est parallèle à ∆.
Le milieu I de (M1 , M2 ) est sur D , donc [T1 , T2 , D, ∆] = −1 (8.27, p. 218).
i
i i
i
i
i
i
i
12 • Coniques
342
1) Choisissons P pour origine. On écrit pour tout M la formule − → − → → → F (M) = Q(PM) + 2LP (PM) + F (P). Les points M = P + λ − u et M = P + λ − u sont obtenus en prenant pour λ et λ les racines du trinôme → → λ2 Q(− u ) + 2λL (− u ) + F (P) Solution 12.3.
P
− Le point Q = P + µ→ u est obtenu en écrivant
λ − µ λ PM QM = = − = − λ λ − µ PM QM 2λ λ F (P) F (P) − − → → u =− et PQ = − → − → λ +λ LP ( u ) LP (− u) − → → → Cette expression ne dépend pas du vecteur − u directeur de la sécante. Prenant − u = PQ, d’où µ =
on obtient
−
F (P) − → − → = 1 soit LP (PQ) + F (P) = 0 LP (PQ)
Pour deux positions Q 1 et Q2 de Q, on trouve −→ −→ −−→ LP (PQ1 ) = −F (P) = LP (PQ2 ) soit LP (Q1 Q2 ) = 0 Le lieu est donc porté par une droite ∆ P de direction Ker LP . Soit une sécante D1 coupant C en M1 , M1 , Q1 ∈ D1 tel que [P, Q1 , M1 , M1 ] = −1. La symétrie oblique d’axe le diamètre passant par P et de direction Q-orthogonale laisse C stable et P fixe (12.14, p. 321). Elle transforme D 1 , Q1 , M1 , M1 en D2 , Q2 , M2 , M2 avec −−→ [P, Q2 , M2 , M2 ] = −1. Donc Q1 Q2 ∈ Ker LP est Q-orthogonal au diamètre passant par P. Si P est intérieur à C , toute droite passant par P est sécante et le lieu est toute la polaire ∆P . Si P est extérieur, on peut mener de P deux tangentes en T 1 et T2 . Le lieu est le segment [T1 , T2 ] si C est une ellipse, une parabole, une hyperbole avec T 1 , T2 sur la même branche, deux demi-droites d’origines T 1 , T2 si C est une hyperbole avec T 1 , T2 sur deux branches différentes. 2) Si Q ∈ ∆P et si (PQ) coupe C en M , M , on a [P, Q, M , M ] = −1, donc [Q, P, M , M ] = −1 et P ∈ ∆Q . − → Ce raisonnement ne convient pas si (PQ) n’est pas sécante. On a L P (PQ)+F (P) = 0. − → − → Montrons que LQ (QP) + F (Q) = 0. On a (12.2, p. 315) LQ = LP + Φ(PQ, −), d’où − → − → − → − → − → − → LQ (QP) + F (Q) = LP (QP) + Φ(PQ, QP) + Q(PQ) + 2LP (PQ) + F (P) − → − → − → − → = −LP (PQ) − Q(PQ) + Q(PQ) + 2LP (PQ) + F (P) − → = LP (PQ) + F (P) = 0
i
i i
i
i
i
i
i
Solutions des exercices
343
− → 3) Supposons P ∈ C et disons que Q est conjugué de P si L P (PQ) + F (P) = 0. − → Comme F (P) = 0, Q est conjugué de P si et seulement si L P (PQ) = 0, i.e. Q ∈ ∆P = P + Ker LP . La polaire de P est alors la tangente T P à C en P. Solution 12.4. 1) Les droites Dt passant par le point M(x, y) sont telles que t soit racine du polynôme
Dx,y (T ) = u(T )x + v(T )y + w(T ) = T 2 (u2 + v2 + w2 ) + 2T (u1 + v1 + w1 ) + u0 + v0 + w0 Le discriminant est
∆(x, y) = (u1 x + v1 y + w1 )2 − (u2 x + v2 y + w2 )(u0 x + v0 y + w0 ) On a donc deux, une ou zéro droites D t passant par M(x, y) selon que ∆(x, y) est positif, nul ou négatif, soit selon la place M relativement à la conique C d’équation ∆(x, y) = 0. 2) Si M(x, y) est point caractéristique de D t , il vérifie Dx,y (t) = u(t)x + v(t)y + w(t) = 0 et Dx,y (t) = u (t)x + v (t)y + w (t) = 0
donc t est racine commune du polynôme D x,y (T ) = u(T )x + v(T )y + w(T ) et de sa (T ) = u (T )x + v (T )y + w (T ), c’est-à-dire que t est racine multiple dérivée Dx,y de Dx,y (T ). Ceci équivaut à ∆(x, y) = 0. Il existe bien sûr de nombreux cas singuliers : le polynôme D x,y (T ) peut être de degré 1 pour certains points (x, y) ; les droites D t et Dt peuvent être confondues pour certains t. Nous n’entrerons pas dans cette discussion.
−ı , − → Solution 12.5. On se place dans un repère d’origine O et de base B = ( → j ) où
© Dunod. La photocopie non autorisée est un délit.
−ı et − → → j sont vecteurs directeurs de X et Y . Les points mobiles sont donnés par leurs coordonnées P(t)(at + b, 0) et Q(t)(0, ct + d). Ils se trouvent en O aux instants − ab pour P, − dc pour Q. La droite Dt est d’équation
x at+b
+
y ct+d
− 1 = 0, soit
act2 + t(ad + bc − cx − ay) + bd − dx − by = 0 Le discriminant ∆(x, y) de ce polynôme en t est
(ad + bc − cx − ay)2 − 4ac(bd − dx − by) soit
(cx + ay)2 − 2 (ad + bc)(cx + ay) + ac(dx + by) + (ad + bc)2 − 4abcd C’est l’expression analytique d’une f.q.a. F • de forme quadratique Q = L2 où L est la forme linéaire définie par
MatB (L) = c a
• de forme linéaire LO avec MatB (LO ) = − bc2 + 2acd da2 + 2acb , • F (O) = (ad + bc)2 − 4abcd
i
i i
i
i
i
i
i
12 • Coniques
344
Le déterminant de L et L O est c bc2 + 2acd = ac(bc − ad) det a da2 + 2acb
a et c sont non nuls car ce sont les vitesses de P(t) et Q(t) qui ne sont pas fixes. 1) On a − ab = − dc , donc ad − bc = 0. Les formes linéaires L et L O sont indépendantes. L’enveloppe est la parabole C d’équation ∆(x, y) = 0. Pour t = − ab , P(t) est en O, Dt est en Y qui est donc tangente à C . On vérifie que c’est en le point B où se trouve Q à cet instant. De même C est tangente à X en la position A qu’occupe P à l’instant − dc . 2) Si P, Q sont en O au même instant t 0 = − ab = − dc , l’équation de Dt est y x + − 1 = 0 soit bx + ay + t0 − t = 0 a(t − t0 ) b(t − t0 ) de vecteur directeur (−a, b), donc de direction fixe.
→ → − Solution 12.6. Soit le repère (O, − u,− v ) où O est milieu de (A, B) et → u colinéaire à
(AB). Soit les coordonnées (a, 0) pour A, (−a, 0) pour B, (a, t) pour P, (−a, pt ) pour Q. La droite Dt = (PQ) est d’équation p (x − a)(t − ) − (y − t)2a = 0 soit t2 (x + a) − 2ayt − p(x − a) = 0 t Le discriminant de ce polynôme en t est ∆(x, y) = a2 y 2 + (x2 − a2 )p = x2 p + y 2 a2 − pa2 = 0 On a une conique C de centre O, tangente en A à A et en B à B . C’est une ellipse si p > 0, une hyperbole si p < 0. Dans le cas p = −b2 < 0 où C est hyperbole, les droites D b et D−b passent par O. On montre que ce sont les asymptotes de C . Solution 12.7. a) Les similitudes conservant l’orthogonalité et les rapports des distances, on voit facilement que la transformée par une similitude s d’une conique propre C de foyer F, directrice D , excentricité e est la conique propre de foyer s(F), directrice s(D) et de même excentricité e.
Inversement, soit C une conique d’excentricité e, de foyer F et de directrice D . Soit K et K les projections orthogonales de F et F sur D et D . Il existe une unique similitude directe s transformant (F, K) en (F , K ). Alors s(D) = D , donc s(C) = C . Le rapport de similitude est
K F KF
=
p p
où p et p sont les paramètres.
b) Soit C un cercle de centre Ω et de rayon p, s une similitude directe de rapport λ. Alors s(C) est le cercle de centre s(Ω) et de rayon λp. L’excentricité e détermine donc la forme de la conique C . Pour e donné, le paramètre détermine la taille de C .
i
i i
i
i
i
i
i
Solutions des exercices
345
Solution 12.8. Supposons qu’il existe une tangente T passant par J. Soit M son point
de contact et H la projection orthogonale de M sur D . Alors (JM) = T est la médiatrice de (F, H), donc JF = JH.
Pour mener les tangentes à C issues de J, on construit le cercle de centre J et de rayon JF. Il coupe D en H et H , diamétralement opposés. Les médiatrices de (F, H) et (F, H ) sont les deux tangentes T et T issues de J. La réflexion σ d’axe T transforme H en F. La réflexion σ d’axe T transforme F en Ainsi, σ ◦ σ est la rotation de centre J transformant H en H . Comme J est milieu de (H, H ), σ ◦ σ est la symétrie de centre J, donc T et T sont orthogonales.
H .
La réflexion σ transforme (MH) en (MF). La réflexion σ transforme (M F) en (M H ). La symétrie SJ = σ ◦ σ transforme la droite (MH) en la droite (M H ), donc les droites (M F) et (MF) ont même transformée (M H ) par σ . Elles sont donc confondues, d’où l’alignement de M, F, M .
Solution 12.9. a) Soit ∆ une droite passant par F coupant D en I, θ l’angle non orienté aigu de ∆ et D . Pour tout M ∈ ∆ de projection orthogonale H sur D , on a MH = MI sin θ . Donc M ∈ C si et seulement si MF MI = e sin θ . Si e sin θ = 1 on a deux points M, M sur ∆ de projections orthogonales H, H sur D tels que
M F MF =− = e sin θ MI MI
d’où
MF M F = =e MH MH
Ainsi, ∆ coupe C en M, M conjugués harmoniques relativement à F et I.
© Dunod. La photocopie non autorisée est un délit.
Si ∆0 est parallèle à D , soit h la distance de ∆ et D . Alors ∆ 0 coupe C en M0 , M0 tels que M0 F = M0 F = eh, donc F est le milieu de (M0 , M0 ). Solution 12.10. Soit H la projection orthogonale de M sur D . Soit une représenta-
→ − → FM est tangent. Dérivons la relation τ = ddt tion paramétrique t → M(t). Le vecteur − FM2 − e2 HM2 = 0. On a − → − → − → − → − → dFM → dFM dFH − → → 2− − e HM · ( − ) = (FM − e2 HM) · − 0 = FM · τ dt dt dt → − → − − → → FH car HM · ddt = 0. Par définition de J, − τ et JM sont colinéaires. On a donc
− → − → − → − → − → − → − → − → − → 0 = (FM − e2 HM) · JM = FM · (JF + FM) − e2 HM · (JH + HM) − → − → − → − → − → − → Comme FM2 − e2 HM2 = 0, il reste 0 = FM · JF − e2 HM · JH = FM · JF.
i
i i
i
i
i
i
i
12 • Coniques
346
Solution 12.11. 1) Soit H et K les projections orthogonales de A et B sur D . BF Si F est foyer d’une conique C d’excentricité e, on a AF AH = e = BK , donc (en utilisant l’homothétie de centre I transformant A et H en B et K) BK IK IB JB BF = = = = AF AH IH IA JA où J est conjugué harmonique de I relativement à A, B. Donc F est sur le cercle Γ de diamètre [I, J] (11.20, p. 294).
Inversement, si F ∈ Γ et F ∈ / D , on a ces égalités, donc la conique de foyer F, AF directrice D , excentricité AH = e = BF BK passe par A et B. 2) Les cercles A, B sont tangents en H, K à D . Soit les fonctions circulaires α, β, γ définies par
α(M) = AM2 − AH2 , β(M) = BM2 − BK2 , γ(M) = AH2 BM2 − BK2 AM2 Alors A = V(α), B = V(β), Γ = V(γ) et γ = AH2 β − BK2 α. Les fonctions circulaires α, β, γ appartiennent à un même plan vectoriel, donc A, B, Γ appartiennent à un même faisceau de cercles F . 3) Soit F ∈ Γ. Comme et B .
AF AH
=e=
BF BK ,
F a même position par rapport aux cercles A
(1) Si F extérieur à A et B , e > 1, C est une hyperbole, (2) Si F intérieur à A et B , e < 1, C est une ellipse, (3) Si F ∈ A ∩ B , e = 1, C est une parabole. Comme I ∈ D , tangente commune à A et B , I est extérieur à A, B et l’arc Γ h des points de Γ extérieurs à A et B est non vide. Si F ∈ Γ h \ D , C est une hyperbole, donc le cas 1 est toujours possible. Si les cercles A et B n’ont pas de point commun, i.e. si F est à points limites, C est toujours une hyperbole car Γ = Γ h . C’est en particulier le cas si A et B ne sont pas dans le même demi-plan limité par D . Si les cercles A et B se coupent en F 1 , F2 , F est à points de base F1 , F2 . Les arcs de Γ limités par F1 , F2 sont Γe et Γh , intérieur et extérieur à A et B . (1) Si F ∈ Γh , C est une hyperbole, (2) Si F ∈ Γe , C est une ellipse, (3) Si F ∈ {F1 , F2 }, C est une parabole. Solution 12.12. On sait (12.19, p. 333) que H, H sont sur le cercle principal Ω. Soit
K le point où (FH) recoupe Ω, symétrique de H par rapport au centre Ω. On a donc FH × F H = −FH × FK = −Ω(F) = a2 − c2 .
i
i i
i
i
i
i
i
Solutions des exercices
347
Solution 12.13. 1) Les symétriques P 1 , P2 de F par rapport à T 1 , T2 sont sur F (12.19,
p. 333). Ce sont donc les intersections des cercles F et A.
2) On a σ1 (F) = P1 , σ (P1 ) = P2 , σ2 (P2 ) = F. La réflexion σ2 ◦ σ ◦ σ1 laisse F fixe, donc σ2 ◦ σ ◦ σ1 = σ et σ2 ◦ σ = σ ◦ σ1 est la rotation de centre A et d’angle , T ) ≡ 2(T 2(AF 2 1 , AF) modulo 2π . Soit τ une réflexion échangeant (AF) et (AF ). Elle change les angles en leurs opposés, donc échange T 1 et T2 , d’où le résultat.
3) La rotation σ2 ◦ σ1 , de centre A, d’angle 2(T 1 , T2 ) (modulo 2π ), envoie P 1 en P2 . Les tangentes T1 , T2 sont orthogonales si et seulement si (P 1 , P2 ) sont diamétralement opposés sur A, i.e. si A est sur l’axe radical de A et F , i.e. si −AF2 = A(A) = AP1 × AP2 = F (A) = AF2 − 4a2 i.e. si AF2 + AF2 = 4a2 . Posons 2c = FF . Soit Ω le centre de C . On a − → − → − → −→ AF2 + AF2 = AΩ + ΩF2 + AΩ + ΩF 2 − → − → −→ = 2AΩ2 + 2AΩ · (ΩF + ΩF ) + ΩF2 + ΩF2 = 2AΩ2 + 2c2 Par un calcul simple (voir 12.17, 328), on montre que e = ac . D’où A ∈ Γ si et seulement si AΩ2 = 2a2 − c2 = (2 − e2 )a2 . √ • si e < 2 ce qui est le cas des ellipses et hyperboles de faible excentricité, Γ est le √ cercle orthoptique de centre Ω et de rayon a 2 − e2 . √ • Si e > 2, Γ est vide. √ • Si e = 2, C est une hyperbole équilatère i.e. d’asymptotes X , Y orthogonales. En les considérant comme tangentes avec points de contact à l’infini, Γ se réduit à {Ω}.
© Dunod. La photocopie non autorisée est un délit.
4) Pour étendre ces résultats à la parabole, il faut remplacer F par la directrice D , la droite (AF ) étant remplacée par la droite orthogonale à D passant par A. L’ensemble Γ est alors la directrice (exercice 12.8, p. 338). Solution 12.14. Soit C une telle parabole, F son foyer, D sa directrice. Les projections
orthogonales A , B , C de F sur les tangentes (BC), (CA), (AB) sont sur la tangente au sommet ∆ de C (12.21, p. 335). Par le théorème de Simson (11.18, p. 293), F est sur le cercle (ABC) et ∆ est la droite de Simson de F.
On sait que l’homothétie H F, 1 transforme la droite de Simson ∆ de F en la droite 2 de Steiner qui passe par l’orthocentre (voir le problème 11.6.3, p. 309). Inversement, soit F sur le cercle (ABC) distinct de A, B, C et ∆ sa droite de Simson. Alors la parabole de foyer F et de tangente au sommet ∆ est bien tangente aux côtés du triangle (12.21, p. 335). Même raisonnement pour la directrice.
i
i i
i
i
i
i
i
i
i i
i
i
i
i
i
Chapitre 13
Nombres complexes et géométrie
© Dunod. La photocopie non autorisée est un délit.
Le corps C des nombres complexes a une structure de plan vectoriel euclidien orienté. Ceci permet de transporter dans C les problèmes de géométrie plane pour les résoudre par calcul. Pour ce faire, il faut disposer d’un dictionnaire mettant en regard les phénomènes géométriques et leurs traductions algébriques dans C. Cette problématique est développée dans les sections 13.1 et 13.2. L’adjonction d’un élément ∞ à C permet une application à la géométrie des cercles développée au chapitre 11. Cette partie est longuement développée dans les sections 13.3 et 13.4. C’est l’occasion de découvrir de nouvelles transformations qui ne font pas partie de la géométrie affine : les homographies et antihomographies qui constituent le groupe circulaire.
13.1 LE CORPS C COMME PLAN GÉOMÉTRIQUE 13.1.1. Le plan vectoriel euclidien orienté C Rappelons comment on définit sur C la structure canonique de plan vectoriel euclidien orienté : • l’inclusion R ⊂ C détermine sur C une structure naturelle de R-espace vectoriel de dimension 2,
i
i i
i
i
i
i
i
350
13 • Nombres complexes et géométrie
• l’application module Z → |Z| est la norme euclidienne ; le produit scalaire de Z = X + iY et Z = X + iY est 1 XX + Y Y = (ZZ ) = (ZZ + Z Z) 2 • la base orthonormale (1, i) est décrétée directe ; le déterminant de Z = X + iY et Z = X + iY relativement à (1, i) (et donc relativement à toute base orthonormale directe) est 1 X X det = XY − Y X = "(ZZ ) = (ZZ − Z Z) Y Y 2i
' L’argument d’un complexe Z = 0 est l’angle arg(Z) ≡ ( 1, Z) modulo 2π . Le groupe SO(C) est formé des applications Z → aZ où |a| = 1. Il est canoniquement isomorphe au groupe multiplicatif U des nombres complexes de module 1. Autrement dit, a étant de la forme eiθ , l’application R-linéaire Z → eiθ Z est la rotation vectorielle d’angle θ . Le groupe, isomorphe à C × , des applications Z → aZ (a = 0) est le groupe des similitudes vectorielles directes. Pour a = ρe iθ , l’application Z → aZ est la similitude vectorielle directe de rapport ρ et d’angle θ .
13.1.2. Le plan affine euclidien orienté C On peut aussi considérer C comme plan affine euclidien orienté. Reportons nous à la définition d’espace affine (8.1, p. 204) : le plan vectoriel (euclidien orienté) associé est C lui-même et l’opération du plan vectoriel C sur le plan affine C est l’addition interne (b, z) → z + b de C. Autrement dit, les translations sont les applications z → z + b où z est considéré comme un point et b comme un vecteur. Proposition 13.1. Une application de C dans C est une similitude directe pour la
structure affine euclidienne de C si et seulement si elle est du type z → az + b où a = 0.
Autrement dit, le groupe Sim + (C) des similitudes directes s’identifie au groupe affine GA(C) de C considéré comme droite affine sur le corps C.
Démonstration. Montrons que ces applications sont des similitudes directes. • Pour a = 1, on a toutes les translations. • Pour a = ρeiθ = 1, l’application a un unique point fixe obtenu en résolvant b . Soit z = z0 et l’équation z0 = az0 + b, c’est le point d’affixe z0 = 1−a z = az + b son image. Considérons les "vecteurs" Z = z − z 0 et Z = z − z0 . On a Z = (az + b) − (az0 + b) = a(z − z0 ) = aZ , donc |Z | = ρ|Z| et (Z, Z ) ≡ arg(a) ≡ θ modulo 2π . L’application est bien la similitude directe de centre z0 , de rapport ρ et d’angle θ . Comme ρ et θ peuvent être pris quelconques, de même que z 0 (en prenant b = (1 − a)z0 ), toute similitude directe est de ce type.
i
i i
i
i
i
i
i
13.2 Utilisation de C en géométrie affine plane
351
13.1.3. Le plan affine C On va voir maintenant C comme simple plan affine, autrement dit on oublie la structure euclidienne. On se propose de décrire les applications affines par un énoncé analogue à la proposition 13.1 Proposition 13.2. Une application C → C est une application affine si et seulement az + bz + c. si elle est du type z →
Démonstration. Ces applications sont clairement affines. La question est : toute application affine est-elle de ce type ? Cela revient à montrer le lemme suivant : Lemme 13.3. Une application de C dans C est R-linéaire si et seulement si elle est
du type fa,b : Z → aZ + bZ où (a, b) ∈ C2 .
Ces applications sont clairement R-linéaires et forment un sous-R-espace vectoriel de l’espace LR (C). Comme dimR (C) = 2, on a dimR LR (C) = 2×2 = 4. L’application (a, b) → fa,b est injective, R-linéaire de C 2 dans LR (C). Mais dimR (C2 ) = 4, cette application est donc bijective par égalité des dimensions des espaces de départ et d’arrivée, le lemme est démontré. Soit f : C −→ C une application affine : f est déterminée par son application linéaire associée, qui est de la forme f a,b par le lemme, et par l’image c = f (0) (8.13, p. 209). Elle est donc bien du type annoncé.
13.2 UTILISATION DE C EN GÉOMÉTRIE AFFINE PLANE
© Dunod. La photocopie non autorisée est un délit.
Soit P un plan affine euclidien orienté de plan vectoriel associé P . Nous allons → → u,− v ) permet voir comment la donnée d’un repère orthonormé direct R = (O, − d’« algébriser » une situation géométrique.
13.2.1. Affixes et images Si on considère les bijections
C −→ P − → → → Z = X + iY −→ V = X − u +Y− v C −→ P → → z = x + iy −→ M = O + x− u + y− v
→ − On dit que V et M sont les images de Z et z respectivement et que Z et z sont les → − affixes de V et M. Ces notions sont relatives au repère R. Il n’y a pas d’ambiguïté sur les notions d’affixes. En revanche la notion d’image est plus ambiguë et on devrait → − préciser image vectorielle pour V et image ponctuelle pour M, ce que nous ferons s’il y a risque de confusion.
i
i i
i
i
i
i
i
352
13 • Nombres complexes et géométrie
Une situation géométrique de P ou de P peut être ainsi traduite dans C et étudiée par calcul. On a déjà rencontré cette démarche. Le choix d’une base en algèbre linéaire ou d’un repère en géométrie affine permet de transporter un problème géométrique dans Rn pour l’étudier numériquement. Ici, l’outil numérique est sophistiqué car la structure algébrique de C est plus riche que celle de R2 : on y dispose de la multiplication interne du corps C. Les deux coordonnées réelles d’un point sont remplacées par un seul nombre complexe, l’affixe, ce qui laisse prévoir une simplification des calculs. Un objectif de ce chapitre est d’élaborer un « dictionnaire » mettant en correspondance phénomènes géométriques de P et leurs expressions complexes dans C. Ainsi, les propositions 13.1 et 13.2 donnent les expressions complexes des similitudes directes et des applications affines quelconques.
13.2.2. Équations complexes de droites (i) Toute forme linéaire L : P → R est d’expression complexe Z → aZ + aZ où a ∈ C est unique, affixe d’un vecteur orthogonal à Ker L. (ii) Toute fonction affine f : P → R est d’expression complexe z → az + az + b où (a, b) ∈ C × R est unique. → − →− − → − → Démonstration. (i) On sait que L est du type V → A · V où A est unique orthogonal → − → − → → → → à Ker L. Pour V = X − u +Y− v et A = α− u + β− v , on a (13.1.1., p. 349) → − − → A · V = Xα + Y β = aZ + aZ → − → − où Z = X + iY est affixe de V et a = 12 (α + iβ) est affixe de 12 A . (ii) Une fonction affine (9.12, p. 250) f est définie par la donnée de la forme linéaire associée L et l’image de l’origine f (O) = b ∈ R : − → f (M) = L(OM) + f (O) = az + az + b Lemme 13.4.
où z est affixe de M.
Proposition 13.5. Toute droite affine D a une équation complexe du type az+az+b = 0
où (a, b) ∈ C∗ × R est unique à facteur réel près ; a est l’affixe d’un vecteur orthogonal. Inversement, une telle équation est celle d’une droite.
Démonstration. On sait (9.13, p. 251) qu’une droite est l’ensemble D = V(f ) des points annulant une fonction affine f , unique à facteur (réel) près, et réciproquement. 13.2.3. Équations complexes de cercles Proposition 13.6. L’équation azz + bz + bz + c = 0, où (a, c) ∈ R∗ × R et b ∈ C est
celle d’un cercle si |b|2 − ac 0. Tout cercle a une telle équation, le triplet (a, b, c) est unique à facteur réel près.
i
i i
i
i
i
i
i
13.2 Utilisation de C en géométrie affine plane
353
Démonstration. Soit L la forme linéaire d’expression complexe Z → bZ + bZ . Considérons l’application − → − → F : M → F (M) = aOM2 + L(OM) + c = azz + bz + bz + c où z est affixe de M. C’est une fonction circulaire (11.12, p. 289). Voyons à quelle condition V(F ) est non vide. On écrit b b c b b ac − |b|2 =a z+ + F (M) = a zz + z + z + z+ a a a a a a2 2 b 2 |b| − ac = a z + − a a2 Si |b|2 − ac < 0, V(F ) est vide.
% 1 |b|2 − ac, Si |b|2 −ac 0, V(F ) est le cercle de centre Ω d’affixe − ab et de rayon |a| 2 réduit à son centre si |b| − ac = 0. Inversement, tout cercle donné par son centre et son rayon admet une telle équation. − → − →
− →
Exercice 13.1. Pantographe. Soit un parallélogramme articulé OACB ( OA + OB = OC)
où O est fixe, les longueurs OA = BC et OB = AC sont constantes. Deux plaques triangulaires rigides MAC et CBM , directement semblables, sont fixées sur les segments [A, C] et [C, B]. Montrer que l’on passe de M à M par une similitude fixe directe de centre O. Exercice 13.2. 1) Soit A, B, C d’affixes a, b, c. On note j le nombre e
© Dunod. La photocopie non autorisée est un délit.
équivalences :
2iπ 3
. Montrer les
ABC équilatéral direct ⇔ a + bj + cj 2 = 0 ABC équilatéral ⇔ (a − b)2 + (b − c)2 + (c − a)2 = 0
2) Soit un polynôme P (X) = X 3 + λX 2 + µX + ν à coefficients complexes. À quelle condition sur λ, µ, ν les racines de P (X) sont-elles sommets d’un triangle équilatéral de C ? 3) Soit T = PQR un triangle quelconque. On construit à l’extérieur de T les triangles équilatéraux de côtés [Q, R], [R, P], [P, Q]. Soit A, B, C les centres de ces triangles. Montrer que le triangle ABC est équilatéral (théorème de Napoléon). Exercice 13.3. Soit M1 , M2 d’affixes z1 , z2 distincts. Donner une équation complexe
de la droite (M1 M2 ). On la mettra sous la forme de la nullité d’un déterminant d’ordre 3 (l’équation étant az + az + b = 0, exprimer que z 1 , z2 la vérifient ; considérer un autre point d’affixe z sur la droite et utiliser le fait qu’un système linéaire homogène ayant une solution non triviale est de déterminant nul).
i
i i
i
i
i
i
i
13 • Nombres complexes et géométrie
354
Exercice 13.4. Soit un triangle direct ABC avec les affixes a, b, c. On construit les
triangles équilatéraux PBC, QCA, RAB, extérieurement au triangle ABC. Soit p, q, r les affixes de P, Q, R. − → − → − → 1) Montrer que les vecteurs AP, BQ, CR ont même norme et font entre eux les angles ± 2π 3 . 2) Montrer que les droites (AP), (BQ), (CR) sont concourantes. Exercice 13.5. On donne trois points M 1 , M2 , M3 . Par la même méthode que dans
l’exercice 13.3, donner l’équation complexe du cercle passant par ces trois points (s’ils ne sont pas alignés). Exercice 13.6. Soit ABC un triangle équilatéral.
1) Montrer que pour tout M, on a MA + MB MC. 2) Montrer que MA+MB = MC si et seulement si M est sur l’arc du cercle (ABC) limité par A et B, ne contenant pas C (on réfléchira à la question suivante : à quelle condition sur les arguments de z1 et z2 l’inégalité |z1 + z2 | |z1 | + |z2 | est-elle une égalité ?).
→ → → Exercice 13.7. Soit E un espace euclidien orienté de dimension 3, (O, − e1 , − e2 , − e3 ) un
− → − → − → repère orthonormé direct, A, B, C trois points tels que OA, OB, OC soient deux à deux orthogonaux et de même norme. Autrement dit, ce sont trois arêtes d’un cube de → → e1 , − e2 ). sommet O. Soit P le plan passant par O de direction P = Vect( −
1) Soit a, b, c les affixes des projections orthogonales A , B , C de A, B, C sur P . − → − → − → Montrer que a2 + b2 + c2 = 0 (considérer la matrice de OA, OB, OC dans la base → − − → → − B = ( e1 , e2 , e3 ) et utiliser les propriétés des matrices orthogonales). 2) Montrer que si O est isobarycentre de A , B , C , alors A B C est équilatéral (utiliser l’exercice 13.2). 3) Comment envisager la réciproque de 1) ? Exercice 13.8. Soit M , M deux points mobiles animés de mouvements circulaires
uniformes de même vitesse angulaire ω sur des cercles C , C de centres A , A , de rayons R , R . Prenons la droite des centres pour axe réel. Si a , a sont les affixes (réels) des centres, les affixes de M , M sont donc
z = a + R ei(ωt+ϕ ) ,
z = a + R ei(ωt+ϕ
)
1) Quel est le mouvement du milieu M de (M , M ) ? 2) À quelle condition M est-il immobile ?
i
i i
i
i
i
i
i
13.3 La géométrie des cercles et C
355
Exercice 13.9. Soit ϕ : P → P une application linéaire de représentation complexe
Z → aZ + bZ .
1) Montrer que ϕ est inversible si et seulement si |a| = |b|. 2) Dans le cas général, calculer det(ϕ). 3) Quel est le polynôme caractéristique de ϕ ? Montrer que ϕ a des valeurs propres réelles si et seulement si l’image A de a se trouve dans la bande comprise entre les deux droites horizontales tangentes au cercle de centre l’origine O et de rayon |b|. Exercice 13.10. Soit M , M deux points mobiles animés de mouvements circulaires
uniformes de vitesses angulaires opposées ω et −ω sur des cercles C , C de centres A , A , de rayons R , R . Prenons la droite des centres pour axe réel. Si a , a sont les affixes (réels) des centres, les affixes de M , M sont
z = a + R ei(ωt+ϕ ) ,
z = a + R ei(−ωt+ϕ
)
Montrer que la trajectoire du milieu M de (M , M ) est en général une ellipse dont on déterminera les éléments de réduction. La trajectoire de M peut-elle être un segment ? (On pourra poser u(t) = eiωt et étudier l’application faisant passer de u(t) à l’affixe z(t) de M).
13.3 LA GÉOMÉTRIE DES CERCLES ET C
© Dunod. La photocopie non autorisée est un délit.
Cette section est liée au chapitre 11. Le cadre est un plan affine euclidien orienté P , de plan vectoriel associé P . On le complétera en le plan annalagmatique Pˇ = P ∪ {∞} en ajoutant le point à l’infini ∞ (11.22, p. 296).
13.3.1. Birapport de quatre points Définition 13.7. Soit z1 , z2 , z3 , z4 quatre nombres complexes distincts. On
appelle birapport de ces nombres rangés dans cet ordre le nombre z3 − z1 z3 − z2 [z1 , z2 , z3 , z4 ] = : (où le signe : signifie « divisé par ») z4 − z1 z4 − z2 Ces nombres étant distincts, le birapport n’est jamais égal à 0 ou 1. On vérifie immédiatement que
[z1 , z2 , z3 , z4 ] = [z2 , z1 , z4 , z3 ] = [z3 , z4 , z1 , z2 ] = [z4 , z3 , z2 , z1 ]
i
i i
i
i
i
i
i
13 • Nombres complexes et géométrie
356
Le birapport ne change pas en intervertissant les couples (z 1 , z2 ) et (z3 , z4 ) ou simultanément les termes de chaque couples. Comme on a 4! = 24 ordonnancements possibles des zi , les 24 valeurs sont égales 4 à 4 et on a 24 4 = 6 valeurs possibles du birapport en changeant l’ordre. Par exemple, en intervertissant z 1 et z2 , ou z3 et z4 , le birapport est changé en son inverse. On notera C l’ensemble C ∪ {∞}. L’élément infini ∞ est l’affixe du point à l’infini (noté aussi ∞) du plan annalagmatique Pˇ = P ∪ {∞}. Prolongeons la définition du birapport à C en posant
[∞, z2 , z3 , z4 ] = [z2 , ∞, z4 , z3 ] = [z3 , z4 , ∞, z2 ] = [z4 , z3 , z2 , ∞] =
z4 − z2 z3 − z2
Ces valeurs sont les limites du birapport si z 1 tend vers l’infini alors que les trois autres affixes zi sont fixes. Proposition 13.8. Soit quatre points M1 , M2 , M3 , M4 . Le birapport de leurs affixes
z1 , z2 , z3 , z4 relativement à un repère orthonormé direct ne dépend pas de ce repère. On pose alors [M1 , M2 , M3 , M4 ] = [z1 , z2 , z3 , z4 ], c’est le birapport des quatre points M i . − → − → → → Démonstration. Soit R = (O, − u ,− v ) et R = (O , u , v ) deux repères, b l’af→ − → − → → fixe de O dans R, θ ≡ (− u , u ) ≡ (− v , v ) modulo 2π . Si z et z sont les affixes du même point M dans R et R , la relation1 liant z et z est z = eiθ z + b. Pour z −z −zj trois indices i, j, k, on voit que zi −zj = zzii−z , donc on a égalité des birapports k i k [z1 , z2 , z3 , z4 ] = [z1 , z2 , z3 , z4 ], y compris si l’un des zi est ∞. Proposition 13.9. Le birapport de quatre points alignés est leur birapport au sens du
chapitre 8.
→ Démonstration. Si les M i sont sur une même droite D , prenons O ∈ D et − u un vecteur unitaire directeur de D . L’affixe de M i est zi = OMi et on a [z1 , z2 , z3 , z4 ] =
z3 − z1 z3 − z2 M1 M3 M2 M3 : = : z4 − z1 z4 − z2 M1 M4 M2 M4
ce qui est le birapport au sens du chapitre 8 (8.1.8., p. 217).
1. La même démonstration marche encore si on change l’unité de longueur, c’est-à-dire si on remplace le produit scalaire de P par un autre proportionnel (8.32, p. 223). La formule de changement de repère est alors z = az + b où a = 0 n’est pas toujours de module 1.
i
i i
i
i
i
i
i
13.3 La géométrie des cercles et C
357
13.3.2. Faisceaux de cercles à points de base Théorème 13.10. Pour que quatre points distincts M 1 , M2 , M3 , M4 soient cocycliques au sens généralisé, il faut et il suffit que leur birapport [M 1 , M2 , M3 , M4 ] soit réel.
Voir le corollaire du théorème de l’angle inscrit (p. 293).
Démonstration. Soit z1 , z2 , z3 , z4 les affixes relativement à un repère orthonormé direct et ρ = [M1 , M2 , M3 , M4 ] = [z1 , z2 , z3 , z4 ]. 1) Supposons qu’aucun de ces points n’est ∞. On a ρ=
z3 − z1 z3 − z2 : z4 − z1 z4 − z2
d’où les congruences modulo 2π z − z z − z −−→ −−→ −−→ −−→ 3 1 3 2 − arg = (M1 M4 , M1 M3 ) − (M2 M4 , M2 M3 ) arg(ρ) ≡ arg z4 − z1 z4 − z2 Pour que ρ soit réel, il faut et il suffit que son argument soit nul modulo π , donc qu’on −−→ −−→ −−→ −−→ ait (M1 M4 , M1 M3 ) ≡ (M2 M4 , M2 M3 ) modulo π . Comme cette congruence est modulo π , on peut s’exprimer en termes d’angles de droites :
(M1 M 4 , M1 M3 ) ≡ (M2 M 4 , M2 M3 ) modulo π ce qui équivaut à ce que les quatre points soient cocycliques ou alignés (p. 293), donc appartiennent à un même cercle généralisé. 2) Supposons qu’un de ces points soit ∞, par exemple M 4 = ∞. On a
ρ = [z1 , z2 , z3 , ∞] =
z3 − z1 z3 − z2
© Dunod. La photocopie non autorisée est un délit.
d’où les congruences modulo 2π
arg(ρ) ≡ arg
z − z −−→ −−→ 3 1 ≡ (M2 M3 , M1 M3 ) z3 − z2
Pour que ρ soit réel, il faut et il suffit que son argument soit nul modulo π , donc −−→ −−→ que (M2 M3 , M1 M3 ) ≡ 0, c’est-à-dire que les trois points M 1 , M2 , M3 soient alignés. Ceci équivaut à ce que M1 , M2 , M3 , ∞ soient cocycliques au sens généralisé car les droites sont les cercles généralisés passant par ∞. Corollaire Soit A, B deux points distincts du plan annalagmatique et F le faisceau de cercles à points de base A, B. Pour tout M 0 distinct de A, B, le cercle de F passant par M0 est : / 0 C0 = M ∈ Pˇ | [A, B, M0 , M] ∈ R
i
i i
i
i
i
i
i
13 • Nombres complexes et géométrie
358
13.3.3. Faisceaux de cercles à points-limite Théorème 13.11. Soit A, B deux points distincts du plan annalagmatique et F le
faisceau de cercles (généralisés) de points limites A, B. Pour que deux points distincts P, Q appartiennent au même cercle de F , il faut et il suffit que le birapport [A, B, P, Q] soit de module 1.
Démonstration. Soit P, Q deux points distincts entre eux et de A, B, a, b, p, q les affixes de A, B, P, Q. Posons ρ = [A, B, P, Q] = [a, b, p, q]. 1) Supposons qu’aucun des points A, B n’est ∞. On a
|ρ| =
PA QA |p − a| |q − a| : = : |p − b| |q − b| PB QB
Par le théorème 11.20 (p. 298), pour que P et Q soient sur le même cercle de F il faut QA et il suffit que PA PB = QB , donc que |ρ| = 1. 2) Supposons que B = ∞. On a
|ρ| =
PA |p − a| = |q − a| QA
On sait que les cercles de F sont les cercles de centre A (p. 301). Pour que P et Q soient sur le même cercle de F , il faut et il suffit que PA = QA, donc que |ρ| = 1.
13.3.4. Quadrangle harmonique Définition 13.12. On dit que quatre points distincts A, B, P, Q forment un
quadrangle harmonique si [A, B, P, Q] = −1
Comme −1 est réel, un quadrangle harmonique est formé de points alignés ou cocycliques. S’ils sont alignés, ils forment une division harmonique au sens du chapitre 8 (13.9 et 8.25, p. 216). En particulier, pour Q = ∞, on a [A, B, P, ∞] = −1 si et seulement si P est milieu de (A, B). En effet, [a, b, p, ∞] = p−a p−b a la valeur −1 si et seulement si 2p = a + b. Il nous reste à étudier le cas où les points ne sont pas alignés. Proposition 13.13. Soit A, B, P, Q quatre points distincts d’un cercle Γ de centre O. On a équivalence entre
(i) [A, B, P, Q] = −1, (ii) la droite (AB) et les tangentes en P, Q à Γ sont concourantes ou parallèles. (iii) la droite (PQ) et les tangentes en A, B à Γ sont concourantes ou parallèles,
i
i i
i
i
i
i
i
13.3 La géométrie des cercles et C
359
Cas général : Γ
P Ω
A
B
Q
R
C
Le cas particulier où P et Q sont diamétralement opposés :
Q
© Dunod. La photocopie non autorisée est un délit.
Γ
Ω
A
B
P C
Le point R est envoyé à l’infini.
i
i i
i
i
i
i
i
360
13 • Nombres complexes et géométrie
Démonstration. Le nombre −1 est le seul nombre complexe distinct de 1 qui soit à la fois réel et de module 1. Par le théorème 13.11, on a [A, B, P, Q] = −1 si et seulement si P et Q sont sur un même cercle γ du faisceau à points limites A, B, donc si ce sont les intersections de Γ et d’un cercle γ centré en un point R ∈ (AB) orthogonal à Γ (éventuellement la médiatrice de (A, B)). Il revient au même de dire que les tangentes en P, Q à Γ se rencontrent en R sur (AB), ou sont parallèles à (AB). Ceci donne l’équivalence de (i) et (ii). Comme dans un quadrangle harmonique, les paires A, B et P, Q jouent le même rôle l’une par rapport à l’autre, on a aussi l’équivalence de (i) et (iii). Exercice 13.11. On donne quatre points distincts du plan annalagmatique M 1 , M2 , M3 , M4
et on pose ρ = [M1 , M2 , M3 , M4 ]. Montrer que la modification de l’ordre des M i donne les valeurs suivantes pour le birapport : 1 1 = [M3 , M1 , M2 , M4 ] ρ = [M1 , M2 , M3 , M4 ], 1 − = [M2 , M3 , M1 , M4 ], ρ 1−ρ ρ 1 = [M2 , M1 , M3 , M4 ], = [M3 , M2 , M1 , M4 ], 1 − ρ = [M1 , M3 , M2 , M4 ] ρ ρ−1 Exercice 13.12. Soit A, B, C, D quatre points distincts d’un même cercle. Les six
valeurs deux à deux inverses du birapport sont réelles (13.10, p. 357). Montrer que parmi elles, deux sont négatives et quatre positives (faire le produit des trois valeurs de la première ligne de l’exercice précédent). Montrer que si [A, B, C, D] < 0, alors A et B sont de part et d’autre de (CD). Exercice 13.13. Théorème de Ptolémée. On donne quatre points distincts A, B, C, D
de P . Montrer l’inégalité
AB × CD BC × AD + AC × BD avec égalité si et seulement si A, B, C, D sont sur un même cercle ou alignés, les segments [A, B] et [C, D] ayant une intersection non vide. On remarquera que ρ 1 1 = ρ + (1 − ρ) = 1ρ + (1 − 1ρ ) = 1−ρ + ρ−1 . Exercice 13.14. Relation de Newton. Soit A, B, P, Q quatre points distincts d’affixes
a, b, p, q . 1) Montrer que [A, B, P, Q] = −1 si et seulement si
2(ab + pq) = (a + b)(p + q) 2) Soit I, J les milieux de (A, B) et de (P, Q). Montrer qu’on a équivalence entre les conditions (i) [A, B, P, Q] = −1, − → − → (ii) (AB) est bissectrice de (IP, IQ) et IP × IQ = IA2 = IB2 , − → − → (iii) (PQ) est bissectrice de (JA, JB) et JA × JB = JP2 = JQ2 .
i
i i
i
i
i
i
i
13.3 La géométrie des cercles et C
361
Exercice 13.15. Quadrangle équianharmonique. 1) Soit ρ et ρ de module 1. Mon-
trer que ρ + ρ = 1 si et seulement si l’un des deux nombres ρ, ρ est −j et l’autre −j 2 (remarquer que les parties imaginaires de ρ et ρ doivent être opposées). 2) Soit quatre points A, B, C, D d’affixes a, b, c, d. Montrer que les six valeurs du birapport (13.11) sont toutes de module 1 si et seulement si
ρ =1−
1 1 = = −j ou − j 2 ρ 1−ρ
S’il en est ainsi, on dit que (A, B, C, D) est un quadrangle équianharmonique. 3) Montrer qu’il en est ainsi si et seulement si
AB × CD = BC × AD = CA × BD 4) Que dire de trois points formant avec ∞ un quadrangle équianharmonique ? 5) Soit A, B, C trois points distincts. Construire deux points D et D tels que (A, B, C, D ) et (A, B, C, D ) soient équianharmoniques.
Exercice 13.16. Soit un triangle ABC, Γ le cercle circonscrit, a, b, c les affixes des sommets. On pose
α=
c−b , c−b
β=
a−c , a−c
γ=
b−a b−a
© Dunod. La photocopie non autorisée est un délit.
Pour tout M d’affixe z , on note A , B , C les symétriques de M relativement aux côtés (BC), (CA), (AB) et a , b , c leurs affixes. 1) Montrer les formules
a = α(z − b) + b = α(z − c) + c b = β(z − c) + c = β(z − a) + a c = γ(z − a) + a = γ(z − b) + b 2) En déduire [A , B , C , ∞] =
a −c b −c
= [a, b, c, z]
3) En déduire que M ∈ Γ si et seulement si A , B , C sont alignés (voir problème 11.3, p. 309). Montrer que C est milieu de (A , B ) si et seulement si [A, B, C, M] = −1. 4) Montrer que A B C est équilatéral si et seulement si A, B, C, M est équianharmonique.
i
i i
i
i
i
i
i
13 • Nombres complexes et géométrie
362
13.4 GROUPE CIRCULAIRE 13.4.1. Les homographies Définition 13.14. On appelle homographie numérique de C toute fonction
du type h : z → ad − bc = 0.
az+b cz+d
où a, b, c, d sont des coefficients complexes tels que
Pour c = 0, on retrouve les similitudes directes pour la structure de plan affine euclidien de C (13.1, p. 350). Pourquoi imposer la condition ad − bc = 0 ? Si ad − bc = 0, il existe λ tel que a = λc et b = λd et h(z) = λ pour tout z = − dc , la fonction h est constante. Si c = 0, h n’est pas définie en − dc . On prolonge h en une bijection de C sur lui-même en posant • si c = 0, h(− dc ) = ∞ et h(∞) = ac , • si c = 0, h(∞) = ∞. Les similitudes directes sont donc les homographies laissant fixe ∞. On vérifie que la composée de deux homographies est une homographie et que −1 : z → −dz+b . Les homographies numériques l’inverse de h : z → az+b cz+d est h cz−a forment le groupe circulaire direct numérique noté H + (C). Théorème 13.15. (i) Les homographies sont les applications de C dans C conservant
le birapport.
(ii) Étant donné deux triplets (z 1 , z2 , z3 ) et (z1 , z2 , z3 ) où les zi (resp. les zi ) sont distincts, il existe une homographie unique h telle que h(z i ) = zi pour les trois indices.
Démonstration. 1) Montrons qu’une homographie h : z → port. C’est immédiat si c = 0. Supposons c = 0. Alors
az+b cz+d
conserve le birap-
+ d) − ad a ad − bc c +b = − cz + d c c(cz + d) On voit que h est composée des applications a ad − bc , z −→ − z z −→ cz + d, z −→ cz c Le lecteur vérifiera que chacune d’elles conserve le birapport. Ceci établit la moitié de (i) car il restera à montrer qu’une application conservant le birapport est une homographie. 2) Étant donné les deux triplets z 1 , z2 , z3 et z1 , z2 , z3 , on va montrer qu’il existe une unique application h conservant le birapport transformant z 1 , z2 , z3 en z1 , z2 , z3 et que c’est une homographie. Ceci établira (ii) et la moitié manquante de (i). h(z) =
a c (cz
i
i i
i
i
i
i
i
13.4 Groupe circulaire
363
Si h conserve le birapport et transforme les z i en les zi , on aura pour tout z distinct de z1 , z2 , z3 [z1 , z2 , z3 , z] = [z1 , z2 , z3 , h(z)] En remplaçant les birapports par leurs expressions, on constate que cette relation permet le calcul de h(z) (ce qui prouve l’unicité de h qui est bien déterminée), que la formule obtenue pour h(z) est bien celle d’une homographie et enfin qu’elle est encore valable si z est l’un des z i . En particulier, si une homographie laisse fixe trois points, c’est l’identité. Définition 13.16. Étant donné un plan affine euclidien P et son complété anna-
lagmatique, on appelle homographie de P toute application de Pˇ dans luimême conservant le birapport.
ˇ dans lui-même est une homographie Proposition 13.17. (i) Une application h de P si et seulement si son expression complexe dans un repère (orthonormé direct) est une homographie numérique. S’il en est ainsi, l’expression complexe de h dans n’importe quel repère est une homographie numérique. (ii) Les homographies de Pˇ forment un groupe pour la composition appelé groupe ˇ . circulaire direct de P noté H + (P)
Démonstration. Soit R un repère, h une application de Pˇ dans lui-même, hR l’expression complexe de h. Soit M 1 , M2 , M3 , M4 des points, M1 , M2 , M3 , M4 les images par h, z1 , z2 , z3 , z4 et z1 , z2 , z3 , z4 les affixes de M1 , M2 , M3 , M4 et M1 , M2 , M3 , M4 . Alors zi = hR (zi ) et on a (13.8, p. 356)
© Dunod. La photocopie non autorisée est un délit.
[M1 , M2 , M3 , M4 ] = [z1 , z2 , z3 , z4 ]
et
[M1 , M2 , M3 , M4 ] = [z1 , z2 , z3 , z4 ]
Il est clair que h conserve le birapport si et seulement si h R conserve le birapport c’est-à-dire si hR est une homographie numérique. Le repère R étant quelconque, la preuve de (i) est finie. Le fait que les homographies forment un groupe vient de ce qu’il en est ainsi pour l’ensemble des homographies numériques. Théorème 13.18. Les homographies transforment cercles généralisés en cercles
généralisés et conservent l’orthogonalité. Cette propriété explique la terminologie de groupe circulaire.
Démonstration. Soit h une homographie et C un cercle. Soit A, B, C trois points de C , A , B , C les images de A, B, C par h, C le cercle passant par A , B , C . Pour tout M ∈ C d’image M , on a [A, B, C, M] = [A , B , C , M ]. Ce nombre est réel, donc M ∈ C (13.10, p. 357) et h(C) ⊂ C . On montre de même que h−1 (C ) ⊂ C , d’où h(C) = C . / Γ. Alors C Soit C, Γ deux cercles orthogonaux de transformés C , Γ . Soit A ∈ C , A ∈ est orthogonal aux cercles du faisceau F contenant Γ et le cercle-point {A}. Comme A∈ / Γ, F est à points limites A, B et B ∈ C . Soit A , B les transformés de A, B. Ils sont sur C = h(C).
i
i i
i
i
i
i
i
13 • Nombres complexes et géométrie
364
Soit M, N deux points de Γ, M , N leurs transformés qui sont sur Γ . Alors [A, B, M, N] = [A , B , M , N ] est de module 1 (13.11, p. 358) donc Γ appartient au faisceau F à points limites A , B . Le cercle C passant par ces points appartient au faisceau conjugué F ⊥ à points de base A , B , donc est orthogonal à Γ .
13.4.2. Points fixes d’une homographie Cherchons les points fixes de l’homographie numérique h : z →
az+b cz+d .
1) Cas d’une similitude directe : c = 0 et d = 0 car ad−bc = 0. On a h(z) = ad z+ db et ∞ est point fixe. • Pour a = d, h(z) = z + db . Si b = 0, h est l’identité, sinon la similitude est une translation et ∞ est l’unique point fixe. • Pour a = d, c’est une similitude de centre le point d’affixe points fixes en comptant ∞.
b d−a
; il y a donc deux
2) Cas où c = 0, h(∞) = ac = ∞. On trouve les points fixes en étudiant l’équation h(z) = z , c’est-à-dire les racines dans C du trinôme cX 2 − (a − d)X − b, de discriminant
∆(h) = (a − d)2 + 4bc = (a + d)2 − 4(ad − bc) • Pour ∆(h) = 0 il y a deux points fixes distincts. • Pour ∆(h) = 0, il y a un point fixe unique
a−d 2c .
On dit que h est une élation.
Remarquons que pour c = 0, h est une similitude directe avec ∞ pour point fixe ; ce sera une élation si et seulement si ∞ est seul point fixe, c’est-à-dire si h est une translation : a = d, (a − d)2 = ∆(h) = 0. Pour une homographie h sur un plan P , on applique les résultats de cette discussion à la représentation complexe de h dans un repère. Proposition 13.19. Soit h une homographie avec deux points fixes U, V (distincts).
Pour tout M, le birapport [U, V, M, h(M)] est indépendant de M.
Démonstration. Raisonnons numériquement. Soit u et v les affixes de U, V. Soit z 0 distinct de u, v . Alors z1 = h(z0 ) = z0 . Posons ρ = [u, v, z0 , z1 ]. Pour tout z , définissons h (z) par la relation [u, v, z, h (z)] = ρ. Ceci permet le calcul de h (z) en fonction de u, v, z . On constate que l’expression obtenue est celle d’une homographie. On a h = h car h et h coïncident en u, v, z0 (13.15, p. 362). Comme h a la propriété, le résultat est établi. Exemple : Soit la similitude z → az + b où a = 0. On a les points doubles v = et ∞. Alors (az + b) − (av + b) az + b − v = =a [∞, v, z, az + b] = z−v z−v
b 1−a
i
i i
i
i
i
i
i
13.4 Groupe circulaire
365
13.4.3. Involutions Définition 13.20. Une homographie h, distincte de l’identité, est une involution si elle est elle-même sa propre inverse. Proposition 13.21. Une homographie h est une involution si et seulement si elle a deux points fixes distincts U, V et si [U, V, M, h(M)] = −1 pour tout M.
Démonstration. Montrons qu’une homographie ayant cette propriété est une involution. On prend U, V tels que [U, V, M, h(M)] = −1 pour tout M. Comme −1 est son propre inverse, on a 2 3 1 = −1 = U, V, h(M), h h(M) [U, V, h(M), M] = [U, V, M, h(M)] donc, M = h h(M) , d’où h2 = Id. Inversement, soit h une involution et U un point fixe (il en existe au moins un). Soit M 0 un point distinct de son image M 1 , V tel que [U, V, M0 , M1 ] = −1 et h l’involution de points fixes U et V. Alors h et h coïncident en U, M0 , M1 , donc h = h (13.15, p. 362) a bien la propriété. Description géométrique des involutions Montrons qu’on peut construire l’image d’un point quelconque par une involution. Notons U, V les points fixes de l’involution h. Pour tout M, h(M) = M est tel que U, V, M, M est un quadrangle harmonique (13.13, p. 358). Si M est sur la droite (UV), c’est le conjugué harmonique de M relativement à U, V au sens du chapitre 8 (8.25, p. 216).
© Dunod. La photocopie non autorisée est un délit.
Sinon, on construit le cercle Γ = (UVM). On joint M à l’intersection R des tangentes en U, V à Γ. Cette droite recoupe Γ en M = h(M). Si un point fixe est U = ∞, alors h est une similitude involutive, c’est-à-dire la symétrie centrale de centre V.
13.4.4. Les antihomographies Nous allons étudier un autre type de transformations qui jouent pour les homographies le rôle que jouent les antidéplacements pour les déplacements. On appelle antihomographie toute application f du plan annalagmatique Pˇ dans lui-même transformant les birapports en leurs conjugués : pour M1 , M2 , M3 , M4 distincts on a Définition 13.22.
[f (M1 ), f (M2 ), f (M3 ), f (M4 )] = [M1 , M2 , M3 , M4 ]
i
i i
i
i
i
i
i
366
13 • Nombres complexes et géométrie
Théorème 13.23. (i) Les réflexions sont des antihomographies.
(ii) Étant donné une réflexion σ , l’application f → f ◦ σ (resp. f → σ ◦ f ) est ˇ des homographies et l’ensemble H − (P) ˇ des involutive et échange l’ensemble H + (P) antihomographies. ˇ et H− (P) ˇ est un groupe noté H(P) ˇ appelé (iii) La réunion des ensembles H + (P) + ˇ est un sous-groupe d’indice 2. groupe circulaire de P , dont H (P) (iv) Les homographies et antihomographies transforment cercles généralisés en cercles généralisés et conservent l’orthogonalité.
Démonstration. (i) Soit σ la réflexion d’axe une droite ∆ de P . Pour que l’énoncé ait un sens, il faut préciser comment on prolonge σ à Pˇ . On posera σ(∞) = ∞. Soit → → → u,− v ) où O ∈ ∆ et − u est vecteur directeur de ∆. un repère orthonormé direct (O, − Autrement dit, ∆ est l’axe des réels. La représentation complexe de σ est alors z → z . C’est bien une antihomographie. (ii) Ce point est immédiat à vérifier. Il en résulte que la représentation complexe d’une antihomographie est z → az+b cz+d avec ad − bc = 0. ˇ . Étudions g ◦ f : (iii) Soit f, g dans H(P) • si f conserve le birapport et g conserve le birapport, alors g◦f conserve le birapport, donc est une homographie, • si f conserve le birapport et g conjugue le birapport, alors g ◦ f conjugue le birapport, donc est une antihomographie, • si f conjugue le birapport et g conserve le birapport, alors g ◦ f conjugue le birapport, donc est une antihomographie • si f conjugue le birapport et g conjugue le birapport, alors g ◦ f conserve le birapport, donc est une homographie.
ˇ est un groupe et que H+ (P) ˇ est sous-groupe On en déduit facilement que H( P) d’indice 2. (iv) On connaît le résultat pour les homographies (13.18, p. 363). Il est très facile à vérifier pour les réflexions. Il est donc vrai pour les antihomographies. Définition 13.24. Étant donné un point O ∈ P et un nombre k = 0, on appelle
inversion de pôle O et de puissance k l’application notée Inv(O, k) involutive de Pˇ sur lui-même ainsi définie :
• Inv(O, k) échange O et ∞, • à M distinct de O et de ∞, Inv(O, k) associe le point M de la droite (OM) tel que OM × OM = k. Nous avons déjà rencontré cette transformation en exercice au chapitre 11 (11.4, p. 296).
i
i i
i
i
i
i
i
Exercices
367
Proposition 13.25. (i) Les inversions sont des antihomographies.
(ii) Les antihomographies qui sont involutives sont les réflexions et les inversions.
Démonstration. (i) Soit l’inversion Inv(O, k). Prenons un repère orthonormé direct d’origine O. On voit facilement que l’application z → kz pour z = 0 et échangeant 0 et ∞ est représentation complexe de cette inversion, d’où le résultat. (ii) Il est clair que les réflexions et les inversions sont involutives. Inversement, soit f une antihomographie telle que f = f −1 . • Supposons f (∞) = ∞. Prenons un repère et la représentation complexe de f encore notée f . Elle est du type z → az+b cz+d . La condition f (∞) = ∞ donne c = 0. Alors d = 0 car ad − bc = 0. En remplaçant a, b par ad , db , on se ramène au cas où f (z) = az + b. C’est donc une application affine (13.2, p. 351). Comme f est involutive et conserve les milieux, elle laisse fixe le milieu O de deux points homologues. Plaçons l’origine en O. Alors b = 0 et f (z) = az . Comme f est sa propre inverse, on a z = f f (z) = aaz pour tout z . Ceci impose |a| = 1 et il existe θ tel que a = eiθ . Alors f est composée des applications de représentations complexes z → z et z → eiθ z , c’est-à-dire d’une réflexion d’axe passant par O et d’une rotation de centre O. C’est donc une réflexion. • Supposons que f échange O et ∞. La représentation complexe de f dans un repère d’origine O, encore notée f , est z → az+b cz+d avec a = 0 pour f (∞) = O et d = 0 b pour f (O) = ∞. La représentation complexe est donc z → cz . L’inverse f −1 a pour représentation complexe z → czb . Comme f = f −1 , on a réel car k = k. D’où f = Inv(O, k).
b c
=
b c
= k où k est
EXERCICES
© Dunod. La photocopie non autorisée est un délit.
Exercice 13.17. Montrer qu’une homographie h transforme un faisceau de cercles en un faisceau de cercles de même nature. Exercice 13.18. Soit A, B deux points distincts et h une homographie échangeant A et
B. Montrer que h est une involution (considérer les points fixes de h et h 2 et utiliser 13.15, p. 362) Exercice 13.19. Point de Frégier d’une involution sur un cercle. Soit h une involution de points fixes U, V. 1) Montrer qu’un cercle généralisé est stable par h si et seulement si il appartient au faisceau F(U, V) de points-limites U, V ou au faisceau F ⊥ (U, V) à points de base U, V.
2) On suppose que C est un cercle à centre O stable par h. Montrer que pour tout M ∈ C , la droite ∆M joignant M et h(M) passe par un point fixe (ou est de direction fixe) F appelé point de Frégier situé sur la droite des centres du faisceau F(U, V) ou F ⊥ (U, V) auquel C appartient (distinguer les deux cas).
i
i i
i
i
i
i
i
368
13 • Nombres complexes et géométrie
Exercice 13.20. Groupe de Klein. Soit h1 , h2 deux involutions distinctes de points fixes U1 , V1 pour h1 , U2 , V2 pour h2 . On pose h3 = h2 ◦ h1
1) Montrer qu’on a équivalence entre les conditions • (i) h1 et h2 commutent, • (ii) h3 est une involution, • (iii) h2 échange U1 et V1 , • (iv) h1 échange U2 et V2 . 2) Dans ces conditions, montrer que {Id, h 1 , h2 , h3 } est un groupe commutatif. 3) Étant donné un ensemble Q de quatre points distincts, montrer qu’il existe un tel groupe d’involutions laissant stable Q.
ˇ et GA le groupe des homographies admettant A Exercice 13.21. Soit A un point de P pour point fixe.
ˇ conjugué du groupe des simili1) Montrer que GA est un sous-groupe de H+ (P) tudes directes de P . 2) Quelles sont les conjuguées dans G A des translations de P ? 3) Pour tout h = Id de GA , on a les éventualités : • Si h ∈ GA a un deuxième point fixe B ∈ Pˇ , pour tout M, la valeur du birapport [A, B, M, h(M)] est une constante ρ(h) (13.19, p. 364). • Si h est une élation et n’a donc pas de deuxième point fixe, on pose ρ(h) = 1. Montrer que l’application h → ρ(h) est un morphisme de groupe G A → C× . Exercice 13.22. Soit un ensemble T = {A1 , A2 , A3 } de trois points distincts.
1) Montrer que le groupe G(T ) des homographies laissant T stable est isomorphe à S3 (utiliser 13.15), p. 362). 2) Montrer que ces groupes G(T ) forment une classe de conjugaison de sousˇ . groupes de H+ (P) 3) On suppose que T est un triangle de cercle circonscrit Γ. Construire les points fixes des trois involutions de G(T ) (utiliser l’exercice 13.19). 4) En déduire un autre triangle T tel que G(T ) = G(T ) (considérer les points fixes des involutions de G(T )). 5) Construire T si A1 = ∞.
i
i i
i
i
i
i
i
Problèmes
369
Exercice 13.23. 1) Soit Q un quadrangle harmonique. Montrer que le groupe des homographies laissant Q stable est diédral de cardinal 8.
2) Montrer que les groupes G(Q) forment une classe de conjugaison de sousˇ . groupes de H+ (P) Exercice 13.24. 1) Soit Q un quadrangle équianharmonique. Montrer que le groupe des homographies laissant stable Q est isomorphe au groupe alterné A 4 .
2) Montrer que les groupes G(Q) forment une classe de conjugaison de sousˇ . groupes de H+ (P)
PROBLÈMES Les corrigés de ces problèmes sont disponibles sur le site de Dunod : www.dunod.com.
13.1. PROBLÈME Dans un plan affine euclidien orienté P rapporté à un repère, on donne un polygone à n sommets A = (A0 , . . . , An−1 ) d’affixes a0 , . . . , an−1 . On note Mat(A) la matrice à une colonne dont les coefficients sont a 0 , . . . , an−1 . Soit la racine primitive n-ième de l’unité ω = exp( 2iπ n ) et P = (P0 , . . . , Pn−1 ) le polygone régulier direct convexe dont les sommets ont pour affixes 1, ω, . . . , ω n−1 . Il est commode pour les notations de supposer que l’indice varie dans Z/nZ au lieu de {0, 1, . . . , n − 1} de sorte que A(n−1)+1 = A0 .
© Dunod. La photocopie non autorisée est un délit.
1) Dans cette question, n = 4. On considère les conditions
(1) (2)
a0 + ia1 − a2 − ia3 = 0 a0 − a1 + a2 − a3 = 0
Quelles traductions géométriques ont ces relations pour A = (A 0 , A1 , A2 , A3 ) (la condition (1) seule, la condition (2) seule, les conditions (1) et (2) ensemble) ? 2) Soit la matrice à n − 2 lignes et n colonnes ⎛ 1 ω ω2 ⎜ 1 ω2 ω4 ⎜ Ω = ω hk = ⎜ .. .. .. ⎝ . . .
··· ···
ω n−1 ω 2(n−1) .. .
⎞ ⎟ ⎟ ⎟ ⎠
1 ω n−2 ω (n−2)2 · · · ω (n−2)(n−1) interprétée comme application linéaire de C n dans Cn−2 . Montrer que Ker Ω est engendré par les matrices à une colonne U et V de coefficients 1, . . . , 1 et 1, ω, . . . , ω n−1 .
i
i i
i
i
i
i
i
370
13 • Nombres complexes et géométrie
En déduire que A est un polygone régulier direct convexe si et seulement si on a la relation matricielle Ω Mat(A) = O (exprimer que A est régulier direct convexe si et seulement si il se déduit de P par une similitude directe). 3) On dira que A est affinement régulier convexe s’il se déduit de P par une application affine. Interprétation géométrique pour n = 4. Montrer qu’il en est ainsi si et seulement si on a la relation matricielle Ω Mat(A) = O où Ω est la matrice à n colonnes et n − 3 lignes se déduisant de Ω en enlevant la première ligne. 4) On suppose n = 4. Soit A = (A0 , A1 , A2 , A3 ) quelconque. • On pose ah = • • •
ah+1 +ah . Quelle propriété possède A = (A0 , A1 , A2 , A3 ) ? 2 −ah On pose ah = iah+1 . Quelle propriété possède A = (A0 , A1 , A2 , A3 ) ? i−1 ia −ah On pose bh = h+1 d’image Bh . Quelle propriété possède B = (B0 , B1 , B2 , B3 ) ? i−1 a +a On pose bh = h+12 h d’image Bh . Quelle propriété possède B = (B0 , B1 , B2 , B3 ) ?
Faire des figures. 5) Soit u = 1 une racine n-ième de l’unité. On forme A = (A0 , . . . , An−1 ) d’affixes −ah a0 , . . . , an−1 où ah = uah+1 . u−1 Comment les polygones A et A sont-ils liés géométriquement ? Montrer que a0 + ua1 + · · · + un−1 an−1 = 0. Montrer que si v = 1 est une autre racine n-ième de l’unité telle que
a0 + va1 + · · · + v n−1 an−1 = 0, alors on a encore a0 + va1 + · · · + v n−1 an−1 = 0.
13.2. PROBLÈME Soit E un espace affine euclidien orienté de dimension 3 d’espace vectoriel associé E , P un plan de E , S une sphère de centre Ω, de rayon R, tangente en un point O à P , s le point de S diamétralement opposé à O, π la projection stéréographique de sommet s de S sur Pˇ = P ∪ {∞}. Soit G+ (S) (resp. G(S)) le groupe des rotations (resp. isométries) de E laissant S stable. On se propose d’étudier les bijections de Pˇ sur lui-même du type π ◦ f ◦ π −1 où f ∈ G+ (S) (resp. f ∈ G(S)). 1) Montrer que G+ (S) et G(S) sont isomorphes à SO(E) et O(E). 2) On oriente la droite (Os) de O vers s. Soit la rotation rot(Os, θ). Montrer que π◦rot(Os, θ)◦π −1 est une homographie dont on donnera les points fixes et le birapport (13.19, p. 364). 3) Soit a, b diamétralement opposés sur S , A = π(a), B = π(b) et ρ (ab) le retournement d’axe (ab). Montrer que π ◦ ρ (ab) ◦ π −1 est l’involution de points fixes A, B (utiliser 11.33, p. 307, 13.13, p. 358 et 13.21, p. 365).
i
i i
i
i
i
i
i
Solutions des exercices
371
4) En déduire que les π ◦ f ◦ π −1 sont des homographies si f décrit G + (S) (utiliser 8.43, p. 230). 5) Soit f une rotation d’axe (ab) orienté de a vers b et d’angle θ . Montrer que h = π◦f ◦π −1 est une homographie dont on donnera les points fixes et le birapport (on pourra montrer que f est conjuguée d’une rotation d’axe (Os) par un retournement). 6) Montrer que pour qu’une homographie h soit du type π ◦ f ◦ π −1 où f ∈ G+ (S), il faut et il suffit que h ait deux points fixes A, B homologues par l’inversion Inv(O, −4R2 ) et que le birapport de h soit de module 1.
ˇ isomorphe à S4 (utiliser 10.13, 7) Donner un exemple de sous-groupe fini de H + (P) p. 275).
SOLUTIONS DES EXERCICES Solution 13.1. L’origine étant O, soit a, b, c, z, z les affixes de A, B, C, M, M . La si-
militude (variable) des plaques MAC et CBM s’exprime par l’existence de θ et ρ tels que −→ BM AC − → − → − → =ρ= (AM, AC) ≡ θ ≡ (BC, BM ) mod2π et AM BC On en déduit z − b c−a =k= où k = ρeiθ z−a c−b Comme c − a = b et c − b = a, on en déduit z = kz .
M
Si on fixe des crayons en M et M , lorsque le crayon M décrit une figure F , la crayon décrit la figure se déduisant de F par la similitude de centre O, d’angle θ , de rapport
ρ.
© Dunod. La photocopie non autorisée est un délit.
Solution 13.2. 1) Le triangle ABC est équilatéral direct si et seulement si rot B, π3
transforme C en A, ce qui est équivalent à iπ a−b = e 3 = −j 2 c−b 2 autrement dit à a+bj +cj = 0. Le triangle est équilatéral indirect si a+bj 2 +cj = 0, et il sera équilatéral si et seulement si
(a + bj + cj 2 )(a + bj 2 + cj) = a2 + b2 + c2 − bc − ca − ab = 0 2) Pour que les images des racines a, b, c forment un triangle équilatéral, il faut et il suffit que
0 = a2 + b2 + c2 − bc − ca − ab = (a + b + c)2 − 3(bc + ca + ab) Les relations entre coefficients et racines donnent bc+ca+ab = µ, et a+b+c = −λ. La condition est donc µ = 13 λ2 .
i
i i
i
i
i
i
i
13 • Nombres complexes et géométrie
372
3) Soit p, q, r, a, b, c les affixes de P, Q, R, A, B, C. Supposons T direct. On a 2iπ 2π r−a − → − → = e− 3 = j 2 AQ = AR et (AQ, AR) ≡ − , soit 3 q−a
et deux autres formules analogues. On a donc
a(j 2 − 1) = qj 2 − r,
b(j 2 − 1) = rj 2 − p,
c(j 2 − 1) = pj 2 − q
(j 2 − 1)(a + bj + cj 2 ) = qj 2 − r + r − pj + pj − qj 2 = 0 d’où a + bj + cj 2 = 0. Solution 13.3. Cette équation est du type az + az + b = 0 où a = 0 et b ∈ R. Soit M
d’affixe z sur cette droite. On aura ⎧ ⎨ az1 + az1 + b = 0 az2 + az2 + b = 0 ⎩ az + az + b = 0 Le système linéaire homogène en x, y, t ⎧ ⎨ z1 x + z1 y + t = 0 z2 x + z2 y + t = 0 ⎩ zx + zy + t = 0 a une solution (a, a, b), non triviale car a = 0. On a donc ⎞ ⎛ z1 z1 1 det ⎝ z2 z2 1 ⎠ = 0 z z 1 soit z(z1 − z2 ) − z(z1 − z2 ) + z1 z2 − z2 z1 = 0. En multipliant par i, on obtient l’équation classique d’une droite contenant M 1 , M2 de façon évidente. On a donc bien l’équation de (M1 M2 ). Solution 13.4. 1) Comme P et A ne sont pas dans le même demi-plan limité par (BC),
PBC est indirect et on passe de B à C par la rotation de centre P et d’angle − π3 . On a donc c − p = −j(b − p), donc p = −j 2 b − jc et de même q = −j 2 c − ja et r = −j 2 a − jb. Les trois vecteurs ont même norme et font entre eux des angles ± 2π 3 car on a a−p = a+j 2 b+jc, b−q = b+j 2 c+ja = j(a−p), c−r = c+j 2 a+jb = j 2 (a−p) 2) Les équations de (AP), (BQ), (CR) sont (ex.13.3)
z(a − p) − z(a − p) + ap − ap = 0 z(b − q) − z(b − q) + bq − bq = 0 z(c − r) − z(c − r) + cr − cr = 0
i
i i
i
i
i
i
i
Solutions des exercices
373
où on a
ap − ap = jab + j 2 ac − j 2 ab + jac bq − bq = jbc + j 2 ba − j 2 bc − jba cr − cr = jca + j 2 cb − j 2 ca − jcb On constate alors que la somme des premiers membres des équations est identiquement nulle. Tout point commun au deux premières droites est aussi sur la troisième. Ces trois droites sont concourantes.
Solution 13.5. La méthode est exactement la trouve pour équation ⎛ z1 z1 z1 z1 ⎜ z2 z2 z2 z2 det ⎝ z3 z3 z3 z3 z z zz
même que pour l’exercice 13.3. On
⎞ 1 1 ⎟ =0 1 ⎠ 1
Solution 13.6. 1) Soit a, b, c, z les affixes de A, B, C, M. Supposons ABC direct, on
a a + bj + cj 2 = 0 (ex.13.2). D’où (z − a) + j(z − b) + j 2 (z − c) = 0 et (z − a) + j(z − b) = −j 2 (z − c). L’inégalité triangulaire donne
© Dunod. La photocopie non autorisée est un délit.
MC = | − j 2 (z − c)| = |(z − a) + j(z − b)| |(z − a)| + |j(z − b)| = MA + MB 2) L’inégalité |z1 + z2 | |z1 | + |z2 | est une égalité si et seulement si les images vectorielles de z1 et z2 sont colinéaires de même sens. L’inégalité précédente est une égalité si et seulement si les conditions équivalentes ci-dessous sont satisfaites z − a
2π = arg(j) = arg(z − a) = arg j(z − b) ⇔ arg z−b 3 Ceci équivaut à l’appartenance de M à l’arc indiqué. Solution 13.7. 1) Soit la matrice
⎛
⎞ a1 b1 c1 − → − → − → M = MatB (OA, OB, OC) = ⎝ a2 b2 c2 ⎠ a3 b3 c3
− → − → − → Posons OA = OB = OC = l, longueur de l’arête du cube. Alors 1l M est une matrice orthogonale. On a a2 + b2 + c2 = (a1 + ia2 )2 + (b1 + ib2 )2 + (c1 + ic2 )2 = (a21 + b21 + c21 ) − (a22 + b22 + c22 ) + 2i(a1 a2 + b1 b2 + c1 c2 )
i
i i
i
i
i
i
i
13 • Nombres complexes et géométrie
374
La transposée d’une matrice orthogonale est orthogonale, donc les vecteurs colonnes → − → − → − V1 , V2 , V3 de la transposée t M sont de même normes et deux à deux orthogonaux. On a donc − → − → − → − → a2 + b2 + c2 = (V1 2 − V2 2 ) + 2iV1 · V2 = 0 2) Si O est isobarycentre du triangle projeté, on a
0 = (a + b + c)2 = a2 + b2 + c2 + 2ab + 2bc + 2ca = 2(ab + bc + ca) On a alors (a−b)2 +(b−c)2 +(c−a)2 = 0, donc a, b, c sont bien affixes des sommets d’un triangle équilatéral. 3) Considérons les images A , B , C de a, b, c dans P . On suppose a2 + b2 + c2 = 0. Il est évident que si A, B, C sont trois points de E ayant A , B , C pour projetés, sans autre hypothèse, nous ne parviendrons pas à prouver que ce sont les arêtes d’un cube (prendre par exemple A proche de A et B très loin sur la verticale de B , nous aurons OA < OB. Il reste à interpréter géométriquement la condition algébrique a 2 + b2 + c2 = 0. En− → − → − → visageons la réciproque ainsi : existe-t-il A, B, C de projetés A , B , C tels que OA, OB, OC soient les arêtes d’un cube ? Posons a = a1 + ia2 , b = b1 + ib2 , c = c1 + ic2 . On cherche a3 , b3 , c3 tels que la matrice ⎛ ⎞ a1 b1 c1 M = ⎝ a2 b2 c2 ⎠ a3 b3 c3 soit proportionnelle à une matrice orthogonale, i.e. que la transposée t M soit proportionnelle à une matrice orthogonale. Cela revient à compléter la matrice ⎛ ⎞ ⎛ ⎞ a1 a2 a3 ⎝ b1 b2 ⎠ par une troisième colonne ⎝ b3 ⎠ c1 c2 c3 de façon à obtenir une matrice proportionnelle à une matrice orthogonale. La condition a2 + b2 + c2 = 0 exprime que les vecteurs − → − → → → → → → → et e +b − e +c − e e +b − e +c − e V =a − V =a − 1
1 1
1 2
1 3
2
a21 + b21 + c21 =
a22 + b22 + c22
2 1
2 2
2 3
− → → → → sont orthogonaux de même norme l. On cherche V3 = a3 − e1 + b3 − e2 + c3 − e3 de norme − → − → l orthogonaux à V1 et V2 . On a deux solutions opposées → − → − → 1− → → → e1 + b3 − e2 + c3 − e3 ) V3 = ± V1 ∧ V2 = ±(a3 − l 1 1 1 où a3 = (b1 c2 − c1 b2 ), b3 = (c1 a2 − a1 c2 ), c3 = (a1 b2 − b1 a2 ) l -l - l et
l=
i
i i
i
i
i
i
i
Solutions des exercices
375
Solution 13.8.
1) L’affixe de M est 1 1 1 iϕ R e + R eiϕ eiωt z = (z + z ) = (a + a ) + 2 2 2 Le mouvement de M est donc circulaire uniforme cercle de vitesse angulaire ω sur un 1 de centre A, milieu de (A , A ), de rayon R = 2 R exp(iϕ ) + R exp(iϕ ).
2) Pour que M soit fixe, il faut et il suffit que R = 0, donc que RR = − exp i(ϕ −ϕ ) .
Comme RR est réel positif et − exp i(ϕ − ϕ ) est de module 1, ceci équivaut à R = R et ϕ = ϕ + π . Solution 13.9. 1) Si ϕ n’est pas injective, il existe z 0 = 0 tel que az0 = −bz0 , d’où
|a| × |z0 | = |b| × |z0 |, d’où |a| = |b|.
Inversement, si |b| = |a|, il existe θ tel que b = eiθ a. Le noyau est l’ensemble des vecteurs dont l’affixe z vérifie z + ze iθ = 0, soit arg(z) ≡ θ − arg(z) + π modulo 2π , c’est-à-dire arg(z) ≡ θ2 + π2 modulo π . Donc Ker(ϕ) est une droite vectorielle. 2) La base (1, i) de C devient (a + b, ia − ib), donc (13.1.1., p. 349) 1 (a+b)(ia−ib)−(−ia+ib)(a+b) = |a|2 −|b|2 det(ϕ) = det(a+b, ia−ib) = 2i 3) Le réel λ est valeur propre si et seulement si l’application z → (a − λ)z + bz est de déterminant nul, soit |a − λ| = |b|. Le polynôme caractéristique est
© Dunod. La photocopie non autorisée est un délit.
(a − X)(a − X) − |b|2 = X 2 − (a + a)X + |a|2 − |b|2 Pour trouver les λ ∈ R tels que |a − λ| = |b|, on trace la droite horizontale passant par A qui coupera (ou pas) le cercle de centre O et de rayon |b| en les images des a − λ. Si c’est le cas, c’est-à-dire si | Im(a)| |b|, on a deux valeurs propres réelles λ , λ . Solution 13.10. L’affixe de M est
1 1 1 R exp(iϕ )u(t) + R exp(iϕ )u(t) z = (z + z ) = (a + a ) + 2 2 2 On passe de u à z par une application affine dont l’application linéaire associée est u → K u + K u où K = 12 R exp(iϕ ) et K = 12 R exp(iϕ ). Dans C, u décrit le cercle trigonométrique et z décrit l’ellipse transformée de ce cercle par cette application affine. Son centre est le transformé de O, donc 12 (a + a ), affixe du milieu A de (A , A ). Cette ellipse dégénère en un segment si et seulement si cette application est non injective, donc (ex.13.9) si |K | = |K |, donc si R = R .
i
i i
i
i
i
i
i
13 • Nombres complexes et géométrie
376
La distance de M au centre est 1 AM = |z − a| = R exp i(ωt + ϕ ) + R exp i(−ωt + ϕ ) 2 • Elle est maximum si R exp i(ωt + ϕ ) et R exp i(−ωt + ϕ ) ont même argument modulo 2π , donc si ωt + ϕ = −ωt + ϕ = 12 (ϕ + ϕ ) ce qui donne la direction du grand axe. La longueur du grand axe est donc 12 (R + R ). • Elle est minimum si les arguments de R exp i(ωt + ϕ ) et R exp i(−ωt + ϕ ) diffèrent de π modulo 2π , donc si ωt + ϕ = −ωt + ϕ + π = 12 (ϕ + ϕ + π) ce qui donne la direction du petit axe. La longueur du petit axe est donc 12 |R − R |.
Solution 13.11. C’est un calcul. On peut le simplifier en supposant M 4 = ∞ et
en mettant l’origine en M 1 . Pour justifier cette supposition, on peut considérer une homographie envoyant M 4 à l’infini et en s’appuyant sur la conservation des birapports par les homographies (13.15, p. 362). Remarquons que l’on a ainsi toutes les valeurs possibles du birapport qui sont égales quatre à quatre. Les modifications provoquées par les permutations paires (resp. impaires) sont sur la première (resp. seconde) ligne.
1 Solution 13.12. On a les trois valeurs ρ, 1 − 1ρ , 1−ρ dont le produit est −1 et leurs
inverses. Donc on a deux nombres positifs et un négatif parmi ces trois nombres et de même parmi les inverses. Si [A, B, C, D] < 0, l’argument du birapport est π , d’où la congruence modulo 2π
− → − → − → − → (BC, BD) ≡ (AC, AD) + π
modulo 2π
ce qui donne le résultat. 1 Solution 13.13. Soit ρ = [A, B, C, D]. Par l’exercice 13.11, on a 1−ρ = [C, A, B, D] et ρ ρ−1
= [B, C, A, D], d’où BC × DA ρ AC × DB 1 , = [C, A, B, D] = = [C, B, A, D] = 1−ρ DC × BA ρ−1 AB × DC 1 1 ρ ρ On a 1 = 1−ρ + ρ−1 1−ρ + ρ−1 , d’où AB × CD BC × AD + AC × BD
ρ 1 avec égalité si et seulement si 1−ρ et ρ−1 ont même argument modulo 2π . Le rapport étant −ρ, ceci équivaut à ρ < 0 et on peut utiliser l’exercice précédent.
i
i i
i
i
i
i
i
Solutions des exercices
377
q−a Solution 13.14. 1) [A, B, P, Q] = p−a p−b : q−b , donc le birapport est −1 si et seulement
si
p−a p−b
+
q−a q−b
= 0. On obtient la formule en développant.
2) Plaçons l’origine en I. Alors a + b = 0 et ab = −a 2 = −b2 . Le quadrangle est harmonique si et seulement si pq = +a 2 = +b2 ce qui équivaut aux deux relations
|p| × |q| = |a|2 = |b|2 arg(p) + arg(q) ≡ 2arg(a) ≡ 2arg(b) modulo 2π C’est la traduction complexe de (ii). On a de même l’équivalence de (i) et (iii).
Solution 13.15. 1) Il est clair que −j, −j 2 vérifient la propriété −j 2 − j = 1,
| − j 2 | = | − j| = 1.
Inversement si ρ et ρ de module 1 vérifient ρ + ρ = 1, on a "(ρ) + "(ρ ) = 0, donc, ou bien ρ = −ρ, ou bien ρ = ρ = ρ−1 . La première éventualité n’est pas compatible avec ρ + ρ = 1. Donc ρ = ρ−1 = 1 − ρ, d’où ρ2 − ρ + 1 = 0 ce qui donne le résultat. 2) Si les six valeurs du birapport sont de module 1, c’est le cas de ρ et 1 − ρ, donc nécessairement ρ est −j ou −j 2 . On vérifie que c’est suffisant. Il n’y a plus que deux valeurs du birapport avec par exemple
© Dunod. La photocopie non autorisée est un délit.
ρ=1−
1 1 = = −j ρ 1−ρ
et
ρ 1 = = 1 − ρ = −j 2 ρ ρ−1
3) Cette relation traduit que les birapports sont de module 1. 4) Si [a, b, c, ∞] = −j , alors c−a c−b = −j . On passe donc de B à A par la rotation de centre C et d’angle arg(−j) ≡ − π3 . Le triangle ABC est donc équilatéral direct et inversement. 5) Considérons le faisceau F(A, B) de cercles à points limites A, B. Par 13.11 (p. 358), D est sur le cercle C de F(A, B) passant par C. Il est de même sur le cercle A de F(B, C) passant par A et sur le cercle B de F(C, A) passant par D. S’il est sur deux de ces cercles, il est sur le troisième à cause de la question 1). Ces trois cercles appartiennent à un même faisceau à points de base D , D qui sont les points cherchés. Soit Γ = (ABC). Pour construire C , on prend la tangente en C à Γ qui coupe (AB) en le centre de C .
i
i i
i
i
i
i
i
13 • Nombres complexes et géométrie
378
z−b Solution 13.16. 1) On a aa −b −c = z−c et deux autres relations analogues. On en déduit
a = α(z − b) + b = α(z − c) + c b = β(z − c) + c = β(z − a) + a c = γ(z − a) + a = γ(z − b) + b 2) La poursuite de ce calcul aboutit à
[a , b , c , ∞] =
a − c = [a, b, c, z] b − c
3) On a M ∈ Γ si et seulement si [A, B, C, M] est réel, donc si et seulement si [A , B , C , ∞] = [A, B, C, M]. On retrouve l’alignement de A , B , C sur la droite de Steiner de M avec en plus la localisation exacte. Ainsi, C est milieu de (A , B ) si et seulement si (A, B, C, M) est harmonique. 4) De même, le triangle A B C est équilatéral si et seulement si (A, B, C, M) est équianharmonique. Un quadrangle est équianharmonique si et seulement si les symétriques d’un sommet par rapport aux côtés du triangle formé par les trois autres, forment un triangle équilatéral. Solution 13.17. Soit A, B deux points distincts de transformés A , B .
Soit un cercle C du faisceau F ⊥ (A, B) à points de base A, B. Alors A, B étant sur C , A , B sont sur C = h(C), donc C ∈ F ⊥ (A , B ). On montre la réciproque en faisant le même raisonnement pour h −1 . Soit Γ un cercle du faisceau à points-limites F(A, B). Alors Γ est orthogonal à tout C ∈ F ⊥ (A, B), donc (13.18, p. 363) Γ = h(Γ) est orthogonal à tout C ∈ F ⊥ (A , B ), donc appartient à F(A , B ). On montre la réciproque en utilisant h −1 . Soit F un faisceau singulier de cercles n’ayant en commun qu’un seul point A (un faisceau de droites parallèles si A = ∞). Pour toute paire C 1 , C2 de F , {A} = C1 ∩C2 , donc {h(A)} = h(C1 ) ∩ h(C2 ). Les cercles h(C) sont tous tangents en h(A) (ou sont des droites parallèles si A = ∞), donc sont dans un même faisceau singulier F . En utilisant h−1 , on montre que tout C ∈ F est du type h(C) où C ∈ F . Solution 13.18. On sait (13.4.2., p. 364) que h a au moins un point fixe U. Alors
A, B, U sont trois points fixes pour h 2 = h ◦ h, d’où h2 = Id (13.15, p. 362) et h est une involution. Solution 13.19. 1) Soit C un cercle de F(U, V) (resp. F ⊥ (U, V)). Pour tout M de C ,
on a
[U, V, M, h(M)] = −1, donc h(M) ∈ C car −1 est de module 1 (resp. réel), donc h(C) = C . Inversement, soit C un cercle tel que h(C) = C .
i
i i
i
i
i
i
i
Solutions des exercices
379
Si U ∈ C , pour tout M ∈ C , [U, V, M, h(M)] = −1 est réel, donc V ∈ C et C ∈ F ⊥ (U, V). Supposons U, V non sur C . Le faisceau F(U, C) est stable et est à points-limites car il / C . Comme h(U) = U, le deuxième point-limite contient le cercle-point {U} avec U ∈ est fixe par h, donc est V. Donc C ∈ F(U, V). 2) a) Supposons que C ∈ F ⊥ (U, V). Pour tout M, on a [U, V, M, h(M)] = −1, donc ∆M et les tangentes en U et V à C passent par le même point F ou sont parallèles (13.13, p. 358). Inversement, soit C un cercle, F un point extérieur (éventuellement ∞). L’application associant à M ∈ C le point M où la droite (FM) recoupe C . C’est bien la restriction à C de l’involution de points fixes U, V, points de contact des tangentes à C issues de F.
b) Supposons C ∈ F(U, V). Soit M ∈ C , F le point où ∆M coupe (UV), ΓM le cercle de F ⊥ (U, V) passant par M. Il passe par U, V, M et h(M). Soit O le centre de C et R le rayon. On a OF2 − R2 = C(F) = FM × Fh(M) = ΓM (F) = FU × FV = (OU − OF)(OV − OF) D’où
OF(OU + OV) = R2 + OU × OV = R2 + ΓM (O) = 2R2
Ceci montre que F est fixe. Le point F est intérieur à C , sinon, (réciproque de a)) les points fixes U, V seraient les points de contact des tangentes à C issues de F et on serait dans le cas a). Le lecteur retrouvera cela en montrant que OF < R (utiliser la division harmonique formée par U, V et les points où (UV) coupe C ).
© Dunod. La photocopie non autorisée est un délit.
−1 = h ◦h , d’où l’équivalence (i) ⇔ (ii). Solution 13.20. 1) On a h−1 1 2 3 = (h2 ◦h1 )
La conjuguée h2 ◦ h1 ◦ h−1 2 = h2 ◦ h1 ◦ h2 est l’involution de points fixes h 2 (U1 ) et h2 (V1 ). Pour que h2 et h1 commutent, il faut et il suffit que h 2 ◦ h1 ◦ h−1 2 = h1 , donc que h2 laisse stable {U1 , V1 }. Comme h2 = h1 , U1 , V1 ne sont pas fixes par h2 . Donc {U1 , V1 } est stable par h2 si et seulement si h2 échange U1 et V1 , d’où l’équivalence (i) ⇔ (iii) et de même l’équivalence (i) ⇔ (iv). 2) Si ces conditions sont remplies h 1 ◦h3 = h1 ◦(h1 ◦h2 ) = h2 . On voit facilement que l’on a un groupe commutatif avec h i ◦ hj = hk pour i, j, k distincts. 3) Soit Q = {M0 , M1 , M2 , M3 }. Pour i, j, k distincts dans 1, 2, 3, il existe une homographie hi telle que (13.15, p. 362)
hi (M0 ) = Mi ,
hi (Mi ) = M0 ,
hi (Mj ) = Mk
Comme hi échange M0 et Mi , c’est une involution, (ex.13.18) donc hi échange Mj et Mk . Par le théorème 13.15 (p. 362), l’action des h i sur Q les définit entièrement. Par son action sur Q, le groupe {Id, h1 , h2 , h3 } s’identifie au sous-groupe de Klein de S 4 .
i
i i
i
i
i
i
i
380
13 • Nombres complexes et géométrie
Solution 13.21. 1) Le groupe des similitudes directes n’est autre que G ∞ . Pour toute homographie f telle que f (A) = ∞, on a G∞ = f GA f −1 .
2) Les translations sont les homographies ayant ∞ pour seul point fixe. Leurs conjuguées dans GA sont donc les élations de seul point fixe A. 3) Soit h de deuxième point fixe B. Posons O = f (B). Alors s = f ◦ h ◦ f −1 est une similitude directe de centre O. Pour tout M, on a
ρ(h) = [A, B, M, h(M)] = [f (A), f (B), f (M), f h(M) ]
= [∞, O, f (M), f ◦ h ◦ f −1 f (M) ] = [∞, O, M , s(M )] où M = f (M). Ceci n’est autre que le complexe associé à la similitude directe s = f ◦ h ◦ f −1 dont l’expression complexe dans un repère orthonormé direct est z → ρ(h)z + b où b est affixe de l’image s(O). On en déduit le résultat. On dit que ρ(h) est le birapport de h. Ceci présente une ambiguïté car cette notion dépend de l’ordre que l’on met sur les points fixes, les birapports [A, B, M, h(M)] et [B, A, M, h(M)] étant inverses l’un de l’autre. Si on s’intéresse au groupe G A , le point fixe A joue un rôle particulier et, convenant de le mettre en premier, l’ambiguïté disparaît.
Solution 13.22. 1) C’est une conséquence du théorème 13.15 : étant donnés deux tri-
plets ordonnés de trois points distincts, il existe une unique homographie transformant l’un en l’autre. 2) Soit T et T deux ensembles de trois points. Comme il existe six façons d’ordonner chaque ensemble, il existe six homographies transformant T en T . Soit h l’une d’elles. On a hG(T )h−1 = G(T ), d’où le résultat. 3) Il existe une unique involution u i laissant Ai fixe et échangeant A j et Ak (i, j, k distincts). Le point de Frégier F i de ui est l’intersection de la tangente en A i à Γ et de la droite (Aj Ak ) (ex.13.19). L’autre point fixe Ai est point de contact de l’autre tangente à Γ issue de Fi . 4) On a donc [Aj , Ak , Ai , Ai ] = −1. Le groupe G(T ) opère sur {1, 2, 3} : pour i ∈ {1, 2, 3} et g ∈ G(T ), on définit g(i) par g(Ai ) = Ag(i) . On a alors
−1 = [Aj , Ak , Ai , Ai ] = [g(Aj ), g(Ak ), g(Ai ), g(Ai )] = [Ag(j) , Ag(k) , Ag(i) , g(Ai )]
et − 1 = [Ag(j) , Ag(k) , Ag(i) , Ag(i) ] On en déduit g(Ai ) = Ag(i) . Le groupe G(T ) laisse donc stable T = {A1 , A2 , A3 }. Il est clair que les ensembles T et T jouent le même rôle l’un par rapport à l’autre. 5) Si A1 = ∞, A1 est milieu de (A2 , A3 ), et A2 (resp. A3 ) est milieu de (A3 , A3 ) (resp. (A2 , A2 )).
i
i i
i
i
i
i
i
Solutions des exercices
381
Solution 13.23. Soit un quadrangle harmonique Q = {M 0 , M1 , M2 , M3 }. C’est une
disposition particulière des paires de points {M 0 , M1 } et {M2 , M3 } l’une par rapport à l’autre : on peut intervertir deux paires et intervertir les deux points d’une paire sans changer le birapport −1 égal à son inverse :
−1 = [M0 , M1 , M2 , M3 ] = [M1 , M0 , M3 , M2 ] = [M2 , M3 , M0 , M1 ] = [M3 , M2 , M1 , M0 ] = [M1 , M0 , M2 , M3 ] = [M0 , M1 , M3 , M2 ] = [M3 , M2 , M0 , M1 ] = [M2 , M3 , M1 , M0 ] Il en résulte huit homographies laissant Q stable formant le groupe G(Q). Si Q et Q sont deux quadrangles harmoniques, il existe huit homographies transformant Q en Q . Si h est l’une d’elles, G(Q ) = hG(Q)h−1 . Soit Q = {M0 , M1 , M2 , M3 } un carré, M0 et M1 (resp. M2 et M3 ) étant deux sommets opposés. Le groupe cyclique d’ordre 4 des rotations laissant Q stable est un sousgroupe de G(Q). En revanche, les quatre réflexions laissant Q stable sont des antihomographies et n’appartiennent donc pas à G(Q). Cependant, l’involution de points fixes M 0 , M1 (resp. M2 , M3 ) appartient à G(Q) et opère sur Q comme la réflexion autour de la diagonale (M 0 M1 ) (resp. (M2 M3 )). Soit Γ le cercle circonscrit au carré, M 0 , M1 les points de Γ où la tangente est parallèle à (M0 M2 ) et (M1 M3 ). L’involution de points fixes M 0 , M1 appartient à G(Q) et agit sur Q comme la réflexion autour de la médiatrice de [M 0 , M2 ] et [M1 , M3 ]. De même pour l’involution échangeant M 0 , M2 avec M3 , M1 . Les groupes G(Q) sont donc diédraux.
© Dunod. La photocopie non autorisée est un délit.
Solution 13.24. Si on a [M0 , M1 , M2 , M3 ] = −j , alors toute permutation paire de
ces points conserve le birapport et toute permutation impaire le change en −j 2 . La méthode est la même que pour l’exercice précédent. Si σ est une permutation paire de {0, 1, 2, 3}, on a [M0 , M1 , M2 , M3 ] = [Mσ(0) , Mσ(1) , Mσ(2) , Mσ(3) ] et il existe une homographie unique hσ telle que hσ (Mi ) = Mσ(i) . L’application σ → hσ est l’isomorphisme A4 → G(Q).
Enfin, il est clair que hG(Q)h−1 = G h(Q) , donc ces groupes forment une classe ˇ . de conjugaison de H+ (P)
i
i i
i
i
i
i
i
Index
A
B
action de groupe 130 action fidèle 131 action transitive 131 adjoint 164 affinité orthogonale 336 algorithme d’Euclide 28, 45 angle 189–191 angle inscrit 292 annalagmatique 297, 355 anneau 25 commutatif 25 de Boole 46 euclidien 40 factoriel 41, 63 intègre 28 principal 40 produit 35 quotient 31 annulateur 35 antidéplacement 226 antihomographie 365 application 3 associé 36 automorphisme intérieur 133 axe focal 325 axe radical 291 axiome du choix 9
barycentre 244 base orthonormale 163 birapport 217, 355 birapport d’une homographie 380 bissectrice 227 bon ordre 9 borne supérieure 9 branches d’une hyperbole 318
C caractéristique d’un anneau 33 cardinal 5 centre 126, 290, 316 de gravité 247 cercle généralisé 297 orthoptique 347 principal 333 cercle directeur 333 Céva 219 coefficient dominant 60 cône isotrope 155 congruence 13 conique propre 319 conjugaison 212 contenu 63 coordonnées 206
i
i i
i
i
i
i
i
Solutions des exercices
corps 28 algébriquement clos 62 des fractions 47 fini 75 critère d’Eisenstein 65, 75 critères d’irréductibilité 65 cube 274
D décomposition d’Iwasawa 197 de Dunford 97 LU 196 polaire 196 QR 196 degré total 68 demi-plan 251 dénombrable 5 déplacement 226 dilatation 179, 235 dimension 206 directrice 327 discriminant 74 diviseur de zéro 27 diviseurs élémentaires 108, 129 division euclidienne 31, 40, 60 division harmonique 217 droite affine 207 d’Euler 225 de Simson 293 dualité 108
© Dunod. La photocopie non autorisée est un délit.
E élation 364 ellipse 317 endomorphisme autoadjoint 165 cyclique 105 normal 167 ensemble 1 inductif 10 quotient 11 vide 1 équation d’un hyperplan 208 normale d’un cercle 288 réduite 317, 319 équipotent 5 espace affine 204 hermitien 163 vectoriel euclidien 159
383
excentricité 327, 329 exposant 126
F facteurs invariants 127 faisceau conjugués 300 de cercles 299 harmonique 218 à points de base 294, 301 à points-limites 294, 300 famille 4 fonction affine 250, 304 circulaire 304 circulaire normale 290 de Möbius 75 quadratique affine ou f.q.a. 315 forme bilinéaire 147 antisymétrique 150 non dégénérée 148 symétrique 150 forme définie 155 forme quadratique 155 forme sesquilinéaire hermitienne 161 foyer 327
G groupe circulaire 362, 366 commutatif 126 cyclique 121 de Klein 130 des angles 190 diédral 122, 126 du rectangle 130 linéaire 181 orthogonal 183 produit 124 spécial linéaire 181 spécial orthogonal 187
H homographie 362 homothétie 183, 210 hyperbole 318 hyperplan affine 207
I idéal 30 bilatère 30, 31 maximal 37 premier 37
i
i i
i
i
i
i
i
384
principal 37 trivial 30 idéaux étrangers 39 indicateur d’Euler 47 indice 120 inégalité de Cauchy-Schwarz 159 inégalité de Minkowski 160 intersection 2 intérieur d’un triangle 253 inversible 26 inversion 296 involution 365 irréductible 36 isotrope 153
L lemme d’Euclide 14, 36 de Gauss 13, 44, 63 des noyaux 94
M masse 245 matrice compagnon 88 congruentes 149 hermitiennes 161 orthogonale 163, 188 unitaire 163 maximal 9 Ménélaüs 219 milieu 205 morphisme d’anneaux 29 de Frobenius 34 de groupes 120 multi-indice 68
Index
P parabole 319 parallèles 208 parallélogramme 205 paramètre 329 p.g.c.d. 14, 43, 45 plan affine 207 point de Frégier 367 point pondéré 245 polaire 323 polynôme antisymétrique 73 caractéristique 85 circulaire 288 cyclotomique 65, 74 minimal 85 primitif 63 symétrique 69 symétrique élémentaire 69 polynômes annulateurs 86 p.p.c.m. 14, 43, 45 premier 36 produit cartésien 3 d’une famille 4 mixte 267 scalaire 159 scalaire hermitien 161 vectoriel 269 projection stéréographique 304 puissance 287
Q quadrangle harmonique 358 quadrilatère complet 234 quotient de sous-espaces 102
R N nilpotent 35 normalisateur 134 norme hermitienne 162 norme subordonnée 110 noyaux itérés 109
O orbite 132 orientation 222 du plan 189 origine 206 orthocentre 224 orthogonalité 151, 297
racines multiples 61 réduction de Frobenius 102 réduction de Gauss 157 réduction de Jordan 99 réflexion 185, 187, 226 régulier 27 relation binaire 3 d’ordre 8 d’équivalence 11 de Bezout 44 de Chasles 205 repère affine 206
i
i i
i
i
i
i
i
barycentrique 247 représentation paramétrique 207 retournement 185, 195, 230 réunion 4 rotation 187
S segment 221 semilinéarité 161 signature 157 similitude directe 232 simplexe 247 situation orthocentrique 225 sommes de Newton 73 sommet 325 sous-anneau 28 sous-espaces caractéristiques 96 sous-espaces cycliques 103 sous-groupe distingué 123 sous-groupes 119 spectre 86 stabilisateur 132 stathme 40
T
U union 2 unité 26
V valeur propre 85 valuation 44 vecteur propre 86 vectorialisation 205 vissage 230
© Dunod. La photocopie non autorisée est un délit.
tangente 321 tétraèdre orthocentrique 273 régulier 274 équifacial 277 théorème chinois 38, 46 d’Appolonius 294 d’isomorphisme 33, 124 de Bézout 13 de Cantor 7
de Cantor-Bernstein 6 de Cayley 132 de Cayley-Hamilton 86 de correspondance 32, 124 de d’Alembert-Gauss 62 de Hadamard 93 de Krull 39 de Lagrange 120 de Napoléon 353 de Simson 293 de Steinitz 63 de Sylow 134 de Sylvester 157 de Wedderburn 66 de Zermelo 9 de Zorn 10, 39 spectral 166 transformation antisymétrique 195 transformation orthogonale 183 translation 204 transvection 179, 235 triangle direct 249 triangle orthique 225 trigonalisable 92
i
i i
i
i
i
i
i
Bibliographie
[1] Michel ALESSANDRI. Thèmes de Géométrie. Dunod, 1999. [2] Marcel BERGER. Géométrie. Cedic-Nathan, 1973. [3] Claude CARREGA. Théorie des corps. Hermann, 1975. [4] H.S.M. COXETER. Introduction to Geometry. John Wiley Sons, 1989. [5] Jean de BIASI. Mathématiques pour le CAPES et l’Agrégation Interne. Ellipses, 1995. [6] Jean DELCOURT. Théorie des Groupes. Dunod, 2001. [7] Jean DELCOURT. Problèmes de Mathématiques. Dunod, 2004. [8] Michel DEMAZURE. Cours d’Algèbre. Cassini, 1997. [9] Alain BOUVIER et Denis RICHARD. Groupes. Hermann, 1968. [10] Marie-Noëlle GRAS et Georges GRAS. Algèbre fondamentale, Arithmétique. Ellipses, 2004. [11] Serge FRANCINOU et Hervé GIANELLA. Exercices de Mathématiques pour l’Agrégation. Masson, 1993. [12] Jean-Marie ARNAUDIES et José BERTIN. Groupes et Géométrie. Ellipses, 1996. [13] H.S.M. COXETER et S.L. GREITZER. Redécouvrons la Géométrie. Dunod, 1971. [14] Jean FRESNEL. Méthodes Modernes en Géométrie. Hermann, 1996. [15] Rémi GOBLOT. Algèbre linéaire. Masson, 1995. [16] Rémi GOBLOT. Thèmes de géométrie. Masson, 1998. [17] Rémi GOBLOT. Algèbre commutative. Dunod, 2001. [18] Paul HALMOS. Naive set theory. Springer, 1986. [19] Rached MNEIMNE. Éléments de Géométrie. Cassini, 1997. [20] Jean-Marie MONIER. Géométrie, MPSI, MP. Dunod, 3e édition, 2003. [21] Daniel PERRIN. Cours d’algèbre. Ellipses, 1996. [22] Marc ROGALSKI. Carrefours entre Analyse, Algèbre et Géométrie. Ellipses, 2001. [23] Romain VIDONNE. Groupe circulaire, rotations et quaternions. Ellipses, 2001.
i
i i
i