Ce cours peut ˆetre librement copi´e et distribu´e. La version la plus r´ecente peut ˆetre t´el´echarg´ee `a partir de : http://www.math.jussieu.fr/~alp. Pri`ere d’adresser les remarques, corrections ou suggestions `a l’auteur :
[email protected]
Int´ egrale Simple. par Alain Prout´e Universit´e Denis Diderot — Paris 7
Table des mati` eres 1 Pr´ eliminaires. 1.1 Quelques questions de topologie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Le th´eor`eme des accroissements finis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Fonctions r´egl´ees. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Int´ egrale d’une fonction r´ egl´ ee. 2.1 D´efinition. . . . . . . . . . . . . . . . 2.2 Primitives. . . . . . . . . . . . . . . . 2.3 Techniques de calcul. . . . . . . . . . 2.4 Majoration des int´egrales. . . . . . . 2.5 Application aux nombres complexes. 2.6 Primitives des fractions rationnelles. Exercices . . . . . . . . . . . . . . . . . .
2 2 3 4
. . . . . . .
5 5 6 7 8 10 11 13
3 Int´ egrales g´ en´ eralis´ ees. 3.1 Convergence et crit`ere de Cauchy. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Crit`ere d’Abel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15 15 17 17
4 Int´ egrales d´ ependant d’un param` etre. 4.1 Cas d’un intervalle compact. . . . . . . 4.2 Cas d’un intervalle non compact. . . . 4.3 Un exemple. . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . .
18 18 21 23 24
Solution des exercices.
. . . . . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . .
26
Table des mati` eres Nous traitons ici l’int´egrale de Cauchy, c’est-`a-dire l’int´egrale de Riemann restreinte aux seules fonctions r´egl´ees. Ceci suffit `a couvrir les besoins de l’int´egration ´el´ementaire. Dans tout ce chapitre, [a, b] (a ≤ b) d´esigne un intervalle compact de R, et I un intervalle quelconque de R. On prendra garde au fait que certains r´esultats ne sont valables que sur des intervalles compacts.
2
Int´ egrale Simple.
1
Pr´ eliminaires.
1.1
Quelques questions de topologie.
Une fonction f , d´efinie sur un intervalle I de R et `a valeurs dans un espace m´etrique E, a en x0 une limite ` a droite, not´ee f (x+ 0 ), si f (x+ lim f (x). 0 ) = x→x 0 x>x0
On a une notion analogue de limite `a gauche, not´ee f (x− 0) : f (x− lim f (x). 0 ) = x→x 0 x<x0
− Remarque : f est continue en x0 si et seulement si f (x+ 0 ) = f (x0 ) = f (x0 ).
Rappellons le lemme de Lebesgue, dont on aura besoin `a plusieurs reprises. ´ore `me. (Lemme de Lebesgue) Soit A une partie compacte d’un espace m´etrique E, et soit (Ui )i∈I The une famille de parties ouvertes de E, telle que [ A⊂ Ui . i∈I
Alors il existe un r´eel ρ strictement positif (appel´e “nombre de Lebesgue” pour le recouvrement donn´e), tel que toute boule ouverte de rayon ρ ayant son centre dans A soit contenue dans l’un des ouverts de la famille (Ui )i∈I . Raisonnons par l’absurde, et supposons qu’aussi petit que soit ρ, il existe une boule ouverte de rayon ρ ayant son centre dans A et non contenue dans l’un des ouverts de la famille. Alors, pour tout entier n, il 1 1 existe une boule B(xn , ), de centre xn et de rayon , telle que xn soit dans A, et qui n’est pas contenue n n dans l’un des ouverts de la famille. La suite (xn ) a un point d’accumulation γ dans A (par d´efinition des compacts). Comme la famille d’ouverts couvre A, il existe un ouvert de la famille qui contient γ, et qui contient donc une boule B(γ, ε) de centre γ, et de rayon ε > 0. Choisissons n assez grand pour que, d’une ε 1 ε part la distance de xn `a γ soit plus petite que , et d’autre part soit lui-mˆeme plus petit que . Alors, 2 n 2 1 la boule B(xn , ) est contenue dans la boule B(γ, ε), donc dans l’un des ouverts de la famille, ce qui ne n se peut pas. 2 Corollaire. (Th´eor`eme de Borel-Lebesgue) Soit A une partie compacte d’un espace m´etrique E, et soit (Ui )i∈I une famille d’ouverts de E recouvrant A. Alors il existe une partie finie J de I, telle que la famille (Ui )i∈J recouvre A. Raisonnons par l’absurde, et supposons qu’aucune sous–famille finie de (Ui )i∈I ne suffise `a couvrir A. Soit ρ > 0 un nombre de Lebesgue pour le recouvrement donn´e. On va construire par r´ecurrence une suite {xn }n∈N de points de A, telle que ∀p∈N ∀q∈N p 6= q ⇒ d(xp , xq ) ≥ ρ. Ceci impliquera qu’aucune sous–suite de la suite {xn }n∈N ne peut converger et donc que A n’est pas compact. Comme la sous–famille vide de (Ui )i∈I ne recouvre pas A, A n’est pas vide et contient donc un point x0 . Supposons maintenant x0 , . . . , xn contruits, tels que d(xp , xq ) ≥ ρ pour tous p et q tels que 0 ≤ p < q ≤ n. Pour chaque p, tel que 0 ≤ p ≤ n, la boule ouverte de centre xp et de rayon ρ est contenue dans l’un des ouverts (appelons–le Up ) de la famille d’ouverts (Ui )i∈I . Comme les ouverts U0 , . . . , Un ne sauraient recouvrir A, il existe un point xn+1 dans A dont la distance `a chacun des x0 , . . . , xn est au moins ρ. 2 Rappelons ´egalement le th´eor`eme suivant de prolongement par continuit´e (adapt´e ici aux application lipschitziennes). ´ore `me. (Th´eor`eme du prolongement par continuit´e) Soient E et F des espaces m´etriques, D une The partie dense de E, et f : D −→ F une application k-lipschitzienne. On suppose F complet. Alors, il existe
Int´ egrale Simple.
3
une unique application continue f : E −→ F , prolongeant f (i.e : telle que ∀x ∈ D f (x) = f (x)), et cette application est k-lipschitzienne. Soit x un point quelconque de E. Comme D est dense dans E, il existe une suite (xn ) de points de D qui converge vers x. Cette suite est ´evidemment de Cauchy, puisqu’elle converge. La suite (f (xn )) est alors une suite de F , qui est de Cauchy car f est k-lipschitzienne (v´erification ais´ee). Elle converge donc vers un ´el´ement de F que l’on notera f (x). Cette construction est ind´ependante du choix de la suite (xn ). En effet, si (x0n ) est une autre suite convergeant vers x, alors d(xn , x0n ) tend vers 0 quand n tend vers l’infini, et comme f est k-lipschitzienne, il en est de mˆeme de d(f (xn ), f (x0n )). La fonction f : E −→ F est donc bien d´efinie. Il reste `a montrer qu’elle est k-lipschitzienne (ce qui impliquera qu’elle est continue). Soient x et y des points de E, (xn ) et (yn ) des suites de points de D convergeant respectivement vers x et y. Alors, pour tout ε > 0, il existe n assez grand pour que d(f (x), f (xn )) < ε, d(f (y), f (yn )) < ε, d(x, xn ) < ε et d(y, yn ) < ε. On a alors d(f (x), f (y)) ≤ ≤ ≤
d(f (x), f (xn )) + d(f (xn ), f (yn )) + d(f (yn ), f (y)) 2ε + kd(xn , yn ) 2ε + k(2ε + d(x, y))
Comme ε est arbitraire, on voit que f est k-lipschitzienne. L’unicit´e de f continue prolongeant f est cons´equence imm´ediate de la continuit´e et du fait que D est dense dans E. 2
1.2
Le th´ eor` eme des accroissements finis.
On connait bien sˆ ur le th´eor`eme des accroissements finis pour des fonctions `a valeurs dans R : ´ore `me. Soit [a, b] (a < b) un intervalle compact de R non r´eduit `a un point, et f : [a, b] −→ R une The application continue sur [a, b], d´erivable sur ]a, b[. Alors il existe c ∈]a, b[, tel que f (b) − f (a) = f 0 (c). b−a Ce th´eor`eme (qui r´esulte facilement du th´eor`eme de Rolle) n’admet qu’une version plus faible pour les fonctions `a valeurs dans un espace de Banach quelconque : ´ore `me. (Th´eor`eme des accroissements finis) Soit F un espace de Banach, [a, b] (a ≤ b) un intervalle The compact de R, et f : [a, b] −→ F une application continue sur [a, b], d´erivable sur ]a, b[ et dont la d´eriv´ee est born´ee sur ]a, b[. On a alors : kf (b) − f (a)k ≤ |b − a| sup kf 0 (x)k. x∈]a,b[
Le r´esultat ´etant trivial pour a = b, on peut supposer a < b. Posons M = sup kf 0 (x)k. Soit ε > 0. x∈]a,b[
Il suffit de montrer que b appartient `a l’ensemble A suivant : A = {x ∈ [a, b] | kf (x) − f (a)k ≤ |x − a|M + ε(x − a + 1)}. En effet, si b ∈ A, on a kf (b) − f (a)k ≤ |b − a|M + ε(b − a + 1), et comme ε est arbitraire, on a le r´esultat annonc´e. A n’est pas vide, puisqu’il contient a. Il est par ailleurs major´e par b et a donc une borne sup´erieure γ telle que a ≤ γ ≤ b. A est ferm´e, puisque les deux membres de l’in´egalit´e large kf (x) − f (a)k ≤
4
Int´ egrale Simple.
|x − a|M + ε(x − a + 1) qui le d´efinit sont des fonctions continues de x. γ appartient donc `a A. De plus, A contient un voisinage de a, par continuit´e de f en a (c’est `a cela que sert le +1 dans la d´efinition de A). On voit donc que a < γ. Comme γ ∈ A, il suffit maintenant de montrer que γ = b. Supposons γ < b. Alors γ ∈]a, b[, et f est d´erivable en γ. Il existe donc un η > 0, tel que pour |h| < η, on ait : ° ° ° f (γ + h) − f (γ) ° 0 ° − f (γ)° ° ° < ε. h On a alors, pour 0 < h < η : kf (γ + h) − f (a)k
≤
kf (γ + h) − f (γ)k + kf (γ) − f (a)k
≤ =
hM + hε + |γ − a|M + ε(γ − a + 1) |γ + h − a|M + ε(γ + h − a + 1),
c’est `a dire γ + h ∈ A, ce qui contredit le fait que γ est la borne sup´erieure de A. 2
1.3
Fonctions r´ egl´ ees.
´finition. Une fonction f d´efinie sur un intervalle quelconque I de R, et `a valeurs dans un espace De de Banach E, est dite r´egl´ee, si elle admet en tout point int´erieur `a I une limite `a gauche et une limite `a droite, ainsi qu’une limite `a droite en inf(I) si celui-ci est dans I et une limite `a gauche en sup(I) si celui-ci est dans I. ´finition. Une fonction f d´efinie sur [a, b], et `a valeurs dans un espace de Banach E, est dite en De escalier, si elle est localement constante, sauf en un nombre fini de points de [a, b]. La r´eunion de deux ensembles finis ´etant un ensemble fini, il est clair que la somme de deux fonctions en escalier est encore une fonction en escalier. On v´erifie alors facilement que l’ensemble des fonctions en escalier d´efinies sur [a, b] et `a valeurs dans E est un espace vectoriel r´eel. Si on note x0 , . . . , xn , les points o` u la fonction en escalier f n’est pas localement contante, (avec x0 < · · · < xn ), on voit que f est constante dans chaque intervalle ]xi , xi+1 [ (pour 0 ≤ i < n). Remarque : Une fonction en escalier est r´egl´ee. Une fonction continue est r´egl´ee. Une fonction en escalier sur [a, b] est born´ee, puisqu’elle ne prend qu’un nombre fini de valeurs. On rappelle que la norme de la convergence uniforme (sur l’espace des fonctions born´ees d´efinies sur l’intervalle I et `a valeurs dans un espace vectoriel norm´e E), est d´efinie par : kf k = sup kf (x)k. x∈I
Le fait que f soit born´ee sur I assure que cette d´efinition a bien un sens. ´ore `me. Pour tout ε > 0, et toute fonction r´egl´ee f sur [a, b] `a valeurs dans l’espace de Banach E, The il existe une fonction en escalier g d´efinie sur [a, b], et `a valeurs dans E, telle que f − g soit born´ee, et kf − gk < ε. Remarque : ceci implique que toute fonction r´egl´ee sur un intervalle compact [a, b] est born´ee. Pour tout point c de [a, b], posons f (c− ) si x < c f (c) si x = c gc (x) = f (c+ ) si x > c Par d´efinition des limites `a gauche et `a droite, il existe un intervalle ouvert non vide Vc de centre c, tel que ∀x ∈ Vc kf (x) − gc (x)k < ε.
Int´ egrale Simple.
5
En appliquant le lemme de Lebesgue `a la famille (Vc )c∈[a,b] , on voit qu’il existe un entier n, tel que chacun i i+1 des intervalles Ui =]a + (b − a), a + (b − a)[ (0 ≤ i < n) soit contenu dans l’un des Vc , disons Vci . n n i La fonction g ´egale `a gci sur Ui , et `a f en chacun des points a + (b − a) est une fonction en escalier n satisfaisant l’in´egalit´e kf − gk < ε. 2 On notera E([a, b], E) l’ensemble des fonctions en escalier sur [a, b] `a valeurs dans E, C([a, b], E) l’ensemble des fonctions continues sur [a, b] `a valeurs dans E, et R([a, b], E) l’ensemble des fonctions r´egl´ees sur [a, b] `a valeurs dans E. Tous ces ensembles sont des sous-espaces vectoriels de l’espace vectoriel des fonctions born´ees sur [a, b] `a valeurs dans E, et sont donc tous des espaces vectoriels norm´es. Le th´eor`eme ci-dessus peut encore s’exprimer ainsi : E([a, b], E) est dense dans R([a, b], E).
2
Int´ egrale d’une fonction r´ egl´ ee.
2.1
D´ efinition.
Commen¸cons par d´efinir l’int´egrale d’une fonction en escalier. ´finition. Soit g : [a, b] −→ E une fonction en escalier (o` De u E est un espace vectoriel norm´e) constante et ´egale `a yi sur chacun des intervalles ]xi , xi+1 [ (0 ≤ i < n, x0 = a et xn = b). L’int´egrale de g sur [a, b] est d´efinie par : Z b X (xi+1 − xi )yi . g(t)dt = a
Z
0≤i
b
Dans l’expression
f (t)dt, la variable t est muette. a
Il est facile de v´erifier que :
°Z ° ° b ° ° ° g(t)dt° ≤ (b − a)kgk. ° ° a °
De plus, l’int´egrale est lin´eaire, c’est–`a–dire que : Z b Z b Z b g(t)dt + h(t)dt = (g + h)(t)dt a
et
a
Z
a
Z
b
b
g(t)dt,
αg(t)dt = α a
a
comme on le v´erifie facilement. Il en r´esulte imm´ediatement que la fonction de E([a, b], E) vers E d´efinie par Z b g 7→ g(t)dt a
est une application lin´eaire continue, dont la norme est inf´erieure ou ´egale `a b − a. En fait sa norme est exactement b − a, comme on peut le constater en int´egrant une fonction contante sur [a, b]. Cette application est donc (b − a)–lipschitzienne. En cons´equence, d’apr`es ce qui a ´et´e prouv´e pr´ec´edemment, elle se prolonge d’une fa¸con unique en une application (b − a)-lipschitzienne de R([a, b], E) vers E, que l’on note encore Z b f 7→ f (t)dt. a
6
Int´ egrale Simple.
La lin´earit´e est conserv´ee grˆace `a la continuit´e de la somme et de la multiplication par un r´eel. Ce qui vient d’ˆetre dit vaut donc pour toute fonction r´egl´ee. L’int´egrale v´erifie de plus les relations suivantes Z Z b f (t)dt = − a
Z
f (t)dt
b
Z
b
Z
c
f (t)dt + a
a
f (t)dt = b
c
f (t)dt a
°Z ° Z ° b ° b ° ° f (t)dt° ≤ kf (t)kdt ° ° a ° a ÃZ ! Z b
L
b
f (t)dt
=
a
L(f (t))dt a
la premi`ere pouvant ˆetre prise comme une d´efinition, puisque nous avons suppos´e d`es le d´ebut que a < b, et o` u L est une application lin´eaire continue. En effet, ces relations sont clairement satisfaites par les fonctions en escalier. Elle sont donc satisfaites par toutes les fonctions r´egl´ees par densit´e de E([a, b], E) dans R([a, b], E), car chaque membre de ces ´egalit´es est fonction continue de f .
2.2
Primitives.
´finition. Soit I un intervalle quelconque de R, et f : I −→ E une fonction r´egl´ee. On appelle De primitive de f sur I, toute fonction de la forme Z x x 7→ C + f (t)dt x0
o` u C est un r´eel et x0 un point de I. Il est ais´e de constater que deux primitives quelconques de f ne diff`erent que d’une constante. En effet Z x Z x Z x1 0 0 C+ f (t)dt − C − f (t)dt = C − C + f (t)dt. x0
x1
x0
La derni`ere expression ci–dessus est une constante, puisqu’elle ne d´epend pas de x. Z x La fonction x 7→ f (t)dt est la seule primitive de f qui s’annule en x0 . x0
L’expression
Z f (t)dt
sert `a d´esigner une primitive quelconque de f . Cette expression n’est bien d´efinie que modulo l’ajout d’une fonction constante (si on est sur un intervalle ; en g´en´eral elle n’est bien d´efinie que modulo l’ajout d’une fonction localement constante). Aussi, pour rappeler cette ind´etermination, note-t-on Z f (t)dt + C une primitive de f , o` u C d´esigne une constante ind´etermin´ee. Il est imm´ediat que si F est une primitive quelconque de f , on a Z b f (t)dt = F (b) − F (a). a
Int´ egrale Simple.
7 b
(Formule de Stockes). L’expression F (b)−F (a) est souvent not´ee [F (x)]a , ou si une confusion est `a craindre x=b [F (x)]x=a . Lemme. Toute primitive F de la fonction r´egl´ee et born´ee f sur I est kf k-lipschitzienne sur I (donc en particulier continue). Ceci r´esulte imm´ediatement de
°Z ° kF (y) − F (x)k = ° °
y
x
° ° f (t)dt° ° ≤ |y − x|kf k. 2
Lemme. Toute primitive F de la fonction r´egl´ee f est d´erivable en tout point de I en lequel f est continue, et en un tel point x0 , on a F 0 (x0 ) = f (x0 ). En effet, on a ° ° ° F (x) − F (x0 ) ° ° − f (x0 )° ° ° = x − x0
°Z x ° Z x ° ° 1 ° f (t)dt − f (x0 )dt° ° |x − x0 | ° x0 x0 °Z x ° ° ° 1 ° (f (t) − f (x0 ))dt° ° ° |x − x0 | x0
=
Soit ε > 0. On a un η > 0 tel que kf (t) − f (x0 )k < ε d`es que |t − x0 | < η. Alors, pour |x − x0 | < η, la derni`ere expression ci-dessus est major´ee par ε. 2 Remarque : Une primitive n’est donc pas n´ecessairement une fonction d´erivable partout. Penser par exemple `a une primitive de fonction en escalier. Toutefois, elle est continue partout. En particulier, si f est continue en tout point de I, alors une primitive quelconque de f est d´erivable en tout point de I, et sa d´eriv´ee est f . Voici la r´eciproque de cette assertion. Lemme. Si F est continuement d´erivable sur I, alors elle est une primitive de sa d´eriv´ee. En effet, soit x0 un point de I. La d´eriv´ee de (notez que la continuit´e de F 0 implique que l’int´egrale `a un sens) Z x x 7→ g(x) = F (x) − F 0 (t)dt x0
est x 7→ F 0 (x) − F 0 (x), et est donc nulle. Il en r´esulteZ que g est une fonction constante (th´eor`eme des x
accroissements finis), et que F (x) est de la forme C +
F 0 (t)dt. 2
x0
2.3
Techniques de calcul.
Le dernier lemme nous donne bon nombre de primitives, puisqu’il suffit de lire `a l’envers une table de d´eriv´ees, pour avoir une table de primitives. Par exemple,
Z 0
π
π
sin(x)dx = [− cos(x)]0 = 2.
On retiendra en particulier les primitives suivantes. Z Z dx dx √ = Arc tg(x) + C = Arc sin(x) + C 1 + x2 1 − x2 0
Z √
dx = Arg sh(x) + C 1 + x2
La r`egle de d´erivation d’un produit (f (x)g(x)) = f 0 (x)g(x) + f (x)g 0 (x) nous donne : Z b Z b b 0 f (t)g(t)dt = [f (t)g(t)]a − f (t)g 0 (t)dt a
a
8
Int´ egrale Simple.
(int´egration par parties). Noter que f et g sont suppos´ees ˆetre `a valeurs dans une alg`ebre de Banach (qui peut ˆetre R), pour que le produit ait un sens. Soit f : [c, d] −→ E une application continue, et soit F une primitive de f . Comme f est continue, f est 0 la d´eriv´ee de F en tout point. La r`egle de d´erivation des fonctions compos´ees (F (ϕ(x))) = ϕ0 (x)f (ϕ(x)) nous donne : Z b
F (ϕ(b)) − F (ϕ(a)) =
ϕ0 (t)f (ϕ(t))dt.
a
Z
d
Si ϕ : [a, b] −→ [c, d] envoie a sur c et b sur d, on a alors F (ϕ(b)) − F (ϕ(a)) = formule dite de “changement de variable” suivante : Z
Z
d
b
f (t)dt = c
f (t)dt, ce qui donne la c
f (ϕ(t))ϕ0 (t)dt.
a
En pratique, cette formule s’utilise en faisant la cuisine suivante. Posons t = ϕ(u), alors dt = ϕ0 (u)du, et quand t varie de c `a d, u varie de a `a b. La substitution de ϕ(u) `a t donne donc : Z
Z
d
f (t)dt = c
b
f (ϕ(u))ϕ0 (u)du.
a
Z
b
Nous n’avons pas donn´e de sens `a l’expression dt dans l’expression
f (t)dt qui a un sens global. a
Exemples d’utilisation des deux m´ethodes ci-dessus. Z a Z a ln(x)dx = [xln(x)]1 −
1 x dx x 1 (int´egration par parties) aln(a) − a + 1
1
=
Z
1
Z
p
1−
x2 dx
=
π 2
a
q 1 − sin2 (t) cos(t)dt
0
0
=
(en posant x = sin(t), on a dx = cos(t)dt) Z π2 cos2 (t)dt 0
= = =
2.4
π (car cos(t) ≥ 0 entre 0 et ) 2 Z π2 1 (cos(2t) + 1)dt 2 0 π 1 π [sin(2t)]02 + 4 4 π . 4
Majoration des int´ egrales.
La majoration des int´egrales se fait essentiellement avec les formules °Z ° °Z ° Z ° b ° ° b ° b ° ° ° ° f (t)dt° ≤ (b − a)kf k f (t)dt° ≤ kf (t)kdt. ° ° ° a ° ° a ° a
Int´ egrale Simple.
9
La relation de Chasles
Z
Z
b
Z
c
f (t)dt +
c
f (t)dt =
a
f (t)dt
b
a
est aussi souvent utile en combinaison avec l’une des pr´ec´edentes, par exemple pour montrer (sans utiliser de primitive) que Z 1 xn dx 0
tend vers 0 quand n tend vers l’infini. Soit en effet ε > 0, alors Z 1 Z 1−ε Z 1 n n x dx = x dx + xn dx 0
La premi`ere int´egrale se majore par
0
sup
1−ε
xn , c’est-`a-dire par (1−ε)n , qui tend vers 0 quand n tend vers
0≤x≤1−ε
l’infini, et la deuxi`eme se majore par ε. Le d´ecoupage en deux parties ´etait ici n´ecessaire, car la formule Z 1 de majoration appliqu´ee `a xn dx ne donne qu’une majoration par 1. 0
Une m´ethode tr`es utilis´ee consiste `a majorer l’int´egrale par une autre int´egrale qu’on sait calculer. La premi`ere et la seconde “formule de la moyenne” sont aussi souvent utiles pour majorer des int´egrales. Lemme. (Premi`ere formule de la moyenne) Si f et g sont r´egl´ees sur [a, b], f `a valeurs dans R, et g `a valeurs dans un espace de Banach E, et si f a un signe constant sur [a, b], alors ÃZ ! Z b
b
f (t)g(t)dt = a
f (t)dt Kf,g , a
o` u Kf,g est dans l’adh´erence de l’enveloppe convexe de l’image de g. On peut supposer que f est non nulle en au moins l’un des points o` u elle est continue, sinon les deux int´egrales sont nulles, et le r´esultat est trivial. Dans ces conditions, l’int´egrale du membre de droite ne peut pas ˆetre nulle. Si f et g sont des fonctions en escalier, le quotient : Rb f (t)g(t)dt Kf,g = aR b f (t)dt a repr´esente le barycentre d’une famille finie de points de l’image de g, avec des poids qui sont tous de mˆeme signe. Ce quotient est donc dans l’enveloppe convexe de l’image de g. Par ailleurs, le num´erateur et le d´enominateur sont des fonctions continues des f et g, ce qui donne le r´esultat. 2 Lemme. (Seconde formule de la moyenne) Si f et g sont r´egl´ees sur [a, b], toutes deux `a valeurs dans R, et si f est positive et d´ecroissante (au sens large) sur [a, b], alors Z
Z
b
c
f (t)g(t)dt = f (a) a
g(t)dt a
avec c ∈ [a, b]. Z Quitte `a multiplier f par une constante, on peut supposer que f (a) = 1. Posons G(x) =
x
g(t)dt. a
Alors, G est continue sur [a, b], donc born´ee, et prend toute valeur comprise entre ses bornes. De plus G(a) = 0. On notera respectivement m et M les bornes inf´erieure et sup´erieure de G sur [a, b]. Comme G est continue, il nous suffit de prouver que Z b m≤ f (t)g(t)dt ≤ M. a
10
Int´ egrale Simple.
Supposons d’abord g en escalier. On a donc une suite x0 < x1 < · · · < xn , avec x0 = a, xn = b et g constante ´egale `a gi sur chaque intervalle ]xi−1 , xi [ (pour 1 ≤ i ≤ n). Z xi 1 Posons µi = f (t)dt. Alors, d’apr`es les hypoth`eses et la premi`ere formule de la moyenne, xi − xi−1 xi−1 on a f (a) = 1 ≥ µ1 ≥ µ2 ≥ · · · ≥ µn ≥ 0. De plus G(xi ) − G(xi−1 ) = gi (xi − xi−1 ). On a donc Z
b
f (t)g(t)dt = a
=
n X
Z
xi
gi
i=1 n X
f (t)dt xi−1
(G(xi ) − G(xi−1 ))µi
i=1
=
Ãn−1 X
! G(xi )(µi − µi+1 )
+ G(xn )µn ,
i=0
avec la convention que µ0 = 1 (notez que G(x0 ) = 0). Comme G est une fonction affine par morceaux, elle atteint n´ecessairement ses bornes en des points de la suite x0 . . . xn . Ãn−1 ! X Or l’expression G(xi )(µi − µi+1 ) + G(xn )µn est un barycentre `a coefficients positifs des i=0
G(x0 ) . . . G(xn ) (la somme des coefficients vaut µ0 = 1). Elle repr´esente donc un r´eel compris entre les bornes de G. Supposons maintenant que g est une fonction Z xr´egl´ee quelconque. Soit ε > 0, et soit h une fonction en escalier telle que kg − hk < ε. Posons H(x) = h(t)dt. On notera encore m et M les bornes de H sur a Z b [a, b]. On vient de voir que f (t)h(t)dt est entre les bornes de H. Par ailleurs, pour tout x de [a, b], on a
a |H(x) − G(x)| ≤ (b − a)ε. Comme on a aussi ¯Z ¯ Z b ¯ b ¯ ¯ ¯ f (t)g(t)dt − f (t)h(t)dt¯ ≤ (b − a)ε, ¯ ¯ a ¯ a Z
b
on voit qu’a 2(b − a)ε pr`es, est d´emontr´e. 2
f (t)g(t)dt se situe entre les bornes de G. Comme ε est arbitraire, le lemme a
Exercice : Dans une galerie de mine rectiligne, il y a deux voies ferr´ees parall`eles sur chacune desquelles roule un wagonnet t´el´ecommand´e. Les deux wagonnets re¸coivent les ordres sur la mˆeme fr´equence et sont donc sens´es avoir les mˆemes mouvements. Ces ordres consistent uniquement en un r´eglage de la vitesse qui peut ˆetre positive ou n´egative (marche arri`ere). On fait partir les deux wagonnets d’un mˆeme point de la galerie. Le deuxi`eme wagonnet a une transmission qui patine, et ce de plus en plus au cours de la manœuvre. D´emontrer que le second wagonnet ne saurait atteindre un point de la galerie o` u le premier wagonnet ne soit d´ej`a pass´e.
2.5
Application aux nombres complexes.
´ore `me. L’application exponentielle de C vers C∗ est surjective. The Soit D le compl´ementaire de l’ensemble des r´eels n´egatifs ou nuls dans C, et soit z ∈ D. Alors le
Int´ egrale Simple.
11
segment joignant 1 `a z est dans D. Pour a ∈ [0, 1], posons (on remarquera que t + (1 − t)z ne s’anulle pas) Z a 1−z g(a) = dt. 0 t + (1 − t)z En d´erivant, on obtient : g 0 (a) =
1−z . a + (1 − a)z
Posons h(a) = e−g(a) (a + (1 − a)z). Alors, h0 (a) = −g 0 (a)e−g(a) (a + (1 − a)z) + e−g(a) (1 − z) = 0. En cons´equence, h(0) = h(1), et z = h(0) = h(1) = e−g(1) . Il reste `a traiter le cas des r´eels strictement n´egatifs. On a −1 = i2 , donc −1 est dans l’image de l’application exponentielle. Comme tous les r´eels positifs y sont aussi, tous les r´eels n´egatifs y sont. 2 Comme cons´equence, on voit que pour tout entier k ≥ 1, tout complexe z `a au moins une racine k i`eme . ¡ u ¢k En effet, il suffit d’´ecrire z = eu , et on a e k = z. ´ore `me. (Th´eor`eme de d’Alembert) Tout polynˆome non constant `a coefficients complexes a au moins The une racine complexe. Comme |P (z)| tend vers l’infini quand z tend vers l’infini, l’image de z 7→ |P (z)| est ferm´ee. En effet, si y est un point adh´erent `a l’image de cette application, il est la limite d’une suite de la forme (|P (zn )|)n∈N . L’hypoth`ese implique que la suite (zn ) ne peut pas avoir de sous–suite tendant vers l’infini. Elle est donc born´ee, et a un point d’accumulation γ qui v´erifie n´ecessairement |P (γ)| = y. On voit donc que la fonction z 7→ |P (z)| doit atteindre son minimum en un point z0 de C. Si P (z) est sans racine, on a n´ecessairement P (z0 ) 6= 0, et consid´erons le polynˆome P (z + z0 ) Q(z) = . P (z0 ) |Q(z)| atteint son minimum en 0 et celui-ci vaut 1. On peut donc ´ecrire Q(z) = 1 − az k (1 + ε(z)) o` u ε(z) tend vers 0 quand z tend vers 0, a 6= 0 et k ≥ 1. Comme a peut s’´ecrire bk , on a Q(z) = 1 − (bz)k (1 + ε(z)). u 1 Soit u r´eel positif, tel que |ε( )| < , alors b 2 u |Q( )| = b ≤ ≤ ≤ <
u |1 − uk − uk ε( )| b k k 1 |1 − u | + |u | 2 uk k 1−u + 2 uk 1− 2 1
ce qui est contradictoire. 2
2.6
Primitives des fractions rationnelles.
On appelle fraction rationnelle un quotient de deux polynˆomes coefficients de ces polynˆomes sont r´eels.
P (x) . Nous supposerons ici que les Q(x)
12
Int´ egrale Simple. Les fractions rationnelles des types suivants sont appel´ees des ´el´ements simples a (x − b)n
(x2
ax + b + px + q)n
o` u a, b, p et q sont des r´eels, n un entier au moins ´egal `a 1, et o` u le trinˆome x2 + px + q n’a pas de racine r´eelle. Les ´el´ements simples ci-dessus sont qualifi´es respectivement d’´el´ement simple de premi`ere esp`ece et d’´el´ement simple de deuxi`eme esp`ece. Voici des exemples d’´el´ements simples. 1 x−1
1 (x − 2)3
1 1 + x2
2x + 1 (1 + x + x2 )2
Le calcul des primitives des ´el´ements simples de premi`ere esp`ece ne pose pas de probl`eme particulier. Z dx = ln(|x − b|) + C x−b Z Z dx 1 = (x − b)−n dx = +C (pour n ≥ 2) (x − b)n (1 − n)(x − b)n−1 Pour les ´el´ements simpes de deuxi`eme esp`ece, le changement de variable 2x + p y=p 4q − p2 (on remarquera que 4q − p2 est positif, car le trinˆome n’a pas de racine r´eelle), nous ram`ene `a une int´egrale de la forme Z (αy + β)dy . (1 + y 2 )n On est donc ramen´e au calcul des deux int´egrales suivantes Z Z dy ydy (1 + y 2 )n (1 + y 2 )n Z La deuxi`eme se calcule en posant u = y 2 , ce qui donne du = 2ydy, et ram`ene au calcul de
du . (1 + u)n
Pour calculer la premi`ere, remarquons qu’une int´egration par parties donne · ¸ Z Z dy y y 2 dy = + 2n . 2 n 2 n (1 + y ) (1 + y ) (1 + y 2 )n+1 Le dernier terme du membre de droite peut ˆetre remplac´e par Z Z dy dy 2n − 2n , (1 + y 2 )n (1 + y 2 )n+1 ce qui r´esoud le probl`eme par r´ecurrence, sachant que Z dy = Arc tg(y) + C. 1 + y2 P (x) une fraction rationnelle quelconque. Supposons que nous sachions d´ecomposer Q(x) le d´enominateur en facteurs irr´eductibles (ceci est toujours th´eoriquement possible, mais ce r´esultat n’est pas effectif). Ces derniers ne peuvent ˆetre que de degr´e 1 ou 2, et donc de l’une des formes (x − b) ou (x2 + px + q), o` u ce dernier trinˆome n’a pas de racine r´eelle. Soit maintenant
Int´ egrale Simple.
13
Lemme. Toute fraction rationnelle est d´ecomposable en la somme d’un polynˆome et d’´el´ements simples. P (x) une fraction rationnelle. Si la d´ecomposition de Q(x) ne contient pas deux facteurs Q(x) irr´eductibles distincts, alors Q(x) est de l’une des formes (x − b)n ou (x2 + px + q)n . Toutefois la fraction rationnelle n’est peut ˆetre pas un ´el´ement simple, car le degr´e de P (x) reste quelconque. Soit
Pour faire baisser le degr´e de P (x), il suffit d’effectuer la division euclidienne (ce qui est possible, car R est un corps) de P (x) par le facteur irr´eductible de Q(x). On a alors, pour Q(x) = I(x)n , o` u I(x) est (x − b) ou (x2 + px + q), P (x) = I(x)P 0 (x) + R(x) o` u le degr´e de R(x) est strictement inf´erieur `a celui de I(x). Mais alors,
P 0 (x) P (x) R(x) = + , n−1 Q(x) I(x) Q(x)
et le probl`eme est r´esolu par r´ecurrence. Notez que c’est cette op´eration qui introduit des polynˆomes, lorsque n = 1. Supposons maintenant que Q(x) ait au moins deux facteurs irr´eductibles non identiques. Alors, Q(x) peut s’´ecrire A(x)B(x), o` u A(x) et B(x) sont premiers entre eux. L’identit´e de Bezout, nous donne 1 = A(x)U (x) + B(x)V (x), et l’on a
P (x) P (x)A(x)U (x) + P (x)B(x)V (x) P (x)U (x) P (x)V (x) = = + , Q(x) A(x)B(x) B(x) A(x)
ce qui d´emontre le lemme par r´ecurrence. 2 Ceci r´esoud en principe le probl`eme de la recherche des primitives pour une fraction rationnelle quelconque. Le seul obstacle pratique est la non effectivit´e de la d´ecomposition du d´enominateur en facteurs irr´eductibles. Bien que la d´emonstration ci-dessus soit constructive, il peut ˆetre interressant de d´ecomposer une fraction rationnelle en ´el´ements simples par la m´ethode d’identification, qui consiste `a ´ecrire la d´ecomposition avec des coefficients ind´etermin´es, et `a calculer ces derniers en r´eduisant au mˆeme d´enominateur. Notez que les d´enominateurs des ´el´ements simples de la d´ecomposition sont n´ecessairement des diviseurs du d´enominateur de la fraction rationnelle, comme cela r´esulte de la preuve ci-dessus.
Exercices 1
Soit f une fonction r´egl´ee sur [a, b]. Trouver la limite de Z
b
f (x) cos(nx)dx a
quand n tend vers l’infini. 2 Soient α ≥ 0 et β ≥ 0 deux r´eels, tels que α + β = 1. Soit x0 un r´eel. On consid`ere les deux fonctions : x 7→ ϕ(x) = eαx eβx0 et x 7→ ψ(x) = αex + βex0 a) Montrer que ϕ et ψ prennent la mˆeme valeur en x0 . b) Montrer que pour x ≥ x0 , ϕ(x) ≤ ψ(x).
14
Int´ egrale Simple. c) En d´eduire que si x et y sont deux r´eels quelconques, on a eαx eβy ≤ αex + βey . Soient p et q deux entiers positifs, tels que
l’intervalle [a, b] (a < b).
1 1 + = 1. Soient f et g deux fonction r´egl´ees d´efinies sur p q
d) Montrer que si f et g ne prennent que des valeurs strictement positives, et si : Z
b
Z
a
alors :
b
f (x)p dx =
g(x)q dx = 1,
a
Z
b
f (x)g(x)dx ≤ 1. a
(Poser f (x) = e
ϕ(x) p
et g(x) = e
ψ(x) q
, en justifiant que cela est possible.)
e) Montrer que si f et g ne prennent que des valeurs strictement positives, on a : Z
ÃZ
b
f (x)g(x)dx ≤ a
! p1 ÃZ
b
p
b
! q1 q
g(x) dx
f (x) dx
.
a
a
On note S 1 l’ensemble des nombres complexes de module 1. Soit f : [0, 2π] −→ S 1 une application d´erivable. On pose Z u 0 f (x) h(u) = dx. f (x) 0
3
a) On pose g(u) = e−h(u) f (u). Montrer que la fonction g est constante. b) En d´eduire que si f (0) = f (2π), 1 2iπ
Z
2π 0
f 0 (x) dx f (x)
est un ´el´ement de Z. Si ϕ est une application de S 1 dans S 1 , telle que x 7→ f (x) = ϕ(eix ) soit d´erivable (c’est une fonction de R Z 2π 0 f (x) 1 vers S 1 ), l’entier dx sera not´e do (ϕ), et appel´e le degr´e de ϕ. 2iπ 0 f (x)
c) Calculer le degr´e de l’application de S 1 dans S 1 , d´efinie par z 7→ z n , o` u n est un entier relatif quelconque. On dit qu’une application ϕ de S 1 vers S 1 est ´equivariante, si elle satisfait ϕ(−z) = −ϕ(z) pour tout z de S 1 .
d) Montrer que si ϕ est ´equivariante, son degr´e est impair. Soit S 2 la sph`ere unit´e de R3 , c’est–` a–dire l’ensemble des vecteurs de norme 1 dans R3 , o` u il est entendu que la norme est la norme euclidienne. On consid`ere une application F de classe C 1 de S 2 vers C (c’est–` a–dire la restriction ` a S 2 d’une application d´erivable d´efinie sur un voisinage de S 2 dans R3 ). On suppose que pour tout x de S 2 , on a F (x) 6= F (−x). On pose F (x) − F (−x) Φ(x) = . |F (x) − F (−x)|
Int´ egrale Simple.
15
e) Montrer que Φ est d´erivable, qu’elle envoie S 2 dans S 1 , et qu’elle est ´equivariante (c’est–`a–dire qu’elle v´erifie Φ(−x) = −Φ(x) pour tout x de S 2 ). On envoie le “rectangle” [0, 2π] × [0,
π ] dans R3 par l’application E suivante 2 E
(x, t) 7→ (cos(x) cos(t), sin(x) cos(t), sin(t)). Il est clair que cette application est de classe C 1 , et qu’elle prend ses valeurs dans S 2 .
f) Pour tout t ∈ [0,
π ], on consid`ere l’application ft de [0, 2π] vers S 1 d´efinie par 2 ft
x 7→ F (E(x, t)). Montrer que pour tout t ∈ [0,
π ], l’int´egrale 2 Z
2π 0
ft0 (x) dx ft (x)
est nulle. g) D´emontrer que pour toute application F de classe C 1 de S 2 dans R2 , il existe un x de S 2 tel que F (x) = F (−x). ´ h) Etendre le resultat de la question pr´ec´edente au cas o` u F est seulement continue. i) Montrer que toute involution continue de R2 a un point fixe.
3
Int´ egrales g´ en´ eralis´ ees. Z Jusqu’`a maintenant, nous n’avons parl´e que d’int´egrales de la forme
b
f (t)dt, o` u la fonction f est a
r´egl´ee sur [a, b] (donc en particulier born´ee). Nous allons maintenant g´en´eraliser la notion d’int´egrale `a des intervalles non compacts.
3.1
Convergence et crit` ere de Cauchy.
´finition. Si f est une fonction r´egl´ee, `a valeurs dans un espace de Banach E, et d´efinie sur un De intervalle I quelconque (non n´ecessairement born´e ni ferm´e), de borne inf´erieure α et de borne sup´erieure β (α ou β peut ˆetre ±∞), nous dirons que f est int´egrable sur I, s’il existe un r´eel l tel que °Z ° ° d ° ° ° ∀ε > 0 ∃[a, b] ⊂ I ∀[c, d] ⊂ I ([a, b] ⊂ [c, d]) ⇒ ° f (t)dt − l° < ε ° c ° Si tel est le cas, l est not´e
Z
Z f (t)dt
I
β
ou
f (t)dt. α
Z On dit aussi que l’int´egrale Elle n’a alors pas de sens.
1
f (t)dt est convergente. Dans le cas contraire, on dit qu’elle est divergente. I
1 Ce vocabulaire d´ esuet, mais qu’on conserve par tradition, montre la confusion qu’on peut facilement faire entre le signifiant (l’´ ecriture de l’int´ egrale) et le signifi´ e (la valeur de l’int´ egrale). Il est clair que le mot divergente ne saurait s’appliquer au signifi´ e. Le sens du mot int´ egrale est donc ici diff´ erent de celui qu’il a par exemple dans la phrase : “L’int´ egrale ci–dessus est nulle.”
16
Int´ egrale Simple.
On remarquera la similitude entre cette d´efinition et celle de la limite d’une suite. Dans la d´efinition ci-dessus, les intervalles compacts de I tiennent un rˆole analogue `a celui des entiers dans le cas des limites Z Z b de suites. En quelque sorte f (t)dt est la limite de f (t)dt lorsque “[a, b] tend vers I”. I
a
Lemme. (Crit`ere de Cauchy pour les int´egrales) La convergence de l’int´egrale Z f (t)dt I
est ´equivalente `a °Z ° ° d ° ° ° ∀ε > 0 ∃[a, b] ⊂ I ∀[c, d] ⊂ I (]a, b[∩]c, d[= φ) ⇒ ° f (t)dt° < ε. ° c °
CommeZ on le remarquera, cette caract´erisation des int´egrales convergentes ne fait pas mention de la limite l = f (t)dt, de mˆeme que le crit`ere de Cauchy pour les suites ne fait pas mention de la limite de la suite.
I
Il est clair que si l’int´egrale est convergente, le crit`ere de cauchy est satisfait. R´eciproquement, prenons une suite d’intervalles compacts [a1 , b1 ] ⊂ · · · ⊂ [an , bn ] ⊂ . . . Z bn [ tels que I = [an , bn ]. Alors l’hypoth`ese montre que la suite de r´eels ( f (t)dt)n∈N est une suite de an
n∈N
Cauchy, qui admet donc une limite l. On montre facilement que cette limite est la valeur de l’int´egrale. 2 Z La convergence de l’int´egrale f (t)dt est ´equivalente `a l’existence des deux limites (o` u x0 est un point quelconque de I)
I
Z lim
a→α
Z
x0
f (t)dt a
b
lim
b→β
f (t)dt x0
comme on peut facilement le v´erifier `a l’aide du crit`ere de Cauchy. 1 Exemple : La fonction x 7→ √ est r´egl´ee (car continue) sur l’intervalle ouvert ]0, 1[. On a x Z a
b
√ £√ ¤b √ dx √ = 2 x a = 2( b − a). x
Quand a tend vers 0 et b tend vers 1, l’expression ci-dessus a une limite ´egale `a 2. On a donc Z 1 dx √ = 2. x 0 Une autre situation est celle o` u l’intervalle d’int´egration n’est pas born´e. Par exemple, la fonction 1 est r´egl´ee (car continue) sur R tout entier. On a x 7→ 1 + x2 Z b dx b = [Arc tg(x)]a = Arc tg(b) − Arc tg(a). 2 1 + x a Quand a tend vers −∞, et b vers +∞, cette expression tend vers π, et on a Z +∞ dx = π. 1 + x2 −∞
Int´ egrale Simple.
17 Z
Z
Si l’int´egrale g´en´eralis´ee
|f (t)|dt est convergente, on dit que l’int´egrale g´en´eralis´ee I
f (t)dt est I
absolument convergente. La convergence absolue entraine la convergence (ceci r´esulte facilement du crit`ere de Cauchy pour les int´egrales), mais la r´eciproque est fausse. Par exemple, on peut prouver que l’int´egrale Z +∞ sin(t)dt est convergente, mais non absolument convergente. Pour cela, nous aurons besoin du crit`ere t 0 suivant.
3.2
Crit` ere d’Abel.
Lemme. (Crit`ere d’Abel de convergence des int´egrales g´en´eralis´ees) Si les fonctions r´egl´ees g et h (`a valeurs dans R) d´efinies sur I = [A, +∞[, sont telles que 1. il existe une constante K, telle que pour tout intervalle compact [a, b] contenu dans I, on ait ¯ ¯Z ¯ ¯ b ¯ ¯ g(t)dt¯ ≤ K, ¯ ¯ a ¯ 2. la fonction h est positive, d´ecroissante (au sens large) et tend vers 0 quand t tend vers l’infini, alors l’int´egrale g´en´eralis´ee Z ∞ h(t)g(t)dt A
est convergente. Soit ε > 0. Soit B > A, assez grand pour que |h(t)| < ε, d`es que t > B. Soit [c, d] un intervalle compact contenu dans ]B, +∞[. Alors la seconde formule de la moyenne donne Z d Z d0 h(t)g(t)dt = h(c) g(t)dt c
c
0
pour un certain d entre c et d. On en d´eduit imm´ediatement que ¯Z ¯ ¯ d ¯ ¯ ¯ h(t)g(t)dt¯ ≤ Kε. 2 ¯ ¯ c ¯ Z
+∞
Le crit`ere d’Abel montre imm´ediatement la convergence de l’int´egrale 1 et g(t) = sin(t)). Par contre, t Z (k+1)π kπ
0
| sin(t)|dt 1 ≥ t (k + 1)π
Z
(k+1)π
| sin(t)|dt ≥ kπ
Z Z Nons calculerons plus loin la valeur de l’int´egrale 0
0 +∞
sin(t)dt . t
Exercices 1
2 . (k + 1)π +∞
Comme la s´erie harmonique est divergente, ceci montre que l’int´egrale
a) Calculer (si elles existent) les int´egrales suivantes : Z ∞ Z ∞ 1 1 dt Arc tg dt 2 1 − t t 1 2
sin(t)dt (en prenant h(t) = t
| sin(t)|dt est divergente. t
18
Int´ egrale Simple. b) Etudier l’existence des int´egrales suivantes : Z
∞ 1
Z
esin(t) dt t
∞
sin(t2 )dt
1
2 Soient m et n deux entiers, tels que 0 < m < n. Montrer, en d´ecomposant la fraction en ´el´ements simples, que Z +∞ m−1 x π . dx = n 1+x n sin( mπ 0 n )
4
Int´ egrales d´ ependant d’un param` etre.
4.1
Cas d’un intervalle compact.
Soit I un intervalle ouvert de R, [a, b] un intervalle compact de R, et f : I × [a, b] −→ F une fonction continue, o` u F est un espace de Banach. La fonction de I vers F d´efinie par : Z
b
x 7→
f (x, t)dt a
Z est appel´ee une fonction d´efinie par une int´egrale. L’expression d´ependant d’un param`etre (le param`etre ici est x).
b
f (x, t)dt est aussi appel´ee une int´egrale a
Notez que l’int´egrale ci-dessus a un sens, puisque pour tout x de I, la fonction t 7→ f (x, t) est continue sur [a, b]. On appelle “currifi´ee de f ” l’application ψ : I −→ C([a, b], F ) de I vers l’espace des applications continues de [a, b] vers F , d´efinie par l’une quelconque des formules suivantes, qui sont ´equivalentes : ψ(x)(t) = f (x, t)
ψ(x) = t 7→ f (x, t)
ψ = x 7→ (t 7→ f (x, t))
On notera que [a, b] ´etant compact, L’espace vectoriel r´eel C([a, b], F ) est un espace de Banach quand on le munit de la norme de la convergence uniforme. Lemme. ψ est continue. Il s’agit de prouver que, pour tout x0 ∈ I : ∀ε>0 ∃η>0 ∀x∈I |x − x0 | < η ⇒ kψ(x) − ψ(x0 )k < ε. Soit ε > 0. Comme f est continue, on a pour chaque point t de [a, b], un ηt > 0, et un voisinage ouvert Vt de t dans [a, b], tels que pour tous x ∈ I et t0 ∈ [a, b] : |x − x0 | < ηt ∧ t0 ∈ Vt ⇒ kf (x, t0 ) − f (x0 , t)k < ε/2. La famille d’ouverts (Vt )t∈[a,b] recouvre [a, b]. Il en est donc de mˆeme d’une sous–famille finie Vt1 , . . . , Vtp de cette famille. Posons η = inf(ηt1 , . . . , ηtp ). On a η > 0. Il nous reste `a prouver que : ∀x∈I |x − x0 | < η ⇒ kψ(x) − ψ(x0 )k < ε, c’est `a dire que : ∀x∈I |x − x0 | < η ⇒ ∀t∈[a,b] kψ(x)(t) − ψ(x0 )(t)k < ε.
Int´ egrale Simple.
19
Soit donc x ∈ I, tel que |x − x0 | < η et soit t ∈ [a, b]. Il reste `a prouver que kf (x, t) − f (x0 , t)k < ε. Il existe un ti (1 ≤ i ≤ p), tel que t ∈ Vti . On a donc kf (x, t) − f (x0 , ti )k < ε/2. Pour la mˆeme raison on a aussi kf (x0 , t) − f (x0 , ti )k < ε/2, puisque |x0 − x0 | = 0 < η. Donc : kf (x, t) − f (x0 , t)k ≤ kf (x, t) − f (x0 , ti )k + kf (x0 , ti ) − f (x0 , t)k < ε/2 + ε/2 = ε. 2 Corollaire. Soit I un intervalle ouvert de R, [a, b] un intervalle compact de R, et f : I × [a, b] −→ F une fonction continue, o` u F est un espace de Banach. La fonction de I vers F d´efinie par : Z b x 7→ f (x, t)dt a
est continue sur I. En effet, c’est la compos´ee de la currifi´ee de f , qui est continue d’apr`es le lemme pr´ec´edent, avec l’int´egrale sur [a, b] qui est elle–mˆeme continue. 2 Lemme. (D´eriv´ee d’une currifi´ee) Si I est un intervalle ouvert de R, [a, b] un intervalle compact de R, F un espace de Banach, f : I × [a, b] −→ F une application continue, dont la d´eriv´ee partielle D1 (f ) par rapport `a la premi`ere variable (celle qui appartient `a I) existe et est continue, alors la currifi´ee ψ : I −→ C([a, b], F ) de f est d´erivable, et sa d´eriv´ee en x ∈ I, ψ 0 (x) ∈ C([a, b], F ) est donn´ee par : ψ 0 (x) = t 7→ D1 (f )(x, t).
Par d´efinition, D1 (f )(x, t) est la d´eriv´ee en x de la fonction compos´ee f ◦ αt , o` u αt est d´efinie par αt (x) = (x, t), c’est `a dire D1 (f )(x, t) = (f ◦ αt )0 (x). La seule chose qu’on ait `a prouver est que : ψ(x + h) − ψ(x) − (t 7→ (f ◦ αt )0 (x)) h tend vers 0, quand h tend vers 0. Cette expression est ´egale `a : t 7→
f (x + h, t) − f (x, t) − (f ◦ αt )0 (x). h
Soit ε > 0. Il s’agit de trouver η > 0, tel que : ° ° ° ° f (x + h, t) − f (x, t) 0 ° − (f ◦ αt ) (x)° |h| < η ⇒ °t 7→ ° < ε. h La norme sur les fonctions continues de [a, b] vers F ´etant celle de la convergence uniforme, cette derni`ere implication est ´equivalente `a : ° ° ° ° f (x + h, t) − f (x, t) 0 ° − (f ◦ αt ) (x)° |h| < η ⇒ sup ° ° < ε. h t∈[a,b] ° ° ° f (x + h, t) − f (x, t) ° 0 ° La question essentielle est donc de majorer l’expression ° − (f ◦ αt ) (x)° ° d’une h mani`ere ind´ependante de t. Or cette expression n’est autre que : ° ° ° ° (f ◦ αt )(x + h) − (f ◦ αt )(x) 0 ° − (f ◦ αt ) (x)° ° ° h Comme f ◦ αt est par hypoth`ese d´erivable en x, l’expression : γx,t (h) =
(f ◦ αt )(x + h) − (f ◦ αt )(x) − (f ◦ αt )0 (x), h
20
Int´ egrale Simple.
tend vers 0 quand h tend vers 0, le point d´elicat ´etant que γx,t (h) d´epend de t. Si ce n’´etait pas le cas, la d´emonstration serait finie ici. On a : hγx,t (h)
= (f ◦ αt )(x + h) − (f ◦ αt )(x) − h(f ◦ αt )0 (x) = [(f ◦ αt )(x + h) − h(f ◦ αt )0 (x)] − [(f ◦ αt )(x) − 0(f ◦ αt )0 (x)] = βt (h) − βt (0),
o` u on a pos´e βt (h) = (f ◦ αt )(x + h) − h(f ◦ αt )0 (x). On a donc : γx,t (h) =
βt (h) − βt (0) . h
Pour chaque t ∈ [a, b], la fonction βt est d´erivable sur un voisinage de 0 dans E, puisque pour h assez petit, x + h appartient `a I (I est ouvert). Sa d´eriv´ee en h est : (βt )0 (h) = (f ◦ αt )0 (x + h) − (f ◦ αt )0 (x). Par hypoth`ese, la fonction (x, t) 7→ (f ◦ αt )0 (x) est continue sur I × [a, b]. Il r´esulte du lemme pr´ec´edent que sa currifi´ee x → 7 (t 7→ (f ◦ αt )0 (x) est continue sur I, et donc que la fonction : h 7→ (t 7→ (βt )0 (h)) est continue sur un voisinage de 0 dans R. Or, cette derni`ere fonction vaut 0 (le 0 de l’espace de Banach C([a, b], F )) en 0 (le 0 de R). Il existe donc η > 0, tel que : |h| < η ⇒ ∀t∈[a,b] k(βt )0 (h)k < ε. Le th´eor`eme des accroissements finis nous montre donc que : ° ° ° βt (h) − βt (0) ° ° < ε, ° |h| < η ⇒ ∀t∈[a,b] ° ° h c’est `a dire : |h| < η ⇒ kt 7→ γx,t (h)k < ε. 2 Corollaire. (R`egle de Leibnitz) Soit I un intervalle ouvert de R, [a, b] un intervalle compact de R, F un espace de Banach, et f : I × [a, b] −→ F une fonction continue, ayant une d´eriv´ee partielle D1 f par rapport `a la premi`ere variable, continue sur I × [a, b]. Alors, la fonction θ d´efinie par : Z
b
f (x, t)dt
θ(x) = a
est d´erivable sur I et sa d´eriv´ee en un point x de I est donn´ee par : Z 0
θ (x) =
b
D1 (f )(x, t)dt. a
Z On a θ = J ◦ ψ, o` u ψ est la currifi´ee de f , et o` u J(ϕ) =
b
ϕ(t)dt, pour toute ϕ ∈ C([a, b], F ). On sait a
par le lemme pr´ec´edent que ψ est d´erivable. Par ailleurs, J est d´erivable, puisque c’est une application lin´eaire continue (on a d’ailleurs kJk = |b − a|). Il en r´esulte que θ est d´erivable, et que Z θ0 (x) = I(ψ 0 (x)) =
b
D1 (f )(x, t)dt. 2 a
Int´ egrale Simple.
21
´ore `me. (Th´eor`eme de Fubini) Pour f continue sur [c, d] × [a, b] (`a valeurs dans un espace de Banach The E), on a ! ! Z d ÃZ b Z b ÃZ d f (x, t)dt dx = f (x, t)dx dt. c
Posons
a
Z
x
a
ÃZ
ϕ(x) =
!
b
c
Z
b
µZ
f (s, t)dt ds − c
a
a
x
¶ f (s, t)ds dt.
c
0
Alors, ϕ(c) = 0, et la r`egle de Leibnitz donne ϕ (x) = 0 pour tout x. On a donc ϕ(d) = 0. 2
4.2
Cas d’un intervalle non compact.
Nous allons ´etendre les r´esultats de la section pr´ec´edente aux int´egrales g´en´eralis´ees. On a essentiellement les mˆemes th´eor`emes, avec pour seule diff´erence une hypoth`ese suppl´ementaire sur la convergence des int´egrales. Dans toute cette section, f d´esigne une fonction continue f : I × J −→ F , o` u I est un intervalle quelconque de R, J un intervalle de R (non n´ecessairement compact), et F un espace de Banach. Z Rappelons que la convergence (pour tout x) de l’int´egrale f (x, t)dt est d´efinie par l’existence d’une J
fonction x 7→ l(x) de I vers F (valeur de cette int´egrale pour x donn´e), telle que : °Z ° ° d ° ° ° ∀x∈I ∀ε>0 ∃[a,b]⊂J ∀[c,d]⊂J ([a, b] ⊂ [c, d]) ⇒ ° f (x, t)dt − l(x)° < ε. ° c ° On remarquera que l’intervalle [a, b], qui d´epend bien sˆ ur de ε, d´epend aussi de x. Si l’on exige que [a, b] ne d´epende que de ε, et non plus de x, on obtient un notion plus forte que la “convergence pour tout x”, que l’on appelle la “convergence uniforme sur I”, et qui s’´enonce ainsi : °Z ° ° d ° ° ° ∀ε>0 ∃[a,b]⊂J ∀x∈U ∀[c,d]⊂J ([a, b] ⊂ [c, d]) ⇒ ° f (x, t)dt − l(x)° < ε. ° c ° Cette condition est ´equivalente au crit`ere de Cauchy uniforme pour les int´egrales, que voici : °Z ° ° d ° ° ° ∀ε>0 ∃[a,b]⊂J ∀x∈I ∀[c,d]⊂J (]a, b[∩]c, d[= φ) ⇒ ° f (x, t)dt° < ε. ° c ° Z Remarque : Pour prouver qu’une int´egrale
f (x, t)dt est uniform´ement convergente sur I, il suffit de J
trouver une fonction g : I −→ R, int´egrable sur I, telle que ∀x∈I ∀t∈J kf (t, x)k ≤ g(t). On dit alors que l’int´egrale converge uniform´ement par domination. Z ´ore `me. Si l’int´egrale The f (x, t)dt est uniform´ement convergente sur I, alors la fonction : J
Z x 7→
f (x, t)dt J
est continue sur I. Soit ε > 0, et x0 ∈ I. Pour tout intervalle compact [a, b] assez grand contenu dans J, et pour tout x dans I, on a °Z ° Z b ° ° ° ° f (x, t)dt° < ε. ° f (x, t)dt − ° J ° a
22
Int´ egrale Simple.
Par ailleurs, les r´esultats obtenus dans la section pr´ec´edente montrent qu’il existe un η > 0, tel que pour |x − x0 | < η, on ait °Z ° Z b ° b ° ° ° f (x, t)dt − f (x0 , t)dt° < ε. ° ° a ° a La combinaison de ces deux in´egalit´es, la premi`ere ´etant utilis´ee en x et en x0 , donne le r´esultat. 2 ´ore `me. Soit f : I × J −→ F une application continue, telle que (x, t) 7→ D1 (f )(x, t) soit d´efinie et The continue sur I × J, et que les int´egrales : Z Z D1 (f )(x, t)dt f (x, t)dt et J
J
soient uniform´ement convergentes sur I. Alors la fonction g d´efinie par : Z x 7→ f (x, t)dt J
est d´erivable sur I et a pour d´eriv´ee
Z x 7→
D1 (f )(x, t)dt. J
(r`egle de Leibnitz). Soit x un point de I, et soit ε > 0. Il s’agit de trouver un η > 0, tel que pour tout h tel que |h| < η, on ait : ° ° Z ° g(x + h) − g(x) ° ° ° ≤ ε. − D (f )(x, t)dt 1 ° ° h J Z Comme l’integrale
D1 (f )(x, t)dt est uniform´ement convergente sur I, on a un intervalle [a, b] ne J
d´ependant pas de x et inclus dans I, tel que : °Z ° Z b ° ° ° ° D1 (f )(x, t)dt° ≤ ε. ° D1 (f )(x, t)dt − ° J ° a Par ailleurs,
Z f (x + h, t) − f (x, t) g(x + h) − g(x) n’est autre que dt, et on a : h h J ° °Z Z b ° f (x + h, t) − f (x, t) f (x + h, t) − f (x, t) ° ° ° dt − dt° < ε. ° ° J ° h h a
En effet, pour montrer cette in´egalit´e, il suffit de montrer que pour tout intervalle [c, d] disjoint de [a, b], et contenu dans J, on a : ° °Z ° d f (x + h, t) − f (x, t) ° ° ° dt° ≤ ε. ° ° ° c h Z La fonction u 7→
d
f (x + uh, t)dt est continue et d´erivable sur un intervalle ouvert contenant l’interc
valle [0, 1]. Sa d´eriv´ee en u est ´egale `a : Z h
d
D1 (f )(x + uh, t)dt, c
Z puisqu’elle est la compos´ee des fonctions u 7→ x + uh et y 7→
d
f (y, t)dt. c
Int´ egrale Simple.
23
Cette d´eriv´ee, qui est continue, reste born´ee sur l’intervalle [0, 1]. On a donc, par le th´eor`eme des accroissements finis : ° °Z ° °Z ° ° d ° ° d ° ° ° ° D1 (f )(x + uh, t)dt° . ° (f (x + h, t) − f (x, t))dt° ≤ |h| sup ° ° c ° ° u∈[0,1] ° c °Z ° ° d ° ° ° Or l’intervalle [a, b] a justement ´et´e choisi tel que ° D1 (f )(x, t)dt° soit inf´erieur `a ε, d`es que [c, d] ° c ° est disjoint de [a, b], et ceci quelle que soit la valeur de x, ce qui vaut donc si on remplace x par x + uh. Il nous reste donc simplement `a trouver η > 0, tel que : °Z ° Z b ° b f (x + h, t) − f (x, t) ° ° ° dt − D1 (f )(x, t)dt° ≤ ε, ° ° a ° h a pour |h| ≤ η. Or ceci r´esulte du th´eor`eme de d´erivation d’une int´egrale sur un intervalle compact par rapport `a un param`etre. 2 ´ore `me. (Th´eor`eme de Fubini) Soit f : I ×[α, β] −→ FZune application continue, o` The u I est un intervalle quelconque de R, et F un espace de Banach. Si l’int´egrale x ∈ [α, β], alors :
f (t, x)dt est uniform´ement convergente pour I
Z
β
µZ
α
¶ Z ÃZ f (t, x)dt dx =
I
I
!
β
f (t, x)dx dt.
α
On proc`ede comme pr´ecedemment, en consid´erant la fonction ϕ d´efinie par : ¶ ¶ Z u µZ Z µZ u ϕ(u) = f (t, x)dt dx − f (t, x)dx dt. α
I
En d´erivant ϕ, on trouve :
I
Z
Z
ϕ0 (u) =
f (t, u)dt − I
Z L’int´egrale
α
f (t, u)dt = 0. I
f (t, u)dt ´etant uniform´ement convergente, cette d´erivation est licite. ϕ est donc constante, I
c’est–`a–dire nulle. 2
4.3
Un exemple.
Comme illustration des th´eor`emes pr´ec´edents, nous allons calculer la valeur de l’int´egrale Z +∞ sin(t) dt, t 0 dont nous avons d´ej`a montr´e qu’elle est convergente. Soit a un r´eel positif ou nul, et consid´erons l’int´egrale : Z +∞ sin(t) Ia = e−ta dt. t 0 Pour a = 0, il s’agit de l’int´egrale `a calculer. Comme est domin´ee par l’int´egrale : Z
sin(t) est de module inf´erieur `a 1, l’int´egrale ci–dessus t
+∞
Ia = 0
e−ta dt,
24
Int´ egrale Simple.
qui est convergente si a > 0. Comme e−ta est fonction d´ecroissante de a, il en r´esulte que la convergence de l’int´egrale Ia est uniforme sur tout intervalle de la forme [ε, +∞[, avec ε > 0. Ia est donc une fonction continue de a sur ]0, +∞[. a 7→ Ia est aussi continue en 0. En effet, on a : ¯Z +∞ ¯ ¯ ¯ 1 − e−ta |I0 − Ia | = ¯¯ sin(t)dt¯¯ , t 0
1 − e−ta (1 + ta)e−ta − 1 est d´ecroissante. En effet, sa d´eriv´ee est t 7→ . Pour voir qu’elle t t2 −ta reste n´egative pour tout t > 0, il suffit de montrer que (1 + ta)e reste plus petit que 1, c’est–`a–dire que (ta)2 + . . . .2 1 + ta ≤ eta . Or ceci est clair pour t et a positifs, puisque eta = 1 + ta + 2! 1 − e−ta Par ailleurs, la fonction t 7→ est positive, et tend vers a quand t tend vers 0. La deuxi`eme t formule de la moyenne donne donc, pour tout r´eel positif A, un r´eel B entre 0 et A, tel que : ¯Z ¯ ¯Z ¯ ¯ A 1 − e−ta ¯ ¯ B ¯ ¯ ¯ ¯ ¯ sin(t)dt¯ = a ¯ sin(t)dt¯ ≤ 2a. ¯ ¯ 0 ¯ ¯ 0 ¯ t
et la fonction t 7→
On a donc |I0 − Ia | ≤ 2a, ce qui montre la continuit´e de a 7→ Ia en 0. Par ailleurs, on peut calculer Ia pour a > 0. En effet, en appliquant la r`egle de Leibnitz `a Ia , on obtient l’int´egrale : Z Ia0 = −
+∞
e−ta sin(t)dt,
0
qui est uniform´ement convergente (car domin´ee) sur tout intervalle de la forme [ε, +∞[, avec ε > 0. Ia0 est donc bien la d´eriv´ee de Ia par rapport `a a, pour a > 0. Z +∞ Cette int´egrale est la partie imaginaire de − e−ta eit dt, qui se calcule facilement. On trouve que 0
−1 , d’o` u on d´eduit que Ia = −Arc tg(a) + C, pour une certaine constante C. Cette constante = 1 + a2 π est d´etermin´ee en faisant tendre a vers l’infini. En effet, Ia tend alors vers 0, ce qui fait que C = . 2 π On a donc Ia = −Arc tg(a) + , ce qui donne, quand on fait tendre a vers 0 : 2 Z +∞ sin(t) π dt = . t 2 0
Ia0
Exercices Z 1
Soit x > 0. On consid`ere l’int´egrale Ix =
+∞
e−t
2
2
− xt2
dt.
0
a) Montrer que la r`e√ gle Leibnitz s’applique pour x ∈]α, +∞[, pour tout α > 0. (On pourra utiliser le Z +∞ π −t2 fait que e dt = (int´egrale de Gauss).) 2 0 b) Calculer Ix . (On justifiera toutes les ´etapes.) 2 En fait 1 + u est inf´ erieur ` a eu pour tout r´ eel u (donc en particulier ta), car u 7→ 1 + u a pour graphe la tangente en 0 au graphe de u 7→ eu , qui est convexe.
Int´ egrale Simple. 2
25
a) On consid`ere les deux fonctions de x suivantes : µZ
x
e
f (x) =
−t2
¶2 dt
Z et
1
g(x) =
0
0
2
2
e−x (1+t ) dt. 1 + t2
D´eriver des deux fonctions, et calculer f (x) + g(x). b) Chercher la limite de g(x) quand x tend vers +∞, et en d´eduire la valeur de l’int´egrale de Gauss : Z ∞ 2 e−t dt. 0
3 Soit α > 0. D´emontrer en d´erivant par rapport au param`etre, et en utilisant l’int´egrale de Gauss, que
Z
+∞
√
π α2 e4 . 2
2
e−x cos(αx)dx =
0
4 Soit α > 0. D´emontrer en d´erivant par rapport au param`etre, et en utilisant l’int´egrale de Gauss, que
Z
+∞ 0
5
2
√ 1 − e−αx dx = πα. x2
On pose pour x r´eel strictement positif : Z
∞
Γ(x) =
e−t tx−1 dt.
0
a) Montrer que cette int´egrale est uniform´ement convergente pour x dans un intervalle compact de ]0, +∞[. (Traiter s´epar´ement les int´egrales entre 0 et 1 et entre 1 et +∞.) Que peut-on dire de la fonction Γ sur ]0, +∞[ ? b) Montrer que pour x > 0, on a : Γ(x + 1) = xΓ(x)
Γ(1) = 1
Γ(n) = (n − 1)!
(pour n entier positif). 1 quand x tend vers 0. x
c) Montrer que Γ(x) est ´equivalent `a d) Montrer que
Γ(1 +
1 )= x
Z
∞ 0
x
(Faire le changement de variable t = u .) e) Montrer que Z (On rappelle que 0
√ 1 Γ( ) = π. 2 ∞
2
e−t dt =
1√ π.) 2
x
e−t dt.
26
Int´ egrale Simple.
Solutions des exercices. Section 2. 1. Soit ε > 0. Comme la fonction f est r´egl´ee, il existe une fonction en escalier g d´efinie sur [a, b], telle que pour tout x de [a, b], on ait |f (x) − g(x)| < ε. On voit alors que la diff´erence des deux int´egrales Z b f (x) cos(nx)dx et a
Z
b
g(x) cos(nx)dx a
n’est pas plus grande que ε(b − a). Si on prouve que la limite de la seconde int´egrale est 0 quand n tend vers l’infini, il en r´esultera que la premi`ere tend aussi vers 0, car ε est arbitrairement petit. Or la seconde int´egrale est une combinaison lin´eaire finie (`a coefficients r´eels) d’int´egrales de la forme Z β cos(nx)dx, α
qui tendent toutes vers 0 quand n tend vers l’infini (calcul explicite). 2.
a) On a ϕ(x0 ) = eαx0 eβx0 = e(α+β)x0 = ex0 , ψ(x0 ) = (α + β)ex0 = ex0 .
b) D´erivons ϕ − ψ. On obtient : ϕ0 (x) − ψ 0 (x) = = =
αeαx eβx0 − αex αex (e(α−1)x+βx0 − 1) αex (eβ(x0 −x) − 1)
Comme β est positif, et x0 − x n´egatif, eβ(x0 −x) est plus petit que 1, et la d´eriv´ee de ϕ − ψ est n´egative. Il en r´esulte que pour x ≤ x0 , on a ϕ(x) ≤ ψ(x). c) Comme x et y jouent des rˆoles identiques dans l’in´egalit´e demand´ee, on peut supposer x ≥ y. y peut donc jouer le rˆole de x0 dans les questions pr´ec´edentes. L’in´egalit´e demand´ee r´esulte alors de la question pr´ec´edente. d) On a, en d´efinissant ϕ et ψ comme indiqu´e dans l’´enonc´e (ce qui est possible parce que f et g sont `a valeurs strictement positives) : Z b Z b ϕ(x) ψ(x) f (x)g(x)dx = e p + q dx a
a
≤ = = e) Posons
ÃZ A= a
b
Z Z 1 b ϕ(x) 1 b ψ(x) e dx + e dx p a q a 1 1 + (car eϕ(x) = f (x)p ) p q 1.
! p1 f (x)p dx
ÃZ
b
B= a
! q1 g(x)q dx
,
Int´ egrale Simple.
27
et F (x) = Alors,
Z
G(x) =
F (x)p dx =
a
Z
b
et de mˆeme qui donne
b
f (x) A Z
1 Ap
b
g(x) . B
f (x)p dx = 1,
a
G(x)q dx = 1. On peut donc appliquer le r´esultat de la question pr´ec´edente `a F et G, ce
a
Z
b
F (x)G(x)dx ≤ 1, a
c’est-`a-dire, en multipliant par AB :
Z
b
f (x)g(x)dx ≤ AB, a
ce qui est le r´esultat cherch´e.
3.
f 0 (u) , soit h0 (u)f (u) = f 0 (u). D´erivons maintenant g. On a f (u)
a) On a d’abord h0 (u) =
g 0 (u) = −h0 (u)e−h(u) f (u) + e−h(u) f 0 (u) = 0 g (qui est d´efinie sur un intervalle) est donc constante. b) Il r´esulte de la question pr´ec´edente que g(0) = g(2π). Or on a aussi f (0) = f (2π). Comme f ne s’annulle pas (elle prend ses valeurs dans S 1 ), on en d´eduit e−h(0) = e−h(2π) , soit eh(2π) = 1, puisque h(0) = 0. Il en r´esulte que h(2π) est de la forme 2iπn avec n entier relatif. c) C’est un calcul d’int´egrale particuli`erement simple. do (z 7→ z n ) =
1 2iπ
Z
2π
0
ineinx dx = n. einx
En particulier, l’identit´e est de degr´e 1, l’application constante qui envoie tout ´el´ement de S 1 sur 1 est de degr´e 0, la conjugaison z 7→ z est de degr´e −1. d) Posons f (x) = ϕ(eix ). On a f (x + π) = ϕ(ei(x+π) ) = ϕ(−eix ) = −ϕ(eix ) = −f (x), d’o` u on d´eduit f 0 (x + π) = −f 0 (x). On a alors, en faisant le changement de variable x = u + π, Z 2π 0 Z π 0 Z π 0 f (x) f (u + π) f (x) dx = du = dx f (x) f (u + π) π 0 0 f (x) d’o` u
Z
2π 0
f 0 (x) dx = 2 f (x)
Z 0
π
f 0 (x) dx. f (x)
Les fonctions h et g ´etant d´efinies comme dans la question a), on doit calculer h(π). Or, g ´etant constante, on a g(π) = g(0). On a aussi f (π) = −f (0). On a donc eh(π) = −1, ce qui montre que h(π) est de la forme (2k + 1)iπ.
28
Int´ egrale Simple.
1 2h(π), c’est–`a–dire `a un nombre impair. 2iπ e) Φ est d´erivable, car elle est le quotient de deux fonctions d´erivable (la fonction “valeur absolue” est d´erivable sur C − {0}), dont la deuxi`eme ne s’annulle pas. Elle envoie S 2 dans S 1 , car clairement Φ(x) est de module 1. Enfin la v´erification qu’elle est ´equivariante se fait `a vue. Le degr´e de ϕ, est ´egal par d´efinition `a
f) ft est d´erivable, comme compos´ee de fonctions d´erivables. Par ailleurs, la fonction (x, t) 7→ est continue sur le compact [0, 2π] × [0,
est continue sur [0,
ft0 (x) ft (x)
π ]. Il en r´esulte que la fonction 2 Z 2π 0 ft (x) t 7→ dx ft (x) 0
π ]. 2
Z
2π
ft0 (x) dx ft (x) 0 est dans 2iπZ. Comme 2iπZ est discret, cette int´egrale est ind´ependante de t. Il suffit donc de montrer π qu’elle est nulle pour t = , ce qui est clair car la fonction f π2 est constante. 2 g) S’il n’existe pas d’x tel que F (x) = F (−x), on est dans les conditions d’application des questions e) et f). Consid´erons alors la fonction f0 d´efinie dans la question pr´ec´edente. On a vu que Par ailleurs, pour tout t, on a ft (0) = ft (2π). Il en r´esulte d’apr`es la question b), que
Z 0
2π
f00 (x) dx = 0. f0 (x)
On a f0 (x) = ϕ(eix ), o` u ϕ est l’application de S 1 dans S 1 d´efinie par y 7→ F (<(y), Im (y), 0). L’integrale ci–dessus montre que le degr´e de ϕ est 0. Par ailleurs, ϕ est ´equivariante. Son degr´e doit donc ˆetre impair, ce qui est une contradiction. h) Si la fonction continue F : S 2 −→ R2 v´erifie F (x) 6= F (−x) pour tout x de S 2 , alors, par compacit´e elle v´erifie kF (x) − F (−x)k > ε pour un certain ε > 0. D’apr`es le th´eor`eme se Stone–Weierstrass (S 2 est compacte), appliqu´e `a chacune des composantes de F , il existe une fonction polynˆomiale (donc de type ε C 1 ) G : S 2 −→ R2 telle que pour tout x de S 2 , kF (x) − G(x)k < . Ceci interdit G(x) = G(−x) pour 3 tout point x de S 2 , ce qui est impossible, d’apr`es la question pr´ec´edente. i) Appelons encore “´equivariante” une application F : S n −→ R2 qui v´erifie pour tout x de S n : F (−x) = f (F (x)), o` u f est l’involution donn´ee sur R2 . On identifie S n−1 `a “l’´equateur” de S n , c’est–`a–dire l’ensemble des points de S n dont la derni`ere coordonn´ee est nulle. Montrons que toute application ´equivariante F de S n−1 vers R2 se prolonge en une application ´equivariante F de S n vers R2 . Si x est distinct des deux pˆoles de S n , x a une “projection” x bien d´efinie sur l’´equateur de S n . Elle est d´efinie par (x1 , . . . , xn , 0) (x1 , . . . , xn , xn+1 ) = . k(x1 , . . . , xn , 0)k Si x est dans l’h´emisph`ere nord de S n (c’est–`a–dire si sa derni`ere coordonn´ee xn+1 est positive ou nulle), et distinct du pˆole nord, on pose F (x) = (1 − xn+1 )F (x). Noter que si x est dans S n−1 , F (x) = F (x). Cette application F est continue. Elle se prolonge par continuit´e au pˆole nord de S n . En effet, ceci r´esulte de ce que la norme de F (x) est major´ee par le produit de (1 − xn+1 ) et du sup des normes des F (x) pour x dans S n−1 . F (x) tend donc vers 0 quand x tend vers le pˆole nord de S n . F est alors automatiquement d´efinie sur l’h´emisph`ere sud par l’exigence d’´equivariance F (−x) = f (F (x)).
Int´ egrale Simple.
29
Il en r´esulte qu’il existe une application continue ´equivariante F de S 2 dans R2 . En effet, il est facile de construire une application ´equivariante de S 0 dans R2 en envoyant 1 sur 0 et −1 sur f (0). Appliquons le r´esultat de la question pr´ec´edente `a F . On a alors un x de S 2 tel que F (x) = F (−x) = f (F (x)), ce qui signifie que F (x) est un point fixe de f . Note : Les r´esultats d´emontr´es ici dans les deux derni`eres questions, restent valables si on remplace R2 par Rn . On peut facilement constater que certains arguments se g´en´eralisent facilement `a la dimension n. En fait, la seule difficult´e est de montrer que toute application ´equivariante de S n dans S n est de degr´e impair (il faut aussi bien sˆ ur d´efinir ce qu’on entend par degr´e dans ce cas). Ceci demeure non ´el´ementaire.
Section 3. 1.
a) Premi`ere int´egrale : En t = 2, la fonction est continue. Au voisinage de l’infini, elle est 1 1 ´equivalente `a − 2 donc int´egrable. On trouve facilement qu’elle vaut − Log (3) en d´ecomposant la fraction t 2 en ´el´ements simples. 1 Deuxi`eme int´egrale : En t = 1, la fonction est continue. Au voisinage de l’infini, tend vers 0, et t 1 1 Arc tg ( ) est ´equivalent `a . L’int´egrale est donc divergente. t t 1 b) Premi`ere int´egrale : Comme sin(t) oscille entre −1 et 1, esin(t) oscille entre et e. La fonction `a e 1 int´egrer est donc minor´ee au voisinage de l’infini par , et l’int´egrale est divergente. et Deuxi`eme int´egrale : En faisant le changement de variable t2 = u, l’int´egrale devient Z ∞ 1 sin(u) √ du. 2 u 1 Or cette derni`ere int´egrale est convergente en vertu du crit`ere d’Abel. En effet, l’int´egrale de sin(u) reste 1 major´ee par 2 sur tout intervalle, et la fonction u 7→ √ est positive, d´ecroissante, et tend vers 0 `a 2 u Z ∞ sin(t) l’infini. Bien sˆ ur, cette int´egrale n’est pas absolument convergente (mˆeme raison que pour dt, t 1 voir le cours). 2. La convergence de l’int´egrale en 0 ne pose aucun probl`eme, de mˆeme qu’en +∞, car m−1 ≤ n−2. Bien que le th´eor`eme des r´esidus soit appliquable ici, on se propose de traiter l’exercice par des moyens ´el´ementaires. On va donc d´ecomposer la fraction rationnelle en ´el´ements simples. Soient ζ0 . . . ζn−1 les racines du polynˆome 1 + xn , c’est-`a-dire les racines n-i`emes de −1. On a ζk = eiπ
2k+1 n
.
La d´ecomposition en ´el´ements simples a la forme n−1 X ak xm−1 = n 1+x x − ζk k=0
On d´etermine la valeur de ak en multipliant chaque membre de cette ´egalit´e par x − ζk , et en faisant x = ζk . On obtient ζ m−1 . ak = Q k j6=k (ζk − ζj )
30
Int´ egrale Simple. En mettant ζkn−1 en facteur au d´enominateur, et en tenant compte du fait que ζkn = −1, on a ak = − Q
ζkm j6=k (1
−
ζj ζk )
.
2iπ(j−k) ζj ζj = e n . Les , pour j 6= k, sont donc les racines n-i`emes de l’unit´e, autres que 1. ζk ζk Il en r´esulte que le produit Y ζj (1 − ) ζk
Par ailleurs,
j6=k
n
est simplement la valeur de
x −1 = 1 + x + x2 + · · · + xn−1 pour x = 1, c’est-`a-dire n. En cons´equence, x−1 1 ak = − ζkm . n
Posons
Z
A
I(A) = 0
xm−1 dx, 1 + xn
o` u A est un r´eel positif grand (destin´e `a tendre vers +∞). On a I(A) =
n−1 X k=0
Z
A
ak 0
dx . x − ζk
Remarquer que pour aucune valeur de x dans [0, +∞[, x − ζk ne peut ˆetre un r´eel n´egatif ou nul, car ζk ne peut pas ˆetre ´egal `a 1. En cons´equence, en choisissant la d´etermination habituelle (dite principale) du logarithme complexe, c’est-`a-dire telle que log(z) soit d´efini pour tout complexe z qui n’est pas un r´eel n´egatif ou nul, et que log(z) ait une partie imaginaire comprise strictement entre −π et +π, on voit que I(A) =
n−1 X
ak (log(A − ζk ) − log(−ζk )).
k=0
A−ζk = ρeiθ est un nombre complexe dont l’argument θ tend vers 0, et dont le module ρ est ´equivalent `a A, quand A tend vers +∞ (comme on le constate ais´ement an faisant le dessin). On a donc A log(A) − log(A − ζk ) = log(A) − log(ρ) − iθ = log( ) − iθ, ρ ce qui montre que log(A) − log(A − ζk ) tend vers 0 quand A tend vers +∞. Par ailleurs, la somme des ak est nulle. On peut le constater d’au moins deux fa¸cons. D’abord parce 2iπm qu’elle est invariante par multiplication par e n , qui n’est pas 1 car 0 < m < n. Dautre part, parce qu’elle est une fonction sym´etrique de degr´e m des ζk , et que toutes les fonctions sym´etriques ´el´ementaires des ζk de degr´es strictement inf´erieurs `a n sont nulles, comme on le voit en examinant le polynˆome 1 + xn . Il en r´esulte que n−1 X ak (log(A − ζk ) − log(A) − log(−ζk )). I(A) = k=0
En faisant maintenant tendre A vers +∞, on voit que I=
n−1 X k=0
−ak log(−ζk ).
Int´ egrale Simple.
Comme ζk = e
31
iπ(2k+1) n
, on a −ζk = eiπ(
2k+1 n −1)
, et donc
log(−ζk ) = iπ(
2k + 1 − 1). n
2k + 1 − 1 est compris entre −1 et 1, et qu’en cons´equence cette formule respecte la Notez que n d´etermination du logarithme. On a donc I=
n−1 2iπ X m kζk , n2
toujours en tenant compte de ce que la somme des
k=0 ζkm est
nulle.
En utilisant la formule d’Euler pour sin, on a sin(
n−1 n−1 −imπ iπm iπm mπ π X iπ(2k+1)m imπ π X n )I = 2 ke k(e n (2k+2) − e n (2k) ). (e n − e n ) = 2 n n n k=0
k=0
Cette derni`ere sommation se calcule en faisant une transformation d’Abel. n−1 X
k(e
2iπm n (k+1)
−e
2iπm n k
)
= −e
2iπm n
+ (n − 1)en
k=0
2iπm n
+
n−2 X
(k − (k + 1))e(k+1)
2iπm n
k=1
=
n−
=
n,
n−1 X
ek
2iπm n
k=0
car la somme des racines n-i`emes de l’unit´e est nulle.
Section 4. a) On a e−t
2
2
− xt2
2
≤ e−t . Comme l’int´egrale de Gauss est convergente, on a donc convergence Z +∞ 2 x2 2x uniforme pour x ∈]0, +∞[. Consid´erons maintenant l’int´egrale Jx = − 2 e−t − t2 dt. Cette int´egrale t 0 est uniform´ement convergente sur ]α, +∞[, pour α > 0. En effet, Jx est la somme des deux int´egrales Z 1 Z +∞ 2 x2 2x −t2 − x22 2x t suivantes : dt + − 2e − 2 e−t − t2 dt. La seconde converge uniform´ement par domination t t 0 1 −t2 2xe par la fonction . La premi`ere converge uniform´ement pour x > α par domination par la fonction t2 α2 x2 α2 e− t2 , puisque x > α entraine e− t2 ≤ e− t2 . On peut donc appliquer la r`egle de Leibnitz sur ]α, +∞[, et 2 t on a donc Jx = Ix0 pour x > 0. Z +∞ 2 x2 x −x b) En posant u = , on a du = 2 dt, et on obtient Jx = −2 e− u2 −u du = −2Ix . x 7→ Ix t t 0 0 est donc solution de l’´ e quation difff´ e rentielle I = −2I , c’est–` a –dire de la forme Ix = Ae−2x . On a par x x √ √ π π −2x ailleurs A = I0 = . Donc Ix = e . 2 2 1.
2. a) Les deux fonctions sont bien d´efinies et continues pour toute valeur de x. Elle sont d´erivables (on utilise la d´erivation sous le signe somme pour la deuxi`eme). On obtient Z 1 Z x 2 2 −t2 0 −x2 0 −x2 e−x t dt. e dt et g (x) = −2xe f (x) = 2e 0
0
32
Int´ egrale Simple.
La seconde int´egrale peut ˆetre transform´ee par le changement de variable u = xt, ce qui donne g 0 (x) = −f 0 (x). π La somme f (x) + g(x) est donc constante. En faisant x = 0, on trouve que cette constante vaut . 4 b) La famille ϕx de fonctions d´efinies par 2
ϕx (t) =
e−x (1+t 1 + t2
2
)
tend uniform´ement vers 0 quand x tend vers +∞, sur l’intervalle [0, 1]. On en d´eduit que g(x) tend vers 0 quand x tend vers +∞. π quand x tend vers +∞, ce qui donne la valeur de l’int´egrale de En cons´equence, f (x) tend vers 4 Gauss : √ Z ∞ 2 π e−t dt = . 2 0
3. L’int´egrale Iα propos´ee est uniform´ement convergente, car elle est domin´ee par l’int´egrale de Gauss qui est elle mˆeme convergente. La d´erivation par rapport `a α donne : Iα0 =
1 2
Z
+∞
2
−2xe−x sin(αx)dx,
0
qui pour les mˆemes raisons est uniform´ement convergente, ce qui justifie cette d´erivation. 2
2
Comme x 7→ −2xe−x est la d´eriv´ee de x 7→ e−x , en int´egrant par parties, on obtient : Z i α Z +∞ 2 1 h −x2 α +∞ −x2 Iα0 = e sin(αx) − e−x cos(αx)dx = − e cos(αx)dx. 2 2 0 2 0 α2 α On a donc Iα0 = − Iα . En d´erivant par rapport `a α l’expression Iα e 4 , on trouve 0. Cette expression 2 α2 est donc une constante A. On a donc Iα = Ae− 4 . Il reste `a d´eterminer A, qui n’est autre que I0 , c’est–`a–dire l’int´egrale de Gauss, d’o` u le r´esultat.
2
4. Au voisinage de 0, 1 − e−αx est ´equivalent `a αx2 , ce qui montre la convergence de l’int´egrale au voisinage de 0, cette convergence ´etant uniforme sur tout intervalle de la forme ]0, A]. Au voisinage de 1 l’infini, l’int´egrale est domin´ee par celle de 2 , qui est convergente, ce qui prouve la convergence uniforme x de notre int´egrale au voisinage de l’infini, pour toute valeur de α. En d´erivant l’int´egrale Iα propos´ee par rapport `a α, on trouve : Z +∞ 2 0 Iα = e−αx dx, 0
qui est une int´egrale uniform´ement convergente pour α dans ]0, A]. Ceci montre que cette d´erivation est licite. √ En faisant le changement de variable u = x α, et en utilisant l’int´egrale de Gauss, on trouve Iα0 = √ 1 √ π √ . On a donc Iα = πα + C, pour une certaine constante C. Mais C = I0 = 0. 2 α 5. a) Soit [α, β] un intervalle compact de ]0, +∞[ (0 < α < β), et soit x dans [α, β]. Pour t entre 0 et 1, e−t tx−1 est major´e ind´ependamment de x, par tα−1 . Comme α est strictement positif, l’int´egrale
Int´ egrale Simple. Z
1
33 Z
α−1
t
−t x−1
dt est convergente. Pour t ≥ 1, e t
−t β−1
est major´e par e t
0
, et l’int´egrale
∞
e−t tβ−1 dt
1
est convergente. L’int´egrale d´efinissant Γ est donc uniform´ement convergente pour x entre α et β, et la fonction Γ est continue sur ]0, +∞[. b) La premi`ere relation s’obtient en int´egrant par parties (x > 0) : Z ∞ Γ(x + 1) = tx e−t dt 0 Z ∞ £ ¤∞ = − tx e−t 0 + xtx−1 e−t dt 0
=
xΓ(x).
La deuxi`eme s’obtient par un calcul direct : Z
∞
Γ(1) =
e−t dt = 1.
0
La troisi`eme s’obtient par r´ecurrence en utilisant les deux autres : Elle est vraie pour n = 1, et Γ(n + 1) = nΓ(n) = n(n − 1)! = n! c) Ceci r´esulte imm´ediatement des deux premi`eres relations ci-dessus, et de la continuit´e de Γ en 1. En effet : Γ(x) = xΓ(x) = Γ(x + 1) 1 x
qui tend vers 1 quand x tend vers 0. d) On a dt = xux−1 du, donc : Γ(1 +
1 ) = x = = =
1 1 Γ( ) xZ x 1 ∞ −t 1 −1 e t x dt x 0 Z 1 ∞ −ux 1−x x−1 e u xu du x 0 Z ∞ x e−u du. 0
e) Il suffit de faire x = 2 dans la relation pr´ec´edente : √ Z ∞ 2 1 1 3 π Γ( ) = Γ( ) = e−u du = , 2 2 2 2 0 √ 1 donc Γ( ) = π. 2
Ce cours peut ˆetre librement copi´e et distribu´e. Il est recommand´e d’en t´el´echarger la version la plus r´ecente ` a partir de : http://www.math.jussieu.fr/~alp. Toute remarque, correction ou suggestion doit ˆetre address´ee ` a l’auteur :
[email protected].
Calcul Diff´ erentiel par Alain Prout´e Universit´e Denis Diderot — Paris 7
Table des mati` eres 1 D´ eriv´ ee d’une fonction. 1.1 L’application lin´eaire tangente. . . . . . . . . . . . . . 1.2 Lien avec la dimension 1. . . . . . . . . . . . . . . . . 1.3 Exemples de calcul de d´eriv´ees. . . . . . . . . . . . . . 1.3.1 Applications lin´eaires continues. . . . . . . . . 1.3.2 L’application x 7→ xn . . . . . . . . . . . . . . . 1.3.3 L’application x 7→ x−1 . . . . . . . . . . . . . . 1.3.4 Applications bilin´eaires continues. . . . . . . . 1.4 D´erivation des applications ` a valeurs dans un produit. 1.5 Le th´eor`eme de d´erivation des fonctions compos´ees. . . ´ 1.5.1 Enonc´ e et d´emonstration. . . . . . . . . . . . . 1.5.2 Cas de la dimension 1. . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Nouveaux exemples de d´eriv´ees. . . . . . . . . . . . . . 1.6.1 Produit de deux fonctions. . . . . . . . . . . . . 1.6.2 Fonctions polynˆ omiales. . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7 Matrice jacobienne. . . . . . . . . . . . . . . . . . . . . 1.8 Calcul des d´eriv´ees partielles. . . . . . . . . . . . . . . 1.9 Un exemple pathologique. . . . . . . . . . . . . . . . . 1.10 D´eriv´ee dans la direction d’un vecteur. . . . . . . . . . 1.11 Encore des exemples de d´eriv´ees. . . . . . . . . . . . . 1.11.1 Le d´eterminant. . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
2 2 3 4 4 4 4 5 5 6 6 7 7 7 7 9 10 10 10 11 12 12 12 13
2 Le th´ eor` eme de la moyenne (ou des accroissements finis). ´ 2.1 Enonc´ e et d´emonstration . . . . . . . . . . . . . . . . . . . . . 2.2 Applications du th´eor`eme de la moyenne. . . . . . . . . . . . 2.2.1 Fonctions lipschitziennes. . . . . . . . . . . . . . . . . 2.2.2 Convergence d’une suite de fonctions d´erivables. . . . 2.2.3 D´erivabilit´e et d´eriv´ees partielles. . . . . . . . . . . . . 2.2.4 D´eriv´ee d’une curryfi´ee et r`egle de Leibnitz. . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
14 14 15 15 16 17 18 21
3 D´ eriv´ ees d’ordre sup´ erieur. 3.1 D´efinition. . . . . . . . . . . . . . . . . . . . . 3.2 Exemples de d´eriv´ees d’ordre sup´erieur. . . . 3.2.1 Applications lin´eaires. . . . . . . . . . 3.2.2 Applications bilin´eaires. . . . . . . . . 3.2.3 Composition avec une fonction affine. 3.2.4 Fonctions compos´ees. . . . . . . . . . 3.2.5 L’application x 7→ x−1 . . . . . . . . . 3.3 Sym´etrie des d´eriv´ees d’ordre sup´erieur. . . . 3.4 Formule de Taylor–Young. . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
21 21 22 22 23 23 23 24 25 27
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
2
Calcul Diff´ erentiel 3.5 Extr´emas de fonctions deux fois d´erivables. . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4 Diff´ eomorphismes et inversion locale. 4.1 Diff´eomorphismes et diff´eomorphismes locaux. . . 4.2 Applications contractantes. . . . . . . . . . . . . ´ 4.3 Enonc´ e et d´emonstration du th´eor`eme d’inversion 4.3.1 R´eduction du probl`eme . . . . . . . . . . 4.3.2 Une application contractante. . . . . . . . 4.3.3 Injectivit´e locale. . . . . . . . . . . . . . . 4.3.4 Surjectivit´e locale. . . . . . . . . . . . . . 4.3.5 L’inverse local et sa continuit´e. . . . . . . 4.3.6 Fin de la d´emonstration. . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . locale. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
Solution des exercices.
1 1.1
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
28 29 30 30 31 32 33 33 34 34 34 35 35 36
D´ eriv´ ee d’une fonction. L’application lin´ eaire tangente.
D´ efinition 1 Soit E et F des espaces de Banach. Soit U un ouvert de E, et f : U −→ F une application (qu’on ne suppose pas n´ecessairement continue). Soit x un point de U . On dit que f est d´erivable en x, s’il existe une application lin´eaire continue fx′ de E vers F , telle que, pour tout h dans un voisinage de 0, on ait : f (x + h) = f (x) + fx′ (h) + o(h), o` u o(h) est n´egligeable devant h, quand h tend vers 0, ce qui signifie que : ∀ε>0 ∃η>0 khk < η ⇒ ko(h)k < εkhk. On notera que la fonction h 7→ o(h) d´epend de f et de x. On remarquera ´egalement que “ˆetre n´eligeable devant h quand h tend vers 0” est plus fort que “tendre vers 0 quand h tend vers 0”. En effet, en particularisant l’hypoth`ese que o(h) est n´egligeable devant h quand h tend vers 0 `a ε = 1, on obtient ko(h)k ≤ khk pour h assez petit. Notation de Landau : Quand on manipule plusieurs fonctions telles que la fonction o ci-dessus, on devrait normalement leur donner des noms diff´erents : o1 , o2 , . . . Toutefois, il est d’usage de les noter toutes o. C’est ce qu’on appelle la “notation de Landau”. Il faut ´evidemment garder cette convention pr´esente `a l’esprit. Elle a pour cons´equence entre autres, que : o(h) + o(h) = o(h)
o(h) − o(h) = o(h)
ko(h) = o(h)
(o` u k est un r´eel). Ceci signifie tout simplement qu’une somme, une diff´erence ou un multiple r´eel d’expressions n´egligeables devant h quand h tend vers 0 est encore une expression n´egligeable devant h quand h tend vers 0. Toutefois, pour plus de clart´e, il nous arrivera de donner des noms diff´erents aux expressions n´egligeables devant h quand h tend vers 0. La fonction h 7→ f (x + h) est donc “presque” une fonction affine continue (` a savoir la fonction h→ 7 f (x) + fx′ (h)), en ce sens que la diff´erence entre ces deux fonctions est n´egligeable devant h quand h tend vers 0. On peut aussi dire que la fonction h 7→ f (x + h) − f (x) est “presque” lin´eaire continue. Lemme 1 Si f est d´erivable en x, alors elle est continue en x.
Calcul Diff´ erentiel
3
En effet, on a f (x + h) − f (x) = fx′ (h) + o(h), et comme fx′ est continue, le membre de droite de cette ´egalit´e tend vers 0 quand h tend vers 0. Lemme 2 L’application lin´eaire continue fx′ de la d´efinition pr´ec´edente est unique (si elle existe). En effet, supposons que g soit une autre application lin´eaire continue, telle que f (x + h) = f (x) + g(h) + o(h). On aurait alors fx′ (h) − g(h) = o(h). Soit ε > 0, et h un ´el´ement de E. Pour h assez petit, on a : kfx′ (h) − g(h)k < εkhk. Comme ε est arbitraire, on voit que kfx′ − gk = 0, ce qui signifie g = fx′ . 2 L’application lin´eaire continue fx′ est appel´ee “application lin´eaire tangente `a f en x”, ou “d´eriv´ee de f en x”, ou “diff´erentielle de f en x”. L’application x 7→ fx′ , qui envoie U dans l’espace des applications lin´eaires continues de E vers F s’appelle “d´eriv´ee de f ”, et sera not´ee f ′ . On ne doit pas confondre la d´eriv´ee f ′ : U −→ L(E, F ), avec la d´eriv´ee en x, fx′ : E −→ F . On ´evitera la notation f ′ (x), et on conservera la notation fx′ pour d´esigner l’image de x par f ′ . La notation f ′ (x) quant–`a elle est r´eserv´ee pour un autre usage, comme on va le voir ci–apr`es. Certains ouvrages utilisent l’une des notations (df )x ou (Df )x au lieu de fx′ .
1.2
Lien avec la dimension 1.
Pour une fonction f d´efinie sur un intervalle U de R, et `a valeurs dans un espace de Banach E, pas n´ecessairement de dimension 1, on a d´ej` a une notion de d´eriv´ee en un point x0 . Il s’agit de la limite du rapport suivant (appel´e taux d’accroissement dans le cas o` u E = R) :
quand x tend vers x0 .
f (x) − f (x0 ) x − x0
Cette d´eriv´ee est not´ee f ′ (x0 ), et est un ´el´ement de E, et non pas une application lin´eaire de R vers E. C’est la raison pour laquelle, nous r´eservons la notation f ′ (x) pour d´esigner la d´eriv´ee de f en x (limite du rapport ci–dessus), et adoptons la notation fx′ pour d´esigner l’application lin´eaire tangente `a f en x (malheureusement aussi appel´ee “d´eriv´ee”). Bien sˆ ur, dans cette situation, l’application lin´eaire tangente a encore un sens. Il y a donc certainement un lien entre f ′ (x) (´el´ement de E) et l’application lin´eaire tangente fx′ (´el´ement de L(R, E)). Ce lien s’exprime par l’´egalit´e : f ′ (x) = fx′ (1). Remarquons d’abord que cette ´egalit´e a un sens, puisque fx′ ´etant une application (lin´eaire) de R vers E, fx′ (1) est un ´el´ement de E, tout comme f ′ (x). Maintenant fx′ : R −→ E est caract´eris´e par : f (x + h) = f (x) + fx′ (h) + o(h), o` u o(h) est n´egligeable devant h quand h tend vers 0, et f ′ (x) est caract´eris´e par : f (x + h) = f (x) + hf ′ (x) + o(h) (d´eveloppement limit´e ` a l’ordre 1 de f en x). Comme fx′ (h) = hfx′ (1), par lin´earit´e de fx′ , on voit, par ′ unicit´e de la d´eriv´ee f (x) que f ′ (x) = fx′ (1).
4
Calcul Diff´ erentiel
1.3
Exemples de calcul de d´ eriv´ ees.
La m´ethode standard est de tenter de “d´evelopper” f (x + h) sous la forme f (x) + l(h) + o(h), avec l lin´eaire continue, et o(h) n´egligeable devant h quand h tend vers 0. Si on y parvient, l sera n´ecessairement fx′ , par unicit´e de l’application lin´eaire tangente en x. Noter que toute application contante a une d´eriv´ee nulle en tout point. 1.3.1
Applications lin´ eaires continues.
Si u : E −→ F est une application lin´eaire continue, elle est d´erivable en tout point de E. Un effet, on peut ´ecrire u(x + h) = u(x) + u(h) + o(h) (avec ici o(h) = 0). La d´eriv´ee de u en x est donc u (et ceci quel que soit le point x de E). 1.3.2
L’application x 7→ xn .
Soit A une alg`ebre de Banach. L’application x 7→ xn de A vers A est d´erivable en tout x de E. En effet, on a, en developpant le produit (x + h)n , (x + h)(x + h) . . . (x + h) = xn + xn−1 h + xn−2 hx + · · · + xhxn−2 + hxn−1 + o(h), o` u o(h) contient tous les termes du developpement qui sont de degr´e au moins 2 en h. On notera que tout monˆ ome de degr´e au moins 2 en h est n´egligeable devant h. En effet, la norme d’un tel monˆ ome est major´ee par le produit d’une constante r´eelle par une puissance de khk d’exposant au moins 2. Comme l’application h 7→ xn−1 h + xn−2 hx + · · · + xhxn−2 + hxn−1 est lin´eaire et continue, on voit qu’elle doit ˆetre la d´eriv´ee de x 7→ xn en x. Bien sˆ ur dans le cas d’une alg`ebre commutative, on trouve la formule plus famili`ere h 7→ nxn−1 h. 1.3.3
L’application x 7→ x−1 .
Soit A une alg`ebre de Banach. On sait que A∗ est un ouvert de A. Par ailleurs, l’application x 7→ x−1 est d´efinie sur A∗ , et envoie A∗ dans A. Nous allons la d´eriver en un point x. Commen¸cons par la d´eriver en 1. On a (1 + h)(1 − h) = 1 − h2 , ce qui donne (1 + h)−1 = 1 − h + (1 + h)−1 h2 ,
ce qui a un sens pour h assez petit. Or, comme (1 + h)−1 est born´e pour h voisin de 0 (continuit´e de x 7→ x−1 en 1), et comme h2 est n´egligeable devant h quand h tend vers 0, on voit que (1 + h)−1 h2 est n´egligeable devant h. On a donc (1 + h)−1 = 1 − h + o(h).
Comme h 7→ −h est lin´eaire continue, la d´eriv´ee de x 7→ x−1 en 1 est donc h 7→ −h.(1 ) 1
On pouvait aussi proc´ eder comme suit : On a pour khk < 1, (1 + h)−1 = 1 − h + h2 − h3 + · · · = 1 − h + o(h),
puisque kh2 − h3 + . . . k ≤ khk2 k1 − h + h2 − . . . k ≤ khk2
1 . 1 − khk
Calcul Diff´ erentiel
5
Soit maintenant x un ´el´ement quelconque de A∗ . On a (x + h)−1
= (x(1 + x−1 h))−1 = (1 + x−1 h)−1 x−1 = (1 − x−1 h + o(h))x−1
= x−1 − x−1 hx−1 + o(h). La d´eriv´ee de x 7→ x−1 en x est donc l’application (lin´eaire continue) h 7→ −x−1 hx−1 . −h Dans le cas d’une alg`ebre commutative, cette formule peut se r´e´ecrire h 7→ 2 . On retrouve ainsi le x r´esultat bien connu dans le cas de l’alg`ebre R. 1.3.4
Applications bilin´ eaires continues.
Soit f : E × F −→ G une application bilin´eaire continue (o` u E, F et G sont des espaces de Banach). f est d´erivable en tout point (x, y) de E × F . En effet, on peut ´ecrire f (x + h, y + k) = f (x, y) + f (x, k) + f (h, y) + f (h, k). Comme f est continue, on a kf (h, k)k ≤ kf k khk kkk. La norme de (h, k) est par d´efinition sup(khk, kkk). On a donc kf (h, k)k ≤ kf k k(h, k)k2 = o((h, k)). Il en r´esulte que la d´eriv´ee de f en (x, y) est l’application lin´eaire continue (h, k) 7→ f (x, k) + f (h, y). En particulier, si E = F = G = R, et si f est le produit (multiplication des nombres r´eels), on a pour d´eriv´ee du produit en (x, y) : (h, k) 7→ xk + hy. Des exemples importants sont bien sˆ ur les produits scalaires, le produit vectoriel, et d’une mani`ere g´en´erale, tout ce qui porte le nom de “produit”, qui est g´en´eralement bilin´eaire continu.
1.4
D´ erivation des applications ` a valeurs dans un produit.
Supposons maintenant que f soit une application d’un ouvert U d’un espace de Banach E, vers un produit F = F1 × · · · × Fn d’espaces de Banach (lequel est un espace de banach avec la norme k(y1 , . . . , yn )k = sup(ky1 k, . . . , kyn k)). Il existe alors des applications uniques fi : U −→ Fi , telles que pour tout x de U , on ait : f (x) = (f1 (x), . . . , fn (x)). Les applications fi sont appel´ees les composantes de f (relativement `a la d´ecomposition F1 × · · · × Fn de F ). Lemme 3 Sous les conditions ci–dessus, f est d´erivable en x ∈ U , si et seulement si chaque composante fi est d´erivable en x. De plus, on a pour tout h de E : ′
′
fx′ (h) = ((f1 )x (h), . . . , (fn )x (h)). Autrement–dit, la d´eriv´ee de f en x a pour composantes les d´eriv´ees en x des composantes de f . Supposons f d´erivable en x, c’est–`a–dire f (x + h) = f (x) + fx′ (h) + o(h),
6
Calcul Diff´ erentiel
o` u o(h) est n´egligeable devant h quand h tend vers 0. Notons (fx′ )i la ii`eme composante de l’application lin´eaire fx′ . (fx′ )i est une application lin´eaire continue de E vers Fi . En projetant la relation ci–dessus sur le ii`eme facteur de F , on obtient : fi (x + h) = fi (x) + (fx′ )i (h) + oi (h), o` u oi (h) est n´egligeable devant h quand h tend vers 0, ce qui montre que fi est d´erivable en x, et que ′ (fi )x = (fx′ )i . R´eciproquement, si chaque fi est d´erivable en x, on a : fi (x + h) = fi (x) + (fi )′x (h) + oi (h), o` u oi (h) est n´egligeable devant h quand h tend vers 0, ce qui donne imm´ediatemment : ′
′
f (x + h) = f (x) + ((fi )x (h), . . . , (fi )x (h)) + o(h), o` u o(h) est n´egligeable devant h quand h tend vers 0, et prouve donc que f est d´erivable en x, avec pour d´eriv´ee l’application lin´eaire continue : ′
′
h 7→ ((fi )x (h), . . . , (fi )x (h)). 2
1.5 1.5.1
Le th´ eor` eme de d´ erivation des fonctions compos´ ees. ´ Enonc´ e et d´ emonstration.
Th´ eor` eme 1 Soient E, F et G trois espaces de Banach. Soit U un ouvert de E, et V un ouvert de F . Soit f : U −→ F et g : V −→ G des applications, telles que f (U ) ⊂ V . Soit enfin x un point de U . Si f est d´erivable en x, et si g est d´erivable en f (x), alors g ◦ f est d´erivable en x, et on a : (g ◦ f )′x = gf′ (x) ◦ fx′ . Ce th´eor`eme dit simplement que la d´erivation commute `a la composition. En effet, comme f est d´erivable en x, on a f (x + h) = f (x) + fx′ (h) + o1 (h), o` u o1 (h) est n´egligeable devant h quand h tend vers 0. De mˆeme, on a puisque g est d´erivable en f (x), g(f (x) + k) = g(f (x)) + gf′ (x) (k) + o2 (k), o` u o2 (k) est n´egligeable devant k quand k tend vers 0. Dans l’´egalit´e ci–dessus, qui est valable pour tout k assez petit, on peut remplacer k par f (x+h)−f (x) (lui aussi petit quand h est petit, et qui est ´egal `a fx′ (h) + o1 (h)), ce qui donne g(f (x + h)) = g(f (x)) + gf′ (x) (fx′ (h)) + gf′ (x) (o1 (h)) + o2 (fx′ (h) + o1 (h)). Il suffit donc pour d´emontrer le th´eor`eme de montrer que gf′ (x) (o1 (h)) + o2 (fx′ (h) + o1 (h)) est n´egligeable devant h, quand h tend vers 0. Or o1 (h) ´etant n´egligeable devant h quand h tend vers 0, il en est de mˆeme de gf′ (x) (o1 (h)), puisque gf′ (x) est une application lin´eaire continue, et h 7→ fx′ (h)+o1 (h) ´etant domin´ee par h au voisinage de 0 (car fx′ est lin´eaire continue ; en fait, on a clairement kfx′ (h) + o1 (h)k ≤ (kfx′ k + 1)khk pour h assez petit), o2 (fx′ (h) + o1 (h)), qui est n´egligeable devant fx′ (h) + o1 (h) quand h tend vers 0, est donc n´egligeable devant h quand h tend vers 0. 2
Calcul Diff´ erentiel 1.5.2
7
Cas de la dimension 1.
Dans le cas o` u les espaces E et F sont de dimension 1, on peut ´ecrire : (g ◦ f )′x (1) = gf′ (x) ◦ fx′ (1), ce qui donne : (g ◦ f )′ (x) = gf′ (x) (f ′ (x)) = f ′ (x)gf′ (x) (1) = f ′ (x)g ′ (f (x)), c’est–`a–dire, la formule bien connue de d´erivation des fonctions compos´ees d’une seule variable r´eelle.
Exercices 1
Soit a, b ∈ R avec a < b et soit t ∈]a, b[. On consid`ere les apllications : ψ
C([a, b], R) −→
ϕt
C([a, b], R) −→ R f 7−→ f (t)
et
f
7−→
R Z
b
f (x)dx
a
Montrer que ϕt et ψ sont d´erivables. 2 On consid`ere M2 (R) l’ensemble des matrices 2 × 2 `a co´efficients r´eels. Soit l’application θ sur M2 (R) d´efinie par : M2 (R) A
θ
−→ M2 (R) 7−→ A2
Montrer que θ est d´erivable sur M2 (R) et donner une ´expression de sa d´eriv´ee.
3
Soit une application ϕ : R → R de classe C 2 . Soient a, b ∈ R tels que a ≤ b. On pose alors : ϕ∗
C([a, b], R) −→ C([a, b], R) f 7−→ ϕ◦f Montrer que ϕ∗ est d´erivable et donner sa d´eriv´ee. 4
On consid`ere l’application : R3 × R3 (x, y)
o` u ∧ est le produit vectoriel de R3 .
f
−→ R3 7−→ x ∧ y
Montrer que f est d´erivable et donner sa s´eriv´ee.
1.6 1.6.1
Nouveaux exemples de d´ eriv´ ees. Produit de deux fonctions.
Lemme 4 (D´erivation d’un produit) Soit E un espace de Banach, U un ouvert de E, et A une alg`ebre de Banach. Soit f, g : U −→ A deux applications d´erivables en x0 ∈ U . Alors l’application produit f g est
8
Calcul Diff´ erentiel
d´erivable en x0 , et a pour d´eriv´ee : h 7→ fx′ 0 (h)g(x0 ) + f (x0 )gx′ 0 (h). L’application f g, c’est–`a–dire x 7→ f (x)g(x) est la compos´ee suivante : E x
(f,g)
−→ 7−→
A×A (f (x), g(x))
.
−→ A 7−→ f (x)g(x)
La premi`ere application envoie x0 sur le couple (f (x0 ), g(x0 )), et a pour d´eriv´ee en x0 l’application lin´eaire : h 7→ (fx′ 0 (h), gx′ 0 (h)), et la seconde, qui est une application bilin´eaire continue, a pour d´eriv´ee en (f (x0 ), g(x0 )), l’application lin´eaire : (k, l) 7→ hg(x0 ) + f (x0 )l. On obtient le r´esultat annonc´e en appliquant le th´eor`eme de d´erivation des fonctions compos´ees. Le r´esultat du lemme pr´ec´edent est assez malpratique, car il oblige `a faire apparaˆıtre h dans l’expression de la d´eriv´ee de f g. On aimerait pouvoir ´ecrire : (f g)′x0 = fx′ 0 g(x0 ) + f (x0 )gx′ 0 ou mˆeme la forme plus condens´ee : (f g)′ = f ′ g + f g ′ C’est possible, mais ` a condition de prendre conscience du fait que les produits qui interviennent dans ces nouvelles formules ne sont plus celui de l’alg`ebre A, mais des produit induits par lui. En effet, fx′ 0 n’appartient pas ` a A, mais ` a L(E, A), alors que fx′ 0 (h) appartient bien entendu `a A. Le produit fx′ 0 g(x0 ) (qui doit appartenir ` a L(E, A)) est donc celui d’un ´el´ement de L(E, A) par un ´el´ement de A. Un tel produit existe bien. Il est d´efini par : (l, x) 7→ (h 7→ l(h)x) o` u le produit de l(h) par x est celui de A. Ce nouveau produit est clairement bilin´eaire, et est le seul (de L(E, A) × A vers L(E, A)) qu’on puisse “naturellement” associer au produit dont on dispose d´ej` a sur A. C’est pourquoi il est dit “induit” par celui de A. Notez qu’on a de mˆeme un produit A × L(E, A) −→ L(E, A), d´efini par : (x, l) 7→ (h 7→ xl(h)) qui est celui qu’on doit utiliser dans l’expression f (x0 )gx′ 0 .
Ces conventions ´etant admises (c’est ` a dire qu’on a surd´efini la simple juxtaposition qui sert `a noter les produits), la formule (f g)′x0 = fx′ 0 g(x0 ) + f (x0 )gx′ 0 est correcte. Pour ce qui est de la seconde formule, il faut aller un peu plus loin. De mˆeme qu’on d´efinit le produit de deux fonctions f et g (par exemple de R vers R ou de U vers A comme c’est le cas ici) en posant (f g)(x) = f (x)g(x), on peut d´efinir le produit de deux fonctions : ϕ : U −→ L(E, A)
et
ψ : U −→ A
en posant (ϕψ)(x) = ϕ(x)ψ(x), o` u bien entendu, le produit de ϕ(x) ∈ L(E, A) par ψ(x) ∈ A est celui dont on a parl´e ci–dessus. Dans ces conditions, le seconde formule (f g)′ = f ′ g + f g ′ est elle aussi correcte. On a donc :
Calcul Diff´ erentiel
9
Lemme 5 Soit E un espace de Banach, U un ouvert de E, et A une alg`ebre de Banach. Soit f, g : U −→ A deux applications d´erivables sur U . Alors l’application produit f g est d´erivable sur U , et on a : (f g)′ = f ′ g + f g ′ o` u le produit de f ′ par g est d´efini par : f ′ g = x0 7→ (h 7→ fx′ 0 (h)g(x0 ))
c’est a ` dire
(f ′ g)(x0 )(h) = fx′ 0 (h)g(x0 )
et de mani`ere similaire pour le produit de f par g ′ . 1.6.2
Fonctions polynˆ omiales.
Soit E un espace de Banach. Soit E ∗ l’espace des formes lin´eaires continues sur E. E ∗ est un sous– espace de l’alg`ebre des fonctions continues de E vers R. Ce sous–espace engendre une sous–alg`ebre, qu’on appelle alg`ebre des fonctions polynˆ omiales sur E. Dans le cas o` u E = Rn , E ∗ a pour base (e∗1 , . . . , e∗n ), o` u (e1 , . . . , en ) est la base canonique de Rn . n L’alg`ebre des fonctions polynˆ omiales sur R est donc engendr´ee par ces formes lin´eaires. Elle contient dont les produits de la forme e∗i1 . . . e∗ik , de mˆeme que toutes les combinaisons lin´eaires de ces produits. Il est facile de v´erifier que l’ensemble de ces combinaisons lin´eaires est une alg`ebre. C’est donc l’alg`ebre des fonctions polynˆ omiales. Il faut remarquer que si on note (x1 , . . . , xn ) une variable repr´esentant un ´el´ement quelconque de Rn , la forme lin´eaire e∗i n’est autre que : (x1 , . . . , xn ) 7→ xi .
Avec ces notations, une combinaison lin´eaire de produits des formes lin´eaires e∗i n’est alors pas autre chose qu’une application de la forme : (x1 , . . . , xn ) 7→ P (x1 , . . . , xn ), o` u P (x1 , . . . , xn ) est un polynˆ ome en les variables x1 , . . . , xn . Ceci justifie la d´efinition donn´ee plus haut de l’alg`ebre des fonctions polynˆomiales sur E. Une fonction polynˆ omiale ´etant une somme de produits de formes lin´eaires, il suffit pour la d´eriver de savoir d´eriver une somme (la d´eriv´ee est la somme des d´eriv´ees), un produit de deux facteurs (c’est un cas particulier d’application bilin´eaire), et une forme lin´eaire continue (sa d´eriv´ee est elle–mˆeme). Par exemple, la d´eriv´ee au point (x0 , y0 , z0 ) de l’application suivante de R3 vers R : (x, y, z) 7→ x2 + 3xy − 5xyz est : (h, k, l) 7→ 2hx0 + 3hy0 + 3x0 k − 5hy0 z0 − 5x0 kz0 − 5x0 y0 l. En effet, (x, y, z) 7→ x2 est le produit de la forme lin´eaire (x, y, z) 7→ x par elle–mˆeme. Sa d´eriv´ee est donc : (h, k, l) 7→ x0 h + hx0 = 2hx0 (x, y, z) 7→ 3xy est un produit de deux forme lin´eaires, et a pour d´eriv´ee : (h, k, l) 7→ 3hy0 + 3x0 k Enfin, la fonction polynˆ omiale (x, y, z) 7→ −5xyz est un produit de trois forme lin´eaires, et a pour d´eriv´ee : (h, k, l) 7→ −5hy0 z0 − 5x0 kz0 − 5x0 y0 l.
10
Calcul Diff´ erentiel
Exercices 5 Montrer que la norme associ´ee au produit scalaire d’un espace euclidien est d´erivable en tout point autre que 0, et calculer cette d´eriv´ee.
1.7
Matrice jacobienne.
Nous suppposons maintenant que les espaces de Banach E et F sont de dimensions finies n et p, et sont munis de bases. Soit donc B = (e1 , . . . , en ) une base de E, et B ′ = (ε1 , . . . , εp ) une base de F . Soit U un ouvert de E, x un point de U , et f : U −→ F une application d´erivable en x. On notera fi les composantes de f relativement ` a la base B ′ . La d´eriv´ee fx′ de f en x est alors une application lin´eaire ′ de E vers F . fx a une matrice dans les bases B et B ′ . D´ efinition 2 La matrice de fx′ dans les bases B et B ′ s’appelle la matrice jacobienne de f en x (relativement aux bases B et B ′ ). Le coefficient de la ii`eme colonne et j i`eme ligne de cette matrice est not´e : ∂fj , ∂xi x et est appel´e d´eriv´ee partielle en x de la composante fj relativement `a la variable xi . ∂fj contient une r´ef´erence `a une variable xi qui n’a pas ´et´e d´efinie. Ceci est dˆ u ∂xi au fait qu’en g´en´eral, la fonction fj est d´ecrite par une formule de la forme : Note : La notation
(x1 , . . . , xn ) 7−→ fj (x1 , . . . , xn ). Si la description de cette fonction faisait intervenir d’autres variables, par exemple, comme u1 , . . . , un , il ∂fj . faudrait noter cette d´eriv´ee partielle ∂ui Il s’agit donc d’un abus de langage, que seule une tradition s´eculaire nous oblige `a conserver. Dans tous les cas, le contexte permet de savoir de quoi on parle. La matrice jacobienne de f en x, not´ee parfois Jac (f )x peut donc s’´ecrire comme suit : ∂f1 ∂f1 . . . ∂x1 ∂xn x x .. .. Jac (f )x = . . . ∂fp ∂fp ... ∂x1 x ∂xn x
1.8
Calcul des d´ eriv´ ees partielles.
Supposons toujours que x = (x1 , . . . , xn ) est un point donn´e de U , et que f est d´erivable en x. Si on fixe des indices i et j (1 ≤ i ≤ n et 1 ≤ j ≤ p), on peut consid´erer l’application : ϕ
t 7−→ fj (x1 , . . . , xi−1 , t, xi+1 , . . . , xn ),
Calcul Diff´ erentiel
11
(appel´ee fonction partielle a ` hauteur de x selon la variable xi ) qui est la compos´ee des trois applications suivantes : ι
t 7−→ (x1 , . . . , xi−1 , t, xi+1 , . . . , xn ),
π
f,
(y1 , . . . , yp ) 7−→ yj .
Il s’agit d’une application d’un ouvert de R vers R, bien d´efinie au voisinage xi . Les applications ι et π ci–dessus sont respectivement affine et lin´eaire. Le th´eor`eme de d´erivation des fonctions compos´ees montre donc que la d´eriv´ee de ϕ en xi est la composition d’applications lin´eaires : π ◦ fx′ ◦ ι′ . Or la matrice de π est la matrice ligne (0 . . . 0 1 0 . . . 0) (avec le 1 `a la j i`eme place), et la matrice de ι est la matrice colonne : 0 .. . 0 1 0 . .. ′
0
(avec le 1 `a la ii`emeplace). On voit donc tout de suite que la matrice de ϕ′xi est la matrice 1 × 1 suivante : ∂fj . ∂xi x Il en r´esulte que le calcul de la d´eriv´ee partielle variable et `a valeurs r´eelles ϕ.
∂fj ∂xi
se fait en d´erivant la fonction d’une seule
x
La notion de d´eriv´ee partielle, nous donne un moyen efficace de calculer la d´eriv´ee de certaines fonctions, comme par exemple la fonction polynˆomiale f donn´ee en exemple pr´ec´edemment, d´efinie par : f (x, y, z) = x2 + 3xy − 5xyz. On a tr`es facilement : ∂f = 3x − 5xz, ∂y
∂f = 2x + 3y − 5yz, ∂x
∂f = −5xy, ∂z
ce qui donne tout de suite la matrice jacobienne. On v´erifiera facilement qu’on retrouve ainsi le r´esultat pr´ec´edent.
1.9
Un exemple pathologique.
On vient de voir que si f est d´erivable en x, elle a des d´eriv´ees partielles en x. La r´eciproque est fausse, comme le montre l’exemple suivant. Consid´erons l’application f de R × R vers R d´efinie par : f (x, y) =
xy(x + y) , x2 + y 2
pour (x, y) 6= (0, 0), et f (0, 0) = 0. Int´eressons nous `a ce qui se passe en (0, 0). La fonction partielle `a hauteur de 0, selon la variable x est : x 7→ 0,
12
Calcul Diff´ erentiel
puisqu’il suffit de faire y = 0 dans la formule donn´ee. La fonction nulle de R vers R est ´evidemmment d´erivable. La d´eriv´ee partielle existe donc bien. De la mˆeme fa¸con, on peut voir que la d´eriv´ee partielle selon la variable y existe et est elle aussi nulle. Toutefois, la fonction f n’est pas d´erivable en 0. En effet, supposons f d´erivable en (0, 0), et soit ′ : R × R −→ R l’application lin´eaire tangente. Les d´eriv´ees partielles ´etant nulles, la matrice u = f(0,0) jacobienne de f en (0, 0) est nulle, et donc u = 0. En cons´equence, la d´eriv´ee en 0 de la compos´ee de : x 7→ (x, x)
et
f
doit elle aussi ˆetre nulle. Mais cette derni`ere fonction est l’identit´e x 7→ x de R et a 1 pour d´eriv´ee en 0. Toutefois, on verra plus loin que si les d´eriv´ees partielles sont continues, la fonction est d´erivable.
1.10
D´ eriv´ ee dans la direction d’un vecteur.
D´ efinition 3 Soit U un ouvert d’un espace de Banach E, et f : U −→ F une application a ` valeurs dans l’espace de Banach F . Soit x un point de U , et v un vecteur de E. La d´eriv´ee de f en x dans la direction de v est par d´efinition, si elle existe, la limite suivante : ∂f f (x + hv) − f (x) = lim . ∂v x h−→0 h Autrement–dit, c’est la d´eriv´ee g ′ (0) de la fonction g d´efinie par g(h) = f (x + hv). Lemme 6 Dans les mˆemes conditions que ci–dessus, et en supposant f d´erivable en x, on a : ∂f = fx′ (v). ∂v x En effet, l’application g : h 7→ f (x + hv) est la compos´ee de l’application affine h 7→ x + hv, et de f . L’application affine en question, qui va de R vers E, envoie 0 sur x, et a pour d´eriv´ee en 0 l’application lin´eaire h 7→ hv. La d´eriv´ee g0′ de g en 0 est donc, d’apr`es le th´eor`eme de d´erivation des fonctions compos´ees : h 7→ fx′ (hv). On a donc
1.11 1.11.1
∂f ∂v
= g ′ (0) = g0′ (1) = fx′ (v). 2
x
Encore des exemples de d´ eriv´ ees. Le d´ eterminant.
Lemme 7 Soit M l’espace des matrices carr´ees n×n r´eelles. L’application “d´eterminant” det : M −→ R est diff´erentiable, et sa d´eriv´ee en A est donn´ee par la formule : ˜ det′A (H) = tr (t AH). (o` u A˜ est la comatrice de A).
Calcul Diff´ erentiel
13
Remarquons d’abord que le d´eterminant ´etant une application polynˆomiale, sa d´eriv´ee en A existe. On a donc une application lin´eaire det′A de M vers R, telle que pour tout H, on ait : det(A + H) = det(A) + det′A (H) + o(H)
o` u o(H) est n´egligeable devant H quand H tend vers 0. Une matrice est dite “unicolonne” si toutes ses colonnes sont nulles sauf une. Soit U une matrice unicolonne dont l’unique colonne non nulle est la ii`eme . En d´eveloppant le d´eterminant de A + U par rapport `a la ii`eme colonne, on obtient imm´ediatement : ˜ ). det(A + U ) = det(A) + tr (t AU ˜ On voit donc que l’appplication lin´eaire ϕ d´efinie par ϕ(H) = det′A (H) − tr (t AH) v´erifie l’´egalit´e : ϕ(U ) = o(U ) pour tout matrice unicolonne U . Pour tout r´eel λ non nul, on a donc par lin´earit´e de ϕ : o(λU ) . λ Or le membre de droite de cette ´egalit´e tend vers 0 quand λ tend vers 0. Il en r´esulte que ϕ est nulle sur toute matrice unicolonne. Comme toute matrice est somme de matrices unicolonnes, ϕ est nulle. 2 ϕ(U ) =
Dans le cas o` u A est inversible, cette formule se “simplifie” en : det′A (H) = det(A)tr (A−1 H). car alors
˜ ˜ tr (t AH) = tr (A−1 At AH) = det(A)tr (A−1 H).
Exercices 6 Soit G un sous–groupe ouvert du groupe des ´el´ements inversibles A∗ d’une alg`ebre de Banach A. Soit de mˆeme G′ un sous–groupe ouvert du groupe des ´el´ements inversibles A′∗ d’une alg`ebre de Banach A′ . Soit g : G −→ G′ un morphisme de groupes suppos´e continu. Montrer que si g est d´erivable en 1, alors il est d´erivable en tout point x de G, et on a : gx′ (h) = g(x)g1′ (x−1 h) = g1′ (hx−1 )g(x).
7
Le but de cet ´exercices est de montrer que ∀x ∈ R, det(exA ) = etr (A) .
On consid`ere Mn (R) l’ensemble des matrices n × n `a co´efficients r´eels et soit GL n (R) l’ensemble des matrices de Mn (R) inversibles. Soit A ∈ Mn (R), on consid`ere les applications : R x
ϕ
−→ GL n (R) 7−→ exA
et
R x
ψ
−→ R∗+ 7−→ det(ϕ(x)) = det(exA )
1. Montrer que ϕ est d´erivable en 0 et que ϕ′ (0) = A. 2. Montrer que ψ est d´erivable en 0 et que ψ ′ (0) = tr (A). 3. En d´eduire que det(exA ) = etr (A)x pour tout x ∈ R. 8
Soit l’application : R2 (x, y)
f
−→ R 7−→ arctan x + arctan y − arctan
x+y 1 − xy
14
Calcul Diff´ erentiel
On note D = R2 \{(x, y) ∈ R2 , xy = 1} le domaine de d´efinition de f . Montrer que f (x, y) est ´egal soit ` a 0, soit `a π, soit `a −π.
2
Le th´ eor` eme de la moyenne (ou des accroissements finis).
Le th´eor`eme de la moyenne a une interpr´etation m´ecanique simple. Soit A un point mobile dont la trajectoire est une courbe de l’espace R3 . Soit B un deuxi`eme point mobile dont la trajectoire est une courbe de R (c’est–` a–dire une ligne droite). On suppose qu’`a tout moment, la vitesse de B est positive et plus grande que le module de la vitesse de A. Alors, `a tout moment, B est plus ´eloign´e de son point de d´epart que ne l’est A. Bien sˆ ur, ceci tient non seulement au fait que B a une vitesse plus ´elev´ee que A, mais aussi au fait que B se d´eplace en ligne droite, alors que A peut par exemple tourner en rond. Pourtant, ce th´eor`eme “´evident”, qui s’appelle th´eor`eme de la moyenne, ou th´eor`eme des accroissements finis, n’est pas si simple ` a d´emontrer. La raison en est que les hypoth`eses portent sur la vitesse (une notion “infinit´esimale”), alors que la conclusion porte sur les distances parcourues (une notion “globale”). Pour passer de l’hypoth`ese ` a la conclusion, il est donc n´ecessaire de passer de l’infinit´esimal au global (ou de l’infinit´esimal au fini, d’o` u le nom de th´eor`eme des accroissements finis).
2.1
´ Enonc´ e et d´ emonstration
Th´ eor` eme 2 (th´eor`eme de la moyenne) Soit E un espace de Banach. Soit [a, b] (a < b) un intervalle compact de R. Soient : f : [a, b] −→ E et g : [a, b] −→ R
deux applications continues sur [a, b] et d´erivables sur ]a, b[, telles que ∀x ∈]a, b[ kf ′ (x)k ≤ g ′ (x). Alors, on a : kf (b) − f (a)k ≤ g(b) − g(a). On remarquera l’absence de signes de valeurs absolues autour de g ′ (x) et de g(b) − g(a). Soit ε > 0. Il suffit de montrer que : kf (b) − f (a)k ≤ g(b) − g(a) + ε(b − a) + ε, car ε peut ˆetre pris aussi petit qu’on veut. Soit A l’ensemble des x de [a, b] tels que : kf (x) − f (a)k > g(x) − g(a) + ε(x − a) + ε. Si on d´emontre que A est vide, alors b ne pourra pas appartenir `a A, et on aura d´emontr´e l’in´egalit´e voulue. On peut donc supposer A non vide. ` cause du terme ε a A ` la fin du second membre de l’in´egalit´e d´efinissant A, et `a cause de la continuit´e des fonctions f et g et de la fonction x 7→ ε(x − a), on voit qu’il existe un voisinage de a ne contenant aucun point de A. Comme A est non vide et minor´e par a, A a une borne inf´erieure. Notons c cette borne inf´erieure. On a a < c d’apr`es ce qui vient d’ˆetre dit plus haut. Par ailleurs, c ne peut pas ˆetre dans A. En effet, s’il y ´etait, un voisinage de c dans [a, b] serait inclus dans A, car A est d´efini par une in´egalit´e stricte dont les deux membres sont des fonctions continues de x.
Calcul Diff´ erentiel
15
c est donc distinct de b, car sinon, A serait r´eduit au point b, et c serait dans A. On a donc a < c < b, et on peut appliquer l’hypoth`ese au point c, c’est–`a–dire qu’on a kf ′ (c)k ≤ g ′ (c). Comme c n’est pas dans A, on a : kf (c) − f (a)k ≤ g(c) − g(a) + ε(c − a) + ε. ´ Ecrivons que f et g sont d´erivables en c : f (c + h) = f (c) + hf ′ (c) + o1 (h),
g(c + h) = g(c) + hg ′ (c) + o2 (h).
o` u o1 (h) et o2 (h) sont n´egligeables devant h, quand h tend vers 0. Il suffit maintenant de prouver que pour h > 0 assez petit, c + h n’est pas dans A, car ceci sera en contradiction avec le fait que c est la borne inf´erieure de A. Or, on a (pour h > 0) : kf (c + h) − f (a)k ≤
≤ ≤ ≤
kf (c + h) − f (c)k + kf (c) − f (a)k
khf ′ (c)k + ko1 (h)k + g(c) − g(a) + ε(c − a) + ε hg ′ (c) + g(c) − g(a) + ε(c − a) + ε + ko1 (h)k
g(c + h) − g(a) + ε(c − a) + ε + ko1 (h)k − o2 (h).
Or ko1 (h)k − o2 (h) ´etant n´egligeable devant h, quand h tend vers 0, on peut choisir h assez petit pour que cette quantit´e soit plus petite que εh. 2
2.2 2.2.1
Applications du th´ eor` eme de la moyenne. Fonctions lipschitziennes.
Lemme 8 Soit f : [a, b] −→ F une application continue d’un intervalle compact de R vers un espace de Banach F . On suppose que f est d´erivable sur ]a, b[. Alors, s’il existe un r´eel k tel que ∀x ∈]a, b[ kf ′ (x)k ≤ k, l’application f est k–lipschitzienne sur [a, b]. Le th´eor`eme de la moyenne appliqu´e sur un intervalle quelconque [u, v] contenu dans [a, b], en prenant pour g la fonction x 7→ kx, montre que kf (u) − f (v)k ≤ k(v − u). 2 Th´ eor` eme 3 Soit U une partie ouverte et convexe d’un espace de Banach E. Soit f : U −→ F une fonction continue et d´erivable, a ` valeurs dans un espace de Banach F . Alors, s’il existe un r´eel k tel que ∀x ∈ U kfx′ k ≤ k, f est k–lipschitzienne sur U . Soient u et v deux point de U . Comme U est convexe, la fonction affine ϕ d´efinie par t 7→ (1 − t)u + tv envoie l’intervalle [0, 1] dans U . La d´eriv´ee de ϕ′ (t), en un point quelconque de [0, 1] est le vecteur v − u. ′ (v − u). Ce La fonction f ◦ ϕ est continue sur [0, 1] et d´erivable sur ]0, 1[. Sa d´eriv´ee en un point t est fϕ(t) ′ vecteur a une norme inf´erieure ou ´egale ` a kfϕ(t) k kv − uk, donc `a kkv − uk. Le lemme pr´ec´edent appliqu´e `a f ◦ ϕ et aux point 0 et 1 de [0, 1], donne donc kf (v) − f (u)k ≤ kkv − uk. 2 Note : il arrive souvent que la condition kfx′ k ≤ k soit obtenue en utilisant la continuit´e de f ′ sur un compact. Corollaire 1 Soit U un ouvert convexe d’un espace de Banach E. Soit f : U −→ F une fonction d´erivable a ` valeurs dans un espace de Banach F . Si fx′ est nul pour tout x de U , la fonction f est constante.
16
Calcul Diff´ erentiel On applique le th´eor`eme pr´ec´edent avec k = 0. 2
Note : L’hypoth`ese que U est convexe est indispensable. En effet, une fonction d´erivable sur un ouvert U quelconque, et dont la d´eriv´ee est nulle n’est pas n´ecessairement constante. Elle est seulement localement constante. 2.2.2
Convergence d’une suite de fonctions d´ erivables.
On sait que si une suite de fonctions d´erivables converge uniform´ement, il n’y a aucune raison qu’il en soit de mˆeme de la suite de leurs d´eriv´ees. Par exemple, la suite de fonctions (fn )n d´efinies par : x 7→
1 sin(nx), n
converge uniform´ement vers 0 (sur un intervalle quelconque de R). Par contre, la suite des d´eriv´ees : x 7→ cos(nx), ne converge pas (mˆeme simplement). Par contre, comme on va le voir, la convergence de la suite des d´eriv´ees, implique (sous certaines conditions) la convergence de la suite de fonctions. Th´ eor` eme 4 Soit U un ouvert convexe d’un espace de Banach E, et x0 un point de U . Soit (fn )n une suite de fonctions d´erivables sur U , a ` valeurs dans un espace de Banach F . On suppose que : – La suite d’´el´ements de F : (fn (x0 ))n converge. – La suite de fonctions : x 7→ (fn )′x converge uniform´ement sur U vers une fonction g : U −→ L(E, F ). Alors, la suite (fn )n converge vers une fonction f . La convergence est uniforme sur toute partie born´ee de U . De plus, f est d´erivable sur U , et on a f ′ = g. On commence par prouver l’existence de la fonction f . Pour cela, il suffit de montrer que pour chaque x de U , la suite d’´el´ements de F : (fn (x))n est une suite de Cauchy. La suite de fonctions (fn′ )n ´etant uniform´ement convergente sur U , elle est uniform´ement de Cauchy sur U . En particulier, on peut poser : kp,q = sup k(fp )′x − (fq )′x k, x∈U
et de plus kp,q tend vers 0 quand p et q tendent vers l’infini. Comme U est convexe, et fp′ − fq′ born´e sur U par la constante kp,q , fp − fq est kp,q –lipschitzienne : kfp (x) − fq (x) − (fp (x0 ) − fq (x0 ))k ≤ kp,q kx − x0 k. Si on suppose maintenant que x reste dans une partie born´ee B de U , kx − x0 k est major´e par une constante dB ind´ependante de x. Soit ε > 0. Pour p et q assez grands, on a kp,q < ε, et kfp (x0 ) − fq (x0 )k < ε, puisque la suite (fn (x0 ))n est convergente. On a donc : kfp (x) − fq (x)k ≤ ε(dB + 1), ce qui montre que (fn (x))n est une suite de Cauchy, et que la convergence est uniforme sur toute partie born´ee de U . Notons f (x) la limite de fn (x) quand n tend vers l’infini. La fonction f est continue car elle est localement limite uniforme de fonctions continues (chaque point de U a un voisinage born´e).
Calcul Diff´ erentiel
17
Il nous reste donc ` a montrer que f est d´erivable sur U , et que sa d´eriv´ee est g. Soit donc x un point de U . Nous devons montrer que f (x + h) = f (x) + g(x)(h) + o(h). C’est–` a–dire que kf (x + h) − f (x) − g(x)(h)k est n´egligeable devant h. On a : kf (x + h) − f (x) − g(x)(h)k
≤
+ +
kf (x + h) − f (x) − (fn (x + h) − fn (x))k
kfn (x + h) − fn (x) − (fn )′x (h)k k(fn )′x (h) − g(x)(h)k.
Soit ε > 0. Prenons n et p assez grands pour que kfp (x + h) − fp (x) − (fn (x + h) − fn (x))k ≤ kp,n khk, et pour que kp,n < ε. Quand p tend vers l’infini, fp (x) tend vers f (x), et fp (x + h) vers f (x + h). On a donc : kf (x + h) − f (x) − (fn (x + h) − fn (x))k ≤ εkhk, d`es que n est sup´erieur ou ´egal ` a un certain entier n0 . Comme chaque fn est d´erivable en x, on a : fn (x + h) − fn (x) − (fn )′x (h) = on (h). De plus, comme (fn )′x et g(x) sont des applications lin´eaires continues, on a k(fn )′x (h) − g(x)(h)k ≤ k(fn )′x − g(x)k khk. Comme (fn′ )n converge uniform´ement vers g, on a k(fn )′x − g(x)k ≤ ε d`es que n est assez grand (disons sup´erieur ou ´egal ` a n1 , lui mˆeme sup´erieur ou ´egal `a n0 ). On a alors, pour tout h : kf (x + h) − f (x) − g(x)(h)k ≤ 2εkhk + kon1 (h)k. Soit maintenant un η > 0 tel que kon1 (h)k ≤ εkhk, d`es que khk ≤ η. On a alors montr´e que pour tout ε > 0, il existe η > 0, tel que kf (x + h) − f (x) − g(x)(h)k ≤ 3εkhk d`es que khk ≤ η. 2 2.2.3
D´ erivabilit´ e et d´ eriv´ ees partielles.
Rappelons qu’on dit qu’une fonction est de classe C 1 sur l’ouvert U , si elle est d´erivable sur U et si sa d´eriv´ee f ′ est continue sur U . Si une fonction est d´erivable en un point, elle a des d´eriv´ees partielles en ce point. La r´eciproque est fausse comme on l’a vu sur un exemple. Toutefois, on a quand mˆeme la propri´et´e suivante : Th´ eor` eme 5 Soit f : U −→ Rp une fonction continue d´efinie sur un ouvert U de l’espace de banach n R . Pour que f soit de classe C 1 sur U , il faut et il suffit que ses d´eriv´ees partielles existent et soient continues sur U . Si f est de classe C 1 , ses d´eriv´ees partielles sont continues, puisqu’une composition de fonctions de classe C 1 est de classe C 1 . R´eciproquement, supposons les d´eriv´ees partielles continues. On peut tr`es bien supposer que f est `a valeurs dans R (ce qui revient ` a se limiter `a une composante de f ). Les d´eriv´ees partielles sont donc les ∂f (1 ≤ i ≤ n), toutes d´efinies sur U . fonctions ∂xi
18
Calcul Diff´ erentiel Soit x = (x1 , . . . , xn ) un point de U , et h = (h1 , . . . , hn ) un vecteur de Rn . On veut montrer que f (x + h) − f (x) −
n X ∂f i=1
∂xi
hi = o(h). x
Posons yi (t) = (x1 , . . . , xi−1 , xi + thi , xi+1 + hi+1 , . . . , xn + hn ), et ∂f thi . gi (t) = f (yi (t)) − ∂xi x Calculons maintenant gi (1) − gi (0) : gi (1) − gi (0) = f (yi (1)) − f (yi (0)) −
∂f ∂xi
hi .
x
En remarquant que yi (0) = yi+1 (1), on voit que : n n X X ∂f (gi (1) − gi (0)) = f (y1 (1)) − f (yn (0)) − hi , ∂xi x i=1 i=1 c’est–`a–dire exactement l’expression dont on doit montrer qu’elle est n´egligeable devant h. Il suffit donc de montrer que chacune des expressions gi (1) − gi (0) est n´egligeable devant h. La fonction gi est d´erivable et sa d´eriv´ee est : ∂f ∂f ′ hi − hi . gi (t) = ∂xi yi (t) ∂xi x ∂f est continue sur U , et comme kyi (t) − xk ≤ khk (en supposant que la ∂xi n norme sur R soit la norme euclidienne), on voit que pour tout ε > 0, il existe η > 0, tel que :
∂f ∂f
−
≤ ε,
∂xi yi (t) ∂xi x Comme la d´eriv´ee partielle
d`es que khk ≤ η. Pour khk ≤ η, on a donc kgi′ (t)k ≤ εkhk. Le th´eor`eme de la moyenne permet alors de conclure. 2 2.2.4
D´ eriv´ ee d’une curryfi´ ee et r` egle de Leibnitz.
Soit U un ouvert d’un espace de Banach E, F un espace de Banach, et K un espace compact. Soit enfin ϕ : U × K −→ F une application continue. On appelle “curryfi´ee de ϕ” l’application ψ : U −→ C(K, F ) de U vers l’espace des applications continues de K vers F , d´efinie par l’une quelconque des formules suivantes, qui sont ´equivalentes : ψ(x)(t) = ϕ(x, t)
ψ(x) = t 7→ ϕ(x, t)
ψ = x 7→ (t 7→ ϕ(x, t))
On notera que K ´etant compact, L’espace vectoriel r´eel C(K, F ) est un espace de Banach quand on le munit de la norme de la convergence uniforme. De plus, ϕ ´etant continue, l’application t 7→ ϕ(x, t) est continue, et ψ est donc bien ` a valeurs dans C(K, F ). Lemme 9 ψ est continue.
Calcul Diff´ erentiel
19
Il s’agit de prouver que, pour tout x0 ∈ U : ∀ε>0 ∃η>0 ∀x∈U kx − x0 k < η ⇒ kψ(x) − ψ(x0 )k < ε. Soit ε > 0. Comme ϕ est continue, on a pour chaque point t de K, un ηt > 0, et un voisinage ouvert Vt de t dans K, tels que pour tous x ∈ U et t′ ∈ K : kx − x0 k < ηt ∧ t′ ∈ Vt ⇒ kϕ(x, t′ ) − ϕ(x0 , t)k < ε/2. La famille d’ouverts (Vt )t∈K recouvre K. Il en est donc de mˆeme d’une sous–famille finie Vt1 , . . . , Vtp de cette famille. Posons η = inf(ηt1 , . . . , ηtp ). On a η > 0. Il nous reste `a prouver que : ∀x∈U kx − x0 k < η ⇒ kψ(x) − ψ(x0 )k < ε, c’est `a dire que : ∀x∈U kx − x0 k < η ⇒ ∀t∈K kψ(x)(t) − ψ(x0 )(t)k < ε. Soit donc x ∈ U , tel que kx − x0 k < η et soit t ∈ K. Il reste `a prouver que kϕ(x, t) − ϕ(x0 , t)k < ε. Il existe un ti (1 ≤ i ≤ p), tel que t ∈ Vti . On a donc kϕ(x, t) − ϕ(x0 , ti )k < ε/2. Pour la mˆeme raison on a aussi kϕ(x0 , t) − ϕ(x0 , ti )k < ε/2, puisque kx0 − x0 k = 0 < η. Donc : kϕ(x, t) − ϕ(x0 , t)k ≤ kϕ(x, t) − ϕ(x0 , ti )k + kϕ(x0 , ti ) − ϕ(x0 , t)k < ε/2 + ε/2 = ε. 2 Lemme 10 (D´eriv´ee d’une curryfi´ee) Si U est un ouvert d’un espace de Banach E, K un espace compact, F un espace de Banach, ϕ : U × K −→ F une application continue, dont la d´eriv´ee partielle d1 ϕ par rapport a ` la premi`ere variable (celle qui appartient a ` U ) existe et est continue, alors la curryfi´ee ψ : U −→ C(K, F ) de ϕ est d´erivable, et sa d´eriv´ee en x ∈ U , ψx′ : E −→ C(K, F ) est donn´ee par : ψx′ (h) = t 7→ ((d1 ϕ)(x,t) (h)) Par d´efinition, (d1 ϕ)(x,t) est la d´eriv´ee en x de la fonction compos´ee ϕ ◦ αt , o` u αt est d´efinie par αt (x) = (x, t), c’est ` a dire (d1 ϕ)(x,t) = (ϕ ◦ αt )′x . La seule chose qu’on ait ` a prouver est que : ψ(x + h) − ψ(x) − (t 7→ (ϕ ◦ αt )′x (h)) est n´egligeable devant h, quand h tend vers 0. Cette expression est ´egale `a : t 7→ ϕ(x + h, t) − ϕ(x, t) − (ϕ ◦ αt )′x (h). Soit ε > 0. Il s’agit de trouver η > 0, tel que : khk < η ⇒ kt 7→ ϕ(x + h, t) − ϕ(x, t) − (ϕ ◦ αt )′x (h)k < εkhk. La norme sur les fonctions continues de K vers F ´etant celle de la convergence uniforme, cette derni`ere implication est ´equivalente ` a: khk < η ⇒ sup kϕ(x + h, t) − ϕ(x, t) − (ϕ ◦ αt )′x (h)k < εkhk. t∈K
La question essentielle est donc de majorer l’expression kϕ(x+ h, t)− ϕ(x, t)− (ϕ◦ αt )′x (h)k d’une mani`ere ind´ependante de t. Or cette expression n’est autre que : k(ϕ ◦ αt )(x + h) − (ϕ ◦ αt )(x) − (ϕ ◦ αt )′x (h)k Comme ϕ ◦ αt est par hypoth`ese d´erivable en x, on a : (ϕ ◦ αt )(x + h) − (ϕ ◦ αt )(x) − (ϕ ◦ αt )′x (h) = ox,t (h),
20
Calcul Diff´ erentiel
kox,t (h)k = 0, le point d´elicat ´etant que ox,t (h) d´epend de t. Si ce n’´etait pas le cas, la khk d´emonstration serait finie ici. avec lim
h−→0
On a : ox,t (h)
= (ϕ ◦ αt )(x + h) − (ϕ ◦ αt )(x) − (ϕ ◦ αt )′x (h) = [(ϕ ◦ αt )(x + h) − (ϕ ◦ αt )′x (h)] − [(ϕ ◦ αt )(x) − (ϕ ◦ αt )′x (0)] = βt (h) − βt (0),
o` u on a pos´e βt (h) = (ϕ ◦ αt )(x + h) − (ϕ ◦ αt )′x (h). Pour chaque t ∈ K, la fonction βt est d´erivable sur un voisinage de 0 dans E, puisque pour h assez petit, x + h appartient ` a U (U est ouvert). Sa d´eriv´ee en h est : (βt )′h = (ϕ ◦ αt )′x+h − (ϕ ◦ αt )′x . Par hypoth`ese, la fonction (x, t) 7→ (ϕ ◦ αt )′x est continue sur U × K. Il r´esulte du lemme pr´ec´edent que sa curryfi´ee x 7→ (t 7→ (ϕ ◦ αt )′x ) est continue sur U , et donc que la fonction : h 7→ (t 7→ (βt )′h ) est continue sur un voisinage de 0 dans E. Or, cette derni`ere fonction vaut 0 (le 0 de l’espace de Banach C(K, L(E, F ))) en 0 (le 0 de E). Il existe donc η > 0, tel que : khk < η ⇒ ∀t∈K k(βt )′h k < ε. Le th´eor`eme de la moyenne nous montre donc que : khk < η ⇒ ∀t∈K kβt (h) − βt (0)k < εkhk, c’est `a dire : khk < η ⇒ kt 7→ ox,t (h)k < εkhk. 2 Corollaire 2 (R`egle de Leibnitz) Soit U un ouvert d’un espace de Banach E, [a, b] un intervalle compact de R, F un espace de Banach, et ϕ : U × [a, b] −→ F une fonction continue, ayant une d´eriv´ee partielle d1 ϕ par rapport a ` la premi`ere variable, continue sur U × [a, b]. Alors, la fonction θ d´efinie par : θ(x) =
Z
b
ϕ(x, t) dt
a
est d´erivable sur U et sa d´eriv´ee en un point x de U est donn´ee par : Z b ′ θx = (d1 ϕ)(x,t) dt. a
On a θ = I ◦ ψ, o` u ψ est la curryfi´ee de ϕ, et o` u I(f ) =
Z
b
a
f (t) dt, pour toute f ∈ C([a, b], F ). On sait
par le lemme pr´ec´edent que ψ est d´erivable. Par ailleurs, I est d´erivable, puisque c’est une application lin´eaire continue (on a d’ailleurs kIk = |b − a|). Il en r´esulte que θ est d´erivable, et que ! Z Z b
θx′ (h) = I(ψx′ (h)) =
b
(d1 ϕ)(x,t) (h) dt =
a
(d1 ϕ)(x,t) dt (h).
a
On remarquera que la premi`ere des deux int´egrales ci–dessus est celle d’une fonction `a valeurs dans F , alors que la deuxi`eme est celle d’une fonction `a valeurs dans L(E, F ). La derni`ere ´egalit´e est l´egitim´ee par le fait que l’´evaluation en h : f 7→ f (h) de L(E, F ) vers F est lin´eaire continue. 2
Calcul Diff´ erentiel
21
Exercices 9 Soit f : U −→ F une application de classe C 1 d’un ouvert U d’un espace de Banach E non r´eduit a` 0, vers un espace de Banach F . Soit x0 un point de U . a) Soit k un r´eel strictement positif. Montrer qu’il existe un voisinage V de x0 (contenu dans U ), sur lequel la fonction ψ = (x 7→ f (x) − f (x0 ) − fx′ 0 (x − x0 )) est k–lipschitzienne. On suppose qu’il existe une application lin´eaire continue g : F −→ E, telle que g ◦fx′ 0 soit l’application identique de E. b) Montrer que la norme de g n’est pas nulle, et que kfx′ 0 (h)k ≥
khk , pour tout h de E. kgk
c) Montrer qu’il existe un voisinage V de x0 dans U , sur lequel f est injective.
10
Montrer que le syst`eme : x =
admet une unique solution sur R2 .
y =
1 sin(x + y) 4 2 1 + arctan(x − y) 3
11
On consid`ere C([0, 1], R) l’espace vectoriel r´eel des fonctions continue de [0, 1] dans R et on le Z 1 f (t)dt). munit de la norme 1 not´e k k1 (kf k1 = 0
Soit la fonction :
ϕ
]0, +∞[ −→ C ([0, 1], R) α 7−→ t 7→ tα
Montrar que ϕ est d´erivable et calculer ϕ′ , puis montrer que ϕ′ est 2-lipschtzienne.
3
D´ eriv´ ees d’ordre sup´ erieur.
3.1
D´ efinition.
On a vu que si f est une application d´erivable de l’ouvert U de l’espace de Banach E, vers l’espace de Banach F , alors pour tout point x de E on a une d´eriv´ee en x ou application lin´eaire tangente en x : fx′ ∈ L(E, F ). On a appel´e d´eriv´ee de f la fonction f ′ = (x 7→ fx′ ) de U vers L(E, F ), qui `a tout x de U associe l’application lin´eaire tangente ` a f en x. f ′ est donc une application de l’ouvert U vers l’espace vectoriel L(E, F ). Comme E et F sont des espaces de Banach, il en est de mˆeme de L(E, F ), et cela a donc un sens de se demander si f ′ est d´erivable en un point x de U . Si tel est le cas, l’application lin´eaire tangente `a f ′ en x sera not´ee fx′′ . C’est une application lin´eaire de E vers L(E, F ), autrement–dit un ´el´ement de L(E, L(E, F )). Par ailleurs, l’espace L(E, L(E, F )) est canoniquement isomorphe `a l’espace des applications bilin´eaires
22
Calcul Diff´ erentiel
de E×E vers F . La correspondance canonique (curryfication/d´ecurryfication) est donn´ee par les formules : L(E, L(E, F )) f
−→ L(E, E; F ) 7−→ (x, y) → 7 f (x)(y)
L(E, E; F ) g
−→ L(E, L(E, F )) 7−→ x 7→ (y 7→ g(x, y))
On peut donc consid´erer fx′′ comme une application bilin´eaire de E × E vers F . En principe on devrait adopter une autre notation que fx′′ pour cette application bilin´eaire, mais aucune confusion n’est `a craindre, car le contexte indiquera toujours clairement s’il s’agit d’un ´el´ement de L(E, L(E, F )) ou d’un ´el´ement de L(E, E; F ). En particulier, si h et k sont deux vecteurs de E, les deux expressions : fx′′ (h)(k)
et
fx′′ (h, k),
repr´esentent le mˆeme ´el´ement de F . La seule diff´erence est que dans la premi`ere expression fx′′ est consid´er´e comme un ´el´ement de L(E, L(E, F )), alors que dans la seconde expression, fx′′ est consid´er´e comme un ´el´ement de L(E, E; F ). Comme on l’a fait pour f ′ , on peut maintenant consid´erer l’application : U −→ L(E, E; F ) x 7−→ fx′′ qu’on notera f ′′ , et qu’on appelera d´eriv´ee seconde de f . Comme L(E, E; F ) est encore un espace de Banach, on peut envisager de d´eriver f ′′ , si f ′′ est d´erivable. Ceci nous donnera une application f ′′′ : U −→ L(E, L(E, E; F )). Comme L(E, L(E, E; F )) s’identifie canoniquement ` a L(E, E, E; F ), on peut consid´erer fx′′′ comme une application trilin´eaire de E × E × E vers F . D’une mani`ere g´en´erale, on pourra consid´erer, si elle existe, la d´eriv´ee ni`eme de f , qui sera une application de U vers l’espace des applications n–multilin´eaires de E n vers F . La d´eriv´ee ni`eme de f sera not´ee f (n) . En particulier, on peut utiliser les notations f (0) , f (1) , f (2) , etc. . . pour repr´esenter f , f ′ , f ′′ , etc. . . D´ efinition 4 Une application f d’un ouvert U d’un espace de Banach E vers un espace de Banach F est dite de classe C n (sur U ), si elle admet une d´eriv´ee ni`eme continue (sur U ). On dit aussi que f est n fois continument d´erivable (ou diff´erentiable) sur U . Elle est dite de classe C ∞ , si elle est de classe C n pour tout entier naturel n. Si une fonction f est de classe C n , elle admet donc des d´eriv´ees successives f ′ , f ′′ ,. . .,f (n) , toutes continues sur U . Ces d´eriv´ees sont ` a valeurs dans des espaces de Banach de plus en plus gros, sauf si la dimension de E est 1. D´ efinition 5 Une application f d’un ouvert U d’un espace de banach E vers un espace de Banach F est dite n fois d´erivable en x, si elle est de classe C n−1 dans un voisinage de x, et si f (n−1) est d´erivable en x.
3.2 3.2.1
Exemples de d´ eriv´ ees d’ordre sup´ erieur. Applications lin´ eaires.
Une application lin´eaire continue f : E −→ F a elle–mˆeme pour d´eriv´ee en tout point x de E. Ceci signifie que la d´eriv´ee f ′ de f est l’application constante x 7→ fx′ = f , de E vers L(E, F ). La d´eriv´ee seconde f ′′ est donc nulle en tout point x, de mˆeme que les d´eriv´ees suivantes.
Calcul Diff´ erentiel 3.2.2
23
Applications bilin´ eaires.
On a vu que la d´eriv´ee au point (x, y) de l’application bilin´eaire continue f : E × F −→ G est : (h, k) 7→ f (h, y) + f (x, k). Or il est clair que f ′ : E × F −→ L(E × F, G), qui n’est autre que : (x, y) 7→ ((h, k) 7→ f (h, y) + f (x, k)) est lin´eaire continue, et a donc elle–mˆeme pour d´eriv´ee en tout point (x, y). Ceci donne : ′′ ((h, k), (u, v)) = f (h, v) + f (u, k). f(x,y) ′′ est une application bilin´eaire de (E × F ) × (E × F ) vers G. On notera que f(x,y) ′′ ne d´epend pas de (x, y), ce qui montre que f ′′′ est nulle, L’application f ′′ est constante, puisque f(x,y) de mˆeme que toutes les d´eriv´ees suivantes.
La formule ci–dessus met clairement en ´evidence le fait que f ′′ est une application bilin´eaire sym´etrique. En effet, on a : f ′′ ((h, k), (u, v)) = f (h, v) + f (u, k) = f (u, k) + f (h, v) = f ′′ ((u, v), (h, k)). La forme quadratique (en supposant que G = R) associ´ee `a f ′′ est donc : (h, k) 7→ f ′′ ((h, k), (h, k)) = 2f (h, k). Remarque : Toute forme bilin´eaire f (mˆeme non sym´etrique) sur E × F est une forme quadratique sur E × F , dont la forme polaire est la forme bilin´eaire sym´etrique sur (E × F ) × (E × F ) donn´ee par : ((h, k), (u, v)) 7→ 3.2.3
1 (f (h, v) + f (u, k)). 2
Composition avec une fonction affine.
Lemme 11 Si f est affine, et g n fois d´erivable en f (x), on a : (n)
′ ′ (g ◦ f )(n) x = gf (x) ◦ (f × · · · × f ).
Si g est affine, et f n fois d´erivable en x, on a : ′ (n) (g ◦ f )(n) x = g ◦ fx .
On a ´ecrit f ′ au lieu de fx′ , car f ´etant affine, sa d´eriv´ee premi`ere est constante, de mˆeme pour g ′ . La v´erification se fait par r´ecurrence sur n. 2 3.2.4
Fonctions compos´ ees.
Th´ eor` eme 6 Soient E, F et G des espaces de Banach. Soit U un ouvert de E, et V un ouvert de F . Soit x ∈ U . Soient f : U −→ V , et g : V −→ G des applications continues. Alors, si f est n fois d´erivable en x, et si g est n fois d´erivable en f (x), g ◦ f est n fois d´erivable en x.
24
Calcul Diff´ erentiel
Ceci se montre par r´ecurrence sur n. Le cas n = 1 r´esulte imm´ediatement du th´eor`eme de d´erivation des fonctions compos´ees. Supposons donc n ≥ 2, et le th´eor`eme valable jusqu’` a l’ordre n − 1. On a pour tout y de U : (g ◦ f )′y = gf′ (y) ◦ fy′ . La fonction y 7→ (g ◦ f )′y est donc la compos´ees des deux fonctions suivantes : y 7→ (gf′ (y) , fy′ )
et
(u, v) 7→ u ◦ v.
g ´etant n fois d´erivable en f (x), g ′ est n − 1 fois d´erivable en f (x). Comme f est n fois d´erivable en x, elle est a fortiori n − 1 fois d´erivable en x. Le compos´e y 7→ gf′ (y) est donc n − 1 fois d´erivable en x, par hypoth`ese de r´ecurrence. Comme par ailleurs, f ′ est n− 1 fois d´erivable en x, l’application y 7→ (gf′ (y) , fy′ ) est n− 1 fois d´erivable en x. Par ailleurs, (u, v) 7→ u ◦ v est de classe C ∞ (c’est une application bilin´eaire continue). Elle est a fortiori n − 1 fois d´erivable en tout point. En appliquant une deuxi`eme fois l’hypoth`ese de r´ecurrence, on voit que y 7→ gf′ (y) ◦ fy′ est n − 1 fois d´erivable en x. Mais ceci signifie exactement que g ◦ f est n fois d´erivable en x. 2 Th´ eor` eme 7 La composition de deux fonctions de classe C n est de classe C n . Il suffit d’adapter l´eg`erement la d´emonstration du th`eor`eme pr´ec´edent. 2 3.2.5
L’application x 7→ x−1 .
Soit A une alg`ebre de Banach, et Ψ l’application x 7→ x−1 de A∗ vers A. On a d´ej` a d´eriv´e Ψ une fois, et obtenu : Ψ′x (h) = −x−1 hx−1 . Lemme 12 La fonction Ψ est ind´efiniment d´erivable. Il sagit de montrer que Ψ est de classe C n pour tout n. On d´emontre ceci par r´ecurrence sur n. Noter que le r´esultat est vrai pour n = 1 (et d’ailleurs aussi pour n = 0). Supposons donc n ≥ 2, et le lemme d´emontr´e pour toute valeur strictement inf´erieure `a n. Consid´erons l’application Γ de A × A vers L(A, A), d´efinie par Γ
(x, y) 7−→ (h 7→ −xhy). On a donc Γ(x, y)(h) = −xhy. Noter que l’application Γ est bilin´eaire et continue (la continuit´e ´etant assur´ee par le fait que la norme de l’application lin´eaire h 7→ −xhy est major´ee par kxk kyk). Γ est donc de classe C ∞ . Par ailleurs, on voit que Ψ′x (h) = −x−1 hx−1 = Γ(Ψ(x), Ψ(x))(h). C’est–` a–dire qu’on a : Ψ′x = Ψ′ (x) = Γ(Ψ(x), Ψ(x)). De l`a il r´esulte que si Ψ est de classe C n−1 , il en est de mˆeme de Ψ′ , ce qui montre que Ψ est de classe C . Ψ est donc de classe C ∞ . 2 n
Calcul Diff´ erentiel
25
Corollaire 3 Soient E et F deux espaces de banach. L’application : f 7→ f −1 , de Iso (E, F ) vers Iso (F, E) est ind´efiniment d´erivable. Si Iso (E, F ) est vide, il n’y a rien ` a montrer. Sinon, il existe un isomorphisme f0 : E −→ F entre les espaces de Banach E et F . Ceci nous donne un isomorphisme lin´eaire (donc ind´efiniment d´erivable) Λ entre Iso (E, F ) et l’alg`ebre de Banach Iso (E, E) : Λ
f 7−→ f0−1 ◦ f. De mˆeme on a un isomorphisme lin´eaire ∆ entre Iso (E, E) et Iso (F, E) donn´e par : ∆
g 7−→ g ◦ (f0 )−1 . Notons Ψ l’application x 7→ x−1 de l’alg`ebre de Banach Iso (E, E), et Φ l’application x 7→ x−1 de l’´enonc´e. On a alors clairement Φ = ∆ ◦ Ψ ◦ Λ, ce qui montre que Φ est de classe C ∞ . 2
3.3
Sym´ etrie des d´ eriv´ ees d’ordre sup´ erieur.
Th´ eor` eme 8 (Th´eor`eme de Schwarz) Soit U un ouvert d’un espace de Banach E. Soit f : U −→ F une application deux fois d´erivable en x. Alors l’application bilin´eaire : (h, k) 7→ fx′′ (h, k), de E × E vers F , est sym´etrique. Il suffit de prouver que l’expression fx′′ (h, k) − fx′′ (k, h) est o((khk + kkk)2 ). En effet, le quotient kfx′′ (th, tk) − fx′′ (tk, th)k (kthk + ktkk)2 tendra alors vers 0 quand le r´eel t tend vers 0, mais comme il est ind´ependant de t (car num´erateur et d´enominateur sont homog`enes de degr´e 2), il ne peut ˆetre que nul, ce qui montrera le th´eor`eme. Consid´erons la fonction ϕ d´efinie par : ϕ(t) = f (x + th + k) − f (x + th), o` u t ∈ [0, 1]. En appliquant le th´eor`eme de la moyenne `a la fonction t 7→ ϕ(t) − tϕ′ (0), sur l’intervalle [0, 1], on obtient : kϕ(1) − ϕ(0) − ϕ′ (0)k ≤ sup kϕ′ (t) − ϕ′ (0)k. t∈[0,1]
Calculons ϕ′ (t). On a, en appliquant le th´eor`eme de d´erivation des fonctions compos´ees : ′ ′ (h) − fx+th (h). ϕ′ (t) = fx+th+k
Par ailleurs, par d´efinition de la d´eriv´ee seconde de f en x, on a : ′ fx+th+k
=
fx′ + fx′′ (th + k) + o(th + k)
′ fx+th
=
fx′ + fx′′ (th) + o(th).
26
Calcul Diff´ erentiel
On peut majorer les normes de th + k et de th par khk + kkk (t appartient `a [0, 1]), et donc remplacer o(th + k) et o(th) par o(khk + kkk). Noter que chaque membre des ´egalit´es ci–dessus est une application lin´eaire continue. En particulier, il en est ainsi de o(khk + kkk). L’expression o(khk + kkk)(h) peut s’´ecrire o((khk + kkk)2 ). En effet, le quotient : o(khk + kkk)(h) (khk + kkk)2 tend vers 0 quand khk+kkk tend vers 0, car la norme de o(khk+kkk)(h) est major´ee par ko(khk+kkk)k khk. On a donc : ′ fx+th+k (h) = ′ fx+th (h)
=
fx′ (h) + fx′′ (th + k)(h) + o((khk + kkk)2 )
fx′ (h) + fx′′ (th)(h) + o((khk + kkk)2 ).
d’o` u: ϕ′ (t) = fx′′ (k)(h) + o((khk + kkk)2 ),
cette ´egalit´e ´etant valable pour tout t ∈ [0, 1].
On en d´eduit que ϕ′ (t) − ϕ′ (0) = o((khk + kkk)2 ), donc ϕ(1) − ϕ(0) − ϕ′ (0) = o((khk + kkk)2 ), et finalement ϕ(1) − ϕ(0) − fx′′ (k)(h) = o((khk + kkk)2 ). Par ailleurs, l’expression ϕ(1) − ϕ(0) est sym´etrique en h et k, car elle est ´egale `a : f (x + h + k) − f (x + k) − f (x + h) + f (x). Si on ´echange les rˆoles de h et k, on obtient donc ϕ(1) − ϕ(0) − fx′′ (h)(k) = o((khk + kkk)2 ), d’o` u: fx′′ (h)(k) − fx′′ (k)(h) = o((khk + kkk)2 ). 2
Corollaire 4 Si f : U −→ F est n fois d´erivable en x, l’application n–multilin´eaire fx(n) est sym´etrique. Rappelons qu’une application f : E × · · · × E −→ F n–multilin´eaire est sym´etrique, si elle v´erifie l’´egalit´e : f (x1 , . . . , xn ) = f (xσ(1) , . . . , xσ(n) ), pour tout permutation σ de l’ensemble {1, . . . , n}, et tous x1 , . . . , xn . n.
Le corollaire est d´ej` a d´emontr´e pour n ≤ 2. Supposons donc n ≥ 3, et proc´edons par r´ecurrence sur f (n) n’est autre que la d´eriv´ee seconde de g = f (n−2) . g est deux fois d´erivable en x. L’application : (h1 , h2 ) 7→ gx′′ (h1 , h2 )
est donc sym´etrique. Ceci dit, gx′′ (h1 , h2 ) est une application (n − 2)–multilin´eaires de E × · · · × E vers F . On peut donc l’appliquer ` a des vecteurs h3 , . . . , hn , on obtient l’´el´ement suivant de F : gx′′ (h1 , h2 )(h3 , . . . , hn ) = fx(n) (h1 , . . . , hn ). Ceci montre que fx(n) (h1 , . . . , hn ) est invariant par permutation de h1 et h2 . Mais on peut aussi consid´erer f (n) comme la d´eriv´ee premi`ere de j = f (n−1) . On obtient de mˆeme : jx′ (h1 )(h2 , . . . , hn ) = f (n) (h1 , . . . , hn ), ce qui montre que fx(n) (h1 , . . . , hn ) est invariant par permutation des n − 1 derni`eres variables, car par hypoth`ese de r´ecurrence, jx′ (h1 ) est une application (n − 1)–multilin´eaire sym´etrique. Le corollaire r´esulte maintenant du fait que le groupe des permutations de l’ensemble {1, . . . , n} est engendr´e par la transposition de 1 et 2, et par les permutation de 2, . . . , n.(2 ) 2 2 Soit σ est une permutation quelconque de {1, . . . , n}. Si σ(1) = 1, la question est r´ egl´ ee. Sinon, 1 = σ(i) (i 6= 1). Commen¸cons par une permutation des n − 1 derniers ´ el´ ements amenant i a ` la deuxi` eme place, puis transposons les deux
Calcul Diff´ erentiel
3.4
27
Formule de Taylor–Young.
Th´ eor` eme 9 (formule de Taylor–Young en dimension 1) Soit I un intervalle de R, x un point de I, et f une fonction de I vers un espace de Banach F , n fois d´erivable en x. Alors, on a la formule de Taylor–Young a ` l’ordre n suivante : f (x + h) = f (x) + hf ′ (x) +
hn (n) h2 ′′ f (x) + · · · + f (x) + o(hn ). 2! n!
D´emontrons ceci par r´ecurrence sur n. Pour n = 1, la formule se r´esume `a la d´efinition de la d´eriv´ee. Supposons donc n ≥ 2, et la formule d´emontr´ee `a l’ordre n − 1. h2 ′′ hn (n) f (x) − · · · − f (x). On a ϕ(0) = f (x), donc on doit 2! n! n simplement montrer que ϕ(h) − ϕ(0) est un o(h ). Posons ϕ(h) = f (x + h) − hf ′ (x) − D´erivons ϕ. On obtient : ϕ′ (h) = f ′ (x + h) − f ′ (x) − hf ′′ (x) − · · · −
hn−1 (n) f (x). (n − 1)!
L’hypoth`ese de r´ecurrence montre donc que ϕ′ (h) est un o(hn−1 ). Soit ε > 0. Il existe η > 0, tel que |h| ≤ η entraine |ϕ′ (h)| ≤ ε|hn−1 |. Pour tout t tel que |t| ≤ |h| ≤ η, on a donc |ϕ′ (t)| ≤ ε|tn−1 | ≤ ε|hn−1 |. ϕ est donc ε|hn−1 |–lipschitzienne sur l’intervalle [0, h] (o` u l’intervalle [h, 0] si h est n´egatif). On a donc |ϕ(h) − ϕ(0)| ≤ ε|hn−1 | |h|. 2 Remarque : Le reste de Young o(hn ) peut ˆetre not´e hn ε(h), o` u ε(h) tend vers 0 quand h tend vers 0. Th´ eor` eme 10 (formule de Taylor–Young) Soit U un ouvert d’un espace de Banach E, et F un espace de Banach. Soit x ∈ E. Si f : U −→ F est n fois d´erivable en x, on a la formule de Taylor–Young a ` l’ordre n suivante : f (x + h) = f (x) + fx′ (h) +
1 ′′ 1 f (h, h) + · · · + f (n) (h, . . . , h) + o(khkn ). 2! x n!
h , et khk g(t) = f (x + tu), o` u t est un r´eel. La fonction g est d´efinie dans un voisinage de 0 dans R, et `a valeurs dans F , et on a g(0) = f (x). Elle est n fois d´erivable en 0, et ses d´eriv´ees en 0 sont : Nous d´eduisons ce th´eor`eme du pr´ec´edent. Soit h un vecteur non nul de E. Posons u =
g ′ (0) = fx′ (u),
g ′′ (0) = fx′′ (u, u),
...
g (n) (0) = fn(n) (u, . . . , u).
Le th´eor`eme pr´ec´edent appliqu´e ` a g en 0 donne : g(t) = g(0) + tg ′ (0) +
t2 ′′ tn g (0) + · · · + g (n) (0) + o(tn ). 2! n!
On a donc : f (x + tu) = f (x) + fx′ (tu) +
1 ′′ 1 f (tu, tu) + · · · + f (n) (tu, . . . , tu) + o(tn ). 2! x n!
La formule d´esir´ee est obtenue en rempla¸cant t par khk dans cette expression. 2 premi` eres places, ce qui a pour effet d’amener i a ` la premi` ere place, et enfin terminons par une permutation des n − 1 derniers ´ el´ ements, pour amener les autres ´ el´ ements a ` leur place.
28
Calcul Diff´ erentiel
Lemme 13 Si f : U −→ F est continue et n fois d´erivable en x, les conditions suivantes sont ´equivalentes : – f (x + h) = o(khkn ), – fx(p) = 0 pour 0 ≤ p ≤ n. La formule de Taylor–Young montre que si fx(p) = 0 pour tout p tel que 0 ≤ p ≤ n, alors f (x + h) est o(khkn ). D´emontrons la r´eciproque par r´ecurrence sur n. Pour n = 0, on a f (x + h) = o(1), donc f (x) = 0, car f est continue. Supposons maintenant n ≥ 1. Par hypoth`ese de r´ecurrence, on a fx(p) = 0, pour tout p tel que 0 ≤ p ≤ n − 1. Il nous reste seulement ` a montrer que fx(n) est nul. La formule de Taylor–Young donne : f (x + h) =
1 (n) f (h, . . . , h) + o(khkn ). n! x
fx(n) (h, . . . , h) est donc n´egligeable devant khkn . Donc le quotient : (n)
fx (th, . . . , th) kthkn tend vers 0 quand le r´eel t tend vers 0. Comme ce quotient est ind´ependant de t (le num´erateur et le d´enominateur sont homog`enes de degr´e n), il ne peut ˆetre que nul. On a donc fx(n) (h, . . . , h) = 0 pour tout h. Le th´eor`eme r´esulte alors imm´ediatement du lemme suivant : Lemme 14 Si f : E × · · · × E −→ F est une application n–multilin´eaire continue sym´etrique, et si pour tout x de E f (x, . . . , x) = 0, alors f est nulle. On va montrer ce lemme par r´ecurrence sur n. Il est ´evident pour n = 1, la conclusion ´etant alors contenue dans les hypoth`eses. Soient x et y deux vecteurs quelconques de E. Posons ϕ(t) = f (x + (t − 1)y, . . . , x + (t − 1)y). ϕ est une application de R vers F . Elle est nulle par hypoth`ese. Sa d´eriv´ee ϕ′ est donc elle aussi nulle. On peut par ailleurs la calculer directement sur la d´efinition, ce qui donne, en tenant compte de la sym´etrie de f : ϕ′ (t) = nf (y, x + (t − 1)y, . . . , x + (t − 1)y). On a en particulier ϕ′ (1) = 0, c’est–`a–dire f (y, x, . . . , x) = 0, ceci ´etant valable pour tout x et tout y. Pour y fix´e, l’application (n − 1)–multilin´eaire ψ d´efinie par : ψ
(x2 , . . . , xn ) 7−→ f (y, x2 , . . . , xn ) est sym´etrique, et v´erifie ψ(x, . . . , x) = 0, pour tout x, comme on l’a montr´e plus haut. Par hypoth`ese de r´ecurrence, ψ est nulle, et comme y est arbitraire, f est nulle. 2
3.5
Extr´ emas de fonctions deux fois d´ erivables.
Th´ eor` eme 11 Soit f : U −→ R une fonction d´efinie sur un ouvert U de Rn . Soit x ∈ U . Si f est deux fois d´erivable en x, si fx′ = 0, et si la forme quadratique h 7→ fx′′ (h, h) est d´efinie positive (resp. n´egative), f admet un minimum (resp. maximum) local en x.
Calcul Diff´ erentiel
29
La formule de Taylor donne : f (x + h) − f (x) =
1 ′′ f (h, h) + o(khk2 ). 2 x
Il s’agit de montrer que h 7→ f (x + h) − f (x) garde un signe constant dans un voisinage de 0. Comme la sph`ere unit´e S de Rn est compacte, la fonction h 7→ fx′′ (h, h), qui est strictement positive sur S, y est minor´ee par un r´eel stritement positif α. On a donc fx′′ (h, h) ≥ α sur S, ou encore fx′′ (h, h) ≥ αkhk2 pour α tout h de Rn . Prenons η > 0 assez petit pour que khk < η entraine o(khk2 ) ≤ khk2 . On voit alors que 4 α f (x + h) − f (x) reste pour khk ≤ η, plus grand que khk2 , c’est–`a–dire positif. 2 4 Lemme 15 Soit f : U −→ R une fonction d´efinie sur un ouvert U de Rn . Soit x ∈ U . Si f est deux fois d´erivable en x, si fx′ = 0, et si la forme quadratique h 7→ fx′′ (h, h) n’est ni positive ni n´egative, f n’admet pas d’extremum en x. Comme fx′′ n’est pas positive, sa restriction a une droite vectorielle D− est d´efinie n´egative. De mˆeme, comme elle n’est pas n´egative, sa restriction `a une droite vectorielle D+ est d´efinie positive. Le th´eor`eme pr´ec´edent, appliqu´e aux restrictions de f `a ces deux droites, montre alors qu’il existe des points aussi proche qu’on veut de x, en lesquels f prend des valeurs strictement plus grandes ou strictement plus petites que f (x). 2
Exercices 12 Soit E un espace de Banach, et q : E −→ R une forme quadratique continue de forme polaire f : E × E −→ F . Montrer que q est ind´efiniment d´erivable, et que : qx′ (h) = 2f (x, h),
qx′′ (h, k) = 2f (h, k),
q (n) = 0 (pour n ≥ 3)
13 Soient E, F et G des espaces de Banach. Soit U un ouvert de E, et V un ouvert de F . Soit x ∈ U . Soit f : U −→ V ⊂ F une application deux fois d´erivable en x. Soit g : V −→ G une application deux fois d´erivable en f (x). Montrer que la d´eriv´ee seconde de g ◦ f en x, est donn´ee par : (g ◦ f )′′x = gf′′(x) ◦ (fx′ × fx′ ) + gf′ (x) ◦ fx′′ , o` u (fx′ × fx′ )(h, k) est par d´efinition (fx′ (h), fx′ (k)). 14 Soit E un espace euclidien de dimension finie. On notera x.y le produit scalaire de x et y, et kxk la √ norme de x (qui vaut x.x). Soit f : E −→ E une application deux fois d´erivable, telle que pour tout x, fx′ respecte la norme, c’est–` a–dire telle que kfx′ (h)k = khk, pour tout x et tout h de E. a) Montrer que pour tout x de E, fx′ respecte le produit scalaire, c’est–`a–dire que fx′ (h).fx′ (k) = h.k, pour tous x, h et k de E. Montrer de plus que pour tout x, fx′ est bijectif. Pour h, k et l des ´el´ements de E, on pose Ax (h, k, l) = fx′ (h).fx′′ (l, k).
b) Montrer que Ax (h, k, l) + Ax (k, h, l) = 0. c) Montrer que pour tous h, k, l et x, on a Ax (h, k, l) = 0 et en d´eduire que fx′′ = 0 pour tout x de E. d) Montrer que f ′ est une application constante, et en d´eduire que f est une application affine.
30
Calcul Diff´ erentiel
Soient A et B deux alg`ebres de Banach. On note A∗ (respectivement : B∗ ) le groupe des ´el´ements inversibles de A (respectivement : B). Soit g : A∗ −→ B∗ un morphisme de groupes deux fois d´erivable. Pour tous x et y dans A ou dans B, on pose [x, y] = xy − yx. Montrer que g1′ ([x, y]) = [g1′ (x), g1′ (y)]. (Utiliser la formule
15
de Taylor–Young ` a l’ordre 2 pour d´evelopper les expressions g(1 + tx), g(1 + ty) et g(1 + tx + ty + t2 xy), o` u t est un r´eel.)
16
Soit E un espace euclidien de dimension finie. Soit {a0 , . . . , ap } une famille finie non vide (p ≥ 0) de p X points de E. Soit f : E −→ R la fonction d´efinie par f (x) = kx − ai k2 . i=0
a) Calculer les deux premi`eres d´eriv´ees
fx′
et
fx′′
de f en x.
b) D´eterminer les extrema relatifs de f .
17 On note M l’espace des matrices carr´ees n × n `a coefficients r´eels. Soient A1 , . . . , Ap un ensemble fini (´eventuellement vide pour p = 0), de vecteurs de M. On consid`ere la fonction Ψ : M −→ R d´efinie par p X Ψ(X) = tr (t XX) + tr (t (X − Ai )(X − Ai )). i=1
a) Calculer
Ψ′X (H)
et Ψ′′X (H, K).
b) D´eterminer les extremas relatifs de Ψ.
4 4.1
Diff´ eomorphismes et inversion locale. Diff´ eomorphismes et diff´ eomorphismes locaux.
D´ efinition 6 Soit U un ouvert d’un espace de Banach E, et V un ouvert d’un espace de Banach F . Une application f : U −→ V est appel´ee diff´eomorphisme de classe C n , si f est bijective, et si f et f −1 sont de classe C n . On notera que le compos´e de deux diff´eomorphismes est un diff´eomorphisme, que si un compos´e est un diff´eomorphisme, et si l’une des deux fonctions de la composition est un diff´eomorphisme, l’autre en est un aussi. Si f est un diff´eomorphisme, fx′ est un isomorphisme d’espaces de Banach, comme le montre le th´eor`eme de d´erivation des fonctions compos´ees, appliqu´e aux composition f ◦ f −1 et f −1 ◦ f . Th´ eor` eme 12 Soit U un ouvert d’un espace de Banach E, et V un ouvert d’un espace de Banach F . Soit f : U −→ V un hom´eomorphisme. Pour que f soit un diff´eomorphisme de classe C n (n ≥ 1), il suffit que f soit de classe C n , et que pour tout x de U , fx′ ∈ Iso (E, F ). Posons g = f −1 . La seule chose a ` montrer est que g est de classe C n . Soit y ∈ V . Il existe un unique x ∈ U , tel que y = f (x). On a : f (x + h) = f (x) + fx′ (h) + o(h). Posons k = f (x + h) − f (x). On a alors y + k = f (x + h), donc g(y + k) = x + h = g(y) + h. Par ailleurs, k = fx′ (h) + o(h), donc h = (fx′ )−1 (k) + (fx′ )−1 (o(h)). On obtient donc : g(y + k) = g(y) + (fx′ )−1 (k) + (fx′ )−1 (o(h)).
Calcul Diff´ erentiel
31
Pour montrer que g est d´erivable en y, avec pour application lin´eaire tangente (fx′ )−1 , il suffit donc de prouver que (fx′ )−1 (o(h)) est o(k). Comme (fx′ )−1 est lin´eaire continue, il suffit de prouver que o(h) est o(k), autrement–dit que tout ce qui est n´egligeable devant h, l’est aussi devant k. Posons A = k(fx′ )−1 k. On a h = (fx′ )−1 (k) + (fx′ )−1 (o(h)). Soit η > 0, tel que khk < η entraine khk . On a alors : ko(h)k < 2A khk khk ≤ Akkk + , 2 c’est–`a–dire khk ≤ 2Akkk, ce qui montre que o(h) est o(k). g est donc d´erivable sur V , et a (fx′ )−1 pour d´eriv´ee en f (x). Si f est de classe C n , f ′ est de classe C n−1 , donc le compos´e de f ′ avec l’application x 7→ x−1 , de Iso (E, F ) vers Iso (F, E), qui est de classe C ∞ , est de classe C n−1 . Mais ce compos´e est (f −1 )′ . 2 D´ efinition 7 Soient E et F deux espaces de Banach, U un ouvert de E, f : U −→ F une application continue, et x0 un point de U . On dit que f est un diff´eomorphisme local de classe C k en x0 , s’il existe un ouvert V inclus dans U et contenant x0 , et un ouvert W de F , tels que f soit un diff´eomorphisme de classe C k de V vers W .
4.2
Applications contractantes.
D´ efinition 8 Soit E un espace m´etrique, dont la distance sera not´ee (x, y) 7→ d(x, y). Une application f : E −→ E est dite k–contractante, si 0 ≤ k < 1, et si ∀x ∈ E ∀y ∈ E d(f (x), f (y)) ≤ kd(x, y). On dit que f est contractante, s’il existe k tel que f soit k–contractante. On notera qu’une application k–contractante est k–lipschitzienne, donc en particulier continue. Th´ eor` eme 13 Si E est complet et non vide, toute application contractante de E vers E a un unique point fixe. En effet, comme E n’est pas vide, il existe un point x dans E. Consid´erons la suite (f n (x))n∈N dans E. C’est une suite de Cauchy. En effet, f diminuant les distances au moins d’un facteur k, on a : d(f p+q (x), f p (x))
≤ ≤ ≤
≤
d(f p+q (x), f p+q−1 (x)) + · · · + d(f p+1 (x), f p (x)) (k q−1 + · · · + 1)d(f p+1 (x), f p (x)) (k q−1 + · · · + 1)k p d(f (x), x) kp d(f (x), x). 1−k
Or, cette derni`ere expression expression est plus petite qu’un ε donn´e `a l’avance, d`es que p est assez grand. La suite ci–dessus a donc une limite y (E est complet). Comme la suite (f (f n (x)))n∈N a mˆeme limite que (f n (x))n∈N (c’est la mˆeme suite d´ecal´ee d’un cran), et comme f est continue, on voit que y est un point fixe de f . Si z ´etait un autre point fixe de f , on aurait : d(y, z) = d(f (y), f (z)) ≤ kd(y, z),
32
Calcul Diff´ erentiel
ce qui montre que d(y, z) = 0, donc que y = z. 2 Si l’espace m´etrique E est born´e (c’est–` a–dire si la distance de deux points quelconques de E est major´ee par un r´eel A (la borne inf´erieure desquels est appel´ee diam`etre de E) ind´ependant de ces points), alors on peut introduire une notion de distance entre deux fonctions k–contractantes f et g de E vers E, par la formule : d(f, g) = sup d(f (x), g(x)). x∈E
Ce sup est d’ailleurs major´e par la constante A. On voit alors que l’ensemble Ck (E) des applications k–contractantes de E vers E est un espace m´etrique.(3 ) Th´ eor` eme 14 Soit E un espace m´etrique born´e non vide . L’application Ψ : Ck (E) −→ E, qui a ` toute 1 fonction k–contractante de E vers E associe son unique point fixe est –lipschitzienne. 1−k Soient f et g deux applications k–contractantes de E vers E. Soit x le point fixe de f . On a : d(g n (x), x)
≤ d(g n (x), g n−1 (x)) + · · · + d(g(x), x) ≤ (k n−1 + · · · + 1)d(g(x), x) ≤ (k n−1 + · · · + 1)d(g(x), f (x)) 1 d(f, g). ≤ 1−k
Comme la suite (g n (x))n converge vers le point fixe de g, on a le r´esultat. 2
4.3
´ Enonc´ e et d´ emonstration du th´ eor` eme d’inversion locale.
Th´ eor` eme 15 (th´eor`eme d’inversion locale) Soit E et F deux espaces de Banach. Soit U un ouvert de E, et x0 un point de U . Soit f : U −→ F une application de classe C n (n ≥ 1), telle que fx′ 0 soit un isomorphisme d’espaces de Banach de E vers F . Alors f est un diff´eomorphisme local de classe C n en x0 . L’hypoth`ese que f est de classe C 1 dans un voisinage de x0 , c’est–`a–dire que f ′ est continue dans un voisinage de x0 , est essentielle. En effet, consid´erons l’application f de R vers R d´efinie par : 1 f (x) = x + 2x2 cos , x pour x 6= 0, et f (0) = 0. Elle admet Id R comme d´eriv´ee en 0. Pour le voir, il suffit de chercher la limite de : x + 2x2 cos x1 , x qui est clairement 1. Toutefois, f ′ n’est pas continue en 0. En effet, pour x 6= 0, on a f ′ (x) = 1 + 1 1 4x cos + 2 sin , et cette expression n’a pas de limite quand x tend vers 0. La fonction f n’est x x 1 reste voisine de 1 par ailleurs injective dans aucun voisinage de 0. En effet, l’expression 1 + 4x cos x 1 quand x est proche de 0, alors que 2 sin oscille une infinit´e de fois entre 2 et −2. En cons´equence, f x 3
On pourra montrer a ` titre d’exercice que cet espace est complet si E est complet.
Calcul Diff´ erentiel
33
change de sens de variation une infinit´e de fois au voisinage de 0, ce qui pour une fonction continue montre qu’elle ne peut ˆetre injective dans aucun voisinage de 0. Elle ne saurait donc ˆetre une diff´eomorphisme local en 0. 4.3.1
R´ eduction du probl` eme
Nous commen¸cons par nous ramener au cas o` u E = F , x0 = f (x0 ) = 0 et fx′ 0 = Id E . Pour cela, posons pour tout x de E : −1 g(x) = fx′ 0 (f (x0 + x) − f (x0 )) . L’application g est donc la compos´ee des applications suivantes : E −→ E x 7→ x0 + x
E −→ F f
F −→ F y→ 7 y − f (x0 )
F −→ E −1 fx′ 0
g envoie donc E dans E, et envoie 0 sur 0 : 0 7→ x0 7→ f (x0 ) 7→ 0 7→ 0 La premi`ere et la troisi`eme applications sont des translations, qui sont donc d´erivables, et admettent l’application identique (de E ou de F ) comme d´eriv´ee en un point quelconque. La deuxi`eme, qui est f , est d´erivable en x0 , et la derni`ere qui est lin´eaire continue est d´erivable en 0. g est donc d´erivable en 0 et −1 admet pour d´eriv´ee le compos´e fx′ 0 ◦ Id F ◦ fx′ 0 ◦ Id E , c’est–`a–dire Id E . Toutes ces applications, sauf f , ´etant des diff´eomorphismes, on voit que g est un diff´eomorphisme local en 0 si et seulement si f est un diff´eomorphisme local en x0 . Noter que g est de classe C n dans un voisinage de 0, pr´ecis´ement dans le translat´e de U par la translation x 7→ x − x0 , qu’on notera U ′ . Il nous reste donc a ` prouver que g : E −→ E, v´erifiant g(0) = 0 g0′ = Id E , et de classe C n dans un voisinage de 0, est un diff´eomorphisme local en 0. 4.3.2
Une application contractante.
Lemme 16 Il existe un voisinage de 0 dans E, dans lequel l’application x 7→ ψ(x) = x − g(x) est
1 –contractante. 2
Il s’agit de montrer qu’il existe un η > 0, tel que pour x et y dans la boule de centre 0 et de rayon η, on a : 1 kψ(x) − ψ(y)k ≤ kx − yk. 2 Ceci r´esulte du th´eor`eme de la moyenne. En effet, on a pour tout x de U ′ : ψx′ = Id E − gx′ . Comme x 7→ gx′ est continue, et g0′ = Id E , l’expression Id E − gx′ tend vers 0 quand x tend vers 0. 1 Il existe donc η > 0, tel que kψx′ k ≤ , d`es que kxk ≤ η. Le th´eor`eme de la moyenne donne alors le 2 r´esultat. 2
34
Calcul Diff´ erentiel
4.3.3
Injectivit´ e locale.
1 Notons V la boule ouverte de centre 0 et de rayon η (sur laquelle ψ est –contractante). Alors la 2 restrition de g ` a cette boule est injective. En effet, pour x et y dans V , on a : kψ(x) − ψ(y)k ≤
1 kx − yk. 2
Si on avait g(x) = g(y), on aurait alors : kx − yk ≤
1 kx − yk, 2
donc x = y. 2 4.3.4
Surjectivit´ e locale.
On d´esire montrer que si y est assez proche de 0, l’´equation en x suivante : y = g(x), a une solution. Cette ´equation peut encore s’´ecrire : y − g(x) + x = x, ce qui fait qu’une solution apparaˆıt comme un point fixe de la fonction x 7→ ϕ(x) = y − g(x) + x. Pour montrer que cette fonction a un point fixe, il suffit de montrer qu’elle envoie une boule ferm´ee F de centre 0 et de rayon non nul (qui est une partie compl`ete de E) dans elle–mˆeme, et que sa restriction `a F est contractante. On va montrer qu’il en est ainsi pour y assez proche de 0. On va construire F dans la boule V de centre 0 et de rayon η. De cette fa¸con, on est assur´e que ϕ est 1 –contractante. En effet ϕ(x) = y − ψ(x), donc pour a et b dans V , on a : 2 kϕ(a) − ϕ(b)k = kψ(a) − ψ(b)k ≤
1 ka − bk. 2
Prenons pour F n’importe quelle boule ferm´ee de centre 0 et de rayon η ′ strictement plus petit que η. De cette fa¸con F est contenue dans V , et la condition ci dessus est v´erifi´ee. Si maintenant y est de norme plus petite que
η′ , F est stable par ϕ. En effet, pour kxk ≤ η ′ : 2
kϕ(x)k = ky − ψ(x)k ≤ kyk + kψ(x)k ≤ puisque ψ est
η′ η′ + = η′ , 2 2
1 –contractante, et ψ(0) = 0. 2
η′ est donc l’image par 2 ′ g d’un unique x de norme inf´erieure ou ´egale `a η . Ceci montre la surjectivit´e locale de g. ϕ a donc un point fixe unique dans F . Tout y de norme inf´erieure ou ´egale `a
4.3.5
L’inverse local et sa continuit´ e.
D’apr`es ce qu’on vient de voir, tout ´el´ement de la boule ferm´ee F ′ de centre 0 et de rayon l’image par g d’un unique ´el´ement de la boule ferm´ee F de centre 0 et de rayon η ′ .
η′ est 2
Calcul Diff´ erentiel
35
g n’est pas n´ecessairement une bijection entre F et F ′ , car des ´el´ements x de F peuvent tr`es bien avoir une image par g qui ne soit pas dans F ′ . Toutefois, l’assertion ci–dessus d´efinit une application h : F ′ −→ F . Pour tout y de F ′ , h(y) est l’unique ´el´ement de F qui v´erifie g(h(y)) = y. Par ailleurs, h est continue, car elle est 2–lipschitzienne. En effet, si on pose ϕy (x) = y − g(x) + x et ϕy′ (x) = y ′ − g(x) + x, on a kϕy − ϕy′ k = ky − y ′ k. Or l’application qui `a ϕy associe son unique point 1 –lipschitzienne, c’est–`a–dire 2–lipschitzienne. fixe h(y) est 1 − 12 Comme h est 2–lipschitzienne, et envoie 0 sur 0, elle envoie en fait la boule ouverte V ′ de centre 0 et η′ de rayon dans la boule ouverte V ′′ de centre 0 et de rayon η ′ . 2 Par ailleurs, on a h(V ′ ) = g −1 (V ′ ) ∩ V ′′ .
En effet, si x ∈ h(V ′ ), alors x = h(y) avec y ∈ V ′ . Donc x est dans V ′′ et g(x) = g(h(y)) = y est dans V ′ . R´eciproquement, si x ∈ V ′′ et g(x) ∈ V ′ , on a g(h(g(x))) = g(x). Mais comme x et h(g(x)) sont dans V ′′ , et que la restriction de g ` a V ′′ est injective, on voit que x = h(g(x)), donc que x ∈ h(V ′ ). Ceci montre que h(V ′ ) est un ouvert de E. On a donc ´etabli que h est un hom´eomorphisme de l’ouvert V ′ (contenant 0) sur l’ouvert h(V ′ ) (contenant 0). Cet hom´eomorphisme est l’inverse de g : h(V ′ ) −→ V ′ . 4.3.6
Fin de la d´ emonstration.
Pour terminer la d´emonstration du th´eor`eme d’inversion locale, il nous reste `a voir que g : h(V ′ ) −→ V ′ et son inverse h : V ′ −→ h(V ′ ) sont de classe C n . Pour g il s’agit d’une hypoth`ese, et pour h, cela est une cons´equence d’un th´eor`eme vu plus haut. On a donc d´emontr´e le th´eor`eme d’inversion locale.
Exercices 18 On consid`ere §n la sph`ere de Riemann de Rn+1 (S n = {x ∈ Rn+1 | kxk = 1}). Soit X un champ de vecteur sur S n de classe C ∞ et tel que ∀x ∈ S n , hx, X(x)i = 0 (le champ est orthogonal `a la sph`ere) et ∀x ∈ S n , X(x) 6= 0. Le but de cet ´exercice va ˆetre de montrer que n est paire. Pour t ≥ 0, on introduit les fonctions :
1. 2. 3. 4.
Y
Sn Sn et X(x) x x 7−→ kX(x)k Montrer que pour t suffisament petit, ϕt est injective. p Montrer qu’alors ∀x ∈ S n , ϕt (x) ∈ S(0, 1 + t2 ). Montrer que ϕt est un diff´eomorphisme local. Conclure. Sn
−→
ϕt
−→ Rn+1 7−→ x + tY (x)
Solutions des exercices.
36
Calcul Diff´ erentiel
1 On voit facilement que ϕt est lin´eaire par d´efinition de l’´evaluation des fonctions. Donc si ϕt est continue, alors elle sera sa propre d´eriv´ee. Il faut donc montrer que ϕt est lin´eaire continue. [a,b] Or si on munis C([a, b], R) de la norme de convergence uniforme que l’on notera k k∞ , alors on a : [a,b] ∀f ∈ C([a, b], R), |ϕt (f )| = |f (t)| ≤ kf k∞ =⇒ kϕt k ≤ 1
D’o` u on d´eduit que ϕt est continue et que donc ϕt est d´erivable et on a ∀f ∈ C([a, b], R), (ϕt )′f = ϕt . De mˆeme, par lin´earit´e de l’int´egrale, ψ est une forme lin´eaire. Donc il suffit de montrer que ψ est continue pour montrer qu’elle est d´erivable et on auras aussi que ∀f ∈ C([a, b], R), ψf′ = ψ. Z b [a,b] ∀f ∈ C([a, b], R), |ψ(f )| = f (t)dt ≤ (b − a)kf k∞ a =⇒
kψk ≤ b − a
En fait on a mˆeme que kψk = b − a en consid´erant la fonction constante ´egale `a 1 par exemple. Donc ψ est une forme lin´eaire continue et d’o` u ce qu’il fallait montrer. 2 Soit A ∈ M2 (R), on alors : θ(A + H) = (A + H)2 = A2 + AH + HA + H 2 Et donc pour montrer que θ est d´erivable, il faut montrer que H 2 = o(H) et que H 7→ AH + HA est une application lin´eaire continue. kH 2 k −−→ ≤ kHk − kHk→0 0 c’est ` a dire H 2 = o(H). On pose maintenant γA (H) = AH + HA, on kHk a que γA est lin´eaire car le produit est lin´eaire et la somme aussi. Il reste donc `a montrer que γA est continue. On a : kγA (H)k ≤ 2kAkkHk ⇒ kγA k ≤ 2kAk On a :
′ et donc γA est continue et d’o` u θ est d´erivable et θA = H 7→ AH + HA.
3 On a ϕ∗ (f + h) = ϕ ◦ (f + h) mais ceci n’est pas ´egal `a ϕ ◦ f + ϕ ◦ h car ϕ n’est peut–ˆetre pas lin´eaire. Il faut utiliser autre chose que les m´ethodes pr´ec´edentes. En fait, si x ∈ [a, b], on a : ϕ∗ (f + h)(x)
=
ϕ(f (x) + h(x))
=
ϕ(f (x)) + ϕ′ (f (x))h(x) +
=
h(x)2 ′′ ϕ (f (x) + θh(x)) , θ ∈ [0, 1] (Taylor-Lagrange) 2 h(x)2 ′′ ′ ϕ (f (x) + o(f (x), h(x))h(x) (x) ϕ∗ (f )(x) + (hϕ∗ (f )) (x) + x 7→ 2
On a donc : h(x)2 ′′ ϕ (f (x) + o(f (x), h(x)))h(x) ϕ∗ (f + h) = ϕ∗ (f ) + (x 7→ h(x)ϕ′ (f (x))) + x 7→ 2
Calcul Diff´ erentiel
37
et on voit ais´ement que h 7→ (x 7→ h(x)ϕ′ (f (x))) est lin´eaire. On va donc maintenant montrer la continuit´e de cette application lin´eaire. On a successivement : |h(x)ϕ′ (f (x))|
≤
kx 7→ h(x)ϕ′ (f (x))k∞ ≤ kh 7→ (x 7→ h(x)ϕ′ (f (x))) k ≤
khk∞ |ϕ′ (f (x))|
khk∞ kx 7→ ϕ′ (f (x))k∞ kϕ ◦ f k∞
et la continuit´e est d´emontr´ee. Il reste ` a s’occuper du o. On suppose h 6= 0, alors :
2
h ′′
2 ϕ (f + θh) khk∞ ′′ −−−−→ ∞ ≤ ||ϕ (f + θh)||∞ khk∞ →0 0 khk∞ 2 car ϕ ´etant de classe C 2 , ϕ′′ (f + θh) est continue sur [a, b] et donc born´ee. ϕ∗ est donc d´erivable et (Dϕ∗ )f = h 7→ h(ϕ′ ◦ f ). 4 On a que f (x + h, y + k) = f (x, y) + f (h, y) + f (x, k) + f (h, k) car le produit vectoriel est bilin´eaire. Il suffit de montrer que f (h, k) = o(h, k). Or on sait que kh ∧ k ≤ |h||k| et comme k(h, k)k = max{|h|, |k|} ′ (h, k) = f (h, y) + f (x, k). on a le r´esultat avec f(x,y)
5 Notons x 7→ kxk la norme (norme euclidienne) associ´ee au produit scalaire de l’espace euclidien E, lui–mˆeme not´e (x, y) 7→ x.y. La norme est la compos´ee des fonctions suivantes : ∆
.
√
x 7−→ (x, x) 7−→ x.x 7−→
√ x.x = kxk.
√ √ continue sur ]0, +∞[. Comme ∆ est lin´eaire continue, le produit scalaire bilin´eaire continue, et n’est pas d´erivable en 0, et comme seul 0 est envoy´e sur 0 par . ◦ ∆, on voit que la norme euclidienne est d´erivable en tout point autre que 0. On applique le th´eor`eme de d´erivation des fonctions compos´ees en un point x 6= 0 de E. En un tel point, la d´eriv´ee de cette composition est la composition des trois d´eriv´ees suivantes : ∆
h 7−→ (h, h)
h h 7−→ √ 2 x.x
(h, k) 7−→ h.x + x.k
ce qui donne (compte tenu de la sym´etrie du produit scalaire) h 7→
x.h . kxk
6 On a : g(x + h)
= g(x(1 + x−1 h)) = g(x)g(1 + x−1 h) = g(x)(1 + g1′ (x−1 h) + o(h)) = g(x) + g(x)g1′ (x−1 h) + o(h).
Compte tenu des hypoth`eses faites sur les groupes G et G′ , l’application h 7→ g(x)g1′ (x−1 h) est lin´eaire et continue. La deuxi`eme ´egalit´e s’obtient de mˆeme, en commen¸cant le calcul par g(x+h) = g((1+hx−1 )x).
38
Calcul Diff´ erentiel 7 1. Tout d’abord on voit que ϕ(0) = e0 = In . Et si h ∈ R, alors : ϕ(0 + h) = ehA = In + hA +
∞ X hp Ap p=2
Il est ´evident que h 7→ hA est lin´eaire. Il faut donc montrer que k
∞ X hn An p=2
n!
k ≤ |h|2
p!
∞ X hp Ap
∞ X |h|p−2 kAp p=2
k
p!
p=0
= o(h).
p!
Et d’o` u on a bien que ϕ est d´erivable en 0 et que ϕ′ (0) = A 2. Le d´eterminant est d´erivable sur Mn (R) entier donc en particulier en ϕ(0) = In , et par composition ′
′
ϕ(0)
In
on a : ψ ′ (0) = det (ϕ′ (0)) = det(A) = tr(A).
3. Comme l’exponentielle est un morphisme de groupe (R, +) dans (GL n (R), ◦) et que le d´eterminant est un morphisme de groupe (GL n (R), ◦) dans (R∗ , .), par composition ψ est un morphisme de groupe de (R, +) dans (R∗ , .). Or on montre facilement que les applications de la forme x 7→ ± exp(λx) pour λ ∈ R sont d´ej` a de tel morphisme. On va montrer que tous les morphismes de groupe de (R, +) dans (R∗ , .) sont de cette forme et on auras alors que ∃λ ∈ R tel que ∀x ∈ R, det(exA ) = eλx car det(e0 ) = det(In ) = 1 > 0. Soit donc f un morphisme de groupe de (R, +) dans (R∗ , .). Supposons que f (1) > 0, sinon −f est aussi un morphisme de groupe et change f en −f . Alors on a : n
∀n ∈ N, f (n) = f (1 + · · · + 1) = f (1) × · · · × f (1) = (f (1)) , | {z } {z } | n
∀n ∈ Z,
f (n) =
(
n
(f (1))n −1 f (−(−n)) = (f (−n))−1 = f (1)−n
si n ≥ 0 si n < 0
⇐⇒ f (n) = (f (1))n ∀(p, q) ∈ Z × N∗ , =⇒ =⇒
q 1 q = f f (1) = f q q 1 1 f = (f (1)) q q p p p 1 p 1 f = f = f (1) q = f (1) q q q
Comme f (1) > 0 par hypoth`ese, ∃λ ∈ R, f (1) = eλ . On consid`ere la fonction g d´efinie sur R par u ce qu’il fallait d´emontrer. g(x) = eλx . On a alors que f = g sur Q et comme Q = R, on a que f = g. D’o` On a donc l’´existence d’un λ ∈ R tel que ∀x ∈ R, det(exA ) = eλx , d’o` u ψ ′ (x) = λeλx et de ψ ′ (0) = tr (A) on d´eduit que λ = tr (A). On vient donc bien de d´emontrer que det(exA ) = etr (A)x .
Calcul Diff´ erentiel
39
8 f est de classe C ∞ sur D et on a : ∂f (x, y) = ∂x
1 − 1 + x2
1−xy+y(x+y) (1−xy)2 2 x+y 1 + 1−xy
1 − xy + y(x + y) 1 − 2 1+x (1 − xy)2 + (x + y)2 1 + y2 1 − 1 + x2 (1 − xy)2 + (x + y)2
= =
or (1 − xy)2 + (x + y)2
∂f ∂x
donc
= = =
= =
1 − 2xy + x2 y 2 + x2 + y 2 + 2xy
1 + x2 + y 2 + x2 y 2 (1 + x2 )(1 + y 2 ) 1 + y2 − y2 − 1 (1 + x2 )(1 + y 2 ) 0
De mˆeme, on a pour la d´eriv´ee par rapport `a y : ∂f ∂y
= = =
1 + x2 1 − 1 + y2 (1 − xy)2 + (x + y)2 1 1 + x2 − 1 + y2 (1 + x2 )(1 + y 2 ) 0
On a donc que f ′ = 0 et donc que f est constante sur chaques composantes connexes de D. On note : 1 2 D1 = (x, y) ∈ R , x < 0, y < x 1 1 2 D2 = (x, y) ∈ R , y > si x < 0, y ∈ R si x = 0, y < si x > 0 x x 1 2 D3 = (x, y) ∈ R , x > 0, y > x lim f (x, x) = π donc f
x→∞
D1
= π.
On a (0, 0) ∈ D2 et f (0, 0) = 0 donc f
D2
lim f (x, x) = −π donc f
x→−∞
D3
= 0.
= −π.
9 a) La d´eriv´ee en x de ψ est h 7→ (fx′ − fx′ 0 )(h). Or, par hypoth`ese, x 7→ fx′ est continue. Il en r´esulte que pour x dans un voisinage convenable V de x0 , on a kfx′ − fx′ 0 k ≤ k. Comme il est possible de prendre V convexe, il en r´esulte imm´ediatement (cours) que ψ est k–lipschitzienne sur V . b) Si la norme de g ´etait nulle, g serait la fonction nulle, et E serait r´eduit `a 0. On a h = g(fx′ 0 (h)), u le r´esultat. donc khk ≤ kgk kfx′ 0 (h)k, d’o`
40
Calcul Diff´ erentiel
1 . On a un voisinage V de x0 sur lequel ψ est k–lipschitzienne. Soient x et y kgk 1 deux points de V . On a alors, en supposant x 6= y, kψ(x) − ψ(y)k < kx − yk. Si f (x) = f (y), on a kgk 1 kψ(x) − ψ(y)k = kfx′ 0 (x − y)k ≥ kx − yk, ce qui est impossible. kgk c) Prenons k <
10 Soit la fonction : F
2 −→ R 2 1 sin(x + y), 1 + arctan(x − y) (x, y) 7−→ 4 3
R2
Pour montrer que le syst`eme admet une unique solution, il suffit de montrer que F a un unique point fixe. On va donc montrer que F est contractante et en appliquant le th´eor`eme du point fixe, on auras ce qu’il fallait d´emontrer car R2 est complet et non vide. On voit ais´ement que F est de classe C ∞ sur R2 . En nottant alors Jac (x,y) F la matrice jacobienne de F en (x, y), on a : ∂F ∂F 1 1 1 1 cos(x + y) cos(x + y) ∂x 4 ∂y 4 Jac (x,y) F = = ∂F2 ∂F2 −2 2 ∂x
On pose alors M =
a c
3 (1 + (x − y)2 )
∂y
3 (1 + (x − y)2 )
b h = Jac (x,y) F pour simplifier les ´ecritures. Et on a donc que ∀ ∈ R2 , d k
M h ≤ kM k h avec h = |h| + |k|
k
k k h ah + bk et M = k ch + dk
d’o` u l’on a :
M h =
k ≤
=
or :
|ah + bk| + |ch + dk| |a| + |c| |h| + |b| + |d| |k| |a| + |c| |h| + |k| car a = b et c = −d
|a| + |c| = ≤ |b| + |d| ≤ d’o` u on d´eduit que kM k ≤
2 1 |cos(x + y)| + 4 3 (1 + (x − y)2 ) 1 2 3+8 11 + = = <1 4 3 12 12 11 1 2 + = 4 3 12
11 11 et par in´egalit´ee de la moyenne, F est -contractante. 12 12
11 Soient α ∈]0, +∞[, h ∈ R et t ∈ [0, 1], on a :
Calcul Diff´ erentiel
41
ϕ(α + h)(t)
= tα+h = tα th = tα eh ln(t) = tα (1 + h ln(t) + ot (h)) = tα + htα ln(t) + tα ot (h)
La fonction h 7→ (t 7→ htα ln(t)) est ´evidemment lin´eaire et continue puisque son espace de d´epart est de dimension 1. On a donc : ϕ(α + h) = ϕ(α) + (t 7→ htα ln(t)) + (t 7→ tα ot (h)). Pour montrer que ϕ est d´erivable, il suffit donc de montrer que la fonction t 7→ tα ot (h) est n´egligeable devant h quand h tend vers 0. Or, on a ot (h) = th − 1 − h ln(t). Le signe de cette expression ne d´epend th − 1 qui ne s’annule pas dans l’intervalle pas de t. En effet, en la d´erivant par rapport `a t, on obtient h t ouvert ]0, 1[. Pour majorer l’int´egrale : Z 1 |tα (th − 1 − h ln(t))|dt 0
il suffit donc de majorer
Z
1
0
Or, on a
Z
1
tα+h dt =
0
t (t − 1 − h ln(t))dt α
h
1 h 1 + o(h) = − α+1+h α + 1 (α + 1)2
o` u o(h) est n´egligeable devant h quand h tend vers 0. En particulier, on a : Z 1 1 , tα dt = α + 1 0 et enfin, en int´egrant par parties : Z 1 Z 1 1 1 1 1 1 α+1 t ln(t) 0 − tα+1 dt = − tα ln(t)dt = α + 1 α + 1 t (α + 1)2 0 0 On voit donc finalement que :
Z
0
On a donc ϕ′ (α) = t 7→ tα ln(t).
1
tα (th − 1 − h ln(t))dt = o(h)
1 (q(x + y) − 4 q(x) − q(y)). Comme q(x) = f (x, x) = f ◦ ∆ (o` u ∆(x) = (x, x)), le th´eor`eme de d´erivation des fonctions compos´ees donne : ′ ′ (h, h). (∆(h)) = f(x,x) qx′ (h) = f∆(x) 12 La forme polaire f : E × E −→ R est continue, car donn´ee par la formule f (x, y) =
′ (Noter que ∆ est lin´eaire.) Par ailleurs, f ´etant bilin´eaire continue et sym´etrique, on a f(x,x) (h, h) = ′ f (x, h) + f (h, x) = 2f (x, h). Le reste est ´evident, puisque q est une fonction lin´eaire de x.
13 Il suffit d’appliquer le th´eor`eme de d´erivation des fonctions compos´ees. On a d’abord : (g ◦ f )′x = gf′ (x) ◦ fx′ .
42
Calcul Diff´ erentiel
Noter que (g ◦ f )′ est une application de U vers L(E, G). C’est cette application qu’on veut d´eriver en x. Pour ce faire, on va la d´ecomposer en un produit de deux applications, comme suit : U x
−→ L(E, F ) × L(F, G) 7→ (fx′ , gf′ (x) )
◦
−→ L(E, G) 7→ (g ◦ f )′x
La premi`ere de ces applications a deux composantes qui sont respectivement x 7→ fx′ et x 7→ gf′ (x) . Pour la d´eriver en x, il suffit de d´eriver chaque composante en x. La premi`ere composante se d´erive facilement, puisqu’elle est simplement f ′ . Sa d´eriv´ee en x est donc fx′′ . La deuxi`eme composante est la composition : U x
f
−→ V 7→ f (x)
g′
−→ L(F, G) 7→ gf′ (x)
Sa d´eriv´ee en x s’obtient donc par le th´eor`eme de d´erivation des fonctions compos´ees, ce qui donne : gf′′(x) ◦ fx′ . La d´eriv´ee en x de x 7→ (fx′ , gf′ (x) ) est donc : h 7→ (fx′′ (h), gf′′(x) (fx′ (h))). Nous devons maintenant d´eriver la composition ◦ : L(E, F ) × L(F, G) −→ L(E, G). Noter que compte tenu des conventions courantes sur la composition, cette application envoie le couple (u, v) sur v ◦ u, et non pas u ◦ v. Comme elle est bilin´eaire, sa d´eriv´ee en (u, v) est : (h, k) 7→ v ◦ h + k ◦ u. Dans la situation pr´esente, on doit la d´eriver en (fx′ , gf′ (x) ), ce qui donne : (h, k) 7→ gf′ (x) ◦ h + k ◦ fx′ . En rassemblant maintenant tous ces r´esultats, on obtient la formule suivante pour h 7→ (g ◦ f )′′x (h) : h 7→ gf′ (x) ◦ fx′′ (h) + gf′′(x) (fx′ (h)) ◦ fx′ , ce qui fait que (g ◦ f )′′x (h, k) = (g ◦ f )′′x (h)(k) = gf′ (x) (fx′′ (h)(k)) + gf′′(x) (fx′ (h))(fx′ (k)) = gf′ (x) (fx′′ (h, k)) + gf′′(x) (fx′ (h), fx′ (k)).
14 a) C’est imm´ediat, puisque le produit scalaire s’exprime en fonction de la norme par la formule : kx + yk − kxk − kyk ′ . fx a un noyau r´eduit `a 0, puisque qu’il respecte la norme. Comme c’est un x.y = 2 endomorphisme d’un espace de dimension finie, fx′ est bijectif. b) Pour h et k fix´es, d´erivons les deux fonctions x 7→ fx′ (h).fx′ (k) et x 7→ h.k (qui sont ´egales d’apr`es la question pr´ec´edente). La deuxi`eme a une d´eriv´ee nulle, puisqu’elle est constante. La premi`ere est la composition des deux fonctions suivantes : x 7→ (fx′ (h), fx′ (k)) et (u, v) 7→ u.v. La fonction x 7→ fx′ (h) est elle mˆeme la compos´ee des deux fonctions : x 7→ fx′ et ϕ 7→ ϕ(h), la deuxi`eme ´etant lin´eaire continue. x 7→ fx′ a pour d´eriv´ee en x : l 7→ fx′′ (l), et ϕ 7→ ϕ(h) a pour d´eriv´ee elle–mˆeme en tout point. Donc x 7→ fx′ (h) a pour d´eriv´ee en x : l 7→ fx′′ (l)(h).
Calcul Diff´ erentiel
43
Comme par ailleurs (u, v) 7→ u.v a pour d´eriv´ee en (u, v) : (α, β) 7→ α.v + u.β, on voit que la d´eriv´ee en x cherch´ee est : l 7→ fx′′ (l, h).fx′ (k) + fx′ (h).fx′′ (l, k). Or cette d´eriv´ee ´etant nulle, on a Ax (h, k, l) + Ax (k, h, l) = 0. c) La question pr´ec´edente a montr´e que (h, k, l) 7→ Ax (h, k, l) est antisym´etrique relativement aux deux premi`eres variables. Par ailleurs, le th´eor`eme de Schwarz montre qu’elle est sym´etrique par rapport aux deux derni`eres. On a donc Ax (h, k, l) = Ax (h, l, k) = −Ax (l, h, k) = −Ax (l, k, h) = Ax (k, l, h) = Ax (k, h, l) = −Ax (h, k, l), ce qui montre que Ax (h, k, l) = 0. On a donc fx′ (h).fx′′ (l, k) = 0. Comme fx′ est surjectif, et le produit scalaire non d´eg´en´er´e, on en d´eduit que fx′′ (k, l) = 0 pour tous k, l et x, donc fx′′ = 0, pour tout x. d) Comme f ′′ est la fonction nulle, f ′ est constante (application du th´eor`eme de la moyenne). On a donc fx′ (h) = u(h), o` u u est une application lin´eaire de E vers E. La fonction x 7→ f (x) − u(x) a donc elle aussi une d´eriv´ee nulle. Elle est donc constante (disons de valeur C) et on a f (x) = u(x) + C, c’est–`a–dire que f est une fonction affine. 15 La formule de Taylor–Young ` a l’ordre 2, donne pour x dans A et t r´eel : g(1 + tx) = 1 + g1′ (tx) + b(tx, tx) + o(ktxk2 ) = 1 + tg1′ (x) + t2 b(x, x) + o(t2 ), o` u b est une application bilin´eaire sym´etrique de A × A vers B. Dans cette formule, on peut remplacer tx par ty, mais aussi par tx + ty + t2 xy. On a alors, puisque g(1 + tx + ty + t2 xy) = g(1 + tx)g(1 + ty), et en isolant les coefficients de t2 : g1′ (xy) − g1′ (x)g1′ (y) = 2b(x, y). Le r´esultat en d´ecoule en soustrayant des deux membres de cette ´egalit´e les deux membres de celle obtenue en ´echangeant x et y. 16 a) La fonction ´etant une somme, il suffit de calculer les d´eriv´ees de chaque terme de cette somme. Posons donc g(x) = kx − ak2 = (x − a).(x − a), o` u le point repr´esente le produit scalaire. L’application x 7→ x − a ´etant affine de d´eriv´ee h 7→ h en tout point, et le produit scalaire ´etant bilin´eaire, on a : gx′ (h) = (x − a).h + h.(x − a) = 2(x − a).h. L’application g ′ : E −→ L(E, R) est donc x 7→ (h 7→ 2(x − a).h). C’est la compos´ee de l’application affine x 7→ x − a et de l’application lin´eaire x 7→ (h 7→ 2x.h)). On a donc : g ′′ (k) = (h 7→ 2k.h), ou encore : g ′′ (k, h) = 2k.h. La d´eriv´ee premi`ere de f est donc h 7→
! p X (x − ai ) .h, 2 i=0
et sa d´eriv´ee seconde est (h, k) 7→ 2(p + 1)h.k. b) En un extremum relatif, la d´eriv´ee premi`ere doit s’annuler, ce qui ne peut arriver que si p
p X
(x−ai ) =
i=0
1 X ai . Par ailleurs, la d´eriv´ee seconde ´etant 2(p + 1) fois le produit scalaire, 0, c’est–`a–dire au point p + 1 i=0 elle est d´efinie positive, ce qui montre que f a un minimum relatif en ce point.
44
Calcul Diff´ erentiel
17 a) Ψ(X) ´etant une somme, il suffit de d´eriver chaque terme de la somme. Noter que tr (t XX) n’est autre que tr (t (X − 0)(X − 0)). Consid´erons donc la fonction Γ d´efinie par Γ(X) = tr (t (X − A)(X − A)), o` u A est une matrice quelconque. Cette fonction est une composition de fonctions. Notons que X 7→ X − A est affine et a pour d´eriv´ee l’application identique. La transposition et la trace sont lin´eaires. Enfin, le produit de matrices est bilin´eaire. La d´eriv´ee de Γ est donc donn´ee par : Γ′X (H) = tr (t (X −A)H + t H(X −A)) = 2tr (t (X −A)H). On a donc p p X X Ai )H). tr (t (X − Ai )H) = 2tr (t ((p + 1)X − Ψ′X (H) = 2tr (t XH) + 2 i=1
i=1
Calculons maintenant Γ′′X (H, K). Ici on doit d´eriver Γ′ , c’est–`a–dire l’application : X 7→ (H 7→ 2tr (t (X − A)H)), qui est la compos´ee de l’application affine X 7→ t (X − A), dont la d´eriv´ee est la transposition, et de l’application lin´eaire U 7→ (H 7→ 2tr (U H)). On a donc : Γ′′X (K) = (H 7→ 2tr (t KH)), c’est–`a–dire Γ′′X (H, K) = 2tr (t KH) = 2tr (t HK). Ceci donne : Ψ′′X (H, K) = 2(p + 1)tr (t HK). b) Remarquons que p + 1 n’est jamais nul, mˆeme si p = 0. Pour que Ψ ait un extremum relatif en X, il p X Ai )H) = 0. Comme la est n´ecessaire que Ψ′X soit nul. On doit donc avoir pour tout H : tr (t ((p+1)X − i=1
forme bilin´eaire sym´etrique (H, K) 7→ tr (t HK) est d´efinie positive, on doit avoir : (p + 1)X − p
p X
Ai = 0,
i=1
1 X Ai . Il y a donc au plus un seul extremum local, se situant au point qu’on p + 1 i=1 vient de calculer. (Si p = 0, ce point est 0.)
c’est–`a–dire X =
Comme on l’a vu, la d´eriv´ee seconde de Ψ en X est ind´ependante de X. Elle est le produit par 2(p + 1) (qui n’est pas nul) du produit scalaire (H, K) 7→ tr (t HK). Elle est donc d´efinie positive, ce qui montre p 1 X que Ψ a, au point Ai un minimum local. p + 1 i=1 X(x) , et comme X est de classe C ∞ et que la norme aussi, on en kX(x)k d´eduit que Y est aussi de classe C ∞ . Et par la bilin´earit´e du produit scalaire, on a que Y est un champ de vecteur norm´e orthogonal ` a la sph`ere. 18 1. On a ∀x ∈ S n , Y (x) =
Du fait que Y soit C ∞ , on d´eduit que ϕt est ´egalement de classe C ∞ (ϕt = IdS n + tY ). On consid`ere x, y ∈ S n tels que ϕt (x) = ϕt (y) et on veut montrer que cela implique x = y. Or : ϕt (x) = ϕt (y)
⇐⇒ x + tY (x) = y + tY (y)
⇐⇒ kx + tY (x) − y − tY (y)k = 0 De plus on a kx + tY (x) − y − tY (y)k ≥ kx − yk − tkY (x) − Y (y)k . On introduit alors : Y
Rn+1 \{0} −→ x
et Y est toujours de classe C ∞ avec Y
Sn
7→
Rn+1 x kxkY kxk
= Y . On a donc pour x, y ∈ S n , kY (x)−Y (y)k = kY (x)−Y (y)k. ′
De plus comme Y est de classe C ∞ , on a en particulier que Y est continue sur Rn+1 \{0}, donc born´ee
Calcul Diff´ erentiel
45 ′
sur tous compact de Rn+1 \{0} et on a donc que ∀z ∈ [x, y], ∃k ≥ 0, kY z k ≤ k. Puis par in´egalit´ee de la moyenne, on obtient que kY (x) − Y (y)k ≤ kkx − yk, ce qui implique que kx + tY (x) − y − tY (y)k ≥ |1 − tk|kx − yk. Il suffit alors de prendre t > 0 tel que tk < 1 pour avoir l’injectivit´e. En effet, avec un tel t on a 1 − tk > 0 et donc : ϕt (x) = ϕt (y) ⇐⇒ kϕt (x) − ϕt (y)k = 0 ⇐⇒ 0 ≥ (1 − tk)kx − yk ≥ 0 ⇐⇒ x = y
2. Soit x ∈ S n . On a : kϕt (x)k2
= = = ⇒
D’o` u on a bien que ϕt (x) ∈ S(0,
kx + tY (x)k2 kxk2 + t2 kY (x)k2 car Y ⊥ S n
1 + t2 car x ∈ S n et Y norm´e par d´efinition p 1 + t2 kϕt (x)k =
p 1 + t2 ).
′
3. Soit x ∈ S n . D’apr`es la premi`ere question, ∀K ⊂ B(0, 1), K compact, ∃k > 0, ∀y ∈ K, kY y k ≤ k. ′
u ∀x ∈ S n , il Et comme pour x ∈ S n , ϕt = IdS n + Y , on a que ∀h ∈ Rn+1 , (ϕt )′x (h) = h + tY x (h). D’o` ′ ´existe K ⊂ S n tel que x ∈ K et il ´existe k > 0 tel que kY x k ≤ k. Puis en choisissant le t comme `a la ′ question 1., on a que ktY x k ≤ tk < 1. On en d´eduit pour h ∈ Rn+1 , h 6= 0, (ϕt )′x (h) = 0
′
⇐⇒ −h = tY x (h)
′
⇐⇒ khk ≤ tkhkkY x k =⇒
khk < khk car h 6= 0
Ce qui est impossible. D’o` u (ϕt )′x (h) = 0 ⇐⇒ h = 0. On vient donc de montrer que (ϕt )′x est injective. Or c’est une application lin´eaire de Rn+1 dans lui mˆeme et donc, puisque nous sommes en dimension finie, (ϕt )′x est un isomorphisme. Enfin, on d´eduit du th´eor`eme d’inversion locale que ϕt est un diff´eomorphisme local. p 4. D’apr`es la question 2. on sait que ∀x ∈ S n , ϕt (x) ∈ S(0, 1 + t2 ). Alors en notant Cα,β la couronne de centre 0 comprise entre les rayons α et β avec β > α (Cα,β = {x ∈ Rn+1 | α < kxk < β}), montrons que l’image par ϕt de Cα,β est Cα√1+t2 ,β √1+t2 . En effet comme ϕt est un diff´eomorphisme local, on a que ϕt (Cα,β ) est un ouvert de Cα√1+t2 ,β √1+t2 car Cα,β est un ouvert et si r ∈]α, β[, alors ϕt (Cα,β ∩ Sr ) = ϕt (Cα,β ) ∩ Sr√1+t2 est un ouvert de Sr√1+t2 , en notant Sm la sph`ere de centre 0 et de rayon m. Or comme r ∈]α, β[, Cα,β ∩ Sr = Sr est donc compact et comme ϕt est continue, ϕt (Cα,β ∩ Sr ) est compact donc ferm´e. On vient donc de montrer que a la fois ouvert et ferm´e dans Sr√1+t2 . On d´eduit, par connexit´e de ϕt (Cα,β ) ∩ Sr√1+t2 est un non vide ` √ √ Sm , que ϕt (Cα,β ) ∩ Sr 1+t2 = Sr 1+t2 . [ On a donc que ∀r ∈]α, β[, ϕt (Cα,β ∩ Sr ) = Sr√1+t2 . Or Cα,β = Sr , d’o` u on a bien que ϕt (Cα,β ) = α
46
Calcul Diff´ erentiel
Cα√1+t2 ,β √1+t2 . Et de plus on a : Cα√1+t2 ,β √1+t2
= = =
D’o` u ϕt (Cα,β ) =
p p {x ∈ Rn+1 , | α 1 + t2 < kxk < β 1 + t2 }
kxk ∈ Cα,β } {x ∈ Rn+1 , | √ 1 + t2 p 1 + t2 Cα,β
p 1 + t2 Cα,β .
Alors si on note V le volume de Cα,β et V ′ celui de ϕt (Cα,β ), on a alors que V ′ = D’autre part, Z V′ = du C √ α
=
Z
Cα,β
1+y2 ,β
n+1 p V. 1 + t2
√
1+t2
det((ϕt )′x )dx
′
u Jac f est la matrice jacobienne de f , d’o` u Or, de (ϕt )′x = Id + tY x on a Jacx (ϕt ) = In+1 + tJacx (Y ) o` on a pour t suffisament petit, det((ϕt )′x ) > 0. On voit alors que det((ϕt )′x ) est un polynˆome en t de degr´e au n+1 n+1 X Z X i ′ ′ ti Ai (x)dx, Ai (x)t . Alors, par lin´earit´e de l’int´egrale, V = plus n + 1. On pose det((ϕt )x ) = i=0
i=0
Cα,β
d’o` u V ′ est un polynˆ ome en t de degr´e n + 1 au plus. p n+1 Mais comme on avait d´ej` a que V ′ = V et que V est une constante, on d´eduit que 1 + t2 n+1 p est un polynˆ ome en t. 1 + t2
p n+1 n+1 On a donc . Puis, par unicit´e de la d´ecomposition = P (t), d’o` u P (t)2 = 1 + t2 1 + t2 en produit omes irr´eductibles dans R[X], et comme il y a un nombre forc´ement paire de facteur de polynˆ 1 + t2 dans la d´ecomposition de P 2 , on a qu’il y a ´egalement un nombre paire de facteur 1 + t2 dans n+1 , autrement dit n + 1 est paire et donc n est impaire. le polynˆome 1 + t2
Ce cours peut ˆetre librement copi´e et distribu´e. Il est recommand´e d’en t´el´echarger la version la plus r´ecente `a partir de : http://www.math.jussieu.fr/~alp. Toute remarque, correction ou suggestion doit ˆetre address´ee `a l’auteur :
[email protected].
Equations Diff´ erentielles. par Alain Prout´e Universit´e Denis Diderot — Paris 7
Table des mati` eres 1 D´ efinitions. 1.1 Solutions. . . . . . . . . . . . . . . . . . . . . . . . 1.2 Diff´erentiabilit´e des solutions. . . . . . . . . . . . . 1.3 Syst`emes diff´erentiels. . . . . . . . . . . . . . . . . ´ 1.4 Equations autonomes. . . . . . . . . . . . . . . . . ´ 1.5 Equations d’ordre sup´erieur. . . . . . . . . . . . . . 1.6 Conditions initiales et solutions non prolongeables. 1.7 Exemple. . . . . . . . . . . . . . . . . . . . . . . . 1.8 Interpr´etation g´eom´etrique. . . . . . . . . . . . . .
. . . . . . . .
2 2 3 3 3 4 4 5 5
2 Le th´ eor` eme de Cauchy–Lipschitz. 2.1 Condition de Lipschitz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ 2.2 Enonc´ e du th´eor`eme et utilisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5 5 6
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
3 Techniques de r´ esolution. ´ 3.1 Equations `a variables s´eparables. . . . . . . . . . . . 3.2 Probl`eme de la chaˆınette. . . . . . . . . . . . . . . . 3.3 Mouvement dans un champ d’attraction newtonien. ´ 3.4 Equations homog`enes. . . . . . . . . . . . . . . . . . ´ 3.5 Equation de Bernoulli. . . . . . . . . . . . . . . . . . ´ 3.6 Equation aux diff´erentielles totales. . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
7 7 8 9 10 11 11
4 D´ emonstration du th´ eor` eme de Cauchy–Lipschitz. 4.1 Une ´equation int´egrale. . . . . . . . . . . . . . . . . . 4.2 Un op´erateur contractant. . . . . . . . . . . . . . . . 4.3 Unicit´e locale. . . . . . . . . . . . . . . . . . . . . . . 4.4 Solutions maximales. . . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
13 13 13 14 15
5 Deux lemmes concernant les solutions. 5.1 Applications propres. . . . . . . . . . . . 5.2 Comparaison de deux solutions. . . . . . 5.3 Caract´erisation des solutions maximales. 5.4 Exemples. . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
15 15 17 17 18
´ 6 Equations lin´ eaires. 6.1 Application du th´eor`eme de Cauchy–Lipschitz. 6.2 Espace des solutions de l’´equation homog`ene. . 6.3 R´esolution de l’´equation homog`ene. . . . . . . . 6.4 La r´esolvante. . . . . . . . . . . . . . . . . . . . 6.5 M´ethode de variation des constantes. . . . . . . 6.6 Solutions complexes. . . . . . . . . . . . . . . . ´ 6.7 Equations lin´eaires `a coefficients constants. . . 6.8 Interpr´etation g´eom´etrique. . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
19 19 20 21 21 23 23 23 25
. . . .
. . . .
. . . .
2
Equations Diff´ erentielles. ´ 6.9 Equations d’ordre sup´erieur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ 6.10 Equations de Lagrange et de Clairaut. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26 27
Dans une ´equation diff´erentielle ordinaire, la fonction inconnue est une fonction d’une variable r´eelle.1 L’´equation elle-mˆeme est une relation entre cette fonction inconnue et une ou plusieurs de ses d´eriv´ees. La fonction inconnue peut ˆetre `a valeurs dans un espace vectoriel r´eel, comme c’est le cas des ´equations de la m´ecanique issues du principe F = mΓ, o` u la fonction inconnue (la trajectoire) est `a valeurs dans R3 .
1
D´ efinitions. Une ´equation diff´erentielle ordinaire d’ordre k a la forme suivante : F (x, y, y 0 , . . . , y (k) ) = 0
o` u y est la fonction inconnue (` a valeurs dans Rn ) de la variable r´eelle x, o` u y 0 , . . . , y (k) sont ses d´eriv´ees, n n n et o` u F est une fonction d’une partie Γ de R × R × . . . × R vers R .
1.1
Solutions.
´finition. Une solution de l’´equation diff´erentielle F (x, y, y 0 , . . . , y (k) ) = 0 est un couple (I, ϕ), o` De uI est un intervalle ouvert de R, ϕ une fonction k fois d´erivable d´efinie sur I, et telle que pour tout x de I, on ait F (x, ϕ(x), ϕ0 (x), . . . , ϕ(k) (x)) = 0.
Par abus de langage, on dira souvent que ϕ est une solution de l’´equation, sans pr´eciser l’intervalle I de d´efinition de cette solution.2 Noter que la donn´ee d’une ´equation diff´erentielle est en fait la donn´ee de la fonction F , laquelle comprend la donn´ee du domaine Γ de d´efinition de F . Quand on parle de l’´equation F (x, y, . . .) = 0, on fait donc un abus de langage en ne pr´ecisant pas Γ. Il est g´en´eralement sous–entendu, que Γ est le plus grand domaine sur lequel la formule d´efinissant F a un sens.3 Dans un premier temps, nous nous int´eresserons seulement aux ´equations du premier ordre, c’est-`a-dire a` celles dans lesquelles seule la d´eriv´ee premi`ere de la fonction inconnue intervient. Une telle ´equation a la forme suivante : F (x, y, y 0 ) = 0. Nous verons un peu plus loin que toute ´equation diff´erentielle est ´equivalente `a une ´equation du premier ordre, quitte `a augmenter la dimension de l’espace dans lequel la fonction inconnue prend ses valeurs. De plus nous supposerons que cette ´equation est r´esolue par rapport ` a y 0 , c’est-`a-dire qu’elle est en fait de la forme : y 0 = F (x, y). 1 par opposition avec une ´ equation aux d´ eriv´ ees partielles, dans lesquelles la fonction inconnue est une fonction de plusieurs variables r´ eelles. 2 On remarquera toutefois, qu’en principe, la donn´ ee de la fonction ϕ comprend la donn´ ee de son domaine de d´ efinition, et qu’en cons´ equence, il est redondant de sp´ ecifier l’intervalle I. En pratique, la fonction ϕ est donn´ ee par une “formule” qui peut laisser planer des doutes sur le domaine de d´ efinition, d’o` u la n´ ecessit´ e de pr´ eciser l’intervalle I. On peut aussi interpr´ eter le couple (I, ϕ) comme une d´ efinition pr´ ecise de fonction, form´ ee d’un “domaine” et d’une “formule”. 3 On devrait donc noter l’´ equation diff´ erentielle ` a l’aide du couple ( Γ, F ). C’est d’ailleurs ce qu’on fait en g´ eom´ etrie diff´ erentielle, o` u la donn´ ee d’un champs de vecteurs sur une vari´ et´ e diff´ erentielle (formulation moderne des ´ equations diff´ erentielles ordinaires) suppose aussi la donn´ ee de la vari´ et´ e diff´ erentielle elle-mˆ eme.
Equations Diff´ erentielles.
3
Dans ce cas, la fonction F va d’une partie de R × Rn vers Rn , et une solution est de la forme (I, ϕ), o` u ϕ va de I vers Rn . On a alors ϕ0 (x) = F (x, ϕ(x)). On notera qu’alors, le graphe d’une solution est n´ecessairement inclus dans le domaine de d´efinition de F , sans quoi l’expression F (x, ϕ(x)) n’aurait pas de sens.
1.2
Diff´ erentiabilit´ e des solutions.
Si (I, ϕ) est solution de l’´equation y 0 = F (x, y), alors ϕ est une fonction d´erivable (sans quoi cela n’a pas de sens de dire que c’est une solution. Voir la d´efinition d’une solution plus haut). Dans ces conditions, si la fonction F elle mˆeme est d´erivable, le membre de droite de l’´egalit´e ϕ0 (x) = F (x, ϕ(x)) devient d´erivable. Il en est donc de mˆeme du membre de gauche, ce qui implique que ϕ est deux fois d´erivable. Si F est de classe C n , alors toute solution de l’´equation est de classe C n+1 . Ceci se voit par r´ecurrence sur n. En effet, si ϕ est de classe C i (i ≤ n), la formule ϕ0 (x) = F (x, ϕ(x)) montre que ϕ0 est aussi de classe C i , c’est–`a–dire que ϕ est de classe C i+1 . Bien sˆ ur, il en r´esulte que si F est de classe C ∞ , il en est de mˆeme de ϕ.
1.3
Syst` emes diff´ erentiels.
Comme nous autorisons la solution ϕ `a ˆetre `a valeurs dans un espace Rn , on peut l’interpr´eter comme une famille de n fonctions de I vers R. Dans ce cas, on peut appeler l’´equation diff´erentielle, un syst`eme diff´erentiel. Par exemple, pour n = 3, l’´equation vectorielle y 0 = F (x, y) est en fait le syst`eme diff´erentiel y10 y20 y30
= F1 (x, y1 , y2 , y3 ) = F2 (x, y1 , y2 , y3 ) = F3 (x, y1 , y2 , y3 )
o` u y1 , y2 , y3 sont les composantes de y, et F1 , F2 , F3 les composantes de F .
1.4
´ Equations autonomes.
Si l’´equation est de la forme plus particuli`ere y 0 = F (y), on dira que c’est une ´equation diff´erentielle autonome. Dans les probl`emes de m´ecanique, o` u la variable x repr´esente le temps (elle est not´ee alors t), une ´equation diff´erentielle est la plupart du temps obtenue `a partir de l’´equation F = mΓ reliant l’accel´eration d’un point mat´eriel de masse m `a la force qui agit sur lui. Cette force (F dans la notation ci-dessus) d´epend en g´en´eral de la position du point mat´eriel dans l’espace (par exemple, l’effet d’un potentiel) et de sa vitesse (par exemple l’effet d’un frottement). Elle peut aussi d´ependre directement du temps. C’est le cas dans le probl`eme des oscillations forc´ees, o` u une force ext´erieure, variable avec le temps, ind´ependante de la vitesse et de la position du point mat´eriel agit sur celui-ci. Dans ce cas l’´equation diff´erentielle contient un terme de la forme f (t) repr´esentant cette force, et il ne peut donc pas s’agir d’une ´equation autonome. Si par contre la force F s’exprime uniquement en fonction de la position du point et de sa vitesse, il s’agit d’une ´equation autonome, c’est-`a-dire non explicitement d´ependante du temps. Quitte `a augmenter d’une unit´e la dimension de l’espace dans lequel la fonction inconnue prend ses valeurs, on peut rendre autonome une ´equation qui ne l’est pas. En effet, consid´erons l’´equation y 0 = F (x, y), dans laquelle la fonction inconnue y prend ses valeurs dans Rn . Soit (I, ϕ) une solution de cette ´equation. Posons ψ(x) = (x, ϕ(x)).
4
Equations Diff´ erentielles.
Alors ψ est une fonction `a valeurs dans R × Rn , et (I, ψ) est solution de l’´equation autonome (de fonction inconnue z) z 0 = (1, F (z)), comme on le voit imm´ediatement en d´erivant ψ. R´eciproquement, si ψ est solution de l’´equation z 0 = (1, F (z)), posons ϕ(x) = π2 (ψ(x)), o` u π2 : R × Rn −→ Rn est la projection canonique. On a alors en d´erivant cette ´egalit´e ϕ0 (x) = π2 (ψ 0 (x)), puisque π2 est lin´eaire (la vitesse de la projection d’un point P en mouvement est la projection de la vitesse de P ). Or π2 (ψ 0 (x)) est F (ψ(x)), soit F (x, ϕ(x)). On voit donc qu’alors ϕ est solution de y 0 = F (x, y).
1.5
´ Equations d’ordre sup´ erieur.
Une astuce analogue `a celle d´ecrite ci-dessus permet de remplacer toute ´equation d’ordre sup´erieur ou ´egal `a 2 par une ´equation du premier ordre. Bien sˆ ur, comme ci-dessus, ceci se fait au prix d’une augmentation de la dimension de l’espace dans lequel la fonction inconnue prend ses valeurs. Soit F (x, y, y 0 , . . . , y (k) ) = 0 une ´equation d’ordre k, avec y `a valeurs dans Rn . Soit (I, ϕ) une solution de cette ´equation. Posons ψ(x) = (ϕ(x), ϕ0 (x), . . . , ϕ(k−1) (x)). En d´erivant ψ, on obtient ψ 0 (x) = (ϕ0 (x), ϕ00 (x), . . . , ϕ(k) (x)), et on voit que F (x, π1 (ψ(x)), ψ 0 (x)) = 0, puisque ϕ(x) n’est autre que π1 (ψ(x)), o` u π1 : Rn × . . . × Rn −→ Rn est la projection canonique sur le premier facteur. (I, ψ) est donc solution d’une ´equation du permier ordre, mais en contre-partie la dimension de l’espace dans lequel ψ prend ses valeurs est nk. R´eciproquement, si (I, ψ) est solution de l’´equation F (x, π1 (z), z 0 ) = 0, il suffit de poser ϕ(x) = π1 (ψ(x)), pour constater que (I, ϕ) est solution de F (x, y, y 0 , . . . , y (k) ) = 0.
1.6
Conditions initiales et solutions non prolongeables.
Si une solution de l’´equation y 0 = F (x, y) satisfait la relation y0 = ϕ(x0 ), pour un certain point (x0 , y0 ) de Γ, c’est-`a-dire si le graphe de la solution passe par le point (x0 , y0 ), on dira que (x0 , y0 ) est une condition initiale de la solution (I, ϕ).
y pp pp pp ppppp pp pp pp ppppp pp pp ppppp pp pp pp ppppp pp pp ppppp pp pp ppppp p 6 pp ppppppp pp pppp ppppp pp pp ppp p p p pp pppp p pp ppp
Γ
p p ppp p pp p pp ppp pp pppp p ppppp pp pppp p p pp pp p p ppp pp ppp pp pp ppp ppp p• pp p ppp pppp ppp p ppp (x , y ) p 0 0 pp ppppp p pp p p ppp pppp pp ppp p p p ppp pppp ppp ppp pppp pp p ppp pppp p p p p p p p pp p p p pp ppp pppp p pppppp pp ppp pp p p p pp pppp p p p pp pp pppp pp ppppppppppppp p p p p ppppppppppppp pp ppppp pp pp pp pp pp ppppp ppppp pp pp ppppp pp pp pp pp pp ppppp pp ppppp pp pp ppppp pp pp ppppp pp pp ppppppp
-x
I
Notez qu’une solution a en g´en´eral de nombreuses conditions initiales possibles. Si (I, ϕ) et (I 0 , ϕ0 ) sont deux solutions d’une ´equation diff´erentielle, on dira que (I 0 , ϕ0 ) prolonge (I, ϕ) (ou que (I 0 , ϕ0 ) est un prolongement de (I, ϕ) ), si I est inclus dans I 0 et si la restriction de ϕ0 `a I est ϕ. Si une solution (I, ϕ) n’admet pas d’autre prolongement qu’elle mˆeme, on dit que c’est une solution non prolongeable, ou maximale. La figure ci-contre repr´esente le domaine Γ de la fonction F , et une solution non prolongeable de condition initiale (x0 , y0 ). Elle montre aussi l’intervalle I de d´efinition de cette solution. Notez que le graphe de la solution se trouve tout entier dans Γ.
Equations Diff´ erentielles.
1.7
5
Exemple.
Consid´erons l’´equation (autonome) tr`es simple suivante : y 0 = y. On a ici (avec les notations ci-dessus) F (x, y) = y. La fonction F est d´efinie sur Γ = R × R (ici n = 1). Toutes les fonctions x 7→ aex (pour a quelconque dans R) sont des solutions ´evidentes de cette ´equation. Ces fonctions sont d´efinies sur R tout entier, et sont donc des solutions non prolongeables, puisque qu’il n’y a pas dans R d’intervalle plus grand que R. On d´emontrera plus loin (en utilisant le th´eor`eme de Cauchy–Lipschitz), qu’on a l`a toutes les solutions non prolongeables de cette ´equation.
1.8
Interpr´ etation g´ eom´ etrique.
L’´equation diff´erentielle y 0 = F (x, y) peut s’interpr´eter comme un champ de vecteurs sur le domaine Γ de d´efinition de F . En effet, Γ est un ouvert de R × Rn , et F une application de Γ vers Rn . La fonction (x, y) 7→ (1, F (x, y)) n
est alors une application de Γ vers R × R , autrement-dit, une application qui `a chaque point de Γ fait correspondre un vecteur de l’espace vectoriel dont Γ est un ouvert. Une telle application s’appelle un champ de vecteurs sur Γ. Une solution (I, ϕ) a pour graphe une courbe trac´ee dans Γ, et en chaque point (x, y) de cette courbe, le vecteur correspondant du champ (de composantes 1 et F (x, y) ) est tangent `a la courbe. C’est exactement ce que nous dit l’´egalit´e ϕ0 (x) = F (x, ϕ(x)) quand on la lit comme suit (1, ϕ0 (x)) = (1, F (x, ϕ(x))), autrement-dit “vecteur tangent au graphe de ϕ ´egale vecteur du champ”. Le graphe de ϕ s’appelle une courbe int´egrale du champ de vecteurs. Le probl`eme de la recherche des courbes int´egrales des champs de vecteurs (dans des ouverts de Rn , et plus g´en´eralement sur des vari´et´es diff´erentielles) est donc le pendant g´eom´etrique de la th´eorie des ´equations diff´erentielle ordinaires.
2
Le th´ eor` eme de Cauchy–Lipschitz.
2.1
Condition de Lipschitz.
´finition. Une fonction de deux variables F : Γ −→ Rn (o` De u Γ est un ouvert de R × Rn ), est dite lispchitzienne par rapport `a la seconde variable, s’il existe un r´eel k, tel que ∀x ∈ R ∀y1 ∈ Rn ∀y2 ∈ Rn (x, y1 ) ∈ Γ ∧ (x, y2 ) ∈ Γ ⇒ kF (x, y1 ) − F (x, y2 )k ≤ kky1 − y2 k. Si tout point de Γ a un voisinage dans lequel la fonction F est lipschitzienne par rapport `a la seconde variable, on dira que F est localement lipschitzienne sur Γ (k peut alors varier d’un voisinage `a l’autre). ∂F est continue sur Γ, alors la fonction F est loca∂y lement lipschitzienne par rapport `a la seconde variable sur Γ. Cela r´esulte imm´ediatemment du th´eor`eme de la moyenne. On remarquera que si la d´eriv´ee partielle D2 (F ) =
6
Equations Diff´ erentielles.
Ce crit`ere est tr`es utile en pratique, car la v´erification qu’une d´eriv´ee partielle est continue, se fait la plupart du temps par simple inspection.
2.2
´ Enonc´ e du th´ eor` eme et utilisation.
´ore `me. (Cauchy–Lipschitz) Soit Γ, un ouvert de R × Rn , et F : Γ −→ Rn une fonction continue, The localement lipschitzienne par rapport `a sa seconde variable. Soit (x0 , y0 ) un point quelconque de Γ. Alors il existe une unique solution non prolongeable (I, ϕ) de l’´equation y 0 = F (x, y), de condition initiale (x0 , y0 ). Nous d´emontrerons le th´eor`eme de Cauchy–Lipschitz plus loin. Ce faisant, nous obtiendrons les sous– produits suivants : ´ore `me. (version locale du pr´ec´edent) Soit Γ, un ouvert de R × Rn , et F : Γ −→ Rn une fonction The continue, localement lipschitzienne par rapport `a sa seconde variable. Soit (x0 , y0 ) un point quelconque de Γ. Alors il existe une solution (I, ϕ) de l’´equation y 0 = F (x, y), de condition initiale (x0 , y0 ) (o` u I est donc un voisinage de x0 ). Lemme. Sous les hypoth`eses du th´eor`eme de Cauchy–Lipschitz , deux solutions de mˆeme condition initiale sont ´egales sur l’intersection de leur domaines. En attendant, nous montrons par des exemples comment on peut utiliser ce th´eor`eme. Revenons sur l’´equation y 0 = y. Nous avons vu que les fonctions x 7→ aex d´efinies sur R tout entier en sont des solutions maximales. Dans cette situation, la fonction F est d´efinie par F (x, y) = y. Elle est ∂F continue, et sa d´eriv´e partielle par rapport `a la seconde variable est (x, y) 7→ (x, y) = 1, autrement-dit ∂y une fonction constante, donc continue sur R×R tout entier. On prend alors Γ = R×R, pour l’application du th´eor`eme de Cauchy–Lipschitz, ce qui montre que par tout point (x0 , y0 ) du plan passe une unique solution maximale. Or il est clair que la fonction x 7→ (y0 e−x0 )ex , qui est une de nos solutions maximales a un graphe qui passe par (x0 , y0 ). Comme d’apr`es le th´eor`eme une telle solution est unique, il est clair qu’on a toutes les solutions maximales. Voici un autre exemple plus d´elicat. Consid´erons l’´equation diff´erentielle 2
y 0 = 3y 3 . 2
Dans ce cas, la fonction F est (x, y) 7→ 3y 3 . Elle est continue sur R×R. Par contre, sa d´eriv´ee par rapport 1 `a la seconde variable est (x, y) 7→ 2y − 3 , qui n’est pas continue pour y = 0 (comme on va le voir un peu plus loin elle n’est pas non plus localement lipschitzienne au voisinage des points de la forme (x, 0) ). On se contentera donc d’appliquer le th´eor`eme de Cauchy–Lipschitz dans les deux ouverts suivants : Γ = {(x, y) | y > 0}
et
Γ0 = {(x, y) | y < 0}.
En faisant la “cuisine” de s´eparation des variables qu’on expliquera plus loin, on trouve que les fonctions y = (x − a)3 (o` u a varie dans R) d´efinies sur R, sont des solutions de l’´equation.
Equations Diff´ erentielles.
7
La figure ci-contre montre quelques unes des fonctions de cette famille. Toutefois, on notera que la fonction x 7→ 0 (d´efinie sur tout R) est aussi solution de l’´equation. Remarquons que pour x = a, la fonction x 7→ (x−a)3 vaut 0 (ainsi que sa d´eriv´ee). On voit donc que cette fonction et la fonction nulle sont deux solutions maximales distinctes de mˆeme condition initiale (a, 0). Ceci montre que le th´eor`eme de Cauchy–Lipschitz ne saurait s’appliquer dans le plan tout entier, et donc que la fonction F n’est pas localement lipschitzienne dans tout le plan (ce qui pouvait aussi se voir directement par une ´etude de cette fonction). Mais il y a encore d’autres solutions maximales que celles d´ecrites ci-dessus. En effet, pour tous r´eels a et b, tels que a < b, la remarque pr´ec´edente montre que la fonction d´efinie par (x − a)3 0 x 7→ (x − b)3
pp pp pppp pp ppp ppp p pp p p p ppp pp ppp pp pp pp pp p ppp p ppp p p p p pp pppp pppp ppppp ppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppp ppppppppp - x p p p p p p p p p p p p p p pp pppp pppp pppp pppp p pp p pp ppp pp pp pp pp p p ppp ppp pp ppp pppp ppppp pp p pp pp pppp pp p pp pp
yppp p pp 6 pp
si x ≤ a si a ≤ x ≤ b si b ≤ x
est encore une solution maximale. Exercice.Montrer qu’on les a maintenant toutes (en supposant a et b dans R).
3
Techniques de r´ esolution.
Ces techniques permettent en g´en´eral de trouver des formules d´ecrivant des solutions de l’´equation donn´ee. Une fois ces formules obtenues, une ou plusieurs applications du th´eor`eme de Cauchy–Lipschitz permettent de savoir si on les a toutes, comme on l’a illustr´e pr´ec´edemment. Le cas des ´equations lin´eaires sera trait´e dans des sections ult´erieures.
´ Equations ` a variables s´ eparables.
3.1
Il s’agit d’´equations de la forme (avec y une fonction inconnue prenant ses valeurs dans R) y0 =
F (x) , G(y)
(ou de la forme y 0 = F (x)G(y) ), qui s’´ecrivent encore G(y)y 0 = F (x). N’oublions pas que y est une fonction de x, et prenons des primitives des deux membres. On obtient Z Z 0 G(y)y dx = F (x)dx + C, Z soit
Z G(y)dy =
F (x)dx + C. Cette derni`ere forme rend possible le calcul de l’int´egrale du premier
membre, mˆeme si on ne connait pas la fonction y. En d´esignant donc par G et F des primitives respectives de G et F , on obtient G(y) = F(x) + C, soit en principe la famille de solutions y = G −1 (F(x) + C). 2
Les ´equations y 0 = y et y 0 = 3y 3 sont bien sˆ ur `a variables s´eparables, de mˆeme que toute ´equation autonome dont la fonction inconnue est `a valeurs dans R. Voici un exemple montrant comment une ´equation tr`es simple peut r´esoudre un probl`eme physique apparemment complexe.
8
Equations Diff´ erentielles.
3.2
Probl` eme de la chaˆınette.
Supposons qu’un cable soit tendu entre deux points A et B. Il pend alors dans un plan vertical, et nous d´esirons savoir quelle forme il prend, autrement-dit de quelle fonction il dessine le graphe.
BM −F0 6 −V0 B B B B B B B Bprpp A p −H0 ppppp
En prenant des coordonn´ees dans le plan du cable, on peut supposer que le point A est `a l’abscisse 0. Consid´erons la partie du cable situ´ee entre les abscisses 0 et x. Ce corps solide est en ´equilibre. Il y a trois forces qui agissent sur lui : la tension Fx du cable au point d’abscisse x, son poids Px , et la r´eaction du pylone en A, qui est clairement −F0 (faire tendre x vers 0). On a donc
pp pp ppp pp Vx B Fx pp ppp r ppp 6ppppppp ppp p ppp p p ppp 6 pppppppp r ppp ppppp pppppprp p p ppppppp p p Hx pppppppppppp pppppppp ppppppp pp pppppppppppppp pp ppp pp pp p
0
? Px
Fx + Px = F0 .
-
En d´ecomposant cette ´equation en composante horizontale et composante verticale, on constate tout de suite que H0 = Hx pour tout x, c’est-`a-dire que la composante horizontale de la tension du cable est contante le long du cable. Il nous reste donc une seule ´equation int´eressante, qui est la suivante :
x
Vx + Px = V0 .
Bien sˆ ur, la tension Fx du cable est un vecteur tangent au cable. Il s’en suit que Vx = y 0 Hx = y 0 H0 , o` u y est la fonction inconnue dont le cable dessine le graphe. Par ailleurs, le poids Px est proportionnel `a la longueur de cable entre les abscisses 0 et x. On a donc Px = −ρLx , o` u Lx est cette longueur. Mais Lx se calcule par la formule bien connue Z xq 2 Lx = 1 + (y 0 (t)) dt. 0
On a donc l’´equation “int´egrale” suivante Z 0
x
q 2
1 + (y 0 (t)) dt = V0 .
y H0 + ρ 0
En d´erivant cette ´equation, on obtient l’´equation diff´erentielle ρ p y 00 = − 1 + (y 0 )2 H0 qui est une ´equation du premier ordre de fonction inconnue y 0 , puisqu’elle ne fait pas intervenir y. Cette ´equation est `a variables s´eparables, et on trouve tout de suite Z Z ρ dy 0 p =− dx + C, H0 1 + (y 0 )2 ρ ρ H0 ρ x + C. On en d´eduit y 0 = sh(− x + C), puis y = − ch(− x + C) + D. H0 H0 ρ H0 Bien sˆ ur les constantes C et D peuvent ˆetre calcul´ees quand on connait les positions des points A et B. soit Arg sh(y 0 ) = −
Equations Diff´ erentielles.
9
En conclusion, la position du cable est compl`etement d´etermin´ee par les positions de ces deux points, la masse du cable par unit´e de longueur (masse lin´eique) et la composante horizontale de la tension. Si le tablier d’un pont est suspendu au cable, on peut supposer que le poids du cable est n´egligeable devant le poids du pont. Le probl`eme se r´esoud de la mˆeme fa¸con `a ceci pr`es que Lx devient une fonction lin´eaire de x. L’´equation est encore plus simple, et on trouve que le cable prend la forme d’une parabole.
3.3
Mouvement dans un champ d’attraction newtonien.
Un corps mobile (la terre) se d´eplace dans le champ d’attraction cr´e´e par un corps fixe (le soleil). La force d’attraction exerc´ee sur le corps mobile est colin´eaire `a l’axe des deux corps, et son module est donn´e par la loi de Newton : kmm0 F = d2 o` u d est la distance des deux corps, m et m0 leurs masses, et k une constante. L’accel´eration du corps mobile est donc elle aussi port´ee par la droite OM , o` u on note M le corps mobile, et O le corps fixe. ~ la vitesse du corps mobile (d´eriv´ee du vecteur OM ~ Les deux corps sont assimil´es `a des points. Soit V ~ par rapport au temps), et ~γ son acc´el´eration (d´eriv´ee de V par rapport au temps). ~ ∧V ~ , on obtient V ~ ∧V ~ + OM ~ ∧ ~γ = 0, car ~γ est port´e par la droite En d´erivant le produit vectoriel OM OM . ~ ∧V ~ est constant. On peut supposer que cette constante est non nulle. Il en r´esulte que le vecteur OM ~ et V ~ est nul, ou si ces deux vecteurs sont En effet, elle ne peut ˆetre nulle que si l’un des vecteurs OM ~ ~ est nul, la terre est immobile, si OM ~ colin´eaires. Si OM est nul, la terre est confondue avec le soleil, si V ~ et V sont colin´eaires, la terre se dirige droit vers le soleil. Tous ces cas particuliers sont exclus. ~ est donc constamment orthogonal `a un vecteur constant, ce qui fait que le mouvement a lieu dans OM un plan. Nous prenons dans ce plan un rep`ere fixe dont l’origine se trouve `a l’emplacement du corps fixe. Nous prenons ´egalement un rep`ere mobile dont l’origine se trouve `a l’emplacement du corps mobile, et ~ . Ces rep`ere sont suppos´es orthonorm´es et de sens direct. En dont le premier vecteur est colin´eaire `a OM appelant ρ et θ les coordonn´ees polaires du corps mobile dans le rep`ere fixe, on voit que le rep`ere mobile se d´eduit du rep`ere fixe par une rotation d’angle θ et une translation. ~ ,V ~ et ~γ dans le rep`ere fixe. Nous en d´eduisons Nous pouvons calculer les coordonn´ees des vecteurs OM les coordonn´ees de ces mˆemes vecteurs dans le rep`ere mobile en leur faisant subir une rotation d’angle −θ. Les d´eriv´ees premi`ere et seconde par rapport au temps sont respectivement not´ees avec un point et deux points au dessus de l’expression `a d´eriver.
~ OM ~ V
~γ
rep`ere fixe
rep`ere mobile
x = ρ cos(θ)
ρ
y = ρ sin(θ)
0
x˙ = ρ˙ cos(θ) − ρθ˙ sin(θ)
ρ˙
y˙ = ρ˙ sin(θ) + ρθ˙ cos(θ)
ρθ˙
¨ sin(θ) x ¨ = (¨ ρ − ρθ˙2 ) cos(θ) − (2ρ˙ θ˙ + ρθ)
ρ¨ − ρθ˙2
¨ cos(θ) y¨ = (¨ ρ − ρθ˙2 ) sin(θ) + (2ρ˙ θ˙ + ρθ)
2ρ˙ θ˙ + ρθ¨
~ et ~γ colin´eaires), on a 2ρ˙ θ˙ + ρθ¨ = 0. En d´erivant l’expression Comme l’accel´eration est centrale (OM 2˙ 2¨ ˙ A = ρ θ, on trouve 2ρρ˙ θ + ρ θ, c’est-`a-dire 0. L’expression ρ2 θ˙ est donc constante. Cette expression est le
10
Equations Diff´ erentielles.
double de la vitesse ar´eolaire. Sa constance exprime le fait que l’aire balay´ee par le segment OM augmente lin´eairement avec le temps. Appliquons maintenant la loi de la m´ecanique (F~ = m~γ ), qui se r´esume ici, compte tenu de ce que nous avons d´ej`a ´etabli, `a la formule kmm0 + m(¨ ρ − ρθ˙2 ) = 0. ρ2 On peut diviser par m, ce qui montre que la masse du corps mobile n’intervient pas dans la A2 d´etermination de la trajectoire (Galil´ee), poser K = km0 , et remarquer que ρθ˙2 = 3 , ce qui nous ρ laisse avec l’´equation diff´erentielle : ρK − A2 + ρ3 ρ¨ = 0. Recherchons l’´equation polaire de la trajectoire sous la forme ρ=
1 . f (θ)
˙ 0 (θ) θf ˙ 00 (θ) = −A2 f 2 (θ)f 00 (θ). En reportant dans = −Af 0 (θ), puis ρ¨ = −Aθf f 2 (θ) l’´equation diff´erentielle, on obtient l’´equation lin´eaire du second ordre `a coefficients constants avec second membre suivante : K f + f 00 = 2 . A On a alors ρ˙ = −
L’´equation sans second membre a pour solution g´en´erale f (θ) = α cos(θ + ϕ). K Par ailleurs, la constante 2 est solution particuli`ere de l’´equation avec second membre. On en d´eduit A donc la solution g´en´erale suivante : 1 K = 2 + α cos(θ + ϕ). ρ A Quitte `a changer de rep`ere par rotation, on peut supposer ϕ = 0. En multipliant par ρ, en isolant le K terme ρ 2 dans un membre, et en ´elevant au carr´e (en se souvenant que ρ2 = x2 + y 2 et x = ρ cos(θ)), A on obtient K2 (x2 + y 2 ) 4 = (1 − αx)2 A ce qui constitue l’´equation d’une conique (polynˆome du second degr´e en x et y).
3.4
´ Equations homog` enes.
L’´equation y 0 = F (x, y) est homog`ene, si la fonction F elle-mˆeme est homog`ene de degr´e 0, c’est-`a-dire si F (tx, ty) = F (x, y), pour tous t, x et y. y , on obtient une ´equation `a variables s´eparables. x En effet, en rempla¸cant y par ux dans l’´equation, on a u + u0 x = F (x, ux) = F (1, u), soit En introduisant la nouvelle fonction inconnue u =
u0 x = F (1, u) − u.
Equations Diff´ erentielles.
11
Remarquer que si le r´eel u0 v´erifie F (1, u0 ) − u0 = 0, la fonction constante u = u0 est solution de cette ´equation, et donc que la fonction lin´eaire y = u0 x est solution de l’´equation homog`ene. Par exemple, l’´equation
p
x2 − y 2 + y x p x2 − y 2 + y est homog`ene. La fonction F d´efinie par F (x, y) = n’est d´efinie que pour x 6= 0 et |x| ≥ |y|. x Sur le domaine Γ = {(x, y) | |x| > |y|}, elle est continue et d´erivable par rapport `a y. Le th´eor`eme de Cauchy–Lipschitz y est donc applicable. Remarquer que les deux droites d’´equations y = ±x, qui bordent ce domaine, sont des solutions (maximales sur R− et sur R+ ). 0
y =
Posons maintenant y = ux, on obtient en s´eparant les variables √ ppppp pppp p ppppp ppp p p p pp ppp pp ppp ppp p p p ppp ppp pp pp pp ppp ppp ppp pppp pp p pp ppp 6 pp y pppp pp ppp ppp pp pp pp pp ppp p p ppp ppp p p ppp ppp ppp pp pp pp pppp ppp ppp ppp pp p pp ppp pp pppp pp pp pp p p ppp p ppppppppppppppp ppppp pp @pp pp p@ p
e−π/2 @
3.5
-x
eπ/2
du dx = , x 1 − u2
soit Arc sin(u) = ln|x| + C, avec −1 ≤ u ≤ 1, et π π donc − ≤ ln(x) + C ≤ . En revenant `a y = 2 2 ux, on trouve y = x sin(ln|x| + C). y Par ailleurs, (x, y) ´etant donn´e dans Γ, on a < 1, donc x π y = x sin(α) pour un certain α compris entre − 2 π et , qui peut ´evidemment ˆetre mis sous la forme 2 ln|x| + C, pour un C convenable. Par exemple, pour la solution passant en (1, 0), on a α = 0, et ln(x) = 0, donc C = 0. La solution est y = x sin(ln(x)), pour x entre e−π/2 et eπ/2 . Entre 0 et e−π/2 cette solution se prolonge par y = −x, et entre eπ/2 et +∞, par y = x. Toutes les solutions maximales sur R+ sont de ce type.
´ Equation de Bernoulli.
L’´equation de Bernoulli est de la forme y 0 + p(x)y = q(x)y n , 1 on se ram`ene `a une ´equation lin´eaire. En effet, en divisant par y n , on obtient y n−1 y0 (1 − n)y 0 0 = q(x) − up(x). Par ailleurs, u = , d’o` u l’´equation lin´eaire yn yn En posant u =
u0 = (1 − n)(q(x) − up(x)).
3.6
´ Equation aux diff´ erentielles totales.
Si (x, y) 7→ h(x, y) est une fonction de deux variables d´efinie dans un certain domaine O (par exemple la pression athmosph´erique en chaque point d’un territoire), le gradient de h en un point de O est d´efini
12
Equations Diff´ erentielles.
par grad(h) = (
∂h ∂h , ). ∂x ∂y
Le gradient repr´esente en un point donn´e la direction dans laquelle la pression augmente le plus vite, et mesure la vitesse de cette augmentation. Les courbes du domaine O sur lesquelles la pression est constante (lignes isobares ou plus g´en´eralement lignes de niveau), ont pour ´equations h(x, y) = C, o` u C est une constante. Si x 7→ (x, y(x)) est une ´equation d’une courbe isobare, on a en d´erivant h(x, y(x)) = C ∂h ∂h (x, y) + y 0 (x, y) = 0, ∂x ∂y soit une ´equation diff´erentielle des lignes isobares. Une telle ´equation s’appelle une ´equation aux diff´erentielles totales, et a pour solutions les courbes d’´equations intrins`eques h(x, y) = C. Bien sˆ ur, la difficult´e est de trouver la fonction h, car en g´en´eral, l’´equation est donn´ee sous la forme P (x, y) + y 0 Q(x, y) = 0. En fait, r´esoudre une ´equation aux diff´erentielles totales correspond au probl`eme physique consistant `a d´eterminer un potentiel quand on en connait le gradient. La solution consiste, une fois qu’on a fix´e arbitrairement le potentiel `a 0 en un point (x0 , y0 ) `a calculer la circulation du gradient le long d’une courbe joignant (x0 , y0 ) `a (x, y). On obtient ainsi la valeur du potentiel en (x, y). Une condition n´ecessaire et suffisante pour qu’il existe localement une fonction h dont les d´eriv´ees partielles soient P et Q, c’est-`a-dire, pour que (P, Q) soit localement un gradient, est que ∂Q ∂P = . ∂x ∂y Elle est n´ecessaire par le lemme de Schwarz sur la sym´etrie des d´eriv´ees secondes, et suffisante pour la raison suivante. Posons :
Z
Z
x
h(x, y) =
y
P (t, y)dt + x0
Q(x0 , t)dt, y0
qui repr´esente la circulation du champ (P, Q) le long des segments de droite joignant le point (x0 , y0 ) au point (x0 , y), et ce dernier `a (x, y). En effet, il suffit de d´eriver cette expression par rapport `a x, ce qui donne ∂h = P (x, y), ∂x puis par rapport `a y, ce qui donne ∂h ∂y
Z
x
∂P (t, y)dt + Q(x0 , y) x0 ∂y Z x ∂Q = (t, y)dt + Q(x0 , y) x0 ∂x = Q(x, y) − Q(x0 , y) + Q(x0 , y) =
= Q(x, y). Bien sˆ ur, ce calcul n’est valable que si les segment en question sont inclus dans le domaine O. Note : ce que nous venons de d´emontrer est un cas particulier d’un lemme tr`es important en g´eom´etrie diff´erentielle, connu sous le nom de lemme de Poincar´e.
Equations Diff´ erentielles.
4
13
D´ emonstration du th´ eor` eme de Cauchy–Lipschitz. Consid´erons une ´equation du premier ordre “r´esolue en y 0 ” : y 0 = F (x, y),
o` u la fonction inconnue y de la variable x est `a valeurs dans Rn . Soit (x0 , y0 ) un point du domaine ouvert Γ sur lequel F est d´efinie.
4.1
Une ´ equation int´ egrale.
Lemme. (I, ϕ) est solution de l’´equation diff´erentielle y 0 = F (x, y), avec condition initiale (x0 , y0 ) (avec x0 dans I), si et seulement si elle v´erifie Z x ϕ(x) = y0 + F (t, ϕ(t))dt, x0
pour tout x dans I. En effet, si ϕ satisfait l’´equation int´egrale ci-dessus, alors ϕ(x0 ) = y0 . Par ailleurs, le membre de droite de cette ´equation est clairement d´erivable. Il en est donc de mˆeme du membre de gauche, c’est-`a-dire de ϕ. En d´erivant les deux membres, on trouve ϕ0 (x) = F (x, ϕ(x)). R´eciproquement, en int´egrant ϕ0 entre x0 et x, on trouve imm´ediatemment que ϕ satisfait l’´equation int´egrale. 2 Nous passons maintenant `a la d´emonstration du th´eor`eme de Cauchy–Lipschitz.
4.2
Un op´ erateur contractant.
Comme Γ est ouvert, il existe un pav´e P compact de la forme [x0 − η, x0 + η] × B(y0 , ε) (o` u B(y0 , ε) est la boule ferm´ee de centre y0 et de rayon ε) d’int´erieur non vide (c’est-`a-dire, avec η et ε strictement positifs), et contenu dans Γ.
y pp pp pp ppppp pp pp ppppp pp pp pp ppppp pp pp ppppp pp pp pp ppppp pp pp ppppp p 6 pppp ppppp pp pp ppppp pp pp pp ppp p pp ppppp p p p p p p p pp p p p p p ppp pp Γ p 6 ppp ppp ppp
pppp p pp p ppp ppp pppp p ppp p ppp 2ε ppp pppp (x0 , y0 ) ppp pppp p ppp ppp p ppp pp ? p ppp p p ppp pp pppp 2η pppp p p ppppp p ppp pp pppp ppp p p p p p pp p pppp pppppp pp p p p p p p p p p p pp ppppp pp p ppp ppppp pp pp ppppp pp pp pp ppp pp pp pp ppppp pp pp ppppp pp pp pp ppppp pp pp ppppp pp
-x
Sur le pav´e P , qui est compact, la fonction F est born´ee par une constante M , et lipshitzienne de rapport k par rapport `a la seconde variable. L’id´ee de la d´emonstration est de montrer que quitte `a r´eduire ε et η (en fait, on ne va r´eduire que η), l’op´erateur A qui `a ϕ associe la fonction A(ϕ) suivante Z x x 7→ y0 + F (t, ϕ(t))dt, x0
est contractant, quand on le restreint aux fonctions continues sur ]x0 − η, x0 + η[ dont le graphe est inclus dans P , et passe par (x0 , y0 ). En appliquant alors le th´eor`eme du point fixe, on obtient un point fixe de cet op´erateur A, c’est-`a-dire une solution de l’´equation int´egrale, d´efinie dans un voisinage de x0 .
Notons donc E l’ensemble des fonctions continues d´efinies sur ]x0 − η, x0 + η[ dont le graphe est inclus dans P , et passe par (x0 , y0 ). Il s’agit d’un espace m´etrique pour la distance de la convergence uniforme. De plus il est complet.
14
Equations Diff´ erentielles.
Essayons donc de trouver ε et η pour que, d’une part A soit stable sur E (c”est–`a–dire, envoie E dans E), et soit d’autre part contractant. On doit satisfaire l’in´egalit´e : kA(ϕ)(x) − y0 k ≤ ε, pour tout x tel que |x − x0 | < η. Or Z
x
kA(ϕ)(x) − y0 k = k
F (t, ϕ(t))dtk ≤ |x − x0 |M. x0
Notez que pour majorer F (t, ϕ(t)) par M , on utilise le fait que le graphe de ϕ est inclus dans P . Il suffit ε donc de prendre η plus petit que . M Ensuite, nous devons rendre A contractante, c’est-`a-dire telle que : kA(ϕ) − A(ψ)k ≤ Kkϕ − ψk pour un K strictement plus petit que 1, o` u la norme est celle de la convergence uniforme sur l’intervalle ]x0 − η, x0 + η[. Pour cela, notons que pour x donn´e dans l’intervalle ]x0 − η, x0 + η[, on a Z x Z x kA(ϕ)(x) − A(ψ)(x)k = k (F (t, ϕ(t)) − F (t, ψ(t))) dtk ≤ kF (t, ϕ(t)) − F (t, ψ(t))kdt. x0
x0
Comme ϕ et ψ ont leur graphe dans P et F est lipschitzienne de rapport k par rapport `a la seconde variable, on a kA(ϕ)(x) − A(ψ)(x)k ≤ |x − x0 |k sup kϕ(t) − ψ(t)k ≤ ηkkϕ − ψk. t∈[x0 ,x]
Il suffit donc de prendre η strictement inf´erieur `a
1 , pour que A soit contractant de rapport K = ηk < 1. k
Nous avons donc prouv´e l’existence, pour tout (x0 , y0 ) de Γ, d’une solution de l’´equation de condition initiale (x0 , y0 ), et d´efinie dans un voisinage de x0 .
4.3
Unicit´ e locale.
Supposons maintenant que ϕ et ψ soient deux solutions de l’´equation diff´erentielle, toutes deux d´efinies dans un voisinage de x0 , et prenant la valeur y0 en x0 . Comme ϕ et ψ sont deux solutions de l’´equation d´efinies dans un voisinage de x0 (quitte `a r´eduire encore η, on peut supposer qu’elles sont toutes deux d´efinies dans ]x0 − η, x0 + η[, et quitte `a r´eduire encore un peu plus η, on peut supposer, comme elles sont continues, que leurs graphes sont contenus dans P ), elles sont n´ecessairement des points fixes de A. Comme A ne peut avoir qu’un seul point fixe, elles sont ´egales. On voit donc que deux solutions de mˆeme condition initiale (x0 , y0 ) sont n´ecessairement ´egales dans un voisinage de x0 . Il en r´esulte que deux solutions (I, ϕ) et (J, ψ) de mˆeme condition initiale (x0 , y0 ) sont ´egales sur l’intersection de leurs domaines I ∩ J. En effet, soit K le plus grand intervalle contenu dans I ∩ J, sur lequel les deux fonctions sont ´egales. Si K n’est pas ´egal `a I ∩J, par exemple si l’extr´emit´e sup´erieure x1 de K est strictement plus petite que l’extr´emit´e sup´erieure de I ∩J (qui peut ˆetre infinie), on a n´ecessairement x1 ∈ K, car les deux solutions sont continues. Soit y1 la valeur commune des deux solutions en x1 . En appliquant ce qui a ´et´e vu pr´ec´edemment, on voit que les deux fonctions doivent ˆetre ´egales dans un voisinage de x1 , ce qui est une contradiction.
Equations Diff´ erentielles.
4.4
15
Solutions maximales.
Consid´erons pour finir l’ensemble des toutes les solutions de l’´equation de condition initiale (x0 , y0 ). Soit I la r´eunion de tous les intervalles de d´efinition de ces solutions, et soit ψ la fonction d´efinie sur I par ψ(x) = ϕ(x), o` u ϕ est l’une quelconque des solutions de notre ensemble, dont le domaine de d´efinition contient x. Alors ψ est bien d´efinie, car deux solutions de mˆeme condition initiale sont ´egales sur l’intersection de leurs domaines. De plus (I, ψ) est clairement une solution maximale de l’´equation, de condition initiale (x0 , y0 ). Ceci termine la d´emonstration du th´eor`eme de Cauchy–Lipschitz. 2
5
Deux lemmes concernant les solutions.
5.1
Applications propres.
Soit (un ) une suite de R. Rappelons que lim un = ∞
n→∞
signifie ∀A > 0 ∃N ∈ N ∀n > N |un | > A. Remarquer que ceci peut encore s’´enoncer comme suit : une suite (un ) tend vers l’infini (de R) si et seulement si tout compact de R ne contient qu’un nombre fini de termes de la suite. Cette derni`ere fa¸con de voir les choses nous permet de g´en´eraliser la notion de “tendre vers l’infini”. Rappelons qu’un espace m´etrique E est dit localement compact, si pour tout point x de E, et tout voisinage V de x, il existe un voisinage compact de x contenu dans V . ´finition. Soit U une partie localement compacte de Rn , et (un ) une suite de U . On dit que (un ) De tend vers l’infini relativement `a U , si tout compact de U ne contient qu’un nombre fini de termes de la suite. On note ce fait comme suit lim un = ∞
n→∞
ou
lim un = ∞U
n→∞
pour ´eviter toute confusion. Par exemple, une suite de la boule ouverte de centre 0 et de rayon 1 de R2 tend vers l’infini relativement `a cette boule si la suite de ses modules tend vers 1. Par contre, s’il s’agit de la boule ferm´ee, aucune suite de cette boule ne peut tendre vers l’infini (relativement `a cette boule). Autrement-dit, un compact n’a pas d’infini. La raison pour laquelle on se restreint aux partie localement compactes de Rn est la suivante : Lemme. Soit U une partie localement compacte de Rn , et (un ) une suite de U . Les deux ´enonc´es suivants sont ´equivalents : – la suite (un ) tend vers l’infini de U , – la suite (un ) n’a pas de point d’accumulation dans U . En effet, si (un ) a un point d’accumulation l dans U , il existe un voisinage compact de l, et celui–ci contient une infinit´e de points de la suite. R´eciproquement, si la suite (un ) ne tend pas vers l’infini de U , alors il existe un compact K dans U , contenant une infinit´e de points de la suite. La suite a alors un point d’accumulation dans K, c’est–`a–dire dans U . 2
16
Equations Diff´ erentielles.
Dans la suite, nous dirons espace localement compact pour d´esigner une partie localement compact d’un Rn (sans pr´ecision sur n). ´finition. Soient U et V deux espaces localement compacts, et f une application continue de U vers De V . On dit que f est propre, si “f respecte l’infini”, c’est-`a-dire, si lim un = ∞U ⇒ lim f (un ) = ∞V .
n→∞
n→∞
Cette implication sera aussi not´ee lim f (x) = ∞
x→∞
ou
lim f (x) = ∞V
x→∞U
pour ´eviter toute confusion. On notera que ∞U n’est pas un point de Rn . En fait ∞U n’a pas de sens pris isol´ement. Par exemple, la 1 suite de nombres r´eels n 7→ (−1)n (1 − tend vers ∞]−1,1[ . Or, elle admet (dans R) 1 et −1 comme points n d’accumulation. Pour pouvoir voir ∞U comme un point, il faut construire le compactifi´e d’Alexandroff de U . Si U est une partie de Rn , cet espace ne peut en g´en´eral pas ˆetre vu comme une partie de Rn . Lemme. Une application f : U −→ V entre espaces localement compacts est propre si et seulement si pour tout compact K de V , f −1 (K) est compact. Supposons f propre. Soit K un compact de V . Si f −1 (K) n’´etait pas compact, il existerait une suite (un ) de f −1 (K) sans point d’accumulation dans f −1 (K). Si cette suite n’a pas de point d’accumulation dans U , elle tend vers ∞U . Son image tend donc vers ∞V , ce qui est impossible, car son image est dans le compact K. Si cette suite a un point d’accumulation l, il ne peut pas ˆetre dans f −1 (K). L’image de la suite tend alors vers f (l), qui ne peut pas ˆetre dans K. C’est impossible, puisque K est ferm´e dans V . R´eciproquement, supposons que pour tout compact K de V , f −1 (K) soit compact. Soit (un ) une suite de U tendant vers ∞U . Si la suite image ne tendait pas vers ∞V , il existerait un compact K de V contenant une sous–suite de la suite image. Ceci signifierait que f −1 (K) contient une infinit´e de termes de la suite (un ), ce qui contredit le fait qu’elle tende vers ∞U . 2 Lemme. Soient U et V deux espaces localement compacts. Pour que la suite ((un , vn )) tende vers ∞U ×V , il suffit que (un ) tende vers ∞U ou que (vn ) tende vers ∞V . Supposons par exemple que (un ) tend vers ∞U . Soit K un compact de U × V . La projection de π1 (K) de K sur le facteur U est un compact, car la projection est continue. π1 (K) ne contient donc qu’un nombre fini de termes de la suite (un ). Il en r´esulte imm´ediatement que K ne contient qu’un nombre fini de termes de la suite ((un , vn )). 2 La r´eciproque est fausse, comme le montre la suite de R × R d´efinie par : (n, 0) si n est pair, (un , vn ) = (0, n) si n est impair. Par contre, on a la “presque r´eciproque” suivante : Lemme. Soient U et V deux espaces localement compacts. Soit (un ) une suite convergente de U , et soit (vn ) une suite de V . Pour que la suite ((un , vn )) tende vers ∞U ×V , il faut et il suffit que la suite (vn ) tende vers ∞V . Compte tenu du lemme pr´ec´edent qui prouve d´ej`a le “il suffit”, il suffit de montrer que si ((un , vn )) tend vers ∞U ×V , alors (vn ) tend vers ∞V .
Equations Diff´ erentielles.
17
S’il n’en ´etait pas ainsi, la suite (vn ) aurait une sous–suite (vp(n) ) convergente (o` u p est une injection croissante de N vers N). Comme la suite (up(n) ) est elle aussi convergente, il en r´esulte que la suite ((un , vn )) a une sous–suite convergente, ce qui ne se peut pas. 2
5.2
Comparaison de deux solutions.
Nous allons maintenant montrer que deux solutions d’une ´equation diff´erentielle satisfaisant les hypoth`eses du th´eor`eme de Cauchy–Lipschitz, ne peuvent pas s’´eloigner trop rapidement l’une de l’autre. Lemme. Soient (I, ϕ) et (I, ψ) deux solutions de l’´equation diff´erentielle y 0 = F (x, y), d´efinies sur le mˆeme intervalle I, o` u y est `a valeurs dans Rn , et o` u F (suppos´ee continue) satisfait kF (x, y1 ) − F (x, y2 )k ≤ kky1 − y2 k, pour tous couples (x, y1 ) et (x, y2 ) dans un domaine Γ contenant les graphes des deux solutions. Soient x et x0 deux points de I. On a alors kϕ(x) − ψ(x)k ≤ kϕ(x0 ) − ψ(x0 )kek|x−x0 | .
y 6
pppppppp p ppppppppp p pppppppp pp p p p p p p p pp pppppp pp ppppppppp ppppppp p ψ pp p p p p p p p p p p pp p p p p p pp ppppppp p p p p p p pp p p p p p p p pp p p pppppp p p p ppp p p p p p pppp ppppppppppppppppppppp p p p p p p p p p p p p p p p p p p p p p pp pp ppppppppppppppppp p ppp p pp ppppppppppppppp ϕ pp pp pp p pppppppppppp p p p p p p p p p p ppp ppp ppp ppp p p p p p p p p p p p p pp ppppppppppppp pp p p p p pp p p pppppp p ppp ppp pppppp ppp pp pp pp pp pp pp
x0
Posons h(x) = kϕ(x) − ψ(x)k. Les graphes de ϕ et de ψ ne pouvant pas se rencontrer en vertu du th´eor`eme de Cauchy–Lipschitz (sauf si ϕ = ψ, mais dans ce cas le r´esultat est trivial), on a h(x) > 0 pour tout x de I. Par ailleurs, h(x)
-x
x
= kϕ(x) − ψ(x)k = kϕ(x0 ) − ψ(x0 ) + Z x (F (t, ϕ(t)) − F (t, ψ(t)))dtk x0 Z x ≤ h(x0 ) + k h(t)dt . x0
(La valeur Z x absolue autour de l’int´egrale est n´ecessaire car x − x0 peut ˆetre n´egatif.) Posons H(x) = h(t)dt , ce qui donne H 0 (x) = kh(x), et h(x) ≤ H(x). Noter que H(x0 ) = h(x0 ). H satisfait h(x0 ) + k x0
donc l’in´equation diff´erentielle suivante (on peut diviser par H(x) qui est toujours strictement positif) : H 0 (x) ≤ k. H(x) H(x) En int´egrant entre x0 et x, on obtient ln ≤ k|x − x0 |, c’est–`a–dire H(x) ≤ H(x0 )ek|x−x0 | , donc H(x0 ) h(x) ≤ h(x0 )ek|x−x0 | . 2
5.3
Caract´ erisation des solutions maximales.
Le corollaire suivant traduit l’id´ee que si une solution est maximale, alors quand x tend vers l’une des extr´emit´es du domaine de d´efinition de la solution, le point (x, ϕ(x)) tend vers la “fronti`ere”, o` u l’“infini” de Γ.
18
Equations Diff´ erentielles.
Corollaire. Sous les mˆemes hypoth`eses que pour le th´eor`eme de Cauchy–Lipschitz, une solution (I, ϕ) de l’´equation diff´erentielle : y 0 = F (x, y) est maximale (pour le domaine Γ de F ) si et seulement si l’application x 7→ (x, ϕ(x)) de I vers Γ est propre.
Supposons d’abord que x 7→ ϕ(x) = (x, ϕ(x)) soit propre de I vers Γ, que par exemple I soit de la forme ]a, b[ avec b r´eel, et que la solution ϕ puisse ˆetre prolong´ee `a droite (i.e : au del`a de b). Soit (xn ) une suite croissante de I tendant vers b. Comme ϕ peut ˆetre prolong´ee au del`a de b, la suite de points de Γ : (ϕ(xn )) tend vers une limite qui est un point de Γ. Mais ceci contredit le fait que ϕ soit propre. R´eciproquement, supposons que (I, ϕ) soit une solution maximale. Si ϕ n’est pas propre, il existe une suite (xn ) dans I tendant vers l’une des extr´emit´es de I, et telle que la suite (ϕ(xn )) converge vers un point (x0 , y0 ) de Γ (figure ci-contre).
y 6 pppppppppppppϕ ppppppppppppp p pppppppppppp ppppppppppppp pppppppppppp ppppppppppppp p p p p p p p ppppppppppp p p p p ppppppppppp pppppp ppppppppppp y0 p p p p p p p p p p p p p p p p p p p p p p p p pppppppppppppppppppppppppppppp pppp pp pppppppp pp pppppppp pppppppp p p p p p ppp p p p p p p p pp pppppp ψ pp ppp ppp pp pp ppp
x
0
-x
x x0
Compte tenu de la d´efinition de ϕ, x0 est l’extr´emit´e de I vers laquelle tend la suite (xn ). Pour fixer les id´ees, on supposera que x0 est l’extr´emit´e droite (sup´erieure) de I. Soit (J, ψ) une solution de l’´equation diff´erentielle passant par ce point (x0 , y0 ), et d´efinie dans un intervalle ]x0 − η, x0 + η[ (on peut supposer η assez petit pour que ]x0 − η, x0 [ soit contenu dans I). Soient x et x0 deux r´eels tels que x0 − η < x < x0 < x0 . Alors, d’apr`es le lemme pr´ec´edent, on a 0
kϕ(x) − ψ(x)k ≤ kϕ(x0 ) − ψ(x0 )kek|x −x| . Remarquer que le membre de gauche de cette in´egalit´e est ind´ependant de x0 . Quand x0 tend vers x0 , le membre de droite tend vers 0. On a donc ϕ = ψ dans l’intervalle ]x0 − η, x0 [, et on voit que ϕ peut ˆetre prolong´ee au del`a de x0 , ce qui contredit l’hypoth`ese. 2
5.4
Exemples.
` titre d’illustration des th´eor`emes pr´ec´edents, voici des exemples de leur utilisation. A Exemple 1. Soit l’´equation diff´erentielle M 0 = F (x, M ), o` u M d´esigne une matrice carr´ee n × n `a coefficients r´eels. On suppose F continument d´erivable sur R × Mn (o` u Mn est l’espace des matrices carr´ees r´eelles n × n) et on suppose que pour toute matrice M , la matrice t F (x, M )M est antisym´etrique. Soit (I, ϕ) une solution maximale de l’´equation, pour laquelle il existe un x0 tel que la matrice ϕ(x0 ) soit orthogonale. Nous nous proposons de montrer que ϕ(x) est orthogonale pour tout x de I, et que I = R. Par hypoth`ese, on a t ϕ(x0 )ϕ(x0 ) = 1 (matrice identit´e). Par ailleurs, t
ϕ(x)ϕ(x)
0
=
t t
ϕ0 (x)ϕ(x) + t ϕ(x)ϕ0 (x)
= F (x, ϕ(x))ϕ(x) + t ϕ(x)F (x, ϕ(x)) = 0,
Equations Diff´ erentielles.
19
car t F (x, ϕ(x))ϕ(x) est antisym´etrique. Il en r´esulte que l’expression t ϕ(x)ϕ(x) est constante, donc ´egale `a 1. La matrice ϕ(x) est donc orthogonale pour tout x du domaine I de ϕ (qui est un intervalle). Remarquer que le th´eor`eme de Cauchy–Lipschitz s’applique dans R × Mn . Comme l’ensemble des matrices orthogonales est une partie born´ee de Mn (toute matrice orthogonale est de norme 1, pour la norme habituelle kM k = sup kM Xk), le domaine de d´efinition d’une solution maximale ϕ doit ˆetre R kXk=1
tout entier, sinon l’application x 7→ (x, ϕ(x)) ne serait pas propre. En effet, quand x tend vers l’infini de I, x (la premi`ere composante de (x, ϕ(x)) doit tendre vers l’infini de R. Exemple 2. Soit I un intervalle ouvert de R. Soit k un r´eel strictement positif. Soit F : I ×Rn −→ Rn une application continue k–lipschitzienne par rapport `a la seconde variable. Soit x0 un point de I. Pour tout y0 ∈ Rn , on note (Jy0 , ϕy0 ) la solution maximale de l’´equation diff´erentielle y 0 = F (x, y) de condition initiale (x0 , y0 ). Nous nous proposons de montrer que l’intervalle Jy0 ne d´epend pas de y0 . Il suffit de montrer que si y0 et y1 sont deux points quelconques de Rn , on a Jy1 ⊂ Jy0 . Raisonnons par l’absurde et supposons que ce n’est pas le cas. Comme les deux intervalles ont le point x0 en commun, la condition Jy1 6⊂ Jy0 signifie que l’une des extr´emit´es de Jy0 est dans Jy1 . Supposons pour fixer les id´ees que ce soit l’extr´emit´e sup´erieure. On peut donc ´ecrire Jy0 =]a, b[, (o` u a peut ˆetre −∞), et on a b ∈ Jy1 . a
Les deux solutions ϕy0 et ϕy1 sont d´efinies sur l’intervalle ]x0 , b[. Soit x1 un point de cet intervalle. On kϕy1 (x1 ) − ϕy0 (x1 )k ≤ ky1 − y0 kek(x1 −x0 ) .
Quand x1 tend vers b, le membre de droite de cette in´egalit´e tend vers une limite finie, `a savoir ky1 −y0 kek(b−x0 ) , ce qui montre que le membre de gauche reste born´e. Comme ϕy1 (x1 ) tend vers ϕy1 (b) (car b ∈ Jy1 ), on voit que ϕy0 (x1 ) reste born´e quand x1 tend vers b. En cons´equence, la fonction x 7→ (x, ϕy1 (x)), de Jy1 vers I × Rn n’est pas propre. Ceci contredit le fait que (Jy0 , ϕy0 ) soit une solution maximale de l’´equation diff´erentielle.
´ Equations lin´ eaires.
6
Elles sont de la forme
y 0 = A(x)y + b(x).
o` u, pour tout x d’un certain intervalle ouvert J de R, b(x) est un vecteur de Rn , et A(x) une application lin´eaire de Rn dans Rn . L’application de A(x) au vecteur y est not´ee par juxtaposition. Si b(x) est nul pour tout x, on dit que l’´equation est homog`ene.
6.1
Application du th´ eor` eme de Cauchy–Lipschitz.
Les fonctions x 7→ A(x) et x 7→ b(x) sont d´efinies sur un intervalle ouvert J de R. Elles sont `a valeurs respectivement dans L(Rn , Rn ) et Rn . Il suffit qu’elles soient continues sur J, pour que les hypoth`eses du th´eor`eme de Cauchy–Lipschitz soient satisfaites dans l’ouvert J × Rn de R × Rn . En effet, soit F la fonction d´efinie sur J × Rn par F (x, y) = A(x)y, qui est la composition de (x, y) 7→ (A(x), y) et de l’application bilin´eaire qui applique une application lin´eaire `a un vecteur. F est clairement continue, et de plus, pour tous vecteurs y1 et y2 de Rn , on a kF (x, y1 ) − F (x, y2 )k = kA(x)(y1 − y2 )k ≤ kA(x)kky1 − y2 k.
20
Equations Diff´ erentielles.
Comme A est continue sur J, sa norme y est localement born´ee. Il en r´esulte que F est localement lipschitzienne sur J × Rn , et il en est de mˆeme de (x, y) 7→ F (x, y) + b(x). Lemme. Les solutions maximales de l’´equation lin´eaire y 0 = A(x)y + b(x) (o` u A et b sont d´efinies et continues sur J), sont d´efinies sur J tout entier. Raisonnons par l’absurde et supposons qu’une solution maximale (I, ϕ) soit d´efinie sur un intervalle I strictement plus petit que J. Par exemple, l’extr´emit´e sup´erieure b de I est un point de J. Comme le th´eor`eme de Cauchy s’applique dans J × Rn , ϕ(x) doit tendre vers l’infini (de Rn ) quand x tend vers b, car, comme il s’agit d’une solution maximale, l’application x 7→ (x, ϕ(x)) doit ˆetre propre (comme application de J vers J × Rn ). Soit maintenant y0 un point quelconque de Rn . Le point (b, y0 ) est dans J × Rn . Il existe donc une solution (V, ψ) d´efinie dans un voisinage V de b, et de condition initiale (b, y0 ). Soient x et x0 deux point de V plus petits que b. La fonction x 7→ A(x) ´etant born´ee dans V , car continue sur un compact plus grand que V , il existe une constante k telle que (x, y) 7→ A(x)y + b(x) soit globalement k–lipschitzienne dans V × Rn . En cons´equence, on a : 0
kϕ(x0 ) − ψ(x0 )k ≤ kϕ(x) − ψ(x)kek|x −x| . Quand x0 tend (en croissant) vers b, le second membre de cette in´egalit´e tend vers un r´eel (`a savoir kϕ(x) − ψ(x)kek|b−x| ). Par ailleurs, ψ(x0 ) tend vers ψ(b). Ceci est incompatible avec le fait que ϕ(x0 ) tende vers l’infini. 2
6.2
Espace des solutions de l’´ equation homog` ene.
Soit J l’intervalle de d´efinition de la fonction x 7→ A(x) (`a valeurs dans L(Rn , Rn )). On vient de voir que les solutions maximales de l’´equation y 0 = A(x)y sont d´efinies sur J tout entier, et que la fonction nulle est l’une de ces solutions. En fait l’ensemble des solutions de cette ´equation a une structure alg´ebrique refl`etant la lin´earit´e de l’´equation. Lemme. L’ensemble des solutions maximales de l’´equation lin´eaire homog`ene (o` u A est d´efinie sur l’intervalle J, et y `a valeurs dans Rn ) y 0 = A(x)y est un sous-espace vectoriel de dimension n de l’espace C 1 (J, Rn ) des application continument d´erivables de J vers Rn . Il est clair que la somme de deux solutions est encore une solution, de mˆeme que le produit d’une solution par une constante. Il nous reste `a voir que la dimension de l’espace des solutions est n. Soit x0 un point quelconque de J. Consid´erons l’application ϕ 7→ ϕ(x0 ). Cette application est lin´eaire de l’espace des solutions vers Rn . Elle est bijective, car d’apr`es le th´eor`eme de Cauchy–Lipschitz, pour x0 et y0 donn´es, il existe une unique solution maximale passant par (x0 , y0 ). 2 Il r´esulte de ce lemme, que d´ecrire l’ensemble des solutions de l’´equation lin´eaire homog`ene peut se faire en exhibant une base de l’espace des solutions. Une telle base s’appelle un syst`eme fondamental de solutions.
Equations Diff´ erentielles.
6.3
21
R´ esolution de l’´ equation homog` ene.
L’´equation dite “homog`ene” ou “sans second membre” y 0 = A(x)y peut ˆetre dans certains cas r´esolue comme suit. Posons
Z Ax0 (x) =
x
A(t)dt. x0
Il s’agit de l’int´egrale entre x0 et x d’une fonction continue `a valeurs dans l’espace vectoriel L(Rn , Rn ). Elle se fait en int´egrant chacune des n2 composantes de cette fonction. La fonction x 7→ Ax0 (x) a bien sˆ ur pour d´eriv´ee la fonction x 7→ A(x). Le lemme suivant est d´emontr´ee plus loin. Lemme. Si pour tout x0 et tout x1 de J, l’endomorphisme A(x0 ) commute avec l’endomorphisme A(x1 ), la d´eriv´ee de x 7→ eAx0 (x) est x 7→ A(x)eAx0 (x) .
On suppose maintenant que x 7→ A(x) satisfait les condition du lemme ci-dessus. Soit maintenant y0 un vecteur quelconque de Rn , et consid´erons la fonction x 7→ eAx0 (x) y0 . Cette fonction a pour d´eriv´ee x 7→ A(x)eAx0 (x) y0 , et est donc une solution de l’´equation homog`ene. Comme la primitive Ax0 (x) a ´et´e choisie de telle sorte qu’elle soit nulle en x0 ∈ J, on a eAx0 (x0 ) y0 = e0 y0 = y0 , de telle sorte que le couple (x0 , y0 ) est une condition initiale de la solution donn´ee ci-dessus. Il est clair que l’on a toutes les solutions maximales de l’´equation homog`ene.
6.4
La r´ esolvante.
Notons C(x, x0 )y0 la valeur en x de la solution de condition initiale (x0 , y0 ) de l’´equation homog`ene. Il est d’usage d’introduire la fonction (x, x0 ) 7→ C(x, x0 ) appel´ee r´esolvante de l’´equation homog`ene y 0 = A(x)y. Pour x0 et x fix´es, C(x, x0 ) est une application lin´eaire de Rn dans Rn . La r´esolvante C(x, x0 ) est donc la transformation qui applique la condition initiale y0 au temps x0 , sur la position finale C(x, x0 )y0 au temps x. La r´esolvante C(x, x0 ) est inversible. En effet, si C(x, x0 ) n’´etait pas inversible, il existerait y0 6= 0, tel que C(x, x0 )y0 = 0. Mais alors, les solutions de condition initiales (x0 , y0 ) et (x0 , 0), qui sont distinctes, se rencontreraient au temps x (en 0). R´eciproquement, si deux solutions qui sont distinctes en x0 , pouvaient se rencontrer en x, la r´esolvante C(x, x0 ) aurait un noyau non r´eduit `a 0.
22
Equations Diff´ erentielles.
En raisonnant de mˆeme, on voit que des solutions (I, ϕ1 ), . . . , (I, ϕk ) de l’´equation y 0 = A(x)y sont lin´eairement ind´ependante en un point de I si et seulement si elle le sont en tout point de I. Lemme. Pour tous x0 , x1 et x2 de l’intervalle J de d´efinition des solutions de l’´equation lin´eaire homog`ene y 0 = a(x)(y), la r´esolvante C satisfait : – C(x0 , x0 ) = Id , – C(x2 , x1 )C(x1 , x0 ) = C(x2 , x0 ), – C(x1 , x0 )−1 = C(x0 , x1 ). La premi`ere identit´e est ´evidente. Pour prouver la deuxi`eme, consid´erons un point y0 de Rn , et soit (J, ϕ) la solution maximale de l’´equation homog`ene de condition initiale (x0 , y0 ). On a alors ϕ(x0 ) = y0 , ϕ(x1 ) = y1 = C(x1 , x0 )(y0 ), et ϕ(x2 ) = y2 = C(x2 , x0 )(y0 ) par d´efinition de la r´esolvante. (J, ϕ) est donc aussi bien la solution de condition initiale (x1 , y1 ), et on a ϕ(x2 ) = y2 = C(x2 , x1 )(y1 ), ce qui donne pour tout y0 : C(x2 , x1 ) (C(x1 , x0 )(y0 )) = C(x2 , x0 )(y0 ). La troisi`eme identit´e est cons´equence imm´ediate des deux autres, en faisant x2 = x0 . 2 Lemme. Pour x0 donn´e, la fonction x 7→ C(x, x0 ) (de J dans L(Rn , Rn )) est solution de l’´equation diff´erentielle y 0 = A(x)y
Pour comprendre l’´enonc´e de ce lemme, il faut remarquer que y ´etant `a valeurs dans L(Rn , Rn ), l’expression A(x)y ne peut pas d´esigner l’application de A(x) `a y, ce qui n’aurait pas de sens. Cette expression d´esigne la multiplication dans l’alg`ebre L(Rn , Rn ) des endomorphismes A(x) et y (c’est-`a-dire leur composition). Posons f (x) = C(x, x0 )y0 . Alors f est solution de l’´equation y 0 = A(x)y, par d´efinition de la r´esolvante. On a donc ∂C (x, x0 )y0 = A(x)C(x, x0 )y0 . ∂x ∂C Ceci ´etant vrai pour tout y0 , on a (x, x0 ) = A(x)C(x, x0 ). 2 ∂x Exercice.On suppose que kA(x)k < k, pour tout x de l’intervalle [x0 , x1 ]. Montrer que l’application y0 7→ (x 7→ C(x, x0 )y0 ) (qui `a une valeur initiale y0 (en x0 ) fait correspondre la solution correspondante de l’´equation y 0 = A(x)y sur [x0 , x1 ]) est (ek|x1 −x0 | )-lipschitzienne. Exercice.Soit B une application lin´eaire de Rn dans Rn , commutant avec A(x) pour tout x de J. Montrer que la r´esolvante C(x, x0 ) commute avec B. Exercice.Montrer que le d´eterminant de la r´esolvante C(x, x0 ) est Rx Tr(A(t))dt e x0 . (On pourra utiliser la formule dA(x) −1 d det(A(x)) = tr ( A (x)) det(A(x)), dx dx pour A(x) inversible et d´erivable. Pour ´etablir cette formule, remarquer que le polynˆome caract´eristique de M donne le d´eveloppement limit´e de det(I + hM ) pour h voisin de 0.)
Equations Diff´ erentielles.
6.5
23
M´ ethode de variation des constantes.
Pour r´esoudre l’´equation “avec second membre”, on suppose que l’´equation homog`ene est r´esolue, c’est a` dire que l’on dispose d’une formule donnant la r´esolvante. La lin´earit´e de l’´equation montre que si l’on connait toutes les solutions de l’´equation homog`ene, et une solution particuli`ere de l’´equation avec second membre, on a toutes les solutions de l’´equation avec second membre. Pour trouver une solution particuli`ere de l’´equation avec second membre, on utilise la m´ethode dite de “variation des constantes”, qui consiste `a rechercher des solutions de la forme y = C(x, x0 )y0 (x).4 En d´erivant cette expression, on trouve y0 =
∂C (x, x0 )y0 (x) + C(x, x0 )y00 (x) = A(x)C(x, x0 )y0 (x) + C(x, x0 )y00 (x). ∂x
En reportant y et y 0 dans l’´equation avec second membre, on obtient C(x, x0 )y00 (x) = b(x), soit y00 (x) = C(x0 , x)b(x), ce qui donne y0 (x) par une simple int´egration. Il en r´esulte que la solution maximale de l’´equation avec second membre, de condition initiale (x0 , y0 ), est donn´ee par la formule Z x x 7→ C(x, x0 ) y0 + C(x0 , x)b(t)dt . x0
6.6
Solutions complexes.
Il est parfois n´ecessaire d’´etendre `a Cn le domaine dans lequel les solutions d’une equation diff´erentielle prennent leurs valeurs. Dans le cas des ´equations diff´erentielles lin´eaires, ceci est toujours possible, car tout vecteur de Rn peut ˆetre vu comme un vecteur de Cn , et toute application R-lin´eaire de Rn dans Rn s’´etend d’une fa¸con canonique en une application C-lin´eaire de Cn dans Cn . L’´equation y 0 = A(x)(y) + b(x) (o` u A(x) et b(x) sont r´eels) peut donc ˆetre vue comme une ´equation dont les solutions sont `a valeurs dans Cn . Quand A(x) et b(x) sont r´eels, ils sont invariants par conjugaison complexe. Dans ce cas, si (I, ϕ) est une solution, (I, ϕ) est aussi une solution dite conjugu´ee de la pr´ec´edente. La recherche des solutions r´eelles peut donc tr`es bien se faire via la recherche des solutions complexes. Nous en verrons un exemple ci-apr`es, puisque la jordanisation des matrices suppose que l’on se place sur C.
6.7
´ Equations lin´ eaires ` a coefficients constants.
Ce sont des ´equations du type
y 0 = Ay + b(x)
o` u la fonction inconnue y prend ses valeurs dans Rn , o` u A est une application lin´eaire de Rn dans Rn , et o` u b(x) est pour tout x d’un intervalle J, un vecteur de Rn . Bien sˆ ur, ces ´equations ne sont qu’un cas particulier d’´equations lin´eaires. 4 On remarquera que la constante y0 devient une fonction de x, d’o` u le nom compl` etement ridicule de cette m´ ethode. Il aurait ´ et´ e plus heureux et plus correct de l’appeler m´ ethode de variation de la condition initiale, puisque y0 est l’une des donn´ ees de la condition initiale (x0 , y0 ).
24
Equations Diff´ erentielles.
Comme A est “constant” (par rapport `a x), la fonction x 7→ A est ´evidemment continue, et le th´eor`eme de Cauchy–Lipschitz peut s’appliquer avec Γ = J × Rn . Noter qu’une ´equation lin´eaire homog`ene `a coefficients constants est autonome. Par ailleurs, A commutant avec A, les conditions sont remplies pour que les solutions de l’´equation homog`enes s’expriment `a l’aide d’exponentielles de matrices. En reprenant ce qui a ´et´e fait pr´ec´edemment dans le cas g´en´eral, on voit que dans le cas d’une ´equation lin´eaire `a coefficients constants, on a Z x Ax0 (x) = Adt = (x − x0 )A, x0
et donc, les solutions de l’´equation homog`ene sont x 7→ e(x−x0 )A y0 , o` u y0 est un vecteur quelconque de Rn . Leur calcul se ram`ene donc `a celui de la matrice exA . Pour cela, on peut au besoin mettre la matrice A sous forme de Jordan. Mais nous allons voir tout de suite quels enseignement g´en´eraux on peut tirer de l’existence de la forme de Jordan. Soit λ une valeur propre de A, de multiplicit´e k. Soit Eλ le sous-espace caract´eristique correspondant, c’est-`a-dire le noyau de l’endomorphisme (A − λId )k . Eλ est stable par A. Notons Aλ la restriction de A `a Eλ . Alors, toute solution de l’´equation y 0 = Aλ y (o` u y est `a valeurs dans Eλ ) est solution de l’´equation homog`ene d’origine y 0 = Ay. Un syst`eme fondamental de solutions de l’´equation y 0 = Aλ y comporte autant de fonctions que la dimension de l’espace caract´eristique Eλ . Comme les sous-espaces caract´eristiques pour les diverses valeurs propres de A ont Rn pour somme directe, on voit qu’un syst`eme fondamental de solutions de l’´equation homog`ene d’origine est obtenu en r´eunissant des syst`emes fondamentaux de solutions des ´equations y 0 = Aλ y pour chaque valeur propre λ de A (Le syst`eme obtenu est alors form´e de solutions lin´eairement ind´ependantes en nombre convenable). On est donc ramen´e `a r´esoudre les ´equations y 0 = Aλ y, pour chaque λ. L’endomorphisme Aλ de l’espace caract´eristique Eλ , s’´ecrit λId + N o` u N est un endomorphisme nilpotent (forme de Jordan). On a donc exAλ = exλId +xN = exλId exN , car xλId et xN commutent. Par ailleurs, on a exλId = exλ Id (exponentielle d’une matrice diagonale), et finalement, les solutions de l’´equation y 0 = Aλ y s’´ecrivent x 7→ exλ exN y0 , o` u y0 est un vecteur de Eλ . Comme N est nilpotent, on a l’expression de exN comme somme finie exN = Id + xN +
x2 N 2 xk−1 N k−1 + ... + , 2! (k − 1)!
(o` u k est la dimension du sous-espace caract´eristique Eλ ). Les coefficients de la matrice de exN (dans une base quelconque de Eλ ) sont donc des polynˆomes en x de degr´e au plus k − 1, et ceux de la matrice exAλ sont des produits de la fonction x 7→ exλ par de tels polynˆomes. Ceci r´esoud en principe l’´equation,
Equations Diff´ erentielles.
25
homog`ene, mais suppose en pratique que la forme de Jordan de A ait ´et´e d´etermin´ee. La r´esolution de l’´equation avec second membre se fait par la m´ethode de variation des constantes. Lemme. Dans le cas d’une ´equation lin´eaire `a coefficients constants, la r´esolvante est invariante par translation, c’est-`a-dire qu’elle satisfait C(x, x0 ) = C(x + t, x0 + t).
Cela tient bien sˆ ur au fait que l’´equation homog`ene est autonome, et plus pr´ecis´ement au fait que C(x, x0 ) = e(x−x0 )a . 2
6.8
Interpr´ etation g´ eom´ etrique.
Notons GL (n, R) le groupe lin´eaire de Rn , c’est-`a-dire le groupe des applications lin´eaires inversibles de Rn vers lui-mˆeme. ´finition. L’image d’un homomorphisme continu et d´erivable du groupe additif R vers GL (n, R) est De appel´e un sous-groupe `a un param`etre (de GL (n, R)). Si A est un matrice quelconque,
x 7→ exA
est un homomorphisme de groupes (en effet, xA commute avec x0 A), continu et d´erivable. Son image est donc un sous-groupe `a un param`etre. En fait, ceci donne tous les sous-groupes `a un param`etres, comme on va le voir. Soit ϕ(R) un sous-groupe `a un param`etre de GL (n, R) (o` u ϕ : R −→ GL (n, R) est un homomorphisme continu). Posons dϕ A= (0). dx (A est une matrice carr´ee n × n), et consid´erons l’homomorphisme x 7→ ψ(x) = exA . Alors ψ est identique `a ϕ, car ces deux applications satisfont l’´equation diff´erentielle (`a valeurs dans L(Rn , Rn )) y 0 = Ay, pour une mˆeme condition initiale (0, 0) (le deuxi`eme 0 est la matrice nulle). En effet, comme ϕ est un homomorphisme de groupes, on a dϕ dϕ (x) = ϕ(x) (0) dx dx (il suffit de d´eriver ϕ(x + h) = ϕ(x)ϕ(h) par rapport `a h). ϕ est donc la solution de l’´equation homog`ene y 0 = Ay (o` u Ay repr´esente la multiplication des matrices A et y). On a de mˆeme d(exA ) = AexA , dx ce qui montre que ψ est solution de la mˆeme ´equation. On a donc une correspondance bijective entre les ´equations lin´eaires homog`enes `a coefficients constants a` valeurs dans Rn , les matrices carr´ees n × n et les sous-groupes `a un param`etre du groupe lin´eaire GL (n, R).
26
Equations Diff´ erentielles.
6.9
´ Equations d’ordre sup´ erieur.
On a vu que les ´equations diff´erentielles d’ordre 2 et plus, se ramennent `a des ´equations d’ordre 1, quitte `a augmenter la dimension de l’espace dans lequel les solutions prennent leurs valeurs. Nous allons examiner de plus pr`es le cas des ´equations lin´eaires `a coefficients constants. Soit
y (n) + a1 (x)y (n−1) + . . . + an−1 (x)y 0 + an (x)y = b(x),
une ´equation lin´eaire d’ordre n, o` u y est `a valeurs dans R ou C. On peut transformer cette ´equation en un syst`eme du premier ordre, en posant yi = y (i) pour i entre 0 et n. On obtient alors le syst`eme suivant y00 y10 ... 0 yn−2 0 yn−1
= = ... = =
y1 y2 ... yn−2 −an (x)y0 − . . . − a1 (x)yn−1 + b(x)
Il s’´ecrit matriciellement comme suit. 0 1 0 .. .. y0 . . .. . .. . = yn−1 0 ... −an (x) . . .
0 1 ..
... .. .
.
0 .. . 0
0
1
−a2 (x)
−a1 (x)
y0 .. . yn−1
+
0 .. . 0
.
b(x)
Le calcul du polynˆome caract´eristique est facile si on d´eveloppe par rapport `a la derni`ere ligne. On obtient le polynˆome suivant tn + a1 (x)tn−1 + . . . + an−1 (x)t + an (x). Supposons maintenant les coefficients constants. Apr`es factorisation sur C, ce polynˆome a la forme (t − λ1 )α1 . . . (t − λk )αk . Il r´esulte de ce que nous avons vu que les solution de l’´equation homog`ene sont `a chercher parmi les fonction du type x 7→ P (x)eλi x , o` u P (x) est un polynˆome de degr´e strictement inf´erieur `a αi . Or ces fonctions engendrent un espace de dimension au plus n. Comme l’espace des solutions doit ˆetre de dimension n, on voit que l’on a l`a l’ensemble de toutes les solutions de l’´equation homog`ene. En r´esum´e, pour r´esoudre l’´equation lin´eaire d’ordre n ci-dessus (`a coefficients constants), il suffit de rechercher les racines du polynˆome caract´eristique de cette ´equation, qui s’obtient en rempla¸cant simplement les d´eriv´ees successives de y par les puissances successives de t. On applique ensuite la m´ethode de variation des constantes.
Equations Diff´ erentielles.
6.10
27
´ Equations de Lagrange et de Clairaut.
L’´equation de Lagrange a la forme suivante y = xϕ(y 0 ) + ψ(y 0 ). Supposons qu’on ait une fonction t 7→ f (t) telle que pour tout t (t − ϕ(t))f 0 (t) = f (t)ϕ0 (t) + ψ 0 (t). Supposons de plus que cette fonction puisse ˆetre invers´ee dans un certain domaine. On a alors une fonction x 7→ g(x), telle que pour tout t, g(f (t)) = t, et donc f 0 (t)g 0 (f (t)) = 1. Consid´erons maintenant la fonction x 7→ h(x) = xϕ(g(x)) + ψ(g(x)). Cette fonction est solution de l’´equation de Lagrange. En effet, en d´erivant h, on obtient h0 (x) = ϕ(g(x)) + xg 0 (x)ϕ0 (g(x)) + g 0 (x)ψ 0 (g(x)). En posant t = g(x), on a x = f (t) et donc h0 (x) = =
ϕ(t) + f (t)g 0 (f (t))ϕ0 (t) + g 0 (f (t))ψ 0 (t) f (t)ϕ0 (t) + ψ 0 (t) ϕ(t) + f 0 (t)
=
ϕ(t) + t − ϕ(t)
=
t
=
g(x)
ce que nous allons lire g(x) = h0 (x), que nous reportons dans la d´efinition de h pour obtenir h(x) = xϕ(h0 (x)) + ψ(h0 (x)). Il suffit donc de trouver des solutions de l’´equation lin´eaire (t − ϕ(t))f 0 (t) = f (t)ϕ0 (t) + ψ 0 (t). de fonction inconnue f , pour obtenir des solutions de l’´equation de Lagrange.
Ce cours peut ˆetre librement copi´e et distribu´e. Il est recommand´e d’en t´el´echarger la version la plus r´ecente `a partir de : http://www.math.jussieu.fr/~alp. Toute remarque, correction ou suggestion doit ˆetre address´ee `a l’auteur :
[email protected].
Espaces M´ etriques. par Alain Prout´e Universit´e Denis Diderot — Paris 7
Table des mati` eres 1 Rappels sur les Nombres R´ eels Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 2
2 Espaces m´ etriques. 2.1 Boules ouvertes. . . . . . . . . . . . 2.2 Parties born´ees. . . . . . . . . . . . . 2.3 Voisinages et Parties Ouvertes. . . . 2.4 Points Adh´erents, Parties Ferm´ees et Exercices . . . . . . . . . . . . . . . . . .
. . . . .
2 3 3 4 4 5
3 Suites et Limites 3.1 Points d’Accumulation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Le Th´eor`eme de Bolzano–Weierstrass. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5 5 6
4 Suites de Cauchy et Espaces M´ etriques Complets. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6 8
5 Compacts Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9 9
6 Applications Continues Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10 11
7 Un Th´ eor` eme de Prolongement
12
8 Applications Lipschitziennes et Applications Contractantes
12
Solution des exercices.
13
1
. . . . . . . . . . . . . . . . . . . . . . . . . . . Parties Denses. . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Rappels sur les Nombres R´ eels
D´ efinition 1 (Axiomatique des nombres r´eels) L’ensemble R des nombres r´eels est un corps ordonn´e dans lequel toute partie non vide et major´ee a une borne sup´erieure. Rappelons qu’un corps est un groupe (dit “additif” de loi not´ee + et d’´el´ement neutre not´e 0), qu’il est muni d’une multiplication (not´ee ×) distributive sur l’addition, et que le compl´ementaire de 0 est un groupe pour cette multiplication. On peut d´eduire de cette d´efinition que 0 est distinct de 1, et que l’addition est commutative. Un corps ordonn´e K est un corps muni d’une relation d’ordre total (not´ee ≤) compatible avec l’addition et la multiplication, en ce sens que pour tous x, y et z de K, x ≤ y =⇒ x + z ≤ y + z
0 ≤ x et y ≤ z =⇒ xy ≤ xz.
2
Espaces M´ etriques.
On v´erifie alors facilement que 1 est strictement positif, donc que n + 1 est strictement plus grand que n, pour tout entier n, et qu’en cons´equence, il s’agit d’un corps de caract´eristique 0, et son plus petit sous-corps est identifiable au corps Q des rationnels. De plus, la suite des entiers positifs (n)n∈N n’est pas major´ee (autrement-dit, le corps des r´eels est archim´edien). En effet, si elle l’´etait, elle aurait une borne sup´erieure ω, puisqu’elle est non vide, et il existerait alors une infinit´e d’entiers entre ω − 1 et ω (puisque que ω − 1 < ω). Soit n un tel entier. On a alors ω < n + 1, ce qui contredit la d´efinition de ω. Il en r´esulte imm´ediatemment que dans R, on a lim
n→+∞
1 = 0. n
On appelle module ou valeur absolue d’un r´eel x, le r´eel |x| = sup(x, −x). Remarque. On d´efinit parfois R comme un “corps ordonn´e archim´edien complet”. On peut montrer que la propri´et´e “toute partie non vide et major´ee a une borne sup´erieure” est ´equivalente `a la conjonction des deux propri´et´es “archim´edien” et “complet” (et non pas `a la deuxi`eme seule). Bien entendu, pour une telle d´efinition, R n’´etant pas encore construit, on doit adapter la d´efinition du mot “complet”, qui s’applique en g´en´eral `a des espaces m´etriques (voir plus loin).
Exercices 1
Montrer que dans tout corps K, on a 0 6= 1, et que l’addition est commutative.
2 Montrer que le r´eel 1 est strictement positif. Montrer que tout nombre r´eel qui est le carr´e d’un nombre r´eel est positif. 3
Montrer que la valeur absolue d’un r´eel est positive ou nulle.
4
Montrer que toute partie non vide et minor´ee de R a une borne inf´erieure.
5
Montrer que pour tout r´eel strictement positif ε, il existe un entier N , tel que pour tout entier 1 n > N , on ait 0 ≤ ≤ ε. n
2
Espaces m´ etriques.
D´ efinition 2 Un espace m´etrique est un ensemble E muni, d’une application d : E × E −→ [0, +∞[⊂ R, appel´ee distance, satisfaisant les axiomes suivants, pour tous x, y et z de E : – d(x, y) = 0 si et seulement si x = y, – d(x, y) = d(y, x), – d(x, z) ≤ d(x, y) + d(y, z). Le dernier axiome s’appelle “la premi`ere in´egalit´e triangulaire”. On en d´eduit imm´ediatement “la deuxi`eme in´egalit´e triangulaire” : d(x, z) ≥ |d(x, y) − d(y, z)| pour tous x, y et z de E. Ces deux in´egalit´es se r´esument par le slogan suivant : dans un triangle, la longueur d’un cot´e est comprise entre la somme et la diff´erence des longueurs des deux autres. Des exemples de distances sont les suivants :
Espaces M´ etriques.
3
– d(x, y) = |x − y| dans R, mais aussi dans Z, Q ou C, – d(x, y) = kx − yk dans Rn , o` u k k est l’une quelconque des normes habituelles. (On rappelle qu’une norme sur un espace vectoriel r´eel E est une application x 7→ ||x||, de E vers R, telle que pour tous x et y de E et tout λ de R, on ait ||x|| ≥ 0, ||x|| = 0 si et seulement si x = 0, ||λx|| = |λ| ||x|| et ||x + y|| ≤ ||x|| + ||y||.) q – la norme euclidienne : k(x1 , . . . , xn )k = x21 + · · · + x2n , – la norme “sup” : k(x1 , . . . , xn )k = sup(|x1 |, . . . , |xn |), pour ne citer que les deux plus importantes, – d(f, g) = sup kf (x) − g(x)k, sur l’ensemble des fonctions born´ees d´efinies sur D et `a valeurs dans x∈D
Rn , – d(M, N ) = kM − N k = sup k(M − N )Xk, sur l’espace des applications lin´eaires (ou des matrices kXk=1
d’applications lin´eaires) de Rn dans Rm . Il y a bien sˆ ur de nombreux autres exemples de distances utiles en analyse. On voit donc que tous les espaces cit´es plus haut sont des espaces m´etriques, ainsi bien sˆ ur que tous leurs sous-ensembles, puisque toute partie d’un espace m´etrique est clairement un espace m´etrique.
2.1
Boules ouvertes.
D´ efinition 3 Soit x un point d’un espace m´etrique E, et r un r´eel strictement positif. On appelle boule ouverte de centre x et de rayon r, l’ensemble B(x, r) = {y ∈ E | d(x, y) < r}, c’est-` a-dire l’ensemble des ´el´ements de E dont la distance ` a x est strictement inf´erieure ` a r. Comme on demande que r soit strictement positif, une boule ouverte ne peut pas ˆetre vide. En effet B(x, r) contient au moins x. Elle peut par ailleurs ne contenir que x. Par exemple, la boule ouverte 1 B(0, ) de l’espace m´etrique Z ne contient que 0. 2 Dans R, la boule ouverte de centre x et de rayon r est l’intervalle ouvert ]x − r, x + r[. D´ efinition 4 Quand pour un point x d’un espace m´etrique E, il existe une boule ouverte de centre x ne contenant que x, on dit que x est un point isol´e de E. D´ efinition 5 Si tous les points d’un espace m´etrique sont isol´es, on dit que l’espace m´etrique est discret. Il est facile de v´erifier que Z est discret.
2.2
Parties born´ ees.
D´ efinition 6 Une partie A d’un espace m´etrique E est born´ee si elle est vide ou contenue dans une boule ouverte.(1 ) Dans ce cas, si B(x, r) est une telle boule, on voit que tout point de A est `a une distance de x inf´erieure `a r. Par exemple, R n’est pas born´e, mais la sph`ere unit´e de Rn (d´efinie comme {x ∈ Rn | kxk = 1}) est born´ee. D´ efinition 7 Si A est une partie born´ee d’un espace m´etrique E, on appelle diam`etre de A le nombre r´eel positif ou nul suivant : sup d(x, y). x∈A,y∈A 1 On peut penser que le cas “vide” est inutile. C’est vrai sauf si E lui-mˆ eme est vide, car alors E n’a aucune boule ouverte, puisque toute boule ouverte a un centre.
4
Espaces M´ etriques.
Notez que ce nombre existe, car A ´etant contenue dans une boule B(x, r), la distance de deux points quelconques de A ne peut pas d´epasser 2r. Si A est vide, son diam`etre est 0 (la borne sup´erieure de la partie vide de [0, +∞[).
2.3
Voisinages et Parties Ouvertes.
D´ efinition 8 Un voisinage d’un point x d’un espace m´etrique E est une partie de E contenant une boule ouverte de centre x. 1 Par exemple, l’intervalle [0, 1] est un voisinage de , car il contient (entre autres) la boule ouverte 3 1 1 B( , ). 3 4 Dans un espace discret, la partie {x} (r´eduite au seul point x) est un voisinage de x (puisque c’est une boule ouverte de centre x). D´ efinition 9 Une partie A d’un espace m´etrique E est ouverte, si elle est voisinage de chacun de ses propres points. Il est clair que dans un espace discret, toute partie est ouverte. Lemme 1 Toute boule ouverte d’un espace m´etrique E est une partie ouverte de E. Toute r´eunion de boules ouvertes de E est une partie ouverte de E. En effet, soit B(x, r) une boule ouverte, et soit y un point de cette boule. Soit d la distance de x `a y. d est strictement inf´erieur `a r. Par l’in´egalit´e triangulaire, on voit que la boule ouverte (remarquer que r − d est strictement positif) B(y, r − d) de centre y est contenue dans B(x, r). La deuxi`eme assertion r´esulte imm´ediatement de la d´efinition de la r´eunion. 2 Lemme 2 Les parties ouvertes d’un espace m´etrique E satisfont les axiomes suivants : – E et φ sont des parties ouvertes de E, – toute r´eunion de parties ouvertes de E est une partie ouverte de E, – toute intersection d’une famille finie de parties ouvertes de E est une partie ouverte de E. E est bien sˆ ur voisinage de chacun des ses points, puisque pour tout x, la boule ouverte B(x, 1) est contenue dans E. φ est aussi une partie ouverte, puisque l’´enonc´e ∀x ∈ φ (φ voisinage de x) est vrai. Le r´esultat est ´evident pour une r´eunion de parties ouvertes, compte tenu de la d´efinition des parties ouvertes. En ce qui concerne l’intersection, il suffit de le faire pour deux parties ouvertes U et V . Soit x un point de U ∩ V . Alors il existe deux boules ouvertes B(x, r) et B(x, r0 ) de centre x et respectivement contenues dans U et V . La boule B(x, inf(r, r0 )) est alors contenue dans U ∩ V . 2
2.4
Points Adh´ erents, Parties Ferm´ ees et Parties Denses.
D´ efinition 10 Soit A une partie d’un espace m´etrique E, et x un point de E. On dit que x est adh´erent ` a A, si tout voisinage de x rencontre A. (On dit que deux parties se rencontrent si leur intersection n’est pas vide.) Notez qu’un point x adh´erent `a A n’est pas n´ecessairement dans A. Toutefois, il est `a une distance2 nulle de A, puisque pour tout ε > 0, la boule B(x, ε) contient des points de A. D´ efinition 11 On dit qu’une partie A d’un espace m´etrique E est ferm´ee, si elle contient tous les points qui lui sont adh´erents. 2
La distance d’un point y ` a une partie non vide A est inf d(x, y). x∈A
Espaces M´ etriques.
5
D´ efinition 12 Une partie A d’un espace m´etrique E est dite dense dans E, si tout point de E est adh´erent ` a A.
Exercices 1 Montrer qu’une partie A d’un espace m´etrique E est ferm´ee si et seulement si son compl´ementaire est ouvert. 2
3
Montrer que Q est dense dans R.
Suites et Limites
D´ efinition 13 Une suite d’un espace m´etrique E est une application u : N −→ E. En g´en´eral, l’image de n par la suite u sera not´e un . La suite elle mˆeme sera not´ee (un )n∈N (dans cette expression, la variable n est li´ee). L’´element un de E sera appel´e le n-i`eme terme de la suite, ou le terme de rang n. L’image de la suite est bien entendu le sous-ensemble de E form´e de tous les termes de la suite. D´ efinition 14 Une “sous-suite” d’une suite u est une composition u ◦ ϕ, o` u ϕ : N −→ N est une application strictement croissante. Par exemple, (un+1 )n∈N est une sous-suite de (un )n∈N , car l’aplication n 7→ n + 1 de N vers N est strictement croissante. D´ efinition 15 La suite (un )n∈N de l’espace m´etrique E converge vers la limite l (o` u l est un point de E) si ∀ε > 0 ∃N ∈ N ∀n > N d(un , l) < ε. Autrement-dit, une suite (un )n∈N converge vers la limite l si, aussi petit que soit un voisinage de l, tous les termes de la suite `a partir d’un certain rang sont dans ce voisinage. Evidemment, le rang en question augmente en g´en´eral, quand on r´eduit le voisinage. Lemme 3 Si la suite u converge vers l, alors toute sous-suite de u converge vers l. Et r´eciproquement bien sˆ ur, puisque u est une sous-suite de u. 2 Par contre, une suite non convergente peut avoir des sous-suites convergentes.
3.1
Points d’Accumulation.
D´ efinition 16 Soit (un )n∈N une suite d’un espace m´etrique E. Un point γ de E est un point d’accumulation de (un )n∈N , si ∀ε > 0 ∀N ∈ N ∃n > N d(un , γ) < ε. Autrement-dit, γ est point d’accumulation de la suite (un )n∈N , si tout voisinage de γ contient au moins un terme de la suite de rang aussi grand qu’on veut. Cette derni`ere condition sur le rang, implique en fait que tout voisinage de γ contient une infinit´e de termes de la suite. Il revient au mˆeme de dire que γ est la limite d’une sous-suite de (un )n∈N .
6
Espaces M´ etriques.
Lemme 4 Tout point adh´erent ` a l’image d’une suite, est soit un terme de la suite, soit un point d’accumulation de la suite. Il est clair par d´efinition des points adh´erents, que tous les termes de la suite et tous les points d’accumulation de la suite sont adh´erents `a la suite. R´eciproquement, supposons que x soit adh´erent `a la suite (un ), et ne soit pas un terme de la suite (un ). Soit B(x, r) une boule ouverte de centre x. Si B(x, r) ne contenait qu’un nombre fini de termes de la suite, disons un1 , . . . , unk (qui sont tous n´ecessairement distincts de x), la boule ouverte de centre x et de rayon (strictement positif) inf(d(x, un1 ), . . . , d(x, unk )) ne contiendrait aucun terme de la suite, ce qui est impossible. 2 Corollaire 1 Toute suite d’un espace m´etrique E qui n’a pas de point d’accumulation, a pour image une partie ferm´ee de E. Ceci r´esulte imm´ediatement du lemme pr´ec´edent. 2 Par exemple, la suite d´efinie par un = n dans R n’a pas de point d’accumulation, et constitue donc une partie ferm´ee de R.
3.2
Le Th´ eor` eme de Bolzano–Weierstrass.
Th´ eor` eme 1 (de Bolzano-Weierstrass) Toute suite born´ee de Rn admet au moins un point d’accumulation. D´emontrons le d’abord pour R. Soit (uk ) une suite born´ee de R. L’ensemble Ek = {up | p > k} est une partie non vide et major´ee de R. Elle admet donc une borne sup´erieure ck . Comme Ek+1 ⊂ Ek , la suite (ck ) est d´ecroissante. Elle est par ailleurs minor´ee. Elle admet donc une limite γ (sa borne inf´erieure). Toute boule ouverte B(γ, ε) de centre γ contient tous les termes de la suite (ck ) `a partir d’un certain rang (d´ependant de ε). Mais, si elle contient ck , elle contient une boule ouverte B(ck , rk ) de centre ck , qui elle-mˆeme doit contenir des ´el´ements de Ek , autrement-dit des termes de la suite, de rang aussi grand qu’on veut. Ceci montre que γ est point d’accumulation de la suite. Passons maintenant au cas de Rn = R × Rn−1 . Soit (uk ) une suite born´ee de Rn . uk s’´ecrit uk = (vk , wk ), avec vk ∈ R et wk ∈ Rn−1 . Les projections sur les facteurs de Rn diminuant les distances, la suite (vk ) est une suite born´ee de R. Elle admet donc au moins un point d’accumulation γ, c’est–`a–dire qu’elle a une sous–suite (vki )i∈N qui converge vers Γ. Consid´erons la sous–suite (wki )i∈N de la suite (wk ). Par hypoth`ese de r´ecurrence, elle admet un point d’accumulation δ. Alors (γ, δ) est un point d’accumulation de la suite (un ) dans Rn .
4
Suites de Cauchy et Espaces M´ etriques Complets.
D´ efinition 17 Une suite (un ) d’un espace m´etrique E est une suite de Cauchy si ∀ε > 0 ∃N ∈ N ∀n > N ∀m > N d(un , um ) < ε. Cette d´efinition dit simplement qu’aussi petit que soit ε, les termes de la suite ont, `a partir d’un certain rang, des distances mutuelles plus petites que ε. Il est clair que toute sous-suite d’une suite de Cauchy est une suite de Cauchy. Il est clair que toute suite convergente est de Cauchy. Quand la r´eciproque est vraie, on dit que l’espace m´etrique E est complet : D´ efinition 18 Un espace m´etrique est complet si toute suite de Cauchy dans cet espace converge. Dans un espace m´etrique complet, la d´efinition des suites de Cauchy est donc un crit`ere de convergence. On remarquera que ce crit`ere ne fait pas intervenir la limite de la suite, et c’est l`a toute sa force. Il permet de prouver qu’une suite est convergente sans en connaitre, ni mˆeme en ´evoquer la limite.
Espaces M´ etriques.
7
Lemme 5 Toute suite de Cauchy qui a une sous-suite convergente est convergente (vers la mˆeme limite que cette sous-suite). Soit γ la limite de la sous-suite. Aussi petit que soit ε, il existe un N tel que les distances mutuelles ε entre termes de rang au moins N soient plus petites que , et par ailleurs, au moins l’un de ces termes 2 ε est distant de γ de moins de . 2 2 Lemme 6 Rn est complet. En effet, soit (un ) une suite de Cauchy de Rn . Cette suite est born´ee, car comme `a partir d’un certain rang N , les distance mutuelles entre les termes de cette suite sont plus petites que 1, tous les termes de rang plus grand que N sont dans une boule de rayon 1. Les autres termes sont en nombre fini. D’apr`es le th´eor`eme de Bolzano-Weierstrass, la suite a donc un point d’accumulation γ, qui est la limite de la suite par le lemme pr´ec´edent. 2 Lemme 7 Toute partie ferm´ee F d’un espace m´etrique complet E est un espace m´etrique complet. En effet, soit (un ) une suite de Cauchy de F . (un ) est clairement une suite de Cauchy de E, et elle converge donc dans E vers une limite l. Comme l est clairement adh´erent `a F , et comme F est ferm´e, on voit que l ∈ F . 2 D´ efinition 19 On dira qu’une suite (un )n∈N dans un espace m´etrique E est “contrˆ ol´ee” si :(3 ) ∀n∈N ∀p∈N d(un , un+p ) <
1 n+1
Une suite qui est contrˆol´ee est bien sˆ ur de Cauchy. Par ailleurs, toute suite de Cauchy a une sous-suite contrˆol´ee. En effet, prenons pour ϕ(0) un entier tel que ∀p≥ϕ(0) d(uϕ(0) , up ) ≤ 1, puis pour ϕ(1) un 1 entier strictement plus grand que ϕ(0) tel que ∀p≥ϕ(1) d(uϕ(1) , up ) ≤ , etc. . . On a ainsi construit une 2 sous-suite u ◦ ϕ de u qui est contrˆol´ee. Soit E un espace m´etrique. Notons E 0 l’ensemble de toutes les suites de Cauchy de E (qui ne sont pas n´ecessairement convergentes, puisque E n’a pas ´et´e suppos´e complet). Pour u et v dans E 0 , consid´erons la suite : n 7→ kn = d(un , vn ) C’est une suite de Cauchy de R. En effet, on a : |kp − kp+q | = = ≤ ≤
|d(up , vp ) − d(up+q , vp+q )| |d(up , vp ) − d(up , up+q ) + d(up , up+q ) − d(up+q , vp+q )| |d(up , vp ) − d(up , vp+q )| + |d(up , vp+q ) − d(up+q , vp+q )| d(vp , vp+q ) + d(up , up+q )
et cette derni`ere expression est aussi petite que l’on veut pour p assez grand. On pose d0 (u, v) = lim d(un , vn ). Il est facile de v´erifier que d0 : E 0 × E 0 −→ R est sym´etrique n→∞
et satisfait l’in´egalit´e triangulaire. Par contre, deux ´el´ements u et v de E 0 tels que d(u, v) = 0 ne sont pas n´ecessairement ´egaux. On note E le quotient de E 0 par la relation d’´equivalence R d´efinie par uRv ⇔ d0 (u, v) = 0. Il est facile de v´erifier que d0 passe au quotient et donne une distance d sur E. On va montrer que E muni de cette distance est complet. On notera que si deux suites u et v sont contrˆol´ees, 1 1 alors on a d(u(n), v(n)) ≤ + d0 (u, v) + . n+1 n+1 Soit donc (un )n∈N une suite de Cauchy de E. Pour tout n ∈ N, un est donc une classe d’´equivalence de suites de Cauchy de E. Il s’agit de montrer que (un )n∈N converge. Pour cela il suffit de montrer qu’une 3
On utilise n + 1 au lieu de n dans cette d´ efinition pour ´ eviter une division par 0.
8
Espaces M´ etriques.
sous-suite contrˆol´ee de (un )n∈N converge. On peut donc supposer (un )n∈N contrˆol´ee. On notera un une suite repr´esentant la classe un , et il est possible de la choisir contrˆol´ee. Enfin, on notera un (i) le ii`eme terme de la suite un . On pose wn = un (n).(4 ) Alors (wn )n∈N est une suite de Cauchy. En effet, on a pour tous entiers n, p et q : d(wn , wn+p ) = ≤ ≤
d(un (n), un+p (n + p)) d(un (n), un (n + p)) + d(un (n + p), un+p (n + p)) 1 + d(un (n + p), un (q)) + d(un (q), un+p (q)) + d(un+p (q), un+p (n + p)) n+1
Ceci reste valable quand q tend vers l’infini, ce qui donne : d(wn , wn+p ) ≤ ≤ ≤
1 1 1 + + d0 (un , un+p ) + n+1 n+1 n+p+1 1 1 1 1 + + + n+1 n+1 n+1 n+p+1 4 n+1
ce qui montre que (wn )n∈N est de Cauchy. Il reste `a voir que la classe de (wn )n∈N est la limite de u. Pour cela, donnons-nous un ε > 0, et montrons que pour n assez grand, on a d0 (un , w) < 2ε. On a pour tout n : d0 (un , w) =
lim d(un (p), w(p))
p→∞
=
lim d(un (p), up (p))
p→∞
En prenant p assez grand (et plus grand que n), on a |d0 (un , w) − d(un (p), up (p))| < ε. Par ailleurs, on a d(un (p), up (p)) ≤
1 1 + d0 (un , up ) + n+1 p+1
1 3 . Finalement, d(un (p), up (p)) ≤ et n+1 n+1 3 3 d0 (un , w) ≤ ε + . Ceci ´etant valable pour tout n, il reste `a prendre n assez grand pour que ≤ n+1 n+1 ε. 2 L’espace m´etrique complet E d´efini ci-dessus est appel´e le “compl´et´e” de E. L’exemple le plus connu est R qui est le compl´et´e de Q. Revenons au cas g´en´eral, et notons qu’on a une application (dite “canonique”) : Comme u est contrˆol´ee et p > n, on a d0 (un , up ) ≤
E
γ
/E
u (x)n∈N est la suite constante de valeur x (qui est bien sˆ ur de Cauchy, et d´efinie par x 7→ (x)n∈N , o` mˆeme contrˆ ol´ee). De plus, γ est une isom´etrie. En effet d(γ(x), γ(y)) = d0 ((x)n∈N , (y)n∈N ) = d(x, y). En particulier γ est injective.
Exercices 1 Soit E un espace m´etrique complet non vide. Soit (Ui )i∈N une famille d´enombrable (i.e. une suite) d’ouvert de E, tous denses dans E. Montrer que l’intersection \ Ui A= i∈N 4
Cette astuce est appel´ ee “proc´ ed´ e diagonal”.
Espaces M´ etriques.
9
(qui n’est en g´en´eral pas un ouvert de E) n’est pas vide (th´eor`eme de Baire). 2 Montrer que sous les hypoth`eses du th´eor`eme de Baire, A est non seulement non vide, mais aussi dense dans E. 3
5
En utilisant le th´eor`eme de Baire, montrer que R n’est pas d´enombrable.
Compacts
D´ efinition 20 Une partie A d’un espace m´etrique E est compacte si toute suite de A a au moins un point d’accumulation dans A. Cette d´efinition met clairement en ´evidence le fait qu’il est ´equivalent de dire que A est compact comme partie de E, ou compact comme partie de A. La compacit´e, contrairement aux notions d’ouvert et de ferm´e est une notion absolue. En particulier, on peut parler d’espace m´etrique compact. Lemme 8 Si A est une partie compacte de E, alors A est une partie ferm´ee de E. En effet, soit x un point de E adh´erent `a A. Il existe donc une suite de A qui converge vers x. Comme A est compact, cette suite doit avoir un point d’accumulation dans A. Comme x est son seul point d’accumulation, x est dans A. 2 Lemme 9 Tout espace m´etrique compact est born´e et complet. Soit E un espace m´etrique compact. S’il est vide, il est ´evidemment born´e et complet. Sinon, soit x un point de E. Si E n’´etait pas born´e, il existerait une suite (xn ) dans E, telle que la distance de x `a xn soit au moins ´egale `a n. Cette suite a un point d’accumulation γ. Soit B une boule ouverte de centre γ et de rayon plus petit que 1. Cette boule contient une infinit´e de termes de la suite. Soit xn un terme de la suite, appartenant `a B, et soit d la distance de x `a xn . Soit enfin m un entier assez grand pour que m − d soit plus grand que le diam`etre de la boule B, et tel que xm soit aussi dans la boule B. Alors, par la deuxi`eme in´egalit´e triangulaire, la distance de xn `a xm est plus grande que m − d. Ce qui est impossible. E est donc born´e. Soit maintenant (un ) une suite de Cauchy de E. Comme E est compact, cette suite a un point d’accumulation γ dans E. Ce point ne peut ˆetre que la limite de la suite. En effet, soit ε > 0, et soit N un entier tel que deux termes quelconques de la suite de rangs plus grands que N soient distants de moins de ε. Prenons n > N assez grand pour que la distance de xn `a γ soit plus petite que ε. Alors, pour tout m > N la distance de xm `a γ est plus petite que 2ε, ce qui montre que la suite converge vers γ. 2 Th´ eor` eme 2 Les parties compactes de Rn sont pr´ecis´ement celles qui sont ferm´ees et born´ees. Soit A une partie ferm´ee et born´ee de Rn . Soit (xn )n∈N une suite de A. D’apr`es le th´eor`eme de Bolzano-Weierstrass, cette suite a un point d’accumulation (dans Rn ). Ce point d’accumulation est en fait dans A, car A est ferm´ee. R´eciproquement, on a d´ej`a vu que les compacts de Rn sont tous ferm´es et born´es. 2
Exercices 1
Montrer que tout espace m´etrique compact et discret est fini.
2 Soit A une partie compacte d’un espace m´etrique E, et soit (Ui )i∈I une famille de parties ouvertes de E, telle que [ A⊂ Ui . i∈I
10
Espaces M´ etriques.
Montrer qu’il existe un r´eel ρ strictement positif (appel´e “nombre de Lebesgue” pour le recouvrement donn´e), tel que toute boule ouverte de rayon ρ ayant son centre dans A soit contenue dans l’un des ouverts de la famille (Ui )i∈I . 3
Soit A une partie compacte d’un espace m´etrique E, et (Ui )i∈I une famille d’ouverts de E, tels
que A⊂
[
Ui .
i∈I
Montrer qu’il existe une partie finie J de I, telle que [ A⊂ Ui . i∈J
(Utiliser l’exercice pr´ec´edent.) 4 Montrer que, si une partie A d’un espace m´etrique E a la propri´et´e que de tout recouvrement ouvert on peut extraire un sous-recouvrement fini, alors A est compacte.
6
Applications Continues
Essentiellement, la continuit´e d’une application entre espaces m´etriques signifie qu’elle commute aux limites de suites. D´ efinition 21 Une application f : E −→ F entre deux espaces m´etriques est continue en x ∈ E si l’image par f de toute suite de E qui converge vers x, converge vers f (x). Si f est continue en x, on a donc f ( lim xn ) = lim f (xn ). n→∞
n→∞
Voici maintenant une d´efinition ´equivalente plus classique. D´ efinition 22 Une application f : E −→ F est continue en x ∈ E si et seulement si ∀ε > 0 ∃η > 0 ∀x0 ∈ E d(x, x0 ) < η =⇒ d(f (x), f (x0 )) < ε. Remarquer que cette d´efinition peut se lire comme suit : pour toute boule ouverte B (de rayon ε) de centre f (x), il existe une boule ouverte B 0 de centre x (de rayon η), telle que f (B 0 ) ⊂ B, ou encore comme suit : Pour tout voisinage V de f (x), f −1 (V ) est un voisinage de x. Montrons l’´equivalence de ces deux d´efinitions. Soit f une fonction continue en x au sens de la premi`ere d´efinition. Soit B(f (x), ε) une boule ouverte de centre f (x). S’il n’exitait pas de boule ouverte B 0 (x, η), telle que f (B 0 ) ⊂ B, alors, pour tout entier n, 1 il existerait un point xn de la boule de centre x et de rayon , tel que f (xn ) ne soit pas dans B(f (x), ε). n Par construction la suite xn converge vers x, alors que la suite f (xn ) ne peut pas converger vers f (x). R´eciproquement, si f est continue en x au sens de la deuxi`eme d´efinition, et si (xn ) est une suite convergeant vers x, alors, pour tout ε > 0, il existe un η > 0, tel que d(x0 , x) < η entraine d(f (x0 ), f (x)) < ε, et il existe un N , tel que n > N entraine d(xn , x) < η. En conclusion, la suite f (xn ) converge vers f (x). 2 D´ efinition 23 Si f : E −→ F est continue en tout point d’une partie A de E, on dit que f est continue sur A. Si elle est continue sur E tout entier, on dit simplement qu’elle est continue.
Espaces M´ etriques.
11
Th´ eor` eme 3 Soit f : E −→ E 0 une application continue entre deux espaces m´etriques. Soit A une partie compacte de E. Alors f (A) est compact. Soit (yn ) une suite de f (A). Il existe une suite (xn ) de A, telle que f (xn ) = yn . Comme A est compact, la suite (xn ) a une sous-suite qui converge vers un point l de A. Mais alors, (yn ) a une sous-suite qui converge vers f (l) ∈ f (A). 2 En particulier, on voit que toute application continue d’un espace compact dans R est born´ee et atteint ses bornes. Th´ eor` eme 4 Soit f : E −→ E 0 une application continue et injective entre deux espaces m´etriques. On suppose E compact. Alors f est un hom´eomorphisme de E vers f (E). La seule question est de voir que f −1 : f (E) −→ E est continue, autrement-dit, que pour tout ferm´e F de E, f (F ) est un ferm´e de f (E). Comme E est compact, F est aussi compact, de mˆeme que f (F ), qui est donc un ferm´e de f (E). 2 D´ efinition 24 Une application f : E −→ F entre deux espaces m´etriques est uniform´ement continue si ∀ε > 0 ∃η > 0 ∀x ∈ E ∀x0 ∈ E d(x, x0 ) < η =⇒ d(f (x), f (x0 )) < ε. Il faut remarquer que la seule diff´erence qu’il y a entre cette d´efinition et celle de la continuit´e simple en tout point x de E, est la place des quantificateurs. En, effet, il suffit de d´eplacer le quantificateur ∀x ∈ E au d´ebut de l’´enonc´e ci-dessus, pour obtenir la d´efinition de la continuit´e simple en tout point de E. Intuitivement, il faut penser que la continuit´e de f en un point x peut ˆetre de plus ou moins bonne qualit´e, suivant la fa¸con dont η d´epend de ε. Ce que dit la continuit´e uniforme, c’est que la continuit´e est d’aussi bonne qualit´e en tous les points de E. Th´ eor` eme 5 Si f : E −→ F est continue, et si E est compact, f est uniform´ement continue. En effet, si f n’´etait pas uniform´ement continue, il existerait un ε > 0, tel que pour tout η > 0, il y 1 ait deux points x et x0 tels que d(x, x0 ) < η et d(f (x), f (x0 )) > ε. En particulier, en prenant η = , on n 1 obtient deux suites (xn ) et (x0n ), telles que d(xn , x0n ) < et d(f (xn ), f (x0n )) > ε. n Comme E est compact, la suite (xn ) a un point d’accumulation γ dans E. Comme f est continue en ε γ, il existe η > 0, tel que pour tout x, d(x, γ) < η entraine d(f (x), f (γ)) < . Prenons maintenant n 2 η η assez grand pour que d(xn , γ) < , et d(xn , x0n ) < . Alors on a d(x0n , γ) < η, donc d(f (xn ), f (x0n )) ≤ 2 2 d(f (xn ), f (γ)) + d(f (γ), f (x0n )) < ε, ce qui est impossible. 2 Autre d´emonstration : Soit ε > 0. Pour chaque point x de E, il existe une boule ouverte Bx de centre x, telle que f (Bx ) soit contenu dans la boule ouverte de centre f (x) et de rayon ε/2. La famille (Bx )x∈E est un recouvrement ouvert de E. Il existe donc un nombre de Lebesgue ρ pour ce recouvrement. Il suffit alors de prendre η < ρ. En effet, si x et y sont deux points de E tels que d(x, y) < η, la boule de centre x et de rayon ρ contient x et y, et est contenue dans une boule Bz . On a alors d(f (x), f (y)) ≤ d(f (x), f (z)) + d(f (z), f (y)) ≤ ε. 2
Exercices 1 a) Montrer qu’une application f : E −→ E 0 est continue si et seulement si l’image r´eciproque par f de tout ouvert de E 0 est un ouvert de E. b) Montrer qu’une application f : E −→ E 0 est continue si et seulement si l’image r´eciproque par f de tout ferm´e de E 0 est un ferm´e de E.
12
Espaces M´ etriques.
2 Montrer qu’une application quelconque d’un espace m´etrique discret E vers un espace m´etrique F est continue. 3 Soit f : [0, 1] −→ [0, 1] une fonction continue. Soit x un point de [0, 1]. On d´efinit la suite (xn ) en posant xn = f n (x). Montrer que cette suite converge si et seulement si xn+1 − xn tend vers 0, quand n tend vers l’infini.
7
Un Th´ eor` eme de Prolongement
Th´ eor` eme 6 Soit E un espace m´etrique, A une partie dense de E, F un espace m´etrique complet, et f : A −→ F une application uniform´ement continue. Alors f admet un prolongement continu unique ` a E, et ce prolongement est uniform´ement continu. On commence par d´efinir le prolongement de f `a E tout entier. Soit donc x un point quelconque de E. Comme A est dense dans E, il existe une suite (un ) de points de A qui converge vers x, et qui est donc une suite de Cauchy. La suite image (f (un )) est aussi une suite de Cauchy. En effet, soit ε > 0 alors, comme f est uniform´ement continue, il existe un η tel que d(x, x0 ) < η entraine d(f (x), f (x0 )) < ε. Or pour avoir d(un , um ) < η, il suffit de prendre n et m assez grands. La suite (f (un )) converge donc dans F (qui est complet) vers une limite l. Cette limite est ind´ependante du choix qui a ´et´e fait de la suite (un ) convergeant vers x. En effet, si (vn ) est une autre suite convergeant vers x, la continuit´e uniforme de f montre que la distance de f (un ) `a f (vn ) tend vers 0 quand la distance de un `a vn tend vers 0. La fonction f est donc maintenant bien d´efinie sur E tout entier, et la d´efinition donn´ee est la seule possible, pour que ce prolongement soit continu (car il doit commuter aux limites de suites). Il nous reste `a montrer que f est uniform´ement continue sur E. Soit ε > 0. Comme f est uniform´ement continue sur A, il existe η > 0 tel que ∀x ∈ A ∀x0 ∈ A d(x, x0 ) < η =⇒ d(f (x), f (x0 )) <
ε . 3
Soient maintenant x et x0 deux point quelconques de E tels que d(x, x0 ) < η. Soient (un ) et (u0n ) deux suites de A convergeant respectivement vers x et x0 . Pour n assez grand, on a d(un , u0n ) < η, donc d(f (un ), f (u0n )) < ε. En faisant tendre n vers l’infini dans cette derni`ere in´egalit´e, on obtient d(f (x), f (x0 )) < ε. 2
8
Applications Lipschitziennes et Applications Contractantes
D´ efinition 25 Une application f : E −→ F entre deux espaces m´etriques est dite k-lipschitzienne (o` uk est une constante r´eelle), si ∀x ∈ E ∀y ∈ E d(f (x), f (y)) ≤ kd(x, y). Si k est strictement plus petit que 1, on dit que f est k-contractante. Une application lipchitzienne est a fortiori uniform´ement continue. Th´ eor` eme 7 Si l’espace m´etrique E est complet et non vide, et si l’application f : E −→ E est kcontractante (pour un certain k < 1), alors f admet un point fixe unique. Comme E n’est pas vide, il existe un ´el´ement x0 dans E. Construisons une suite de E par r´ecurrence en posant xn+1 = f (xn ). Soit d la distance de x0 `a x1 . Comme f est k-contractante, on voit facilement par r´ecurrence que d(xn , xn+1 ) < k n d. En cons´equence, on a
Espaces M´ etriques.
13
d(xn , xn+m ) < k n d(1 + k + k 2 + · · · + k m−1 ) ≤
kn d. 1−k
Il en r´esulte que (xn ) est une suite de Cauchy de E. Soit l la limite de cette suite. Alors, l et f (l) sont clairement limites de la mˆeme suite, ce qui montre que f (l) = l. l est donc un point fixe de f . Par ailleurs, l’in´egalit´e d(f (l), f (l0 )) ≤ kd(l, l0 ) < d(l, l0 ) montre que ce point fixe est unique. 2 Lemme 10 Sur un espace born´e, toute application lipschitzienne est born´ee. Dire que l’espace m´etrique E est born´e est dire qu’il existe un r´eel M , tel que d(x, y) ≤ M , pour tous x et y de E. Si maintenant, f : E −→ E est k–lipschitzienne (pour un certain k), et si x0 est un point de E, on a d(f (x), f (x0 )) ≤ kM pour tout x de E. Ceci montre bien que f est born´ee. 2 On voit donc que si E est born´e, l’ensemble des applications k–lipschitziennes de E vers F est un espace m´etrique, avec la distance : d(f, g) = sup d(f (x), g(x)). x∈E
Cet espace m´etrique sera not´e Lipk (E, F ). Th´ eor` eme 8 Soit E un espace m´etrique non vide, born´e et complet, et soit k ∈]0, 1[. L’application 1 de Lipk (E, E) vers E, qui ` a une application k-contractante associe son unique point fixe est 1−k lipschitzienne. En effet, soient f et g deux applications k–contractantes de E vers E. Soit x le point fixe de f , et y le point fixe de g. On a : d(x, y) = d(f (x), g(y)) ≤ d(f (x), g(x)) + d(g(x), g(y)) ≤ d(f, g) + kd(x, y) c’est-`a-dire (1 − k)d(x, y) ≤ d(f, g), d’o` u le r´esultat. 2
Solutions des exercices. Section 1. 1. La d´efinition des corps pr´ecise que le compl´ementaire de 0 dans K est un groupe d’´el´ement neutre 1. On a donc n´ecessairement 0 6= 1. Par ailleurs, on a pour tout x de K, 0x = 0, autrement–dit, 0 est “absorbant”. En effet, on a 0+0 = 0, puisque 0 est neutre pour l’addition, donc (0 + 0)x = 0x, c’est–`a–dire 0x + 0x = 0x par distributivit´e. Comme dans le groupe additif, tout ´el´ement est r´egulier, on a 0x = 0. On a aussi, pour tout x de K, −x = (−1)x, c’est–`a–dire que l’oppos´e de x est le produit de l’oppos´e de 1 par x. En effet, on a d’abord 1 + (−1) = 0, puisque −1 est l’oppos´e de 1, donc 1x + (−1)x = 0x = 0, par distributivit´e. Comme par ailleurs, 1x = x, puisque 1 est neutre pour la multiplication, on voit que −x = (−1)x. Enfin, pour tous x et y dans K, on a −(x + y) = −y − x (propri´et´e du groupe additif, et par ailleurs, −(x + y) = (−1)(x + y) = −x − y. Comme tout ´el´ement de K est un oppos´e, on voit que l’addition est commutative.
14
Espaces M´ etriques.
2. On sait d´ej`a que 1 est distinct de 0. Il suffit donc de montrer que 0 ≤ 1. Ceci va r´esulter de la deuxi`eme question, puisque 1 est le carr´e de 1. Il suffit donc de montrer que le carr´e de tout r´eel est positif. Soit donc x un r´eel. Si x ≥ 0, on a, en utilisant l’un des axiomes de R, x2 ≥ 0. Sinon, l’ordre ´etant total, on a n´ecessairement x ≤ 0. En ajoutant −x `a chaque membre de cette in´egalit´e, on trouve 0 ≤ −x. −x est donc positif, et on en d´eduit comme pr´ec´edemment que (−x)2 ≥ 0, c’est–`a–dire x2 ≥ 0. 3. La valeur absolue |x| du r´eel x est par d´efinition le plus grand des deux r´eels x et −x. Si x est positif, |x| ´etant au moins ´egale `a x, est aussi positive. Sinon, l’ordre ´etant total, x ne peut ˆetre que n´egatif, c’est–`a–dire que x ≤ 0. En ajoutant −x aux deux membres de cette ´egalit´e, on trouve −x ≥ 0, et on raisonne comme pr´ec´edemment. 4. Soit A une partie non vide et minor´ee de R. Il existe donc un r´eel a, tel que ∀x ∈ A a ≤ x. Notons −A le sous–ensemble suivant de R : −A = {x ∈ R| − x ∈ A}. Si x ∈ −A, alors −x ∈ A et a ≤ −x. On a donc en ajoutant x − a aux deux membres, x ≤ −a, ce qui montre que −A est major´e par −a. On peut donc utiliser l’un des axiomes de R, et on a une borne sup´erieure c pour −A. Autrement-dit, par d´efinition de la borme sup´erieure, c est le plus petit majorant de −A. En raisonnant comme pr´ec´edemment, on voit que c est le plus grand minorant de A, c’est–`a–dire la borne inf´erieure de A. 5.
Noter que ceci est la mˆeme chose que lim
n→+∞
1 = 0, n
et r´esulte imm´ediatemment du fait que R est archim´edien. 1 . Comme la suite des entiers ε 1 (n)n n’est pas major´ee, on voit qu’il existe un entier N , tel que pour tout n > N , on ait n ≥ , ce qui ε 1 peut aussi s’´ecrire ≤ ε, puisque n et ε sont positifs. n En effet, soit ε > 0. Comme ε n’est pas nul, on peut consid´erer le r´eel
Section 2. 1. Supposons d’abord que A est une partie ferm´ee de E. Il s’agit de montrer que E −A est voisinage de chacun de ses points. Soit donc x un point de E − A. S’il n’existait pas de boule ouverte de centre x 1 contenue dans E − A, alors pour tout entier n, la boule Bn de centre x et de rayon contiendrait un n point yn de A. La suite (yn ) converge clairement vers x, ce qui montre que x est adh´erent `a A, donc dans A, puisque A est ferm´ee, ce qui ne se peut pas. R´eciproquement, supposons E−A ouvert dans E. Il s’agit de montrer que tout point x qui est adh´erent `a A est dans A. Soit donc x un point de E adh´erent `a A. Il existe donc une suite (yn ) de A convergeant vers x. Si x n’´etait pas dans A, il serait dans l’ouvert E − A, et il existerait alors une boule ouverte B de centre x et de rayon r > 0, contenue dans E − A. Ceci contredit le fait que la suite (yn ), qui est dans A, converge vers x. 2. Il s’agit de montrer qu’une boule ouverte quelconque B de R contient au moins un rationnel. Soit x le centre de cette boule. Comme R est archim´edien, il existe un entier b plus grand que x. L’ensemble
Espaces M´ etriques.
15
des rationnels plus grands que x n’est donc pas vide, et il est minor´e par x. Il a donc une borne inf´erieure c, et on a x ≤ c. Si x ´etait diff´erent de c, c − x serait strictement positif, et il existerait un entier n tel 1 1 que 0 ≤ ≤ c − x, puisque R est archim´edien. Mais alors c − est un rationnel plus grand que x et n n strictement plus petit que c, ce qui ne se peut pas, par d´efinition de c. On a donc c = x, ce qui montre que x est adh´erent `a l’ensemble des rationnels qui sont plus grands que lui, donc que B contient des rationnels.
Section 4. 1. Comme E n’est pas vide, aucun des Ui ne peut ˆetre vide. On peut construire par r´ecurrence une suite (xn ) de points de E et une suite (Bn ) de boules ouvertes de E, telles que xn soit le centre de Bn , 1 Bn+1 ⊂ Bn , et Bn ⊂ Un . 2 En effet, on commence par choisir x0 dans U0 , et comme U0 est un ouvert de E, il existe une boule ouverte B0 de centre x0 contenue dans U0 . Supposons maintenant x0 , B0 , . . . , xn , Bn construits. Comme 1 Un+1 est un ouvert dense de E, Bn ∩Un+1 est un ouvert non vide. Il existe donc une boule ouverte Bn+1 2 1 de centre xn+1 contenue dans Bn ∩ Un+1 , ce qui montre qu’on peut construire les deux suite annonc´ees. 2 1 Comme Bn+1 est contenu dans Bn , on voit que chaque boule Bi contient tous les termes de la suite 2 xn `a partir du terme xi . Comme le diam`etre de Bn tend vers 0 quand n tend vers l’infini (au moins aussi 1 vite qu’une suite g´eom´etrique de raison ), on voit que (xn ) est une suite de Cauchy. Elle admet donc 2 une limite l. 1 Comme l est adh´erent `a Bn+1 , l est adh´erent `a Bn , et appartient donc `a Bn , donc `a Un . l est donc 2 dans A. 2. Dans la d´emonstration du th´eor`eme, on a commenc´e par construire la boule ouverte B0 de centre x0 , avec pour seule contrainte que B0 ⊂ U0 . Le point l de A qu’on a construit est alors dans B0 . Soit maintenant x un point de E et C un boule ouverte de centre x. Comme U0 est dense dans E, et que C ∩ U0 est un ouvert, on peut prendre la boule B0 incluse dans C ∩ U0 . Il en r´esulte que l est lui aussi dans C ∩ U0 , donc que A rencontre C. Ceci montre que A est dense dans E (mais pas n´ecessairement ouvert dans E). 3. Il suffit de prouver qu’aucune suite ne peut remplir R tout entier. Si (xn ) est une suite de r´eels, chaque sous–ensemble R − {xn } est un ouvert de R dense dans R. On a donc une famille d´enombrables d’ouverts denses, dont l’intersection en peut donc pas ˆetre vide, d’apr`es le th´eor`eme de Baire. Or un point de cette intersection ne peut pas appartenir `a la suite.
Section 5. 1. Soit E un espace m´etrique compact et discret. Chaque singleton {x} est alors un ouvert de E, et la famille d’ouverts ({x})x∈E recouvre donc E. Comme E est compact, une sous famille finie de cette famille suffit `a recouvrir E. Mais cette sous–famille ne contient qu’un nombre fini de singletons, et ne couvre donc qu’une partie finie de E. E est donc fini. 2. Raisonnons par l’absurde, et supposons qu’aussi petit que soit ρ, il existe une boule ouverte de rayon ρ ayant son centre dans A et non contenue dans l’un des ouverts de la famille. Alors, pour 1 tout entier n, il existe une boule B(xn , ) telle que xn soit dans A, et qui n’est pas contenu dans l’un n
16
Espaces M´ etriques.
des ouverts de la famille. La suite (xn ) a un point d’accumulation dans A, disons γ. Comme la famille d’ouverts couvre A, il existe un ouvert de la famille qui contient γ, et qui contient donc une boule B(γ, ε) ε de centre γ. Choisissons n assez grand pour que, d’une part la distance de xn `a γ soit plus petite que , 2 1 ε 1 et d’autre part soit lui-mˆeme plus petit que . Alors, la boule B(xn , ) est contenue dans la boule n 2 n B(γ, ε), donc dans l’un des ouverts de la famille, ce qui ne se peut pas (Lemme de Lebesgue, ρ s’appelle un nombre de Lebesgue pour le recouvrement donn´e). 3. Raisonnons par l’absurde, et supposons qu’aucune sous-famille finie de (Ui )i∈I ne recouvre A. Soit ρ un nombre de Lebesgue pour le recouvrement (Ui )i∈I (exercice pr´ec´edent). On peut construire une suite (xn )n∈N dans A, telle que les distances mutuelles de deux termes quelconques de la suite soit au moins ρ. En effet, supposons x1 , . . . , xn−1 d´ej`a construits, de telle fa¸con que pour chaque j entre 1 et n − 1, on ait une boule de centre xj et de rayon ρ contenue dans un ouvert Uij du recouvrement donn´e. La famille finie d’ouverts Uji ne recouvre pas A, et il existe donc un point xn qui n’est pas dans leur r´eunion. Par ailleurs, la boule de centre xn et de rayon ρ est contenue dans un ouvert Uin du recouvrement, d’apr`es le lemme de Lebesgue. Maintenant il est clair qu’une telle suite ne saurait avoir de point d’accumulation, ce qui est contradictoire (th´eor`eme de Borel–Lebesgue). 4. Il s’agit de montrer que toute suite (xn ) de E a un point d’accumulation. Supposons que (xn ) soit une suite sans point d’accumulation. Alors l’image de cette suite est un ferm´e de E. Plus g´en´eralement, pour tout entier n, l’ensemble {xn , xn+1 , . . .} est une partie ferm´ee de E. Si on pose Un = E − {xn , . . .}, on obtient une famille (Un ) d’ouverts de E qui recouvrent E. Un nombre fini d’entre eux suffit donc pour recouvrir E. Mais comme ils sont totalement ordonn´es par l’inclusion, l’un d’entre eux est `egal `a E, ce qui signifie que la suite (xn ) a une image finie. Ceci contredit le fait qu’elle n’a pas de point d’accumulation.
Section 6. 1. 2. 3. Si la suite (xn ) converge, il est clair que xn+1 − xn tend vers 0. R´eciproquement, supposons que xn+1 − xn tende vers 0. Comme [0, 1] est compact, la suite (xn ) a au moins un point d’accumulation. Tout le probl`eme est de prouver qu’elle n’en a qu’un seul. Supposons donc qu’elle en ait deux, α et β (α < β). Soit γ un point de l’intervalle ]α, β[, et soit V une boule ouverte de centre Γ, contenue dans ]α, β[, et de largeur ε. Pour n assez grand, on a |xn+1 − xn | < ε, et comme α et β sont des points d’accumulation, il y a n´ecessairement un terme de la suite dans V. En cons´equence, tous les points de l’intervalle [α, β] sont des points d’accumulation de la suite. Soit ε > 0. L’ensemble des termes xn de la suite tels que xn soit dans l’intervalle [α, β], et tels que |f (xn ) − xn | < ε est dense dans [α, β]. Comme f est continue, on a |f (x) − x| < ε, pour tout x de [α, β], et comme ceci est vrai pour tout ε, on a f (x) = x pour tout x de [α, β]. Mais ce dernier point implique que la suite est stationnaire, ce qui contredit l’hypoth`ese.
Le Béaba des Espaces Normés et Algèbres de Banach Alain Prouté Université Denis Diderot-Paris 7 Dernière révision de ce texte : 21 novembre 2012 Ce texte a été écrit pour le niveau Licence 2.
Table des matières 1 2 3 4 5 6 7 8
1
Normes. Normes sur un espace de dimension finie. Continuité des applications linéaires. Normes équivalentes. Espaces et algèbres de Banach. Quelques propriétés des algèbres de Banach. L’application exponentielle. Comparaison des fonctions au voisinage d’un point.
1 3 4 5 6 8 9 10
Normes.
+ 1 Définition. Soit E un espace vectoriel réel. Une « norme » sur E est une application N : E → [0, +∞[, telle que (pour tous x et y de E, et tout a de R) : • N (x) > 0, pour tout x non nul, • N (x + y) ≤ N (x) + N (y), • N (ax) = |a|N (x). Noter que le dernier axiome implique que N (0) = 0 et N (x) = N (−x). L’inégalité N (x + y) ≤ N (x) + N (y) s’appelle l’« inégalité triangulaire ». On peut l’utiliser de la façon suivante : N (x) = N (x + y − y) ≤ N (x + y) + N (−y) = N (x + y) + N (y) ce qui donne N (x) − N (y) ≤ N (x + y). En échangeant les rôles de x et y, on a aussi N (y) − N (x) ≤ N (x + y), ce qui donne finalement : |N (x) − N (y)| ≤ N (x + y) L’inégalité triangulaire complète est donc la suivante : |N (x) − N (y)| ≤ N (x + y) ≤ N (x) + N (y) qui peut se lire comme suit si on assimile 0, x et −y aux sommets d’un triangle et la norme d’un vecteur à sa longueur : « dans un triangle, la longueur d’un coté est comprise entre la différence et la somme des longueurs des deux autres cotés. »
Il arrive qu’on ait à considérer plusieurs normes distinctes sur un même espace vectoriel E, mais quand ce n’est pas le cas, et donc quand aucune ambiguïté ne peut en résulter, il est d’usage de noter kxk la norme de x quel que soit l’espace vectoriel E. L’inégalité triangulaire s’écrit alors : | kxk − kyk | ≤ kx + yk ≤ kxk + kyk + 2 Définition. Soit k k une norme sur E. La « distance associée » à k k est l’application d : E × E → [0, +∞[ donnée par d(x, y) = kx − yk. La vérification que les axiomes des distances sont satisfaits est sans difficulté. Tout espace normé est donc aussi un espace métrique, et cela a un sens de parler d’application continue sur E ou à valeurs dans E relativement à une norme donnée. Noter en particulier que l’application x 7→ kxk est continue relativement à elle-même. En effet, on a d(kxk, kak) = | kxk − kak | ≤ kx − ak = d(x, a), ce qui montre que kxk tend vers kak, quand x tend vers a. On voit même que l’application x 7→ kxk est 1-lipschitzienne pour la distance qui lui est associée. + 3 Remarque. Noter toutefois qu’il n’y a aucune raison en général pour que x 7→ kxk soit continue relativement à une autre distance, même si celle-ci est associée à une norme.( 1 ) Par exemple, sur l’espace E des fonctions continuement dérivables [0, 1] → R, on a la distance associée à la norme de la convergence uniforme qui est donnée par kf k = sup |f (x)|, et on a aussi la norme N définie x∈[0,1]
par N (f ) = sup |f (x)| + |f 0 (x)|. Cette dernière n’est pas continue relativement à la distance de la x∈[0,1]
convergence uniforme, car une suite de fonctions continuement dérivables peut converger uniformément vers 0 sans qu’il en soit de même de la suite des dérivées de ces fonctions. C’est par exemple le cas de 1 la suite (x 7→ cos(nx))n∈N . n √ + 4 Lemme. Soit (x, y) 7→ x.y un produit scalaire sur E. l’application x 7→ x.x est une norme sur E, dite « associée » au produit scalaire (x, y) 7→ x.y. Démonstration. On a : (kx + yk)2
= (x + y).(x + y) = x.x + 2x.y + y.y ≤ x.x + 2|x.y| + y.y ≤ kxk2 + 2kxk kyk + kyk2 = (kxk + kyk)2
(inégalité de Cauchy-Schwartz)
L’inégalité triangulaire en résulte. Les autres propriétés sont trivialement vérifiées.
o
+ 5 Lemme. Si E et F sont deux espaces normés, on peut faire de E × F un espace normé en posant : k(x, y)k = sup(kxk, kyk) o Noter que les projections canoniques (x, y) 7→ x et (x, y) 7→ y de E × F sur E et sur F sont continues, et même 1–lipschitziennes, puisqu’elles diminuent la norme. On aurait les mêmes propriétés en prenant p comme norme sur E × F : k(x, y)k = kxk + kyk, ou k(x, y)k = |xk2 + kyk2 , mais nous supposerons dans la suite que la norme à choisir par défaut sur E × F est la norme « sup », introduite en premier. 1. Sauf, comme on va le voir plus loin, dans le cas de la dimension finie.
2
Noter qu’une application à valeurs dans le produit E × F est continue si et seulement si ses deux composantes (c’est-à-dire ses compositions avec les deux projections canoniques) sont continues.
2
Normes sur un espace de dimension finie.
Si E est un espace vectoriel de dimension finie et si B = (e1 , . . . , en ) est une base de E, on peut associer plusieurs normes à cette base. Les plus couramment utilisées sont notées k k1 , k k2 et k k∞ , et sont définies, pour x = x1 e1 + · · · + xn en , par • kxk1 = |x1 | + · · · + |xn | p • kxk2 = |x1 |2 + · · · + |xn |2 • kxk∞ = sup(|x1 |, . . . , |xn |) On a déjà vérifié plus haut que k k2 est bien une norme. La vérification pour les deux autres ne pose aucune difficulté. Noter qu’on a les inégalités kxk∞ ≤ kxk2 ≤ kxk1 En effet, pour la première on a kxk∞ = |xi | pour un certain i, et |xi |2 ≤ |x1 |2 + · · · + |xn |2 . La seconde résulte de |x1 |2 + · · · + |xn |2 ≤ (|x1 | + · · · + |xn |)2 . On a également : kxk1 ≤ nkxk2
kxk2 ≤
et
√
nkxk∞
En effet, on a clairement kxk1 ≤ nkxk∞ , d’où la première inégalité. La deuxième résulte de l’inégalité évidente kxk22 ≤ nkxk2∞ . Il résulte de tout cela que si on note d1 , d2 et d∞ les distances associées aux trois normes ci-dessus, on a pour tout x et y de E : √ d∞ (x, y) ≤ d2 (x, y) ≤ d1 (x, y) d1 (x, y) ≤ nd2 (x, y) d2 (x, y) ≤ nd∞ (x, y) et donc que les notions de continuité relatives à d1 , d2 et d∞ sont équivalentes. + 6 Lemme. Soit B = (e1 , . . . , en ) une base d’un espace E de dimension finie et soit d l’une des distances d1 , d2 et d∞ associées à cette base. Soit N une norme quelconque sur E. Alors N est continue pour la distance d. Démonstration. D’après ce qui précède, il suffit de traiter le cas de d∞ . On a (pour x = x1 e1 +· · ·+xn en ) : N (x)
= N (x1 e1 + · · · + xn en ) ≤ |x1 |N (e1 ) + · · · + |xn |N (en ) ≤ K sup(|x1 |, . . . , |xn |) = Kkxk∞
(où K = N (e1 ) + · · · + N (en ))
ce qui montre la continuité de N en 0. L’inégalité |N (x) − N (a)| ≤ N (x − a) permet d’en déduire la continuité de N en tout point a de E. o
3
3
Continuité des applications linéaires.
+ 7 Lemme. Soient E et F deux espaces vectoriels réels normés, et f : E → F une application linéaire. Les conditions suivantes sont équivalentes. • (1) Il existe un réel k tel que kf (x)k ≤ k, pour tout x de E tel que kxk = 1. • (2) Il existe un réel k tel que kf (x)k ≤ kkxk, pour tout x de E. • (3) f est continue en 0. • (4) f est continue en tout point de E. Démonstration. Montrons que (1) entraine (2). Soit x un vecteur de E. Si x est nul, l’inégalité kf (x)k ≤ x kkxk est trivialement vérifiée. Sinon, posons y = . Le vecteur y est alors de norme 1, et on a par kxk hypothèse kf (y)k ≤ k. En multipliant les deux membres par kxk, et en utilisant la définition de la norme et la linéarité de f , on voit que kf (x)k ≤ kkxk. Que (2) entraine (3) est trivial, puisque (2) montre que f (x) tend vers 0 quand x tend vers 0. (4) résulte facilement de (3), grâce à la linéarité de f . En effet, la différence f (x)−f (x0 ) étant simplement f (x − x0 ), le fait que x tende vers x0 entraine que x − x0 tend vers 0, donc que f (x − x0 ) tend vers 0 (par (3)), et donc que f (x) tend vers f (x0 ). Il suffit pour terminer de prouver que (4) entraine (1). Supposons donc f continue. Elle est en particulier continue en 0. Donc, pour tout ε > 0, il existe alors η > 0, tel que pour tout x de E on ait : kxk ≤ η ⇒ kf (x)k ≤ ε. 1 . Soit x un η vecteur de E de norme 1. Alors ηx est de norme inférieure ou égale à η, donc ηf (x) = f (ηx) est de norme inférieure ou égale à 1. Ceci montre que f (x) est de norme inférieure ou égale à k. o En particulier, pour ε = 1, on a un η > 0, tel que kxk ≤ η ⇒ kf (x)k ≤ 1. Posons k =
La borne inférieure de l’ensemble des k vérifiant (1) ou (2) ci–dessus (qui existe si f est continue), s’appelle la « norme » de l’application linéaire f , et est noté kf k. La condition (2) peut donc encore s’écrire kf (x)k ≤ kf k kxk. On voit donc qu’une application linéaire entre espaces normés est continue si et seulement si elle a une norme. On dit aussi dans ce cas que l’application f est « bornée ». + 8 Lemme. Le norme d’une application linéaire continue f : E → F est donnée par l’une quelconque des formules suivantes : kf k = sup kf (x)k = sup kf (x)k = kxk=1
kxk≤1
kf (x)k kf (x)k = sup , kxk x∈E−{0} kxk=a kxk sup
où a est un réel strictement positif quelconque. Démonstration. En effet, on a défini la norme de f comme la borne inférieure de l’ensemble des k tels que pour tout x de E, on ait kf (x)k ≤ kkxk. On voit donc que pour tout x de norme 1, on a kf (x)k ≤ kf k. Il en résulte que : sup kf (x)k ≤ kf k. kxk=1
4
Si ce sup (appelons–le s) était strictement inférieur à kf k, on aurait kf (x)k ≤ s pour tout x de norme 1, et kf k ne serait alors pas la borne inférieure de l’ensemble des k vérifiant (1). On a donc kf k = sup kf (x)k. kxk=1
Les autres formules s’en déduisent facilement en utilisant la linéarité de f .
o
+ 9 Lemme. La notion de norme définie ci-dessus pour les applications linéaire continues d’un espace normé E vers un espace normé F , est une norme sur L(E, F ) au sens de la définition 1 (page 1).
4
Normes équivalentes.
Soit E un espace vectoriel, N1 et N2 deux normes sur E. On dit que N2 « domine » N1 s’il existe un réel K tel que pour tout x ∈ E, on ait N1 (x) ≤ KN2 (x). Deux normes qui se dominent l’une l’autre sont dites « équivalentes ». Autrement-dit, N1 et N2 sont équivalentes si et seulement si il existe des réels K et k 6= 0 tels que pour tout x ∈ E, on ait kN2 (x) ≤ N1 (x) ≤ KN2 (x). On a montré plus haut que les normes k k1 , k k2 et k k∞ associées à une base d’un espace de dimension finie sont équivalentes. Mais on a mieux : + 10 Lemme. Sur un espace vectoriel réel de dimension finie, toutes les normes sont équivalentes. Démonstration. Traitons d’abord le cas où E est Rn . La distance usuelle sur Rn est la distance d2 associée à la base canonique. Soit N une norme quelconque sur Rn . On sait que la sphère unité S de Rn , définie par S = {x ∈ Rn | d2 (x, 0) = kxk2 = 1} est une partie compacte de E. Comme N : Rn → R est continue (lemme 2 (page 3)), N (S) est une partie compacte de R, en fait une partie compacte de ]0, +∞[ car N ne s’annule qu’en 0 qui n’appartient pas à S. Il en résulte qu’il existe des réels k et K strictement positifs tels que k ≤ N (x) ≤ K pour tout x de Rn . Autrement-dit, si kxk2 = 1, on a kkxk2 ≤ N (x) ≤ Kkxk2 . L’axiome N (ax) = |a|N (x) de la définition des normes montre qu’il en est de même pour tout x 6= 0, et donc pour tout x ∈ E, ce qui signifie que N et k k2 sont équivalentes. Le cas général s’en déduit par utilisation de l’unique isomorphisme linéaire f : Rn → E qui envoie la base canonique de Rn sur une base choisie dans E (qui est supposé de dimension n). On a alors kf (x)kE = 2 n Rn n Rn kxk2 , et si N est une norme sur E, N ◦ f est une norme sur R , et on a kkxk2 ≤ N (f (x)) ≤ KkxkR 2 , E donc kkf (x)kE o 2 ≤ N (f (x)) ≤ Kkf (x)k2 . Le lemme en résulte par surjectivité de f . + 11 Lemme. Si E est de dimension finie, toute application linéaire f : E → F , où F est un espace normé, est continue relativement à toute norme sur E. Démonstration. D’après le lemme 10, il suffit de traiter le cas où la norme de E est la norme k k∞ associée à une base quelconque de E. Notons k kF la norme donnée sur F . Pour tout x = x1 e1 + · · · + xn en de E, on a : kf (x)kF = kf (x1 e1 + · · · + xn en )kF ≤ |x1 |kf (e1 )kF + · · · + |xn |kf (en )kF ≤ Kkxk∞ où on a posé K = kf (x1 )kF + · · · + kf (xn )kF . L’application f est donc continue en 0 et sa linéarité entraîne qu’elle est continue sur E tout entier. o
5
5
Espaces et algèbres de Banach.
Comme tout espace normé E est un espace métrique, la notion de suite de Cauchy de E a un sens. + 12 Définition. Un espace normé est dit « complet » si toute suite de Cauchy de E est convergente. Un espace vectoriel réel normé complet est appelé un « espace de Banach ». C’est le cas de Rn muni de la norme euclidienne, ou de toute autre norme, puisqu’elles sont toutes équivalentes. De même, tout espace vectoriel réel normé de dimension finie est un espace de Banach. + 13 Lemme. Si E et F sont des espaces de Banach, il en est de même de E × F , quand on le munit de l’une quelconque des normes k(x, y)k
=
k(x, y)k
= kxk + kyk p = kxk2 + kyk2
k(x, y)k
sup(kxk, kyk)
Démonstration. Soit ((xn , yn ))n une suite de Cauchy de E × F . Comme les projections canoniques sont lipschitziennes, les suites (xn )n et (yn )n sont aussi de Cauchy, donc convergentes. Soient x et y leurs limites. Soit ε > 0. Pour n assez grand, les normes de xn − x et de yn − y sont plus petites que ε.( 2 ) Il s’en suit que pour ces n, la norme de (xn , yn ) − (x, y) est plus petite que 2ε. o + 14 Définition. Soit E un espace normé. Une application R-bilinéaire et associative (qu’on appelera « multiplication », et qu’on notera (x, y) 7→ xy) de E × E vers E, et un élément de E (qu’on appellera « unité », et qu’on notera 1) neutre pour la multiplication, font de E une « algèbre unitaire normée », si les conditions suivantes sont satisfaites, pour tous x et y de E : kxyk ≤ kxk kyk k1k = 1 Si de plus E est complet, on dit qu’il s’agit d’une « algèbre de Banach ». On notera que la condition kxyk ≤ kxk kyk assure la continuité de la multiplication en 0. En effet, elle montre que pour rendre xy aussi petit qu’on veut, il suffit de rendre x et y assez petits. Par ailleurs, la bilinéarité de la multiplication entraîne qu’elle est continue sur E × E. + 15 Exemple.
L’algèbre des matrices carrées n × n, avec la norme : kAk = sup kAXk, kXk=1
où X est un vecteur de Rn (i.e. une matrice colonne), et où X 7→ kXk est une norme quelconque sur Rn , est un exemple d’algèbre de Banach, de même que l’algèbre des fonctions continues d’un espace compact vers R, muni de la norme de la convergence uniforme. Ces affirmations se vérifient facilement. + 16 Définition. Soit E un espace de Banach. Une série : ∞ X
un
n=0
2. On notera que le fait qu’il n’y ait que deux (en fait un nombre fini de) facteurs dans le produit E × F nous permet de trouver un même n ayant cette propriété pour les deux suites. Ce raisonnement ne s’applique donc pas dans le cas d’un produit infini d’espaces normés complets.
6
où un ∈ E est dite normalement convergente, si la série de nombres réels : ∞ X
kun k
n=0
converge. + 17 Lemme. Dans un espace de Banach, toute série
X
un normalement convergente est convergente,
n
et la norme de sa somme est majorée par la somme des normes de ses termes. Démonstration. Comme la série
∞ X
kun k converge, pour tout ε > 0, on a kup k + · · · + kup+q k ≤ ε
n=0
dès que p est assez grand. A fortiori, on a kuX p + · · · + up+q k ≤ ε pour p assez grand, ce qui montre que la suite des sommes partielles de la série un forment une suite de Cauchy, qui par conséquent converge. Chacune de ces somme partielle ayant par ailleurs une norme majorée par la somme partielle correspondante de la série des normes, on a la dernière assertion de l’énoncé. o On notera L(E, F ) l’espace des applications linéaires continues de E vers F . D’après ce qu’on a vu plus haut, L(E, F ) est un espace normé. + 18 Lemme. Si F est complet, il en est de même de L(E, F ). Démonstration. En effet, soit (fn )n une suite de Cauchy dans L(E, F ). Pour x fixé dans E, la suite (fn (x))n est une suite de Cauchy de F . En effet, la norme de fp (x) − fq (x) est majorée par kfp − fq k kxk. La suite (fn (x))n converge donc dans F vers un élément qu’on notera f (x). Ceci définit une fonction f de E vers F . Cette fonction f est linéaire. En effet, pour tout ε > 0, tout x de E, tout y de E et tout α de R, on a : kf (x + αy) − f (x) − αf (y)k ≤ kf (x + αy) − fp (x + αy)k + kf (x) − fp (x)k + |α| kf (y) − fp (y)k. Or le deuxième membre de cette inégalité est plus petit que ε dès que p est assez grand. Comme le premier membre ne dépend pas de p, il doit être nul. Par ailleurs, la convergence des fn vers f est uniforme sur la boule unité de E. En effet, d’après l’hypothèse, kfp − fq k ≤ ε dès que p et q sont plus grands qu’un certain entier N (dépendant de ε). Il en est donc de même de kfp (x) − fq (x)k quand kxk ≤ 1. Ce qui montre que les suites (fn (x))n sont uniformément de Cauchy pour x dans la boule unité de E. La convergence uniforme en résulte, puisque la condition kfp (x) − fq (x)k ≤ ε pour tous p et q plus grands que N entraine kfp (x) − f (x)k ≤ ε pour p plus grand que N , et ceci indépendamment de x. On en déduit que f est continue, et qu’elle appartient donc à L(E, F ). Pour terminer, on a la majoration kfp − f k ≤ ε, pour p plus grand que N . Ceci montre que f est bien la limite des fn , dans l’espace L(E, F ). o L’algèbre des endomorphismes continus L(E, E) d’un espace de Banach E est une algèbre normée, avec la composition comme multiplication, et l’application identique comme unité. Si de plus E est complet, c’est une algèbre de Banach. Bien sûr, la continuité de f pour la norme suggérée ci–dessus est équivalente à la continuité de f 7
pour p toute autre norme équivalente à celle–ci. C’est le cas des normes (x, y) 7→ kxk + kyk, et (x, y) 7→ kxk2 + kyk2 .
6
Quelques propriétés des algèbres de Banach.
+ 19 Lemme. Soit A une algèbre de Banach. La boule ouverte de centre 1 et de rayon 1 dans A ne contient que des éléments inversibles. Démonstration. En effet, supposons que x soit dans cette boule, c’est–à–dire que k1 − xk < 1. Posons u = 1 − x. Alors, la série géométrique ∞ X un n=0
est normalement convergente dans A, puisque kuk < 1. Par ailleurs, on a l’identité remarquable (1 − u)(1 + u + u2 + · · · + un−1 ) = 1 − un , qui montre (comme un tend vers 0 quand n tend vers l’infini, et comme la multipication de A est continue) que les somme partielles de la série ci–dessus tendent vers un inverse de 1 − u, c’est–à–dire un inverse de x. o Il est clair que la boule ci–dessus est d’ailleurs la plus grande boule de centre 1 ne contenant que des éléments inversibles, puisque 0, qui n’est pas inversible, est à la distance 1 de 1. On notera A∗ l’ensemble des éléments inversibles de A. C’est clairement un groupe multiplicatif ayant 1 pour élément neutre. Dans le cas de l’algèbre des matrices carrées n × n, A∗ n’est autre que le groupe linéaire GLn (R). + 20 Lemme. Dans toute algèbre de Banach A, A∗ est un ouvert de A. Démonstration. Il suffit de montrer que A∗ est voisinage de chacun de ses points. On sait déjà par le lemme précédent qu’il est voisinage de 1. Soit x un point quelconque de A∗ . Alors l’application y 7→ x−1 y, qui est continue (car le produit de A est continu), envoie x sur 1. Elle envoie donc un voisinage V de x dans la boule de centre 1 et de rayon 1. Si y est dans V , alors x−1 y est inversible, ce qui montre que y est inversible. o En particulier GLn (R) est un ouvert de l’algèbre des matrices (ce qui peut aussi se voir en utilisant la continuité du déterminant). + 21 Lemme. Pour tout h tel que khk < 1 dans une algèbre de Banach A, on a les inégalités : k(1 + h)−1 k ≤
1 1 − khk
k(1 + h)−1 − 1k ≤
et
khk . 1 − khk
Démonstration. L’inverse de 1 + h est la somme de la série normalement convergente : 1 − h + h2 − h3 + . . .
8
Il en résulte que les normes de (1 + h)−1 et (1 + h)−1 − 1 sont majorées respectivement par les sommes des séries : 1 + khk + khk2 + khk3 + . . . et khk + khk2 + khk3 + . . . qui valent respectivement
khk 1 et . 1 − khk 1 − khk
o
+ 22 Lemme. Soit A une algèbre de Banach. Alors, l’application x 7→ x−1 de A∗ vers A∗ est continue. Démonstration. Il est clair que la deuxième des inégalités du lemme précédent implique la continuité de khk tend vers 0 quand h tend vers 0. x 7→ x−1 en 1, puisque 1 − khk Pour montrer la continuité de x 7→ x−1 en un point x quelconque, notons que : (x + h)−1 = (x(1 + x−1 h))−1 = (1 + x−1 h)−1 x−1 . Quand h tend vers 0, le produit x−1 h tend vers 0 (continuité de la multiplication), donc 1 + x−1 h tend vers 1 de même que (1 + x−1 h)−1 , ce qui fait que (x + h)−1 tend vers x−1 . o On notera que la norme de x−1 ne se déduit en général pas de celle de x (contrairement à la norme de (1 + h)−1 qui comme on l’a vu se déduit de celle de h). L’exemple suivant met ce fait en évidence. Soit A l’algèbre de Banach des matrices réelles 2 × 2, et considérons la matrice : a 0 0 b avec 0 < b < a. Cette matrice est inversible et sa norme est a. Son inverse est la matrice : −1 a 0 0 b−1 dont la norme est b−1 . Cette norme peut être rendue aussi grande qu’on veut, en diminuant b, sans pour autant changer la norme de la matrice originelle. En particulier, il ne faut pas croire que kx−1 k = kxk−1 . Toutefois, on a toujours kxk kx−1 k ≥ kxx−1 k = k1k = 1.
7
L’application exponentielle.
Soit A une algèbre de Banach. Pour tout élément x de A, on peut considérer la série : exp(x) =
∞ X xn . n! n=0
Cette série est normalement convergente. En effet, il résulte de l’inégalité kxyk ≤ kxk kyk, que kxn k ≤ kxkn . La norme du terme général de la série ci–dessus est donc majorée par le terme général de la série : ∞ X kxkn , n! n=0
9
qui est convergente (série exponentielle ordinaire pour les éléments de R). On a de plus kex k ≤ ekxk . On a donc une application exponentielle bien définie pour toute algèbre de Banach A. Un cas particulier important est celui des algèbres de matrices. Si x et y sont deux éléments de A qui commutent (xy = yx), alors : exp(x) exp(y) = exp(x + y). En effet, il suffit de multiplier terme à terme les séries définissant exp(x) et exp(y), ce qui est possible, puisqu’il s’agit de séries normalement convergentes. On obtient, la série définissant exp(x + y), car si x et y commutent, on peut utiliser la formule du binôme pour développer (x + y)n . On voit aussi que exp(0) = 1. On a donc exp(−x) exp(x) = 1, puisque x et −x commutent, ce qui montre que pour tout x de A, exp(x) est inversible. Par ailleurs, comme il s’agit d’une série entière de rayon de convergence infini, la convergence est uniforme sur toute partie bornée de A. L’application exponentielle est donc continue.
8
Comparaison des fonctions au voisinage d’un point.
+ 23 Définition. Soient E, F et G des espaces de Banach. Soit U un ouvert de E, et soient f : U → F et g : U → G des fonctions continues. Soit enfin x0 un point de U . • On dit que f est K–dominée par g au voisinage de x0 , s’il existe un voisinage V de x0 contenu dans U , tel que ∀x ∈ V kf (x)k ≤ Kkg(x)k. • On dit que f est dominée par g au voisinage de x0 , s’il existe K tel que f soit K–dominée par g au voisinage de x0 . • On dit que f est négligeable devant g au voisinage x0 , si pour tout K > 0, f est K–dominée par g au voisinage de x0 . On voit donc que f est négligeable devant g au voisinage de x0 , si pour tout ε > 0, il existe un voisinage V de x0 , tel que pour tout x de V , on ait kf (x)k ≤ εkg(x)k. Bien entendu, plus ε est petit, plus le vvoisinage V doit être pris petit. + 24 Lemme. Soit l une application linéaire continue de F vers un espace de Banach H. Si f est dominée par g au voisinage de x0 , alors l ◦ f est dominée par g au voisinage de x0 . Si f est négligeable devant g au voisinage de x0 , l ◦ f est négligeable devant g au voisinage de x0 . Enfin, si f est dominée par g au voisinage de x0 , toute fonction négligeable devant f au voisinage de x0 est négligeable devant g au voisinage de x0 . Démonstration. Comme l est linéaire continue, on a kl(y)k ≤ klk kyk pour tout y de F . f étant dominée par g au voisinage de x0 , il existe K tel que, kf (x)k ≤ Kkg(x)k, pour tout x d’un voisinage V de x0 dans E. On a alors kl(f (x))k ≤ klk kf (x)k ≤ klkKkg(x)k, pour tout x de V . Ceci montre que l ◦ f est dominée par g au voisinage de x0 . De même, si f est négligeable devant g au voisinage de x0 , pour tout ε > 0, on a un voisinage V de x0
10
(dépendant de ε), tel que kf (x)k ≤ εkg(x)k, pour tout x de V . On a alors kl(f (x))k ≤ klk kf (x)k ≤ klkεkg(x)k, pour tout x de V , ce qui montre que l ◦ f est négligeable devant g au voisinage de x0 . Enfin, f étant dominée par g au voisinage de x0 , il existe un réel K > 0 et un voisinage V de x0 , tels que kf (x)k ≤ Kkg(x)k, pour tout x de V . Si maintenant h est une fonction négligeable devant f au ε voisinage de x0 , on a pour tout ε > 0, un voisinage V 0 de x0 , tel que kh(x)k ≤ kf (x)k, pour tout x K de V 0 . On a donc : ε kh(x)k ≤ kf (x)k ≤ εkg(x)k, K pour tout x de V ∩ V 0 . Ceci montre que h est négligeable devant g au voisinage de x0 .
o
+ 25 Définition. Si f est négligeable devant g au voisinage d’un point x0 , on dira aussi que f (x) est négligeable devant g(x) quand x tend vers x0 . Pour bien comprendre le sens de cette dernière définition, il faut remarquer que f (x) n’est pas la fonction f , mais la valeur que prend cette fonction en x. C’est la raison pour laquelle, la nouvelle locution fait mention de x (alors que l’ancienne locution ne fait mention que de x0 ), de façon qu’on puisse à partir de f (x) et de x retrouver la fonction x 7→ f (x), qui n’est autre que f .
11