Analisi matematica II
Claudio Canuto, Anita Tabacco
Analisi matematica II Teoria ed esercizi con complementi in rete
CLAUDIO CANUTO Dipartimento di Matematica Politecnico di Torino ANITA TABACCO Dipartimento di Matematica Politecnico di Torino
ISBN 978-88-470-0873-1 Springer Milan Berlin Heidelberg New York e-ISBN 978-88-470-0874-8 Springer Milan Berlin Heidelberg New York Springer-Verlag fa parte di Springer Science+Business Media springer.com © Springer-Verlag Italia, Milano 2008
Quest’opera è protetta dalla legge sul diritto d’autore e la sua riproduzione è ammessa solo ed esclusivamente nei limiti stabiliti dalla stessa. Le fotocopie per uso personale possono essere effettuate nei limiti del 15% di ciascun volume dietro pagamento alla SIAE del compenso previsto. Le riproduzioni per uso non personale e/o oltre il limite del 15% potranno avvenire solo a seguito di specifica autorizzazione rilasciata da AIDRO, Via Corso di Porta Romana n. 108, Milano 20122, e-mail
[email protected] e sito web www.aidro.org. Tutti i diritti, in particolare quelli relativi alla traduzione, alla ristampa, all’utilizzo di illustrazioni e tabelle, T alla citazione orale, alla trasmissione radiofonica o televisiva, alla registrazione su microfilm o in database, o alla riproduzione in qualsiasi altra forma (stampata o elettronica) rimangono riservati anche nel caso di utilizzo parziale. La violazione delle norme comporta le sanzioni previste dalla legge. 9
7
8
6
5
4
3
2
1
Riprodotto da copia camera-ready fornita dagli Autori Progetto grafico della copertina: Simona Colombo, Milano Stampato in Italia: grafic f he porpora, Segrate, Milano Springer-Verlag Italia Srl, Via Decembrio 28, 20137 Milano
Prefazione
Questo volume costituisce il proseguimento della presentazione dei principali strumenti di base dell’Analisi Matematica iniziata nel nostro libro Analisi Matematica I - anch’esso pubblicato da Springer - a cui faremo riferimento nel testo come Vol. I. Gli argomenti qui trattati vengono tradizionalmente demandati, nella maggior parte delle sedi universitarie italiane, ad un secondo corso di Analisi Matematica. La scelta dei contenuti e delle modalit` a di presentazione per un tale insegnamento `e assai pi` u variegata e flessibile rispetto a quella per un corso di Analisi Matematica I, usualmente dedicato in massima parte alle funzioni reali di una variabile reale. Per questo motivo, abbiamo cercato di coprire un ventaglio sufficientemente ampio di argomenti, ben sapendo che il numero di crediti assegnati dai nuovi ordinamenti didattici a un secondo corso di Analisi Matematica pu` o non essere sufficiente a coprirli tutti. Al fine di facilitare un uso flessibile del testo abbiamo cercato, ove possibile, di rendere non troppo rigida la concatenazione degli argomenti, anche a costo di qualche ripetizione. L’ordine di presentazione `e quello che ci `e sembrato il pi` u naturale. Nei primi tre capitoli si completa lo studio delle funzioni di una variabile con le successioni e serie di funzioni, tra le quali le serie di potenze e di Fourier. Successivamente si passa ad esaminare le funzioni di pi` u variabili ed a valori vettoriali, studiandone le propriet` a di continuit` a e sviluppandone il calcolo differenziale ed integrale (dapprima sugli aperti misurabili di Rn e quindi sulle curve e superfici). Infine alcuni dei concetti visti trovano applicazione nello studio dei sistemi di equazioni differenziali ordinarie. Come per il primo volume, ci siamo posti l’obiettivo di raggiungere la massima chiarezza espositiva nella nostra presentazione. Ogni pagina del testo contiene di norma uno, o al pi` u pochi, concetti essenziali, evitando una eccessiva ricchezza di messaggi che potrebbe distrarre lo studente. Abbiamo scelto di presentare i teoremi sotto ipotesi sufficientemente generali ma di immediata leggibilit` a. Alcuni passaggi, necessari da un punto di vista della completezza ma pi` u delicati dal punto di vista teorico, sono stati evidenziati e possono essere omessi in una lettura essenziale. Gli enunciati sono in genere immediatamente seguiti da numerosi esempi e, ove possibile, da una loro illustrazione grafica; lo stesso vale anche per la descrizione
VI
Prefazione
dei procedimenti di calcolo. Nel testo sono usate le seguenti convenzioni grafiche: le definizioni appaiono su sfondo grigio, mentre gli enunciati su sfondo ciano; gli esempi sono segnalati da una barra verticale in colore; gli esercizi di cui si fornisce la soluzione sono indicati con un riquadro nel testo (ad esempio 12. ). Ogni capitolo ha una controparte sul sito web, dove lo studente pi` u motivato e interessato pu`o trovare la giustificazione di vari risultati solo enunciati nel testo, insieme a utili complementi. Abbiamo invece completamente omesso quelle dimostrazioni in cui, a nostro avviso, gli aspetti tecnici sono prevalenti rispetto a quelli concettuali. Esse possono essere reperite sui testi specialistici della materia. Un significativo numero di esercizi viene fornito al termine di ogni capitolo, permettendo all’allievo di valutare immediatamente lo stato delle conoscenze acquisite; essi sono raccolti in gruppi che riprendono i principali argomenti. Di tutti gli esercizi viene fornita la soluzione; per la maggior parte di essi, si delinea il procedimento risolutivo. La preparazione del materiale raccolto ha tratto beneficio dall’esperienza maturata nell’insegnamento degli argomenti qui trattati presso il Politecnico di Torino. ` stata inoltre di grande aiuto la consultazione di testi relativi agli stessi temi, E quali quelli di A. Bacciotti e F. Ricci, di C. Pagani e S. Salsa, e di G. Gilardi, oltrech´e di opere di impostazione anglosassone quali quelle di T. Apostol e di J. Stewart. Tutte le figure sono state realizzate mediante il programma MATLABTM e rielaborate attraverso le macroistruzioni contenute nel pacchetto psfrag reperibile negli archivi internazionali; siamo riconoscenti a Giuseppe Ghib` o per l’assistenza tecnica che ci ha fornito a tale riguardo. Desideriamo inoltre esprimere la nostra pi` u viva gratitudine nei confronti di Francesco Longo che ha prodotto con maestria buona parte delle figure contenute nel volume, oltre a leggere e contribuire a migliorare una versione preliminare del testo. Siamo infine riconoscenti a Francesca Bonadei, responsabile per la Matematica della Springer-Verlag Italia, per il costante incoraggiamento e la pazienza dimostrataci. Ringraziamo fin da ora i colleghi e gli studenti che vorranno segnalarci gli inevitabili errori rimasti e suggerirci possibili miglioramenti nella qualit` a dell’esposizione. Torino, luglio 2008
Claudio Canuto, Anita Tabacco
Indice
1
Serie numeriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Richiami sulle successioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Serie numeriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Serie a termini positivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Serie a termini di segno alterno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Operazioni algebriche sulle serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.1 Soluzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 1 4 9 16 20 22 25
2
Serie di funzioni e di potenze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Successioni di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Propriet` a delle successioni uniformemente convergenti . . . . . . . . . . . . 2.2.1 Passaggio al limite sotto segno di integrale . . . . . . . . . . . . . . . . 2.2.2 Passaggio al limite sotto segno di derivata . . . . . . . . . . . . . . . . 2.3 Serie di funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Serie di potenze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Operazioni algebriche sulle serie di potenze . . . . . . . . . . . . . . . 2.4.2 Derivazione e integrazione di serie di potenze . . . . . . . . . . . . . 2.5 Funzioni analitiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Serie di potenze in C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7.1 Soluzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35 36 39 40 40 42 46 53 54 57 61 62 66
3
Serie di Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Polinomi trigonometrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Coefficienti e serie di Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Forma esponenziale della serie di Fourier . . . . . . . . . . . . . . . . . . . . . . . 3.4 Serie di Fourier e derivazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 Convergenza delle serie di Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.1 Convergenza quadratica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77 78 81 90 91 93 93
VIII
Indice
3.5.2 Convergenza puntuale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 3.5.3 Convergenza uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 3.5.4 Decadimento dei coefficienti di Fourier . . . . . . . . . . . . . . . . . . . 98 3.6 Funzioni periodiche di periodo T > 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 3.7 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 3.7.1 Soluzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 4
Funzioni tra spazi euclidei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 4.1 Vettori in Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 4.2 Matrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 4.3 Insiemi in Rn e loro propriet`a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 4.4 Funzioni: definizioni e primi esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 4.5 Continuit` a e limiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 4.5.1 Propriet` a dei limiti e della continuit` a . . . . . . . . . . . . . . . . . . . . 140 4.6 Curve in Rm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 4.7 Superfici in R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 4.8 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 4.8.1 Soluzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
5
Calcolo differenziale per funzioni scalari . . . . . . . . . . . . . . . . . . . . . . . 159 5.1 Derivate parziali prime e gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 5.2 Differenziabilit` a e differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 5.2.1 Teorema di Lagrange e funzioni lipschitziane . . . . . . . . . . . . . . 169 5.3 Derivate parziali seconde e matrice hessiana . . . . . . . . . . . . . . . . . . . . 172 5.4 Derivate parziali di ordine superiore . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 5.5 Sviluppi di Taylor; convessit` a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176 5.5.1 Convessit` a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 5.6 Estremi di una funzione; punti stazionari . . . . . . . . . . . . . . . . . . . . . . . 178 5.6.1 Punti di sella . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 5.7 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 5.7.1 Soluzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
6
Calcolo differenziale per funzioni vettoriali . . . . . . . . . . . . . . . . . . . . . 207 6.1 Derivate parziali e matrice jacobiana . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 6.2 Differenziabilit` a e lipschitzianit` a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 6.3 Operatori differenziali notevoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 6.3.1 Operatori del primo ordine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 6.3.2 Operatori del secondo ordine . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 6.4 Derivazione di funzioni composte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 6.4.1 Un’applicazione: le funzioni definite mediante integrali . . . . . 221 6.5 Curve regolari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 6.5.1 Congruenza tra curve; orientazione . . . . . . . . . . . . . . . . . . . . . . 226 6.5.2 Lunghezza di un arco e ascissa curvilinea . . . . . . . . . . . . . . . . . 229 6.5.3 Elementi di geometria differenziale di una curva . . . . . . . . . . . 232 6.6 Cambiamenti di variabile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
Indice
IX
6.6.1 Cambiamenti di variabile notevoli . . . . . . . . . . . . . . . . . . . . . . . 238 6.7 Superfici regolari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 6.7.1 Cambiamenti di parametrizzazione . . . . . . . . . . . . . . . . . . . . . . 248 6.7.2 Superfici orientabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250 6.7.3 Bordo di una superficie; superfici chiuse . . . . . . . . . . . . . . . . . . 251 6.7.4 Superfici regolari a pezzi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256 6.8 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 6.8.1 Soluzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260 7
Applicazioni del calcolo differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 7.1 Teorema della funzione implicita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 7.1.1 Invertibilit` a locale di una funzione . . . . . . . . . . . . . . . . . . . . . . . 275 7.2 Curve e superfici di livello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277 7.2.1 Curve di livello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277 7.2.2 Superfici di livello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281 7.3 Estremi vincolati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 7.3.1 Metodo parametrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286 7.3.2 Metodo dei moltiplicatori di Lagrange . . . . . . . . . . . . . . . . . . . . 287 7.4 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295 7.4.1 Soluzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
8
Calcolo integrale per funzioni in pi` u variabili . . . . . . . . . . . . . . . . . . 307 8.1 Integrale doppio su rettangoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308 8.2 Integrale doppio su insiemi misurabili . . . . . . . . . . . . . . . . . . . . . . . . . . 314 8.2.1 Propriet` a dell’integrale doppio . . . . . . . . . . . . . . . . . . . . . . . . . . 323 8.3 Cambiamento di variabili negli integrali doppi . . . . . . . . . . . . . . . . . . . 327 8.4 Integrali multipli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 8.4.1 Cambiamenti di variabili negli integrali tripli . . . . . . . . . . . . . . 338 8.5 Applicazioni ed estensioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340 8.5.1 Massa, baricentro e momenti di inerzia . . . . . . . . . . . . . . . . . . . 341 8.5.2 Volume dei solidi di rotazione . . . . . . . . . . . . . . . . . . . . . . . . . . . 342 8.5.3 Integrali di funzioni vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 8.5.4 Integrali multipli impropri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 8.6 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347 8.6.1 Soluzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
9
Calcolo integrale su curve e superfici . . . . . . . . . . . . . . . . . . . . . . . . . . 377 9.1 Integrali curvilinei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378 9.1.1 Baricentro e momenti di inerzia di una curva . . . . . . . . . . . . . . 384 9.2 Integrali di linea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385 9.3 Integrali superficiali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 388 9.3.1 Area di una calotta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392 9.3.2 Baricentro e momenti di inerzia di una superficie . . . . . . . . . . 394 9.4 Integrali di flusso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394 9.5 I Teoremi di Gauss, Green e Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 396
X
Indice
9.5.1 Aperti e superfici ammissibili e loro bordo . . . . . . . . . . . . . . . . 397 9.5.2 Il Teorema della divergenza o di Gauss . . . . . . . . . . . . . . . . . . . 402 9.5.3 Il Teorema del rotore; Teorema di Green . . . . . . . . . . . . . . . . . 405 9.5.4 Il Teorema di Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407 9.6 Campi conservativi e potenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409 9.6.1 Calcolo esplicito del potenziale . . . . . . . . . . . . . . . . . . . . . . . . . . 416 9.7 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419 9.7.1 Soluzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423 10 Equazioni differenziali ordinarie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435 10.1 Esempi introduttivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435 10.2 Definizioni generali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438 10.3 Equazioni scalari del primo ordine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444 10.3.1 Equazioni a variabili separabili . . . . . . . . . . . . . . . . . . . . . . . . . . 445 10.3.2 Equazioni omogenee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447 10.3.3 Equazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 448 10.3.4 Equazioni di Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452 10.3.5 Equazioni di Riccati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452 10.3.6 Equazioni del secondo ordine riconducibili al primo . . . . . . . . 453 10.4 Esistenza e unicit` a del problema di Cauchy . . . . . . . . . . . . . . . . . . . . . 455 10.4.1 Esistenza e unicit` a locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455 10.4.2 Soluzione massimale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459 10.4.3 Esistenza globale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462 10.4.4 Esistenza globale unilaterale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464 10.4.5 Integrali primi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467 10.5 Sistemi di equazioni lineari del primo ordine . . . . . . . . . . . . . . . . . . . . 470 10.5.1 Sistema omogeneo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472 10.5.2 Sistema non omogeneo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475 10.6 Sistemi lineari con matrice A costante . . . . . . . . . . . . . . . . . . . . . . . . . 478 10.6.1 Sistema omogeneo con A diagonalizzabile . . . . . . . . . . . . . . . . 479 10.6.2 Sistema omogeneo con A non diagonalizzabile . . . . . . . . . . . . 483 10.6.3 Sistema non omogeneo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 487 10.7 Equazioni lineari scalari di ordine n . . . . . . . . . . . . . . . . . . . . . . . . . . . . 490 10.8 Stabilit` a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 496 10.8.1 Sistemi lineari autonomi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 498 10.8.2 Sistemi piani . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 499 10.8.3 Cenno alla stabilit` a non lineare . . . . . . . . . . . . . . . . . . . . . . . . . 506 10.9 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 508 10.9.1 Soluzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513 Definizioni e formule notevoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527 Indice analitico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 539
1 Serie numeriche
Questo `e il primo di tre capitoli dedicati allo studio del concetto matematico di serie. Esso esprime in modo rigoroso l’idea di sommare infiniti termini di una successione, che pu`o essere costituita da numeri (serie numeriche) oppure da funzioni (serie di funzioni). Mediante una serie, `e possibile ad esempio rappresentare un numero irrazionale come somma di infiniti numeri razionali via via pi` u piccoli, oppure una funzione continua come somma di infinite funzioni costanto a tratti su intervalli di ampiezza via via decrescente. La definizione di serie `e basata sul concetto di limite di una successione; conseguentemente, l’analisi del comportamento di una serie si avvale di tutti gli strumenti messi a punto per lo studio di tali limiti. In questo capitolo consideriamo le serie numeriche, che hanno importanza di per s´e ma sono anche propedeutiche alla successiva definizione e analisi delle serie di funzioni. Iniziamo con il richiamo delle principali propriet` a delle successioni numeriche. Successivamente, consideriamo vari tipi di convergenza di una serie numerica, e identifichiamo alcune classi notevoli di serie, per le quali forniamo appropriati strumenti per lo studio della loro convergenza.
1.1 Richiami sulle successioni Le successioni sono state presentate nel Vol. I; ne ricordiamo qui la definizione e le principali propriet` a. Una successione reale `e una funzione definita in N a valori in R il cui dominio contiene un insieme del tipo {n ∈ N : n ≥ n0 } per un qualche intero n0 ≥ 0. Solitamente, denotata con a la successione, si preferisce indicare l’immagine dell’intero n con la notazione an piuttosto che con il simbolo a(n); in altre parole scriveremo a : n → an . Un modo comunemente usato per indicare una successione `e {an }n≥n0 (ignorando gli eventuali termini con n < n0 ) o ancora pi` u semplicemente {an }. Il comportamento o carattere di una successione per n tendente a ∞ viene classificato nel modo seguente. Si dice che la successione {an }n≥n0 `e convergente (oppure che converge a ) se esiste finito il lim an = . Se il limite esiste n→∞
Canuto C, Tabacco A: Analisi Matematica II. © Springer-Verlag Italia, Milano 2008
2
1 Serie numeriche
ma `e infinito, diremo che la successione diverge a +∞ o −∞ (oppure che `e positivamente o negativamente divergente). Se la successione non `e n´e convergente n´e divergente, ovvero se il lim an non esiste, diremo che la successione n→∞ `e indeterminata. Nello studio di una successione, il comportamento dei primi termini `e ininfluen` utile pertanto la seguente definizione. Si dice che una successione {an }n≥n te. E 0 verifica definitivamente una certa propriet` a se esiste un intero N ≥ n0 tale che la successione {an }n≥N verifica tale propriet` a. Riportiamo ora gli enunciati dei principali teoremi che permettono lo studio del comportamento limite delle successioni. Teoremi sulle successioni 1. Teorema di unicit` a del limite: il limite di una successione, se esiste, `e unico. 2. Teorema di limitatezza: una successione convergente `e limitata. 3. Teorema di esistenza del limite delle successioni monotone: sia data una successione definitivamente monotona. Se essa `e limitata allora `e convergente; se non `e limitata allora `e divergente (a +∞ se `e crescente, a −∞ se `e decrescente). 4. Primo Teorema del confronto: siano {an } e {bn } due successioni tali che esistano, finiti o infiniti, i limiti lim an = e lim bn = m. Se definitivamente n→∞ n→∞ vale an ≤ bn , allora ≤ m. 5a. Secondo Teorema del confronto - caso finito: siano {an }, {bn } e {cn } tre successioni tali che lim an = lim cn = ∈ R. Se definitivamente vale n→∞ n→∞ an ≤ bn ≤ cn , allora lim bn = . n→∞
5b. Secondo Teorema del confronto - caso infinito: siano {an }, {bn } due successioni tali che lim an = +∞. Se definitivamente vale an ≤ bn , allora n→∞ lim bn = +∞. Analogo risultato vale se il limite `e −∞: lim bn = −∞ n→∞ n→∞ implica lim an = −∞. n→∞
6. Propriet` a: una successione {an } `e infinitesima, cio`e lim an = 0, se e solo n→∞
se la successione {|an |} dei valori assoluti `e infinitesima. 7. Teorema: sia {an } una successione infinitesima e {bn } una successione limitata. Allora la successione {an bn } `e infinitesima. 8. Algebra dei limiti: siano {an } e {bn } due successioni tali che lim an = n→∞
e lim bn = m (, m finiti o infiniti). Si ha n→∞
lim (an ± bn ) = ± m ,
n→∞
lim an bn = m ,
n→∞
lim
n→∞
an = , bn m
se definitivamente bn = 0 ,
ogniqualvolta l’espressione a secondo membro `e definita.
1.1 Richiami sulle successioni
3
9. Teorema di sostituzione: sia {an } una successione tale che lim an = e n→∞ sia g una funzione definita in un intorno di . a) se ∈ R e g `e continua in , allora lim g(an ) = g(); n→∞
b) se ∈ / R ed esiste il lim g(x) = m, allora lim g(an ) = m. n→∞
x→
10. Criterio del rapporto: sia {an } una successione per cui definitivamente valga an > 0. Supponiamo che esista finito o infinito il an+1 = q. n→∞ an lim
Se q < 1, allora lim an = 0; se q > 1 allora lim an = +∞. n→∞
n→∞
Vediamo qualche esempio di successione particolarmente significativa. Esempi 1.1 i) Consideriamo la successione, detta successione geometrica, an = q n , dove q `e un numero fissato in R. In Vol I, Esempio 5.18, abbiamo dimostrato che ⎧ 0 ⎪ ⎪ ⎪ ⎨1 lim q n = n→∞ ⎪ +∞ ⎪ ⎪ ⎩ non esiste
se se se se
|q| < 1, q = 1, q > 1, q ≤ −1.
ii) Sia p un numero fissato > 0 e consideriamo la successione applicando il Teorema di sostituzione con g(x) = px , lim
n→∞
√ n
lim
√ n
p. Si ha,
p = lim p1/n = p0 = 1 .
iii) Consideriamo la successione si ha n→∞
(1.1)
n→∞
√ n
n; usando ancora il Teorema di sostituzione,
√ log n n = e0 = 1. n = lim exp n→∞ n
iv) Ricordiamo che il numero e di Nepero pu`o essere definito come limite della 1 n successione an = 1 + , che `e convergente in quanto strettamente crescente n e superiormente limitata. v) Da ultimo consideriamo alcune successioni significative che tendono a +∞, e precisamente log n , nα , q n , n! , nn
(α > 0, q > 1) .
4
1 Serie numeriche
In Vol. I, § 5.4, abbiamo dimostrato che ciascuna di esse `e un infinito di ordine superiore rispetto alla precedente. Ci` o significa che, per n → ∞, con α > 0 e q > 1, si ha log n = o(nα ) , nα = o(q n ) , q n = o(n!) ,
2
n! = o(nn ) .
1.2 Serie numeriche Per introdurre il concetto di serie numerica, ossia di “somma di infiniti numeri”, prendiamo in esame una semplice ma significativa situazione geometrica. Consideriamo un segmento di lunghezza = 2 (si veda la Figura 1.1). Attraverso il suo punto medio, possiamo dividerlo nell’unione di due segmenti contigui di lunghezza a0 = /2 = 1. Teniamo fisso il segmento di sinistra, mentre dividiamo il segmento di destra ancora in due parti uguali, di lunghezza a1 = /4 = 1/2. Iterando tale procedimento infinite volte, possiamo pensare il 1 segmento iniziale come unione di infiniti segmenti, di lunghezza 1, 12 , 14 , 18 , 16 ,... Corrispondentemente, siamo indotti a pensare la lunghezza totale del segmento come somma delle infinite lunghezze dei segmenti in cui lo abbiamo suddiviso, vale a dire 1 1 1 1 2=1+ + + + + ... (1.2) 2 4 8 16 Abbiamo, a destra, una somma di infiniti addendi. Il concetto di somma di infiniti termini pu` o essere definito in modo rigoroso usando la nozione di successione, e conduce alla definizione di serie numerica. Data la successione {ak }k≥0 , costruiamo la cosiddetta successione delle somme parziali o delle ridotte {sn }n≥0 nel modo seguente: s0 = a 0 ,
s1 = a 0 + a 1 ,
s2 = a 0 + a 1 + a 2
e, in generale, sn = a 0 + a1 + . . . + an =
n
ak .
k=0
1 2
1 0
1
1 4
3 2
1 8
7 4
1 16
15 8
2
Figura 1.1. Suddivisioni successive dell’intervallo [0, 2]. Le ascisse dei punti di suddivisione sono indicate in basso e le lunghezze dei sottointervalli in alto
1.2 Serie numeriche
5
` naturale studiare il comportamento limite di tale Notiamo che sn = sn−1 + an . E successione. Poniamo (formalmente) ∞
ak = lim
k=0
Il simbolo
∞
n→∞
n
ak = lim sn . n→∞
k=0
ak viene detto serie (numerica), mentre ak `e il termine generale
k=0
della serie.
Definizione 1.2 Data la successione {ak }k≥0 e posto sn =
n
ak , si
k=0
consideri il limite lim sn . n→∞
i) Se il limite esiste (finito o infinito), il suo valore s viene detto somma della serie e si scrive ∞
ak = s = lim sn .
k=0
-
Se s `e finito, si dice che la serie
n→∞
∞
ak converge.
k=0 ∞
Se s `e infinito, si dice che la serie
ak diverge, positivamente se
k=0
s = +∞, negativamente se s = −∞.
ii) Se il limite non esiste, si dice che la serie
∞
ak ` e indeterminata.
k=0
Esempi 1.3 i) Ritorniamo sull’esempio iniziale del segmento suddiviso in infinite parti. La lunghezza del segmento ottenuto con k + 1 suddivisioni `e ak = 21k , per k ≥ 0. ∞ 1 . Allora Dunque, siamo indotti a considerare la serie 2k k=0
s0 = 1 , .. . sn = 1 +
3 1 s1 = 1 + = , 2 2 1 1 + ... + n . 2 2
s2 = 1 +
7 1 1 + = , 2 4 4
6
1 Serie numeriche
Usando il prodotto notevole an+1 − bn+1 = (a − b)(an + an−1 b + . . . + abn−1 + bn ), e scegliendo a = 1 e b = x arbitrario purch´e = 1, otteniamo l’identit` a n+1 1 − x . (1.3) 1 + x + . . . + xn = 1−x Dunque
1 1 − 2n+1 1 1 1 sn = 1 + + . . . + n = = 2 1 − 2 2 2n+1 1 − 12 1 = 2− n . 2 Pertanto
1 lim sn = lim 2 − n = 2 . n→∞ n→∞ 2 Quindi la serie converge e la somma vale 2. Ci`o giustifica rigorosamente l’espressione (1.2). ii) Si consideri la serie
∞
(−1)k . Risulta
k=0
s0 = 1 ,
s1 = 1 − 1 = 0 ,
s2 = s 1 + 1 = 1 ,
s3 = s 2 − 1 = 0 , .. .
s2n = 1 , s2n+1 = 0 . Dunque le ridotte con indice pari valgono sempre 1 e quelle con indice dispari 0. In definitiva il lim sn non esiste e quindi la serie `e indeterminata. n→∞
iii) I due esempi precedenti sono casi particolari della seguente serie, detta serie geometrica, ∞ qk , k=0
dove q `e un numero fissato in R. Essa riveste particolare importanza. Se q = 1, risulta sn = a0 + a1 + . . . + an = 1 + 1 + . . . + 1 = n + 1 e lim sn = +∞. n→∞ Dunque la serie diverge a +∞. Se q = 1, si ha, grazie alla (1.3), sn = 1 + q + q 2 + . . . + q n = Ricordando l’Esempio 1.1 i), otteniamo
⎧ 1 ⎪ ⎪ ⎪ ⎨ 1−q
1 − q n+1 . 1−q
1 − q n+1 = lim sn = lim +∞ n→∞ n→∞ ⎪ 1−q ⎪ ⎪ ⎩ non esiste
se |q| < 1 , se q > 1 , se q ≤ −1 .
1.2 Serie numeriche
7
In definitiva ∞
q
⎧ 1 ⎪ ⎪ converge a ⎪ ⎨ 1−q
k
diverge a + ∞ ⎪ ⎪ ⎪ ⎩ `e indeterminata
k=0
se |q| < 1 , se q ≥ 1 , se q ≤ −1 .
2
Talvolta la successione {ak } `e definita solo per k ≥ k0 ; la Definizione 1.2 si modifica in modo ovvio. Vale inoltre la seguente propriet`a la cui verifica, peraltro immediata, `e lasciata allo studente. Propriet` a 1.4 Il comportamento di una serie non cambia se si aggiunge oppure modifica oppure elimina un numero finito di termini. Si noti che tale propriet` a nulla dice, nel caso si abbia convergenza della serie, sul valore della somma, il quale generalmente cambia se si modifica la serie. Ad esempio, ∞ ∞ 1 1 = − 1 = 2 − 1 = 1. 2k 2k k=1
k=0
Esempi 1.5 i) Consideriamo la serie
∞ k=2
1 , detta serie di Mengoli. Risulta (k − 1)k
ak = e dunque
1 1 1 = − (k − 1)k k−1 k
1 1 =1− , 1·2 2
1 1 1 1 s3 = a 2 + a 3 = 1 − + − =1− 2 2 3 3
s2 = a 2 =
e, in generale,
1 1 1 1 1 + − + ... + − 1− 2 2 3 n−1 n 1 =1 − . n Allora
1 lim sn = lim 1 − =1 n→∞ n→∞ n e quindi la serie converge e la sua somma vale 1. sn = a 2 + a 3 + . . . + a n =
8
1 Serie numeriche
1 . Si ha log 1 + k k=1 k+1 1 = log = log(k + 1) − log k ak = log 1 + k k
ii) Consideriamo la serie
e, quindi, s1 = log 2
∞
s2 = log 2 + (log 3 − log 2) = log 3
.. . sn = log 2 + (log 3 − log 2) + . . . + log(n + 1) − log n = log(n + 1) . Dunque lim sn = lim log(n + 1) = +∞ n→∞
n→∞
2
e quindi la serie diverge (positivamente).
Le due serie considerate sono esempi di una classe pi` u ampia di serie dette telescopiche, cio`e tali che ak = bk+1 −bk per una opportuna successione {bk }k≥k0 . In tal caso si ha sn = bn+1 − bk0 e dunque il comportamento della serie coincide con quello della successione {bk }. Diamo ora una semplice, ma utile, condizione necessaria per la convergenza di una serie numerica.
Propriet` a 1.6 Sia
∞
ak una serie convergente. Allora
k=0
lim ak = 0 .
k→∞
Dim.
(1.4)
Sia s = lim sn . Poich´e ak = sk − sk−1 , si ha n→∞
lim ak = lim (sk − sk−1 ) = s − s = 0 .
k→∞
k→∞
2
Osserviamo che la condizione (1.4) non `e sufficiente a garantire la convergenza della serie. In altre parole, il termine generale di una serie pu` o tendere a 0 senza ∞ 1 diverge che si abbia convergenza. Ad esempio, si ricordi che la serie log 1+ k k=1 1 (Esempio 1.5 ii)), mentre si ha lim log 1+ = 0 per la continuit` a del logaritmo. k→∞ k Esempio 1.7 1 k ` . E immediato vedere che essa non converge, k k=1 k in quanto il termine generale ak = 1 − k1 tende a e−1 = 0. 2
Consideriamo la serie
∞
1−
1.3 Serie a termini positivi
Se la serie
∞
9
ak converge a s, si dice resto n-simo della serie la quantit`a
k=0
r n = s − sn =
∞
ak .
k=n+1
La propriet` a seguente fornisce un’altra condizione necessaria per la convergenza della serie.
Propriet` a 1.8 Sia
∞
ak una serie convergente. Allora
k=0
lim rn = 0 .
n→∞
Dim.
` sufficiente osservare che lim rn = lim (s − sn ) = s − s = 0 . E n→∞
Data una serie
∞
n→∞
2
ak , non sempre `e possibile stabilire il suo comportamento
k=1
facendo uso della definizione. Infatti pu` o accadere che la successione delle ridotte ` utile allora avere dei criteri che garantiscano non sia calcolabile esplicitamente. E la convergenza o la divergenza della serie. Nel caso in cui si abbia convergenza, l’eventuale problema di calcolare il valore numerico della serie potr` a essere affrontato facendo ricorso a tecniche pi` u sofisticate, che esulano dallo scopo di questo testo.
1.3 Serie a termini positivi Si tratta di serie
∞
ak per cui si ha ak ≥ 0 per ogni k ∈ N. Vale allora il seguente
k=0
risultato.
Proposizione 1.9 Sia
∞
ak una serie a termini positivi. Allora la serie o
k=0
converge oppure diverge positivamente. Dim.
La successione sn `e monotona crescente, infatti sn+1 = sn + an ≥ sn ,
∀n ≥ 0 .
` sufficiente allora applicare il Teorema 3 di pag. 2 per concludere che E 2 lim sn esiste, finito o uguale a +∞. n→∞
10
1 Serie numeriche
Esaminiamo ora alcuni criteri per lo studio della convergenza di serie a termini positivi.
Teorema 1.10 (Criterio del confronto) Siano
∞
ak e
k=0
∞
bk due serie
k=0
numeriche a termini positivi e si abbia 0 ≤ ak ≤ bk , per ogni k ≥ 0. i) Se la serie
∞
bk converge, allora converge anche la serie
k=0
ii) se la serie
∞
∞
ak ≤
k=0
∞
ak e vale
k=0
bk ;
k=0
ak diverge, allora diverge anche la serie
k=0
Dim.
∞
∞
bk .
k=0
i) Indichiamo rispettivamente con {sn } e con {tn } le successioni delle ∞ ∞ ak e bk . Poich´e ak ≤ bk per ogni k, si ha ridotte delle serie k=0
k=0
s n ≤ tn , Per ipotesi, la serie
∞
∀n ≥ 0 .
bk converge e quindi lim tn = t ∈ R. Inoltre, grazie n→∞
k=0
alla Proposizione 1.9, esiste (finito o infinito) il lim sn = s. Applicando n→∞
ora il Primo Teorema del confronto (Teorema 4 di pag. 2) alle successioni {sn } e {tn }, si ha s = lim sn ≤ lim tn = t ∈ R . n→∞
Dunque s ∈ R e la serie
∞
ak converge. Inoltre s ≤ t.
k=0
ii) Osserviamo che se la serie punto i), anche la serie
∞
n→∞
∞
bk convergesse, per quanto visto al
k=0
ak convergerebbe.
k=0
Esempi 1.11 i) Si consideri la serie
∞ 1 . Poich´e k2
k=1
1 1 , < 2 k (k − 1)k
∀k ≥ 2 ,
2
1.3 Serie a termini positivi
11
∞
1 converge (Esempio 1.5 i)), possiamo concludere (k − 1)k k=2 che anche la serie data converge e la sua somma `e ≤ 2. Si pu` o dimostrare che la π2 (si veda l’Esempio 3.18) . sua somma vale 6 ∞ 1 ii) Si consideri la serie , detta serie armonica. Poich´e vale la disuguak k=1 glianza log(1 + x) ≤ x , ∀x > −1 , (Vol. I, Capitolo 6, Esercizio 12), ne segue che e la serie di Mengoli
1 1 ≤ , ∀k ≥ 1 ; log 1 + k k ∞ 1 quindi, poich´e la serie diverge (Esempio 1.5 ii)), possiamo log 1 + k k=1 concludere che anche la serie armonica diverge. iii) La generalizzazione delle serie studiate nei due esempi precedenti `e data dalla serie ∞ 1 , α > 0, (1.5) kα k=1
detta serie armonica generalizzata. Osservando che 1 1 1 1 per 0 < α < 1 , > < 2 per α > 2 , α α k k k k e applicando il Criterio del confronto, deduciamo che la serie armonica generalizzata diverge per 0 < α < 1 e converge per α > 2. Il caso 1 < α < 2 verr` a studiato nell’Esempio 1.19. 2 Enunciamo ora un utile criterio che generalizza quello del confronto.
Teorema 1.12 (Criterio del confronto asintotico) Date due serie e
∞
∞
ak
k=0
bk a termini positivi, se le successioni {ak }k≥0 e {bk }k≥0 sono equigrandi
k=0
per k → ∞, allora il comportamento delle due serie coincide. Dim.
Dire che le successioni {ak }k≥0 e {bk }k≥0 sono equigrandi per k → ∞ equivale a dire che ak lim = ∈ R \ {0} . k→∞ bk
bk ak e sono entrambe convergenti Pertanto le successioni bk k≥0 ak k≥0 e dunque limitate (Teorema 2 di pag. 2). Quindi esistono due costanti M1 , M2 > 0 tali che, per ogni k > 0, si ha
12
1 Serie numeriche
ak ≤ M1 bk
e
bk ≤ M2 , ak
ossia ak ≤ M1 bk e bk ≤ M2 ak . ` E sufficiente allora applicare il Teorema 1.10 per ottenere il risultato.
2
Esempi 1.13 i) Si consideri la serie
∞
ak =
k=0
∞ k+3 1 . Sia bk = , allora 2k2 + 5 k
k=0
ak 1 = . k→∞ bk 2 Dunque la serie data ha lo stesso comportamento della serie armonica e pertanto diverge. ∞ ∞ 1 1 1 ii) Si consideri la serie ak = sin 2 . Poich´e sin 2 ∼ 2 per k → ∞, la k k k k=1 k=1 ∞ 1 serie data si comporta come la serie e dunque converge. 2 k2 lim
k=1
Enunciamo infine due criteri, di natura algebrica e sovente di facile applicazione, che forniscono condizioni sufficienti per la convergenza o la divergenza di una serie.
Teorema 1.14 (Criterio
del
rapporto) Sia data la serie
con ak > 0, ∀k ≥ 0. Si supponga che esista, finito o infinito, il limite lim
k→∞
∞
ak
k=0
ak+1 = . ak
Allora se < 1, la serie converge; se > 1, la serie diverge. Dim.
Sia finito. Per definizione di limite si ha che per ogni ε > 0, esiste un intero kε ≥ 0 tale che ak+1 ak+1 − < ε ossia − ε < < + ε. ∀k > kε ⇒ ak ak Supponiamo dapprima < 1. Scelto ε = 1− 2 , poniamo q = osserviamo che ak+1 0< < +ε = q, ∀k > kε . ak
1+ 2
e
1.3 Serie a termini positivi
13
Pertanto, reiterando, ak+1 < qak < q 2 ak−1 < . . . < q k−kε akε +1 e quindi
akε +1 k q , ∀k > kε . q kε Concludiamo usando il Teorema 1.10 e il fatto che la serie geometrica di ragione q < 1 converge (Esempio 1.3 iii)). Se invece > 1, scelto ε = − 1, osserviamo che ak+1 1=−ε< , ∀k > kε . ak ak+1 <
Pertanto ak+1 > ak > . . . > akε +1 > 0 e non `e verificata la condizione necessaria di convergenza in quanto lim ak = 0. k→∞
Se infine = +∞, posto A = 1 nella condizione di limite, esiste kA ≥ 0 tale che ak > 1 per ogni k > kA . Dunque ancora non `e verificata la condizione necessaria di convergenza. 2
Teorema 1.15 (Criterio della radice) Sia data la serie ∀k ≥ 0. Si supponga che esista, finito o infinito, il limite lim
k→∞
√ k
∞
ak con ak ≥ 0,
k=0
ak = .
Allora se < 1, la serie converge; se > 1, la serie diverge. Dim.
La dimostrazione `e sostanzialmente identica a quella del teorema precedente ed `e lasciata al lettore. 2
Esempi 1.16 i) Si consideri la serie
∞ k k k+1 . Allora ak = k e ak+1 = k+1 ; dunque 3k 3 3
k=0
ak+1 1k+1 1 = < 1. = lim k→∞ ak k→∞ 3 k 3 Pertanto, applicando il Criterio del rapporto 1.14, la serie data converge. ∞ 1 ii) Si consideri la serie . Allora kk lim
k=1
√ k
1 = 0 < 1. k Pertanto, applicando il Criterio della radice 1.15, la serie data converge. lim
k→∞
ak = lim
k→∞
2
14
1 Serie numeriche
Si noti che, sia per il Criterio del rapporto sia per il Criterio della radice, non si ∞ ∞ 1 1 e pu` o concludere nulla nel caso in cui = 1. Ad esempio, le serie sono k k2 k=1 k=1 rispettivamente divergente e convergente, ma entrambe soddisfano la condizione in ciascuno dei due criteri con = 1. In alcuni casi `e conveniente pensare il termine generale ak di una serie come il valore assunto per x = k da una funzione f definita su una semiretta reale [k0 , +∞). In questo modo, sotto opportune ipotesi `e possibile mettere in relazione il comportamento della serie con quello dell’integrale improprio della funzione su [k0 , +∞). Vale infatti il seguente risultato. Teorema 1.17 (Criterio integrale) Sia f una funzione positiva, decrescente e continua in [k0 , +∞), con k0 ∈ N. Allora valgono le seguenti disuguaglianze
∞
+∞
f (k) ≤
f (x) dx ≤ k0
k=k0 +1
∞
f (k) .
(1.6)
k=k0
Pertanto, la serie e l’integrale improprio hanno lo stesso comportamento; precisamente +∞ ∞ f (x) dx converge ⇐⇒ f (k) converge; a) k0
k=k0
+∞
⇐⇒
f (x) dx diverge
b) k0
Dim.
∞
f (k) diverge.
k=k0
Poich´e f `e decrescente, per ogni k ≥ k0 , si ha f (k + 1) ≤ f (x) ≤ f (k) ,
∀x ∈ [k, k + 1] .
Per la propriet` a di monotonia dell’integrale, si ottiene
k+1
f (k + 1) ≤
f (x) dx ≤ f (k) ; k
dunque, per ogni n ∈ N con n > k0 , risulta n+1 k=k0 +1
n
f (k) ≤
f (x) dx ≤ k0
n
f (k)
k=k0
(avendo riscalato di un’unit` a l’indice della prima serie). Passando al limite per n → +∞ e osservando che f `e positiva e continua, si ottiene la tesi. 2
1.3 Serie a termini positivi
15
Si osservi che dalle disuguaglianze (1.6) segue facilmente che +∞ +∞ ∞ f (x) dx ≤ f (k) ≤ f (k0 ) + f (x) dx . k0
k0
k=k0
Il confronto con l’integrale improprio della funzione f permette di dare una stima spesso accurata del resto e della somma della serie, sulla quale basare un’approssimazione numerica di tali valori. Si ha infatti il seguente risultato.
Propriet` a 1.18 Sotto le ipotesi del Teorema 1.17, se la serie converge allora per ogni n ≥ k0 si ha +∞ f (x) dx ≤ rn ≤ n+1
e
Se la serie
∞
+∞
f (x) dx ,
(1.7)
n
+∞
f (x) dx ≤ s ≤ sn + n+1
Dim.
f (k)
k=k0
+∞
sn +
∞
f (x) dx .
(1.8)
n
f (k) converge, le disuguaglianze (1.6) si possono riscrivere
k=k0
sostituendo a k0 un qualunque intero n ≥ k0 . Allora, usando la prima di tali disuguaglianze si ha +∞ ∞ r n = s − sn = f (k) ≤ f (x) dx ; k=n+1
n
similmente, usando la seconda disuguaglianza con k0 sostituito da n + 1, si ha +∞ f (x) dx ≤ rn . n+1
Ci`o fornisce la (1.7), dalla quale si ottiene la (1.8) aggiungendo sn a ciascun membro. 2 Esempi 1.19 i) Il Criterio integrale permette di studiare la convergenza della serie armonica generalizzata (1.5) per tutti i valori ammissibili del parametro α. Osserviamo 1 infatti che la funzione α , α > 0,soddisfa le ipotesi del teorema e ha integrale x improprio su [1, +∞) convergente se e solo se α > 1. In conclusione,
∞ converge se α > 1 , 1 kα diverge se 0 < α ≤ 1 . k=1
16
1 Serie numeriche
ii) Studiamo la convergenza della serie ∞ 1 . k log k k=2 1 Consideriamo la funzione f (x) = e ricordiamo che il suo integrale su x log x [2, +∞) diverge in quanto +∞ +∞ 1 1 dx = dt = +∞. x log x 2 log 2 t ∞ 1 diverge. Pertanto la serie k log k k=2
iii) Si vuole stimare l’errore commesso approssimando la somma della serie
∞ 1 k3
k=1
utilizzando la somma dei primi 10 termini, ossia s10 . +∞ 1 f (x) dx con f (x) = 3 . Si ha Calcoliamo x n c +∞ 1 1 1 − dx = lim = 2. 3 2 c→+∞ x 2x n 2n n Pertanto, utilizzando la (1.7), otteniamo +∞ 1 1 r10 = s − s10 ≤ dx = = 0.005 3 x 2 (10)2 10 e +∞ 1 1 r10 ≥ dx = = 0.004132 . . . 3 2 x 2 (11) 11 ` possibile stimare la somma mediante la (1.8), ovvero E s10 +
1 1 ≤ s ≤ s10 + . 2 2 (11) 2 (10)2
Poich´e 1 1 + . . . + 3 ∼ 1.197532 , 23 10 si ottiene 1.201664 ≤ s ≤ 1.202532 . Il valore esatto di s `e s = 1.202057 . . . s10 = 1 +
1.4 Serie a termini di segno alterno Si tratta di serie della forma ∞
(−1)k bk
con
k=0
Vale il seguente criterio dovuto a Leibniz.
bk > 0 ,
∀k ≥ 0 .
2
1.4 Serie a termini di segno alterno
17
Teorema 1.20 (Criterio di Leibniz) Data una serie a termini di segno ∞ (−1)k bk , se valgono le due condizioni alterno k=0
i)
lim bk = 0 ;
k→∞
ii) la successione {bk }k≥0 `e monotona decrescente , allora la serie `e convergente. Detta s la sua somma, per ogni n ≥ 0 si ha |rn | = |s − sn | ≤ bn+1 Dim.
e
s2n+1 ≤ s ≤ s2n .
Osserviamo che, poich´e la successione {bk }k≥0 `e decrescente, s2n = s2n−2 − b2n−1 + b2n = s2n−2 − (b2n−1 − b2n ) ≤ s2n−2 e
s2n+1 = s2n−1 + b2n − b2n+1 ≥ s2n−1 .
Dunque la sottosuccessione delle ridotte di indice pari `e decrescente mentre quella delle ridotte di indice dispari `e crescente. Inoltre, per ogni n ≥ 0, s2n = s2n−1 + b2n ≥ s2n−1 ≥ . . . ≥ s1 e
s2n+1 = s2n − b2n+1 ≤ s2n ≤ . . . ≤ s0
Cos`ı {s2n }n≥0 `e limitata inferiormente e {s2n+1 }n≥0 `e limitata superiormente. Per il Teorema 3 di pag. 2, entrambe le successioni convergono; poniamo lim s2n = inf s2n = s∗
n→∞
Poich´e
e
n≥0
lim s2n+1 = sup s2n+1 = s∗ .
n→∞
n≥0
s∗ − s∗ = lim s2n − s2n+1 = lim b2n+1 = 0 , n→∞
concludiamo che la serie
∞
n→∞
(−1)k bk converge a s = s∗ = s∗ . Inoltre, per
k=0
quanto detto, si ha s2n+1 ≤ s ≤ s2n ,
∀n ≥ 0 ,
ossia la successione {s2n }n≥0 approssima s per eccesso, mentre {s2n+1 }n≥0 approssima s per difetto. Infine, per ogni n ≥ 0, risulta 0 ≤ s − s2n+1 ≤ s2n+2 − s2n+1 = b2n+2 e
0 ≤ s2n − s ≤ s2n − s2n+1 = b2n+1
ovvero |rn | = |s − sn | ≤ bn+1 .
2
18
1 Serie numeriche
Esempi 1.21 ∞ 1 i) Consideriamo la serie armonica generalizzata a segni alterni (−1)k α , k k=1 con α > 0. Poich´e lim bk = lim k1α = 0 e la successione k1α k≥1 `e monotona k→∞
k→∞
strettamente decrescente, la serie converge. ii) Si noti che la condizione i) del criterio precedente `e anche necessaria, mentre la condizione ii) `e soltanto sufficiente. Infatti, per k ≥ 2 sia
1/k k pari , bk = 2 (k − 1)/k k dispari . ` E immediato osservare che bk > 0 e che bk `e infinitesima. La successione non `e monotona decrescente in quanto si ha bk > bk+1 se k `e pari, bk < bk+1 se k `e dispari. Tuttavia, ∞ ∞ 1 1 bk = (−1)k + k k2 k=2
k≥3 k dispari
k=2
`e convergente in quanto le due serie a secondo membro sono convergenti. ∞ (−1)k corretta iii) Si vuole una approssimazione della somma della serie k! k=0
alla terza cifra decimale, cio`e con un errore inferiore a 10−3 . Osserviamo che la 1 serie, a segni alterni con bk = k! , converge per il Criterio di Leibniz. Dalla stima |s − sn | ≤ bn+1 , si vede che, per n = 6, si ha 1 1 < = 0.0002 < 10−3 . 0 < s6 − s ≤ b7 = 5040 5000 Essendo s6 ∼ 0.368056 . . . la stima della somma s ∼ 0.368 `e corretta alla terza cifra decimale. 2 Per studiare le serie a termini di segno arbitrario, `e utile introdurre il concetto di convergenza assoluta.
Definizione 1.22 Si dice che la serie converge la serie a termini positivi
∞
ak converge assolutamente se
∞ k=0
|ak |.
k=0
Esempio 1.23 La serie rie
∞ 1 . k2
k=0
∞
(−1)k
k=0
1 k2
converge assolutamente in quanto converge la se2
1.4 Serie a termini di segno alterno
19
Il seguente criterio assicura che la convergenza assoluta implica la convergenza della serie.
Teorema 1.24 (Criterio di convergenza assoluta) Se la serie
∞
ak
k=0
converge assolutamente, allora essa converge e si ha ∞ ∞ ak ≤ |ak | . k=0
Dim.
k=0
La dimostrazione `e simile a quella del Criterio di convergenza assoluta per gli integrali impropri. Definiamo le successioni
ak se ak ≥ 0 0 se ak ≥ 0 + − ak = e ak = 0 se ak < 0 −ak se ak < 0 . − Osserviamo che a+ k , ak ≥ 0 per ogni k ≥ 0, e risulta − ak = a + k − ak
− |ak | = a+ k + ak .
e
− Poich´e 0 ≤ a+ k , ak ≤ |ak |, per ogni k ≥ 0, possiamo applicare il Crite∞ ∞ a+ e a− rio del confronto (Teorema 1.10) e ottenere che le serie k k k=0
convergono. Osservando che, per ogni n ≥ 0, n k=0
ak =
n
n n − a+ a+ a− k − ak = k − k ,
k=0
k=0
deduciamo che anche la serie
k=0
∞
ak =
k=0
∞ k=0
a+ k −
k=0 ∞
a− k converge.
k=0
Infine, passando al limite per n → ∞ nella relazione n n ak ≤ |ak | , k=0
k=0
si ottiene la disuguaglianza richiesta.
2
Osservazione 1.25 Esistono serie che convergono ma non assolutamente. Ad ∞ 1 esempio, la serie armonica a segni alterni (−1)k converge, mentre la serie k k=1
20
1 Serie numeriche
∞ 1 diverge. Dunque la serie armonica a segni alterni non converge k k=1 assolutamente. Diremo in tal caso che la serie converge semplicemente oppure condizionatamente. 2
armonica
Il criterio precedente permette di studiare serie a segno variabile considerandone la convergenza assoluta. Essendo la serie dei valori assoluti a termini positivi, si possono applicare a tale serie i criteri visti nel § 1.3.
1.5 Operazioni algebriche sulle serie ` possibile definire le operazioni di somma, moltiplicazione di una serie per uno E ∞ ∞ scalare e prodotto di due serie. Siano ak e bk due serie. La serie somma `e k=0
k=0
definita in modo naturale come la serie il cui termine generale `e ck = ak + bk ; ossia poniamo formalmente ∞
∞
ak +
k=0
bk =
k=0
∞
(ak + bk ) .
k=0
Supponiamo che ciascuna serie sia o convergente oppure divergente e indichiamo ∞ ∞ ak e t = bk la loro somma (s, t ∈ R ∪ {±∞}). Allora la serie somma con s = k=0
k=0
`e determinata (convergente oppure divergente) ogniqualvolta l’espressione s + t `e definita. In tal caso si ha ∞ (ak + bk ) = s + t k=0
e dunque la serie converge se s + t ∈ R, diverge se s + t = ±∞. Se una delle due serie `e convergente e l’altra `e indeterminata, allora la serie somma `e necessariamente indeterminata. Al di fuori di questi casi, la natura della serie somma non `e direttamente deducibile da quella dei singoli addendi, e va studiata caso per caso. ∞ Sia ora λ ∈ R \ {0}; la serie λ ak `e definita come la serie il cui termine k=0
generale `e λak . Il comportamento di tale serie coincide con quello della serie e in caso di convergenza o divergenza si ha ∞ k=0
λak = λs .
∞ k=0
ak
1.5 Operazioni algebriche sulle serie
21
La definizione della serie prodotto richiede una riflessione. Infatti, si desidera che, qualora entrambe le serie convergano (a valori s, t ∈ R) la serie prodotto converga al prodotto st. Ci` o non accade se si definisse il termine generale ck della serie prodotto come il prodotto dei termini omologhi delle due serie, ossia ck = ak bk . Il seguente semplice esempio illustra il problema; consideriamo le serie geometriche con termine generale rispettivamente ak = 21k e bk = 31k . Allora ∞ 1 1 = k 2 1− k=0
mentre
1 2
= 2,
∞ 1 1 = k 3 1− k=0
∞ ∞ 1 1 1 1 = = 2k 3k 6k 1 − k=0 k=0
1 6
=
1 3
=
3 2
3 6 = 2 = 3 . 5 2
Un modo per moltiplicare due serie che garantisce la propriet` a sopra citata `e il cosiddetto prodotto alla Cauchy, definito come segue. Il termine generale ck della serie prodotto ha la forma ck =
k
aj bk−j = a0 bk + a1 bk−1 + · · · + ak−1 b1 + ak b0 .
(1.9)
j=0
Osserviamo che, disponendo i prodotti a bm (, m ≥ 0) secondo la matrice semiinfinita b0 b1 b2 ... a0
a0 b 0
a0 b 1
a0 b 2
...
a1
a1 b 0
a1 b 1
a1 b 2
...
a2 .. .
a2 b 0
a2 b 1
a2 b 2
...
ogni termine ck `e la somma degli elementi che si trovano sulla k-esima antidiagonale della matrice. La motivazione della forma del termine generale ck sar`a chiara quando studieremo le serie di potenze (§ 2.4.1). ∞ ∞ ` possibile dimostrare che la convergenza assoluta delle serie ak e bk `e E una condizione sufficiente per la convergenza della serie ∞ k=0
ck =
∞
k=0
ak
∞
k=0
bk
∞ k=0
= st .
k=0
k=0
ck ; in tal caso si ha
22
1 Serie numeriche
1.6 Esercizi 1. Scrivere il termine generale an delle seguenti successioni e calcolare lim an : n→∞
a)
1 2 3 4 , , , ,... 2 3 4 5
2 3 4 5 b) − , , − , ,... 3 9 27 81
c) 0, 1,
√
2,
√
3,
√
4, . . .
2. Studiare il comportamento delle seguenti successioni e, nel caso esista, calcolarne il limite: n+5 , n≥0 a) an = n(n − 1) , n ≥ 0 b) an = 2n − 1 √ 3 n 2 + 6n2 √ , n≥0 c) an = , n ≥ 1 d) a = n 2 3n + n 1+ 3n e) an =
5n 3n+1
,
n≥0
g) an = arctan 5n ,
f)
n≥0
(−1)n−1 n2 , n2 + 1
h) an = 3 + cos nπ ,
n≥0 n≥0
n cos n , n≥0 n3 + 1 √ √ log(2 + en ) m) an = n + 3 − n , n ≥ 0 , n≥1 n) an = 4n (−3)n o) an = −3n + log(n + 1) − log n , n ≥ 1 p) an = , n≥1 n! i) an = 1 + (−1)n sin
1 , n
an =
n≥1
)
an =
3. Studiare il comportamento delle seguenti successioni: a) an = n −
√
n
3n − 4n 1 + 4n (2n)! e) an = (n!)2
√n2 +2 2 n −n+1 g) an = n2 + n + 2 c) an =
n+1π i) an = n cos n 2
n2 + 1 b) an = (−1)n √ n2 + 2 (2n)! d) an = n!
n 6 f) an = 3 n3 h) an = 2n sin(2−n π)
1 ) an = n! cos √ − 1 n!
4. Dire se le seguenti serie convergono; in caso affermativo, calcolarne la somma: k−1 ∞ 1 4 a) 3 k=1
b)
∞ 2k k+5
k=1
1.6 Esercizi
c)
∞
tan k
∞
d)
k=0
e)
sin
k=1
∞ 3k + 2k
6k
k=0
∞
f)
k=1
1 1 − sin n n+1
23
1 2 + 3−k
5. Utilizzando la serie geometrica, scrivere il numero 2.317 = 2.3171717 . . . come rapporto di interi. 6. Trovare i valori del parametro reale x per i quali le seguenti serie convergono. Per tali valori di x, calcolare la somma della serie: ∞ ∞ xk a) b) 3k (x + 2)k 5k k=2
k=1
∞ 1 c) xk
d)
k=1
∞
tank x
k=0
7. Trovare i valori del parametro reale c per i quali si ha ∞ (1 + c)−k = 2 . k=2
8. Si supponga che la serie
∞
ak (ak = 0) sia convergente. Mostrare che la serie
k=1
∞ 1 non pu` o convergere. ak
k=1
9. Studiare la convergenza delle seguenti serie a termini positivi: ∞ ∞ 3 2k b) a) 2k2 + 1 k5 − 3 k=0
c)
k=0
e)
k=2
∞ 3k
∞
d)
k!
k=1
k arcsin
k=1
g)
∞ k=1
i)
∞
∞ k=1
f)
1 k
)
√ 3
k+3 k9 + k2
∞ k=1
h)
k=1
m)
7 k2
log k k sin
∞ k! kk
∞ k=1
2k
1 −1
∞ 2 + 3k k=0
n)
5 log 1 + 2 k
2k
∞ cos2 k √ k k k=1
24
1 Serie numeriche
10. Trovare i valori del parametro reale p per cui converge la serie
∞ k=1
11. Stimare la somma s della serie
∞ k=0
1 . k(log k)p
1 utilizzando la somma dei primi 6 k2 + 4
termini. 12. Studiare la convergenza delle seguenti serie a termini di segno alterno:
∞ ∞ k3 + 3 1 k k a) +1 b) (−1) log (−1) k 2k3 − 5 k=1 k=0
√2 ∞ ∞ 1 1 k 1+ 2 c) sin kπ + d) (−1) −1 k k e)
k=1
k=1
∞ (−1)k 3k
∞
f)
4k − 1
k=1
(−1)k+1
k=1
k2 k3 + 1
13. Verificare che le seguenti serie sono convergenti. Determinare il numero minimo n di termini necessari affinch´e la ridotta n-esima sn approssimi la somma a meno dell’indicata accuratezza: ∞ (−1)k+1 a) , |rn | < 10−3 k4 k=1
b)
∞ (−2)k k=1
c)
k!
∞ (−1)k k k=1
4k
|rn | < 10−2
,
,
|rn | < 2 · 10−3
14. Studiare la convergenza assoluta delle seguenti serie: a)
c)
∞ (−1)k−1 √ 3 k k=1 ∞ (−2)k k=1
e)
∞
(−1)k
k=1
g)
k!
∞ (−4)k k=1
d)
k 2 k +3
f)
h)
k4
∞ cos 3k k=1
∞ (−1)k+1 5k−1 (k + 1)2 4k+2
k=1
b)
k3
∞ sin k π6 √ k k k=1 ∞ k=1
10k (k + 2) 52k+1
1.6 Esercizi
15. Studiare la convergenza delle seguenti serie:
∞ 1 1 − cos 3 a) k k=1
∞ 1 k c) k3 2
b)
k=1
e)
∞ k=1
∞
k2
(−1)k
√ k
2−1
k=1
k−1
(−1) k! 1 · 3 · 5 · · · (2k − 1)
∞ sin k k=1
d)
25
f)
∞
(−1)k
k=1
3k − 1 2k + 1
16. Verificare la convergenza delle seguenti serie e calcolarne la somma: ∞ ∞ 2k−1 3k (−1)k k b) a) 5 2 · 42k k=1
c)
∞ k=1
k=1
2k + 1 k 2 (k + 1)2
d)
∞ k=0
1 (2k + 1)(2k + 3)
1.6.1 Soluzioni 1. Termine generale e limite di successioni: n , n ≥ 1, lim an = 1 a) an = n→∞ n+1 n+1 b) an = (−1)n n , n ≥ 1 , lim an = 0 n→∞ 3 √ c) an = n , n ≥ 0 , lim an = +∞ n→∞
2. Studio del comportamento di successioni e calcolo del limite: b) Converge a 12 . c) Converge a 6. e) Diverge a +∞. n2 = 1, pertanto la successione assegnata `e indeterf) Osserviamo che lim 2 n→∞ n + 1 minata in quanto (2n + 1)2 (2n)2 = −1 , lim a2n+1 = lim = 1. lim a2n = lim − 2 n→∞ n→∞ n→∞ n→∞ (2n + 1)2 + 1 (2n) + 1
a) Diverge a +∞. d) Converge a 1.
g) Converge a π2 . h) Ricordando che cos nπ = (−1)n , si conclude immediatamente che la successione `e indeterminata. i) Poich´e {sin n1 }n≥1 `e una successione infinitesima e {(−1)n }n≥1 `e una successione limitata, si ha 1 lim (−1)n sin = 0 n→∞ n e dunque la successione assegnata converge a 1.
26
1 Serie numeriche
n cos n n n 1 n3 + 1 ≤ n3 + 1 ≤ n3 = n2 , Pertanto, per il Criterio del confronto, n cos n = 0. lim n→∞ n3 + 1
) Si ha
∀n ≥ 1 .
m) Converge a 0. n) Risulta log(2 + en ) log en (1 + 2e−n ) 1 log(1 + 2e−n ) = = + 4n 4n 4 4n 1 e dunque lim an = . n→∞ 4 o) Diverge a −∞. p) Converge a 0. 3. Comportamento di successioni: a) Diverge a +∞. b) Indeterminata. c) Ricordando il comportamento della successione geometrica (Esempio 1.1 i)) si ha 4n ( 34 )n − 1 lim an = lim n −n = −1 ; n→∞ n→∞ 4 (4 + 1) quindi la successione converge a −1. d) Diverge a +∞. e) Scriviamo an =
2n 2n − 1 n+2 n+1 2n(2n − 1) · · · (n + 2)(n + 1) = · ··· · > n + 1, n(n + 1) · · · 2 · 1 n n−1 2 1
poich´e lim (n+1) = +∞, per il secondo Teorema del confronto (caso infinito), n→∞ si deduce che la successione diverge a +∞. f) Converge a 1. g) Poich´e
n2 − n + 1 , an = exp n2 + 2 log 2 n +n+2 studiamo la successione
n2 − n + 1 2 2n + 1 bn = n2 + 2 log 2 = n + 2 log 1 − 2 . n +n+2 n +n+2 Osserviamo che lim
n→∞
e quindi
log 1 −
2n + 1 2 n +n+2
2n + 1 =0 +n+2
n2
∼−
2n + 1 , +n+2
n2
n → ∞.
1.6 Esercizi
Allora
√ n2 + 2 (2n + 1) 2n2 = − lim lim bn = − lim = −2 ; n→∞ n→∞ n→∞ n2 n2 + n + 2
dunque la successione {an } converge a e−2 . h) Posto x = 2−n π, osserviamo che x → 0+ per n → ∞. Dunque lim an = lim π +
n→∞
x→0
sin x =π x
e la successione {an } converge a π. i) Osserviamo che
quindi, posto x =
cos
π n+1π π π = cos + = − sin ; n 2 2 2n 2n
π 2n ,
si ha
lim an = − lim n sin
n→∞
n→∞
π sin x π π = − lim =− + 2n 2 x→0 2 x
e la successione {an } converge a −π/2. ) Converge a −1/2. 4. Studio della convergenza di serie e calcolo della loro somma: a) Converge e la somma vale 6. b) Osserviamo che 2k = 2 = 0 . k+5 Dunque la serie non converge ma diverge a +∞. c) Non converge. d) Si tratta di una serie telescopica; risulta 1 1 1 1 1 ) sn = (sin 1 − sin ) + (sin − sin ) + · · · + (sin − sin 2 2 3 n n+1 1 = sin 1 − sin . n+1 lim ak = lim
k→∞
k→∞
Poich´e lim sn = sin 1, la serie converge e la sua somma vale sin 1. n→∞
e) Si ha ∞ 3k + 2k k=0
6k
=
∞ k 3 k=0
6
+
∞ k 2 k=0
6
=
Pertanto la serie converge e la somma vale 7/2. f) Non converge.
1 1−
1 2
+
1 1−
1 3
=
7 . 2
27
28
1 Serie numeriche
5. Possiamo scrivere
1 17 17 17 17 1 2.317 = 2.3 + 3 + 5 + 7 + . . . = 2.3 + 3 1 + 2 + 4 + . . . 10 10 10 10 10 10 ∞ 1 17 100 17 23 17 1 + = 2.3 + 3 = 1 3 2k 10 10 10 1 − 102 10 1000 99 k=0
= 2.3 +
=
17 1147 23 + = . 10 990 495
6. Studio della convergenza di serie e calcolo della loro somma: a) Converge per |x| < 5 e la somma vale s =
x2 5(5−x) .
b) Si tratta di una serie geometrica di ragione q = 3(x + 2); dunque si ha convergenza se |3(x + 2)| < 1, ossia se x ∈ (− 73 , − 53 ). Per tali valori di x, la somma vale 1 3x + 6 s= −1=− . 1 − 3(x + 2) 3x + 5 1 c) Converge per x ∈ (−∞, −1) ∪ (1, +∞) e la somma vale s = x−1 . d) La serie `e una serie geometricadi ragione q = tan x; pertanto si ha convergenza se | tan x| < 1, ossia per x ∈ k∈Z − π4 + kπ, π4 + kπ . Per tali valori di x, la 1 somma vale s = 1−tan x. 1 7. La serie `e una serie geometrica di ragione q = 1+c , la quale converge se |1+c| > 1, ossia se c < −2 oppure c > 0. Per tali valori si ha ∞
(1 + c)−k =
k=2
1 1 1 1 − 1 − 1 − c = c(1 + c) . 1 − 1−c √
1 = 2, si ottiene c = −1±2 3 . Ricordando che il Imponendo la condizione c(1+c) parametro c varia nell’insieme (−∞, −2) ∪ (0, +∞), si conclude che l’unico valore √ ammissibile `e c = −1+2 3 . ∞ ak converge, vale la condizione necessaria lim ak = 0. 8. Poich´e la serie k→∞
k=1
∞ 1 1 Pertanto lim non pu` o valere 0 e dunque la serie non pu` o convergere. k→∞ ak ak k=1
9. Studio della convergenza di serie a termini positivi: a) Converge. b) Osserviamo che il termine generale ak tende a +∞ per k → ∞. Pertanto per la Propriet` a 1.6 la serie diverge positivamente. In alternativa, `e possibile utilizzare il Criterio della radice 1.15.
1.6 Esercizi
29
c) Applichiamo il Criterio del rapporto 1.14: ak+1 3k+1 k! = lim ; k→∞ ak k→∞ (k + 1)! 3k lim
scrivendo (k + 1)! = (k + 1)k! e semplificando, si ottiene lim
k→∞
ak+1 3 = lim = 0. k→∞ k + 1 ak
Ne segue che la serie converge. d) Applichiamo nuovamente il Criterio del rapporto 1.14: ak+1 (k + 1)! kk = lim = lim · lim k→∞ ak k→∞ (k + 1)k+1 k→∞ k!
k k+1
k =
1 < 1. e
Dunque la serie converge. e) Osserviamo che 7 7 per k → ∞. = k2 k Pertanto, applicando il Criterio del confronto asintotico 1.12 e ricordando che la serie armonica diverge, possiamo concludere che la serie data diverge. f) Converge. g) Osserviamo che log k > 1 per k ≥ 3, cos`ı ak ∼ k
log k 1 > , k k
k ≥ 3.
Per il Criterio del confronto 1.10 possiamo concludere che la serie diverge. In alternativa, si pu` o osservare che la funzione f (x) = logx x `e positiva e continua per x > 1. Inoltre, dallo studio del segno della derivata prima, si vede che `e ` possibile dunque applicare il Criterio integrale 1.17: decrescente per x > e. E c +∞ c log x log x (log x)2 dx = lim dx = lim c→+∞ 3 c→+∞ x x 2 3 3 (log c)2 (log 3)2 − = +∞ c→+∞ 2 2
= lim
e concludere che la serie assegnata diverge. h) La serie converge per il Criterio del confronto asintotico 1.12, in quanto 2k e la serie geometrica
1 1 ∼ k, −1 2
∞ 1 converge. 2k
k=1
k → +∞ ,
30
1 Serie numeriche
i) La serie diverge per il Criterio del confronto asintotico 1.12, in quanto sin e la serie armonica
1 1 ∼ , k k
k → +∞ ,
∞ 1 diverge. k
k=1
) Diverge. m) Converge. n) La serie converge per il Criterio del confronto 1.10, in quanto cos2 k 1 √ ≤ √ , k k k k e la serie armonica generalizzata
k → +∞ ,
∞ 1 converge. 3/2 k k=1
10. Converge per p > 1. +∞ f (x) dx con f (x) = 11. Calcoliamo n
1 x2 +4 ,
funzione positiva, decrescente e
continua in [0, +∞): +∞
1 1 x +∞ n π 1 dx = arctan = − arctan . x2 + 4 2 2 n 4 2 2
n
Poich´e s6 =
1 1 1 + + ... + = 0.7614 , 4 5 40
utilizzando la (1.8)
+∞
+∞
f (x) dx ≤ s ≤ s6 +
s6 + 7
f (x) dx , 6
otteniamo 0.9005 ≤ s ≤ 0.9223 . 12. Studio della convergenza di serie a termini di segno alterno: a) Converge semplicemente. b) Non converge. c) Poich´e 1 1 1 = cos(kπ) sin = (−1)k sin , sin kπ + k k k la serie assegnata `e a termini di segno alterno con bk = sin k1 . Risulta lim bk = 0
k→∞
e
bk+1 < bk .
Pertanto, per il Criterio di Leibniz 1.20, la serie converge. Osserviamo che la serie non converge assolutamente in quanto sin k1 ∼ k1 per k → ∞, dunque la serie dei valori assoluti si comporta come la serie armonica, che diverge.
1.6 Esercizi
31
d) La serie converge assolutamente in quanto, usando l’equivalenza fondamentale (1 + x)α − 1 ∼ αx, per x → 0, si ha √ √ (−1)k 1 + 1 2 − 1 ∼ 2 , k → ∞, k2 k2 e quindi, ricordando l’Esempio 1.11 i), possiamo applicare il Criterio del confronto asintotico 1.12 alla serie dei valori assoluti. e) Non converge. ` una serie a segni alterni con bk = f) E
k2 ` immediato verificare che .E k3 + 1
lim bk = 0 .
k→∞
Non `e invece ovvio che la successione bk sia definitivamente decrescente. Per dimostrarlo, consideriamo la funzione f (x) =
x2 , +1
x3
e studiamone la monotonia. Poich´e f (x) =
x(2 − x3 ) (x3 + 1)2
e siamo interessati soltanto ai valori di x positivi, otteniamo che f (x) √ √ < 0 se 3 3 2 − x < 0, ossia se x > 2. Dunque, f `e decrescente nell’intervallo ( 3 2, +∞). Ci`o significa che f (k + 1) < f (k), e perci`o, bk+1 < bk , per k ≥ 2. In definitiva, per il Criterio di Leibniz 1.20, la serie converge. 13. Approssimazioni di serie: a) n = 5. k
b) Si tratta di una serie a segni alterni con bk = 2k! . Si ha immediatamente lim bk = 0; inoltre risulta bk+1 < bk per ogni k > 1 in quanto k→∞
bk+1 =
2k 2k+1 < = bk (k + 1)! k!
⇐⇒
2 <1 k+1
⇐⇒
k > 1.
Imponendo la condizione bn+1 < 10−2 = 0.01, si pu` o verificare che risulta b7 =
8 = 0.02 , 315
b8 =
2 = 0.006 < 0.01 . 315
Pertanto il minimo numero di termini necessari `e n = 7. c) n = 5.
32
1 Serie numeriche
14. Studio della convergenza assoluta di serie: a) Si ha convergenza semplice ma non assoluta. Infatti, la serie a segni alterni converge per il Criterio di Leibniz 1.20, mentre la serie dei valori assoluti `e una serie armonica generalizzata con esponente α = 13 < 1. b) Non converge. c) La serie converge assolutamente, come si vede facilmente utilizzando ad esempio il Criterio del rapporto 1.14: bk+1 2k+1 2 k! · = 0 < 1. = lim = lim k→∞ bk k→∞ (k + 1)! 2k k→∞ k + 1 lim
d) La serie converge assolutamente in quanto la serie dei valori assoluti converge per il Criterio del confronto 1.10: cos 3k 1 ∀k ≥ 1 . k3 ≤ k3 , e) f) g) h)
Converge semplicemente ma non assolutamente. Converge assolutamente. La serie non converge in quanto il termine generale non tende a 0. Converge assolutamente.
15. Studio della convergenza di serie: a) Converge. b) Osserviamo che
sin k 1 k2 ≤ k2 ,
per ogni k > 0 ;
∞ 1 converge e dunque, applicando il Criterio del confronto 1.10, k2 k=1 anche la serie dei valori assoluti converge. Pertanto la serie data converge assolutamente. c) Diverge. √ d) Si tratta di una serie a termini di√segno alterno con bk = k 2−1. La successione √ k k+1 {bk }k≥1 `e decrescente, essendo 2 > 2 per ogni k ≥ 1. Dunque possiamo applicare il Criterio di Leibniz 1.20 e concludere che la serie converge. Si osservi che la serie non converge assolutamente, in quanto
la serie
√ k
2 − 1 = elog 2/k − 1 ∼
log 2 , k
k → ∞,
e quindi la serie dei valori assoluti si comporta come la serie armonica, che diverge.
1.6 Esercizi
e) Si osservi che 2 3 k k! = 1 · · ··· < bk = 1 · 3 · 5 · · · (2k − 1) 3 5 2k − 1 in quanto
2 k < , 2k − 1 3
33
k−1 2 3
∀k ≥ 2 .
Pertanto la serie converge assolutamente in quanto la serie
∞
bk converge per
k=1
il Criterio del confronto 1.10 (`e maggiorata da una serie geometrica di ragione q = 23 < 1). f) Non converge. 16. Verifica della convergenza di serie e calcolo della loro somma: a) −1/7 . b) A meno di un fattore, si tratta di una serie geometrica; ricordando l’Esempio 1.3 iii), si ha ∞ k=1
∞
3k 1 = 2 · 42k 2
k=1
3 16
k
1 = 2
1 3 −1 1 − 16
=
(si noti che il primo indice della sommatoria `e 1). c) Si tratta di una serie telescopica in quanto possiamo scrivere 2k + 1 1 1 = 2− ; 2 + 1) k (k + 1)2
k 2 (k dunque
sn = 1 − da cui s = lim sn = 1. n→∞
d) 1/2 .
1 , (n + 1)2
3 26
2 Serie di funzioni e di potenze
L’idea di approssimare una funzione mediante una successione di funzioni pi` u semplici, o comunque note, `e alla base di molteplici procedure matematiche, di natura tanto teorica quanto applicativa. Ad esempio, per dimostrare l’esistenza di una soluzione di un’equazione differenziale, `e possibile costruire ricorsivamente una successione di funzioni approssimanti e poi mostrare che esse convergono verso una soluzione cercata. D’altro canto, l’effettivo calcolo dei valori della soluzione dell’equazione differenziale pu` o non essere realizzabile per via analitica, ed allora si pu` o ricorrere a metodologie numeriche, che generano funzioni approssimanti ` aventi una struttura particolarmente semplice, ad esempio polinomiale a tratti. E dunque importante comprendere quando una successione di funzioni genera una funzione limite, quali siano i vari tipi di convergenza verso il limite e quali propriet` a delle funzioni che formano la successione siano ereditate dalla funzione limite. Ci` o costituir` a l’oggetto della prima parte del capitolo. Il passaggio da una successione di funzioni alla corrispondente serie di funzioni `e analogo a quello, gi` a studiato, che porta da una successione di numeri reali alla serie numerica associata; la complicazione aggiuntiva nasce dal fatto che diversi tipi di convergenza sono ora possibili. Queste problematiche verranno prese in esame nel prosieguo del capitolo. Lo sviluppo in serie di funzioni costituisce uno degli strumenti pi` u importanti dell’Analisi Matematica e delle sue applicazioni, anche in questo caso a livello sia teorico sia numerico. Esempi fondamentali di serie di funzioni sono dati dalle serie di potenze, che verranno trattate nella seconda met` a del capitolo, dalle serie di Fourier, a cui `e dedicato tutto il successivo capitolo, e pi` u in generale da tutte le serie di funzioni ortogonali classiche, quali gli sviluppi in polinomi di Legendre, di Chebyshev o di Hermite, in funzioni di Bessel, e cos`ı via. A differenza degli ultimi sviluppi in serie citati, che forniscono una rappresentazione globale di una funzione su un intervallo della retta reale, le serie di potenze hanno una natura pi` u locale; infatti, ove esse convergano su un intervallo (x0 − R, x0 + R) della retta reale, rappresentano la funzione limite in termini di sole informazioni sul comportamento della funzione in un intorno arbitrariamente o essere piccolo di x0 . In effetti, lo sviluppo in serie di potenze della funzione pu` pensato come il suo sviluppo di Taylor di ordine infinito, centrato in x0 . Ci` o rispec-
Canuto C, Tabacco A: Analisi Matematica II. © Springer-Verlag Italia, Milano 2008
36
2 Serie di funzioni e di potenze
chia la visione intuitiva di una serie di potenze come di un polinomio algebrico di grado infinito, vale a dire la somma di infiniti monomi di grado via via crescente. Nel seguito, affronteremo il problema della determinazione rigorosa dell’insieme di convergenza di una serie di potenze; studieremo poi le principali propriet` a delle serie di potenze e delle funzioni, dette analitiche, che sono sviluppabili in tali serie su di un intervallo della retta reale non ridotto a un punto.
2.1 Successioni di funzioni Sia X un qualunque insieme della retta reale. Supponiamo che per ogni n maggiore o uguale di un certo n0 ≥ 0 sia data una funzione reale definita su X, che indichiamo con fn : X → R. La famiglia {fn }n≥n0 `e detta successione di funzioni. Esempi sono le famiglie di funzioni fn (x) = sin(x + n1 ), n ≥ 1 oppure fn (x) = xn , n ≥ 0, su X = R. Come per le successioni numeriche, siamo interessati a studiare il comportamento di una successione di funzioni per n → ∞. Il primo passo di tale studio consiste nell’analizzare, in ogni punto dell’insieme X, la successione numerica data dai valori delle funzioni fn in tale punto. Definizione 2.1 Diciamo che la successione {fn }n≥n0 converge puntualmente in x ∈ X se la successione numerica {fn (x)}n≥n0 converge per n → ∞. Sia A ⊆ X l’insieme di tali punti x, che chiamiamo insieme di convergenza puntuale della successione {fn }n≥n0 ; risulta cos`ı definita una funzione f : A → R ponendo f (x) = lim fn (x) , n→∞
∀x ∈ A .
Scriveremo fn → f puntualmente in A, e diremo che f `e la funzione limite della successione. Notiamo che f `e la funzione limite della successione se e solo se essa soddisfa lim |fn (x) − f (x)| = 0 ,
n→∞
Esempi 2.2
∀x ∈ A .
i) Sia fn (x) = sin x + n1 , n ≥ 1, su X = R. Allora, osservando che x + n1 → x per n → ∞ e utilizzando la continuit` a della funzione seno, si ha 1 f (x) = lim sin x + = sin x , ∀x ∈ R , n→∞ n da cui A = X = R. ii) Sia fn (x) = xn , n ≥ 0, su X = R; allora, ricordando la (1.1), si ha
0 se −1 < x < 1 , (2.1) f (x) = lim xn = n→∞ 1 se x = 1 . La successione non converge per ogni altro valore di x e pertanto A = (−1, 1]. 2
2.1 Successioni di funzioni
37
Il concetto di convergenza puntuale non `e, in molti casi, sufficiente per garantire che certe propriet`a soddisfatte dalle singole funzioni fn che compongono la successione siano trasferite alla funzione limite f . La continuit` a (cos`ı come la derivabilit` a o l’integrabilit` a) `e una di queste propriet` a. Negli esempi precedenti, notiamo che in entrambi i casi le funzioni fn (x) sono continue, mentre la funzione limite lo `e nel caso i) ma non nel caso ii). Una condizione pi` u stringente di convergenza che garantisce il trasferimento ora citato `e la cosiddetta convergenza uniforme. Per capire la differenza tra convergenza puntuale e uniforme, ricordiamo la definizione di limite, esplicitando la Definizione 2.1. Essa afferma che per ogni punto x ∈ A e per ogni ε > 0 esiste un intero n tale che ∀n ≥ n0 , n > n
|fn (x) − f (x)| < ε .
=⇒
In generale n dipende non soltanto da ε ma anche da x, ossia n = n(ε, x). In altri termini, l’indice n a partire dal quale i valori fn (x) approssimano f (x) a meno di ε pu` o variare da punto a punto. Ad esempio, consideriamo ancora la successione fn (x) = xn , e sia 0 < x < 1; la condizione |fn (x) − f (x)| = |xn − 0| = xn < ε log ε u piccolo valore di n per cui la `e verificata per ogni n > log x . Pertanto il pi` condizione vale, tende all’infinito con l’avvicinarsi di x a 1. Non si pu` o quindi trovare un n dipendente solo da ε e non da x. La convergenza viene detta uniforme quando l’indice n pu` o essere scelto indipendente da x. Ci`o significa che, per ogni ε > 0, deve esistere un intero n tale che ∀n ≥ n0 , n > n =⇒ |fn (x) − f (x)| < ε , ∀x ∈ A .
Ricordando la definizione di estremo superiore e tenendo conto dell’arbitrariet` a di ε, possiamo riformulare la condizione ora enunciata nel modo seguente: per ogni ε > 0, deve esistere un intero n tale che ∀n ≥ n0 , n > n
=⇒
sup |fn (x) − f (x)| < ε .
x∈A
Diamo quindi la seguente definizione. Definizione 2.3 La successione {fn }n≥n0 converge uniformemente in A alla funzione limite f se lim sup |fn (x) − f (x)| = 0 ,
n→∞ x∈A
ossia se per ogni ε > 0, esiste un intero n = n(ε) tale che ∀n ≥ n0 , n > n
=⇒
|fn (x) − f (x)| < ε ,
Scriveremo fn → f uniformemente in A.
∀x ∈ A .
(2.2)
38
2 Serie di funzioni e di potenze
Introduciamo la notazione g∞,A = sup |g(x)| , x∈A
dove g : A → R denota una funzione limitata su A; tale quantit` a viene detta norma infinito di g su A (si veda ; Complementi al Cap. 2 , per una trattazione organica del concetto di norma di funzione). Pertanto, la condizione di convergenza uniforme pu` o essere scritta sinteticamente come lim fn − f ∞,A = 0 ,
n→∞
(2.3)
che pu` o essere assunta come definizione di convergenza uniforme. Ovviamente, la convergenza uniforme di una successione `e una condizione pi` u forte della convergenza puntuale. Infatti, per definizione di norma infinito, si ha ∀x ∈ A ,
|fn (x) − f (x)| ≤ fn − f ∞,A
e dunque se la norma di destra tende a 0, anche il valore assoluto di sinistra tender`a a 0. Abbiamo quindi il seguente risultato. Proposizione 2.4 Se la successione {fn }n≥n0 converge a f uniformemente in A, allora converge anche puntualmente in A. Non vale il viceversa, come mostrano alcuni degli esempi sottostanti. Esempi 2.5
i) La successione fn (x) = sin x + n1 , n ≥ 1, converge uniformemente a f (x) = sin x in R. Infatti, usando una delle formule di prostaferesi, si ha, per ogni x ∈ R, 1 1 1 1 − sin x = 2 sin ; sin x + cos x + ≤ 2 sin n 2n 2n 2n 1 inoltre, l’uguaglianza `e raggiunta ad esempio per x = − 2n . Pertanto 1 1 − sin x = 2 sin fn − f ∞,R = sup sin x + n 2n x∈R e passando al limite per n → ∞ si ottiene il risultato (si veda la Figura 2.1, a sinistra). ii) Come visto in precedenza, la successione fn (x) = xn , n ≥ 0, non converge uniformemente in I = [0, 1] alla funzione f definita in (2.1). Infatti, per ogni n ≥ 0, si ha fn − f ∞,I = sup xn = 1 (si veda la Figura 2.1, a destra). Tuttavia, si 0≤x<1
ha convergenza uniforme su ogni sottointervallo Ia = [0, a] con 0 < a < 1 fissato. Infatti fn − f ∞,Ia = sup |xn − 0| = an → 0 per n → ∞ x∈[0,a]
2.2 Propriet` a delle successioni uniformemente convergenti
39
y y sin x f10 f2
f1 x
f2
f1
f10 f100 f
1
x
Figura 2.1. Grafici di alcune funzioni fn e della funzione limite f relative agli Esempi 2.5 i) (a sinistra) e ii) (a destra)
e dunque la successione converge a zero uniformemente in Ia . Pi` u in generale si pu` o verificare che la successione converge uniformemente a zero in ogni intervallo [−a, a], 0 < a < 1. 2 ` immediato dimostrare che vale il seguente criterio, utile per verificare la E convergenza uniforme di una successione di funzioni. Proposizione 2.6 Sia {fn }n≥n0 una successione di funzioni convergente puntualmente in A a una funzione f ; sia inoltre {Mn }n≥n0 una successione numerica, infinitesima per n → ∞, tale che |fn (x) − f (x)| ≤ Mn ,
∀x ∈ A .
Allora fn → f uniformemente in A. 1 Tale propriet` a `e stata utilizzata negli esempi precedenti, con Mn = 2 sin 2n nel n caso i), e con Mn = a nel caso ii).
2.2 Propriet` a delle successioni uniformemente convergenti Presentiamo alcune importanti propriet` a delle successioni uniformemente convergenti per la cui dimostrazione rimandiamo a ; Complementi al Cap. 2 . Come annunciato, la convergenza uniforme assicura il trasferimento della continuit` a alla funzione limite. Teorema 2.7 Sia {fn }n≥n0 una successione di funzioni continue su un intervallo I della retta reale, che convergono uniformemente a una funzione f su I. Allora f `e continua in I.
40
2 Serie di funzioni e di potenze
Il risultato precedente pu` o essere usato per asserire che la convergenza puntuale di una successione di funzioni non `e uniforme. Infatti, se la funzione limite non `e continua mentre le singole componenti della successione lo sono, si ha il risultato negativo. 2.2.1 Passaggio al limite sotto segno di integrale Supponiamo che fn → f puntualmente su I = [a, b]. Allora, se le funzioni sono integrabili, non `e vero in generale che b b fn (x) dx → f (x) dx . a
a
Esempio 2.8 Sia fn (x) = xn2 e−nx in I = [0, 1]. Allora fn (x) → 0 = f (x) per n → ∞, 1 puntualmente su I. Dunque f (x) dx = 0; d’altra parte, ponendo ϕ(t) = te−t , si ha
0
1
fn (x) dx = 0
1
n
ϕ(nx)n dx = 0
0
= −ne
−n
−e
−n
n ϕ(t) dt = −ne−n + −e−t 0
+ 1 → 1 per n → ∞ .
2
La convergenza uniforme `e una condizione sufficiente per trasferire alla funzione limite la propriet` a di integrabilit` a. Teorema 2.9 Sia I = [a, b] un intervallo chiuso e limitato. Sia {fn }n≥n0 una successione di funzioni integrabili su I e tali che fn → f uniformemente in I. Allora f `e integrabile su I, e si ha
b
fn (x) dx → a
b
f (x) dx
per n → ∞ .
(2.4)
a
Osserviamo che la (2.4) pu` o essere scritta come b b lim fn (x) dx = lim fn (x) dx , n→∞
a
a n→∞
il che mostra che la propriet`a di convergenza uniforme permette lo scambio tra le operazioni di limite e di integrazione. 2.2.2 Passaggio al limite sotto segno di derivata Nel limite di funzioni derivabili, opportune ipotesi di convergenza uniforme, precisate nel seguente teorema, assicurano la derivabilit`a della funzione limite.
2.2 Propriet` a delle successioni uniformemente convergenti
41
Teorema 2.10 Sia {fn }n≥n0 una successione di funzioni di classe C 1 su un intervallo I = [a, b]. Supponiamo che esistano due funzioni f e g definite su I tali che i) fn → f puntualmente in I; ii) fn → g uniformemente in I. Allora f `e di classe C 1 su I, e si ha f = g. Inoltre fn → f uniformemente in I (e, ovviamente, fn → f uniformemente in I). Sotto le ipotesi del teorema, vale quindi l’uguaglianza lim fn (x) = lim fn (x) , ∀x ∈ A , n→∞
n→∞
e dunque la propriet` a di convergenza uniforme (delle derivate prime) permette di scambiare le operazioni di limite e di derivazione. Osservazione 2.11 Una forma pi` u generale del teorema precedente, con dimostrazione del tutto analoga, afferma che se la successione {fn }n≥n0 di funzioni di classe C 1 soddisfa le condizioni: i) esiste x0 ∈ [a, b] tale che lim fn (x0 ) = ∈ R; n→∞
ii) la successione {fn }n≥n0 converge uniformemente su I verso una funzione g (necessariamente continua su I), allora, posto
x
f (x) = +
g(t) dt , x0
si ha che fn converge uniformemente a f su I. Inoltre f ∈ C 1 e vale f (x) = g(x) per ogni x ∈ [a, b]. 2 Osservazione 2.12 Mostriamo con un esempio come la sola convergenza puntuale della successione delle derivate non sia sufficiente per ottenere la tesi, anche in presenza di convergenza uniforme della successione delle funzioni. Consideriamo la successione fn (x) = x − xn /n. Essa converge uniformemente in I = [0, 1] alla funzione f (x) = x, in quanto n x 1 |fn (x) − f (x)| = ≤ , ∀x ∈ I , n n e dunque 1 → 0 per n → ∞ . n Tuttavia la successione delle derivate fn (x) = 1 − xn−1 converge alla funzione discontinua
1 se x ∈ [0, 1) , g(x) = 0 se x = 1 . fn − f ∞,I ≤
42
2 Serie di funzioni e di potenze
Pertanto {fn }n≥0 converge solo puntualmente e non uniformemente a g in [0, 1], e tale funzione non coincide su I con la derivata della funzione f . 2
2.3 Serie di funzioni A partire da una successione di funzioni {fk }k≥k0 definite su un insieme X ⊆ R, ∞ fk in modo analogo a quanto fatto per possiamo costruire una serie di funzioni k=k0
le successioni e serie numeriche. Precisamente, consideriamo la successione delle somme parziali o ridotte n sn (x) = fk (x) k=k0
e ne studiamo il comportamento per n → ∞. Sono dunque possibili varie tipologie di convergenza.
Definizione 2.13 Diciamo che la serie di funzioni
∞
fk converge pun-
k=k0
tualmente in x se la successione delle ridotte {sn }n≥k0 converge puntual∞ fk (x) converge. Sia mente in x; equivalentemente, la serie numerica k=k0
A ⊆ X l’insieme di tali punti x, che chiamiamo insieme di convergen∞ za puntuale della serie fk ; risulta cos`ı definita una funzione somma s : A → R ponendo
k=k0
s(x) = lim sn (x) = n→∞
∞
fk (x) ,
∀x ∈ A .
k=k0
Lo studio della convergenza puntuale di una serie di funzioni pu` o essere svolto applicando in ogni punto x ∈ X quanto visto per le serie numeriche. In particolare, affinch´e x ∈ A, la successione {fk (x)}k≥k0 deve essere infinitesima per k → ∞. Inoltre, in ciascun punto si possono applicare i criteri di convergenza visti nel capitolo precedente.
Definizione 2.14 Diciamo che la serie di funzioni assolutamente in A se per ogni x ∈ A converge la serie
∞ k=k0 ∞ k=k0
fk converge |fk (x)| .
2.3 Serie di funzioni
Definizione 2.15 Diciamo che la serie di funzioni
∞
43
fk converge uni-
k=k0
formemente alla funzione somma s in A se la successione delle ridotte {sn }n≥k0 converge uniformemente a s in A. Tanto la convergenza assoluta (grazie al Teorema 1.24) quanto quella uniforme (grazie alla Proposizione 2.4) implicano la convergenza puntuale della serie in A. Non esistono invece implicazioni logiche tra la convergenza assoluta e quella uniforme. Esempio 2.16 La serie di funzioni
∞
xk , non `e altro che la serie geometrica gi`a considerata
k=0
nell’Esempio 1.3, in cui la ragione q viene vista come variabile indipendente e quindi indicata con x. Pertanto essa converge puntualmente alla funzione somma 1 s(x) = 1−x in A = (−1, 1); sullo stesso insieme si ha anche convergenza assoluta. Per quanto riguarda la convergenza uniforme, essa vale in ogni intervallo chiuso [−a, a], con 0 < a < 1. Infatti, 1 − xn+1 1 |x|n+1 an+1 |sn (x) − s(x)| = − = ≤ , 1−x 1−x 1−x 1−a avendo osservato che se |x| ≤ a allora 1 − a ≤ 1 − x. Inoltre la successione n+1 Mn = a1−a tende a 0 per n → ∞ e, applicando la Proposizione 2.6, si ha il risultato. 2 ` chiaro dalle definizioni appena date che i Teoremi 2.7, 2.9 e 2.10 possono E essere riformulati per le serie di funzioni. Nel seguito, per comodit` a dello studente, riportiamo gli enunciati opportunamente adattati. Teorema 2.17 Sia {fk }k≥k0 una successione di funzioni continue su un in∞ fk converga uniformemente a tervallo I della retta reale tali che la serie k=k0
una funzione s su I. Allora s `e continua su I.
Teorema 2.18 (Integrazione per serie) Sia I = [a, b] un intervallo chiuso e limitato. Sia {fk }k≥k0 una successione di funzioni integrabili su I e tali che ∞ fk converga uniformemente a una funzione s su I. la serie k=k0
44
2 Serie di funzioni e di potenze
Allora s `e integrabile su I, e si ha
b
∞
fk (x) dx =
a k=k 0
∞
b
fk (x) dx .
(2.5)
a
k=k0
Si usa dire che la serie `e integrabile termine a termine. Teorema 2.19 (Derivazione per serie) Sia {fk }k≥k0 una successione di funzioni di classe C 1 su un intervallo I = [a, b]. Supponiamo che esistano due funzioni s e t definite su I tali che i) ii)
∞ k=k0 ∞
fk (x) = s(x) ,
∀x ∈ I;
fk (x) = t(x) ,
∀x ∈ I e la convergenza sia uniforme su I.
k=k0
Allora s ∈ C (I) e si ha s = t. Inoltre 1
su I (e
∞
∞
fk converge uniformemente a s
k=k0
fk converge uniformemente a s ).
k=k0
In altre parole, il teorema afferma che ∞ ∞ fk (x) = fk (x) , k=k0
∀x ∈ I .
k=k0
Si usa dire che la serie `e derivabile termine a termine. L’importanza della nozione di convergenza uniforme per le serie appare chiara dai teoremi precedenti. Tuttavia, si pone il problema della sua verifica, non sempre agevole. Inoltre tale verifica, fatta in base alla definizione, presuppone la conoscenza della funzione somma; come abbiamo visto neppure per le serie numeriche la somma `e calcolabile esplicitamente in generale. Forniamo allora, nel seguito, una condizione sufficiente che garantisce la convergenza uniforme di una serie e che non richiede la conoscenza della sua somma. Teorema 2.20 (Criterio di Weierstrass) Sia {fk }k≥k0 una successione di funzioni definite in X e sia {Mk }k≥k0 una successione di numeri reali tali che, per ogni k ≥ k0 , si abbia |fk (x)| ≤ Mk ,
∀x ∈ X .
2.3 Serie di funzioni
Supponiamo inoltre che la serie numerica ∞
∞
45
Mk converga. Allora la serie
k=k0
fk converge uniformemente in X.
k=k0
Dim.
Fissato x ∈ X, la serie numerica
∞
|fk (x)| converge per il Criterio del
k=k0
confronto e dunque `e ben definita la funzione somma s(x) =
∞
∀x ∈ X .
fk (x) ,
k=k0
` sufficiente quindi verificare che la successione delle ridotte {sn }n≥k E 0 converge uniformemente a s in X. Risulta, per ogni x ∈ X, ∞ ∞ ∞ |sn (x) − s(x)| = fk (x) ≤ |fk (x)| ≤ Mk , k=n+1
k=n+1
ossia sup |sn (x) − s(x)| ≤
x∈X
Poich´e la serie
∞
∞
k=n+1
Mk .
k=n+1
Mk converge, l’espressione a secondo membro altro non
k=k0
`e che il resto n-esimo di una serie convergente che, per n → ∞, tende a 0. In conclusione lim sup |sn (x) − s(x)| = 0 n→∞ x∈X
e dunque la serie
∞
fk converge uniformemente in X.
k=k0
Esempio 2.21 Studiamo la convergenza puntuale e uniforme della serie ∞ sin k 4 x √ , x ∈ R. k k k=1 Si osservi che sin k 4 x 1 √ ≤ √ ∀x ∈ R ; k k k k,
2
46
2 Serie di funzioni e di potenze
1 pertanto `e possibile applicare il Criterio di Weierstrass con Mk = k√ in k ∞ 1 converge (si tratta di una serie armonica generalizquanto la serie 3/2 k k=1 zata di esponente 3/2). Dunque la serie converge uniformemente e quindi anche puntualmente in R. 2
2.4 Serie di potenze Le serie di potenze sono un caso notevole di serie di funzioni, in cui ciascuna funzione fk `e un particolare polinomio. Precisamente, diamo la seguente definizione. Definizione 2.22 Sia x0 ∈ R e {ak }k≥0 una successione numerica. Chiamiamo serie di potenze una serie della forma ∞
ak (x − x0 )k = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · ·
(2.6)
k=0
Il punto x0 `e detto centro della serie e i numeri {ak }k≥0 coefficienti della serie. Notiamo che la serie converge nel suo centro qualunque siano i coefficienti. Vediamo nel seguito tre esempi significativi che quasi esauriscono la gamma delle possibili tipologie di insieme di convergenza. Mostreremo infatti che tale insieme `e sempre un intervallo (eventualmente ridotto al solo centro). Esempi 2.23 i) La serie ∞
k k xk = x + 4x2 + 27x3 + · · ·
k=1
converge solo per x = 0; infatti, per ogni x = 0 il termine generale kk xk non tende a zero e dunque non `e verificata la condizione necessaria per la convergenza di una serie (Propriet` a 1.6). ii) Consideriamo la serie ∞ xk k=0
k!
=1+x+
x2 x3 + + ··· ; 2! 3!
(2.7)
essa viene detta serie esponenziale. Il nome `e dovuto al fatto che la sua somma `e la funzione s(x) = ex ; tale propriet` a sar`a verificata nel seguito (Esempio 2.46 i)).
2.4 Serie di potenze
47
La serie (2.7) converge per ogni x ∈ R. Infatti, fissato x = 0, si ha convergenza per il Criterio del rapporto per le serie numeriche (Teorema 1.14): k+1 x |x| k! lim · k = lim = 0, ∀x ∈ R \ {0} . k→∞ (k + 1)! x k→∞ k + 1 iii) Un altro esempio gi`a incontrato `e la serie geometrica ∞ xk = 1 + x + x2 + x3 + · · · k=0
(si ricordi l’Esempio 2.16). Abbiamo visto che essa converge per x ∈ (−1, 1) con 1 somma s(x) = 1−x . 2 Negli esempi appena considerati le serie convergono (assolutamente) in un intervallo simmetrico rispetto al centro (in tutti i casi esaminati, l’origine). Vedremo che l’insieme di convergenza A di una qualunque serie di potenze, indipendentemente dai valori assunti dai suoi coefficienti, `e un intervallo limitato (aperto, chiuso oppure semiaperto) avente x0 come centro, oppure `e tutto R. Nel seguito studieremo in dettaglio il caso di serie centrate nell’origine. Infatti, la sostituzione y = x − x0 permette sempre di ridursi a questa situazione. Premettiamo un risultato tecnico, diretta conseguenza del Criterio del confronto per serie numeriche (Teorema 1.10), che ha un’importanza fondamentale nello studio delle serie di potenze.
Proposizione 2.24 Se la serie
∞
ak xk , con x = 0, ha i termini limita-
k=0
ti, in particolare se converge, allora la serie di potenze
ak xk converge
k=0
assolutamente per ogni x tale che |x| < |x|. Dim.
∞
Dall’ipotesi di limitatezza dei termini ak xk , esiste una costante M > 0 tale che |ak xk | ≤ M , ∀k ≥ 0 . Allora, per ogni x con |x| < |x|, risulta k k k k x ≤ M x , |ak x | = ak x x x Poich´e |x| < |x|, la serie geometrica
∞ k x
∀k ≥ 0 .
converge assolutamente x e dunque, per il Criterio del confronto, converge assolutamente anche la ∞ serie a k xk . 2 k=0
k=0
48
2 Serie di funzioni e di potenze
Esempio 2.25
k − 1 ≤ 1, x ha i termini limitati per x = ±1, in quanto La serie k+1 k + 1 k=0 per ogni k ≥ 0. Dunque, per la proposizione precedente, la serie converge per |x| < 1. Si noti che non converge per |x| ≤ 1 perch´e, per x = ±1, il termine generale non `e infinitesimo. 2 ∞ k−1
k
La Proposizione 2.24 ha una conseguenza immediata ma fondamentale che enunciamo esplicitamente. ∞
Corollario 2.26 Se una serie di potenze
ak xk converge in un punto x1 =
k=0
0, allora converge assolutamente nell’intervallo aperto (−|x1 |, |x1 |); se non converge in un punto x2 = 0, allora non converge in nessun punto delle semirette (|x2 |, +∞) e (−∞, −|x2 |). L’enunciato `e illustrato in Figura 2.2, nel caso x1 > 0 e x2 < 0. non converge
x2 −x1
0
x1
−x2
converge Figura 2.2. Rappresentazione dell’enunciato del Corollario 2.26
Siamo ora in grado di mostrare quanto anticipato: l’insieme di convergenza di una serie di potenze `e un intervallo simmetrico, esclusi eventualmente gli estremi, rispetto al suo centro.
Teorema 2.27 Data la serie di potenze dei casi seguenti:
∞
ak xk , si verifica uno e uno solo
k=0
a) la serie converge solo in x = 0; b) la serie converge puntualmente e assolutamente per ogni x ∈ R; inoltre converge uniformemente in ogni intervallo chiuso e limitato [a, b]. c) esiste un unico numero reale R > 0 tale che la serie converge puntualmente e assolutamente per ogni x con |x| < R, uniformemente in ogni intervallo [a, b] ⊂ (−R, R). Inoltre la serie non converge per ogni x tale che |x| > R.
2.4 Serie di potenze
Dim.
Sia A l’insieme di convergenza della serie
∞
49
a k xk .
k=0 Se A = {0}, si ha il caso a). Se A = R, si ha il caso b). Infatti per il Corollario 2.26, la serie converge puntualmente e assolutamente per ogni x ∈ R. Per quanto riguarda la convergenza uniforme su un intervallo [a, b], poniamo L = max(|a|, |b|). Allora |fk (x)| = |ak xk | ≤ |ak Lk | , ∀x ∈ [a, b] ;
possiamo dunque applicare il Criterio di Weierstrass 2.20 con Mk = |ak |Lk . Si supponga ora che A contenga punti diversi da 0 ma che non sia l’intera retta. Esiste dunque x ∈ / A; applicando ancora il Corollario 2.26, A non pu` o contenere alcun punto x con |x| > |x|, quindi l’insieme A `e limitato. Poniamo R = sup A; si ha R > 0, perch´e A non si riduce al solo {0}. Si consideri un qualunque x con |x| < R; per definizione di estremo superiore, ∞ esiste x1 tale che |x| < x1 < R con ak xk1 convergente. Dunque, ancora k=0
per il Corollario 2.26, la serie converge puntualmente e assolutamente in x. Per quanto riguarda la convergenza uniforme, si procede esattamente come nel caso b). Infine, in base alla definizione di estremo superiore l’insieme A non pu` o contenere valori x > R, e neppure x < −R (nuovamente grazie ∞ al Corollario 2.26). Dunque, se |x| > R, la serie ak xk non converge. 2 k=0
Definizione 2.28 Dicesi raggio di convergenza della serie ∞ ak xk converge . R = sup x ∈ R :
quantit` a
∞
ak xk la
k=0
k=0
Tornando al Teorema 2.27, osserviamo che, nel caso a), si ha R = 0; nel caso b), si ha R = +∞; mentre, nel caso c), R `e precisamente il numero reale strettamente positivo che compare nell’enunciato. Esempi 2.29 Riprendiamo gli Esempi 2.23. ∞ i) La serie k k xk ha raggio di convergenza R = 0. ii) La serie
k=1 ∞
iii) La serie
k=0 ∞ k=0
xk ha raggio di convergenza R = +∞. k! xk ha raggio di convergenza R = 1.
2
50
2 Serie di funzioni e di potenze
Nulla pu` o essere dedotto dal teorema sul comportamento della serie per x = ±R: la serie pu` o convergere in entrambi i punti, in uno solo di essi oppure in nessuno dei due, come mostrano gli esempi seguenti. Esempi 2.30 i) La serie ∞ xk k=1
k2
converge in x = ±1 (serie armonica generalizzata di esponente 2 in x = 1, a segni alterni in x = −1). Inoltre non converge per ogni x con |x| > 1, in quanto il termine generale non tende a zero. Pertanto R = 1 e A = [−1, 1]. ii) La serie ∞ xk k=1
k
converge in x = −1 (serie armonica a segni alterni) ma non in x = 1 (serie armonica). Pertanto R = 1 e A = [−1, 1). iii) Abbiamo gi` a visto che la serie geometrica ∞ xk k=1
converge solo in A = (−1, 1) e ha raggio R = 1.
2
La convergenza in uno degli estremi assicura che la serie converge uniformemente sugli intervalli chiusi che includono tale estremo. Precisamente, si dimostra il seguente teorema. Teorema 2.31 (di Abel) Supponiamo R > 0 finito. Se la serie converge in x = R, allora la convergenza `e uniforme in ogni intervallo [a, R] ⊂ (−R, R]. Analogo risultato vale se la serie converge in x = −R. Se ora consideriamo una serie di potenze centrata in un generico punto x0 , i risultati precedenti si riformulano nel modo seguente. Il raggio di convergenza R ∞ vale 0 se e solo se la serie ak (x − x0 )k converge solo nel suo centro x0 , mentre k=0
R = +∞ se e solo se la serie converge in ogni punto x in R. Nel caso restante, R `e positivo e finito e il Teorema 2.27 afferma che l’insieme A di convergenza della serie verifica le inclusioni: {x ∈ R : |x − x0 | < R} ⊆ A ⊆ {x ∈ R : |x − x0 | ≤ R} . ` evidente l’importanza del saper determinare il raggio di convergenza di una E serie di potenze. I successivi criteri, diretta conseguenza degli analoghi Criteri del
2.4 Serie di potenze
51
rapporto e della radice per serie numeriche, rispondono in modo sufficientemente semplice ma efficace a tale esigenza. Teorema 2.32 (Criterio del rapporto) Data la serie di potenze ∞
ak (x − x0 )k ,
k=0
con ak = 0 per ogni k ≥ 0, se esiste il limite ak+1 = lim k→∞ ak allora il raggio di convergenza R `e dato da ⎧ 0 se = +∞ , ⎪ ⎪ ⎨ R = +∞ se = 0 , ⎪ ⎪ ⎩1 se 0 < < +∞ . Dim.
(2.8)
` sufficiente applicare il Per semplicit` a supponiamo x0 = 0. Sia x = 0. E Criterio del rapporto 1.14 per ottenere la tesi in quanto ak+1 xk+1 ak+1 |x| = |x| . = lim lim k→∞ ak xk k→∞ ak Se = +∞, |x| > 1 e la serie non converge per ogni x = 0, ossia R = 0; se = 0, |x| = 0 < 1 e la serie converge per ogni x, ossia R = +∞. Infine, se `e finito e non nullo, la serie converge per ogni x tale che |x| < 1, ovvero |x| < 1/, e non converge se |x| > 1/; pertanto R = 1/. 2
Teorema 2.33 (Criterio della radice) Data la serie di potenze ∞
ak (x − x0 )k ,
k=0
se esiste il limite lim
k→∞
k |ak | =
allora il raggio di convergenza R `e dato dalla formula (2.8). La dimostrazione di questo teorema utilizza il Criterio della radice 1.15 e segue la falsariga della dimostrazione del criterio precedente; pertanto viene lasciata allo studente volenteroso.
52
2 Serie di funzioni e di potenze
Esempi 2.34 i) La serie
∞
kxk ha raggio di convergenza R = 1 in quanto lim
k→∞
k=0
√ k
k = 1; non
converge n´e per x = 1 n´e per x = −1. ii) Consideriamo la serie
∞ k! k x kk
k=0
e applichiamo il Criterio del rapporto:
k
−k (k + 1)! k 1 kk = lim 1 + · = lim = e−1 . lim k→∞ (k + 1)k+1 k→∞ k + 1 k→∞ k! k Pertanto il raggio di convergenza vale R = e. iii) Consideriamo la serie ∞ k=2 2
2k + 1 (x − 2)2k . (k − 1)(k + 2)
(2.9)
Conviene porre y = (x−2) e studiare la serie di potenze in y centrata nell’origine ∞ 2k + 1 yk . (2.10) (k − 1)(k + 2) k=2 Risulta lim k
k→∞
2k + 1 =1 (k − 1)(k + 2)
e quindi in raggio di convergenza di tale serie vale 1. Inoltre, per y = 1 la serie (2.10) si riduce a ∞ 2k + 1 , (k − 1)(k + 2) k=2
2k+1 che diverge in quanto si comporta come la serie armonica (essendo (k−1)(k+2) ∼ 2 k , k → ∞), mentre per y = −1 la serie (2.10) converge (grazie al Criterio di Leibniz 1.20). In definitiva la serie (2.10) converge per −1 ≤ y < 1. Ritornando alla variabile x, questo equivale a −1 ≤ (x − 2)2 < 1. La prima disequazione `e sempre verificata, mentre la seconda `e vera per −1 < x − 2 < 1. Concludendo, la serie (2.9) ha raggio di convergenza R = 1 e converge nell’intervallo (1, 3) (si noti che il centro `e x0 = 2). ∞ iv) La serie xk! = x + x + x2 + x6 + x24 + · · · k=0
`e una serie di potenze con infiniti coefficienti uguali a 0 e non si pu` o ricorrere ad una sostituzione come nell’esempio precedente; in queste situazioni non `e possibile applicare alcuno dei criteri visti sopra e conviene rifarsi direttamente ai Criteri del rapporto e della radice per serie numeriche.
2.4 Serie di potenze
Nel caso in esame, si ha (k+1)! x = lim |x|(k+1)!−k! lim k→∞ xk! k→∞ ! 0 = lim |x|k!k = +∞ k→∞
53
se |x| < 1 , se |x| > 1 .
Pertanto R = 1; inoltre la serie non converge n´e per x = 1, n´e per x = −1. v) Consideriamo, per α ∈ R, la serie binomiale ∞
α k x . k k=0
Se α = n ∈ N, la serie `e in realt` a una somma finita e, per la formula del binomio di Newton (Vol. I, Eq. (1.13)), vale n
n k x = (1 + x)n ; k k=0
ci`o ne giustifica il nome. Studiamo dunque il caso α ∈ R \ N. Notiamo che α k+1 k! |α − k| |α(α − 1) · · · (α − k)| α = · = ; (k + 1)! |α(α − 1) · · · (α − k + 1)| k+1 k pertanto α k+1 |α − k| lim α = lim =1 k→∞ k→∞ k + 1 k e dunque la serie ha raggio di convergenza R = 1. La serie non converge n´e in x = 1 n´e in x = −1 in quanto il termine generale non tende a 0 per k → ∞. 2 2.4.1 Operazioni algebriche sulle serie di potenze Le operazioni algebriche di somma e prodotto tra polinomi si estendono in modo naturale alle serie di potenze centrate in uno stesso punto x0 . Si pone in tal caso il problema di quale sia il raggio di convergenza della serie risultante. Una risposta `e data dai teoremi seguenti, in cui per semplicit`a si pone x0 = 0.
Teorema 2.35 Date due serie di potenze Σ1 =
∞
a k xk e Σ2 =
k=0
∞
b k xk ,
k=0
rispettivamente con raggio di convergenza R1 e R2 , la serie somma Σ = ∞ (ak + bk )xk ha raggio di convergenza R soddisfacente R ≥ min(R1 , R2 ). k=0
Se R1 = R2 , allora necessariamente R = min(R1 , R2 ).
Dim.
; Complementi al Cap. 2 .
2
54
2 Serie di funzioni e di potenze
Nel caso in cui R1 = R2 , il raggio R pu` o essere strettamente maggiore di entrambi a causa di cancellazioni nei termini nella somma. Esempio 2.36 Consideriamo le serie ∞ 2k + 1 k x Σ1 = 4k − 2k
e
Σ2 =
k=1
∞ 2k − 1 k x , 4k + 2k
k=1
che hanno raggio di convergenza R1 = R2 = 2. La serie somma ∞ 4 Σ= k 4 −1 k=1 ha raggio di convergenza R = 4.
2
Il prodotto di due serie viene definito in modo che valga la propriet` a distributiva della somma rispetto al prodotto. In altri termini, si ha (a0 + a1 x + a2 x2 + . . .)(b0 + b1 x + b2 x2 + . . .) = a0 b0 + (a0 b1 + a1 b0 )x + (a0 b2 + a1 b1 + a2 b0 )x2 + . . . , ossia
∞ k=0
a k xk
∞
∞ b k xk = c k xk
k=0
con ck =
k
(2.11)
k=0
aj bk−j .
j=0
Tale modo di moltiplicare due serie di potenze prende il nome di prodotto alla Cauchy; infatti, si noti che ponendo x = 1 si ottengono serie numeriche il cui prodotto `e precisamente il prodotto alla Cauchy definito in (1.9). Si dimostra allora il seguente risultato.
Teorema 2.37 Date due serie di potenze Σ1 =
∞
a k xk e Σ2 =
k=0
∞
b k xk ,
k=0
rispettivamente con raggio di convergenza R1 e R2 , la serie prodotto (2.11) ha raggio di convergenza R soddisfacente R ≥ min(R1 , R2 ).
2.4.2 Derivazione e integrazione di serie di potenze Passiamo ora a studiare la regolarit` a della funzione somma di una serie di potenze. Come gi`a osservato, le funzioni fk (x) = ak (x − x0 )k sono dei polinomi e dunque di classe C ∞ su tutto R. In particolare esse sono funzioni continue e, poich´e si ha uniforme convergenza su ogni intervallo chiuso contenuto nell’insieme di convergenza
2.4 Serie di potenze
55
della serie (Teorema 2.31), la somma s(x) `e una funzione continua dove `e definita (si applichi il Teorema 2.17). Vediamo in dettaglio come si traducono i teoremi di derivazione e integrazione termine a termine per le serie di potenze. Per semplicit`a di esposizione, consideriamo x0 = 0. Premettiamo il seguente risultato tecnico.
Lemma 2.38 Le serie
" 1
=
"
a k xk e
2
k=0
raggio di convergenza.
Dim.
∞
=
∞
kak xk hanno lo stesso
k=0
" " Siano R1 e R2 i raggi di convergenza delle serie 1 e 2 , rispettivamente. Si ha ovviamente R2 ≤ R1 (in quanto |ak xk | ≤ |kak xk |). D’altra parte se ∞ ak xk converge e dunque |x| < R1 e x soddisfa |x| < x < R1 , la serie k=0
|ak |xk `e maggiorato da una constante M > 0 per ogni k ≥ 0. Pertanto x k x k |kak xk | = k|ak |xk ≤ M k . x x ∞ x k k `e convergente (Esempio 2.34 i)), per il Criterio Poich´e la serie x k=0 ∞ del confronto 1.10, anche la serie kak xk converge e dunque R1 ≤ R2 . k=0
2
In conclusione R1 = R2 e il lemma `e dimostrato. La serie
∞
kak xk−1 =
k=0
derivata della serie
∞
∞
kak xk−1 =
k=1
∞
(k + 1)ak+1 xk viene detta serie
k=0
a k xk .
k=0
Teorema 2.39 Si consideri la serie
∞
ak xk e si supponga che il suo raggio
k=0
di convergenza R sia positivo, finito o infinito. Allora a) la somma della serie s `e una funzione di classe C ∞ nell’intervallo (−R, R). Inoltre, la derivata di ordine n di s in (−R, R) pu` o essere calcolata de∞ k ak x termine a termine n volte. In particolare, per rivando la serie k=0
ogni x ∈ (−R, R), si ha s (x) =
∞ k=1
kak xk−1 =
∞
(k + 1)ak+1 xk ;
k=0
(2.12)
56
2 Serie di funzioni e di potenze
b) per ogni x ∈ (−R, R), vale la formula x ∞ ak k+1 x s(t) dt = . k +1 0
(2.13)
k=0
Dim.
a) Per il lemma precedente una serie di potenze e la sua serie derivata hanno lo stesso raggio di convergenza, in quanto per ogni x = 0 si ha ∞ ∞ 1 kak xk−1 = kak xk . La serie derivata converge uniformemente in x k=1 k=1 ogni intervallo [a, b] ⊂ (−R, R); possiamo dunque applicare il Teorema 2.19 e concludere che s `e di classe C 1 in (−R, R) e vale la (2.12). Iterando il procedimento si ottiene il risultato. ∞ b) Il risultato segue immediatamente osservando che la serie ak xk `e la k=0 ∞ ak k+1 x serie derivata della serie . Le due serie hanno lo stesso raggio k+1 k=0 di convergenza e si pu`o applicare il Teorema 2.18. 2
Esempio 2.40 Dalla formula
∞
xk =
k=0
1 , 1−x
x ∈ (−1, 1) ,
deduciamo, derivando termine a termine, che per x ∈ (−1, 1), si ha ∞ ∞ 1 kxk−1 = (k + 1)xk = . (1 − x)2 k=1
(2.14)
(2.15)
k=0
Integrando termine a termine la serie ∞ 1 , (−1)k xk = 1+x
x ∈ (−1, 1) ,
k=0
ottenuta dalla (2.14) sostituendo −x a x, risulta, per ogni x ∈ (−1, 1), ∞ ∞ (−1)k k+1 (−1)k−1 k x x = log(1 + x) . = k+1 k k=0
Infine, dalla formula ∞
(2.16)
k=1
(−1)k x2k =
k=0
1 , 1 + x2
x ∈ (−1, 1) ,
ottenuta dalla (2.14) sostituendo −x2 a x, ancora integrando termine a termine, deduciamo che, per ogni x ∈ (−1, 1), si ha ∞ (−1)k 2k+1 x = arctan x . (2.17) 2k + 1 k=0
2.5 Funzioni analitiche
Proposizione 2.41 Sia
∞
57
ak (x − x0 )k una serie di potenze con raggio di
k=0
convergenza R > 0. I coefficienti della serie si esprimono mediante le derivate della funzione somma s(x) come ak =
Dim.
1 (k) s (x0 ) , k!
∀k ≥ 0 .
Scriviamo la funzione somma come s(x) =
∞
ah (x − x0 )h ; derivando
h=0
termine a termine k volte, si ha s(k) (x) =
∞
h(h − 1) · · · (h − k + 1)ah (x − x0 )h−k
h=k
=
∞
(h + k)(h + k − 1) · · · (h + 1)ah+k (x − x0 )h .
h=0
Per x = x0 , solo il termine di indice h = 0 d` a contributo non nullo e l’espressione precedente diventa s(k) (x0 ) = k! ak ,
∀k ≥ 0 .
2
2.5 Funzioni analitiche Nel precedente paragrafo abbiamo esaminato le propriet` a della funzione somma di una serie di potenze: esse sono descritte dal Teorema 2.39. Mettiamoci ora dal punto di vista contrario, partiamo cio`e da una qualsiasi funzione (necessariamente di classe C ∞ ) e domandiamoci se questa `e la somma di una serie di potenze. Pi` u precisamente, sia f ∈ C ∞ (X), X ⊆ R e x0 ∈ X e chiediamoci se in un opportuno intervallo (x0 − δ, x0 + δ) ⊆ X, con δ > 0, sia possibile rappresentare f come la somma di una serie di potenze, ossia ∞ f (x) = ak (x − x0 )k ; (2.18) k=0
notiamo che, ricordando la Proposizione 2.41, necessariamente si ha f (k) (x0 ) , ∀k ≥ 0 . k! In particolare, se x0 = 0, f si rappresenta come ak =
f (x) =
∞ f (k) (0) k=0
k!
xk .
(2.19)
58
2 Serie di funzioni e di potenze
Definizione 2.42 La serie in (2.18) `e detta la serie di Taylor di f centrata in x0 . Se essa ha raggio positivo e la sua somma coincide con f in un intorno di x0 , la funzione f si dice sviluppabile in serie di Taylor, o anche analitica, in x0 . Se x0 = 0, si parla rispettivamente di serie di Maclaurin di f e sviluppabilit` a in serie di Maclaurin. La definizione precedente `e motivata dal fatto che non per tutte le funzioni C ∞ `e possibile una rappresentazione in serie di potenze, come mostra l’esempio seguente. Esempio 2.43 Consideriamo la funzione
2
e−1/x se x = 0 , 0 se x = 0 . Non `e difficile verificare che essa `e di classe C ∞ su R con f (k) (0) = 0 per ogni k ≥ 0. Pertanto la serie in (2.19) ha i termini tutti nulli e la somma (la funzione nulla) non rappresenta la funzione f in nessun intorno dell’origine. 2 f (x) =
Osserviamo che le ridotte della serie in (2.18) altro non sono che i polinomi di Taylor della funzione f in x0 di ordine via via crescente: sn (x) =
n f (k) (x0 ) k=0
k!
(x − x0 )k = T fn,x0 (x) .
Dunque la sviluppabilit` a in serie di Taylor di f equivale alla convergenza ad f della successione dei suoi polinomi di Taylor, vale a dire lim sn (x) = lim T fn,x0 (x) = f (x) ,
n→∞
n→∞
∀x ∈ (x0 − δ, x0 + δ) .
In tal caso, il resto n-esimo della serie, rn (x) = f (x) − sn (x), `e infinitesimo per n → ∞ per ogni x ∈ (x0 − δ, x0 + δ): lim rn (x) = 0 .
n→∞
Siamo ora in grado di fornire una condizione sufficiente a garantire la sviluppabilit` a in serie di Taylor di una funzione C ∞ nell’intorno di un punto x0 . Teorema 2.44 Sia f ∈ C ∞ (x0 − δ, x0 + δ) con δ > 0. Se esiste un indice k0 ≥ 0 e una costante M > 0 tale che, per ogni k ≥ k0 , si abbia |f (k) (x)| ≤ M
k! , δk
∀x ∈ (x0 − δ, x0 + δ) ,
(2.20)
allora f `e sviluppabile in serie di Taylor in x0 e il raggio di convergenza di tale serie `e almeno δ.
2.5 Funzioni analitiche
Dim.
59
Scriviamo lo sviluppo di Taylor di f in x0 di ordine n ≥ k0 con resto nella forma di Lagrange (si ricordi il Vol. I, Teorema 7.2): f (x) = T fn,x0 (x) +
1 f (n+1) (xn )(x − x0 )n+1 (n + 1)!
dove xn `e un punto opportuno compreso tra x0 e x. Tenuto conto dell’ipotesi, per ogni x ∈ (x0 − δ, x0 + δ), risulta 1 |f (n+1) (xn )| |x − x0 |n+1 ≤ M |rn (x)| = (n + 1)!
|x − x0 | δ
n+1 .
Se si suppone che |x − x0 |/δ < 1, questo implica lim rn (x) = 0
n→∞
2
e il teorema `e dimostrato.
Osservazione 2.45 La condizione (2.20) `e soddisfatta in particolare se tutte le derivate f (k) (x) sono equilimitate, ossia sono limitate indipendentemente da k; cio`e se esiste una costante M > 0 tale che |f (k) (x)| ≤ M ,
∀x ∈ (x0 − δ, x0 + δ) .
(2.21)
Infatti, ricordando l’Esempio 1.1 v), si ha δk!k → ∞ per k → ∞, e quindi δk!k ≥ 1 per k maggiore o uguale di un opportuno k0 . Pi` u in generale, con analogo ragionamento, si vede che la (2.20) `e verificata se |f (k) (x)| ≤ M k ,
∀x ∈ (x0 − δ, x0 + δ) .
(2.22)
Esempi 2.46 i) Possiamo ora dimostrare quanto anticipato sulla serie esponenziale, vale a dire che per ogni x ∈ R, si ha l’uguaglianza ∞ xk x e = . (2.23) k! k=0
Gi` a sappiamo che la serie converge per ogni x ∈ R (Esempio 2.23 ii)); inoltre, la funzione ex `e di classe C ∞ su R con f (k) (x) = ex e f (k) (0) = 1 . Fissato un qualunque δ > 0, vale la condizione (2.21), in quanto |f (k) (x)| = ex ≤ eδ = M , ∀x ∈ (−δ, δ) . Pertanto f `e sviluppabile in serie di Maclaurin e vale la (2.23). Pi` u in generale, la funzione ex `e sviluppabile in serie di Taylor in ogni x0 ∈ R e risulta ∞ e x0 (x − x0 )k , ex = ∀x ∈ R . k! k=0
60
2 Serie di funzioni e di potenze
ii) Ponendo −x2 al posto di x nella (2.23), si ha ∞ 2 x2k , ∀x ∈ R . (−1)k e−x = k! k=0
Integrando termine a termine tale serie, si ottiene una rappresentazione per serie della funzione degli errori x ∞ 2 2 2 (−1)k x2k+1 erf x = √ , e−t dt = √ k! 2k + 1 π 0 π k=0 che interviene, ad esempio, nel calcolo delle probabilit` a e nella statistica. iii) Le funzioni trigonometriche f (x) = sin x e g(x) = cos x sono analitiche per ogni x ∈ R. Infatti, esse sono funzioni C ∞ su R e tutte le loro derivate soddisfano la (2.21) con M = 1. In particolare, per x0 = 0, si ha ∞ (−1)k x2k+1 , ∀x ∈ R , (2.24) sin x = (2k + 1)! k=0
cos x =
∞ (−1)k k=0
(2k)!
x2k ,
iv) Mostriamo che, per α ∈ R \ N, si ha ∞
α k x , (1 + x)α = k
∀x ∈ R .
(2.25)
∀x ∈ (−1, 1) .
(2.26)
k=0
Nell’Esempio 2.34 v), abbiamo gi` a calcolato il raggio di convergenza della serie binomiale a secondo membro, ottenendo R = 1. Indichiamo con f (x) la somma della serie, per ora incognita: ∞
α k f (x) = x , ∀x ∈ (−1, 1) . k k=0
Derivando termine a termine e moltiplicando per (1 + x) si ottiene
∞
∞ ∞
α k−1 α α k k k x = (k + 1) x + k x (1 + x)f (x) = (1 + x) k k+1 k k=1
=
k=0
k=0
k=1
∞
∞
α α k α (k + 1) +k xk = α x = αf (x) . k+1 k k k=0
−1
Pertanto f (x) = α(1 + x) f (x). Consideriamo ora la funzione ausiliaria g(x) = (1 + x)−α f (x) e osserviamo che g (x) = 0 per ogni x ∈ (−1, 1). Infatti, g (x) = −α(1 + x)−α−1 f (x) + (1 + x)−α f (x) = −α(1 + x)−α−1 f (x) + α(1 + x)−α−1 f (x) = 0 . Dunque g(x) `e costante e possiamo scrivere f (x) = c(1 + x)α . Il valore della costante arbitraria c `e determinato dalla condizione f (0) = 1, ossia c = 1.
2.6 Serie di potenze in C
61
v) Per α = −1, la (2.26) fornisce lo sviluppo in serie di Taylor nell’origine della 1 funzione f (x) = 1+x : ∞
1 = (−1)k xk . 1+x k=0
In realt` a, f `e analitica in ogni punto x0 = −1 e il raggio della corrispondente serie di Taylor `e R = |1+x0 |, vale a dire la distanza di x0 dal punto di singolarit` a x = −1. Infatti, si ha f (k) (x) = (−1)k k!(1 + x)−(k+1) e non `e difficile verificare che vale la stima (2.20) in un opportuno intorno di x0 . Inoltre, applicando il Criterio della radice (Teorema 2.33), si ha # R = lim k |1 + x0 |k+1 = |1 + x0 | > 0 . k→∞
1 e analitica in ogni punto vi) Si pu` o dimostrare che la funzione f (x) = 1+x 2 ` x0 ∈ R. Tuttavia, ci` o non significa che il raggio di convergenza della generica serie di Taylor di f sia +∞. Ad esempio, in x0 = 0 si ha ∞ f (x) = (−1)k x2k , k=0
che ha raggio di convergenza 1. In generale, la serie di Taylor di f in x0 ha raggio di convergenza 1 + x20 (si veda il successivo paragrafo). vi) Gli ultimi due esempi sono casi particolari di funzioni razionali. Si pu` o dimostrare che tali funzioni, e pi` u in generale tutte le funzioni elementari, sono analitiche in ogni punto interno al loro dominio. 2
2.6 Serie di potenze in C La definizione di serie di potenze si estende facilmente al caso complesso. Intendiamo con serie di potenze in C una espressione del tipo ∞
ak (z − z0 )k ,
k=0
dove {ak }k≥0 `e una successione di numeri complessi, z0 ∈ C e z rappresenta la variabile complessa. I concetti di convergenza (puntuale, assoluta, uniforme) si estendono sostituendo il modulo al valore assoluto nelle relative definizioni. Si pu` o dimostrare che l’intervallo di convergenza di una serie di potenze in R viene sostituito da un disco di convergenza nel piano complesso, centrato in z0 e di raggio R ∈ [0, +∞]. Il termine funzione analitica individua una funzione di variabile complessa che `e la somma di una serie di potenze in C. Esempi di tali funzioni sono le funzioni razionali di una variabile complessa f (z) =
P (z) , Q(z)
62
2 Serie di funzioni e di potenze
con P e Q polinomi a coefficienti complessi, primi tra loro; fissato un punto z0 ∈ dom f , il raggio di convergenza della serie di potenze centrata in z0 la cui somma `e f , coincide con la distanza (nel piano complesso) di z0 dal pi` u vicino zero del denominatore, ossia dalla pi` u vicina singolarit` a. Le funzioni esponenziale, seno e coseno hanno una naturale estensione in C, ottenuta sostituendo alla variabile reale x la variabile complessa z rispettivamente nelle formule (2.23), (2.24) e (2.25). Tali serie convergono in tutto il piano complesso, e dunque le corrispondenti funzioni sono analitiche su C. Per maggiori dettagli si rimanda a ; Complementi al Cap. 2 .
2.7 Esercizi 1. Determinare l’insieme di convergenza puntuale, la funzione limite e gli insiemi di convergenza uniforme delle seguenti successioni di funzioni definite sull’insieme indicato: nx a) fn (x) = , I = [0, +∞) 1 + n3 x3 x b) fn (x) = , I = [0, +∞) 1 + n2 x2 c)
I=R
fn (x) = enx ,
d) fn (x) = nxe−nx ,
I=R
nx
e)
fn (x) =
4 , 3nx + 5nx
I=R
2. Studiare la convergenza puntuale e uniforme della successione di funzioni fn (x) = nx(1 − x2 )n , Dire se vale la formula
1
lim
fn (x) dx =
n→∞
0
x ∈ [−1, 1] . 1
lim fn (x) dx .
0 n→∞
3. Studiare la convergenza puntuale e uniforme della successione di funzioni fn (x) = arctan nx , Dire se vale la formula
n→∞
1
lim
fn (x) dx = a
con a = 0 oppure a = 1/2.
x ∈ R.
1
lim fn (x) dx ,
a n→∞
2.7 Esercizi
63
4. Determinare l’insieme di convergenza puntuale delle seguenti serie di funzioni: ∞ ∞ 2 (k + 2)x x k √ 1+ a) b) , k k3 + k k=1 k=1 c)
∞ k=1
e)
∞
1 , xk + x−k
(−1)k k x sin
k=1
x>0
d)
∞ k=1
1 k
f)
xk
xk , + 2k
x = −2
∞ x k − k2 − 1 k=1
5. Determinare l’insieme di convergenza puntuale e uniforme della serie di fun∞ ekx . Calcolare la somma, ove `e definita. zioni k=2
6. Posto fk (x) = cos xk , verificare che mentre
∞
∞
fk (x) converge uniformemente in [−1, 1]
k=1
fk (x) non converge in alcun punto.
k=1
7. Determinare l’insieme di convergenza puntuale e uniforme delle seguenti serie: ∞ ∞ ∞ 1 (log k)x (k2 + x2 ) k2 +x2 − 1 a) k 1/x b) c) k k=1 k=1 k=1 ∞ k 8. Sapendo che la serie ak 4 converge, `e possibile dedurre la convergenza delle k=0
seguenti serie? ∞ ak (−2)k a) k=0
9. Supponiamo che la serie
b) ∞
∞
ak (−4)k
k=0
ak x converga per x = −4 e diverga per x = 6. k
k=0
Cosa si pu`o affermare sulla convergenza o divergenza delle seguenti serie? ∞ ∞ ak b) ak 7k a) k=0
c)
∞
k=0
ak (−3)k
d)
k=0
∞
(−1)k ak 9k
k=0
10. Sia p un intero positivo. Determinare, al variare di p, il raggio di convergenza della serie ∞ (k!)p k x . (pk)! k=0
64
2 Serie di funzioni e di potenze
11. Trovare il raggio e l’insieme di convergenza delle seguenti serie di potenze: ∞ xk √ a) k k=1
c)
∞
b)
d)
k=0
e)
∞
k 2 (x − 4)k
k=1
i)
k=1
(−1)k
f)
(x + 3)k k3k
h)
3k
xk log k
∞ k 3 (x − 1)k
10k
k=0
(−1)k
∞
∞
k=2
k=0
g)
k+1
k=0
kx2k
∞
∞ (−1)k xk
∞
k!(2x − 1)k
k=1
k
kx 1 · 3 · 5 · · · (2k − 1)
)
∞ (−1)k x2k−1 k=1
2k − 1
12. La funzione J1 (x) definita da J1 (x) =
∞ k=0
(−1)k x2k+1 k! (k + 1)! 22k+1
`e detta funzione di Bessel di ordine 1. Determinarne il dominio. 13. Una funzione f `e definita da f (x) = 1 + 2x + x2 + 2x3 + · · · =
∞
a k xk
k=0
dove a2k = 1 e a2k+1 = 2 per ogni k ≥ 0. Determinare il dominio di f e una formula esplicita per f . 14. Determinare l’insieme di convergenza delle seguenti serie:
k ∞ k ∞ 1 2 1+x √ a) (x2 − 1)k b) k 3 k 1−x k=1
c)
k=1
∞ k + 1 −kx2 2 k2 + 1
d)
k=1
∞ 1 (3x)k k x+ 1 k
k=1
15. Determinare il raggio di convergenza della serie di potenze ∞ k=0
al variare del parametro reale a > 0.
a
√ k k
x
x
2.7 Esercizi
65
16. Sviluppare in serie di Maclaurin, indicando il raggio di convergenza dello sviluppo ottenuto, le seguenti funzioni: a) f (x) =
x3 x+2
c)
f (x) = log(3 − x)
e)
f (x) = log
1 + x2 1 − x2 x3 d) f (x) = (x − 4)2
b) f (x) =
1+x 1−x
f)
g) f (x) = sin2 x
f (x) = sin x4
h) f (x) = 2x
17. Sviluppare le seguenti funzioni in serie di Taylor con centro nel punto x0 , indicando il raggio di convergenza dello sviluppo ottenuto: 1 , x √ b) f (x) = x , a) f (x) =
c)
f (x) = log x ,
x0 = 1 x0 = 4 x0 = 2
18. Verificare che per |x| < 1 si ha k=1
k 2 xk =
x2 + x . (1 − x)3
19. Scrivere i primi 3 termini dello sviluppo in serie di Maclaurin delle seguenti funzioni: 2 log(1 − x) sin x b) f (x) = e−x cos x c) f (x) = a) f (x) = ex 1−x 20. Scrivere sotto forma di serie di Maclaurin i seguenti integrali indefiniti: sin x2 dx a) b) 1 + x3 dx 21. Utilizzando gli sviluppi in serie, calcolare i seguenti integrali definiti con la precisione indicata: 1 a) sin x2 dx , con 3 cifre decimali esatte 0 1/10 1 + x3 dx , con un errore assoluto < 10−8 b) 0
66
2 Serie di funzioni e di potenze
2.7.1 Soluzioni 1. Limite di successioni di funzioni: a) Poich´e fn (0) = 0 per ogni n, anche f (0) = 0; inoltre, se x = 0, fn (x) ∼
nx 1 = 2 2 →0 n3 x3 n x
per
n → +∞ .
Pertanto la funzione limite f `e identicamente nulla su I. Al fine di valutare la convergenza uniforme della successione, studiamo l’andamento delle funzioni fn . Si ha fn (x) = e fn (x) = 0 per xn = definitiva
1 √ 3 2n
n(1 − 2n3 x3 ) (1 + n3 x3 )2
con fn (xn ) =
3
2 √ 3 2
(si veda la Figura 2.3). In
2 |fn (x)| = √ 332 x∈[0,+∞) sup
e pertanto la convergenza non `e uniforme sull’intervallo [0, +∞). Tuttavia, fissato δ > 0, per n sufficientemente grande, fn risulta decrescente in [δ, +∞) e quindi sup |fn (x)| = fn (δ) → 0 per n → +∞ . x∈[δ,+∞)
Dunque la convergenza `e uniforme su ogni intervallo [δ, +∞), con δ > 0. b) Procedendo come nell’esercizio precedente, si vede che la successione converge puntualmente su I alla funzione limite f (x) = 0, per ogni x ∈ I. Inoltre, si ha fn (x) =
1 − n2 x2 (1 + n2 x2 )2
e, per ogni x ≥ 0, risulta y 3
2 √ 3
f1
2
f2 f20
f6
f
x
Figura 2.3. Grafici di alcune funzioni fn e di f relative all’Esercizio 1. a)
2.7 Esercizi
67
y f1
f2 f4 f10 x
f
Figura 2.4. Grafici di alcune funzioni fn e di f relative all’Esercizio 1. b)
fn (x) = 0 ⇐⇒ x =
1 n
con
fn
1 1 = . n 2n
Pertanto la convergenza `e uniforme su I, in quanto lim
sup
n→∞ x∈[0,+∞)
|fn (x)| = lim
n→∞
1 = 0. 2n
Si veda la Figura 2.4 per una rappresentazione grafica di alcune funzioni fn e della funzione limite f . c) La successione converge puntualmente in (−∞, 0] alla funzione limite
0 se x < 0, f (x) = 1 se x = 0. La convergenza non `e uniforme su (−∞, 0] in quanto f non `e ivi continua; invece si ha convergenza uniforme sulla semiretta (−∞, −δ] per ogni δ > 0, in quanto lim sup enx = lim e−nδ = 0 . n→∞ x∈(−∞,−δ]
n→∞
d) Si ha convergenza puntuale a f (x) = 0 per ogni x ∈ [0, +∞). La convergenza `e uniforme su ogni intervallo [δ, +∞) con δ > 0. e) Osserviamo che fn (0) = 1/2. Inoltre, per n → ∞, le funzioni fn sono equivalenti a ! (4/3)nx se x < 0 , fn (x) ∼ (4/5)nx se x > 0 . In ogni caso, per x = 0, f (x) = lim fn (x) = 0 . n→∞
Quindi si ha convergenza puntuale su R alla funzione limite
0 se x = 0, f (x) = 1/2 se x = 0.
68
2 Serie di funzioni e di potenze
La convergenza non `e uniforme su R in quanto la funzione limite non `e ivi continua. Tuttavia si ha convergenza uniforme su ogni insieme del tipo Aδ = (−∞, −δ] ∪ [δ, +∞), con δ > 0, in quanto lim sup |fn (x)| = lim max fn (δ), fn (−δ) = 0 . n→∞ x∈Aδ
n→∞
2. Osserviamo che fn (1) = fn (−1) = 0, per ogni n. Inoltre, per ogni x ∈ (−1, 1), risulta 1 − x2 < 1; pertanto lim fn (x) = 0 ,
n→∞
∀x ∈ (−1, 1) .
In definitiva la successione converge alla funzione limite f (x) = 0 , ∀x ∈ [−1, 1]. Vediamo se la convergenza `e uniforme. A tal fine studiamo le funzioni fn ; poich´e sono funzioni dispari consideriamo x ∈ [0, 1]. Si ha fn (x) = n(1 − x2 )n − 2nx2 (1 − x2 )n−1 = n(1 − x2 )n−1 (1 − x2 − 2nx2 ) ; √ dunque fn (x) presenta un punto√di massimo in x = 1/ 1 + 2n (e, per simmetria, un punto di minimo in x = −1/ 1 + 2n). Cos`ı
n
1 n 2n =√ ; sup |fn (x)| = fn √ 1 + 2n 1 + 2n 1 + 2n x∈[−1,1] pertanto la convergenza non `e uniforme in [−1, 1], perch´e
n n n 2n = +∞ . = e−1/2 lim √ lim √ n→∞ n→∞ 1 + 2n 1 + 2n 1 + 2n Si osservi che dal ragionamento fatto la convergenza non `e uniforme neppure sull’intervallo [0, 1]; non `e possibile dunque applicare il teorema che permette di scambiare le operazioni di limite e di integrazione. Verifichiamo direttamente la validit` a della formula. Ponendo t = 1 − x2 , risulta 1 n 1 n n 1 = ; fn (x) dx = lim t dt = lim lim n→∞ 0 n→∞ 2 0 n→∞ 2(n + 1) 2 mentre
1
lim fn (x) dx = 0 ;
0 n→∞
pertanto non vale l’uguaglianza indicata. 3. Risulta
⎧ se x > 0 , ⎨ π/2 se x = 0 , lim fn (x) = 0 n→∞ ⎩ −π/2 se x < 0 .
2.7 Esercizi
69
Si ha convergenza puntuale su R ma non convergenza uniforme in quanto la funzione limite non `e continua pur essendo continue tutte le funzioni fn . Analogamente non si ha convergenza uniforme su [0, 1]. Pertanto, se poniamo a = 0, non `e possibile scambiare automaticamente le operazione di limite e di integrazione su tale intervallo. Calcoliamo i due membri dell’uguaglianza da verificare. Si ha
1 1 1 nx lim fn (x) dx = lim x arctan nx 0 − dx 2 2 n→∞ 0 n→∞ 0 1+n x = lim
n→∞
log(1 + n2 x2 ) 1 arctan n − 2n 0
= lim
n→∞
Inoltre
arctan n −
1
log(1 + n2 ) 2n
=
π . 2
1
π π dx = . 2 0 n→∞ 0 2 Pertanto l’uguaglianza vale anche se la successione non converge uniformemente su [0, 1]. Se invece poniamo a = 1/2, si ha convergenza uniforme sull’intervallo [1/2, 1] e dunque l’uguaglianza `e vera per il Teorema 2.18. lim fn (x) dx =
4. Insieme di convergenza puntuale di serie di funzioni: a) Fissato x, risulta fk (x) =
(k + 2)x 1 √ ∼ 3−x , 3 k k + k
k → ∞.
Pertanto, la serie si comporta come la serie armonica generalizzata di esponente 3 − x e dunque converge se 3 − x > 1, ossia se x < 2, e diverge se 3 − x ≤ 1, ossia se x ≥ 2. b) Fissato x, utilizziamo il Criterio della radice e calcoliamo x k lim k |fk (x)| = lim 1 + = ex . k→∞ k→∞ k Pertanto la serie converge se ex < 1, ossia se x < 0, e diverge se ex > 1, ossia se x > 0. Se x = 0, la serie diverge perch´e il termine generale `e sempre uguale a 1. In definitiva, l’insieme di convergenza della serie `e la semiretta (−∞, 0). c) Se x = 1, il termine generale non tende a 0 e quindi la serie non converge. Se x = 1, per k → ∞, risulta
−k se x > 1, x fk (x) ∼ k x se x < 1 . In entrambi i casi la serie converge. Riassumendo, l’insieme di convergenza della serie `e (0, +∞) \ {1}.
70
2 Serie di funzioni e di potenze
k d) Se |x| < 2, si ha convergenza assoluta in quanto |fk (x)| ∼ |x| , per k → ∞. 2 Invece, se x < −2 oppure x ≥ 2 la serie non converge in quanto il termine generale non tende a 0. L’insieme di convergenza `e dunque l’intervallo (−2, 2). e) Osserviamo che |fk (x)| ∼
1 k 1−x
k → ∞.
,
Dunque la serie converge assolutamente se 1 − x > 1, ossia se x < 0. Per il Criterio di Leibnitz, la serie converge puntualmente se 0 < 1 − x ≤ 1, ossia se 0 ≤ x < 1. Infine la serie non converge (pi` u precisamente `e indeterminata) se x ≥ 1 in quanto il termine generale non tende a 0. In conclusione l’insieme di convergenza della serie `e (−∞, 1). f) Fissato x, il termine generale della serie `e equivalente a quello di una serie armonica generalizzata:
x x 1 1 √ fk (x) = ∼ , k → ∞. 2 2k k+ k +1 Pertanto l’insieme di convergenza della serie `e (1, +∞). 5. Si tratta di una serie geometrica di ragione q = ex . Pertanto si ha convergenza puntuale in (−∞, 0) e uniforme in (−∞, −δ], per ogni δ > 0. Inoltre, per ogni x < 0, si ha ∞ 1 e2x x (ex )k = − 1 − e = . 1 − ex 1 − ex k=2
6. Osserviamo che, per ogni x ∈ R, lim cos convergenza puntuale della serie
∞ k=1
k→∞
cos
x = 1 = 0. Quindi l’insieme di k
x `e vuoto. k
Risulta fk (x) = − k1 sin xk e dunque |fk (x)| ≤
|x| 1 ≤ 2, 2 k k
∀x ∈ [−1, 1] .
∞ ∞ 1 converge, per il Criterio di Weierstrass la serie fk (x) converge k2 k=1 k=1 uniformemente in [−1, 1].
Poich´e
7. Insieme di convergenza puntuale e uniforme di serie di funzioni: a) Si tratta di una serie armonica di esponente −1/x. Si ha convergenza puntuale in (−1, 0) e uniforme in ogni sottointervallo [a, b] di (−1, 0). b) Applicando il Criterio integrale si vede che la serie converge puntualmente in (−∞, −1). Inoltre converge uniformemente su ogni semiretta (−∞, −δ] per δ > 0 arbitrario.
2.7 Esercizi
71
c) Osservando che fk (x) ∼
1 log(k 2 + x2 ) , k 2 + x2
k → ∞,
si vede che la serie converge puntualmente su tutto R. Inoltre
1 2 log k − 1 = Mk . sup |fk (x)| = fk (0) = exp k2 x∈R La serie numerica
∞
Mk converge in quanto si comporta come la serie
k=1
∞ 2 log k
. Pertanto, applicando il Criterio di Weierstrass, si vede che la k2 convergenza `e anche uniforme su tutto R. k=1
8. L’ipotesi garantisce che il raggio di convergenza della serie `e maggiore o uguale a 4. Pertanto, la prima serie converge sicuramente mentre per la seconda non si pu` o dedurre alcuna informazione. 9. Convergenza di serie di potenze: a) Converge. 10. Si ha
Pertanto
b) Diverge.
ak+1 ak =
c) Converge.
d) Diverge.
p (k + 1)! (pk)! (k + 1)p . = (pk + 1)(pk + 2) · · · (pk + p) p(k + 1) ! (k!)p
ak+1 = lim k + 1 k + 1 · · · k + 1 = 1 ; lim k→∞ ak k→∞ pk + 1 pk + 2 pk + p pp
utilizzando il Criterio del rapporto si ottiene R = pp . 11. Raggio e insieme di convergenza di serie di potenze: a) R = 1, I = [−1, 1)
b) R = 1, I = (−1, 1]
c) R = 1, I = (−1, 1)
d) R = 3, I = (−3, 3]
e) R = 1, I = (3, 5)
f) R = 10, I = (9, 11)
g) R = 3, I = (−6, 0]
h) R = 0, I = { 12 }
i) R = +∞, I = R
) R = 1, I = [−1, 1]
12. Calcoliamo il raggio di convergenza della serie utilizzando il criterio del rapporto: ak+1 k! (k + 1)! 22k+1 1 = lim lim = 0. = lim 2k+3 k→∞ k→∞ k→∞ ak (k + 1)! (k + 2)! 2 4(k + 2)(k + 1) Pertanto R = +∞ e il dominio della funzione `e tutto R.
72
2 Serie di funzioni e di potenze
13. Poich´e lim
k
k→∞
` imme|ak | = 1, il raggio di convergenza della serie `e R = 1. E
diato verificare che la serie non converge per x = ±1 in quanto il termine generale non tende a 0. Pertanto dom f = (−1, 1). Inoltre, per x ∈ (−1, 1), f (x) =
∞
x2k + 2
k=0
∞
x2k+1 =
k=0
1 2x 1 + 2x + = . 1 − x2 1 − x2 1 − x2
14. Insieme di convergenza di serie: a) Poniamo y = x2 − 1 e studiamo la serie di potenze ∞ k 2 k=1
3
yk
nella variabile y, indicando con Ry il suo raggio di convergenza. Si ha 2 k 2 k = lim k→∞ 3 3 e quindi Ry = 32 . Per y = ± 32 , la serie non converge in quanto il termine generale non tende a 0. In conclusione, la serie assegnata converge se − 32 < x2 − 1 < 32 . La prima disequazione `e verificata per ogni x, mentre la seconda # # equivale a x2 < 52 , ossia la serie converge in − 52 , 25 . ∞ 1 k 1+x √ e studiamo la serie di potenze y nella b) Sia x = 1; poniamo y = 1−x k k k=1 variabile y. Si ha 1 1 = lim e− k2 log k = 1 lim k √ k k→∞ k→∞ k e quindi Ry = 1. Per y ± 1, non si ha convergenza in quanto il termine generale non tende a 0. In definitiva, la serie assegnata converge se −1 <
1+x <1 1−x
ossia se
x < 0.
∞ k+1 k y . Si ottiene k2 + 1 k=1 immediatamente Ry = 1; inoltre la serie converge se y = −1 (si comporta come la serie armonica a segni alterni) e diverge se y = 1 (si comporta come la serie armonica). Ritornando alla variabile x, la serie assegnata converge se 2 −1 ≤ 2−x < 1. La prima disequazione `e sempre banalmente verificata, mentre la seconda `e vera per x = 0. In conclusione, l’insieme di convergenza della serie `e R \ {0}. 2
c) Poniamo y = 2−x e studiamo la serie di potenze
2.7 Esercizi
d) Per x = 0, poniamo y =
x x+
=
1 x
73
∞ 3k k x2 y . Il suo e studiamo la serie 1 + x2 k k=1
raggio di convergenza vale Ry = 13 e il suo insieme di convergenza `e [− 13 , 13 ). Tornando alla variabile x, imponiamo le condizioni −
x2 1 1 ≤ < . 2 3 1+x 3
La prima disequazione `e sempre verificata, mentre la seconda equivale a 2x2 <1, √ √ ossia l’insieme di convergenza della serie assegnata `e dato da − 22 , 22 \ {0}. 15. Utilizziamo il Criterio del rapporto e calcoliamo √ √ √ ak+1 1 √ a k+1 √ √ = lim lim = lim a k+1− k = lim a k+1+ k = 1 . k k→∞ k→∞ a k→∞ k→∞ ak Dunque R = 1 per ogni a > 0. 16. Sviluppi in serie di Maclaurin: a) Utilizzando la serie geometrica di ragione q = − x2 , si ha f (x) =
x3 1 2 1+
x 2
=
∞ ∞ xk+3 x3 x k − = (−1)k k+1 ; 2 2 2 k=0
k=0
tale serie ha raggio di convergenza R = 2. b) Utilizzando la serie geometrica di ragione q = x2 , si ha ∞
f (x) = −1 +
2 = −1 + 2 x2k ; 1 − x2 k=0
il raggio di convergenza `e R = 1. c) Utilizzando lo sviluppo della funzione g(t) = log(1 + t) con t = − x3 , si ha f (x) = log 3 + log(1 −
∞ ∞ (−1)k+1 x k xk x ) = log 3 + − = log 3 − ; 3 k 3 k3k k=1
k=1
il raggio di convergenza vale R = 3. d) Utilizzando lo sviluppo della funzione g(t) = t = x4 , si ha f (x) =
1 (si ricordi la (2.15)) con (1 − t)2
∞ ∞ x k (k + 1)xk+3 1 x3 x3 = (k + 1) = ; x 2 16 (1 − 4 ) 16 4 4k+2 k=0
il raggio di validit` a dello sviluppo `e R = 4.
k=0
74
2 Serie di funzioni e di potenze
e) Ricordando lo sviluppo della funzione g(t) = log(1 + t) con t = x e t = −x, si ha f (x) = log(1 + x) − log(1 − x) =
∞ (−1)k+1
k
k=1
xk −
∞ (−1)k+1 k=1
k
(−x)k
∞ ∞ 1 2 (−1)k+1 + 1 xk = x2k+1 ; = k 2k + 1 k=1
k=0
il raggio vale R = 1. f) Si ha f (x) =
∞
(−1)k
k=0
x8k+4 , con R = ∞ . (2k + 1)!
g) Ricordando che sin2 x = 12 (1 − cos 2x) e utilizzando lo sviluppo della funzione g(t) = cos t con t = 2x, si ha ∞
f (x) =
22k x2k 1 1 − , (−1)k 2 2 (2k)!
R = +∞ .
k=0
h) Si ha f (x) =
∞ (log 2)k k=0
k!
xk , con R = +∞ .
17. Sviluppi in serie di Taylor: ` possibile procedere direttamente calcolando le derivate successive della a) E funzione f , ottenendo f (k) (x) = (−1)k
k! , xk+1
da cui
f (k) (1) = (−1)k k! ,
∀k ∈ N .
Pertanto risulta f (x) =
∞
(−1)k (x − 1)k ,
R = 1.
k=0
In alternativa, `e possibile porre t = x−1 e considerare lo sviluppo di Maclaurin 1 della funzione f (t) = 1+t pervenendo al medesimo risultato: ∞
∞
k=0
k=0
1 = (−1)k tk = (−1)k (x − 1)k , 1+t
R = 1.
b) Anche in questo caso possiamo procedere direttamente e ricavare f (x) =
1 −1/2 x , 2
f (k) (x) = (−1)k+1
1 · 3 · 5 · · · (2k − 3) − 2k−1 x 2 , 2k
2.7 Esercizi
75
per ogni k ≥ 2; dunque ∞
1 · 3 · 5 · · · (2k − 3) −(2k−1) 1 f (x) = 2 + (x − 4) + (−1)k+1 2 (x − 4)k 4 k!2k k=1
e il raggio della serie `e R = 4. In alternativa, poniamo t = x − 4 e ricaviamo √ √ t x = 4+t=2 1+ 4 ∞ 1 k t 1 2 = 2 + (x − 4) + 2 4 k 4 k=2 1 ∞ 11 1 k 2 2 − 1 ··· 2 − k + 1 1 = 2 + (x − 4) + 2 (x − 4) 4 k! 4k 1 = 2 + (x − 4) + 2 4 1 = 2 + (x − 4) + 4
c) log x = log 2 +
∞ (−1)k+1 k=1
k2k
k=2 ∞ k=2
∞
1 · 3 · · · (2k − 3) (−1)k+1 k (x − 4) 2k k! 22k
(−1)k+1
k=2
(x − 2)k ,
1 · 3 · 5 · · · (2k − 3) (x − 4)k . k!23k−1
R = 2.
18. Si osservi che l’uguaglianza richiesta `e banalmente vera per x = 0. Derivando termine a termine, per |x| < 1 si ha ∞ k=0
∞
1 , x = 1−x k
k−1
kx
k=1
1 = , (1 − x)2
∞
k(k − 1)xk−2 =
k=2
Partendo da quest’ultima formula, per x = 0, si ricava ∞ ∞ ∞ 2 k−1 2 k−1 = k(k + 1)x = k x + kxk−1 (1 − x)3 k=1 ∞
1 = x Pertanto,
∞ k=1
k=1
k 2 xk =
k=1
k=1
1 k 2 xk + . (1 − x)2
2x x x2 + x − = . 3 2 (1 − x) (1 − x) (1 − x)3
2 . (1 − x)3
76
2 Serie di funzioni e di potenze
19. Sviluppi in serie di Maclaurin: a) Utilizzando gli sviluppi notevoli delle funzioni g(x) = log(1−x) ed h(x) = e−x , si ha x3 x2 x3 x2 f (x) = e−x log(1 − x) = 1 − x + − + ··· − x − − − ··· 2 3! 2 3 1 2 1 3 1 3 1 3 2 = −x + x − x − x + x − x + · · · 2 3 2 2 1 2 1 3 = −x + x − x + · · · 2 3 25 3 b) f (x) = 1 − x2 + x4 − · · · 2 24 5 c) f (x) = x + x2 + x3 + · · · 6 20. Integrali indefiniti: a) Poich´e risulta sin x2 =
∞ (−1)k x2(2k+1) , (2k + 1)!
∀x ∈ R ,
k=0
integrando termine a termine, si ottiene sin x2 dx = c +
∞ k=0
(−1)k x4k+3 (4k + 3)(2k + 1)!
con c costante arbitraria. ∞ 1 · 3 · 5 · · · (2k − 3) 3k+1 x4 + x 1 + x3 dx = c + x + (−1)k−1 . b) 8 2k k!(3k + 1) k=2
21. Integrali definiti: 1 a) sin x2 dx ∼ 0.310 . 0
b)
0
1/10
1 + x3 dx ∼ 0.10001250 .
3 Serie di Fourier
Il suono di una chitarra, l’immagine di un calciatore in televisione, la scia di una petroliera che solca l’oceano, le scosse improvvise di un terremoto sono esempi di eventi, naturali o generati dall’uomo, riconducibili a fenomeni di propagazione ondosa. Il suono nasce infatti dalla rapida variazione della pressione dell’aria, descritta da onde di pressione che si muovono attraverso lo spazio al variare del tempo. Gli altri eventi citati sono descrivibili in termini di propagazione rispettivamente di onde elettromagnetiche, di onde d’acqua sulla superficie dell’oceano e di onde elastiche attraverso il terreno. Mediante il linguaggio matematico, un’onda pu` o essere rappresentata da una (o pi` u di una) funzione che esprime una quantit` a fisica di interesse, quale la pressione dell’aria o l’intensit` a dei colori fondamentali di un’immagine; in genere la funzione dipende dal tempo e da variabili di spazio, quali il punto di ascolto del suono o la posizione di un pixel sullo schermo televisivo. Se fissiamo la posizione spaziale di osservazione, l’onda ci appare come una funzione della sola variabile tempo, ossia come un segnale (acustico, luminoso, etc.). Al contrario, se fissiamo un istante temporale, l’onda ci appare come una distribuzione spaziale di valori della quantit` a fisica (un “fermo immagine” sullo schermo televisivo, una foto della scia della nave scattata da un aereo, etc.). I fenomeni di propagazione ondosa possono avere una struttura estremamente complessa; il desiderio di comprendere e dominare appieno la loro natura ha stimolato, nel corso degli ultimi secoli, la ricerca di adeguati strumenti matematici di analisi. In genere, essi mirano a decomporre una struttura d’onda complessa nella sovrapposizione di componenti pi` u semplici, la cui natura `e ben compresa e che sono facilmente maneggiabili. A seconda della teoria considerata, avremo allora un insieme di onde elementari, ciascuna delle quali descriver` a in modo semplice una specifica modalit`a di propagazione, particolmente significativa. Avremo poi onde che sono sovrapposizione di un numero finito di onde elementari. La struttura ondosa pi` u complessa sar`a per`o rappresentata dalla sovrapposizione di una infinit` a di onde elementari, il che ovviamente pone – come sempre – il delicato problema di dare un senso rigoroso all’operare su un insieme infinito di oggetti matematici.
Canuto C, Tabacco A: Analisi Matematica II. © Springer-Verlag Italia, Milano 2008
78
3 Serie di Fourier
La cosiddetta Analisi di Fourier costituisce l’esempio pi` u noto e diffuso di strumento investigativo nello studio dei fenomeni di propagazione (e non solo di questi). Nella sua forma pi` u semplice, essa considera segnali monodimensionali aventi una fissata periodicit` a. Le onde elementari sono date da funzioni sinusoidali, ciascuna caratterizzata da una propria frequenza, fase e ampiezza di oscillazione. La composizione di un numero finito di onde elementari genera i polinomi trigonometrici, mentre se il numero di esse `e infinito si perviene a una particolare serie di funzioni, detta serie di Fourier. Essa fornisce una forma estremamente efficace di rappresentazione in serie per un’ampia classe di funzioni periodiche. Il presente capitolo `e dedicato ad una introduzione elementare dell’Analisi di Fourier, attraverso lo studio delle serie di Fourier e delle modalit` a di sviluppo di una funzione periodica in serie di Fourier. Accanto alla classica Analisi di Fourier, sono state sviluppati, segnatamente negli ultimi decenni del XX secolo, altri e ben pi` u sofisticati strumenti di analisi e rappresentazione di funzioni, quali ad esempio la cosiddetta Analisi in Ondine. Alcuni di essi sono alla base del recente, straordinario successo della Matematica in diverse applicazioni tecnologiche di punta, quali la telefonia mobile e il trattamento digitale del suono e dell’immagine. Lungi dall’offuscare il ruolo degli strumenti classici, essi piuttosto ne accentuano l’importanza come base fondante di tutti i successivi sviluppi.
3.1 Polinomi trigonometrici Ricordiamo la definizione di funzione periodica. Definizione 3.1 La funzione f : R → R si dice periodica di periodo T > 0 se f (x + T ) = f (x) , ∀x ∈ R, . Osserviamo che se f `e periodica di periodo T allora `e anche periodica di periodo kT , con k ∈ N \ {0} e non si esclude che f possa essere periodica di periodo T /k, con k ∈ N\{0}. Ove esista, chiameremo periodo minimo di f il pi` u piccolo valore di T per cui f `e periodica. Inoltre, f `e nota quando lo `e in un qualunque intervallo [x0 , x0 + T ) (oppure (x0 , x0 + T ]) di ampiezza T . Solitamente si sceglie l’intervallo [0, T ) oppure − T2 , T2 . Si noti che se f `e costante, allora risulta periodica di periodo T , per ogni T > 0. Ogni funzione, definita su un intervallo limitato [a, b), pu` o essere prolungata ad una funzione periodica di periodo T = b − a, ponendo f (x + kT ) = f (x) ,
k ∈ Z , ∀x ∈ [a, b) .
Si noti che tale estensione non `e necessariamente continua nei punti x = a + kT , anche se la funzione in origine lo `e.
3.1 Polinomi trigonometrici
79
Esempi 3.2 i) Le funzioni f (x) = cos x, g(x) = sin x sono periodiche di periodo 2kπ con k ∈ IN \ {0}. Il periodo minimo per entrambe `e 2π. ii) f (x) = cos x4 `e periodica di periodo 8π, 16π, . . .; il suo periodo minimo `e 8π. iii) Le funzioni f (x) = cos ωx, g(x) = sin ωx, ω = 0, sono periodiche con periodo minimo T0 = 2π ω . iv) La funzione Mantissa f (x) = M (x) `e periodica di periodo minimo T0 = 1. 2 Non `e difficile verificare che valgono le seguenti propriet`a. Proposizione 3.3 Sia f una funzione periodica di periodo T > 0; allora, per ogni x0 ∈ IR, si ha
T
x0 +T
f (x) dx = 0
f (x) dx . x0
In particolare, se x0 = −T /2, risulta
T
T /2
f (x) dx =
Dim.
f (x) dx . −T /2
0
Per le propriet` a dell’integrale definito, risulta
T
x0
f (x) dx = 0
0
x0 +T
f (x) dx +
T
f (x) dx +
f (x) dx . x0 +T
x0
Ponendo x = y + T nell’ultimo integrale e tenendo conto della periodicit` a della funzione, si ha
T
0
f (x) dx = x0 +T
x0
0
x0
f (y) dy = −
f (y + T ) dy = x0
f (y) dy , 0
da cui si deduce il risultato.
2
Proposizione 3.4 Sia f una funzione periodica di periodo T1 > 0 e sia T1 T2 > 0. Allora la funzione g(x) = f T2 x `e periodica di periodo T2 .
Dim.
Per ogni x ∈ IR, risulta g(x + T2 ) = f
T T 1 1 (x + T2 ) = f x + T1 = f x = g(x) . T2 T2 T2
T
1
2
80
3 Serie di Fourier
La funzione periodica f (x) = a sin(ωx + φ), dove a, ω, φ sono costanti, ha una notevole rilevanza nello studio che ci accingiamo a compiere. Essa descrive un particolare comportamento oscillatorio, di tipo sinusoidale, e viene detta armonica ω (o onda) elementare. Il suo periodo minimo `e T = 2π e ω mentre il suo inverso 2π ` la frequenza, ossia il numero di oscillazioni sinusoidali presenti in ogni intervallo di lunghezza unitaria (numero di oscillazioni nell’unit` a di tempo, se x indica la variabile tempo); ω `e detta pulsazione o frequenza angolare. Le quantit` a a e φ sono rispettivamente l’ampiezza e la fase dell’oscillazione. Aumentando o diminuendo a > 0, si amplifica o si restringe l’intervallo dei valori assunti da f (si allontanano o si avvicinano all’asse orizzontale i picchi delle oscillazioni), mentre variando φ positivamente o negativamente si effettua una traslazione dell’onda rispettivamente verso sinistra o verso destra (si veda la Figura 3.1). Un’armonica elementare pu`o anche essere rappresentata come a sin(ωx+φ) = α cos ωx+β sin ωx con α = a sin φ e β = a cos φ; la trasformazione inversa dei parametri `e data da a = α2 + β 2 e φ = arctan α β. y
y
1
1 −2π
−1
2π x
x
−1
y
y 2
1
−2π
2π x −2
−2π−φ
−φ
−1
2π−φ
x
Figura 3.1. Armoniche elementari per diversi valori di pulsazione, ampiezza e fase: (ω, a, φ) = (1, 1, 0), in alto a sinistra; (ω, a, φ) = (5, 1, 0), in alto a destra; (ω, a, φ) = (1, 2, 0), in basso a sinistra; (ω, a, φ) = (1, 1, π3 ), in basso a destra
Nel seguito, ci limiteremo allo studio delle funzioni periodiche di periodo 2π in quanto, grazie alla Proposizione 3.4, i risultati che otterremo si possono applicare a funzioni di periodo arbitrario con un semplice cambio di variabile (per ulteriori dettagli si veda il § 3.6). La sovrapposizione di armoniche elementari con frequenze multiple di una fissata frequenza fondamentale, che abbiamo posto per semplicit` a uguale a 1/2π, d` a luogo ai polinomi trigonometrici.
3.2 Coefficienti e serie di Fourier
81
Definizione 3.5 Chiameremo polinomio trigonometrico di ordine o grado n, ogni combinazione lineare finita della forma P (x) = a0 + a1 cos x + b1 sin x + . . . + an cos nx + bn sin nx n (ak cos kx + bk sin kx) , = a0 + k=1
dove i coefficienti ak e bk sono costanti reali e uno almeno tra an e bn `e non nullo. Rappresentando le armoniche elementari in termini di ampiezza e fase, un polinomio trigonometrico pu` o anche scriversi nella forma P (x) = a0 +
n
αk sin(kx + ϕk ) .
k=1
La denominazione nasce dal fatto che ogni polinomio algebrico di grado n nelle due variabili X e Y d` a luogo a un corrispondente polinomio trigonometrico di grado n, mediante la sostituzione X = cos x e Y = sin x e l’uso di opportune identit` a trigonometriche sulle potenze di tali funzioni. Ad esempio, se p(X, Y ) = X 3 +2Y 2 , si ha p(cos x, sin x) = cos3 x + 2 sin2 x 1 − cos 2x 1 + cos 2x +2 = cos x 2 2 1 1 = 1 + cos x − cos 2x + cos x cos 2x 2 2 1 1 = 1 + cos x − cos 2x + (cos x + cos 3x) 2 4 1 3 = 1 + cos x − cos 2x + cos 3x = P (x). 4 4 Ovviamente, non tutte le funzioni periodiche sono rappresentabili come polinomi trigonometrici (ad esempio, f (x) = esin x non lo `e). Tuttavia, le funzioni periodiche appartenenti a certe classi (abbastanza ampie da contenere le funzioni che intervengono nelle applicazioni) possono essere approssimate, in un senso opportuno, mediante polinomi trigonometrici di grado via via crescente, e precisamente possono essere sviluppate in serie di polinomi trigonometrici. Esse sono dette serie di Fourier e costituiscono l’oggetto del nostro studio nei prossimi paragrafi.
3.2 Coefficienti e serie di Fourier Iniziamo con il limitare l’insieme delle funzioni (periodiche di periodo 2π) su cui vogliamo operare. Sebbene la teoria delle serie di Fourier possa essere sviluppata in un ambito molto pi` u vasto, nel seguito considereremo solo una classe ristretta di
82
3 Serie di Fourier
funzioni: quelle appartenenti allo spazio C˜2π , che ora introdurremo. A tale scopo, premettiamo le seguenti definizioni. Definizione 3.6 Una funzione f periodica di periodo 2π si dice continua a tratti se `e continua su [0, 2π] tranne al pi` u un numero finito di punti. In tali punti si ha una discontinuit` a eliminabile o di prima specie, vale a dire esistono finiti i limiti sinistro e destro. Inoltre, f si dice regolarizzata se, in ogni punto di discontinuit` a x0 , risulta f (x0 ) =
1 − f (x+ 0 ) + f (x0 ) , 2
dove f (x+ 0 ) = lim+ f (x)
(3.1)
f (x− 0 ) = lim− f (x) .
e
x→x0
x→x0
Definizione 3.7 Indichiamo con C˜2π lo spazio delle funzioni definite su IR, continue a tratti, regolarizzate e periodiche di periodo 2π. Lo spazio C˜2π `e uno spazio vettoriale su R (ossia αf + βg ∈ C˜2π per ogni α, β ∈ R se f, g ∈ C˜2π ); inoltre non `e difficile verificare che, date f, g ∈ C˜2π , l’espressione 2π (f, g) = f (x)g(x) dx (3.2) 0
definisce un prodotto scalare su C˜2π . Valgono infatti le seguenti propriet` a: ˜ i) (f, f ) ≥ 0 per ogni f ∈ C2π e (f, f ) = 0 se e solo se f = 0; ii) (f, g) = (g, f ), per ogni f, g ∈ C˜2π ; iii) (αf + βg, h) = α(f, h) + β(g, h), per ogni f, g, h ∈ C˜2π e per ogni α, β ∈ R. L’unica verifica non banale `e: (f, f ) = 0 implica f = 0. Per vedere ci` o, siano x1 , . . . , xn i punti di discontinuit` a di f in [0, 2π]; risulta 2π x1 x2 2π 0= f 2 (x) dx = f 2 (x) dx + f 2 (x) dx + . . . + f 2 (x) dx 0
0
x1
xn
e poich´e f `e continua su ogni sottointervallo (xi , xi+1 ), si ricava f (x) = 0 su ciascuno di essi. Infine, otteniamo f (xi ) = 0 in ogni punto di discontinuit` a usando la (3.1). Al prodotto scalare (3.2) `e associata una norma ( ; Complementi al Cap. 3 ), detta norma quadratica, definita da 2π 1/2 f 2 = (f, f )1/2 = |f (x)|2 dx . 0
3.2 Coefficienti e serie di Fourier
83
Essa gode delle seguenti propriet`a, che caratterizzano una norma: i) f 2 ≥ 0 per ogni f ∈ C˜2π e f 2 = 0 se e solo se f = 0; ii) αf 2 = |α| f 2 , per ogni f ∈ C˜2π e per ogni α ∈ R; iii) f + g2 ≤ f 2 + g2 , per ogni f, g ∈ C˜2π . Vale inoltre la disuguaglianza di Schwarz |(f, g)| ≤ f 2 g2 ,
∀f, g ∈ C˜2π .
(3.3)
Ricordiamo che una famiglia {fk } di funzioni non nulle in C˜2π si dice sistema ortogonale se (fk , f ) = 0 per k = . Un sistema ortogonale genera un sistema ortonormale {fˆk }, ossia tale che
1 se k = , ˆ ˆ (fk , f ) = δk = 0 se k = , fk per ogni k (normalizzazione). fk 2 ` facile verificare che l’insieme di funzioni E F = 1, cos x, sin x, . . . , cos kx, sin kx, . . . = ϕk (x) = cos kx : k ≥ 0 ∪ ψk (x) = sin kx : k ≥ 1
ponendo fˆk =
(3.4)
costituisce un sistema ortogonale in C˜2π , il cui sistema ortonormale associato `e dato da 1 1 1 1 1 Fˆ = √ , √ cos x, √ sin x, . . . , √ cos kx, √ sin kx, . . . . (3.5) π π π π 2π Ci`o segue dalle relazioni
2π
2π
sin2 kx dx = π , ∀k ≥ 1 2π 2π cos kx cos x dx = sin kx sin x dx = 0 , 0 0 2π cos kx sin x dx = 0 , ∀k, ≥ 0 . 2
cos kx dx =
0
0
∀k, ≥ 0, k = ,
(3.6)
0
Il sistema ortonormale ora introdotto ha in C˜2π lo stesso ruolo della base ortonormale canonica {ek } in Rn : ogni elemento dello spazio si scrive in modo unico come combinazione lineare degli elementi del sistema, con l’importante differenza
84
3 Serie di Fourier
che tale combinazione lineare `e in forma di serie infinita. Le serie di Fourier costituiscono proprio il modo in cui le funzioni di C˜2π si sviluppano in termini del sistema ortonormale (3.5). Un passo fondamentale di tale sviluppo consiste nell’approssimare una funzione mediante una combinazione lineare finita di funzioni di base. Precisamente, per ogni n ≥ 0, consideriamo il sottospazio (2n + 1)-dimensionale Pn di C˜2π dei polinomi trigonometrici di grado ≤ n. Esso `e generato dalle funzioni ϕk ed ψk di F aventi indice k ≤ n, le quali formano un sistema ortogonale finito Fn . Un’approssimazione “naturale” in Pn di una funzione di C˜2π `e la sua proiezione ortogonale su Pn , che ora definiamo. Definizione 3.8 Sia f ∈ C˜2π . Chiamiamo proiezione ortogonale di f su Pn l’elemento Sn,f di Pn cos`ı definito: Sn,f (x) = a0 +
n
(ak cos kx + bk sin kx) ,
(3.7)
k=1
dove i coefficienti ak e bk sono dati da 2π 1 f (x) dx ; a0 = 2π 0 ak =
bk =
1 π 1 π
2π
f (x) cos kx dx ,
k ≥ 1;
f (x) sin kx dx ,
k ≥ 1.
(3.8)
0
2π 0
Si osservi che Sn,f pu` o essere scritto come Sn,f (x) =
n
ak ϕk (x) +
k=0
n
bk ψk (x)
k=1
e che i coefficienti ak e bk si possono esprimere come ak =
(f, ϕk ) (ϕk , ϕk )
per k ≥ 0 ,
bk =
(f, ψk ) (ψk , ψk )
per k ≥ 1 .
(3.9)
Una rappresentazione equivalente pu` o essere data rispetto al sistema ortonormale finito Fˆn costituito dagli elementi di Fˆ con indice k ≤ n; si ha infatti n n ˆbk ψˆk (x) Sn,f (x) = a ˆk ϕˆk (x) + k=0
con
a ˆk = (f, ϕˆk ) per k ≥ 0 ,
k=1
ˆbk = (f, ψˆk ) per k ≥ 1 .
(3.10)
3.2 Coefficienti e serie di Fourier
85
L’equivalenza segue dalle relazioni ak =
ϕk 1 1 1 f, = (f, ϕ ) = a ˆk k 2 ϕk 2 ϕk 2 ϕk 2 ϕk 2
e dunque ak ϕk (x) = a ˆk
ϕk (x) =a ˆk ϕˆk (x) ; ϕk 2
similmente si prova che bk ψk (x) = ˆbk ψˆk (x). Per studiare le propriet` a della proiezione ortogonale di f su Pn , ricordiamo ancora che tramite la norma quadratica `e possibile definire una distanza tra gli elementi dello spazio C˜2π : d(f, g) = f − g2 ,
f, g ∈ C˜2π .
(3.11)
Il numero f − g2 misura quanto le funzioni f e g sono “vicine”. Valgono le usuali propriet` a di una distanza: i) d(f, g) ≥ 0 per ogni f, g ∈ C˜2π e d(f, g) = 0 se e solo se f = g; ii) d(f, g) = d(g, f ), per ogni f, g ∈ C˜2π ; iii) d(f, g) ≤ d(f, h) + d(h, g), per ogni f, g, h ∈ C˜2π . a di seguito La proiezione ortogonale di f su Pn gode allora delle propriet` elencate, alcune delle quali trovano rappresentazione simbolica nella Figura 3.2. Proposizione 3.9 i) La funzione f − Sn,f `e ortogonale ad ogni elemento di Pn e Sn,f `e l’unico elemento di Pn con tale propriet` a. ii) f − Sn,f `e l’elemento di Pn avente minima distanza da f rispetto alla distanza (3.11), nel senso che f − Sn,f 2 = min f − P 2 ; P ∈Pn
dunque Sn,f `e il polinomio di Pn che meglio approssima f nella norma quadratica. iii) Per la quantit` a f − Sn,f 2 , detta scarto quadratico di Sn,f da f , vale la rappresentazione
2π
f − Sn,f 22 =
|f (x)|2 dx − 2πa20 − π 0
Dim.
n
(a2k + b2k ) .
(3.12)
k=1
La proposizione traduce nella situazione specifica le propriet` a generali della proiezione ortogonale di un elemento di uno spazio vettoriale munito di prodotto scalare, sul sottospazio generato da un sistema ortogonale finito. A beneficio degli allievi che non abbiano visto tale risultato astratto in un
86
3 Serie di Fourier f ˜2π C
Pn
Sn,f P O Figura 3.2. Proiezione ortogonale di una funzione f ∈ C˜2π su Pn
corso precedente, riportiamo la dimostrazione nella situazione particolare di nostro interesse. Per dimostrare i), sia P (x) =
n
a ˜k ϕk (x) +
k=0
n
˜bk ψk (x)
k=1
un generico elemento di Pn . Allora f − P `e ortogonale ad ogni elemento di Pn se e solo se, per ogni k ≤ n, (f − P, ϕk ) = 0
e
(f − P, ψk ) = 0 ,
ossia, usando l’ortogonalit` a delle funzioni ck e sk , se e solo se (f, ϕk ) − a ˜k (ϕk , ϕk ) = 0
e
(f, ψk ) − ˜bk (ψk , ψk ) = 0 .
Dunque necessariamente a ˜k = ak e ˜bk = bk per ogni k ≤ n, ricordando la (3.9). In altri termini, si ha P = Sn,f . Per dimostrare la ii), osserviamo preliminarmente che dalla definizione di norma associata al prodotto scalare, si ha facilmente che f + g22 = f 22 + g22 + 2(f, g) ,
∀f, g ∈ C˜2π .
Scrivendo f − P 2 come (f − Sn,f ) + (Sn,f − P )2 , usando la relazione precedente e osservando che f − Sn,f `e ortogonale a Sn,f − P ∈ Pn per la i), otteniamo l’identit` a f − P 22 = f − Sn,f 22 + Sn,f − P 22 , che possiamo considerare come l’estensione del Teorema di Pitagora agli spazi con prodotto scalare (si veda ancora la Figura 3.2). Da essa segue che f − P 22 ≤ f − Sn,f 22 , ∀P ∈ Pn
3.2 Coefficienti e serie di Fourier
87
e che l’uguaglianza vale se e solo se Sn,f −P = 0, cio`e se e solo se P = Sn,f . Ci`o mostra la ii). Infine, la iii) segue dalle relazioni f − Sn,f 22 = f − Sn,f , f − Sn,f = f, f − Sn,f − Sn,f , f − Sn,f = f, f − Sn,f = f 22 − f, Sn,f e
f, Sn,f =
2π
f (x) Sn,f (x) dx = 2πa20 + π 0
n
(a2k + b2k ) .
2
k=1
` naturale a questo punto chiedersi se, e in quale senso, la successione dei E polinomi Sn,f converga ad f per n → ∞. Essi costituiscono le ridotte della serie di funzioni ∞ a0 + (ak cos kx + bk sin kx) , k=1
dove i coefficienti ak e bk sono definiti dalle (3.8), e dunque equivalentemente possiamo porci il problema della convergenza di tale serie. Diamo la seguente definizione. Definizione 3.10 Si chiama serie di Fourier di f ∈ C˜2π la serie di funzioni a0 +
∞
(ak cos kx + bk sin kx) ,
(3.13)
k=1
dove a0 , ak , bk (k ≥ 1) sono numeri reali detti coefficienti di Fourier di f , definiti dalle (3.8). Scriveremo f ≈ a0 +
∞
(ak cos kx + bk sin kx) .
(3.14)
k=1
Con il simbolo ≈ indichiamo che il secondo membro della (3.14) rappresenta la serie di Fourier di f ; ci`o significa semplicemente che i coefficienti ak e bk sono legati alla f dalle relazioni (3.8). Ricordando i vari comportamenti possibili di una serie di funzioni (§ 2.3), ci aspettiamo che la serie di Fourier di f possa non convergere affatto o anche convergere ad una funzione somma diversa da f . Vedremo nel seguito alcune condizioni sufficienti su f per ottenere varie tipologie di convergenza. Useremo invece il simbolo di uguaglianza soltanto quando la serie converge puntualmente a f . Notiamo che `e possibile definire la serie di Fourier di una funzione f periodica, continua a tratti e non necessariamente regolarizzata. La sua serie coincide con quella della funzione regolarizzata costruita a partire da f .
88
3 Serie di Fourier y
−π
π
−2π
0
2π
x
y
−π
π 0
Figura 3.3. Grafici dell’onda S1,f (x), S9,f (x), S41,f (x), in basso
quadra,
x
in
alto,
e
dei
relativi
polinomi
Esempio 3.11 Scriviamo la serie di Fourier dell’onda quadra (si veda la Figura 3.3) ⎧ ⎨ −1 se −π < x < 0 , f (x) = 0 se x = 0, ±π , ⎩ 1 se 0 < x < π . Ricordando la Proposizione 3.3, per ogni k ≥ 0 si ha 2π π f (x) cos kx dx = f (x) cos kx dx = 0 , 0
−π
in quanto f (x) cos kx `e una funzione dispari; da cui ak = 0. Inoltre 1 π 2 π f (x) sin kx dx = sin kx dx bk = π −π π 0
0 se k `e pari , 2 2 k (1 − cos kπ) = (1 − (−1) ) = = 4 se k `e dispari . kπ kπ kπ Scrivendo ogni k dispari nella forma k = 2m + 1, la serie di Fourier di f risulta quindi ∞ 4 1 f≈ sin(2m + 1)x . 2 π m=0 2m + 1 Questo esempio mostra che se la funzione f ∈ C˜2π risulta avere propriet` a di simmetria, il calcolo dei suoi coefficienti di Fourier pu`o essere semplificato. Pi` u precisamente, vale la proposizione seguente.
3.2 Coefficienti e serie di Fourier
89
Proposizione 3.12 Sia f ∈ C˜2π . Se f `e una funzione dispari, allora ak = 0 , ∀k ≥ 0 , π 2 f (x) sin kx dx , bk = π 0
∀k ≥ 1 ;
se f `e una funzione pari, bk = 0 , ∀k ≥ 1 , 1 π f (x) dx ; a0 = π 0 Dim.
2 ak = π
π
f (x) cos kx dx ,
∀k ≥ 1 .
0
` sufficiente ricordare la Proposizione 3.3, osservare Sia, ad esempio, f pari. E che f (x) sin kx, per ogni k ≥ 1, `e una funzione dispari e f (x) cos kx, per ogni k ≥ 0, `e una funzione pari per ottenere 2π π f (x) sin kx dx = f (x) sin kx dx = 0 , ∀k ≥ 1 , −π
0
e, per ogni k ≥ 0, 2π f (x) cos kx dx = 0
π
π
f (x) cos kx dx = 2 −π
f (x) cos kx dx . 0
2
Esempio 3.13 Scriviamo la serie di Fourier dell’onda raddrizzata f (x) = | sin x| (si veda la Figura 3.4). Osserviamo che f `e una funzione pari, quindi i coefficienti bk sono nulli ed `e sufficiente calcolare i coefficienti ak per k ≥ 0. Risulta π 1 1 π 2 | sin x| dx = sin x dx = , a0 = 2π −π π 0 π 1 π sin 2x dx = 0 , a1 = π 0 π 2 1 π ak = sin(k + 1)x − sin(k − 1)x dx sin x cos kx dx = π 0 π 0 1 1 − cos(k + 1)π 1 − cos(k − 1)π − = π k+1 k−1 ⎧ 0 se k `e dispari , ⎪ ⎨ = ∀k > 1 . 4 ⎪ se k `e pari , ⎩− 2 π(k − 1)
90
3 Serie di Fourier y
−π
0
π
x
0
π
x
y
−π
Figura 3.4. Grafici dell’onda raddrizzata, in alto, e dei relativi polinomi S2,f (x), S10,f (x), S30,f (x), in basso
La serie di Fourier dell’onda raddrizzata `e quindi ∞ 1 4 2 cos 2mx . f≈ − π π m=1 4m2 − 1
2
3.3 Forma esponenziale della serie di Fourier La forma esponenziale di una serie di Fourier ne costituisce una rappresentazione equivalente, pi` u compatta e talvolta pi` u maneggevole; il prezzo da pagare `e l’uso dell’aritmetica complessa in luogo di quella reale. Il punto di partenza `e l’identit` a di Eulero (Vol. I, Eq. (8.31)) θ ∈ R;
eiθ = cos θ + i sin θ ,
(3.15)
ponendo θ = ±kx con k ≥ 1 intero, possiamo esprimere le funzioni cos kx e sin kx come combinazioni lineari delle funzioni eikx e e−ikx , ossia 1 1 cos kx = (eikx + e−ikx ) , sin kx = (eikx − e−ikx ) . 2 2i i0x D’altro canto, si ha banalmente 1 = e . Sostituendo tali espressioni nella (3.14) e riarrangiando i termini, otteniamo f≈
+∞
ck eikx ,
(3.16)
k=−∞
avendo posto c0 = a 0 ,
ck =
ak − ibk , 2
c−k =
ak + ibk , 2
per k ≥ 1 .
(3.17)
3.4 Serie di Fourier e derivazione
91
` facile verificare che si ha anche E ck =
1 2π
2π
f (x)e−ikx dx ,
k ∈ ZZ .
0
L’espressione (3.16) rappresenta la serie di Fourier di f in forma esponenziale, ed i coefficienti ck sono i coefficienti di Fourier complessi di f . La serie di Fourier complessa fornisce l’espansione (formale) di una funzione f ∈ C˜2π rispetto al sistema ortogonale costituito dalle funzioni esponenziali eikx , con k ∈ Z. Si ha infatti
2π se k = , ikx ix (e , e ) = 2πδkl = 0 se k = , avendo introdotto il prodotto scalare (f, g) =
2π
f (x)g(x) dx
0 ∗ sull’insieme C˜2π delle funzioni f = fr + ifi : R → C di variabile reale a valori complessi, le cui parti reale fr e immaginaria fi appartengono a C˜2π . Rispetto a tale sistema, i coefficienti di Fourier complessi (3.17) di f si scrivono come
ck =
(f, eikx ) , (eikx , eikx )
k ∈ Z,
(3.18)
∗ in analogia con la (3.9). Tali espressioni hanno senso per tutte le funzioni di C˜2π , dunque la serie di Fourier pu` o essere definita anche per le funzioni di questo insieme pi` u ampio, secondo la (3.16). ` facile verificare che f ∈ C˜∗ `e una funzione reale (cio`e fi = 0) se e solo se i E 2π suoi coefficienti di Fourier complessi soddisfano le condizioni c−k = ck , per ogni k ∈ Z. In tal caso, i coefficienti di Fourier reali di f possono essere ottenuti dalle formule
a 0 = c0 ,
ak = ck + c−k ,
bk = i(ck − c−k ) ,
per k ≥ 1 .
(3.19)
3.4 Serie di Fourier e derivazione Consideriamo la serie di Fourier reale (3.13) e deriviamola (formalmente) termine a termine. Otteniamo la serie α0 +
∞
(αk cos kx + βk sin kx) ,
k=1
con α0 = 0 ,
αk = kbk ,
βk = −kak ,
per k ≥ 1 .
(3.20)
92
3 Serie di Fourier
Essa risulta coincidere con la serie di Fourier della derivata f della funzione f ∈ C˜2π , se - ad esempio - f `e di classe C 1 su R (nel qual caso f appartiene ancora a C˜2π ). Infatti, per la periodicit` a di f , si ha 2π 1 1 f (2π) − f (0) = 0 . f (x) dx = α0 = 2π 0 2π Inoltre, se k ≥ 1, integrando per parti risulta 1 2π αk = f (x) cos kx dx π 0 2π k 2π 1 f (x) cos kx + f (x) sin kx dx = kbk . = π π 0 0 Analogamente, si verifica che βk = −kak . Possiamo dunque scrivere f ≈
∞
(k bk cos kx − k ak sin kx) .
(3.21)
k=1
Tale rappresentazione vale anche - con analoga deduzione - sotto ipotesi pi` u deboli sulla derivabilit` a di f , ad esempio se f `e di classe C 1 a tratti, secondo la successiva Definizione 3.24. L’espressione della serie di Fourier della derivata di una funzione f diventa ancor pi` u esplicita se si ricorre alla forma complessa (3.16) della serie di f . Notiamo infatti che dalla (3.15) si ha d iθ e = (− sin θ) + i cos θ = i(cos θ + i sin θ) = ieiθ . dθ Pertanto, si ha d ikx e = ikeikx , dx da cui otteniamo f ≈
+∞
ikck eikx .
k=−∞
Se f `e di classe C r su R, r ≥ 1, tale relazione si generalizza in modo ovvio, precisamente +∞ f (r) ≈ (ik)r ck eikx ; k=−∞
in altri termini, il k-esimo coefficiente di Fourier complesso γk della derivata resima di f `e dato da γk = (ik)r ck .
(3.22)
3.5 Convergenza delle serie di Fourier
93
3.5 Convergenza delle serie di Fourier In questo paragrafo discutiamo le propriet` a di convergenza della serie di Fourier di una funzione f , continua a tratti, periodica di periodo 2π (non necessariamente regolarizzata). Ci occupiamo di tre tipi di convergenza: la convergenza quadratica, la convergenza puntuale e la convergenza uniforme. 3.5.1 Convergenza quadratica Iniziamo con il definire cosa si intende per convergenza quadratica. Definizione 3.14 Siano f e fk , k ≥ 0, funzioni definite e di quadrato integrabile su un intervallo chiuso e limitato [a, b]. Si dice che la serie di funzioni ∞ fk converge in norma quadratica alla funzione f nell’intervallo I se k=0
b
lim
n→∞
∞
n n $ $2 2 $ $ fk (x) dx = lim $f − fk $ = 0 . f (x) −
a
n→∞
k=0
k=0
2
Direttamente dalla definizione, si vede che la convergenza uniforme della serie fk a f implica quella quadratica. Infatti,
k=0
a
b
n 2 fk (x) dx ≤ f (x) − a
k=0
b
n 2 sup f (x) − fk (x) dx
x∈[a,b]
k=0
n $ $2 $ $ ≤ (b − a) $f − fk $ k=0
∞,[a,b]
;
dunque, se l’ultima espressione `e infinitesima per n → ∞, anche la prima lo `e. La convergenza quadratica della serie di Fourier di una funzione di C˜2π `e garantita dal seguente fondamentale teorema, di cui omettiamo la dimostrazione. Teorema 3.15 Sia f ∈ C˜2π ; allora la serie di Fourier di f converge a f in norma quadratica, ossia lim f − Sn,f 2 = 0 .
n→+∞
Vediamo alcune rilevanti conseguenze del teorema precedente.
94
3 Serie di Fourier
Corollario 3.16 Sia f ∈ C˜2π . Vale l’ identit` a di Parseval
2π
|f (x)|2 dx = 2πa20 + π 0
Dim.
+∞
(a2k + b2k ) .
(3.23)
k=1
Il risultato segue facilmente dal teorema precedente. Infatti, grazie alla (3.12), n 2π 0 = lim f − Sn,f 2 = lim |f (x)|2 dx − 2πa20 − π (a2k + b2k ) n→+∞
n→+∞
2π
|f (x)|2 dx − 2πa20 − π
= 0
∞
0
k=1
2
(a2k + b2k ) .
k=1
Corollario 3.17 (Lemma di Riemann-Lebesgue) Sia f ∈ C˜2π ; allora lim ak = lim bk = 0 .
k→+∞
Dim.
k→+∞
Dall’identit` a di Parseval (3.23), si ha che la serie
∞
(a2k + b2k ) converge.
k=1
Quindi il suo termine generale, a2k + b2k , tende a zero per k → +∞ e il risultato segue facilmente. 2 ∗ Se f ∈ C˜2π `e sviluppata in serie di Fourier complessa (3.16), l’identit` a di Parseval assume la forma 2π +∞ 2 |f (x)| dx = 2π |ck |2 , 0
k=−∞
mentre il Lemma di Riemann-Lebesgue asserisce che lim ck = 0 .
k→∞
Il Corollario 3.16 `e utile per calcolare somme di serie numeriche. Esempio 3.18 Data la funzione f (x) = x definita su (−π, π) e prolungata per periodicit` a su IR (dente di sega) (si veda la Figura 3.5), non `e difficile determinare la sua serie di Fourier. Infatti, la funzione `e dispari, per cui ak = 0, per ogni k ≥ 0, mentre si ottiene agevolmente bk = 2 (−1)k+1 , per cui k ∞ 2 (−1)k+1 sin kx. f≈ k k=1
3.5 Convergenza delle serie di Fourier
95
y y
−π −3π
π
−π
0
3π
x
π 0
x
Figura 3.5. Grafici della funzione dente di sega (a sinistra) e dei relativi polinomi S1,f (x), S7,f (x), S25,f (x) (a destra)
Questa serie converge in norma quadratica a f (x), e utilizzando l’identit` a di Parseval si ottiene π ∞ 2 |f (x)| dx = π b2k . −π
Poich´e
k=1
π
x2 dx = si ha
−π
2π 3 , 3
∞
4 2π 3 =π , 3 k2 k=1
da cui si ricava la somma della serie dei reciproci dei quadrati dei numeri naturali ∞ 1 π2 ; = 6 k2 k=1
Tale risultato `e gi`a stato anticipato nell’Esempio 1.11 i).
2
Notiamo infine che l’aggiunta di opportune ipotesi di regolarit` a su f permette di stimare il resto della serie di Fourier in funzione di n, ottenendo informazioni sulla velocit` a con cui la serie di Fourier di f tende a f in norma quadratica. Se ad esempio f ∈ C˜2π `e di classe C r , r ≥ 1, su R, allora si pu` o dimostrare che f − Sn,f 2 ≤
1 f (r) 2 . nr
Tale risultato `e coerente con quanto osserveremo nel successivo § 3.5.4 a proposito del decadimento dei coefficienti di Fourier della funzione f .
96
3 Serie di Fourier
3.5.2 Convergenza puntuale Abbiamo visto che la serie di Fourier di una funzione f ∈ C˜2π converge a f in norma quadratica, ossia in un opportuno senso integrale; questo per` o non assicura la convergenza puntuale. Ci si pone quindi il non facile problema di trovare condizioni che garantiscano tale tipo di convergenza: neppure l’ipotesi aggiuntiva di continuit` a della funzione f permette di dedurre la convergenza puntuale della sua serie di Fourier. D’altro canto, la convergenza uniforme della serie di Fourier implica quella puntuale (si veda il commento alla Definizione 2.15). Essendo i polinomi trigonometrici funzioni continue, la convergenza uniforme richiede tuttavia che necessariamente f sia continua (per il Teorema 2.17). Enunceremo, senza dimostrazione, alcune condizioni sufficienti che garantiscono la convergenza puntuale della serie di Fourier di una funzione non necessariamente continua. Le prime condizioni assicurano la convergenza su tutto l’intervallo [0, 2π]. Diamo innanzitutto la seguente definizione. Definizione 3.19 i) Si dice che una funzione f `e regolare a tratti in un intervallo [a, b] ⊂ IR se a) `e derivabile in tutti i punti di [a, b] tranne al pi` u in un numero finito di essi (le derivate si intendono laterali negli estremi); b) `e continua a tratti insieme con la sua derivata f . ii) Si dice che f `e monotona a tratti se `e possibile suddividere l’intervallo [a, b] in un numero finito di sottointervalli su ognuno dei quali f `e monotona. Si ha allora il seguente risultato. Teorema 3.20 Sia f ∈ C˜2π . Supponiamo che valga una delle due condizioni seguenti: a) f `e regolare a tratti in [0, 2π]; b) f `e monotona a tratti in [0, 2π]. Allora la serie di Fourier di f converge puntualmente a f in [0, 2π]. Il risultato vale anche se la funzione di partenza non `e regolarizzata; in una situazione di questo genere (che si incontra ad esempio nell’onda quadra e nel dente di sega) la serie di Fourier, in un punto di discontinuit` a x0 , converge al valore regolarizzato + f (x− 0 ) + f (x0 ) 2 di f in x0 e non a f (x0 ).
3.5 Convergenza delle serie di Fourier
97
y
f (x+ 0 ) f (x0 ) f (x− 0 ) x0
x
Figura 3.6. Significato geometrico delle pseudo-derivate sinistra e destra di f in x0
Diamo ora una condizione locale di convergenza puntuale. Definizione 3.21 Si dice che una funzione continua a tratti ammette pseudo-derivata sinistra oppure destra in x0 ∈ R se esistono finiti i limiti f (x− 0 ) = lim− x→x0
f (x) − f (x− 0) , x − x0
f (x+ 0 ) = lim+ x→x0
f (x) − f (x+ 0) . x − x0
(Si veda la Figura 3.6 che illustra il significato geometrico delle pseudo-derivate.) Osserviamo che se f `e continua in x0 , le pseudo-derivate non sono altro che le derivate sinistra e destra. Notiamo poi che la condizione a) del Teorema 3.20 implica l’esistenza delle pseudo-derivate in ogni punto di [0, 2π], ma esistono funzioni (ad esempio, f (x) = x2 sin x1 per x = 0, x ∈ [−π, π] e f (0) = 0) che non sono regolari a tratti eppure ammettono pseudo-derivate in ogni punto x0 ∈ R. Teorema 3.22 Sia f ∈ C˜2π . Se in x0 ∈ [0, 2π] esistono la pseudo-derivata sinistra e la pseudo-derivata destra, allora la serie di Fourier di f converge in x0 al valore (regolarizzato) f (x0 ).
Esempio 3.23 ` verificata la condizione Riprendiamo l’onda quadra studiata nell’Esempio 3.11. E a) del Teorema 3.20 e dunque si ha convergenza puntuale su tutto IR. Si pu` o osservare nella Figura 3.3 un comportamento particolare in un intorno di un punto di discontinuit` a della funzione. Ad esempio, se consideriamo un intorno del punto x0 = 0, si nota che le ascisse dei pi` u vicini punti di massimo e di minimo della somma parziale n-esima tendono ad x0 per n → ∞, ma le ordinate tendono a due limiti ± ∼ ±1.18 che non coincidono con i limiti laterali di f in 0, f (0± ) = ±1. Questo comportamento anomalo si presenta ogni qualvolta si considera un punto di discontinuit` a di una funzione di C˜2π . Tale fenomeno prende il nome di fenomeno di Gibbs. 2
98
3 Serie di Fourier
3.5.3 Convergenza uniforme Abbiamo gi` a osservato che non si pu`o avere convergenza uniforme della serie di Fourier di una funzione discontinua. D’altra parte la continuit` a non `e una condizione sufficiente per tale convergenza (non garantisce neppure la convergenza puntuale). Introduciamo allora la seguente classe di funzioni. Definizione 3.24 Una funzione f ∈ C˜2π si dice di classe C 1 a tratti se `e continua su IR e regolare a tratti in [0, 2π]. Ad esempio, l’onda quadra non `e di classe C 1 a tratti (non `e continua), mentre l’onda raddrizzata lo `e. Possiamo enunciare il seguente importante teorema, per la cui dimostrazione rimandiamo a ; Complementi al Cap. 3 . Teorema 3.25 Sia f ∈ C˜2π di classe C 1 a tratti. Allora la serie di Fourier di f converge uniformemente a f su tutto IR. Pi` u in generale vale il seguente principio di localizzazione di cui omettiamo la dimostrazione. Teorema 3.26 Sia f ∈ C˜2π regolare a tratti in [0, 2π]. Allora la serie di Fourier di f converge uniformemente a f in ogni sottointervallo chiuso in cui la funzione `e continua.
Esempio 3.27 i) La serie di Fourier dell’onda raddrizzata converge uniformemente su tutto IR (si veda la Figura 3.4). ii) La serie di Fourier dell’onda quadra converge uniformemente alla funzione in ogni intervallo [ε, π − ε] oppure [π + ε, 2π − ε] (con 0 < ε < π/2), in quanto l’onda quadra `e regolare a tratti in [0, 2π] e continua in (0, π) e in (π, 2π). 2 3.5.4 Decadimento dei coefficienti di Fourier Le relazioni ottenute nel § 3.4 tra i coefficienti di Fourier di una funzione e quelli delle sue derivate permettono di stabilire un legame tra il comportamento asintotico dei coefficienti, per |k| → ∞, e la regolarit` a della funzione. Per semplicit` a, ragioniamo sui coefficienti complessi. Sia f ∈ C˜2π di classe C r di R, con r ≥ 1; dalla (3.22) otteniamo, per ogni k = 0,
3.6 Funzioni periodiche di periodo T > 0
|ck | =
99
1 |γk | . |k|r
Inoltre, la successione |γk | `e limitata per |k| → ∞; infatti, per la (3.18) applicata alla funzione f (r) , si ha (f (r) , eikx ) γk = ikx ikx , (e , e ) da cui, usando la disuguaglianza di Schwarz, |γk | ≤
f (r) 2 eikx 2 1 = √ f (r) 2 . eikx 22 2
Pertanto, abbiamo dimostrato che
1 |ck | = O |k|r
per |k| → ∞ .
Il risultato per i coefficienti di Fourier reali `e analogo, ossia
1 |ak |, |bk | = O per k → +∞ , kr e si ottiene usando le (3.19) oppure per calcolo diretto. Dunque, in ogni caso, se f `e una funzione 2π periodica e di classe C r su R, i suoi coefficienti di Fourier sono infinitesimi di ordine almeno r rispetto all’infinitesimo campione 1/|k|. Viceversa, si pu`o dimostrare che la velocit`a con cui decadono i coefficienti di Fourier di una funzione ne determina, in un senso opportuno, la regolarit` a.
3.6 Funzioni periodiche di periodo T > 0 Nel caso in cui la funzione f appartenga a C˜T , ovvero sia definita su R, continua a tratti su [0, T ], regolarizzata e periodica di periodo T > 0, la sua serie di Fourier ha la forma ∞ 2π 2π f ≈ a0 + ak cos k x + bk sin k x , T T k=1
dove 1 a0 = T ak =
bk =
2 T 2 T
T
f (x) dx , 0
T
2π x dx , T
k ≥ 1,
2π x dx , T
k ≥ 1.
f (x) cos k 0
T
f (x) sin k 0
100
3 Serie di Fourier
I teoremi relativi alla convergenza quadratica, puntuale e uniforme della serie di Fourier di una funzione di C˜2π si traducono in modo ovvio in analoghi risultati per funzioni appartenenti allo spazio C˜T . Inoltre, l’identit` a di Parseval diventa T ∞ T 2 |f (x)|2 dx = T a20 + (ak + b2k ) . 2 0 k=1
Per quanto riguarda la forma esponenziale della serie di Fourier, l’espressione (3.16) deve essere sostituita dalla +∞ 2π f≈ ck eik T x , (3.24) k=−∞
con
2π 1 T ck = f (x)e−ik T x dx , k ∈ ZZ ; T 0 l’identit` a di Parseval prende la forma T +∞ |f (x)|2 dx = T |ck |2 . 0
k=−∞
Esempio 3.28 Scriviamo lo sviluppo di Fourier della funzione f (x) = 1 − x2 in I = [−1, 1], resa periodica di periodo 2. Poich´e f `e pari, i coefficienti bk sono nulli. Si ha inoltre 1 1 1 2 2 a0 = (1 − x ) dx = (1 − x2 ) dx = , 2 −1 3 0 1 1 2 4 ak = (1 − x2 ) cos kπx dx = 2 (1 − x2 ) cos kπx dx = 2 2 (−1)k+1 2 −1 k π 0 per ogni k ≥ 1. Dunque ∞ 4 (−1)k+1 2 f≈ + 2 cos kπx. 3 π k2 k=1
Poich´e f `e di classe C 1 a tratti, si ha convergenza uniforme su R e quindi puntuale in ogni x ∈ R. Possiamo scrivere ∞ 2 4 (−1)k+1 f (x) = + 2 cos kπx , ∀x ∈ IR. 3 π k2 k=1 In particolare ∞ 4 (−1)k+1 2 f (0) = 1 = + 2 , 3 π k2 k=1 da cui possiamo ottenere la somma della serie armonica generalizzata a segni alterni ∞ (−1)k+1 π2 . = 2 k2 12 k=1
3.7 Esercizi
101
3.7 Esercizi 1. Determinare il periodo minimo delle seguenti funzioni:
c) f (x) = 1 + cos x + sin 3x
x − cos 4x 3 d) f (x) = sin x cos x + 5
e) f (x) = 1 + cos2 x
f) f (x) = | cos x| + sin 2x
a) f (x) = cos(3x − 1)
b) f (x) = sin
2. Tracciare il grafico √delle funzioni definite su R, che nell’intervallo [0, π) coincidono con f (x) = x e che soddisfano rispettivamente le seguenti propriet`a: a) π-periodica; b) 2π-periodica, pari; c) 2π-periodica, dispari. 3. Data la funzione f (x) = cos3 x + sin 3x − 4, si chiede di a) determinarne il periodo minimo; b) calcolarne lo sviluppo in serie di Fourier; c) studiare la convergenza quadratica, puntuale e uniforme di tale sviluppo. 4. Determinare lo sviluppo in serie di Fourier delle funzioni 2π-periodiche definite su [−π, π] nel modo seguente: a) f (x) = 1 − 2 cos x + |x| c)
b) f (x) = 1 + x + sin 2x
0 se −π ≤ x < 0 , d) f (x) = − cos x se 0 ≤ x < π
f (x) = 4| sin3 x|
5. Determinare lo sviluppo in serie di Fourier delle seguenti funzioni regolarizzate e periodiche di periodo T = 1: ! 1 se x ∈ − 14 , 14 , b) f (x) = | sin 2πx| a) f (x) = 0 se x ∈ 14 , 34 ! ! sin 2πx se x ∈ 0, 12 , x se x ∈ 0, 12 , c) f (x) = d) f (x) = 0 se x ∈ 12 , 1 1 − x se x ∈ 12 , 1 6. Sia f la funzione T -periodica, continua a tratti, regolarizzata la cui serie di Fourier `e ∞ k f ≈1+ sin 2kx . (2k + 1)3 k=1
Determinare il periodo T e le eventuali simmetrie di f .
102
3 Serie di Fourier
7. Utilizzando in modo opportuno le serie di Fourier delle funzioni f (x) = x2 e g(x) = x3 , calcolare la somma delle seguenti serie: a)
∞ 1 k4
b)
k=1
∞ 1 k6
k=1
8. Determinare la serie di Fourier della funzione 2π-periodica definita su [−π, π] come |ϕ(x)| + ϕ(x) f (x) = 2 2 dove ϕ(x) = x − 1. 9. Determinare la serie di Fourier della funzione 2π-periodica, pari, regolarizzata definita su [0, π] come
π − x se 0 ≤ x < π2 , f (x) = 0 se π2 < x ≤ π . Utilizzare lo sviluppo ottenuto per calcolare la somma della serie ∞ k=0
1 . (2k + 1)2
10. Calcolare i coefficienti dello sviluppo in serie di Fourier della funzione 2πperiodica, dispari, definita su [0, π] come f (x) = 1 + sin 2x + sin 4x. 11. Si consideri la funzione 2π-periodica definita su [−π, π] nel modo seguente:
cos 2x se |x| ≤ π2 , f (x) = −1 se |x| > π2 e |x| ≤ π . Determinare la serie di Fourier di f e di f ; studiare successivamente la convergenza uniforme delle serie ottenuta. 12. Si consideri la funzione 2π-periodica coincidente con f (x) = x2 su [0, 2π]. Verificare che la sua serie di Fourier `e f≈
∞ 4 2 1 π π +4 sin kx . cos kx − 3 k2 k k=1
Studiare la convergenza di tale serie e utilizzare quanto ottenuto per calcolare ∞ (−1)k la somma della serie . k2 k=1
3.7 Esercizi
103
13. Si consideri la funzione f (x) = 2 +
∞ 1 sin kx , 2k
x ∈ R.
k=1
Verificare che f ∈ C ∞ (R). Dedurre la serie di Fourier di f ed i valori di f 2 2π e di f (x) dx . 0
14. Si consideri la funzione 2π-periodica definita su [−π, π) come f (x) = x. Determinare la serie di Fourier di f e studiarne la convergenza quadratica, puntuale e uniforme.
3.7.1 Soluzioni 1. Periodo minimo di funzioni: a) T = 23 π .
b) T = 6π .
c) T = 2π .
d) T = π .
e) T = π .
f) T = π .
2. Grafici di funzioni: Si veda la Figura 3.7. 3. a) Il periodo minimo della funzione `e T = 2π. b) Utilizzando varie relazioni trigonometriche si ottiene f (x) = −4 + sin 3x + cos x cos2 x 1 = −4 + sin 3x + cos x(1 + cos 2x) 2 a)
y
−2π
−π
0
π
2π
−2π
x
−π
−π
0
c)
y
−2π
b)
y
0
π
2π
x
Figura 3.7. Grafici relativi all’Esercizio 2
π
2π
x
104
3 Serie di Fourier
1 cos x + sin 3x + 2 3 = −4 + cos x + sin 3x + 4 = −4 +
1 (cos 3x + cos x) 4 1 cos 3x . 4
c) Poich´e la funzione f `e un polinomio trigonometrico, la serie di Fourier `e in realt`a una somma finita di armoniche elementari. Pertanto si ha convergenza di ogni tipo. 4. Sviluppo in serie di Fourier di funzioni: a) La funzione `e la somma del polinomio trigonometrico 1−2 cos x e della funzione ` dunque sufficiente determinare la serie di Fourier della funzione g(x) = |x|. E g. Si tratta di una funzione pari, quindi bk = 0 per ogni k ≥ 1. Calcoliamo i coefficienti ak : π 1 1 π π |x| dx = x dx = , a0 = 2π −π π 0 2 π π 1 2 ak = |x| cos kx dx = x cos kx dx π −π π 0 π 2 2 cos kx + kx sin kx 0 = (−1)k − 1 πk 2 πk 2 ⎧ se k pari, ⎨0 = k ≥ 1. ⎩− 4 se k dispari , πk 2 =
In conclusione, g≈
∞ 1 π 4 − cos(2k + 1)x , 2 π (2k + 1)2 k=0
dunque f ≈1+
∞ 1 4 4 π − 2+ cos x − cos(2k + 1)x . 2 π π (2k + 1)2 k=1
b) f ≈ 1 + 2 sin x + 2
∞ (−1)k+1 k=3
k
sin kx .
c) La funzione `e pari, dunque bk = 0 per ogni k ≥ 1. Calcoliamo i coefficienti ak : π π 1 4 π 3 4 cos3 x 16 − cos x = 4| sin3 x| dx = sin x dx = a0 = 2π −π π 0 π 3 3π 0 π π 1 8 4| sin3 x| cos kx dx = sin3 x cos kx dx ak = π −π π 0
3.7 Esercizi
=
2 π (3 sin x − sin 3x) cos kx dx π 0 ⎧ 2 π ⎪ sin4 x 0 ⎪ ⎪ ⎪ π ⎪ ⎪ π ⎪ ⎪ ⎪ 6 cos 2x cos 4x 1 2 π ⎪ ⎪ − sin 3x 0 − ⎪π ⎨ 4 8 3π
se k = 1 , se k = 3 ,
0
⎪ 2 3 cos(1 + k)x cos(1 − k)x ⎪ ⎪ − + + ⎪ ⎪ ⎪ π 2 1+k 1−k ⎪ ⎪
π ⎪ ⎪ 1 cos(3 − k)x cos(3 + k)x ⎪ ⎪ ⎩ + se k = 1, 3 , 2 3−k 3+k 0 ⎧ se k = 1, k = 3, ⎨0 = 48 ⎩ (−1)k + 1 se k = 1, 3 , π(1 − k 2 )(9 − k2 ) ⎧ se k dispari, ⎨0 = 96 ⎩ se k pari . π(1 − k 2 )(9 − k2 ) =
In conclusione, ∞
f≈
16 1 96 + sin 2kx . 3π π (1 − 4k2 )(9 − 4k2 ) k=1
d) Calcoliamo i coefficienti ak e bk : π 1 a0 = (− cos x) dx = 0 , 2π 0 1 π cos x cos kx dx ak = − π 0 ⎧ π 1 x sin 2x ⎪ ⎪ ⎪− + ⎨ π 2 4 0 = π ⎪ sin(1 − k)x sin(1 + k)x 1 ⎪ ⎪ + ⎩− π 2(1 − k) 2(1 + k) 0 ! 1 per k = 1 , − = 2 0 per k = 1 ; π 1 bk = − cos x sin kx dx π 0
per k = 1 , per k = 1 ,
105
106
3 Serie di Fourier
⎧ π 1 sin2 x ⎪ ⎪ ⎪ ⎨ −π 2 0 = π ⎪ 1 cos(k − 1)x cos(k + 1)x ⎪ ⎪ + ⎩ π 2(k − 1) 2(k + 1) 0 ⎧ 2k ⎨− per k pari , = π(k2 − 1) ⎩ 0 per k dispari . In conclusione,
per k = 1 , per k = 1 ,
∞ 1 k 4 f ≈ − cos x − sin 2kx . 2 π 4k2 − 1 k=1
5. Sviluppo in serie di Fourier di funzioni: a) f ≈ b) f ≈ c) f ≈
∞ 1 2 (−1)k−1 + cos 2π(2k − 1)x . 2 π 2k − 1
4 2 − π π
k=1 ∞
k=1
1 cos 4πkx . −1
4k2
∞ 1 1 2 1 + sin 2πx − cos 4πkx . π 2 π 4k2 − 1 k=1
∞ 1 2 1 d) f ≈ − 2 cos 2π(2k − 1)x . 4 π (2k − 1)2 k=1
6. Risulta
1 2 sin 2x + sin 4x + · · · 27 125 e dunque T = π, che `e il periodo minimo dell’armonica sin 2x. La funzione non `e simmetrica perch´e somma di una funzione pari, g(x) = 1, e ∞ k di una dispari, h(x) = sin 2kx. (2k + 1)3 f ≈1+
k=1
7. Somma di serie: a) Determiniamo i coefficienti di Fourier della funzione 2π-periodica definita come f (x) = x2 sull’intervallo [−π, π]. Poich´e la funzione `e pari, bk = 0 per ogni k ≥ 1. Inoltre 1 π 2 π2 a0 = , x dx = π 0 3
π 2 2 2 π 2 2 2x x ak = − sin kx x cos kx dx = cos kx + π 0 π k2 k k3 0 =
4 (−1)k , k2
k ≥ 1.
3.7 Esercizi
Pertanto
107
∞
f≈
(−1)k π2 +4 cos kx ; 3 k2 k=1
dall’identit` a di Parseval si ha π ∞ 1 2 x4 dx = π 5 + 16π , 4 9 k −π k=1
da cui
∞ 1 π4 . = 4 k 90
k=1
b)
∞ k=1
1 π6 . = k6 945
8. Osserviamo che
f (x) =
x2 − 1 se x ∈ [−π, −1] ∪ [1, π] , 0 se x ∈ (−1, 1)
(si veda la Figura 3.8). La funzione `e pari, quindi bk = 0 per ogni k ≥ 1. Inoltre 2 1 π 2 π2 −1+ , (x − 1) dx = a0 = π 1 3 3π 2 π 2 ak = (x − 1) cos kx dx π 1 sin kx π 2 1 2 2 = 2kx cos kx + (k x − 2) sin kx − π k3 k 1 =
4 sin k − cos k , (−1)k π + 2 πk k
k ≥ 1;
y
x −2π −π 0 π 2π Figura 3.8. Grafico della funzione f relativa all’Esercizio 8
108
3 Serie di Fourier
in definitiva f≈
∞ 2 4 1 sin k π2 −1+ + − cos k cos kx . (−1)k π + 2 3 3π π k k k=1
9. Per convenienza, si disegni il grafico della funzione f (si veda la Figura 3.9). Poich´e f `e pari, sono nulli i coefficienti bk , k ≥ 1. Calcoliamo i coefficienti ak : 1 π/2 3 (π − x) dx = π , a0 = π 0 8 π/2 π/2 1 2 sin kx − 2 cos kx + kx sin kx ak = (π − x) cos kx dx = 2 π 0 x πk 0 =
π 2 2 1 π sin k − 2 cos k + 2 , k 2 πk 2 πk
Pertanto
∞
3 f ≈ π+ 8
k=1
k ≥ 1.
π 2 2 1 π sin k − 2 cos k + 2 k 2 πk 2 πk
cos kx .
La serie converge puntualmente alla funzione f , regolarizzata; in particolare per x = π2 si ha ∞
3 π = π+ 4 8
k=1
Poich´e sin
π k= 2
0 (−1)m
π 2 2 1 π sin k − 2 cos k + 2 k 2 πk 2 πk
se k = 2m , se k = 2m + 1 ,
cos
π k= 2
(−1)m 0
cos
π k. 2
se k = 2m , se k = 2m + 1 ,
y π
π 2 π 4
−π
− π2
0
π 2
π
Figura 3.9. Grafico della funzione f relativa all’Esercizio 9
x
3.7 Esercizi
risulta −
109
∞ ∞ π 1 1 m = (−1) − 1 = − , 2 8 2πm π(2k + 1)2 m=1 k=0
da cui
∞ k=0
1 π2 . = (2k + 1)2 8
10. Risulta ak = 0 , ∀k ≥ 0; b2 = b4 = 1 , b2m = 0 , ∀m ≥ 3 ;
b2m+1 =
4 , ∀m ≥ 0 . π(2m + 1)
11. Il grafico della funzione `e mostrato nella Figura 3.10. Iniziamo con il calcolare i coefficienti di Fourier di f . Poich´e si tratta di una funzione pari, bk = 0 per ogni k ≥ 1. Inoltre π π/2 1 π 1 1 a0 = f (x) dx = cos 2x dx − dx = − , π 0 π 2 0 π/2 π/2 π 2 π 2 ak = f (x) cos kx dx = cos 2x cos kx dx − cos kx dx π 0 π 0 π/2 ⎧ % π/2 π & ⎪ sin 4x x 2 1 ⎪ ⎪ + sin 2x per k = 2 , − ⎪ ⎪ 2 8 2 ⎨π 0 π/2 = % π/2 π & ⎪ ⎪ 2 sin(2 − k)x sin(2 + k)x 1 ⎪ ⎪ + sin kx per k = 2 , − ⎪ ⎩π 2(2 − k) 2(2 + k) 0 k π/2 y
−π −2π
π 0
2π
x
Figura 3.10. Grafico della funzione f relativa all’Esercizio 11
110
3 Serie di Fourier
⎧ 1 ⎪ ⎪ ⎪ ⎪2 ⎨ = 0 ⎪ ⎪ 8(−1)m ⎪ ⎪ ⎩ π(2m + 1) 4 − (2m + 1)2
per k = 2 , per k = 2m , m > 1 , per k = 2m + 1 , m ≥ 0 .
Pertanto ∞ (−1)k 8 1 1 cos(2k + 1)x . f ≈ − + cos 2x + 2 2 π (2k + 1)(3 − 4k − 4k2 ) k=0
Osserviamo che la serie converge uniformemente su R per il Criterio di Weierstrass in quanto, per k ≥ 0, (−1)k 1 (2k + 1)(3 − 4k − 4k2 ) cos(2k + 1)x ≤ (2k + 1)(4k 2 + 4k − 3) = Mk e la serie
∞
Mk `e convergente perch´e si comporta come la serie armonica ge-
k=0
neralizzata di esponente 3 (Mk ∼ 8k13 , per k → ∞). In particolare, la serie di Fourier converge puntualmente per ogni x ∈ R. In alternativa, si pu` o applicare il Teorema 3.20. Invece di calcolare direttamente, in base alla definizione, i coefficienti di Fourier di f , verifichiamo se vi sia convergenza uniforme della serie ottenuta derivando termine a termine la serie di Fourier di f ; in tal modo, si potr` a applicare il Teorema 2.19. In effetti `e immediato verificare che f `e di classe C 1 (R) con
−2 sin 2x se |x| < π2 , f (x) = 0 se π2 ≤ |x| ≤ π , a di tipo salto in ± π2 ). Pertanto mentre f `e C 1 a tratti su R (f ha una discontinuit` la serie di Fourier di f converge uniformemente (e dunque puntualmente) su R e dunque si ha f (x) = − sin 2x +
∞ (−1)k 8 sin(2k + 1)x . π 4k2 + 4k − 3 k=0
12. Risulta 2π 1 4 x2 dx = π 2 , 2π 0 3 2π 1 ak = x2 cos kx dx π 0 2π 2 2 4 1 1 2 x sin kx + 2 x cos kx − 3 sin kx = 2, = π k k k k 0 a0 =
k ≥ 1,
3.7 Esercizi
bk = =
1 π
111
2π
x2 sin kx dx 0
2π 1 2 2 4π 1 − x2 cos kx + 2 x sin kx + 3 cos kx , =− π k k k k 0
k ≥ 1;
pertanto, la serie di Fourier di f `e quella assegnata. La funzione f `e continua e monotona a tratti su R, dunque la sua serie di Fourier converge puntualmente alla funzione f regolarizzata (f˜(2kπ) = 2π 2 , ∀k ∈ Z). Inoltre la serie converge uniformemente a f su tutti i sottointervalli chiusi non contenenti i punti 2kπ, ∀k ∈ Z. In particolare, si ha f (π) = π 2 = e quindi
∞
∞
k=1
k=1
1 (−1)k 4 2 4 π +4 cos kπ = π 2 + 4 2 3 k 3 k2
∞ (−1)k k=1
k2
=
1 2 4 2 π2 (π − π ) = − . 4 3 12
∞ 1 13. Osserviamo che la serie sin kx converge uniformemente su R in quanto 2k k=1
`e possibile applicare il Criterio di Weierstrass con Mk = 21k , perch´e 1 1 |fk (x)| = k sin kx ≤ k , ∀x ∈ R . 2 2 Analogo risultato vale per le serie delle derivate: k k |fk (x)| = k cos kx ≤ k , 2 2 2 k k2 |fk (x)| = k sin kx ≤ k , 2 2
∀x ∈ R , ∀x ∈ R ,
.. . (n)
|fk (x)| ≤
kn , 2k
Ne segue che, per ogni n ≥ 0, la serie
∀x ∈ R . ∞
(n)
fk (x) converge uniformemente su R
k=0
e pertanto, grazie al Teorema 2.19, la funzione f risulta derivabile infinite volte, cio`e f ∈ C ∞ (R). In particolare, la serie di Fourier di f `e f (x) =
∞ k cos kx , 2k
k=1
∀x ∈ R .
112
3 Serie di Fourier
Per calcolare f 2 , utilizziamo l’identit` a di Parseval f 22 =
2π
|f (x)|2 dx = 2πa0 + π 0
= 4π + π
1 1−
−1
(a2k + b2k ) = 4π + π
k=1
1 4
∞
= 4π +
∞ 1 4k
k=1
13 π = π, 3 3
# da cui f 2 = 5 13 3 π. Infine
2π
f (x) dx = 2πa0 = 4π . 0
14. Risulta f ≈2
∞ (−1)k+1 k=1
k
sin kx .
Si ha convergenza quadratica; puntuale alla funzione regolarizzata che coincide con f per x = π + 2kπ e vale 0 per x = π + 2kπ, k ∈ Z; uniforme su ogni intervallo chiuso non contenente punti del tipo x = π + 2kπ, k ∈ Z.
4 Funzioni tra spazi euclidei
Prende avvio in questo capitolo lo studio delle funzioni di pi` u variabili indipendenti oppure aventi valori vettoriali, vale a dire delle funzioni che operano tra sottoinsiemi degli spazi euclidei Rn ed Rm , ove uno almeno tra n ed m `e maggiore di 1. Tale studio proseguir` a nei capitoli successivi con il calcolo differenziale e con quello integrale, e costituir` a parte rilevante del corso. Iniziamo con un breve richiamo dei principali concetti relativi a vettori e matrici, che dovrebbero essere gi`a noti agli studenti. Introduciamo poi le nozioni indispensabili di topologia degli spazi euclidei, ed in particolae quelle di famiglia di intorni di un punto, di insiemi aperti o chiusi e di frontiera di un insieme. Definiamo inoltre varie propriet` a dei sottoinsiemi di uno spazio Rn , che estendono, con una maggiore ricchezza dovuta alla multidimensionalit` a, analoghe caratteristiche degli intervalli della retta reale. Introdotte le funzioni tra spazi euclidei, ne studiamo le propriet` a di continuit` a e di limite, che estendono quelle gi`a note relative al caso monodimensionale, ma che comunque richiedono attenzione specifica, comportando difficolt`a e sottigliezze aggiuntive legate alla dimensione superiore. Da ultimo, consideriamo quelle particolari funzioni, le curve e le superfici, che descrivono in modo matematicamente rigoroso oggetti geometrici rispettivamente mono- e bi-dimensionali spesso parte integrante della nostra esperienza quotidiana. Lo studio delle curve e delle superfici proseguir`a nella seconda parte del Capitolo 6, quando avremo a disposizione gli strumenti del calcolo differenziale, mentre gli aspetti legati al calcolo integrale saranno trattati nel Capitolo 9.
4.1 Vettori in Rn Ricordiamo che Rn `e lo spazio vettoriale delle n-uple ordinate x = (xi )i=1,...,n , che chiameremo vettori. Le componenti xi di x possono essere elencate tanto in senso orizzontale, creando un vettore riga x = (x1 , . . . , xn ) ,
Canuto C, Tabacco A: Analisi Matematica II. © Springer-Verlag Italia, Milano 2008
114
4 Funzioni tra spazi euclidei
quanto in senso verticale, creando un vettore colonna ⎛ ⎞ x1 .. ⎠ ⎝ x= = (x1 , . . . , xn )T . . xn Le due forme saranno per noi del tutto equivalenti, tranne che in alcune situazioni in cui la scelta sar`a importante e verr` a specificata. Useremo prevalentemente la notazione orizzontale per opportunit` a grafica. Possiamo rappresentare ciascun vettore di Rn introducendo la base canonica {e1 , . . . , en } costituita dai vettori che hanno tutte le componenti nulle, tranne una che vale 1, ossia
1 se i = j ei = (δij )1≤j≤n con δij = . (4.1) 0 se i = j Si ha allora x=
n
x i ei .
(4.2)
i=1
Solitamente i vettori della base canonica sono indicati con i e j in R2 e con i, j, k in R3 . Pu` o essere utile identificare un vettore (x1 , x2 ) = x1 i + x2 j ∈ R2 con il vettore (x1 , x2 , 0) = x1 i + x2 j + 0 k ∈ R3 ; in altre parole, l’espressione x1 i + x2 j potr` a indicare tanto un vettore di R2 quanto di R3 , a seconda del contesto. In Rn `e definito il prodotto scalare tra due vettori, ponendo x · y = x1 y1 + . . . + xn yn =
n
xi y i .
i=1
Ad esso `e associata la norma euclidea
+ , n , √ x2 , x = x · x = i
i=1
per cui valgono la disuguaglianza di Cauchy-Schwarz |x · y| ≤ x y
(4.3)
e la disuguaglianza triangolare x + y ≤ x + y .
(4.4)
Due vettori x e y soddisfacenti la relazione x · y = 0 si dicono ortogonali, mentre un vettore x tale che x = 1 `e detto versore. La base canonica di Rn `e un esempio di sistema ortonormale di vettori, ossia un insieme di n versori a due a due ortogonali; infatti, i suoi elementi soddisfano le relazioni ei · ej = δij ,
1 ≤ i, j ≤ n .
4.1 Vettori in Rn
115
Dalla (4.2) segue allora l’espressione x i = x · ei per la i-esima componente di un vettore x. ` utile pensare ogni x ∈ Rn come univocamente associato a un punto P nelE lo spazio n-dimensionale, le cui coordinate rispetto ad un sistema di riferimento cartesiano ortogonale sono le componenti di x; ci`o estende quanto gi`a noto nel piano e nello spazio. Secondo questa identificazione, x rappresenta la distanza euclideadel punto P di coordinate x dall’origine O. Si noti che la quantit` a x − y = (x1 − y1 )2 + . . . + (xn − yn )2 rappresenta la distanza tra i due punti P e Q di coordinate x e y rispettivamente. In R3 `e definito il prodotto esterno x ∧ y tra due vettori x = x1 i + x2 j + x3 k e y = y1 i + y2 j + y3 k. Esso `e ancora un vettore in R3 , dato da x ∧ y = (x2 y3 − x3 y2 )i + (x3 y1 − x1 y3 )j + (x1 y2 − x2 y1 )k . Formalmente, esso pu` o essere ottenuto dalla ⎛ i x ∧ y = det ⎝ x1 y1
(4.5)
formula j x2 y2
⎞ k x3 ⎠ y3
(4.6)
sviluppando il determinante secondo gli elementi della prima riga. Il prodotto esterno tra due vettori `e ortogonale ad entrambi (si veda la Figura 4.1, a sinistra), ossia (x ∧ y) · x = 0 , (x ∧ y) · y = 0 . (4.7) La quantit` a x ∧ y rappresenta l’area del parallelogramma avente come lati i vettori x e y. Invece (x ∧ y) · z rappresenta il volume del prisma avente come lati i vettori x, y, z (si veda ancora la Figura 4.1). Valgono le propriet` a: y ∧ x = −(x ∧ y) , x∧y =0
⇐⇒
x = λy per un opportuno λ ∈ R ,
(x + y) ∧ z = x ∧ z + y ∧ z , dalla prima delle quali segue immediatamente che x ∧ x = 0. x∧y
z
y
y
x
x
Figura 4.1. Prodotto x ∧ y (a sinistra) e (x ∧ y) · z (a destra)
(4.8)
116
4 Funzioni tra spazi euclidei
Valgono inoltre le relazioni circolari i∧j = k,
j ∧ k = i,
k∧i=j;
da esse e dalle precedenti segue ad esempio che se x = x1 i + x2 j e y = y1 i + y2 j, allora x ∧ y = (x1 y2 − x2 y1 )k. Una terna (v1 , v2 , v3 ) di versori a due a due non allineati si dice destrorsa se (v1 ∧ v2 ) · v3 > 0 , ossia se i vettori v3 e v1 ∧ v2 stanno dalla stessa parte rispetto al piano definito dai vettori v1 e v2 . Un modo pratico per verificare se una terna `e destrorsa `e utilizzare la regola della mano destra: disponendo il dito indice lungo v1 e il medio lungo v2 , `e possibile disporre il pollice lungo v3 . (Una regola equivalente utilizza la mano sinistra: disponendo il dito medio lungo v1 e l’indice lungo v2 , `e possibile disporre il pollice lungo v3 .) Una terna (v1 , v2 , v3 ) si dice sinistrorsa se la terna (v1 , v2 , −v3 ) `e destrorsa, ovvero se (v1 ∧ v2 ) · v3 < 0 .
4.2 Matrici Una matrice reale A a m righe ed n colonne (o pi` u semplicemente, una matrice m × n) `e un insieme di m × n numeri reali, che rappresentiamo nella forma di tabella ⎛ ⎞ a11 a12 . . . a1n ⎜a ⎟ ⎜ 21 a22 . . . a2n ⎟ A=⎜ . ⎟ ⎝ .. ⎠ am1
am2
...
amn
o, pi` u compattamente, come A = (aij ) 1 ≤ i ≤ m ∈ Rmn . 1≤j ≤n
I vettori formati dagli elementi di una riga (rispettivamente, di una colonna) di A costituiscono i vettori riga (rispettivamente, colonna) di A. Le matrici m × 1 sono i vettori di Rm rappresentati come vettori colonna, mentre le matrici 1 × n sono i vettori di Rn rappresentati come vettori riga. Se m = n, la matrice dicesi quadrata di ordine n. L’insieme delle matrici m × n `e uno spazio vettoriale che denoteremo come Rm,n (esso `e isomorfo allo spazio euclideo Rmn ). La matrice C = λA + μB, con λ e μ ∈ R, ha elementi cij = λaij + μbij ,
1 ≤ i ≤ m, 1 ≤ j≤ n.
4.2 Matrici
117
Se A `e una matrice m × n e B `e una matrice n × p, risulta definita la matrice prodotto C = AB a m righe e p colonne i cui elementi sono dati dai prodotti scalari di ogni vettore riga della matrice A per ogni vettore colonna della matrice B, ossia n cij = aik bkj , 1 ≤ i ≤ m, 1 ≤ j≤ p. k=1
In particolare, se B = x `e una matrice n × 1, ossia un vettore colonna in Rn , risulta definito il prodotto matrice-vettore Ax, che `e un vettore colonna in Rm . Se p = m, risultano definite la matrice quadrata m × m AB e la matrice quadrata n × n BA. Se n = m, in generale AB = BA, ossia il prodotto di matrici non `e commutativo. Il minore Aij (1 ≤ i ≤ m, 1 ≤ j ≤ n) di una matrice m × n A `e la matrice (m − 1) × (n − 1) ottenuta cancellando da A la i-esima riga e la j-esima colonna. Il rango r ≤ min(m, n) di A `e il massimo numero di righe (o colonne) linearmente indipendenti come vettori di Rn (o di Rm ). Data una matrice m × n A, la sua trasposta `e la matrice n × m AT i cui elementi sono dati da aTij = aji ,
1 ≤ i ≤ n, 1 ≤ j≤ m;
in altri termini, AT si ottiene da A scambiando ordinatamente le righe con le colonne; si ha ovviamente (AT )T = A. Ove definito, il prodotto di matrici soddisfa (AB)T = B T AT . Il prodotto scalare tra due vettori di Rn pu` o essere equivalentemente scritto attraverso il prodotto matriciale come x · y = xT y = y T x, pensando x e y come vettori colonna. Nello spazio Rm,n `e definita una norma, associata alla norma euclidea, ponendo A = max{Ax : x ∈ Rn , x = 1} . (4.9) Valgono le disuguaglianze Ax ≤ A x
e
AB ≤ A B
(4.10)
per ogni x ∈ Rn e B ∈ Rn,p . Matrici quadrate D’ora in avanti, consideriamo matrici quadrate di ordine n. Tra queste, `e particolarmente rilevante la matrice identit` a I = (δij )1≤i,j≤n , la quale soddisfa AI = IA = A per ogni matrice quadrata A di ordine n. Una matrice A si dice simmetrica se coincide con la sua trasposta, ossia se aij = aji ,
1 ≤ i, j ≤ n ;
si dice invece normale se AAT = AT A, e in particolare ortogonale se AAT = AT A = I.
118
4 Funzioni tra spazi euclidei
Ad ogni A possiamo associare uno scalare, detto determinante di A e indicato con det A, che pu` o essere calcolato ricorsivamente attraverso la regola di Laplace, ponendo det A = a se n = 1 e A = (a), e per n > 1 det A =
n
(−1)i+j aij det Aij ,
j=1
ove i ∈ {1, . . . , n} `e fissato arbitrariamente. Si ha, ad esempio,
a b det = ad − bc . c d Valgono le seguenti regole: det(AB) = det A det B ,
det(λA) = λn det A ,
det AT = det A ,
det A = − det A
se A `e ottenuta da A scambiando tra loro due righe o due colonne. Inoltre, si ha immediatamente det I = 1 e | det A| = 1 se A `e ortogonale. La matrice A dicesi non singolare se det A = 0. Questa condizione equivale all’invertibilit` a della matrice, ossia all’esistenza di una matrice di ordine n, che chiameremo matrice inversa di A e che indichiamo con A−1 , tale che AA−1 = A−1 A = I . Se A e B sono matrici invertibili, si ha det(A−1 ) = (det A)−1 ,
(AB)−1 = B −1 A−1 ,
(AT )−1 = (A−1 )T ;
dall’ultima relazione segue in particolare che l’inversa di una matrice simmetrica, se esiste, `e ancora simmetrica. Ogni matrice ortogonale A `e invertibile, con A−1 = AT . Esistono molte condizioni equivalenti alla invertibilit` a di una matrice. Tra esse ricordiamo le seguenti: • il rango di A `e uguale a n; • il sistema lineare Ax = b ammette una soluzione x ∈ Rn per ogni b ∈ Rn ; • il sistema lineare omogeneo Ax = 0 ammette solo la soluzione nulla x = 0. L’ultima condizione equivale a dire che 0 non `e un autovalore di A. Autovalori e autovettori Gli autovalori di A sono le radici (in campo complesso) del polinomio caratteristico di grado n χ(λ) = det(A − λI) , ossia i numeri complessi λ per i quali esiste un vettore v = 0, detto autovettore (destro) di A associato a λ, tale che Av = λv
(4.11)
4.2 Matrici
119
(qui e nel seguito del paragrafo, tutti i vettori devono essere intesi come vettori colonna). Per il Teorema fondamentale dell’Algebra, esistono p autovalori distinti, λ(1) , . . . , λ(p) con 1 ≤ p ≤ n, ciascuno avente molteplicit` a algebrica (cio`e come radice del polinomio χ) μ(i) , tale che μ(1) + . . . + μ(p) = n. Il massimo numero di autovettori linearmente indipendenti associati all’autovalore λ(i) `e detto molteplicit` a geometrica di λ(i) ; la indichiamo con m(i) e soddisfa m(i) ≤ μ(i) . Autovettori associati ad autovalori diversi sono linearmente indipendenti tra di loro. Pertanto, se le molteplicit`a algebrica e geometrica di ciascun autovalore coincidono, abbiamo in totale n autovettori linearmente indipendenti, che quindi formano una base. Si dice in tal caso che la matrice `e diagonalizzabile. Per motivare tale termine, `e conveniente numerare gli autovalori di A come λk con 1 ≤ k ≤ n, ripetendo ciascun autovalore tante volte quanta `e la sua molteplicit` a; sia vk un autovettore associato a λk , scelto in modo che l’insieme {vk }1≤k≤n sia formato da vettori linearmente indipendenti. Le relazioni Avk = λk vk ,
1 ≤ k ≤ n,
possono essere scritte, in forma matriciale, come AP = P Λ ,
(4.12)
dove Λ = diag (λ1 , . . . , λn ) `e la matrice diagonale avente gli autovalori sulla diagonale principale, mentre P = (v1 , . . . , vn ) `e la matrice quadrata di ordine n le cui colonne sono gli autovettori di A. L’indipendenza lineare di tali vettori equivale alla invertibilit` a della matrice P , per cui la relazione (4.12) equivale alla A = P ΛP −1 ;
(4.13)
ci`o significa che A `e simile a una matrice diagonale, ossia `e diagonalizzabile. Tornando alla situazione generale, `e importante notare che, essendo A una matrice reale (e dunque essendo il polinomio caratteristico a coefficienti reali), i suoi autovalori sono o reali o complessi coniugati; lo stesso vale per i corrispondenti autovettori. Il determinante di A coincide con il prodotto degli autovalori, precisamente si ha det A = λ1 λ2 · · · λn−1 λn . Gli autovalori della matrice A2 = AA sono i quadrati degli autovalori di A, con gli stessi autovettori; analoghi risultati valgono per le altre potenze di A. D’altra parte, se A `e invertibile, gli autovalori della matrice inversa sono i reciproci degli autovalori di A, mentre gli autovettori sono gli stessi; infatti, nelle ipotesi fatte, la (4.11) `e equivalente alla v = λA−1 v ,
da cui
A−1 v =
Il raggio spettrale di A `e definito come ρ(A) = max |λk | , 1≤k≤n
1 v. λ
120
4 Funzioni tra spazi euclidei
ossia `e il massimo modulo degli autovalori di A. La norma (euclidea) di A soddisfa # A = ρ(AT A) ; in particolare, se A `e simmetrica si ha A = ρ(A), mentre se A `e ortogonale si ha A = ρ(I) = 1. Matrici simmetriche Le matrici simmetriche godono di propriet` a rilevanti per quanto riguarda i loro autovalori e autovettori. Ogni autovalore di una tale matrice A `e reale e le sue molteplicit`a algebrica e geometrica coincidono; pertanto A `e diagonalizzabile. Gli autovettori, anch’essi tutti reali, possono essere scelti in modo da formare una base ortonormale (infatti, quelli relativi ad autovalori diversi sono tra loro ortogonali, quelli relativi ad uno stesso autovalore possono essere ortonormalizzati); la matrice P associata a una tale base `e dunque ortogonale, e pertanto la relazione (4.13) diventa A = P ΛP T . (4.14) La trasformazione x → P T x = y definisce quindi un cambiamento di base ortogonale in Rn , dalla base canonica {ei }1≤i≤n alla base degli autovettori {vk }1≤k≤n ; rispetto a tale base, la matrice A si rappresenta come una matrice diagonale. La trasformazione inversa `e y → P y = x. Ad ogni matrice reale e simmetrica A `e associata una forma quadratica Q, ossia una funzione Q : Rn → R tale che Q(λx) = λ2 Q(x) per ogni x ∈ Rn e λ ∈ R; precisamente, si pone 1 1 Q(x) = x · Ax = xT Ax . (4.15) 2 2 La forma Q pu` o essere espressa attraverso gli autovalori di A nel modo seguente: sostituendo ad A la sua rappresentazione (4.14), e ponendo y = P T x, si ha Q(x) =
1 1 1 T x (P ΛP )T x = (P T x)T Λ(P T x) = y T Λy . 2 2 2
Osservando che Λy = (λk yk )1≤k≤n se y = (yk )1≤k≤n , concludiamo che 1 λk yk2 . 2 n
Q(x) =
(4.16)
k=1
Possiamo classificare A a seconda del comportamento del segno di Q, nel modo seguente: • •
o equivale A dicesi definita positiva se Q(x) > 0 per ogni x ∈ Rn , x = 0; ci` al fatto che tutti gli autovalori di A sono strettamente positivi. A dicesi semi-definita positiva se Q(x) ≥ 0 per ogni x ∈ Rn ; ci`o equivale al fatto che tutti gli autovalori di A sono non negativi.
4.2 Matrici
•
121
A dicesi indefinita se Q assume in Rn valori sia strettamente positivi sia strettamente negativi; ci` o equivale al fatto che A possiede autovalori sia strettamente positivi sia strettamente negativi.
Le definizioni di matrice definita negativa e semi-definita negativa sono ovvie. Le matrici simmetriche e definite positive possono essere caratterizzate in vari altri modi equivalenti. Ad esempio, si pu` o dire che tutti i minori principali di A (quelli ottenuti cancellando le stesse righe e colonne) sono strettamente positivi. In particolare, gli elementi diagonali aii di A sono tutti strettamente positivi. Si ha poi un’importante caratterizzazione geometrica: se A `e simmetrica e definita positiva, gli insiemi di livello {x ∈ Rn : Q(x) = c > 0} della forma quadratica Q sono degli (iper-)ellissi (ellissi in dimensione 2, ellissoidi in dimensione 3) aventi gli assi disposti nelle direzioni degli autovettori di A. Infatti, limitandoci per semplicit` a al caso bidimensionale, la relazione 1 (λ1 y12 + λ2 y22 ) = c , 2
ossia
y2 y12 + 2 = 1, 2c/λ1 2c/λ2
definisce, nel sistema di coordinate (y1 , y2 ) associato agliautovettori v1 e v2 , un ellisse in forma canonica avente lunghezza dei semiassi 2c/λ1 e 2c/λ2 . Tornando al sistema di coordinate (x1 , x2 ), lo stesso insieme appare come un ellisse disposto secondo le direzioni di v1 e v2 (vedasi la Figura 4.2). Osserviamo infine che, dalla (4.16) segue facilmente la propriet` a Q(x) ≥
λ∗ x2 , 2
∀x ∈ Rn ,
(4.17)
dove λ∗ = min λk . Infatti si ha 1≤k≤n
Q(x) ≥
n λ∗ λ∗ 2 y2 yk = 2 2 k=1
e y2 = P T x2 = xT P P T x = xT x = x2 grazie all’ortogonalit` a di P . x2
y2 x → Py y1
v2
v1
x1
Figura 4.2. Conica associata ad una matrice simmetrica definita positiva
122
4 Funzioni tra spazi euclidei
Esempio 4.1 Si consideri la matrice simmetrica di ordine 2 4 α A= α 2 dove α `e un parametro reale. Risolvendo l’equazione caratteristica det(A−λI) = (4 − λ)(2 − λ) − α2 = 0, otteniamo gli autovalori λ1 = 3 − 1 + α 2 , λ2 = 3 + 1 + α 2 > 0 . Si ha √ |α| < 2 2 ⇒ λ1 > 0 ⇒ A definita positiva , √ |α| = 2 2 ⇒ λ1 = 0 ⇒ A semi-definita positiva , √ |α| > 2 2 ⇒ λ1 < 0 ⇒ A indefinita . 2
4.3 Insiemi in Rn e loro propriet` a Allo scopo di studiare limiti e continuit` a delle funzioni di pi` u variabili, introduciamo vari concetti relativi a vettori e sottoinsiemi di Rn . Mediante il concetto di distanza, possiamo definire gli intorni di un punto in Rn . Definizione 4.2 Sia x0 ∈ Rn e sia r > 0 un numero reale. Chiamiamo intorno di x0 di raggio r l’insieme Br (x0 ) = {x ∈ Rn : x − x0 < r} costituito da tutti i punti di Rn che distano meno di r da x0 . L’insieme B r (x0 ) = {x ∈ Rn : x − x0 ≤ r} viene detto intorno chiuso di x0 di raggio r. Dunque B r (x0 ) `e il cerchio (se n = 2) oppure la sfera (se n = 3) di centro x0 e raggio r, mentre Br (x0 ) `e il cerchio o la sfera senza bordo. Sia ora X un sottoinsieme di Rn . Ricordiamo che C X = Rn \ X indica il complementare di X. Definizione 4.3 Un punto x ∈ Rn dicesi i) punto interno a X se esiste un intorno Br (x) contenuto in X; ii) punto esterno a X se `e punto interno al complementare C X; iii) punto di frontiera di X se non `e n´e interno n´e esterno a X.
4.3 Insiemi in Rn e loro propriet` a
123
Si veda la Figura 4.3 per una rappresentazione grafica delle varie situazioni descritte nella definizione precedente. Un punto di frontiera pu` o essere definito, in modo equivalente, come un punto tale che ogni suo intorno contiene sia punti di X sia punti di C X. Da ci`o segue in particolare che i punti di frontiera di X e del suo complementare coincidono. Definizione 4.4 L’insieme dei punti interni a X costituisce l’ interno di X ◦
e viene indicato con X oppure int X. Similmente l’insieme dei punti di frontiera di X costituisce la frontiera di X e viene indicato con ∂X. L’insieme dei punti esterni a X costituisce l’ esterno di X e viene indicato con est X. Infine, l’insieme X ∪∂X costituisce la chiusura di X e viene indicato con X. Segue facilmente dalla definizione che, in generale, ◦
X ⊆X ⊆X. Quando una delle due inclusioni `e una uguaglianza, si ha un caso notevole, precisato nella seguente definizione. Definizione 4.5 L’insieme X `e aperto se ogni suo punto `e interno, cio`e se ◦
X = X. L’insieme X `e chiuso se contiene la sua frontiera, cio`e se X = X. Notiamo che un insieme `e aperto se e solo se contiene un intorno di ogni suo punto, vale a dire se e solo se non contiene punti della sua frontiera. Conseguentemente, un insieme `e chiuso se e solo se il complementare `e aperto, in quanto, come abbiamo osservato sopra, un insieme e il suo complementare hanno la stessa frontiera.
x1
X
x2 x3
Figura 4.3. Punto interno, x1 , di frontiera, x2 , ed esterno, x3 , per un insieme X
124
4 Funzioni tra spazi euclidei
Esempi 4.6 i) Gli insiemi Rn e ∅ sono contemporaneamente aperti e chiusi (e sono gli unici sottoinsiemi di Rn con tale propriet` a). La loro frontiera `e vuota. ii) Il semipiano X = {(x, y) ∈ R2 : x > 1} `e aperto. Infatti, preso (x0 , y0 ) ∈ X, si verifica facilmente che ogni intorno di raggio r ≤ x0 − 1 `e contenuto in X (si veda la Figura 4.4, a sinistra). La sua frontiera ∂X `e la retta di equazione x = 1 (parallela all’asse delle y), come illustrato nella Figura 4.4, a destra. Il suo complementare C X = {(x, y) ∈ R2 : x ≤ 1} `e dunque chiuso. In generale ogni semipiano X ⊂ R2 definito da una disuguaglianza del tipo ax + by > c oppure ax + by < c , con a e b non entrambi nulli, `e aperto mentre se `e definito da una disuguaglianza del tipo ax + by ≥ c oppure ax + by ≤ c , `e chiuso. In entrambe le situazioni, la frontiera ∂X `e la retta di equazione ax + by = c. iii) Sia X = B1 (0) = {x ∈ Rn : x < 1} la sfera n-dimensionale di centro l’origine e raggio 1, priva di bordo. Essa `e aperta, in quanto preso x0 ∈ X arbitrario e posto r ≤ 1 − x0 , si ha Br (x0 ) ⊆ X. Infatti, se x − x0 < r risulta x = x − x0 + x0 ≤ x − x0 + x0 < 1 − x0 + x0 = 1 . La frontiera di X `e la superficie sferica n-dimensionale ∂X = {x ∈ Rn : x = 1}, cio`e il bordo della sfera, mentre la chiusura di X `e la sfera stessa, ossia l’intorno chiuso B 1 (0). In generale, ogni intorno Br (x0 ), con x0 ∈ Rn e r > 0 arbitrari, `e un insieme aperto avente frontiera {x ∈ Rn : x − x0 = r} e chiusura l’intorno chiuso B r (x0 ). y
y X
X ∂X
Br (x0 ) x0
r x
x
Figura 4.4. Semipiano x > 1 con intorno di un punto (a sinistra) e frontiera (a destra)
4.3 Insiemi in Rn e loro propriet` a
125
iv) L’insieme X = {x ∈ Rn : 2 ≤ x − x0 < 3} (che rappresenta una corona circolare in dimensione 2 e la regione compresa tra due sfere in dimensione 3) non `e n´e aperto n´e chiuso. Infatti, l’interno `e dato da ◦
X = {x ∈ Rn : 2 < x − x0 < 3} e la chiusura da X = {x ∈ Rn : 2 ≤ x − x0 ≤ 3} . La frontiera `e l’insieme ∂X = {x ∈ Rn : x − x0 = 2} ∪ {x ∈ Rn : x − x0 = 3} , unione delle due superfici sferiche che delimitano X. v) L’insieme X = [0, 1]2 ∩ Q2 dei punti a coordinate razionali contenuti nel quadrato unitario ha interno vuoto e frontiera coincidente con la chiusura che `e l’intero quadrato [0, 1]2 . Infatti, ricordando la densit` a dei numeri razionali in R, ogni intorno di ogni punto del quadrato [0, 1]2 contiene infiniti punti di X e infiniti punti del suo complementare. 2
Definizione 4.7 Un punto x ∈ Rn dicesi punto di accumulazione di X se ogni suo intorno contiene punti di X diversi da x, ossia ∀r > 0 , Br (x) \ {x} ∩ X = ∅ . Un punto x ∈ X dicesi punto isolato di X se esiste un intorno Br (x) che non contiene punti di X diversi da x, ossia ∃r > 0 , Br (x) \ {x} ∩ X = ∅ , vale a dire ∃r > 0 ,
Br (x) ∩ X = {x} .
Osserviamo che ogni punto interno di X `e punto di accumulazione di X, mentre nessun punto esterno pu` o essere punto di accumulazione di X. Un punto di frontiera di X `e o punto di accumulazione di X (appartenente o meno a X) o un punto isolato di X. Viceversa, un punto di accumulazione o `e interno a X o `e punto di frontiera di X, non isolato. Un punto isolato `e necessariamente un punto di frontiera. Esempio 4.8 Sia X l’insieme X = {(x, y) ∈ R2 : 2
y2 x2
≤ 1 oppure x2 + (y − 1)2 ≤ 0} .
|y| ≤ 1, definisce la regione compresa tra le bisettrici La condizione xy 2 ≤ 1, ossia |x| y = ±x (incluse) e contenente l’asse x, privata dell’origine (a causa del denominatore). A tale regione si deve aggiungere il punto (0, 1), unica soluzione della disequazione x2 + (y − 1)2 ≤ 0. Si veda la Figura 4.5.
126
4 Funzioni tra spazi euclidei y y = −x
y=x
1 x
Figura 4.5. Insieme X = {(x, y) ∈ R2 :
y2 x2
≤ 1 oppure x2 + (y − 1)2 ≤ 0}
I punti di accumulazione di X sono dati dai punti soddisfacenti la disequazione y 2 ≤ x2 . Essi possono essere divisi in punti interni, definiti dalla condizione y 2 < x2 , e punti di frontiera, soddisfacenti y = ±x (compresa quindi l’origine). Un ulteriore punto di frontiera `e il punto (0, 1), che `e (l’unico) punto isolato dell’insieme. 2 Definiamo ora alcune propriet` a degli insiemi che saranno utili nel seguito. Definizione 4.9 Un insieme X dicesi limitato se esiste un numero reale R > 0 tale che x ≤ R , ∀x ∈ X , ossia X `e contenuto in un intorno chiuso B R (0) dell’origine.
Definizione 4.10 Un insieme X dicesi compatto se `e chiuso e limitato.
Esempi 4.11 i) Il quadrato unitario X = [0, 1]2 ⊂ R2 `e compatto. Infatti esso contiene manifestamente la sua frontiera; inoltre, se x ∈ X si ha # √ √ x = x21 + x22 ≤ 1 + 1 = 2 . Pi` u in generale, il cubo n-dimensionale X = [0, 1]n ⊂ Rn `e compatto. ii) Le figure piane elementari (rettangoli, poligoni, cerchi, ellissi) e i solidi elementari (tetraedri, prismi, piramidi, coni e sfere) sono compatti. iii) Ogni insieme limitato ha come chiusura un insieme compatto.
2
4.3 Insiemi in Rn e loro propriet` a
127
Siano a , b punti distinti in Rn ; indichiamo con S[a, b] il segmento (chiuso) di estremi a e b, cio`e l’insieme dei punti appartenenti alla retta passante per a e b e compresi tra a e b; esso pu`o essere descritto come S[a, b] = {x = a + t(b − a) : 0 ≤ t ≤ 1} = {x = (1 − t)a + tb : 0 ≤ t ≤ 1} .
(4.18)
Definizione 4.12 Un insieme X dicesi convesso se il segmento che unisce due punti qualsiasi di X `e tutto contenuto in X. Dati poi r + 1 punti in Rn , a0 , a1 , . . . , ar , distinti (eccetto eventualmente a0 = ar ), dicesi poligonale di vertici a0 , a1 , . . . , ar l’unione degli r segmenti S[ai−1 , ai ], 1 ≤ i ≤ r, aventi gli estremi a due a due concatenati: P [a0 , . . . , ar ] =
r 0
S[ai−1 , ai ] .
i=1
Definizione 4.13 Un insieme aperto A ⊆ Rn si dice connesso (per archi) se, presi comunque due punti x e y in A, esiste una poligonale che li congiunge interamente contenuta in A. Si veda la Figura 4.6 per un esempio. Esempi 4.14 i) In R gli aperti connessi sono tutti e soli gli intervalli aperti. ii) Ogni insieme aperto convesso A in Rn `e ovviamente connesso.
y x
A
Figura 4.6. Insieme A connesso (ma non convesso)
128
4 Funzioni tra spazi euclidei y x xy = 1
y
x
y
x
Figura 4.7. Insiemi A relativi agli Esempi 4.14 iii) (a sinistra) e iv) (a destra)
iii) Una qualunque corona circolare A = {x ∈ R2 : r1 < x − x0 < r2 } nel piano, con x0 ∈ R2 , r2 > r1 ≥ 0 (si veda la Figura 4.7, a sinistra) `e un insieme ` immediato individuare graficamente, per ogni connesso (ma non convesso). E scelta di x e y ∈ A, una poligonale che li unisce. iv) L’insieme aperto A = {x = (x, y) ∈ R2 : xy > 1} (si veda la Figura 4.7, a destra) non `e connesso. 2 ` possibile dimostrare che ogni insieme aperto non vuoto A di Rn `e l’unione di E una famiglia {Ai }i∈I di insiemi non vuoti, aperti, connessi e a due a due disgiunti; cio`e 0 A= Ai con Ai ∩ Aj per i = j . i∈I
Ogni Ai viene detto componente connessa di A. Ogni insieme aperto connesso ha un’unica componente connessa, se stesso. L’insieme A considerato nell’Esempio 4.14 iv) ha due componenti connesse A1 = {x = (x, y) ∈ A : x > 0}
e
A2 = {x = (x, y) ∈ A : x < 0} .
Definizione 4.15 Chiamiamo regione ogni sottoinsieme R di Rn formato dall’unione di un aperto connesso non vuoto A e di una parte della sua frontiera, ossia R=A∪Z con ∅ ⊆ Z ⊆ ∂A . Se Z = ∅, avremo una regione aperta, se invece Z = ∂A avremo una regione chiusa. Notiamo che una regione pu` o essere definita in modo equivalente come un ◦
insieme R non vuoto di Rn il cui interno A = R `e connesso e tale che A ⊆ R ⊆ A.
4.4 Funzioni: definizioni e primi esempi
Esempio 4.16 L’insieme R = {x ∈ R2 : ha facilmente
129
4 − x2 − y 2 < 1} `e una regione piana, in quanto si
R = {x ∈ R2 :
√
3 < x ≤ 2} . √ Dunque A = R `e la corona circolare aperta {x ∈ R2 : 3 < x < 2}, mentre Z = {x ∈ R2 : x = 2} ⊂ ∂A. 2 ◦
4.4 Funzioni: definizioni e primi esempi Iniziamo considerando le funzioni scalari reali, cio`e le funzioni a valori in R. Sia n un intero ≥ 1 fissato. Chiameremo funzione reale di n variabili reali una funzione f definita in Rn a valori in R; indicando il dominio di f con dom f , abbiamo quindi f : dom f ⊆ Rn → R . Il grafico Γ (f ) = {(x, f (x)) ∈ Rn+1 : x ∈ dom f } `e un sottoinsieme di Rn+1 . Il caso n = 1 (funzioni reali di una variabile reale) `e stato oggetto di ampio studio nel Vol. I. Nel seguito studieremo le funzioni scalari di due o pi` u variabili reali. Nel caso n = 2 oppure n = 3, indicheremo la variabile x anche con (x, y) e (x, y, z), rispettivamente. Esempi 4.17 i) La funzione z = f (x, y) = 2x − 3y, definita su R2 , ha come grafico il piano di equazione 2x − 3y − z = 0. ii) La funzione z = f (x, y) = equazione y = ±x.
y 2 + x2 `e definita su R2 privato delle rette di y 2 − x2
z − x2 − y 2 ha come dominio l’insieme iii) La funzione w = f (x, y, z) = dom f = {(x, y, z) ∈ R3 : z ≥ x2 + y 2 } formato dal paraboloide ellittico di equazione z = x2 + y 2 e dalla regione ad esso interna. iv) La funzione f (x) = f (x1 , . . . , xn ) = log(1−x21 −. . .−x2n ) `e definita all’interno della superficie sferica n-dimensionale di equazione x21 + . . . + x2n = 1, ossia n x2i < 1 . dom f = x ∈ Rn : i=1
` chiaro che `e possibile, in linea teorica, rappresentare graficamente una E funzione scalare soltanto nel caso n ≤ 2. Ad esempio, si consideri la funzione f (x, y) = 9 − x2 − y 2 il cui grafico in R3 ha equazione z = 9 − x2 − y 2 . Elevando al quadrato entrambi i membri dell’equazione si ottiene z = 9 − x2 − y 2
ossia
x2 + y 2 + z 2 = 9 .
130
4 Funzioni tra spazi euclidei
z
(0, 0, 3)
(0, 3, 0) (3, 0, 0) y x Figura 4.8. Rappresentazione grafica della funzione f (x, y) =
p
9 − x2 − y 2
Si riconosce dunque l’equazione di una sfera con centro nell’origine e raggio 3. Poich´e z ≥ 0, il grafico di f `e la semisfera rappresentata in Figura 4.8. Un altro modo per visualizzare il comportamento di una funzione di due oppure tre variabili consiste nel disegnare alcuni suoi insiemi di livello. Dato un numero reale c, l’insieme di livello L(f, c) = {x ∈ dom f : f (x) = c}
(4.19)
`e il sottoinsieme di Rn dei punti in cui la funzione f vale c. La Figura 4.9 mostra alcuni insiemi di livello della funzione z = f (x, y) dell’Esempio 4.9 ii). Geometricamente, in dimensione n = 2, esso `e la proiezione sul piano xy dell’intersezione tra il grafico di f e il piano z = c. Ovviamente L(f, c) `e non vuoto se e solo se c ∈ im f . Un insieme di livello pu` o assumere una forma anche molto complicata. Vedremo per` o nel § 7.2 che sotto ipotesi ragionevoli su f esso `e costituito da una o pi` u curve (in 2 dimensioni) e da una o pi` u superfici (in 3 dimensioni). Consideriamo ora la situazione pi` u generale di funzione definita tra spazi euclidei. Precisamente, fissati due interi n, m ≥ 1, indichiamo con f una qualunque funzione definita in Rn a valori in Rm , ossia f : dom f ⊆ Rn → Rm . Se m = 1, ritroviamo le funzioni scalari reali viste sopra. Se m ≥ 2, diremo che f `e una funzione vettoriale reale. Alcune situazioni notevoli sono le seguenti. Le curve, gi` a oggetto di studio nel Vol. I nel caso m = 2 (curve piane) e m = 3 (curve nello spazio), sono particolari funzioni vettoriali in cui n = 1; invece le superfici nello spazio sono particolari
4.4 Funzioni: definizioni e primi esempi
131
y
x
Figura 4.9. Alcuni insiemi di livello della funzione z = f (x, y) =
y 2 + x2 y 2 − x2
funzioni vettoriali per le quali n = 2 e m = 3. Curve e superfici saranno trattate nei § 4.6 e 4.7 e studiate approfonditamente nel successivo Capitolo 6. Infine nel caso in cui n = m, diremo che f `e un campo vettoriale. Un esempio, per n = m = 3, `e rappresentato dal campo gravitazionale terrestre. Indichiamo con fi , 1 ≤ i ≤ m, le componenti di f rispetto alla base canonica {ei }1≤i≤m di Rm ; in altri termini, poniamo m fi (x)ei . f (x) = fi (x) 1≤i≤m = i=1
Ciascuna componente fi `e una funzione scalare reale di una o pi` u variabili reali, definite almeno su dom f ; in effetti, dom f `e l’intersezione dei domini delle componenti di f . Esempi 4.18 i) Consideriamo il campo vettoriale in R2 definito da f (x, y) = (−y, x) . Il modo migliore per visualizzare un campo bidimensionale consiste nel disegnare il vettore corrispondente a f (x, y) applicato nel punto (x, y). Naturalmente, non `e possibile far questo in ogni punto (x, y), ma `e possibile ottenere un’impressione ragionevole del comportamento di f considerando un numero sufficiente di punti. Poich´e f (1, 0) = (0, 1), disegnamo il vettore (0, 1) applicato nel punto (1, 0); poich´e f (0, 1) = (−1, 0), disegnamo il vettore (−1, 0) applicato nel punto (0, 1). Continuando in questo modo possiamo disegnare un certo numero di vettori che rappresentano il campo f (si veda la Figura 4.10, a sinistra). Si osserva che ogni vettore `e tangente a un cerchio con centro nell’origine. In effetti, il prodotto scalare tra il vettore posizione x = (x, y) e il vettore f (x) `e nullo: x · f (x) = (x, y) · (−y, x) = −xy + xy = 0 ,
132
4 Funzioni tra spazi euclidei y
z
f (0, 1)
f (1, 0)
x
x
y
Figura 4.10. Rappresentazione grafica del campo f (x, y) = (−y, x) (a sinistra) e f (x, y, z) = (0, 0, z) (a destra)
ossia i vettori x e f (x) sono tra loro ortogonali. Inoltre f (x) = x, ovvero, il modulo del vettore f (x, y) coincide con il raggio del cerchio. Il campo ora studiato rappresenta il campo delle velocit` a che descrive la rotazione in senso antiorario di una ruota. ii) In modo analogo si pu` o procedere per visualizzare campi in R3 . Ad esempio, si consideri f (x, y, z) = (0, 0, z) . In Figura 4.10, a destra, `e mostrata una rappresentazione grafica di tale campo. Si osservi che tutti i vettori sono verticali, rivolti verso l’alto al di sopra del piano xy, e rivolti verso il basso al di sotto del piano xy. La grandezza aumenta con la distanza dal piano xy. iii) Si immagini un fluido che scorre all’interno di un tubo e sia f (x, y, z) il vettore della velocit` a nel punto (x, y, z). Allora f assegna un vettore ad ogni punto (x, y, z) in un certo dominio Ω (l’interno del tubo) e dunque f `e un campo vettoriale in R3 , detto campo delle velocit`a. Un tale possibile campo `e mostrato in Figura 4.11. iv) La funzione
x x y z = f (x, y, z) = , , , x3 (x2 + y 2 + z 2 )3/2 (x2 + y 2 + z 2 )3/2 (x2 + y 2 + z 2 )3/2 definita su R3 \ {0} a valori in R3 , rappresenta il campo di forze elettrostatiche generate da una carica puntiforme posta nell’origine. v) Sia A = (aij ) 1 ≤ i ≤ m una matrice reale m × n. La funzione 1 ≤ j≤ n
`e definita su R a valori in R due spazi vettoriali. n
m
f (x) = Ax , e rappresenta un’applicazione lineare tra questi 2
4.5 Continuit` a e limiti
133
Figura 4.11. Campo di velocit` a di un fluido in un tubo
4.5 Continuit` a e limiti La definizione di continuit` a per funzioni tra spazi euclidei `e formalmente identica a quella data per funzioni reali di una variabile reale (Vol. I, Capitolo 3), salvo che il valore assoluto in R viene sostituito da una qualunque norma in Rn o Rm , che per semplicit`a di notazioni indicheremo sempre con il simbolo · . Definizione 4.19 Sia f : dom f ⊆ Rn → R e sia x0 ∈ dom f . La funzione f dicesi continua in x0 se per ogni ε > 0 esiste un δ > 0 tale che ∀x ∈ dom f ,
x − x0 < δ
⇒
f (x) − f (x0 ) < ε ,
x ∈ Bδ (x0 )
⇒
f (x) ∈ Bε (f (x0 )).
vale a dire ∀x ∈ dom f ,
Una funzione f dicesi continua su un insieme Ω ⊆ dom f se `e continua in ogni punto x ∈ Ω. La seguente propriet` a, la cui semplice dimostrazione `e lasciata al lettore volenteroso, `e utile nello studio della continuit` a di una funzione vettoriale. Proposizione 4.20 La funzione f = (fi )1≤i≤m `e continua in x0 ∈ dom f se e solo se lo sono tutte le sue componenti fi . Ci limitiamo pertanto a fornire esempi relativi a funzioni scalari. Esempi 4.21 i) Verifichiamo che la funzione f : R2 → R, f (x) = 2x1 + 5x2 `e continua in x0 = (3, 1). Si ha |f (x) − f (x0 )| = |2(x1 − 3) + 5(x2 − 1)| ≤ 2|x1 − 3| + 5|x2 − 1| ≤ 7x − x0 ;
134
4 Funzioni tra spazi euclidei
Abbiamo qui usato la propriet` a, gi` a ricordata precedentemente, |yi | ≤ y per ogni i. Fissato ε > 0, `e sufficiente scegliere δ = ε/7 per ottenere il risultato. Si noti che il medesimo ragionamento mostra che f `e continua in ogni x0 ∈ R2 . ii) La funzione considerata nell’esempio precedente `e un caso particolare di funzione affine f : Rn → R, ossia di tipo f (x) = a · x + b (con a ∈ Rn , b ∈ R). Essa `e continua in ogni x0 ∈ Rn ; infatti, ricordando la disuguaglianza di Cauchy-Schwarz (4.3), si ha |f (x) − f (x0 )| = |a · x − a · x0 | = |a · (x − x0 )| ≤ a x − x0 .
(4.20) Se a = 0, il risultato `e banale. Altrimenti, fissato ε > 0, la condizione di continuit` a `e soddisfatta scegliendo δ = ε/a. 2 Diremo che f `e uniformemente continua su Ω se, nella definizione di continuit` a, `e possibile scegliere δ indipendente da x0 . La funzione affine f considerata sopra `e uniformemente continua su Rn (per maggiori dettagli si rimanda a ; Complementi al Cap. 4 . La continuit` a di una funzione di pi` u variabili pu` o essere spesso studiata senza ricorrere alla verifica della definizione. A tale scopo, i seguenti criteri, che diamo senza dimostrazione, sono utili: i) Se ϕ `e una funzione definita e continua in un insieme I ⊆ R, la funzione f (x) = ϕ(x1 ) `e definita e continua sull’insieme Ω = I × Rn−1 ⊆ Rn . Pi` u in generale, ogni funzione continua di m variabili risulta continua anche se la si considera come funzione di n > m variabili. Ad esempio sono continue le funzioni f1 (x, y) = ex f2 (x, y, z) =
su dom f1 = R2 , 1 − y2
su dom f2 = R × [−1, 1] × R .
ii) Se f e g sono funzioni continue su un insieme Ω ⊆ Rn , le funzioni f + g, f − g ed f g sono continue su Ω, mentre f /g `e continua nel sottoinsieme di Ω in cui g = 0. Ad esempio sono continue le funzioni h1 (x, y) = ex + sin y
su dom h1 = R2 ,
h2 (x, y) = y log x arctan y h3 (x, y, z) = 2 x + z2
su dom h2 = (0, +∞) × R , su dom h3 = R \ {0} × R × R \ {0} .
4.5 Continuit` a e limiti
135
iii) Se f `e continua su Ω ⊆ Rn e g `e continua su I ⊆ R, la funzione composta g ◦ f `e continua su dom g ◦ f = {x ∈ Ω : f (x) ∈ I}. Ad esempio sono continue le funzioni su dom h1 = {(x, y) ∈ R2 : xy > −1} , su dom h2 = R2 × R \ {1} ,
h1 (x, y) = log(1 + xy) 3 x + y2 h2 (x, y, z) = z−1 h3 (x) = 4 x41 + . . . + x4n
su dom h3 = Rn .
In particolare, dalla Proposizione 4.20 e dall’ultimo criterio, segue il seguente risultato sulla continuit` a della funzione composta nella situazione pi` u generale possibile. Proposizione 4.22 Siano f : dom f ⊆ Rn → Rm
e
g : dom g ⊆ Rm → Rp
due funzioni e sia x0 ∈ dom f tale che y0 = f (x0 ) ∈ dom g, in modo che sia definita la funzione composta h = g ◦ f : dom h ⊆ Rn → Rp , avendosi x0 ∈ dom h. Se f `e continua in x0 e g `e continua in y0 , allora h `e continua in x0 . Anche la definizione di limite finito per x → x0 ∈ Rn di una funzione vettoriale `e del tutto simile a quella data per le funzioni di una variabile reale. Nel seguito supporremo che f sia una funzione definita in dom f ⊆ Rn e che x0 ∈ Rn sia un punto di accumulazione per dom f . Definizione 4.23 Si dice che f ha limite ∈ Rm (o tende a ) per x tendente a x0 , e si scrive lim f (x) = ,
x→x0
se per ogni ε > 0 esiste un δ > 0 tale che ∀x ∈ dom f ,
0 < x − x0 < δ
⇒
f (x) − < ε ,
vale a dire ∀x ∈ dom f ,
x ∈ Bδ (x0 ) \ {x0 }
⇒
f (x) ∈ Bε () .
(4.21)
136
4 Funzioni tra spazi euclidei
Come nel caso delle funzioni di una variabile reale, se f `e definita in x0 , si ha l’equivalenza f continua in x0
⇐⇒
lim f (x) = f (x0 ) .
x→x0
Anche per i limiti vale una propriet` a analoga alla Proposizione 4.20, che giustifica lo studio del limite componente per componente. Esempi 4.24 i) La funzione x4 + y 4 x2 + y 2 2 `e definita in R \{(0, 0)}. Essa `e continua nel suo dominio come si vede facilmente applicando pi` u volte i criteri i) e ii) di pag. 134. Inoltre, si ha lim f (x, y) = 0 . f (x, y) =
(x,y)→(0,0)
Infatti x4 + y 4 ≤ x4 + 2x2 y 2 + y 4 = (x2 + y 2 )2 e, facendo riferimento alla definizione di limite, 4 x + y4 √ 2 2 se 0 < x < ε ; x2 + y 2 ≤ x + y < ε √ dunque la condizione `e verificata con δ = ε. ii) Verifichiamo che lim
(x,y)→(0,0)
|x| + |y| = +∞ . x2 + y 2
Osserviamo che x2 + y 2 ≤ x2 + 2|x| |y| + y 2 = (|x| + |y|)2 da cui x ≤ |x| + |y|. Pertanto 1 |x| + |y| 1 |x| + |y| ≥ , = f (x, y) = 2 x x x x dunque f (x, y) > A se x < 1/A; la condizione di limite `e quindi verificata per δ = 1/A. 2 Una condizione necessaria per l’esistenza del limite (finito o infinito) di una funzione f (x) per x → x0 `e che la funzione ristretta a ogni retta passante per x0 ammetta lo stesso limite. Questa osservazione viene spesso usata per dimostrare la non esistenza di un limite. Esempio 4.25 Verifichiamo che la funzione f (x, y) =
x3 + y 2 x2 + y 2
4.5 Continuit` a e limiti
137
non ammette limite per (x, y) → (0, 0). Infatti, se esistesse, finito o infinito, f (x, y) , L= lim (x,y)→(0,0)
si dovrebbe necessariamente avere L = lim f (x, 0) = lim f (0, y) . x→0
y→0
Ma f (x, 0) = x, dunque lim f (x, 0) = 0 mentre f (0, y) = 1 per ogni y = 0, x→0
2
dunque lim f (0, y) = 1 . y→0
Non si deve tuttavia pensare che lo studio del comportamento di una funzione ristretta alle rette passanti per x0 sia sufficiente per lo studio del limite. Infatti, le rette rappresentano soltanto uno degli infiniti modi con cui ci si pu` o avvicinare al punto x0 . Due diversi legami tra le variabili indipendenti possono dare luogo a comportamenti completamente diversi della funzione. Esempio 4.26 Si consideri la funzione
xex/y se y = 0 , 0 se y = 0 , e si voglia studiarne il limite nell’origine. Essa tende a 0 su ogni retta passante per l’origine. Infatti, lim f (x, 0) = lim f (0, y) = 0 f (x, y) =
x→0
y→0
in quanto la funzione `e identicamente nulla sugli assi coordinati; altrimenti, se y = kx con k = 0, si ha lim f (x, kx) = lim xek = 0 .
x→0
x→0
2
Tuttavia, sull’arco di parabola y = x , x > 0, la funzione tende all’infinito in quanto lim f (x, x2 ) = lim+ xe1/x = +∞ .
x→0+
x→0
Pertanto la funzione non ha limite per (x, y) → (0, 0).
2
` possibile dimostrare (vedasi l’Osservazione 4.34 per maggiori dettagli) che E una funzione di pi` u variabili ammette limite per x tendente a x0 se e solo se,
x0
x0
Figura 4.12. Vari modi di avvicinarsi al punto x0
x0
138
4 Funzioni tra spazi euclidei
muovendosi lungo un qualunque cammino passante per x0 si ha lo stesso comportamento limite (vedasi la Figura 4.12 per alcuni esempi di tali cammini). Come mostrano gli esempi precedenti, se ci`o non si verifica si pu` o concludere che la funzione non ha limite. Per funzioni di due variabili, un’utile condizione sufficiente per studiare l’esistenza di un limite si basa sulla rappresentazione delle variabili indipendenti in coordinate polari, ossia x = x0 + r cos θ ,
y = y0 + r sin θ .
Proposizione 4.27 Supponiamo che esista ∈ R e una funzione g della sola variabile r tale che in un intorno di (x0 , y0 ), si abbia |f (x0 + r cos θ , y0 + r sin θ) − | ≤ g(r)
con
lim g(r) = 0 .
r→0+
Allora si ha lim
f (x, y) = .
(x,y)→(x0 ,y0 )
Esempi 4.28 i) Il criterio appena visto permette uno studio pi` u semplice del limite gi` a considerato nell’Esempio 4.24 i). Infatti, r4 sin4 θ + r4 cos4 θ = r2 (sin4 θ + cos4 θ) r2 ≤ r2 (sin2 θ + cos2 θ) = r2 ricordando che | sin θ| ≤ 1 e | cos θ| ≤ 1. Dunque |f (r cos θ, r sin θ)| ≤ r2 e il criterio si applica con g(r) = r2 . f (r cos θ, r sin θ) =
ii) Si consideri il limite x log y . 2 (x,y)→(0,1) x + (y − 1)2 lim
Si ha f (r cos θ, 1 + r sin θ) =
r cos θ log(1 + r sin θ) = cos θ log(1 + r sin θ) . r
Ricordando che log(1 + t) =1 t risulta, per t sufficientemente piccolo, log(1 + t) ≤ 2, t ossia | log(1 + t)| ≤ 2|t|. lim
t→0
4.5 Continuit` a e limiti
Pertanto, abbiamo |f (r cos θ, 1 + r sin θ)| = | cos θ log(1 + r sin θ)| ≤ 2r| sin θ cos θ| ≤ 2r . Il criterio si applica con g(r) = 2r e risulta x log y = 0. lim (x,y)→(0,1) x2 + (y − 1)2
139
2
` interessante studiare anche il comportamento di una funzione quando la norE ma della variabile indipendente tende all’infinito. Poich´e non esiste un ordinamento naturale su Rn per n ≥ 2, in genere non si discrimina sul modo con cui l’argomento della funzione si allontana indefinitamente dall’origine. La situazione `e diversa dal caso monodimensionale, in cui spesso si `e distinto tra limite per x → +∞ e limite per x → −∞. In pi` u dimensioni si utilizza un solo “punto” all’infinito, indicato con ∞. Gli intorni di tale punto sono definiti come BR (∞) = {x ∈ Rn : x > R}
con R > 0 .
Si noti che ciascuno di essi `e il complementare dell’intorno chiuso B R (0) di centro l’origine e di raggio R. Con tale nozione, le definizioni di limite (finito o infinito) assumono la solita forma. Ad esempio, sia f una funzione il cui dominio sia un insieme non limitato di Rn ; diciamo che f ha limite ∈ Rm per x tendente a ∞, e scriviamo lim f (x) = ∈ Rm ,
x→∞
se per ogni ε > 0, esiste un R > 0 tale che ∀x ∈ dom f ,
x > R
∀x ∈ dom f ,
x ∈ BR (∞)
⇒
f (x) − < ε ,
vale a dire ⇒
f (x) ∈ Bε () .
Consideriamo infine i limiti infiniti. Nel caso scalare, si dice che f ha limite +∞ (o tende a +∞) per x tendente a x0 , e si scrive lim f (x) = +∞,
x→x0
se per ogni R > 0 esiste un δ > 0 tale che ∀x ∈ dom f,
0 < x − x0 < δ
⇒
f (x) > R ,
vale a dire ∀x ∈ dom f,
x ∈ Bδ (x0 ) \ {x0 }
⇒
f (x) ∈ BR (+∞).
(4.22)
140
4 Funzioni tra spazi euclidei
Le definizioni di lim f (x) = −∞
x→x0
e
lim f (x) = −∞
x→∞
si ottengono dalle precedenti sostituendo la condizione f (x) > R con f (x) < −R. Nel caso vettoriale, si ha limite infinito quando almeno una delle componenti della funzione f tende a ∞. Anche in questo caso, non si discrimina sul modo con cui la norma di f diventa arbitrariamente grande. Precisamente, si dice che f ha limite ∞ (o tende a ∞) per x tendente a x0 , e si scrive lim f (x) = ∞,
x→x0
se lim f (x) = +∞ .
x→x0
In modo simile si definisce lim f (x) = ∞ .
x→∞
4.5.1 Propriet` a dei limiti e della continuit` a I principali teoremi sui limiti delle funzioni reali di una variabile reale, presentati nel Vol. 1, Capitolo 4, valgono anche per funzioni reali di pi` u variabili reali. Pi` u precisamente, valgono il Teorema di unicit` a del limite, il Teorema di permanenza del segno, i Teoremi del confronto e i loro corollari, l’Algebra del limiti con il relativo studio delle forme di indeterminazione di tipo algebrico. Ovviamente i limiti sono da considerarsi per x → c dove c indica un punto x0 ∈ Rn oppure ∞. Anche per le funzioni di pi` u variabili possono essere usati i simboli di Landau per descrivere il loro comportamento locale. Le definizioni e le propriet` a dei simboli O, o, , ∼, essendo date mediante limiti, si estendono a questa situazione. Ad esempio, l’espressione f (x) = o(x) per x → 0 significa che lim
x→0
f (x) = 0. x
Una funzione che soddisfa tale propriet` a, ad esempio, `e f (x, y) = 2x2 − 5y 3 . Anche alcuni teoremi globali sulle funzioni continue, visti nel Vol. I, § 4.3, trovano il loro corrispettivo per le funzioni scalari di pi` u variabili. Ad esempio, il Teorema di esistenza degli zeri si enuncia in questo modo. Teorema 4.29 Sia f una funzione continua su una regione R ⊆ Rn . Se f assume in R tanto valori strettamente positivi quanto valori strettamente negativi, allora necessariamente si annulla in R.
4.6 Curve in Rm
Dim.
141
Se a, b ∈ R sono tali che f (a) < 0 e f (b) > 0, e se P [a, . . . , b] `e una qualunque poligonale contenuta in R congiungente a e b, allora f ristretta a P [a, . . . , b] `e una funzione dipendente da una variabile, che soddisfa il Teorema di esistenza degli zeri monodimensionale. Dunque esiste x0 ∈ P [a, . . . , b] tale che f (x0 ) = 0. 2
Dal teorema precedente segue, come nel caso monodimensionale, il Teorema dei valori intermedi. Vale inoltre il Teorema di Weierstrass, che enunceremo nel § 5.6, Teorema 5.24. Per le funzioni a valori in Rm , m ≥ 1, valgono i teoremi sui limiti che hanno senso per le grandezze vettoriali (ad esempio il Teorema di unicit`a del limite e quello sul limite di una somma algebrica di funzioni, ma non quelli del confronto). Inoltre, vale il Teorema di sostituzione nei limiti, del tutto analogo a quello monodimensionale (Vol. I, Teorema 4.15); esso d`a luogo, per le funzioni continue, al risultato di continuit` a della funzione composta, gi` a citato nella Proposizione 4.22. Esempi 4.30 i) Si ha lim
1
e− |x|+|y| = 1 .
(x,y)→∞ 1 Infatti, per (x, y) → ∞ si ha |x| + |y| → +∞ e dunque t = − |x|+|y| → 0; pertanto, il risultato segue dalla continuit` a della funzione esponenziale t → et nell’origine.
ii) Mostriamo che x4 + y 4 = +∞ . (x,y)→∞ x2 + y 2 Il risultato `e conseguenza della disuguaglianza x4 + y 4 1 ≥ x2 , ∀x ∈ R2 , x = 0 , (4.23) x2 + y 2 4 e del Teorema del confronto, in quanto ovviamente (x, y) → ∞ equivale a x → +∞. Per ottenere la (4.23), osserviamo che, se x2 ≥ y 2 , si ha x2 = x2 + y 2 ≤ 2x2 e dunque x4 + y 4 x4 1 1 ≥ = x2 ≥ x2 ; x2 + y 2 2x2 2 4 2 2 2 allo stesso risultato si perviene se y ≥ x lim
4.6 Curve in Rm Una curva descrive, ad esempio, il modo di percorrere il bordo di una regione piana quale un poligono o un ellisse, oppure la traiettoria determinata dal movimento
142
4 Funzioni tra spazi euclidei
in funzione del tempo di un punto materiale sotto l’effetto di una forza ad esso applicata. Come vedremo nel Capitolo 9, `e possibile definire un calcolo integrale sulle curve. Ci` o permetter`a, ad esempio, di esprimere matematicamente il concetto fisico di lavoro. Iniziamo con la definizione di curva. Sia I un qualunque intervallo della retta reale e sia γ : I → Rm una funzione. Indichiamo con γ(t) = xi (t) 1≤i≤m = m xi (t)ei ∈ Rm il punto immagine di t ∈ I attraverso γ. i=1
Definizione 4.31 Una funzione continua γ : I ⊆ R → Rm dicesi curva. L’immagine Γ = γ(I) ⊆ Rm viene detta sostegno della curva. Se il sostegno della curva giace su un piano, diremo che la curva `e piana. I casi pi` u comuni di curve sono le curve nel piano (m = 2), che indicheremo con γ(t) = x(t), y(t) = x(t) i + y(t) j , e le curve nello spazio (m = 3), che indicheremo con γ(t) = x(t), y(t), z(t) = x(t) i + y(t) j + z(t) k . Sottolineiamo la differenza tra una curva, che `e una funzione di variabile reale, ed il sostegno di una curva, che `e un insieme nello spazio euclideo Rm . Una curva definisce un modo di parametrizzare il suo sostegno associando ad ogni valore del parametro t ∈ I uno e un solo punto del sostegno. Tuttavia l’insieme Γ pu` o essere il sostegno di curve diverse, ovvero pu` o essere parametrizzato in modi diversi. Ad esempio la curva piana γ(t) = (t, t) con t ∈ [0, 1] ha come sostegno il segmento di estremi A = (0, 0) e B = (1, 1). Tale segmento `e anche il sostegno della curva δ(t) = (t2 , t2 ), t ∈ [0, 1]; le curve γ e δ costituiscono due parametrizzazioni del segmento AB. Il punto medio di AB, ad esempio, `e individuato dal parametro √ 2 1 t = 2 nel primo caso e t = 2 nel secondo. La curva γ si dice semplice se γ `e un’applicazione iniettiva, ossia se valori diversi del parametro individuano punti diversi del sostegno. Se l’intervallo I = [a, b] `e chiuso e limitato, come negli esempi precedenti, la curva γ si chiamer`a arco. Chiameremo estremi dell’arco i punti P0 = γ(a) e P1 = γ(b); precisamente, diremo che P0 `e il punto iniziale e P1 il punto finale dell’arco, oppure che γ congiunge P0 a P1 . Un arco si dice chiuso se i suoi estremi coincidono, ossia se γ(a) = γ(b); ovviamente un arco chiuso non `e una curva semplice. Tuttavia, si parla di arco chiuso e semplice (o arco di Jordan) se il punto γ(a) = γ(b) `e l’unico punto del sostegno ad essere immagine di due valori diversi del parametro. La Figura 4.13 illustra diversi esempi di archi;
4.6 Curve in Rm
143
γ(b)
γ(b) γ(a)
γ(a) = γ(b)
γ(a)
γ(a) = γ(b)
Figura 4.13. Rappresentazione grafica del sostegno Γ = γ([a, b]) di un arco semplice (in alto a sinistra), un arco non semplice (in alto a destra), un arco chiuso e semplice o di Jordan (in basso a sinistra) e un arco chiuso non semplice (in basso a destra)
in particolare, il sostegno dell’arco di Jordan (in basso a sinistra) evidenzia una propriet` a notevole di tali archi, nota come Teorema di Jordan. Teorema 4.32 Se Γ `e il sostegno di un arco piano di Jordan, esso divide il piano in cui giace in due componenti connesse Σi e Σe , ove Σi `e limitata e viene detta l’ interno di Γ , mentre Σe `e illimitata e viene detta l’ esterno dell’arco; inoltre Γ `e la frontiera comune di Σi e Σe . Come per le curve, vi `e differenza concettuale tra un arco e il suo sostegno. Va tuttavia detto che frequentemente si indica con il termine ‘arco’ un sottoinsieme dello spazio euclideo Rm (ad esempio si parla comunemente di ‘arco di circonferenza’); in tal caso viene sottintesa una parametrizzazione dell’oggetto geometrico, solitamente semplice e definita nel modo pi` u naturale. Esempi 4.33 i) La curva piana e semplice t ∈ R , a = 0 , ad − bc c . Infatti, posto x = ha come sostegno la retta di equazione y = x + a a x−b x(t) = at + b e y = y(t) = ct + d, abbiamo t = , da cui a c c ad − bc y = (x − b) + d = x + . a a a γ(t) = (at + b, ct + d) ,
144
4 Funzioni tra spazi euclidei
ii) Sia ϕ : I → R una funzione definita e continua sull’intervallo I; la curva γ(t) = ti + ϕ(t)j , t∈I, ha come sostegno il grafico di ϕ. iii) La curva
γ(t) = x(t), y(t) = (1 + cos t, 3 + sin t) , t ∈ [0, 2π] , ha come sostegno la circonferenza di centro (1, 3) e raggio 1; infatti vale la rela 2 2 zione x(t) − 1 + y(t) − 3 = cos2 t + sin2 t = 1. Si tratta di un arco chiuso e semplice e costituisce il modo pi` u naturale per parametrizzare tale circonferenza percorrendola in senso antiorario a partire dal punto (2, 3). In generale l’arco chiuso e semplice γ(t) = x(t), y(t) = (x0 + r cos t, y0 + r sin t) , t ∈ [0, 2π] , ha come sostegno la circonferenza centrata in (x0 , y0 ) di raggio r. Si osservi che se t varia in un intervallo di tipo [0, 2kπ], con k intero positivo ≥ 2, l’arco ha ancora come sostegno la circonferenza ma essa viene percorsa k volte; dunque l’arco non `e semplice. Se invece t varia nell’intervallo [0, π], la corrispondente curva `e un arco (di circonferenza) semplice ma non chiuso. iv) Similmente, assegnati a, b > 0, l’arco chiuso e semplice γ(t) = x(t), y(t) = (a cos t, b sin t) , t ∈ [0, 2π] , parametrizza l’ellisse centrato nell’origine e con semiassi a e b, avente equazione x2 y2 + = 1. a2 b2 v) La curva γ(t) = x(t), y(t) = (t cos t, t sin t) = t cos t i + t sin t j , t ∈ [0, +∞] , ha come sostegno la spirale rappresentata in Figura 4.14, a sinistra, che viene percorsa in senso antiorario a partire dall’origine. Infatti il punto γ(t) ha distanza dall’origine uguale a x2 (t) + y 2 (t) = t, che cresce al crescere di t. La curva `e semplice. vi) La curva semplice γ(t) = x(t), y(t), z(t) = (cos t, sin t, t) = cos t i + sin t j + t k , t ∈ R, ha come sostegno l’elica circolare rappresentata in Figura 4.14, a destra. Si noti che il sostegno giace sul cilindro infinito di asse coincidente con l’asse z e raggio 1, ovvero l’insieme {(x, y, z) ∈ R3 : x2 + y 2 = 1}. vii) Siano P e Q punti distinti dello spazio Rm , con m ≥ 2 arbitrario. La curva semplice γ(t) = P + (Q − P )t , t ∈ R, ha come sostegno la retta passante per P e Q. Infatti γ(0) = P , γ(1) = Q e il vettore γ(t) − P ha direzione costante essendo parallelo a Q − P .
4.6 Curve in Rm
145
z
y
x
x y
Figura 4.14. Spirale ed elica circolare definite negli Esempi 4.33 v) e vi)
Una pi` u generale parametrizzazione della stessa retta `e data da t − t0 γ(t) = P + (Q − P ) , t ∈ R, t 1 − t0 con t0 = t1 ; in tal caso si ha γ(t0 ) = P , γ(t1 ) = Q.
(4.24) 2
Alcuni degli esempi precedenti presentano curve il cui sostegno `e il luogo dei punti del piano che soddisfano una certa equazione del tipo f (x, y) = c ;
(4.25)
in altri termini, esse sono parametrizzazioni di insiemi di livello della funzione ` possibile, sotto opportune ipotesi su f , partire da una equazione implicita f. E di tipo (4.25), e ottenere da essa una curva γ(t) = x(t), y(t) di soluzioni. Si rimanda per i dettagli al § 7.2. Osservazione 4.34 Come anticipato nel § 4.5, l’esistenza del limite di una funzione f per x tendente a x0 ∈ Rn equivale al fatto che le restrizioni di f a tutti i sostegni di curve passanti per x0 ammettono lo stesso limite; cio`e si pu` o dimostrare che lim f (x) = ⇐⇒ lim f γ(t) = x→x0
t→t0
per ogni curva γ : I → dom f , tale che γ(t0 ) = x0 per un certo t0 ∈ I.
2
Curve in coordinate polari, cilindriche e sferiche La rappresentazione di una curva in termini di coordinate cartesiane, vista finora, non `e l’unica possibile. Talvolta `e pi` u conveniente ricorrere alla rappresentazione in coordinate polari in dimensione 2 e in coordinate cilindriche o sferiche in dimensione 3 (tali coordinate, gi` a introdotte nel Vol. I, § 8.1, saranno riprese nel § 6.6.1).
146
4 Funzioni tra spazi euclidei
Precisamente, una curva nel piano R2 pu` o essere definita da una funzione continua γp : I ⊆ R → [0, +∞) × R, ove γp (t) = r(t), θ(t) sono le coordinate polari del punto sul sostegno della curva associato al parametro t. Essa corrisponde alla curva γ(t) = r(t) cos θ(t) i+r(t) sin θ(t) j in coordinate cartesiane. Ad esempio, la spirale dell’Esempio 4.33 v) pu` o essere parametrizzata in coordinate polari da γp (t) = (t, t), con t ∈ [0, +∞). 3 In modo analogo, possiamo rappresentare una curva in R mediante le coor-2 dinate cilindriche come γc (t) = r(t), θ(t), z(t) , con γc : I ⊆ R → [0, +∞) × R continua, oppure mediante le coordinate sferiche come γs (t) = r(t), ϕ(t), θ(t) , con γs : I ⊆ R → [0, +∞) × R2 continua. L’elica circolare dell’Esempio 4.33 vi) pu` o essere descritta come γc (t) = (1, t, t) con t ∈ R, mentre un meridiano sulla sfera unitaria che collega il polo nord al polo sud `e parametrizzato da γs (t) = (1, t, θ0 ) con t ∈ [0, π] e θ0 ∈ [0, 2π] fissato.
4.7 Superfici in R3 Le superfici sono funzioni continue definite su particolari sottoinsiemi di R2 , ossia sulle regioni piane (Definizione 4.15); tali sottoinsiemi svolgono lo stesso ruolo degli intervalli I nella definizione delle curve. Definizione 4.35 Sia R ⊆ R2 una regione. Una funzione continua σ : R → R3 dicesi superficie. L’immagine Σ = σ(R) ⊆ R3 `e detta sostegno della superficie. Indicheremo solitamente con (u, v) le variabili indipendenti in R, e con σ(u, v) = x(u, v), y(u, v), z(u, v) = x(u, v)i + y(u, v)j + z(u, v)k la rappresentazione cartesiana di σ. Una superficie dicesi semplice se la restrizione di σ all’interno della regione R `e iniettiva. Una superficie `e una calotta se `e definita su una regione compatta R. Il concetto di calotta `e l’analogo per le superfici del concetto di arco per le curve. Esempi 4.36 i) Siano a, b ∈ R3 due vettori tali che a ∧ b = 0, e sia c ∈ R3 un terzo vettore. La superficie σ : R2 → R3 data da σ(u, v) = au + bv + c = (a1 u + b1 v + c1 )i + (a2 u + b2 v + c2 )j + (a3 u + b3 v + c3 )k costituisce la parametrizzazione del piano Π passante per il punto c e parallelo ai vettori a e b (si veda la Figura 4.15, a sinistra).
4.7 Superfici in R3
147
z
z Π
a
c y
y
b x x
Figura 4.15. Rappresentazione del piano Π (a sinistra) e della semisfera (a destra) relativi agli Esempi 4.36 i) e ii)
Per determinare l’equazione cartesiana di tale piano, poniamo x = (x, y, z) = σ(u, v) ed osserviamo che si ha x − c = au + bv , ossia il vettore x − c `e una combinazione lineare dei vettori a e b. Pertanto, ricordando la (4.7), si ha (a ∧ b) · (x − c) = (a ∧ b) · a u + (a ∧ b) · b v = 0 ossia (a ∧ b) · x = (a ∧ b) · c . Ne segue che il piano in questione ha equazione αx + βy + γz = δ , dove α, β e γ sono le componenti del vettore a ∧ b, mentre δ = (a ∧ b) · c. ii) Ogni funzione scalare continua ϕ : R → R, definita su una regione del piano, definisce la superficie σ : R → R3 σ(u, v) = ui + vj + ϕ(u, v)k , il cui sostegno `e il grafico di ϕ. Una tale superficie dicesi superficie cartesiana o topografica (rispetto all’asse z). Ad esempio, la superficie σ : R = {(u, v) ∈ R2 : u2 + v 2 ≤ 1} → R3 , σ(u, v) = ui + vj + 1 − u2 − v 2 k ha come sostegno l’emisfero superiore della sfera di centro l’origine e raggio unitario (Figura 4.15, a destra). Superfici cartesiane rispetto agli assi x oppure y si ottengono in modo ovvio permutando tra loro le componenti u, v, ϕ(u, v) di σ. iii) Sia γ : I ⊆ R → R3 una curva piana data da γ(t) = γ1 (t), 0, γ3 (t) con γ1 (t) ≥ 0 per ogni t ∈ I; dunque, il suo sostegno Γ giace nel semipiano xz con x ≥ 0.
148
4 Funzioni tra spazi euclidei
Facendo ruotare Γ attorno all’asse z, si ottiene il sostegno Σ della superficie σ : I × [0, 2π] → R3 data da σ(u, v) = γ1 (u) cos v i + γ1 (u) sin v j + γ3 (u)k . Chiameremo superficie di rotazione (attorno all’asse z) una superficie ottenuta in questo modo. L’arco di curva che la genera si chiama arco meridiano. Ad esempio, facendo ruotare attorno all’asse z l’arco di parabola Γ parametrizzata da γ : [−1, 1] → R3 , γ(t) = (4 − t2 , 0, t), otteniamo la superficie laterale di un plinto, come mostrato in Figura 4.16, a sinistra. Analoghe superfici possono essere definite mediante rotazione attorno ad uno degli assi x o y. iv) La funzione vettoriale σ(u, v) = (x0 + r sin u cos v)i + (y0 + r sin u sin v)j + (z0 + r cos u)k definita su R = [0, π] × [0, 2π] `e una calotta avente come sostegno la superficie sferica di centro x0 = (x0 , y0 , z0 ) e raggio r > 0. Pi` u in generale, la superficie dell’ellissoide centrato in x0 e avente semiassi a, b, c > 0, definita dall’equazione cartesiana (x − x0 )2 (y − y0 )2 (z − z0 )2 + + = 1, a2 b2 c2 `e parametrizzata da σ(u, v) = (x0 + a sin u cos v)i + (y0 + b sin u sin v)j + (z0 + c cos u)k . v) L’applicazione σ : R → R3 data da σ(u, v) = u cos v i + u sin vj + vk con R = [0, 1] × [0, 4π] definisce una calotta che ha come sostegno la “rampa” ideale di un parcheggio a tre piani, rappresentato in Figura 4.16, a destra. Il nome elicoide `e comunemente utilizzato per tale superficie definita su R = [0, 1] × R. Tutte le superfici considerate negli esempi precedenti sono semplici. 2 Nel § 7.2, forniremo delle condizioni sufficienti affinch´e una equazione implicita della forma f (x, y, z) = c individui il sostegno di una superficie, che localmente `e di tipo cartesiano. Come per le curve, anche per le superfici esiste una rappresentazione alternativa che fa uso delle coordinate cilindriche oppure sferiche. Ad esempio, la superficie laterale di un cilindro infinito con asse coincidente con l’asse z e raggio 1 si pa3 rametrizza in coordinate cilindriche mediante σc : [0, 2π] × R → R , σc (u, v) = r(u, v), θ(u, v), z(u, v) = (1, u, v). Analogamente, la superficie della sfera unitaria di centro l’origine si parametrizza in coordinate sferiche mediante σs : [0, π] × [0, 2π] → R3 , con σs (u, v) = r(u, v), ϕ(u, v), θ(u, v) = (1, u, v). Le superfici di rotazione considerate nell’Esempio 4.36 iii) si parametrizzano in coordinate cilindriche mediante σc : I × [0, 2π] → R3 , con σc (u, v) = γ1 (u), v, γ3 (u) .
4.8 Esercizi
149
z z
γ
y
x
y x
Figura 4.16. Rappresentazione di un plinto (a sinistra) e di un elicoide (a destra) relativi agli Esempi 4.36 iii) e v)
4.8 Esercizi 1. Determinare l’interno, la chiusura e la frontiera dei seguenti insiemi. Si specifichi inoltre se si tratta di insiemi aperti, chiusi, connessi, convessi o limitati: a) A = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, 0 < y < 1} b) B = B2 (0) \ ([−1, 1] × {0}) ∪ (−1, 1) × {3} c)
C = {(x, y) ∈ R2 : |y| > 2}
2. Determinare il dominio delle seguenti funzioni: x − 3y + 7 x − y2 b) f (x, y) = 1 − 3xy a) f (x, y) =
c)
f (x, y) =
1 3x + y + 1 − √ 2y − x
d) f (x, y, z) = log(x2 + y 2 + z 2 − 9) x y , − e) f (x, y) = x2 + y 2 x2 + y 2
log z f) f (x, y, z) = arctan y, x √ √ 3 g) γ(t) = (t , t − 1, 5 − t)
150
4 Funzioni tra spazi euclidei
t−2 2 h) γ(t) = , log(9 − t ) t+2 i) σ(u, v) = log(1 − u2 − v 2 ), u, )
σ(u, v) =
√
u + v,
2 4 − u2 − v
1 u2 + v 2 ,v 2
3. Dire se esistono e, in caso affermativo, calcolare i seguenti limiti: xy xy a) lim b) lim 2 (x,y)→(0,0) (x,y)→(0,0) x + y 2 x2 + y 2 c)
x log(1 + x) (x,y)→(0,0) y
d)
3x2 y (x,y)→(0,0) x2 + y 2
e)
x2 y (x,y)→(0,0) x4 + y 2
f)
xy + yz 2 + xz 2 (x,y,z)→(0,0,0) x2 + y 2 + z 4
h)
x2 − x3 + y 2 + y 3 x2 + y 2 (x,y)→(0,0)
g) i) m)
lim
lim
x2 (x,y)→(0,0) x2 + y 2 x−y lim (x,y)→(0,0) x + y lim
lim
lim
lim
)
lim
(x2 + y 2 ) log(x2 + y 2 ) + 5
(x,y)→(0,0)
x2 + y + 1 (x,y)→∞ x2 + y 4 lim
n)
1 + 3x2 + 5y 2 x2 + y 2 (x,y)→∞ lim
4. Determinare l’insieme dei punti di continuit` a delle seguenti funzioni: xyz a) f (x, y) = arcsin(xy − x − 2y) b) f (x, y, z) = 2 x + y2 − z 5. Studiare, al variare del parametro reale α ≥ 0, la continuit` a della funzione: ! f (x, y) =
|x|α 0
sin y x2 + y 2
se (x, y) = (0, 0) , se (x, y) = (0, 0) .
6. I cilindri z = x2 e z = 4y 2 si intersecano lungo i sostegni di due curve. Trovare una parametrizzazione di quello che passa per il punto (2, −1, 4). 7. Parametrizzare mediante una curva l’insieme intersezione tra il piano x + y + z = 1 e il cilindro z = x2 . 8. Parametrizzare mediante una curva l’insieme intersezione delle superfici x2 + y 2 = 16 e z = x + y.
4.8 Esercizi
151
9. Data la curva in coordinate polari γ(t) = r(t), θ(t) , t ∈ [0, 2π], trovarne una parametrizzazione in coordinate cartesiane nei seguenti casi: t a) γ(t) = (sin2 t, t) b) γ(t) = sin , t 2 10. Eliminare i parametri u e v in modo da ottenere un’equazione cartesiana in x, y, z che rappresenti il sostegno della superficie indicata: a) σ(u, v) = au cos vi + bu sin vj + u2 k , paraboloide ellittico b) σ(u, v) = ui + a sin vj + a cos vk , cilindro c)
a, b ∈ R a∈R
σ(u, v) = (a + b cos u) sin vi + (a + b cos u) cos vj + b sin uk , 0 < b < a toro
4.8.1 Soluzioni 1. Propriet` a di insiemi: a) L’interno di A `e l’insieme ◦
A = {(x, y) ∈ R2 : 0 < x < 1, 0 < y < 1} ossia il quadrato aperto (0, 1)2 . La chiusura di A `e l’insieme A = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, 0 ≤ y ≤ 1} ossia il quadrato chiuso [0, 1]2 . La frontiera di A `e l’insieme ∂A = {(x, y) ∈ R2 : x = 0 oppure x = 1, 0 ≤ y ≤ 1} ∪ ∪{(x, y) ∈ R2 : y = 0 oppure y = 1, 0 ≤ x ≤ 1} ossia `e l’unione dei quattro segmenti che costituiscono la frontiera del quadrato [0, 1]2 . Pertanto A non `e n´e aperto n´e chiuso ma `e connesso, convesso e limitato. Si veda la Figura 4.17, a sinistra. b) L’interno di B `e l’insieme ◦
B = B2 (0) \ ([−1, 1] × {0}) ; la chiusura di B `e l’insieme B = B2 (0) ∪ [−1, 1] × {3} ;
152
4 Funzioni tra spazi euclidei y
y 3
A
1
y B 2
1
x
−1
1
2
C
x
x −2
Figura 4.17. Rappresentazione grafica degli insiemi A, B e C relativi all’Esercizio 1
la frontiera di B `e l’insieme ∂B = {(x, y) ∈ R2 : x2 + y 2 = 2} ∪ ([−1, 1] × {0}) ∪ ([−1, 1] × {3}) . L’insieme B non `e n´e aperto n´e chiuso; non `e n´e connesso n´e convesso ma `e limitato. Si veda la Figura 4.17, al centro. c) L’interno di C coincide con C; la sua chiusura `e l’insieme C = {(x, y) ∈ R2 : |y| ≥ 2} ; la sua frontiera `e l’insieme ∂C = {(x, y) ∈ R2 : y = ±2} . Pertanto, l’insieme C `e aperto ma non `e n´e connesso n´e convesso n´e limitato. Si veda la Figura 4.17, a destra. 2. Dominio di funzioni: a) Il dominio `e l’insieme {(x, y) ∈ R2 : x = y 2 }, ossia l’insieme di tutti i punti del piano esclusi quelli appartenenti alla parabola di equazione x = y 2 . b) La funzione `e definita dove l’argomento della radice `e ≥ 0; dunque il dominio `e l’insieme {(x, y) ∈ R2 : y ≤
1 1 se x > 0, y ≥ se x < 0, y ∈ R se x = 0} 3x 3x
ossia l’insieme dei punti del piano compresi tra i due rami dell’iperbole y =
1 3x .
c) La funzione `e definita quando 3x + y + 1 ≥ 0 e 2y − x > 0; ossia il dominio `e l’insieme {(x, y) ∈ R2 : y ≥ −3x − 1} ∩ {(x, y) ∈ R2 : y > Esso `e rappresentato nella Figura 4.18 .
x }. 2
4.8 Esercizi
153
y = −3x − 1 y=
x 2
Figura 4.18. Rappresentazione grafica del dominio della funzione f (x, y) √ 1 3x + y + 1 − √x−2y
=
d) La funzione `e definita dove l’argomento del logaritmo `e > 0; pertanto il dominio `e l’insieme {(x, y, z) ∈ R3 : x2 + y 2 + x2 > 9} ,
e) f)
g) h)
i)
)
ossia l’insieme dei punti del piano esterni alla sfera di centro l’origine e di raggio 3. dom f = R2 \ {0} . La funzione `e definita per z > 0 e x = 0; non vi sono limitazione su y. Pertanto, il dominio `e l’insieme in R3 corrispondente al semispazio z > 0 privato del semipiano x = 0. dom γ = I = [1, 5] . t−2 e y(t) = log(9 − t2 ) della curva sono definite Le componenti x(t) = t+2 rispettivamente per t = −2 e t ∈ (−3, 3). Pertanto la curva γ `e definita sui due intervalli I1 = (−3, −2) e I2 = (−2, 3). La superficie `e definita per 0 < u2 + v 2 < 1, ossia in tutti i punti del piano uv contenuti nel cerchio unitario con centro nell’origine, privato dell’origine stessa e della frontiera. Il dominio di σ `e dom σ = {(u, v) ∈ R2 : u + v ≥ 0, u2 + v 2 = 4}. Si veda la Figura 4.19 per una sua rappresentazione grafica.
3. Calcolo di limiti: a) Osserviamo che |x| = da cui
Pertanto
√
x2 ≤
x2 + y 2 ,
|x| ≤ 1. x2 + y 2 |x| |y| ≤ |y| |f (x, y)| = x2 + y 2
154
4 Funzioni tra spazi euclidei y
x
2
Figura 4.19. Dominio della superficie σ relativa all’Esercizio 2. )
e, per il Teorema del doppio confronto, possiamo concludere che il limite assegnato vale 0. xy b) Osserviamo che, se y = 0 oppure x = 0, la funzione f (x, y) = 2 `e idenx + y2 ticamente nulla. Pertanto quando calcoliamo i limiti lungo gli assi coordinati otteniamo 0: lim f (x, 0) = lim f (0, y) = 0 . x→0
y→0
Tuttavia, lungo la retta y = x la funzione vale
1 2
e quindi
1 x2 = . 2 2 x→0 x + x 2
lim f (x, x) = lim
x→0
Possiamo concludere che il limite assegnato non esiste. x c) Calcoliamo la funzione f (x, y) = log(1 + x) lungo le rette y = kx con k = 0; y si ha 1 f (x, kx) = log(1 + x) , k dunque lim f (x, kx) = 0 . x→0
Tuttavia lungo la parabola y = x2 , risulta f (x, x2 ) =
1 x
log(1 + x), ossia
lim f (x, x2 ) = 1 .
x→0
In conclusione, il limite non esiste. d) 0 .
e) Non esiste.
f) Non esiste.
g) Osserviamo che |f (r cos θ, r sin θ)| =
r2 cos2 θ = r cos2 θ ≤ r . r
4.8 Esercizi
155
Dunque, applicando la Proposizione 4.27 con g(r) = r, possiamo concludere che il limite cercato vale 0. h) 1. i) Osserviamo che f (r cos θ, r sin θ) =
cos θ − sin θ , cos θ + sin θ
quindi lim f (r cos θ, r sin θ) =
r→0
cos θ − sin θ ; cos θ + sin θ
pertanto il limite assegnato non esiste. ) 5 . x2 + y + 1 m) Osserviamo che, posto f (x, y) = , si ha x2 + y 4 x2 + 1 x2
e
lim f (x, 0) = 1
e
f (x, 0) =
f (0, y) =
y+1 . y4
Pertanto x→±∞
lim f (0, y) = 0
y→±∞
e si pu` o concludere che il limite assegnato non esiste. n) Osserviamo che 1 + 5(x2 + y 2 ) 1 + 3x2 + 5y 2 0≤ ≤ , ∀(x, y) = (0, 0) . 2 2 x +y x2 + y 2 Posto t = x2 + y 2 , risulta √ 1 + 5(x2 + y 2 ) 1 + 5t = 0; = lim lim t→+∞ x2 + y 2 t (x,y)→∞ pertanto, si ha √ 1 + 3x2 + 5y 2 1 + 5t 0 ≤ lim =0 ≤ lim t→+∞ x2 + y 2 t (x,y)→∞ e dunque il limite cercato vale 0. 4. Insiemi di punti di continuit` a: a) Osserviamo che la funzione `e continua nel suo dominio in quanto composizione di funzioni continue. Per determinare il dominio di f , ricordiamo che la funzione arcsin `e definita quando l’argomento `e compreso tra −1 e 1. Dunque dom f = {(x, y) ∈ R2 : −1 ≤ xy − x − 2y ≤ 1} .
156
4 Funzioni tra spazi euclidei
Rappresentiamo graficamente tale insieme nel piano. Notiamo che i punti della retta x = 2 non appartengono a dom f , come si verifica direttamente. Se x > 2, la condizione −1 + x ≤ (x − 2)y ≤ 1 + x `e equivalente a 1+
1 x−1 x+1 3 = ≤y≤ =1+ , x−2 x−2 x−2 x−2
ovvero appartengono a dom f i punti compresi tra i grafici delle due iperboli 3 1 e y = 1+ . Analogamente, se x < 2, i punti del dominio y = 1+ x−2 x−2 soddisfano la condizione 1+
1 3 ≤y ≤1+ . x−2 x−2
In definitiva, il dominio di f `e rappresentato in Figura 4.20. b) Insieme di continuit` a C = {(x, y, z) ∈ R3 : z = x2 + y 2 }. 5. Calcoliamo il
lim
f (x, y). Utilizzando le coordinate polari, si ha
(x,y)→(0,0)
f (r cos θ, r sin θ) = rα−2 | cos θ|α sin(r sin θ) ; ricordando la disuguaglianza | sin t| ≤ |t|, valida per ogni t ∈ R, si ha |f (r cos θ, r sin θ)| ≤ rα−1 | cos θ|α | sin θ| ; pertanto il limite cercato `e nullo se α > 1, non esiste se α ≤ 1. Dunque la funzione `e continua in R2 se α > 1, `e continua in R2 \ {0} se 0 ≤ α ≤ 1.
y y =1+
1 x−2
1
x
2 y =1+
3 x−2
Figura 4.20. Insieme dei punti di continuit` a della funzione f (x, y) = arcsin(xy − x − 2y)
4.8 Esercizi
157
z
y x Figura 4.21. Intersezione dei cilindri z = x2 e z = 4y 2
6. Impostando il sistema
z = x2 z = 4y 2
si ottiene x2 = 4y 2 . Pertanto l’intersezione tra i due cilindri ha come proiezione sul piano xy le due rette x = ±2y (si veda la Figura 4.21). Poich´e cerchiamo la parametrizzazione del ramo di intersezione contenente il punto (2, −1, 4), sceglieremo la retta x = −2y. Una possibile parametrizzazione `e data dalla scelta del parametro t = y e quindi γ(t) = (−2t, t, 4t2 ) ,
t ∈ R.
7. Si ha x + y + x2 = 1 e, scegliendo t = x come parametro, si ottiene t ∈ R.
γ(t) = (t, 1 − t − t2 , t2 ) ,
8. Usiamo le coordinate cilindriche ponendo x = 4 cos t, y = 4 sin t. Allora la curva si pu` o parametrizzare come γ(t) = (4 cos t, 4 sin t, 4(cos t + sin t)) ,
t ∈ [0, 2π] .
9. Curve in coordinate cartesiane: a) Si ha r(t) = sin2 t e θ(t) = t; ricordando che x = r cos θ e y = r sin θ si ha x = sin2 t cos t
e
y = sin3 t .
2 o parametrizzare come Pertanto γ : [0, in coordinate cartesiane 2π] → R si pu` 2 3 γ(t) = x(t), y(t) = sin t cos t, sin t . Si veda la Figura 4.22, a sinistra.
158
4 Funzioni tra spazi euclidei y
y √ 2 2
1
x
1
x
−1
√ 2 2
Figura 4.22. Sostegno della curva relativa all’Esercizio 9 a) (a sinistra) e 9 b) (a destra)
b) Si ha γ(t) = sin 2t cos t, sin 2t sin t . La curva `e la cosiddetta cardiode; si veda la Figura 4.22, a destra, per una rappresentazione grafica del suo sostegno. 10. Rappresentazione cartesiana di superfici: a) Si vede immediatamente che x2 y2 + = u2 cos2 v + u2 sin2 v = u2 = z a2 b2 e quindi si ritrova l’equazione cartesiana del paraboloide ellittico. b) y 2 + z 2 = a2 . 2 2 2 c) Si osservi che x + y = (a + b cos u) e che a + b cos u > 0 sempre; dunque x2 + y 2 − a = b cos u . Inoltre 2 x2 + y 2 − a + z 2 = b2 cos2 u + b2 sin2 u = b2 ; in conclusione, si ottiene 2 x2 + y 2 − a + z 2 = b 2 .
5 Calcolo differenziale per funzioni scalari
Dopo aver studiato le propriet` a di continuit` a e il comportamento limite delle funzioni di pi` u variabili reali, dedichiamo questo e i due successivi capitoli alla presentazione del calcolo differenziale. In particolare, in questo capitolo sviluppiamo tale calcolo per le funzioni scalari. La potenza degli strumenti differenziali `e gi` a nota allo studente dal primo corso di Analisi Matematica; la conoscenza delle derivate di una funzione reale di una variabile reale permette di comprenderne sia il comportamento globale, sugli intervalli contenuti nel suo dominio, sia quello locale, sugli intorni via via pi` u piccoli di un punto del dominio. Nel passaggio alla dimensione superiore, gli strumenti del calcolo differenziale si arricchiscono e si adeguano alla maggiore complessit`a delle situazioni possibili. Se da una parte perdono d’importanza alcuni obiettivi (ad esempio, tracciare il grafico di una funzione oppure studiarne la monotonia, legata all’ordinamento totale dei punti della retta reale che non ha corrispondente in pi` u dimensioni), dall’altra nuovi strumenti entrano in campo (in particolare quelli forniti dall’Algebra Lineare) e svolgono un ruolo determinante. Cos`ı, alla derivata prima in una variabile si sostituisce il vettore gradiente in pi` u variabili, e alla derivata seconda si sostituisce la matrice hessiana. Mentre alcuni concetti (quali la stessa differenziabilit` a in un punto) richiedono un’attenzione particolare nella loro definizione a causa della multidimensionalit` a, altri (quali la convessit` ae gli sviluppi di Taylor) si ottengono per trasposizione diretta degli analoghi concetti monodimensionali. Anche lo studio dei punti di estremo, cosiddetti liberi, di una funzione di pi` u variabili reali estende in modo naturale risultati gi` a noti, quali ad esempio i Teoremi di Fermat e Weierstrass, ma introduce nel contempo nuove tipologie di punti stazionari, quali i punti di sella.
5.1 Derivate parziali prime e gradiente La situazione pi` u semplice per introdurre il concetto di derivata parziale in un punto `e quella bidimensionale; iniziamo considerando tale caso.
Canuto C, Tabacco A: Analisi Matematica II. © Springer-Verlag Italia, Milano 2008
160
5 Calcolo differenziale per funzioni scalari
Sia f : dom f ⊆ R2 → R una funzione di due variabili, definita nell’intorno di un punto x0 = (x0 , y0 ). La funzione x → f (x, y0 ), ottenuta fissando il valore della seconda variabile indipendente, `e una funzione reale di variabile reale, definita nell’intorno del punto x0 ∈ R. Se essa `e derivabile in x0 , diciamo che f ammette derivata parziale rispetto a x in x0 e poniamo ∂f f (x, y0 ) − f (x0 , y0 ) d (x0 ) = f (x, y0 ) = lim . x→x0 ∂x dx x − x0 x=x0 Similmente, se la funzione y → f (x0 , y) `e derivabile in y0 , diciamo che f ammette derivata parziale rispetto a y in x0 , e poniamo ∂f f (x0 , y) − f (x0 , y0 ) d (x0 ) = f (x0 , y) = lim . y→y ∂y dy y − y0 0 y=y0 Il significato geometrico delle derivate parziali `e illustrato dalla Figura 5.1. Tali definizioni si generalizzano a funzioni di n variabili, n ≥ 3, in modo naturale. Precisamente, sia data una funzione di n variabili f : dom f ⊆ Rn → R, n definita nell’intorno di un punto x0 = (x01 , . . . , x0n ) = x0i ei , dove ei indica i=1
l’i-esimo versore della base canonica in Rn , introdotta in (4.1). Diciamo che f ammette derivata parziale rispetto a xi in x0 , se la funzione reale di una variabile reale x → f (x01 , . . . , x0,i−1 , x, x0,i+1 , . . . , x0n ) , z
P0
r2
r1
Γ (f )
y x (x, y0 )
(x0 , y0 ) (x0 , y)
Figura 5.1. Le derivate parziali di f in x0 sono i coefficienti angolari delle rette r1 ed r2 tangenti al grafico di f in P0
5.1 Derivate parziali prime e gradiente
161
ottenuta fissando il valore di tutte le variabili indipendenti tranne la i-esima, `e derivabile in x = x0i . In tal caso, poniamo ∂f d f (x01 , . . . , x0,i−1 , x, x0,i+1 , . . . , x0n ) (x0 ) = ∂xi dx x=x0i f (x0 + Δx ei ) − f (x0 ) . = lim Δx→0 Δx
(5.1)
La derivata parziale di f in x0 rispetto alla variabile xi viene anche indicata con uno dei simboli Dxi f (x0 ) ,
Di f (x0 ) ,
fxi (x0 )
(oppure semplicemente fi (x0 ), quando la notazione non genera confusione). Definizione 5.1 Supponiamo che f ammetta derivate parziali in x0 rispetto a tutte le variabili. Definiamo il vettore gradiente di f in x0 , che indichiamo con ∇f (x0 ), ponendo ∇f (x0 ) =
∂f ∂xi
(x0 )
= 1≤i≤n
∂f ∂f (x0 ) e1 + . . . + (x0 ) en ∈ Rn . ∂x1 ∂xn
Tale vettore viene anche indicato con grad f (x0 ). Ricordiamo che, come ogni vettore di Rn , ∇f (x0 ) potr` a essere rappresentato sia come vettore riga sia come vettore colonna. Preciseremo la scelta qualora il contesto lo richieda. Esempi 5.2
i) Sia f (x, y) = x2 + y 2 la funzione distanza dall’origine. Considerando il punto x0 = (2, −1), abbiamo ∂f d 2 x 2 (x0 ) = x + 1 = √ =√ , 2 ∂x dx x=2 5 x + 1 x=2 ∂f d y 1 (x0 ) = 4 + y2 = = −√ . 2 ∂y dy y=−1 5 4 + y y=−1 Pertanto 2 1 1 ∇f (x0 ) = √ , − √ = √ (2, −1) . 5 5 5 ii) Sia f (x, y, z) = y log(2x − 3z). Nel punto x0 = (2, 3, 1), abbiamo ∂f d 2 (x0 ) = 3 log(2x − 3) =3 = 6, ∂x dx 2x − 3 x=2 x=2
162
5 Calcolo differenziale per funzioni scalari
∂f (x0 ) = ∂y ∂f (x0 ) = ∂z
d y log 1 = 0, dy y=3 d −3 3 log(4 − 3z) =3 = −9 , dz 4 − 3z z=1 z=1
e dunque ∇f (x0 ) = (6, 0, −9) . ` iii) Sia f : R → R la funzione affine f (x) = a · x + b, con a ∈ Rn , b ∈ R. E n immediato verificare che in ogni punto x0 ∈ R , si ha n
∇f (x0 ) = a . iv) Sia f una funzione che non dipende dalla variabile xi in un intorno di x0 ∈ ∂f dom f . Allora (x0 ) = 0. ∂xi In particolare, se f `e costante in un intorno di x0 , allora ∇f (x0 ) = 0. 2 La funzione ∂f ∂f : x → (x) , ∂xi ∂xi ∂f ⊆ dom f ⊆ Rn a valori in R, dicesi ∂xi funzione derivata parziale (prima) di f rispetto a xi . La funzione gradiente di f ,
definita in un opportuno sottoinsieme dom
∇f : x → ∇f (x), il cui dominio dom ∇f `e l’intersezione dei domini delle singole derivate parziali prime, `e un esempio di campo vettoriale, essendo essa una funzione definita in un sottoinsieme di Rn a valori in Rn . ∂f Osserviamo che, in pratica, il calcolo di ciascuna derivata parziale si ef∂xi fettua considerando tutte le variabili di f diverse da xi come costanti e derivando la funzione risultante della sola variabile xi . Possiamo dunque applicare a tale funzione tutte le regole di derivazione viste nel primo corso di Analisi Matematica. Esempi 5.3 Riprendiamo gli esempi precedenti. i) Per la funzione f (x, y) = x2 + y 2 , abbiamo x x y = ∇f (x) = , x x2 + y 2 x2 + y 2 con dom ∇f = R2 \ {0}. La formula precedente vale in dimensione n qualunque se f (x) = x `e la funzione norma in Rn .
5.2 Differenziabilit` a e differenziale
163
ii) Per la funzione f (x, y, z) = y log(2x − 3z), abbiamo
−3y 2y , log(2x − 3z), , ∇f (x) = 2x − 3z 2x − 3z con dom ∇f = dom f = {(x, y, z) ∈ R3 : 2x − 3z > 0}. iii) La resistenza totale R prodotta da tre conduttori aventi resistenza rispettivamente R1 , R2 , R3 in un circuito parallelo `e data dalla formula: 1 1 1 1 = + + . R R1 R2 R3 Vogliamo calcolare la derivata parziale di R rispetto ad una delle variabili Ri , ad esempio R1 . Essendo 1 R1 R2 R3 R(R1 , R2 , R3 ) = 1 1 1 = R R +R R +R R , + + 2 3 1 3 1 2 R1 R2 R3 risulta ∂R R22 R32 (R1 , R2 , R3 ) = . 2 ∂R1 (R2 R3 + R1 R3 + R1 R2 )2 Le derivate parziali rispetto alle variabili xi , i = 1, . . . , n, sono casi particolari di derivata direzionale lungo un vettore, che ora introduciamo. Sia f una funzione definita in un intorno di un punto x0 ∈ Rn e sia v ∈ Rn un vettore non nullo fissato. Diciamo che f ammette derivata parziale o direzionale lungo v in x0 se esiste finita la quantit` a ∂f f (x0 + tv) − f (x0 ) (x0 ) = lim . t→0 ∂v t
(5.2)
Un altro simbolo usato per tale espressione `e Dv f (x0 ). La condizione precedente esprime la derivabilit` a in t0 = 0 della funzione t → f (x0 + tv) (definita in tutto un intorno di t0 = 0 in quanto se t `e abbastanza piccolo, x0 + tv sta nell’intorno di x0 in cui f `e definita). Si veda la Figura 5.2 per l’interpretazione geometrica della derivata direzionale. La derivata parziale di f in x0 rispetto a xi si ottiene ponendo v = ei ; si ha cio`e ∂f ∂f (x0 ) = (x0 ), i = 1, . . . , n , ∂ei ∂xi come segue immediatamente confrontando la (5.2) con la (5.1) in cui si ponga Δx = t. Nel prossimo paragrafo, esprimeremo le derivate direzionali mediante il gradiente, per le funzioni aventi la propriet` a di differenziabilit` a.
5.2 Differenziabilit` a e differenziale Ricordiamo (Vol. I, § 6.6) che se una funzione reale di variabile reale f `e derivabile in un punto x0 ∈ R, allora vale la prima formula dell’incremento finito
164
5 Calcolo differenziale per funzioni scalari z r Γ (f ) P0
y x
x0
x0 + tv
Figura 5.2. La derivata direzionale `e il coefficiente angolare della retta r tangente al grafico di f in P0
f (x) = f (x0 ) + f (x0 )(x − x0 ) + o(x − x0 ) ,
x → x0 .
(5.3)
La validit` a di tale formula `e in realt` a equivalente alla derivabilit` a di f in x0 , nel senso che se esiste un numero a ∈ R tale che f (x) = f (x0 ) + a (x − x0 ) + o(x − x0 ) ,
x → x0 ,
allora necessariamente f `e derivabile in x0 e a = f (x0 ). Inoltre, dal punto di vista geometrico, la derivabilit` a in x0 equivale all’esistenza della retta tangente al grafico di f in P0 = x0 , f (x0 ) , la cui equazione `e y = t(x) = f (x0 ) + f (x0 )(x − x0 ) . In pi` u variabili, la situazione `e pi` u articolata e l’esistenza del gradiente di f in x0 non assicura n´e la validit` a di una formula analoga alla (5.3), cio`e f (x) = f (x0 ) + ∇f (x0 ) · (x − x0 ) + o(x − x0 ) ,
x → x0 ,
(5.4)
n´e l’esistenza del piano (o iperpiano, se n > 2) tangente al grafico di f in P0 = x0 , f (x0 ) ∈ Rn+1 . Consideriamo ad esempio la funzione ⎧ 2 ⎪ ⎨ x y se (x, y) = (0, 0) , f (x, y) = x2 + y 2 ⎪ ⎩ 0 se (x, y) = (0, 0) . Tale funzione `e identicamente nulla sugli assi coordinati (f (x, 0) = f (0, y) = 0 per ogni x, y ∈ R) e dunque ∂f ∂f (0, 0) = (0, 0) = 0 , ∂x ∂y
ossia
∇f (0, 0) = (0, 0) .
5.2 Differenziabilit` a e differenziale
165
Se valesse la (5.4), in x0 = (0, 0) si dovrebbe avere x2 y = 0; (x,y)→(0,0) (x2 + y 2 ) x2 + y 2 lim
ma, muovendosi ad esempio sulla retta y = x, si ha lim
x→0±
x3 1 = ± √ = 0 . 2 2 2x |x| 2 2 √
Neppure l’esistenza di tutte le derivate direzionali in x0 assicura la validit` a della (5.4). Infatti `e facile vedere che la stessa funzione f ha derivate direzionali lungo qualunque vettore v. Ha dunque senso porre la seguente definizione. Definizione 5.4 Una funzione f dicesi differenziabile in un punto x0 interno al suo dominio, se esiste ∇f (x0 ) e se vale la formula f (x) = f (x0 ) + ∇f (x0 ) · (x − x0 ) + o(x − x0 ) ,
x → x0 .
(5.5)
Nel caso n = 2, l’equazione z = f (x0 ) + ∇f (x0 ) · (x − x0 ) , ossia z = f (x0 , y0 ) +
∂f ∂f (x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 ) , ∂x ∂y
(5.6)
definisce un piano, che viene detto piano tangente al grafico di f in P0 = x0 , y0 , f (x0 , y0 ) . Esso rappresenta il piano che meglio approssima il grafico di f in un intorno di P0 , vedasi la Figura 5.3. La differenziabilit` a di f in x0 equivale precisamente all’esistenza del piano tangente in P0 . Per n > 2, la (5.6) definisce l’iperpiano (sottospazio affine di codimensione 1, ossia di dimensione n − 1) tangente al grafico di f in P0 = x0 , f (x0 ) . La relazione (5.5) suggerisce un modo naturale per approssimare la funzione f nell’intorno di x0 mediante un polinomio di primo grado in x. Trascurando i termini di ordine superiore, abbiamo infatti f (x) ∼ f (x0 ) + ∇f (x0 ) · (x − x0 ) in un intorno di x0 . Tale processo di approssimazione, detto linearizzazione di f in x0 , permette spesso di semplificare in modo efficace e costruttivo la descrizione matematica di un fenomeno fisico. Un’altra interpretazione della relazione (5.5) `e la seguente: poniamo Δx = x − x0 in tale formula, ottenendo la scrittura equivalente
166
5 Calcolo differenziale per funzioni scalari z
Γ (f ) Π P0
y x
x0
Figura 5.3. Piano tangente al grafico di f in P0
f (x0 + Δx) = f (x0 ) + ∇f (x0 ) · Δx + o(Δx) ,
Δx → 0 ,
vale a dire Δf = f (x0 + Δx) − f (x0 ) = ∇f (x0 ) · Δx + o(Δx) ,
Δx → 0 .
Dunque, l’incremento Δf della variabile dipendente `e, a meno di un infinitesimo di ordine superiore al primo, proporzionale all’incremento Δx della variabile indipendente. Ci` o significa che la funzione lineare Δx → ∇f (x0 ) · Δx fornisce una approssimazione spesso sufficientemente accurata della variazione di f in un intorno di x0 . Per tale motivo, si pone la seguente definizione. Definizione 5.5 L’applicazione lineare dfx0 : Rn → R definita da dfx0 (Δx) = ∇f (x0 ) · Δx dicesi differenziale di f in x0 .
Esempio 5.6
√ Consideriamo 1 + x + y. Posto x0 = (1, 2), si ha 1 1la funzione f (x, y) = ∇f (x0 ) = 4 , 4 e dunque il suo differenziale in x0 `e la funzione 1 1 dfx0 (Δx, Δy) = Δx + Δy . 4 1 1 4 Se, ad esempio, scegliamo (Δx, Δy) = 100 , 20 , avremo 1 1 203 − 2 = 0.014944 . . . mentre dfx0 , = 0.015 . 2 Δf = 50 100 20
5.2 Differenziabilit` a e differenziale
167
Come nel caso monodimensionale la derivabilit`a implica la continuit` a, cos`ı in pi` u variabili la continuit` a `e assicurata dalla differenziabilit` a. Proposizione 5.7 Se f `e differenziabile in x0 , allora `e continua in x0 . Dim.
Si ha, dalla (5.4), lim f (x) = lim
x→x0
x→x0
f (x0 ) + ∇f (x0 ) · (x − x0 ) + o(x − x0 ) = f (x0 ) . 2
Questa propriet` a conferma che il concetto corrispondente alla derivabilit` a in pi` u variabili `e la differenziabilit` a. Per verificare che una funzione `e differenziabile in un punto del suo dominio, in genere si applica la seguente condizione sufficiente. Proposizione 5.8 Supponiamo che f ammetta derivate parziali continue in un intorno di x0 . Allora f `e differenziabile in x0 . Dim.
; Complementi al Cap. 5 .
2
Forniamo ora una ulteriore propriet` a delle funzioni differenziabili. Proposizione 5.9 Se f `e differenziabile in x0 , allora f ammette in x0 derivate direzionali lungo un qualunque vettore v = 0 e si ha ∂f ∂f ∂f (x0 ) = ∇f (x0 ) · v = (x0 ) v1 + · · · + (x0 ) vn . ∂v ∂x1 ∂xn Dim.
(5.7)
Si ha, usando la (5.4), f (x0 + tv) = f (x0 ) + t∇f (x0 ) · v + o(tv) ,
tv → 0 .
Poich´e tv = |t|v, si ha o(tv) = o(t) , t → 0. Pertanto ∂f f (x0 + tv) − f (x0 ) (x0 ) = lim t→0 ∂v t = lim
t→0
t∇f (x0 ) · v + o(t) = ∇f (x0 ) · v . t
Si noti che la (5.7) fornisce le espressioni, talvolta utili, ∂f (x0 ) = ei · ∇f (x0 ), ∂xi
i = 1, . . . , n .
2
168
5 Calcolo differenziale per funzioni scalari
L’espressione (5.7) della derivata direzionale di f permette di stabilire un semplice ma importante risultato sul comportamento della funzione nell’intorno di x0 , qualora il suo gradiente non sia nullo in tale punto. Chiediamoci come varia la derivata direzionale di f in x0 , al variare della direzione e del verso in ∂f (x0 ) quancui si calcola la derivata; in altri termini, studiamo la quantit` a ∂v do v `e un versore (v = 1) di Rn . Dalla (5.7), ricordando la disuguaglianza di Cauchy-Schwarz (4.3), abbiamo ∂f (x0 ) ≤ ∇f (x0 ) ∂v ossia − ∇f (x0 ) ≤
∂f (x0 ) ≤ ∇f (x0 ) ; ∂v
∂f ∇f (x0 ) . Pertanto, (x0 ) `e massima (e ∇f (x0 ) ∂v positiva) o minima (e negativa) a seconda che v sia il versore parallelo a ∇f (x0 ), concorde o discorde con esso. Siamo dunque giunti al seguente risultato, illustrato nella Figura 5.4 (si veda il § 7.2.1 per ulteriori dettagli) .
i due estremi sono raggiunti per v = ±
Proposizione 5.10 Se il gradiente di f non `e nullo in x0 , la massima crescita di f , a partire da x0 , avviene nella direzione del gradiente, mentre la massima decrescita avviene nella direzione opposta a quella del gradiente. Diamo infine una propriet` a utile per il seguito. Nel dimostrare la Proposizione 5.9, abbiamo provato che la funzione ϕ(t) = f (x0 + tv) `e derivabile in t = 0 e si ha ϕ (0) = ∇f (x0 ) · v . (5.8)
+ ∇f (x0 ) v
x0 −∇f (x0 ) −
Figura 5.4. Curve di livello e direzione di massima variazione di una funzione
5.2 Differenziabilit` a e differenziale
169
Pi` u in generale, vale il seguente risultato. Propriet` a 5.11 Siano a, v ∈ Rn punti fissati e supponiamo che f sia differenziabile nel punto a + t0 v, con t0 ∈ R. Allora la funzione ϕ(t) = f (a + tv) `e derivabile in t0 e si ha ϕ (t0 ) = ∇f (a + t0 v) · v . Dim.
(5.9)
Ponendo Δt = t − t0 , si ha a + tv = (a + t0 v) + Δt v e dunque ϕ(t) = f (a + t0 v + Δtv) = ψ(Δt). Si ottiene il risultato applicando la (5.8) alla funzione ψ. 2
Notiamo che la formula (5.9) altro non `e che un caso particolare della regola di derivazione di una funzione composta in pi` u variabili, trattata nel § 6.4. 5.2.1 Teorema di Lagrange e funzioni lipschitziane Siano a , b punti distinti in Rn e sia S[a, b] = {x(t) = (1 − t)a + tb : 0 ≤ t ≤ 1} il segmento di estremi a e b, definito in (4.18). Il seguente risultato `e la versione multidimensionale del noto Teorema di Lagrange per funzioni reali di una variabile reale. Teorema 5.12 (di Lagrange) Sia f : dom f ⊆ Rn → R una funzione definita e continua in ogni punto di S[a, b] e differenziabile in ogni punto di S[a, b] esclusi al pi` u gli estremi a e b. Allora esiste x ∈ S[a, b], diverso da a e b, tale che f (b) − f (a) = ∇f (x) · (b − a) . (5.10) Dim.
Introduciamo la funzione ausiliaria ϕ(t) = f x(t) . Essa risulta definita sull’intervallo [0, 1] ⊂ R e ivi continua in quanto funzione composta della funzione continua t → x(t) e della funzione f continua per ipotesi in ogni x(t). Inoltre, osservando che x(t) = a + t(b − a) e applicando la Propriet` a 5.11 con v = b − a, abbiamo che ϕ `e derivabile (almeno) in (0, 1), con ϕ (t) = ∇f x(t) · (b − a) , 0 < t < 1. Concludiamo che ϕ soddisfa le ipotesi del Teorema di Lagrange sull’intervallo [0, 1] e dunque esiste t ∈ (0, 1) tale che ϕ(1) − ϕ(0) = ϕ (t) . Ponendo x = x(t), questa relazione non `e altro che la (5.10).
2
170
5 Calcolo differenziale per funzioni scalari
Come applicazione di tale teorema, stabiliamo un risultato gi` a noto allo studente in dimensione 1. Proposizione 5.13 Sia R una regione di Rn ed f : R ⊆ Rn → R una ◦
funzione definita e continua in R e differenziabile in ogni punto di A = R. Allora ∇f = 0 in A ⇐⇒ f `e costante in R . Dim.
Abbiamo gi` a osservato che se f `e costante in R, e dunque in A, allora ∇f = 0 in ogni punto di A (Esempio 5.2 iv)). Viceversa, fissiamo un qualunque punto a in A, e sia b un punto arbitrario in R. Esiste allora una poligonale P [a0 , . . . , ar ] con a0 = a e ar = b che congiunge tali punti (ci` o segue direttamente dalla definizione di aperto connesso se b ∈ A, mentre se b ∈ ∂A esso pu`o essere collegato a un punto di A mediante un segmento). Su ciascun segmento S[aj−1 , aj ], 1 ≤ j ≤ r, che compone la poligonale, sono soddisfatte le ipotesi del Teorema 5.12, e dunque dalla (5.10) e dall’ipotesi che ∇f `e identicamente nullo si ha f (aj ) − f (aj−1 ) = 0 , da cui f (b) = f (a) per ogni b ∈ R, cio`e f `e costante.
2
Come conseguenza, si ha che se f `e differenziabile in ogni punto di un aperto A e il suo gradiente `e ivi identicamente nullo, allora f `e costante su ciascuna componente connessa di A. La propriet` a che ora introduciamo `e rilevante in varie applicazioni. Sia R una qualunque regione contenuta in dom f . Definizione 5.14 La funzione f dicesi lipschitziana in R se esiste una costante L ≥ 0 tale che |f (x1 ) − f (x2 )| ≤ Lx1 − x2 ,
∀x1 , x2 ∈ R .
(5.11)
La pi` u piccola costante L per cui vale la relazione precedente dicesi costante di Lipschitz di f in R. Ricordando la definizione di estremo superiore di un insieme, si vede facilmente che la costante di Lipschitz di f in R `e data da sup x1 ,x2 ∈R
x1 =x2
|f (x1 ) − f (x2 )| . x1 − x2
Dire che una funzione f `e lipschitziana in R equivale precisamente ad affermare che tale estremo superiore `e finito.
5.2 Differenziabilit` a e differenziale
171
Esempi 5.15 i) La funzione affine f (x) = a · x + b (con a ∈ Rn , b ∈ R) `e lipschitziana in Rn , come mostra la (4.20). Si dimostra che la sua costante di Lipschitz vale a. ii) La funzione f (x) = x, che associa a x ∈ Rn la sua norma euclidea, `e lipschitziana in Rn con costante di Lipschitz uguale a 1, ossia si ha x1 − x2 ≤ x1 − x2 , ∀x1 , x2 ∈ Rn . Ci`o segue scrivendo x1 = x2 + (x1 − x2 ) e usando la disuguaglianza triangolare (4.4), che fornisce x1 ≤ x2 + x1 − x2 , ossia x1 − x2 ≤ x1 − x2 ; scambiando il ruolo di x1 e x2 si ottiene il risultato. iii) La funzione f (x) = x2 non `e lipschitziana in tutto Rn . Infatti, scegliendo x2 = 0, la (5.11) diventa x1 2 ≤ Lx1 che vale solo se x1 ≤ L. La funzione `e invece lipschitziana in ogni regione R limitata, in quanto x1 2 − x2 2 = x1 + x2 x1 − x2 ≤ 2M x1 − x2 , ∀x1 , x2 ∈ R , avendo posto M = sup{x : x ∈ R} e avendo usato il risultato del punto precedente. 2 Osserviamo che se R `e un insieme aperto, allora la lipschitzianit` a di f ne implica la continuit` a (uniforme) su R. Diamo ora una condizione sufficiente per la lipschitzianit` a di una funzione. Proposizione 5.16 Sia R una regione convessa contenuta in dom f . Se f `e differenziabile in tale insieme e se le sue derivate parziali (prime) sono ivi limitate, allora f `e lipschitziana in R. Precisamente, per ogni M ≥ 0 tale che ∂f ∀x ∈ R, i = 1, . . . , n , ∂xi (x) ≤ M , √ vale la (5.11) con L = n M . Dim.
Siano x1 e x2 ∈ R. Per ipotesi il segmento S[x1 , x2 ] `e contenuto in R ed f `e differenziabile (e dunque continua) in ogni punto di S[x1 , x2 ]. Sono pertanto verificate le ipotesi del Teorema di Lagrange 5.12, e quindi esiste x ∈ R tale che f (x1 ) − f (x2 ) = ∇f (x) · (x1 − x2 ) .
172
5 Calcolo differenziale per funzioni scalari
Usando la disuguaglianza di Cauchy-Schwarz (4.3), si ha |f (x1 ) − f (x2 )| ≤ ∇f (x) x1 − x2 . Il risultato segue osservando che 1/2 n 2 1/2 n ∂f √ ∇f (x) = ≤ M2 = nM . ∂xi (x) i=1
i=1
2
Il risultato della proposizione precedente, ossia il fatto che l’esistenza e la limitatezza delle derivate parziali implichi la lipschitzianit` a della funzione, vale sotto ipotesi pi` u generali; ad esempio, se R `e una regione compatta, oppure se la frontiera di R `e sufficientemente regolare.
5.3 Derivate parziali seconde e matrice hessiana Supponiamo che f sia derivabile rispetto a xi in tutto un intorno di x0 . Se la ∂f funzione `e a sua volta derivabile in x0 rispetto a xj , diciamo che f ammette ∂xi in x0 derivata parziale seconda rispetto a xi e xj ; poniamo allora ∂2f ∂ (x0 ) = ∂xj ∂xi ∂xj
∂f ∂xi
(x0 ) .
Una derivata parziale seconda viene detta mista se j = i, pura se j = i; in ∂2f . Altri modi per indicare una derivata quest’ultimo caso si usa il simbolo ∂x2i parziale seconda sono D2xj xi f (x0 ) ,
D2ji f (x0 ) ,
fxj xi (x0 ) ,
fji (x0 ) .
Nel caso in cui i sia diverso da j, se f ammette in x0 le due derivate parziali ∂2f ∂2f (x0 ) e (x0 ), non `e detto che esse coincidano. Ad esempio, si miste ∂xj ∂xi ∂xi ∂xj pu` o verificare che la funzione ⎧ 2 2 ⎨ x −y xy 2 se (x, y) = (0, 0), f (x, y) = x + y2 ⎩ 0 se (x, y) = (0, 0), ∂2f ∂2f (0, 0) = −1 mentre (0, 0) = 1. ∂y∂x ∂x∂y Il seguente teorema `e importante in quanto fornisce una condizione sufficiente, comunemente verificata, che garantisce l’uguaglianza delle due derivate miste.
`e tale che
5.3 Derivate parziali seconde e matrice hessiana
173
∂2f ∂2f e ∂xj ∂xi ∂xi ∂xj (j = i) esistono in un intorno di x0 e sono continue in x0 , allora in tale punto esse coincidono. Teorema 5.17 (di Schwarz) Se le due derivate miste
Dim.
; Complementi al Cap. 5 .
2
Definizione 5.18 Supponiamo che f possieda tutte le derivate parziali seconde in x0 . La matrice Hf (x0 ) = (hij )1≤i,j≤n
con
hij =
∂2f (x0 ) , ∂xj ∂xi
(5.12)
ossia ⎛
∂2f (x0 ) ∂x21
⎜ ⎜ ⎜ ⎜ ∂2f ⎜ Hf (x0 ) = ⎜ ∂x1 ∂x2 (x0 ) ⎜ ⎜ .. ⎜ ⎝ ∂2f . (x0 ) ∂x1 ∂xn
∂2f (x0 ) ∂x2 ∂x1
...
∂2f (x0 ) ∂x22
...
...
...
⎞ ∂2f (x0 ) ⎟ ∂xn ∂x1 ⎟ ⎟ 2 ∂ f ⎟ (x0 ) ⎟ , ⎟ ∂xn ∂x2 ⎟ ⎟ .. ⎟ . ⎠ ∂2f (x ) 0 ∂x2n
dicesi matrice hessiana di f in x0 . ` piuttosto comune l’uso di indicare la matrice hessiana anche con la notazione E Hf (x0 ). Se le derivate seconde miste sono continue in x0 , allora la matrice Hf (x0 ) `e simmetrica, grazie al Teorema di Schwarz. In tal caso, l’ordine di derivazione nel calcolo di una derivata mista `e ininfluente; pertanto, notazioni quali fxi xj (x0 ) oppure fij (x0 ) equivalgono a fxj xi (x0 ) oppure fji (x0 ). La matrice hessiana interviene nello studio del comportamento locale di f in x0 , come illustrato nel § 5.6. Esempi 5.19 i) Consideriamo la funzione f (x, y) = x sin(x + 2y). Risulta ∂f ∂f (x, y) = sin(x + 2y) + x cos(x + 2y) , (x, y) = 2x cos(x + 2y) ∂x ∂y e ∂2f (x) = 2 cos(x + 2y) − x sin(x + 2y) , ∂x2
174
5 Calcolo differenziale per funzioni scalari
∂2f ∂2f (x) = (x) = 2 cos(x + 2y) − 2x sin(x + 2y) , ∂x∂y ∂y∂x ∂2f (x) = −4x sin(x + 2y) . ∂y 2 Considerando ad esempio l’origine x0 = 0, la matrice hessiana di f in tale punto vale
2 2 Hf (0) = . 2 0 ii) Siano dati una matrice simmetrica A ∈ Rn×n , un vettore b ∈ Rn e una costante c ∈ R. Definiamo la funzione f : Rn → R ponendo n n n xp apq xq + b p xp + c . f (x) = x · Ax + b · x + c = p=1
q=1
p=1
Notiamo come, affinch´e il prodotto Ax sia definito, qui `e necessario rappresentare x come un vettore colonna. Conseguentemente, tutti i vettori che appaiono in questo esempio sono vettori colonna. Usando la regola di derivazione del prodotto, abbiamo n n n n n ∂f ∂xp ∂xq ∂xp + (x) = apq xq + xp apq bp . ∂xi ∂xi q=1 ∂xi ∂xi p=1 p=1 q=1 p=1 Osserviamo che per ogni coppia p e i di indici compresi tra 1 e n, abbiamo
∂xp 1 se p = i , = δpi = 0 se p = i . ∂xi Pertanto n n ∂f (x) = aiq xq + xp api + bi . ∂xi q=1 p=1 D’altro canto, essendo la matrice A simmetrica e l’indice di sommatoria arbitrario, si ha n n n xp api = aip xp = aiq xq . p=1
p=1
q=1
Dunque n ∂f (x) = 2 aiq xq + bi , ∂xi q=1
ossia ∇f (x) = 2Ax + b . Derivando ulteriormente, otteniamo ∂2f hij = (x) = 2aij , 1 ≤ i, j ≤ n , ∂xj ∂xi ossia Hf (x) = 2A . Si noti che la matrice hessiana di f `e indipendente da x.
5.4 Derivate parziali di ordine superiore
175
iii) L’energia cinetica di un corpo che ha massa m e si muove con velocit`a v `e data da K = 12 mv 2 . Si ha
1 0 v . ∇K(m, v) = v 2 , mv e HK(m, v) = v m 2 Si noti che vale l’identit` a ∂K ∂ 2 K 2 =K. ∂m ∂v 2
5.4 Derivate parziali di ordine superiore Abbiamo definito le derivate parziali seconde
∂2f di una funzione f come le ∂xj ∂xi
∂f ; se vale il Teorema di Schwarz, l’ordine ∂xi di derivazione nelle derivate miste `e inessenziale. Allo stesso modo, si definiscono ∂2f le derivate parziali terze di f come le derivate parziali prime delle funzioni ∂xj ∂xi (supponendo ovviamente che la derivazione di tali funzioni sia possibile). In generale, per derivazione successiva, si definiscono le derivate parziali k-esime (o di ordine k) di f , per un qualunque intero k ≥ 1. Supponendo che le derivate miste di ogni ordine siano continue, e dunque che ad esse si applichi il Teorema di Schwarz, indicheremo con derivate parziali prime delle funzioni
∂k f α2 αn (x0 ) 1 ∂xα 1 ∂x2 . . . ∂xn la derivata parziale di ordine k di f in x0 ottenuta derivando α1 volte rispetto a x1 , α2 volte rispetto a x2 , . . . , αn volte rispetto a xn . Gli esponenti αi sono interi compresi tra 0 e k tali che α1 +α2 +. . .+αn = k. Un diverso simbolo usato per tale derivata `e Dα f (x0 ), avendo introdotto il multi-indice α = (α1 , α2 , . . . , αn ) ∈ Nn . Altre notazioni sono possibili: ad esempio, con fxxy si indica la derivata terza di una funzione f dipendente da x e y, fatta due volte rispetto a x e una volta rispetto a y. Introduciamo infine la seguente notazione. Una funzione f dicesi di classe C k (k ≥ 1) in un aperto Ω ⊆ dom f se tutte le derivate parziali di ogni ordine ≤ k esistono e sono continue in ogni punto di Ω. L’insieme di tali funzioni viene indicato con C k (Ω). Per estensione, C 0 (Ω) indicher` a l’insieme delle funzioni continue in Ω, mentre C ∞ (Ω) denoter` a l’insieme delle funzioni che stanno in C k (Ω) per ogni k, ossia le funzioni che ammettono derivate parziali continue di ogni ordine in Ω. Si osservi che valgono le inclusioni C ∞ (Ω) ⊂ . . . ⊂ C k (Ω) ⊂ C k−1 (Ω) ⊂ . . . ⊂ C 0 (Ω) .
176
5 Calcolo differenziale per funzioni scalari
Notiamo che, grazie alla Proposizione 5.8, una funzione di C 1 (Ω) `e differenziabile in ogni punto di Ω. In luogo dell’aperto Ω, possiamo considerare nelle definizioni precedenti la sua chiusura Ω, supponendo che Ω sia contenuto in dom f . Diremo che f ∈ C 0 (Ω) se f `e continua in ogni punto di Ω; per 1 ≤ k ≤ ∞, diremo che f ∈ C k (Ω), o che f `e di classe C k in Ω, se esiste un aperto Ω tale che Ω ⊂ Ω ⊆ dom f e f ∈ C k (Ω ).
5.5 Sviluppi di Taylor; convessit` a Come nel caso monodimensionale, gli sviluppi di Taylor permettono di approssimare localmente una funzione con un polinomio nelle variabili indipendenti, conoscendo opportune derivate parziali della funzione. Abbiamo gi` a incontrato alcuni esempi di sviluppi di Taylor; infatti per una funzione differenziabile vale la (5.5), che rappresenta lo sviluppo di Taylor di f in x0 del primo ordine, con resto di Peano. Si noti infatti che l’espressione T f1,x0 (x) = f (x0 ) + ∇f (x0 ) · (x − x0 ) `e un polinomio di grado al pi` u 1 nelle variabili xi , che chiameremo polinomio di Taylor di f in x0 di ordine 1. D’altro canto se f `e di classe C 1 in un intorno di x0 , vale la (5.10) con a = x0 e b = x punto arbitrario in questo intorno, ossia si ha f (x) = f (x0 ) + ∇f (x) · (x − x0 ) , x ∈ S[x, x0 ] . (5.13) Considerando la costante f (x0 ) come un polinomio di grado 0, essa fornisce lo sviluppo di Taylor di f in x0 di ordine 0, con resto di Lagrange. Aumentando la regolarit` a della funzione, possiamo definire formule di Taylor via via pi` u precise. Per quanto riguarda le funzioni di classe C 2 , si hanno i risultati espressi dai seguenti teoremi. Teorema 5.20 Sia f una funzione di classe C 2 in un intorno di x0 . Allora f ammette in x0 il seguente sviluppo di Taylor del primo ordine con resto di Lagrange: 1 f (x) = f (x0 ) + ∇f (x0 ) · (x − x0 ) + (x − x0 ) · Hf (x)(x − x0 ) , 2
(5.14)
dove x `e un punto interno al segmento S[x, x0 ]. Dim.
; Complementi al Cap. 5 .
2
5.5 Sviluppi di Taylor; convessit` a
177
La (5.4) e la (5.14) rappresentano due modi diversi di scrivere il resto nell’approssimazione di f mediante il polinomio di Taylor di primo grado T f1,x0 (x). Il successivo risultato fornisce invece una forma di sviluppo al secondo ordine per la funzione f . Teorema 5.21 Sia f una funzione di classe C 2 in un intorno di x0 . Allora f ammette in x0 il seguente sviluppo di Taylor del secondo ordine con resto di Peano: 1 f (x) = f (x0 ) + ∇f (x0 ) · (x − x0 ) + (x − x0 ) · Hf (x0 )(x − x0 ) 2 x → x0 . +o(x − x0 2 ) , Dim.
(5.15)
; Complementi al Cap. 5 .
2
L’espressione 1 T f2,x0 (x) = f (x0 ) + ∇f (x0 ) · (x − x0 ) + (x − x0 ) · Hf (x0 )(x − x0 ) 2 `e un polinomio di grado ≤ 2 nelle variabili xi , che chiameremo polinomio di Taylor di f in x0 di ordine 2. Esso fornisce la migliore approssimazione quadratica della funzione nell’intorno di x0 (si veda la Figura 5.5 per un esempio). A titolo esemplificativo, esplicitiamo la (5.15) nel caso di una funzione f (x, y) di due variabili:
T f2,x 0
P0
f
Figura 5.5. Grafico del polinomio di Taylor di f in x0 di ordine 2 (paraboloide osculatore in P0 )
178
5 Calcolo differenziale per funzioni scalari
f (x, y) = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) 1 1 + fxx (x0 , y0 )(x − x0 )2 + fxy (x0 , y0 )(x − x0 )(y − y0 ) + fyy (x0 , y0 )(y − y0 )2 2 2 (x, y) → (x0 , y0 ) . +o (x − x0 )2 + (y − y0 )2 , Si osservi che nel termine quadratico si `e utilizzato il fatto che la matrice hessiana `e simmetrica grazie al Teorema di Schwarz. ` possibile scrivere formule di Taylor di ordine n arbitrario supponendo f di E classe C n in un intorno di x0 . Tuttavia tali estensioni esulano dallo scopo di questo testo. 5.5.1 Convessit` a Il concetto di convessit`a (globale e locale) per funzioni di una variabile reale (Vol. I, § 6.9) si generalizza in modo naturale alle funzioni di pi` u variabili reali. La convessit`a globale si esprime attraverso la propriet` a di convessit`a dell’epigrafico della funzione. Precisamente, sia f : C ⊆ Rn → R con C insieme convesso, e sia Ef = (x, y) ∈ Rn+1 : x ∈ C, y ≥ f (x) il suo epigrafico. Diremo che f `e convessa su C se l’insieme Ef `e convesso. La convessit`a locale si esprime attraverso la posizione del grafico della funzione rispetto al suo piano tangente in un punto. Precisamente, se f `e differenziabile in x0 ∈ dom f , diremo che f `e convessa in x0 se esiste un intorno Br (x0 ) tale che f (x) ≥ f (x0 ) + ∇f (x0 ) · (x − x0 ) ,
∀x ∈ Br (x0 ) ;
diremo che f `e strettamente convessa in x0 se la disuguaglianza precedente `e stretta per ogni x = x0 . Si pu` o dimostrare che, per funzioni differenziabili, la convessit` a locale di f in ogni punto di un convesso C ⊆ dom f equivale alla convessit`a globale di f su C. Sia f di classe C 2 in un intorno di x0 appartenente a dom f . Allora, usando il Teorema 5.21 e ricordando le propriet`a della matrice simmetrica Hf (x0 ) (si veda il § 4.2), possiamo affermare che: Hf (x0 ) `e semi-definita positiva
⇐⇒
f `e convessa in x0
Hf (x0 ) `e definita positiva
=⇒
f `e strettamente convessa in x0 .
5.6 Estremi di una funzione; punti stazionari I concetti di estremo e di punto di estremo (locale o globale) di una funzione reale di pi` u variabili reali sono del tutto simili a quelli gi` a visti nel caso monodimensionale.
5.6 Estremi di una funzione; punti stazionari
179
Definizione 5.22 Sia x0 ∈ dom f . Si dice che x0 `e punto di massimo relativo (o locale) per f se esiste un intorno Br (x0 ) di x0 tale che ∀x ∈ Br (x0 ) ∩ dom f,
f (x) ≤ f (x0 ).
Il valore f (x0 ) dicesi massimo relativo di f . Si dice che x0 `e punto di massimo assoluto (o globale) per f se ∀x ∈ dom f,
f (x) ≤ f (x0 ).
Il valore f (x0 ) dicesi massimo assoluto di f . In tutti i casi, il massimo si definisce stretto se si ha f (x) < f (x0 ) per x = x0 . Le definizioni di punto di minimo relativo e assoluto si ottengono dalle precedenti invertendo le disuguaglianze. Un punto di minimo o di massimo verr` a indicato genericamente come punto di estremo per f . Esempi 5.23 i) La funzione f (x) = x ha un minimo globale stretto nell’origine, in quanto f (0) = 0 e f (x) > 0 per ogni x = 0. Ovviamente, f non ammette punti di massimo (relativi o assoluti) su Rn . 2
ii) La funzione f (x, y) = x2 (e−y − 1) `e sempre ≤ 0, in quanto x2 ≥ 0 ed 2 e−y ≤ 1 per ogni (x, y) ∈ R2 . Inoltre essa si annulla se x = 0 oppure se y = 0, ossia f (0, y) = 0 per ogni y ∈ R e f (x, 0) = 0 per ogni x ∈ R. Pertanto, tutti i punti sugli assi coordinati sono punti di massimo globale (non stretto). 2 I punti di estremo considerati nella Definizione 5.22 sono usualmente detti liberi, in quanto la variabile indipendente `e “libera” di variare in tutto il dominio della funzione. Pi` u avanti (§ 7.3), introdurremo il concetto di estremo “vincolato”, in cui la variabile indipendente `e ristretta ad un particolare sottoinsieme del dominio, quale ad esempio una curva o una superficie. Anche per le funzioni di pi` u variabili, il Teorema di Weierstrass (gi` a visto nel Vol. I, Teorema 4.31) fornisce una condizione sufficiente per l’esistenza di estremi di una funzione; la sua dimostrazione `e analoga a quella del caso monodimensionale. Teorema 5.24 (di Weierstrass) Sia f una funzione continua su un insieme compatto K ⊆ dom f . Allora l’immagine f (K) `e un intervallo chiuso e limitato; in particolare, f assume su K valore minimo e massimo. Ad esempio, la funzione f (x) = x gi` a considerata sopra ammette massimo assoluto su ogni compatto K ⊂ Rn . Anche il concetto di punto critico ha un corrispettivo per le funzioni di pi` u variabili.
180
5 Calcolo differenziale per funzioni scalari
Definizione 5.25 Un punto x0 in cui f `e differenziabile dicesi punto critico o stazionario per f se ∇f (x0 ) = 0. Se invece ∇f (x0 ) = 0, il punto x0 dicesi regolare per f . Si osservi che, grazie alla (5.7), in un punto stazionario si annullano tutte le derivate direzionali di f . Per una funzione di due variabili, possiamo dare un’immediata interpretazione geometrica di un punto stazionario. Ricordando l’equazione (5.6), esso `e un punto in cui il piano tangente al grafico della funzione `e orizzontale (si veda la Figura 5.6). L’interesse per la ricerca dei punti stazionari di f `e motivato dal Teorema di Fermat, che enunciamo qui per le funzioni di pi` u variabili. Teorema 5.26 (di Fermat) Sia x0 un punto di estremo per f , in cui f `e differenziabile. Allora x0 `e punto stazionario per f . Dim.
Per ipotesi, per ogni i, la funzione di una variabile x → f (x01 , . . . , x0,i−1 , x, x0,i+1 , . . . , x0n ) `e definita in un intorno di x0i ed `e ivi derivabile; inoltre essa ha un punto di estremo in x0i . Pertanto, a tale funzione si applica il Teorema di Fermat ∂f monodimensionale, che fornisce (x0 ) = 0 . 2 ∂xi
Facciamo alcune osservazioni che illustrano, alla luce del teorema, i legami tra punti di estremo e punti stazionari. i) Notiamo innanzitutto che un punto di estremo per f non `e necessariamente un punto di differenziabilit` a di f e quindi, a maggior ragione, un punto stazionario. P1
P3
P2
P4
Figura 5.6. Punti stazionari di una funzione di due variabili, e piani tangenti in tali punti
5.6 Estremi di una funzione; punti stazionari
181
` precisamente ci`o che accade per la funzione f (x) = x studiata nell’EsemE pio 5.23 i): l’origine `e punto di minimo assoluto, ma la funzione non ammette derivate parziali in tale punto. Infatti, in ogni direzione, f si comporta come la funzione valore assoluto, essendo f (0, . . . , 0, x, 0, . . . , 0) = |x|. ii) Per le funzioni differenziabili in tutto il loro dominio, il Teorema di Fermat fornisce una condizione necessaria per l’esistenza di un punto di estremo; in altri termini, per tali funzioni i punti di estremo vanno ricercati tra i punti stazionari. iii) Non tutti i punti stazionari sono per` o punti di estremo. Ad esempio, la funzione f (x, y) = x3 y 3 ha un punto stazionario nell’origine, ma questo non `e n´e punto di massimo n´e punto di minimo. Infatti f si annulla sugli assi coordinati, `e strettamente positiva all’interno del primo e terzo quadrante e strettamente negativa all’interno del secondo e quarto quadrante. Alla luce delle osservazioni precedenti, ha dunque senso fornire delle condizioni sufficienti affinch´e un punto stazionario x0 per f sia un punto di estremo. A tale proposito, per una funzione di classe C 2 in un intorno di x0 , lo studio della matrice hessiana Hf (x0 ) `e un utile strumento. Sotto le ipotesi fatte, vale infatti lo sviluppo di Taylor (5.15), che – tenendo conto del fatto che x0 `e punto stazionario per f – possiamo scrivere come f (x) − f (x0 ) = Q(x − x0 ) + o(x − x0 2 ) ,
x → x0 ,
(5.16)
avendo indicato con Q(v) = 12 v · Hf (x0 )v la forma quadratica associata alla matrice simmetrica Hf (x0 ) (si veda il § 4.2). Il seguente risultato contiene una condizione sufficiente affinch´e un punto stazionario sia un punto di estremo. Teorema 5.27 Sia f una funzione di classe C 2 in un intorno di un punto x0 stazionario per f . Valgono le seguenti implicazioni. i) Se x0 `e punto di minimo (rispettivamente, massimo) per f , allora Hf (x0 ) `e semi-definita positiva (rispettivamente, negativa). ii) Se Hf (x0 ) `e definita positiva (rispettivamente, negativa), allora x0 `e punto di minimo (rispettivamente, massimo) locale stretto per f . Dim.
i) Supponiamo, per fissare le idee, che x0 sia un punto di minimo locale per f , e sia Br (x0 ) un intorno di x0 in cui f (x) ≥ f (x0 ). Scelto un qualunque vettore v ∈ Rn , sia x = x0 +εv con ε > 0 sufficientemente piccolo in modo che x ∈ Br (x0 ). Dalla (5.16), si ha Q(x − x0 ) + o(x − x0 2 ) ≥ 0 ,
x → x0 .
Ma Q(x − x0 ) = Q(εv) = ε2 Q(v) e o(x − x0 2 ) = o(ε2 v2 ) = ε2 o(1) per ε → 0+ . Pertanto
182
5 Calcolo differenziale per funzioni scalari
ε2 Q(v) + ε2 o(1) ≥ 0 ,
ε → 0+ ,
cio`e Q(v) + o(1) ≥ 0 ,
ε → 0+ .
Passando al limite per ε → 0+ e, notando che Q(v) non dipende da ε, otteniamo Q(v) ≥ 0. Per l’arbitrariet` a di v, si conclude che Hf (x0 ) `e semi-definita positiva. ii) Sia Hf (x0 ) definita positiva. Vale allora la relazione Q(v) ≥ αv2 per ogni v ∈ Rn , ove α = λ∗ /2 e λ∗ > 0 `e il pi` u piccolo autovalore di Hf (x0 ) (vedasi la (4.17)). Usando la (5.16), otteniamo f (x) − f (x0 ) ≥ αx − x0 2 + x − x0 2 o(1) x → x0 . = α + o(1) x − x0 2 , In un intorno Br (x0 ) di raggio abbastanza piccolo, si ha α + o(1) > 0 e pertanto f (x) ≥ f (x0 ) in tale intorno. 2 Come conseguenza del teorema, possiamo dire che in un intorno di un punto x0 di minimo per f , con Hf (x0 ) definita positiva, il grafico di f `e ben approssimato da quello della funzione quadratica g(x) = f (x0 ) + Q(x − x0 ), che in dimensione 2 rappresenta un paraboloide ellittico. Inoltre, gli insiemi di livello di f sono approssimati da quelli della forma quadratica Q(x − x0 ); come ricordato nel § 4.2, essi sono ellissi (in dimensione 2) oppure ellissoidi (in dimensione 3) centrati in x0 . Osservazione 5.28 Si pu` o dimostrare che se f `e di classe C 2 in tutto il suo dominio, con Hf (x) definita positiva (negativa) ovunque, allora f ammette al pi` u un punto stazionario x0 , e questo `e il punto di minimo (massimo) globale per f .2 Esempi 5.29 i) Consideriamo la funzione f (x, y) = 2xe−(x
2
+y 2 )
definita su tutto R . Si ha 2 2 2 2 ∂f ∂f (x, y) = 2(1 − 2x2 )e−(x +y ) , (x, y) = −4xye−(x +y ) ∂x ∂y e quindi, ponendo uguali a 0 tali espressioni, si trovano due punti stazionari √ √ x1 = 22 , 0 e x2 = − 22 , 0 . Risulta poi 2
2 2 ∂2f (x, y) = 4x(2x2 − 3)e−(x +y ) , ∂x2 2 2 ∂2f ∂2f (x, y) = (x, y) = 4y(2x2 − 1)e−(x +y ) , ∂x∂y ∂y∂x 2 2 ∂2f (x, y) = 4x(2y 2 − 1)e−(x +y ) , 2 ∂y
5.6 Estremi di una funzione; punti stazionari
183
e dunque
√ √ −1/2
2 0 −4 2e √ ,0 = Hf 2 0 −2 2e−1/2 e √ √ −1/2
0 4 2e 2 √ Hf − ,0 = . 2 0 2 2e−1/2 Osservando che le matrici hessiane sono diagonali, si ha immediatamente che Hf (x1 ) `e definita negativa mentre Hf (x2 ) `e definita positiva. Pertanto concludiamo che i punti x1 e x2 sono estremi locali (rispettivamente massimo e minimo locale). Si veda la Figura 5.7 per il grafico di f e le corrispondenti curve di livello. ii) Consideriamo la funzione 1 1 + y 2 + + xz . x z Essa `e definita nell’insieme dom f = {(x, y, z) ∈ R3 : x = 0 e z = 0} . Si ha
1 1 ∇f (x, y, z) = − 2 + z, 2y, − 2 + x ; x z imponendo la condizione ∇f (x, y, z) = 0, si trova un unico punto stazionario x0 = (1, 0, 1). Inoltre ⎛ 2 ⎞ ⎛ ⎞ 2 0 1 0 1 3 ⎜x ⎟ ⎜ ⎟ ⎜ ⎟ 0 2 0⎟ . da cui Hf (1, 0, 1) = ⎜ Hf (x, y, z) = ⎜ 0 2 0 ⎟ , ⎝ ⎠ ⎝ ⎠ 2 1 0 2 1 0 z3 L’equazione caratteristica della matrice A = Hf (1, 0, 1) `e det(A − λI) = (2 − λ) (2 − λ)2 − 1 = 0 ; f (x, y, z) =
essa fornisce le tre soluzioni λ1 = 1, λ2 = 2 e λ3 = 3. Pertanto, la matrice hessiana di f in x0 `e definita positiva e quindi x0 `e punto di minimo locale. 2
y
z
y x x
2
Figura 5.7. Grafico e curve di livello della funzione f (x, y) = 2xe−(x
+y 2 )
184
5 Calcolo differenziale per funzioni scalari
5.6.1 Punti di sella Ricordando la definizione (vedasi § 4.2) di matrice indefinita, l’enunciato i) del Teorema 5.27 pu`o essere formulato nel seguente modo logicamente equivalente. Proposizione 5.30 Sia f una funzione di classe C 2 in un intorno di un punto x0 stazionario per f . Se Hf (x0 ) `e indefinita, allora x0 non `e punto di estremo per f . Un punto x0 stazionario per f , in cui Hf (x0 ) sia indefinita, verr` a detto punto di sella. Il seguente esempio spiega l’origine del nome, che deriva dalla forma del grafico di f in un intorno di x0 . Esempio 5.31 Si consideri la funzione f (x, y) = x2 − y 2 . Essendo ∇f (x, y) = (2x, −2y), essa ha un unico punto stazionario nell’origine. Inoltre, la matrice hessiana
2 0 Hf (x, y) = 0 −2 che `e indipendente dal punto considerato, `e ovunque indefinita. Pertanto l’origine `e punto di sella per f . ` interessante analizzare pi` E u in dettaglio il comportamento di f in un intorno di tale punto. In effetti, muovendosi lungo l’asse delle x, ossia considerando la funzione f (x, 0) = x2 , si vede che l’origine `e un punto di minimo per tale funzione. Al contrario, muovendosi lungo l’asse delle y, ossia considerando la funzione f (0, y) = −y 2 , l’origine risulta essere un punto di massimo per tale funzione. In altri termini, si ha f (0, 0) = min f (x, 0) = max f (0, y) . x∈R
x∈R
Le curve di livello della funzione f e il suo grafico (da due punti di vista diversi) sono visualizzati rispettivamente nelle Figure 5.8 e 5.9. 2 y
x
Figura 5.8. Curve di livello relative alla funzione f (x, y) = x2 − y 2
5.6 Estremi di una funzione; punti stazionari
185
z
z
y
x y x
Figura 5.9. Rappresentazione grafica della funzione f (x, y) = x2 −y 2 con due angolazioni differenti
Il comportamento appena illustrato nell’esempio `e tipico dei punti stazionari in cui la matrice hessiana `e indefinita e non singolare (ovverossia, i suoi autovalori sono tutti diversi da zero e di segno non costante). Vediamo altri esempi. Esempi 5.32 i) Consideriamo la funzione f (x, y) = xy. Abbiamo ∇f (x, y) = (y, x)
Hf (x, y) =
0 1
. 1 0 Pertanto, come nel caso precedente, x0 = (0, 0) `e punto di sella, in quanto gli autovalori della matrice hessiana sono λ1 = 1 e λ2 = −1. Osserviamo che, muovendosi lungo la bisettrice del primo e terzo quadrante, f ha un minimo in x0 , mentre muovendosi lungo la bisettrice del secondo e quarto quadrante, f ha un massimo in x0 ; si ha cio`e f (0, 0) = min f (x, x) = max f (x, −x) . x∈R
e
x∈R
Le direzioni delle due bisettrici sono quelle degli autovettori w1 = (1, 1) e w2 = (−1, 1) associati agli autovalori λ1 e λ2 . Si noti che, eseguendo il cambiamento di variabile indipendente x = u − v, y = u + v (che corrisponde a una rotazione di π/4 nel piano, si veda il § 6.6 ed in particolare l’Esempio 6.31), la funzione f diventa f (x, y) = (u − v)(u + v) = u2 − v 2 = f˜(u, v) . che `e la stessa funzione dell’esempio precedente nelle nuove variabili u, v.
186
5 Calcolo differenziale per funzioni scalari
ii) Sia f (x, y) = x2 + y 2 − z 2 . Risulta ∇f (x, y, z) = (2x, 2y, −2z) e l’unico punto stazionario `e l’origine. Si ha ⎛ ⎞ 2 0 0 ⎜ ⎟ Hf (x, y, z) = ⎝ 0 2 0 ⎠ ; 0 0 −2 essa `e dunque indefinita e pertanto l’origine `e punto di sella per f . Un pi` u attento esame della funzione illustra la struttura del punto sella. Muovendosi sul piano xy, ossia considerando la funzione f (x, y, 0) = x2 + y 2 , si vede che l’origine `e un punto di minimo per tale funzione. D’altra parte, muovendosi lungo l’asse z, si vede che l’origine risulta un punto di massimo per la funzione f (0, 0, z) = −z 2 . Si ha dunque f (0, 0, 0) = min 2 f (x, y, 0) = max f (0, 0, z) . (x,y)∈R
z∈R
iii) Una situazione lievemente pi` u articolata delle precedenti `e la seguente. Sia f (x, y, z) = x2 +y 3 −z 2 . Risulta ∇f (x, y, z) = (2x, 3y 2 , −2z), per cui l’origine `e nuovamente punto stazionario. La matrice hessiana ⎛ ⎞ 2 0 0 ⎜ ⎟ Hf (0, 0, 0) = ⎝ 0 0 0 ⎠ ; 0 0 −2 `e indefinita, quindi l’origine `e punto sella. Pi` u precisamente, la funzione ammette in tale punto un minimo se ci si muove lungo l’asse delle x e un massimo se ci si muove lungo l’asse delle z. Invece, se ci si muove lungo l’asse delle y, la funzione presenta un flesso nell’origine. 2 La definizione di punto di sella pu` o essere estesa a comprendere punti stazionari in cui la matrice hessiana sia semi-definita (positiva oppure negativa). In tal caso, la sola conoscenza della matrice Hf (x0 ) non `e sufficiente a determinare la natura del punto. La condizione aggiuntiva che deve essere verificata perch´e x0 sia classificato come punto di sella `e la seguente: esistono una direzione lungo la quale f ha un punto di massimo in x0 ed una direzione lungo la quale f ha un punto di minimo in x0 . Pi` u precisamente, devono esistere due vettori v1 e v2 tali che le funzioni t → f (x0 + tvi ), i = 1, 2, abbiano rispettivamente un punto di minimo e un punto di massimo stretti per t = 0. 2 4 Consideriamo ad esempio la funzione f (x, y) = x − y . L’origine `e punto 2 0 stazionario e ivi l’hessiana `e data da Hf (0, 0) = , e dunque `e una matrice 0 0 semi-definita positiva. Poich´e la funzione f (x, 0) = x2 ha in x = 0 un punto di minimo, mentre la funzione f (0, y) = −y 4 ha in y = 0 un punto di massimo, la condizione precedente `e soddisfatta da v1 = i = (1, 0) e v2 = j = (0, 1). In tal caso diciamo ancora che il punto x0 `e punto di sella per f . Consideriamo invece la funzione f (x, y) = x2 − y 3 , che ha nell’origine un punto stazionario con la stessa matrice hessiana del caso precedente. Tuttavia, per ogni
5.6 Estremi di una funzione; punti stazionari
187
m ∈ R, la funzione f (x, mx) = x2 − m3 x3 ha in x = 0 un punto di minimo, mentre la funzione f (0, y) = −y 3 ha in y = 0 un punto di flesso. Dunque, per nessun vettore v2 la funzione t → f (tv2 ) `e massima in t = 0. Il punto x0 = 0 non sar` a quindi chiamato punto di sella per f . Osserviamo che se x0 `e punto stazionario per f e Hf (x0 ) `e semi-definita positiva, allora ogni autovettore w associato ad un autovalore λ > 0 `e tale che la funzione t → f (x0 + tw) ha un punto di minimo stretto per t = 0 (e dunque w pu` o essere scelto come vettore v1 ); infatti, dalla (5.16), si ha 1 f (x0 + tw) = f (x0 ) + λw2 t2 + o(t2 ) , 2
t → 0.
Pertanto, x0 `e punto di sella per f se e solo se `e possibile trovare un vettore v2 nel nucleo della matrice Hf (x0 ) tale che la funzione t → f (x0 + tv2 ) abbia un punto di minimo stretto in t = 0. In modo analogo si procede se Hf (x0 ) `e semi-definita negativa. Chiudiamo questo paragrafo fornendo una semplice procedura per studiare la natura dei punti stazionari di funzioni di due variabili. Alla luce di quanto detto sopra, si tratta di individuare il segno degli autovalori della matrice hessiana, il che pu` o essere fatto, per una matrice 2 × 2, senza calcoli espliciti. Ricordiamo infatti che, detta A una qualunque matrice di ordine 2 simmetrica, il suo determinante `e il prodotto degli autovalori. Pertanto se det A > 0, i due autovalori saranno di segno concorde e dunque A `e definita, e precisamente positiva o negativa a seconda del segno di uno qualunque dei termini a11 o a22 sulla diagonale. Se det A < 0, i due autovalori saranno di segno discorde quindi A `e indefinita. Se infine det A = 0, la matrice sar`a semi-definita ma non definita. Applicando tali considerazioni alla matrice Hf (x0 ) di un punto stazionario, e ricordando il Teorema 5.27, abbiamo allora: ! det Hf (x0 ) > 0 ⇒
x0 punto di minimo locale stretto se fxx (x0 ) > 0 x0 punto di massimo locale stretto se fxx (x0 ) < 0
det Hf (x0 ) < 0 ⇒ x0 punto di sella o determinare la natura di x0 dalla sola det Hf (x0 ) = 0 ⇒ non si pu` conoscenza di Hf (x0 ) . Nel caso det Hf (x0 ) > 0, l’alternativa tra minimo e massimo pu` o essere equivalentemente decisa in base al segno di fyy (x0 ), che `e concorde con fxx (x0 ). Esempio 5.33 2
Sia f (x, y) = 2xy + e−(x+y) , le cui derivate parziali prime sono date da 2 2 fx (x, y) = 2 y − (x + y) e−(x+y) , fy (x, y) = 2 x − (x + y) e−(x+y) ,
188
5 Calcolo differenziale per funzioni scalari
mentre le derivate parziali seconde sono
2 fxx (x, y) = fyy (x, y) = −2e−(x+y) 1 − 2(x + y)2 , 2 fxy (x, y) = fxy (x, y) = 2 − 2e−(x+y) 1 − 2(x + y)2 . Pertanto, si hanno 3 punti stazionari, dati da 1 1 x1 = log 2, log 2 , x2 = −x1 . x0 = (0, 0) , 2 2 Corrispondentemente,
−2 0 1 − 2 log 2 1 + 2 log 2 , Hf (x1 ) = Hf (x2 ) = . Hf (x0 ) = 0 −2 1 + 2 log 2 1 − 2 log 2 Ne segue che x0 `e punto di massimo, essendo Hf (x0 ) definita negativa, mentre x1 e x2 sono punti di sella, essendo det Hf (x1 ) = det Hf (x2 ) = −8 log 2 < 0.2
5.7 Esercizi 1. Calcolare i valori nei punti indicati delle derivate parziali prime delle seguenti funzioni: a) f (x, y) = 3x + y 2 in (x0 , y0 ) = (1, 2) in (x0 , y0 , z0 ) = (0, 1, −1)
b) f (x, y, z) = yex+yz y 2 c) f (x, y) = 8x2 + e−t dt
in (x0 , y0 ) = (3, 1)
1
2. Calcolare le derivate parziali prime delle seguenti funzioni: a) f (x, y) = log(x + x2 + y 2 ) y b) f (x, y) = cos t2 dt x
c)
f (x, y, z, t) =
x−y z−t
d) f (x1 , . . . , xn ) = sin(x1 + 2x2 + . . . + nxn ) 3. Calcolare la derivata parziale indicata per le seguenti funzioni: a) f (x, y) = x3 y 2 − 3xy 4 ,
fyyy
b) f (x, y) = x sin y ,
∂3f ∂x∂y 2
c) f (x, y, z) = exyz ,
fxyx
d) f (x, y, z) = xa y b z c ,
∂6f ∂x∂y 2 ∂z 3
5.7 Esercizi
189
4. Determinare quali delle seguenti funzioni soddisfano la relazione fxx +fyy = 0, nota come equazione di Laplace: a) f (x, y) = x2 + y 2 c) f (x, y) = log x2 + y 2
b) f (x, y) = x3 + 3xy 2 d) f (x, y) = e−x cos y − e−y cos x
1 5. Verificare che la funzione f (x, t) = e−t sin kx soddisfa la relazione ft = 2 fxx , k nota come equazione del calore. 6. Verificare che le seguenti funzioni soddisfano la relazione ftt = fxx , nota come equazione delle onde: a) f (x, t) = sin x sin t 7. Sia
b) f (x, t) = sin(x − t) + log(x + t)
⎧ 3 3 ⎨ x y − xy 2 2 f (x, y) = x +y ⎩ 0
se (x, y) = (0, 0) , se (x, y) = (0, 0) .
a) Calcolare fx (x, y) e fy (x, y) per ogni (x, y) = (0, 0). b) Calcolare fx (0, 0), fy (0, 0) utilizzando la definizione di derivata parziale. c) Commentare i risultati alla luce del Teorema di Schwarz 5.17. 8. Determinare la funzione gradiente delle seguenti funzioni: x+y a) f (x, y) = arctan b) f (x, y) = (x + y) log(2x − y) x−y c) f (x, y, z) = sin(x + y) cos(y − z)
d) f (x, y, z) = (x + y)z
9. Calcolare le derivate direzionali delle seguenti funzioni lungo i vettori v nei punti indicati: a) f (x, y) = x y − 3 v = (−1, 6) x0 = (2, 12) b) f (x, y, z) =
1 x + 2y − 3z
v = (12, −9, −4)
x0 = (1, 1, −1)
10. Determinare l’equazione del piano tangente al grafico delle seguenti funzioni f (x, y) nel punto P0 = x0 , y0 , f (x0 , y0 ) indicato: a) f (x, y) = 3x2 − y 2 + 3y b) f (x, y) = ey c)
2
−x
2
f (x, y) = x log y
in P0 = (−1, 2, f (−1, 2)) in P0 = (−1, 1, f (−1, 1)) in P0 = (4, 1, f (4, 1))
190
5 Calcolo differenziale per funzioni scalari
11. Verificare, in base alla definizione, che le seguenti funzioni sono differenziabili nel punto indicato: √ a) f (x, y) = y x in (x0 , y0 ) = (4, 1) b) f (x, y) = |y| log(1 + x)
in (x0 , y0 ) = (0, 0)
f (x, y) = xy − 3x2
in (x0 , y0 ) = (1, 2)
c)
12. Data la funzione ⎧ ⎨ f (x, y) =
xy x2 + y 2 ⎩ 0
se (x, y) = (0, 0) , se (x, y) = (0, 0) ,
calcolare fx (0, 0) e fy (0, 0). La funzione `e differenziabile nell’origine? 13. Studiare la differenziabilit` a in (0, 0) della funzione ⎧ 2 3 ⎨ x y se (x, y) = (0, 0) , f (x, y) = x4 + y 4 ⎩ 0 se (x, y) = (0, 0) .
14. Studiare la differenziabilit` a in ogni punto del piano della funzione f (x, y) = |x| sin(x2 + y 2 ) .
15. Studiare la continuit` a e la differenziabilit` a nell’origine, al variare del parametro reale α, della funzione
α |y| sin x se y = 0 , f (x, y) = 0 se y = 0 .
16. Studiare la differenziabilit` a nell’origine della funzione ⎧ 1 ⎨ (x2 + y 2 + z 2 ) sin 2 x + y2 + z2 f (x, y, z) = ⎩ 0
se (x, y, z) = (0, 0, 0) , se (x, y, z) = (0, 0, 0) .
5.7 Esercizi
191
17. Sia f (x, y) = x2 +3xy −y 2 . Determinare il differenziale di f in (x0 , y0 ) = (2, 3). Se x varia da 2 a 2.05 e y varia da 3 a 2.96, confrontare l’incremento Δf con il corrispondente valore del differenziale df(x0 ,y0 ) . 18. Determinare il differenziale delle seguenti funzioni in un generico punto (x0 , y0 ) del loro dominio: a) f (x, y) = ex cos y c)
b) f (x, y) = x sin xy
f (x, y, z) = log(x2 + y 2 + z 2 )
d) f (x, y, z) =
x y + 2z
19. Determinare il differenziale della funzione f (x, y, z) = x3 y 2 + z 2 nel punto √ (2, 3, 4). Utilizzare il risultato per stimare il numero 1.983 3.012 + 3.972 . 20. Dire se la funzione 1 x+y+1 `e lipschitziana sul rettangolo R = [0, 2] × [0, 1] e in caso affermativo calcolare la costante di Lipschitz. f (x, y) =
21. Studiare la lipschitzianit` a in R3 della funzione f (x, y, z) = e−(3x
2
+2y 4 +z 6 )
.
22. Scrivere il polinomio di Taylor del secondo ordine relativo alle seguenti funzioni nel punto indicato: a) f (x, y) = cos x cos y
in (x0 , y0 ) = (0, 0)
b) f (x, y, z) = ex+y+z
in (x0 , y0 , z0 ) = (1, 1, 1)
c)
f (x, y, z) = cos(x + 2y − 3z)
in (x0 , y0 , z0 ) = (0, 0, 1)
23. Determinare gli eventuali punti stazionari, specificandone la natura, delle seguenti funzioni: a) f (x, y) = x2 y + x2 − 2y c) e)
1 f (x, y) = x + x6 + y 2 (y 2 − 1) 6 x 8 f (x, y) = + − y y x
g) f (x, y) = e3x i)
2
−6xy+2y 3
f (x, y) = log(x2 + y 2 − 1)
b) f (x, y) = y log(x + y) x
y
d) f (x, y) = xye− 5 − 6 f)
f (x, y) = 2y log(2 − x2 ) + y 2
h) f (x, y) = y log x )
f (x, y, z) = xyz +
11 1 + x yz
192
5 Calcolo differenziale per funzioni scalari
24. Determinare e rappresentare graficamente il dominio della funzione f (x, y) = y 2 − x2 . Trovare gli eventuali punti stazionari e gli estremi di f . 25. Determinare il dominio e gli eventuali punti stazionari della funzione f (x, y) = x2 log(1 + y) + x2 y 2 . Studiare la natura degli eventuali punti stazionari trovati.
5.7.1 Soluzioni 1. Derivate parziali di funzioni: 3 2 ∂f ∂f (1, 2) = √ , (1, 2) = √ . ∂x ∂y 2 7 7 ∂f ∂f ∂f (0, 1, −1) = e−1 , (0, 1, −1) = 0 , (0, 1, −1) = e−1 . b) ∂x ∂y ∂z c) Risulta 2 ∂f ∂f (x, y) = 16x e (x, y) = e−y , ∂x ∂y avendo calcolato la derivata parziale rispetto ad y mediante il Teorema fondamentale del calcolo integrale. Pertanto a)
∂f (3, 1) = 48 ∂x
e
∂f (3, 1) = e−1 . ∂y
2. Derivate parziali di funzioni: a) Risulta 1 fx (x, y) = , 2 x + y2
fx (x, y) =
1 y · . 2 2 2 x+ x +y x + y2
b) Utilizzando il Teorema x fondamentale del calcolo integrale si ha ∂ cos t2 dt = − cos x2 , fx (x, y) = − ∂x y y ∂ fy (x, y) = cos t2 dt = cos y 2 . ∂y x c) Risulta 1 , z−t y−x fz (x, y, z, t) = , (z − t)2 fx (x, y, z, t) =
1 , t−z x−y ft (x, y, z, t) = . (z − t)2 fy (x, y, z, t) =
5.7 Esercizi
193
d) Risulta ∂f (x1 , . . . , xn ) = cos(x1 + 2x2 + . . . + nxn ) , ∂x1 ∂f (x1 , . . . , xn ) = 2 cos(x1 + 2x2 + . . . + nxn ) , ∂x2 .. . ∂f (x1 , . . . , xn ) = n cos(x1 + 2x2 + . . . + nxn ) , . ∂xn 3. Derivate parziali di funzioni: a) fyyy = −72xy .
b) fyyx = − sin y .
c) fxyx = yz 2 exyz (2 + xyz) .
d) fzzzyyx = abc(b − 1)(c − 1)(c − 2)xa−1 y b−2 z c−3 . 4. Soluzioni dell’equazione di Laplace: a) No. b) No. c) Poich´e f (x, y) = 12 log(x2 + y 2 ), si ha fx =
x , 2 x + y2
fxx =
y 2 − x2 , (x2 + y 2 )2
y x2 − y 2 , fyy = 2 , 2 +y (x + y 2 )2 pertanto fxx + fyy = 0 , ∀x, y = 0. Dunque la funzione `e soluzione dell’equazione di Laplace in R2 \ {0}. d) Poich´e fx = −e−x cos y + e−y sin x , fxx = e−x cos y + e−y cos x , fy =
x2
fy = −e−x sin y + e−y cos x ,
fyy = −e−x cos y − e−y cos x ,
risulta fxx + fyy = 0 , ∀(x, y) ∈ R2 e dunque la funzione `e soluzione dell’equazione di Laplace in R2 . 5. Poich´e ft = −e−t sin kx ,
fx = ke−t cos kx ,
si ha l’asserto. 6. Soluzioni dell’equazione delle onde: a) Poich´e fx = cos x sin t , ft = sin x cos t ,
fxx = − sin x sin t , ftt = − sin x sin t ,
si ha fxx = ftt , ∀(x, t) ∈ R . 2
fxx = −k2 e−t sin kx
194
5 Calcolo differenziale per funzioni scalari
b) Poich´e 1 1 , fxx = − sin(x − t) − , x+t (x + t)2 1 1 , ftt = − sin(x − t) − , ft = − cos(x − t) + x+t (x + t)2 risulta fxx = ftt , ∀(x, t) ∈ R2 tale che x + t > 0. fx = cos(x − t) +
7. a) Utilizzando le usuali regole di derivazione, per (x, y) = (0, 0) si ha (3x2 y − y 3 )(x2 + y 2 ) − 2x(x3 y − xy 3 ) y(x4 + 4x2 y 2 − y 4 ) = , (x2 + y 2 )2 (x2 + y 2 )2 (x3 − 3xy 2 )(x2 + y 2 ) − 2y(x3 y − xy 3 ) x(x4 − 4x2 y 2 − y 4 ) = . fy (x, y) = (x2 + y 2 )2 (x2 + y 2 )2
fx (x, y) =
b) Per calcolare fx (0, 0) e fy (0, 0), utilizziamo la definizione ottenendo f (x, 0) − f (0, 0) = lim 0 = 0 , x→0 x f (0, y) − f (0, 0) = lim 0 = 0 . fy (0, 0) = lim y→0 y→0 y
fx (0, 0) = lim
x→0
Inoltre, fx (0, y) − fx (0, 0) ∂2f y5 (0, 0) = lim = lim − 5 = −1 , y→0 y→0 ∂y∂x y y 2 5 fy (x, 0) − fy (0, 0) x ∂ f (0, 0) = lim = lim 5 = 1 . fyx (0, 0) = x→0 x→0 x ∂x∂y x
fxy (0, 0) =
c) Il Teorema di Schwarz 5.17 non si pu` o applicare in quanto le derivate parziali fxy e fyx non sono continue in (0, 0) (si possono utilizzare le coordinate polari per verificare che non esistono i limiti lim fxy (x, y) e lim fyx (x, y)). (x,y)→(0,0)
(x,y)→(0,0)
8. Funzioni gradiente:
x y . , a) ∇f (x, y) = − 2 x + y 2 x2 + y 2
2(x + y) x+y b) ∇f (x, y) = log(2x − y) + , log(2x − y) − . 2x − y 2x − y c) ∇f (x, y, z) = cos(x + y) cos(y − z) , cos(x + 2y − z) , sin(x + y) sin(y − z) . d) ∇f (x, y, z) = z(x + y)z−1 , z(x + y)z−1 , (x + y)z log(x + y) . 9. Derivate direzionali di funzioni: a)
∂f (x0 ) = −1 . ∂v
b)
∂f 1 (x0 ) = − . ∂v 6
5.7 Esercizi
10. Equazione del piano tangente: a) z = −6x − y + 1 . b) Ricordando l’equazione (5.6), calcoliamo 2
2
2
2
fy (x, y) = 2yey −x , fx (x, y) = −2xey −x , fy (−1, 1) = 2 . f (−1, 1) = 1 , fx (−1, 1) = 2 , Pertanto l’equazione del piano tangente cercata `e z = f (−1, 1) + fx (−1, 1)(x + 1) + fy (−1, 1)(y − 1) , ossia z = 2x + 2y + 1 . c) z = 4y − 4 . 11. Verifica della differenziabilit` a: a) Poich´e fx (x, y) =
y √ 2 x
e fy (x, y) =
f (4, 1) = 2 ,
√
x, risulta
fx (4, 1) =
1 , 4
fy (4, 1) = 2 .
Verificare la differenziabilit` a di f in (4, 1) equivale a dimostrare che lim (x,y)→(4,1)
ossia
f (x, y) − f (4, 1) − fx (4, 1)(x − 4) − fy (4, 1)(y − 1) =0 (x − 4)2 + (y − 1)2
√ y x − 2 − 14 (x − 4) − 2(y − 1) L= lim = 0. (x,y)→(4,1) (x − 4)2 + (y − 1)2
Ponendo x = 4 + r cos θ e y = 1 + r sin θ, e osservando che, per r → 0, √ r r 4 + r cos θ = 2 1 + cos θ = 2 1 + cos θ + o(r) , 4 8 si ha √ r 1 y x − 2 − (x − 4) − 2(y − 1) = 2(1 + r sin θ) 1 + cos θ + o(r) + 4 8 1 r → 0. −2 − r cos θ − 2r sin θ = o(r) , 4 Pertanto L = lim
r→0
o(r) = lim o(1) = 0 . r→0 r
195
196
5 Calcolo differenziale per funzioni scalari
b) Notiamo che f (x, 0) = f (0, y) = 0, dunque fx (0, 0) = fy (0, 0) = 0. Verificare che la funzione `e differenziabile nell’origine mediante la definizione equivale a dimostrare che lim (x,y)→(0,0)
f (x, y) − f (0, 0) − ∇f (0, 0) · (x, y) = 0, x2 + y 2
ossia, notando che f (0, 0) = 0, che |y| log(1 + x) = 0. (x,y)→(0,0) x2 + y 2 lim
Utilizzando le coordinate polari risulta y log(1 + x) r| sin θ log(1 + r cos θ)| ≤ 2r| sin θ cos θ| ≤ 2r ; = 2 2 r x +y applicando la Proposizione 4.27 con g(r) = 2r, si ottiene l’asserto. c) Risulta f (1, 2) = −1, fx (1, 2) = −4 e fy (1, 2) = 1; pertanto verificare la differenziabilit` a di f in (1, 2) equivale a mostrare che L=
xy − 3x2 + 1 + 4(x − 1) − (y − 2) = 0. (x,y)→(1,2) (x − 1)2 + (y − 2)2 lim
Ponendo x = 1 + r cos θ , y = 2 + r sin θ e svolgendo i calcoli, si ha L = lim r cos θ(sin θ − 3 cos θ). r→0
Tale limite `e nullo grazie alla Proposizione 4.27 applicata con g(r) = 4r. 12. Si osservi che f (x, 0) = f (0, y) = 0; pertanto f (x, 0) − f (0, 0) = lim 0 = 0 , x→0 x f (0, y) − f (0, 0) = lim 0 = 0 . fy (0, 0) = lim y→0 y→0 y
fx (0, 0) = lim
x→0
La funzione `e certamente non differenziabile nell’origine in quanto non `e neppure continua; infatti il lim f (x, y) non esiste, come si vede facilmente calcolando (x,y)→(0,0)
il limite dapprima lungo gli assi coordinati, lim f (x, 0) = lim f (0, y) = 0 ,
x→0
y→0
e poi lungo la retta y = x, lim f (x, x) =
x→0
1 . 2
5.7 Esercizi
197
13. La funzione non `e differenziabile. 14. La funzione `e certamente differenziabile in tutti i punti (x, y) ∈ R2 con x = 0 per la Proposizione 5.8. Per studiare i punti appartenenti all’asse delle y, fissiamo un punto (0, y0 ) e ivi calcoliamo le derivate parziali. Non vi sono problemi per fy in quanto vale fy (x, y) = 2|x|y sin(x2 + y 2 ) ,
∀(x, y) ∈ R2 ,
e fy (0, y0 ) = 0. Per quanto riguarda fx si ha f (x, y0 ) − f (0, y0 ) |x| sin(x2 + y02 ) = lim . x→0 x→0 x x lim
√ Se y0 = ± nπ, con n ∈ N, risulta √ |x| (−1)n sin x2 = 0 , fx (0, ± nπ) = lim x→0 x altrimenti lim+
x→0
|x| sin(x2 + y02 ) = sin y02 , x
mentre
|x| sin(x2 + y02 ) = − sin y02 . x x→0 √ Dunque fx (0, y0 ) esiste solo per y0 = ± nπ. In tali punti `e anche continua e quindi f `e ivi differenziabile. lim−
15. La funzione `e continua se α ≥ 0; `e differenziabile se α > 0. 1 e pertanto fx (0, 0, 0) = 0 in quanto 16. Notiamo che f (x, 0, 0) = x2 sin |x|
f (x, 0, 0) − f (0, 0, 0) 1 = lim x sin = 0. x→0 x→0 x |x|
fx (0, 0, 0) = lim
Analogamente, si ha fy (0, 0, 0) = fz (0, 0, 0) = 0. Per studiare la differenziabilit` a nell’origine calcoliamo f (x, y, z) 1 = lim x2 + y 2 + z 2 sin . 2 2 2 2 (x,y,z)→(0,0,0) (x,y,z)→(0,0,0) x +y +z x + y2 + z2 lim
Tale limite `e nullo per il Teorema del doppio confronto in quanto 1 0 ≤ x2 + y 2 + z 2 sin ≤ x2 + y 2 + z 2 , x2 + y 2 + z 2 per ogni (x, y, z) = (0, 0, 0). 17. Si ha fx (x, y) = 2x + 3y , fy (x, y) = 3x − 2y e dunque
198
5 Calcolo differenziale per funzioni scalari
df(2,3) (Δx, Δy) = ∇f (2, 3) · (x − 2, y − 3) = 13(x − 2) . 5 4 Sia ora Δx = (2.05 − x0 , 2.96 − y0 ) = 100 , allora , − 100 Δf = f (2.05, 2.96) − f (2, 3) = 0.6449 mentre df(2,3)
5 4 ,− = 0.65 . 100 100
18. Differenziale di funzioni: a) Risulta fx (x, y) = ex cos y e fy (x, y) = −ex sin y. Allora df(x0 ,y0 ) (Δx, Δy) = ∇f (x0 , y0 ) · (Δx, Δy) = ex0 cos y0 Δx − ex0 sin y0 Δy . b) df(x0 ,y0 ) (Δx, Δy) = (sin x0 y0 + x0 y0 cos x0 y0 ) Δx + x20 cos x0 y0 Δy . 2x0 2y0 Δx + 2 Δy+ 2 2 + y0 + z0 x0 + y02 + z02 2z0 Δz . + 2 x0 + y02 + z02 1 x0 2x0 Δx − Δy − Δz . d) df(x0 ,y0 ,z0 ) (Δx, Δy, Δz) = 2 y0 + 2z0 (y0 + 2z0 ) (y0 + 2z0 )2 c) df(x0 ,y0 ,z0 ) (Δx, Δy, Δz) =
x20
19. Poich´e fx (x, y, z) = 3x2
y2 + z2 ,
x3 y fy (x, y, z) = , y2 + z2
x3 z fz (x, y, z) = , y2 + z2
si ha
32 24 df(2,3,4) (Δx, Δy, Δz) = 60Δx + Δy + Δz . 5 5 2 1 3 Posto Δx = − 100 , si ha , 100 , − 100 1 3 2 , ,− = −1.344 . df(2,3,4) − 100 100 100
√ Pertanto, linearizzando, possiamo approssimare il numero 1.983 3.012 + 3.972 con 1 3 2 , ,− = 40 − 1.344 = 38.656 . f (2, 3, 4) + df(2,3,4) − 100 100 100 20. Poich´e e
∂f ∂f 1 (x, y) = (x, y) = − ∂x ∂y (x + y + 1)2 ∂f ∂f sup (x, y) = sup (x, y) = 1 , (x,y)∈R ∂x (x,y)∈R ∂x
applicando la Proposizione 5.16, si ha che f `e lipschitziana in R con L = 21. La funzione `e lipschitziana su tutto R3 .
√ 2.
5.7 Esercizi
199
22. Polinomi di Taylor: a) Dobbiamo calcolare il polinomio di Taylor di f in x0 di ordine 2, ossia 1 T f2,x0 (x) = f (x0 ) + ∇f (x0 ) · (x − x0 ) + (x − x0 ) · Hf (x0 )(x − x0 ) . 2 Calcoliamo dapprima le derivate parziali prime e seconde: fx (x, y) = − sin x cos y
da cui fx (0, 0) = 0
fy (x, y) = − cos x sin y
da cui fy (0, 0) = 0
fxx (x, y) = − cos x cos y
da cui fxx (0, 0) = −1
fyy (x, y) = − cos x cos y
da cui fyy (0, 0) = −1
fxy (x, y) = fyx (x, y) = sin x sin y
da cui fxy (0, 0) = fyx (0, 0) = 0
Poich´e f (0, 0) = 1, risulta x · 0 −1 y 1 1 1 = 1 + (x, y) · (−x, −y) = 1 − x2 − y 2 . 2 2 2
1 T f2,(0,0) (x, y) = 1 + (x, y) · 2
−1
0
In alternativa, si pu` o ricordare che, per x → 0 e y → 0, 1 cos x = 1 − x2 + o(x2 ) , 2
1 cos y = 1 − y 2 + o(y 2 ) ; 2
pertanto, moltiplicando gli sviluppi e ricordando l’unicit` a del polinomio di Taylor, si ottiene direttamente l’espressione T f2,(0,0) (x, y) = 1 − 12 x2 − 12 y 2 . b) Risulta T f2,(1,1,1) (x, y, z) = e3 1 + (x − 1) + (y − 1) + (z − 1) + +
1 (x − 1)2 + (y − 1)2 + (z − 1)2 + 2
+(x − 1)(y − 1) + (x − 1)(z − 1) + (y − 1)(z − 1) . c) Si ha T f2,(0,0,1) (x, y, z) = cos 3 + sin 3 x + 2y − 3(z − 1) + 1 + cos 3 − x2 − 4y 2 − 9(z − 1)2 + 2 + cos 3 − 2xy + 6x(z − 1) + 6y(z − 1) .
200
5 Calcolo differenziale per funzioni scalari
23. Ricerca di punti stazionari e studio della loro natura: a) Si ha ∂f (x, y) = x2 − 2 . ∂y
∂f (x, y) = 2x(y + 1) , ∂x
Pertanto dalla condizione ∇f (x, y) = 0, si ottengono i punti stazionari P1 = √ √ ( 2, −1) e P2 = (− 2, −1). Poich´e ∂2f ∂2f (x, y) = 2(y + 1) , (x, y) = 0 , ∂x2 ∂y 2 ∂2f ∂2f (x, y) = (x, y) = 2x , ∂x∂y ∂y∂x la matrice hessiana calcolata nei punti stazionari vale √ √ 0 2 2 0 −2 2 Hf (P1 ) = , Hf (P2 ) = . √ √ 0 0 2 2 −2 2 In entrambi i casi, il determinante `e negativo e dunque i punti stazionari sono punti di sella. b) La funzione `e definita per x + y > 0, ossia nel semipiano dom f = {(x, y) ∈ R2 : y > −x}. Si ha y ∂f (x, y) = , ∂x x+y
∂f y (x, y) = log(x + y) + ; ∂y x+y
la condizione ∇f (x, y) = 0, conduce al sistema ⎧ y ⎪ =0 ⎨ x+y y ⎪ =0 ⎩ log(x + y) + x+y che ha come unica soluzione il punto stazionario P = (1, 0) ∈ dom f . Risulta ∂2f x y ∂2f 1 + (x, y) = − , (x, y) = , 2 2 ∂x (x + y) ∂y 2 x+y (x + y)2 ∂2f ∂2f x (x, y) = (x, y) = , ∂x∂y ∂y∂x (x + y)2 e dunque
Hf (P ) =
0 1 1 2
.
Poich´e il determinante della matrice hessiana vale −1 < 0, il punto P `e un punto di sella.
5.7 Esercizi
201
c) Si ha ∂f (x, y) = 1 + x5 , ∂x
∂f (x, y) = 4y 3 − 2y ∂y
e quindi, dalla condizione ∇f (x, y) = 0, si ottengono tre punti stazionari √ √ 2 2 , P3 = − 1, − . P2 = − 1, P1 = (−1, 0) , 2 2 Risulta ∂2f (x, y) = 5x4 , ∂x2
∂2f ∂2f (x, y) = (x, y) = 0 , ∂x∂y ∂y∂x
∂2f (x, y) = 12y 2 − 2 , ∂y 2
e dunque Hf (−1, 0) =
5 0 0 −2
Hf − 1,
,
√
5 0 2 2 = Hf − 1, − = . 2 2 0 4
√
La matrici hessiane sono tutte diagonali; in particolare quella relativa a P1 `e indefinita e quindi P1 `e un punto di sella; mentre quelle relative ai punti P2 e P3 sono definite positive e dunque entrambi i punti sono di minimo locale. d) Si ha x −x−y ∂f (x, y) = y 1 − e 5 6, ∂x 5
y −x−y ∂f (x, y) = x 1 − e 5 6. ∂y 6
Dalla condizione ∇f (x, y) = 0, si ottiene il sistema ⎧ x ⎪ =0 ⎨y 1 − 5 ⎪ ⎩x 1 − y = 0 6 e pertanto i punti stazionari sono P1 = (0, 0) e P2 = (5, 6). Risulta x y ∂2f 1 x y − 2 e− 5 − 6 , (x, y) = ∂x2 5 5 ∂2f ∂2f x y −x−y (x, y) = (x, y) = 1 − 1− e 5 6, ∂x∂y ∂y∂x 5 6 x y ∂2f 1 y − 2 e− 5 − 6 , (x, y) = x 2 ∂y 6 6 e dunque Hf (0, 0) =
0 1 1 0
,
Hf (5, 6) =
− 65 e−2 0
0 5 −2 −6e
.
202
5 Calcolo differenziale per funzioni scalari
Poich´e det Hf (0, 0) = −1 < 0, il punto P1 `e di sella per f ; inoltre det Hf (5, 6) = ∂2f (5, 6) < 0 e quindi P2 `e un punto di massimo relativo. In e−4 > 0 con ∂x2 quest’ultimo caso, il risultato si poteva ottenere osservando che entrambi gli autovalori sono negativi e quindi la matrice `e definita negativa. e) Si osservi che la funzione `e definita in tutto il piano tranne che sugli assi coordinati di equazione x = 0 e y = 0. Si ha 1 8 ∂f (x, y) = − 2 , ∂x y x
x ∂f (x, y) = − 2 − 1 . ∂y y
La condizione ∇f (x, y) = 0 fornisce un’unica soluzione P = (−4, 2). Studiamo la natura di tale punto stazionario. Risulta ∂2f 16 (x, y) = 3 , ∂x2 x
∂2f 1 ∂2f (x, y) = (x, y) = − 2 , ∂x∂y ∂y∂x y
e dunque
Hf (−4, 2) =
− 14
− 14
− 14
−1
∂2f 2x (x, y) = 3 , ∂y 2 y
.
3 ∂2f 1 Poich´e det Hf (−4, 2) = > 0 con (−4, 2) = − < 0, il punto P `e un 2 16 ∂x 4 punto di massimo relativo. f) Si noti che la funzione `e definita nell’insieme dom f = {(x, y) ∈ R2 : 2 − x2 > 0} √ ovvero nella striscia orizzontale delimitata dalle rette y = ± 2. Si ha ∂f 4xy (x, y) = − , ∂x 2 − x2
∂f (x, y) = 2 log(2 − x2 ) + 2y . ∂y
Dalla condizione ∇f (x, y) = 0, si trovano tre punti stazionari P1 = (1, 0), P2 = (−1, 0) e P3 = (0, − log 2). Risulta ∂2f 4y(x2 + 2) ∂2f (x, y) = − , (x, y) = 2 , 2 2 2 ∂x (2 − x ) ∂y 2 ∂2f ∂2f 4x (x, y) = (x, y) = − , ∂x∂y ∂y∂x 2 − x2 e dunque Hf (1, 0) =
0 −4 −4 2
,
Hf (−1, 0) =
0 4 4 2
,
5.7 Esercizi
Hf (0, − log 2) =
2 log 2 0 0 2
203
.
Poich´e det Hf (1, 0) = det Hf (−1, 0) = −16 < 0, i punti P1 e P2 sono entrambi punti di sella; il punto P3 `e un punto di minimo relativo in quanto la matrice hessiana Hf (P3 ) `e definita positiva. g) Si ha 2 3 ∂f (x, y) = 6(y 2 − x)e3x −6xy+2y ; ∂y
2 3 ∂f (x, y) = 6(x − y)e3x −6xy+2y , ∂x
dalla condizione ∇f (x, y) = 0, si trovano due punti stazionari P1 = (0, 0) e P2 = (1, 1). Risulta 2 3 ∂2f (x, y) = 6 1 + 6(x − y)2 e3x −6xy+2y , 2 ∂x 2 3 ∂2f ∂2f (x, y) = (x, y) = 6 − 1 + 6(y 2 − x)(x − y) e3x −6xy+2y , ∂x∂y ∂y∂x 2 3 ∂2f (x, y) = 6 2y + 6(y 2 − x)2 e3x −6xy+2y , 2 ∂y e dunque Hf (0, 0) =
6 −6 −6 0
,
Hf (1, 1) =
6e−1 −6e−1
−6e−1 12e−1
.
Poich´e det Hf (0, 0) = −36 < 0, il punto P1 `e di sella; inoltre det Hf (1, 1) = ∂2f (1, 1) = 6e−1 > 0, pertanto P2 `e un punto di minimo 36e−1 > 0 con ∂x2 relativo. h) La funzione `e definita nel semipiano x > 0. Si ha y ∂f (x, y) = , ∂x x
∂f (x, y) = log x ∂y
e quindi si trova un unico stazionario P = (1, 0). Risulta ∂2f y (x, y) = − 2 , ∂x2 x
∂2f 1 ∂2f (x, y) = (x, y) = , ∂x∂y ∂y∂x x
e dunque
Hf (1, 0) =
0 1 1 0
.
Poich´e det Hf (1, 0) = −1 < 0, il punto P `e un punto di sella.
∂2f (x, y) = 0 ∂y 2
204
5 Calcolo differenziale per funzioni scalari
i) Non vi sono punti stazionari in quanto 2y 2x , ∇f (x, y) = x2 + y 2 − 1 x2 + y 2 − 1 si annulla soltanto in (0, 0) che per`o non appartiene al dominio di f ; infatti dom f = {(x, y) ∈ R2 : x2 + y 2 > 1} ossia contiene i punti esterni alla cerchio di centro l’origine e raggio 1. ) Risulta ∂f 1 (x, y, z) = yz − 2 , ∂x x
1 ∂f (x, y, z) = xz − 2 , ∂y y
1 ∂f (x, y, z) = xy − 2 ∂z z
e ∇f (x, y, z) = 0 in P1 = (1, 1, 1) e P2 = −P1 . Inoltre, si ha 2 , x3 fxy (x, y) = fyx = z , fxx (x, y) =
2 , y3 fxz (x, y) = fzx = y ,
fyy (x, y) =
2 z3 fyz (x, y) = fzy = x fzz (x, y) =
e le matrici hessiane Hf (P1 ) e Hf (P2 ) sono definite positive (gli autovalori sono, per entrambe le matrici, λ1 = 1 con molteplicit` a 2 e λ2 = 4). In conclusione, P1 e P2 sono punti di minimo locale per f . 24. Il dominio della funzione `e l’insieme dom f = {(x, y) ∈ R2 : y 2 − x2 ≥ 0} . La disequazione y 2 −x2 ≥ 0 equivale a (y −x)(y +x) ≥ 0 e quest’ultima `e verificata se i fattori (y − x) e (y + x) hanno lo stesso segno. Dunque dom f = {(x, y) ∈ R2 : y ≥ x e y ≥ −x} ∪ {(x, y) ∈ R2 : y ≤ x e y ≤ −x} ; esso `e rappresentato nella Figura 5.10. Si ha ∂f x (x, y) = − , 2 ∂x y − x2
y ∂f (x, y) = . 2 ∂y y − x2
Osserviamo che i punti delle bisettrici y = x e y = −x non appartengono al dominio delle derivate parziali prime. Pertanto non vi sono punti stazionari. D’altra parte, si vede facilmente che f (x, x) = f (x, −x) = 0
e
f (x, y) ≥ 0 , ∀(x, y) ∈ dom f .
In definitiva, tutti i punti appartenenti alle bisettrici y = x e y = −x, ovvero i punti di coordinate (x, x) e (x, −x), sono punti di minimo assoluto per f . 25. Notiamo innanzitutto che la funzione `e definita nell’insieme dom f = {(x, y) ∈ R2 : 1 + y > 0}
5.7 Esercizi
205
y
y = −x
y=x x
Figura 5.10. Dominio della funzione f (x, y) =
p
y 2 − x2
che rappresenta il semipiano aperto delimitato dalla retta di equazione y = −1. Calcoliamo ora il gradiente della funzione
∂f ∂f x2 ∇f (x, y) = (x, y), (x, y) = 2x log(1 + y) + 2xy 2 , + 2x2 y . ∂x ∂y 1+y I punti stazionari sono i punti tali che ∇f (x, y) = 0; imponendo tale condizione, otteniamo il sistema ⎧ 2 ⎨ 2x log(1 + y) + y = 0 1 ⎩ x2 + 2y = 0 . 1+y Sono soluzioni tutti i punti (0, y) con y arbitrario > −1. Poich´e ∂2f (x, y) = 2 log(1 + y) + y 2 , 2 ∂x
∂2f ∂2f 1 (x, y) = (x, y) = 2x + 2y , ∂x∂y ∂y∂x 1+y
2 ∂ f 1 , (x, y) = x2 2 − ∂y 2 (1 + y)2 l’esame della matrice hessiana calcolata nei punti stazionari
2 log(1 + y) + y 2 0 Hf (0, y) = 0 0 non fornisce alcuna indicazione sulla loro natura. Possiamo studiare la natura dei punti stazionari esaminando direttamente l’espressione della funzione. Si osservi che f (x, y) = α(x)β(y) con α(x) = x2 e
206
5 Calcolo differenziale per funzioni scalari
β(y) = log(1 + y) + y 2 . Inoltre f (0, y) = 0, per ogni y > −1. Non `e difficile vedere che la funzione β(y) > 0 per y > 0 e β(y) < 0 per y < 0 (si confrontino i grafici delle funzioni elementari ϕ(y) = log(1 + y) e ψ(y) = −y 2 ). Dunque, per ogni (x, y) appartenente ad un opportuno intorno di (0, y) si ha f (x, y) ≥ 0
se y > 0
e
f (x, y) ≤ 0
se y < 0 .
Pertanto, per y > 0, i punti (0, y) sono punti di minimo relativo per f mentre, per y < 0, sono punti di massimo relativo. L’origine non `e n´e punto di massimo n´e punto di minimo per f .
6 Calcolo differenziale per funzioni vettoriali
Riprendiamo lo studio delle funzioni a valori vettoriali, iniziato nel Capitolo 4. Introduciamo dapprima varie definizioni legate alla differenziabilit` a di tali funzioni, tra le quali la nozione di matrice jacobiana, che raccoglie i gradienti delle componenti, ed i principali operatori differenziali del primo e del secondo ordine. Forniamo poi diversi strumenti di calcolo differenziale, tra cui `e particolarmente rilevante la cosiddetta regola della catena per il calcolo delle derivate delle funzioni composte. Essa sta alla base delle procedure di cambiamento di sistema di coordinate, che vengono illustrate in generale e poi dettagliate nei casi notevoli di passaggio alle coordinate polari, cilindriche e sferiche. La seconda parte del capitolo `e dedicata allo studio delle curve e delle superfici regolari, o regolari a pezzi, da un punto di vista differenziale. Partendo da un approccio analitico, focalizzato sullo studio delle funzioni che le descrivono, vengono gradualmente messi in luce gli aspetti geometrici, di natura intrinseca, di curve e superfici intese come oggetti nel piano o nello spazio. Sulle curve definiamo alcuni vettori fondamentali (tangente, normale, binormale e curvatura) e mostriamo come fissare un verso di percorrenza, scegliendolo tra due possibili. Sulle superfici definiamo il vettore normale e il piano tangente, discutiamo la possibilit` a di fissare un verso di attraversamento, che conduce alla distinzione tra superfici orientabili e non orientabili, e introduciamo i concetti di bordo e di superficie chiusa. Questi risultati costituiranno nel Capitolo 9 la base per costruire un calcolo integrale sulle curve e sulle superfici, e per stabilire i fondamentali Teoremi di Gauss, Green e Stokes.
6.1 Derivate parziali e matrice jacobiana Sia x0 ∈ dom f . Supponiamo che ogni componente fi di f ammetta in x0 tutte le ∂fi derivate parziali prime , j = 1, . . . , n, ossia che sia definito il vettore gradiente ∂xj ∂f ∂f ∂fi i i (x0 ) = (x0 ), . . . , (x0 ) , ∇fi (x0 ) = ∂xj ∂x1 ∂xn 1≤j≤n
208
6 Calcolo differenziale per funzioni vettoriali
che in questo contesto rappresentiamo come vettore riga. Definizione 6.1 La matrice a m righe ed n colonne ⎛ ⎞ ∇f1 (x0 ) ∂f ⎜ ⎟ i .. (x0 ) 1 ≤ i ≤ m = ⎝ Jf (x0 ) = ⎠ . ∂xj 1 ≤ j≤ n ∇fm (x0 ) dicesi matrice jacobiana di f in x0 . La matrice jacobiana viene anche indicata con Jf (x0 ) oppure con Df (x0 ). Notiamo in particolare che se f = f `e una funzione scalare (cio`e se m = 1), allora Jf (x0 ) = ∇f (x0 ) . Esempi 6.2 i) Consideriamo la funzione f : R3 → R2 , f (x, y, z) = xyz i + (x2 + y 2 + z 2 ) j. Calcolando le derivate parziali delle componenti f1 (x, y, z) = xyz e f2 (x, y, z) = x2 + y 2 + z 2 , otteniamo
yz xz xy . Jf (x, y, z) = 2x 2y 2z ii) Consideriamo la funzione f : Rn → Rn , f (x) = Ax + b , dove A = (aij ) 1≤ i ≤m ∈ Rm×n `e una matrice m × n e b = (bi )1≤i≤m ∈ Rm . La 1≤ j ≤n
componente i-esima di f `e data da fi (x) =
n
aij xj + bi
j=1
∂fi (x) = aij per ogni j = 1, . . . , n e per ogni x ∈ Rn . Dunque ∂xj Jf (x) = A. 2
e pertanto
6.2 Differenziabilit` a e lipschitzianit` a Prendiamo in esame alcuni concetti e risultati stabiliti nel capitolo precedente per le funzioni scalari ed esaminiamo come e quando si estendono al caso di funzioni vettoriali. Iniziando dalla differenziabilit` a, supponiamo che ogni componente di f sia differenziabile nel punto x0 ∈ dom f (si veda la Definizione 5.5), ossia valgano le formule, per i = 1, . . . , n, fi (x) = fi (x0 ) + ∇fi (x0 ) · (x − x0 ) + o(x − x0 ) ,
x → x0 .
6.2 Differenziabilit` a e lipschitzianit` a
209
Osserviamo che il prodotto scalare ∇fi (x0 ) · (x − x0 ) pu` o essere pensato come il prodotto tra il vettore riga ∇fi (x0 ) e il vettore colonna x − x0 . In base alla definizione di matrice jacobiana, le relazioni precedenti possono essere scritte in forma vettoriale come f (x) = f (x0 ) + Jf (x0 )(x − x0 ) + o(x − x0 ) ,
x → x0 .
(6.1)
Diremo quindi che f `e differenziabile in x0 . Come nel caso scalare, ponendo Δx = x − x0 , possiamo scrivere la relazione precedente come f (x0 + Δx) = f (x0 ) + Jf (x0 )Δx + o(Δx) ,
Δx → 0 ;
chiamiamo differenziale di f in x0 l’applicazione lineare dfx0 tra Rn ed Rm definita da dfx0 : Δx → Jf (x0 )Δx . La formula precedente dice che, a meno di infinitesimi di ordine superiore al primo, l’incremento Δf = f (x0 + Δx) − f (x0 ) `e approssimato dal valore del differenziale dfx0 = Jf (x0 )Δx. Come nel caso scalare, la (6.1) `e alla base della linearizzazione della funzione f in x0 , f (x) ∼ f (x0 ) + Jf (x0 )(x − x0 ) in un intorno di x0 , ossia dell’approssimazione di f mediante un polinomio di primo grado nella variabile x (polinomio di Taylor di ordine 1 in x0 ). Le Proposizioni 5.7 e 5.8 si estendono alle funzioni vettoriali, come si vede immediatamente ragionando componente per componente. Anche per le funzioni vettoriali si pu` o parlare di lipschitzianit` a. Gli enunciati seguenti generalizzano rispettivamente la Definizione 5.14 e la Proposizione 5.16. Sia R una qualunque regione contenuta in dom f . Definizione 6.3 La funzione f dicesi lipschitziana in R se esiste una costante L ≥ 0 tale che f (x1 ) − f (x2 ) ≤ Lx1 − x2 ,
∀x1 , x2 ∈ R .
(6.2)
La pi` u piccola costante L per cui vale la relazione precedente dicesi costante di Lipschitz di f in R. Ovviamente f `e lipschitziana in R se e solo se tutte le sue componenti lo sono.
210
6 Calcolo differenziale per funzioni vettoriali
Proposizione 6.4 Sia R una regione connessa contenuta in dom f . Se f `e differenziabile in tale insieme e se esiste M ≥ 0 tale che ∂fi ≤M, (x) ∀x ∈ R, i = 1, . . . , m , j = 1, . . . , n , ∂xj √ allora f `e lipschitziana in R con L = nm M . La dimostrazione segue facilmente dalla Proposizione 5.16 applicata a ciascuna componente di f . Passando poi ad esaminare il Teorema di Lagrange 5.12, per le funzioni vettoriali non vale un risultato analogo, ossia non `e detto che esista x ∈ S[a, b] tale che f (b) − f (a) = Jf (x)(b − a) (mentre ovviamente per ogni componente fi esiste un punto xi ∈ S[a, b] per cui vale la (5.10)). Un semplice esempio `e fornito dalla funzione (curva) f : R → R2 data da f (t) = (t2 , t3 ) con a = 0, b = 1, per la quale si ha f (1) − f (0) = (1, 1) mentre Jf (t) = (2t, 3t2 ). Non `e possibile trovare alcun 2 t tale che Jf (t)(b − a) = (2t, 3t ) = (1, 1). Si pu` o tuttavia dimostrare che, sotto ipotesi analoghe a quelle del Teorema 5.12, si ha f (b) − f (a) ≤ sup Jf (x) b − a , x∈S[a,b]
dove la norma della matrice jacobiana `e definita nel § 4.2. Da ultimo, estendiamo alle funzioni vettoriali il concetto di classe C k , introdotto nel § 5.4. Diremo che f `e di classe C k (con 0 ≤ k ≤ ∞) in un aperto Ω ⊆dom f , se n tutte le sue componenti sono di classe C k in Ω; scriveremo in tal caso f ∈ C k (Ω) . Analoga definizione vale sostituendo Ω con Ω.
6.3 Operatori differenziali notevoli Nel § 5.2 abbiamo visto che ad ogni funzione ϕ, definita in un aperto Ω di Rn a valori in R (campo scalare su Ω) e differenziabile in ogni punto di Ω, possiamo ∂ϕ associare le sue derivate parziali (prime) rispetto alle singole coordinate xj , ∂xj j = 1, . . . , n; esse rappresentano ancora campi scalari su Ω. Ogni applicazione ∂ϕ `e un operatore lineare, essendo ϕ → ∂xj ∂ ∂ϕ ∂ψ (λϕ + μψ) = λ +μ ∂xj ∂xj ∂xj per ogni coppia di funzioni ϕ e ψ differenziabili in Ω e per ogni coppia di scalari λ, μ ∈ R. Esso opera ad esempio tra C 1 (Ω) e C 0 (Ω), vale a dire ogni derivata
6.3 Operatori differenziali notevoli
211
parziale di una funzione di classe C 1 in Ω `e una funzione di classe C 0 in Ω; in ∂ generale, ogni operatore manda C k (Ω) in C k−1 (Ω), per ogni k ≥ 1. ∂xj 6.3.1 Operatori del primo ordine A partire dagli operatori di derivazione parziale (prima), possiamo definire vari operatori differenziali lineari del primo ordine, che agiscono su campi (scalari o vettoriali) definiti e differenziabili in Ω e forniscono campi (scalari o vettoriali) ancora definiti in Ω. Il primo di questi operatori `e gi` a noto, ed `e l’operatore gradiente, che associa ad ogni campo scalare definito e differenziabile in Ω il campo vettoriale le cui componenti sono le sue derivate parziali prime:
∂ϕ ∂ϕ ∂ϕ grad ϕ = ∇ϕ = = e1 + · · · + en . ∂xj 1≤j≤n ∂x1 ∂xn n Per quanto ricordato sopra, se ϕ ∈ C 1 (Ω), allora grad ϕ ∈ C 0 (Ω) ; in altri n termini, il gradiente `e un operatore lineare tra C 1 (Ω) e C 0 (Ω) . Introduciamo ora due altri operatori differenziali lineari notevoli. Definizione 6.5 La divergenza di un campo vettoriale f = f1 e1 + · · · + fn en , definito e differenziabile in Ω ⊆ Rn , `e il campo scalare ∂fj ∂f1 ∂fn + ··· + = . ∂x1 ∂xn ∂xj j=1 n
div f =
(6.3)
n L’operatore divergenza manda C 1 (Ω) in C 0 (Ω).
Definizione 6.6 Il rotore di un campo vettoriale f = f1 i + f2 j + f3 k, definito e differenziabile in Ω ⊆ R3 , `e il campo vettoriale
∂f1 ∂f2 ∂f3 ∂f2 ∂f3 ∂f1 i+ j+ k rot f = − − − ∂x2 ∂x3 ∂x3 ∂x1 ∂x1 ∂x2 ⎛ ⎞ i j k (6.4) ⎜ ∂ ∂ ∂ ⎟ ⎜ ⎟ = det ⎜ ⎟ ⎝ ∂x1 ∂x2 ∂x3 ⎠ f1
f2
f3
(ove il determinante va sviluppato rispetto alla prima riga). L’operatore rotore 3 3 manda C 1 (Ω) in C 0 (Ω) .
212
6 Calcolo differenziale per funzioni vettoriali
Come si vede, tale definizione di rotore si applica soltanto ai campi vettoriali tridimensionali. In dimensione 2, usualmente si definisce il rotore di un campo vettoriale f , definito e differenziabile in un aperto Ω ⊆ R2 , come il campo scalare rot f =
∂f2 ∂f1 − . ∂x1 ∂x2
(6.5)
Esso non `e altro che l’unica componente non nulla, la terza, del rotore del campo tridimensionale Φ(x1 , x2 , x3 ) = f1 (x1 , x2 )i + f2 (x1 , x2 )j + 0k, associato a f ; si ha cio`e rot Φ = 0i + 0j + (rot f ) k . (6.6) Sempre in dimensione 2, si definisce talvolta il rotore di un campo scalare ϕ, definito e differenziabile in un aperto Ω ⊆ R2 , come il campo vettoriale (bidimensionale) rot ϕ =
∂ϕ ∂ϕ i− j. ∂x2 ∂x1
(6.7)
Anche in questo caso, la definizione `e suggerita da un opportuno rotore tridimensionale: ponendo infatti Φ(x1 , x2 , x3 ) = 0i + 0j + ϕ(x1 , x2 )k, si vede immediatamente che si ha rot Φ = rot ϕ + 0k . La definizione di rotore per campi vettoriali in dimensione maggiore di 3 esula dagli scopi di questo testo. ` talvolta comodo introdurre un formalismo simbolico unitario per rappresenE tare gli operatori gradiente, divergenza e rotore. A tale scopo, indichiamo con ∇ il vettore simbolico le cui componenti sono gli operatori di derivazione parziale ∂ ∂ ,..., , ossia poniamo ∂x1 ∂xn
∂ ∂ ∂ ∇= = e1 + · · · + en . ∂xj 1≤j≤n ∂x1 ∂xn Allora, il gradiente di un campo scalare ϕ, che gi`a abbiamo indicato con la notazione ∇ϕ, pu` o essere pensato come il risultato della moltiplicazione (a destra) del vettore ∇ per lo scalare ϕ. Similmente, la (6.3) mostra che la divergenza di un campo vettoriale f `e ottenuta formando il prodotto scalare tra il vettore ∇ e il vettore f , e dunque possiamo scrivere div f = ∇ · f . Infine, in dimensione 3, il rotore di un campo vettoriale f `e ottenuto, come mostra la seconda uguaglianza in (6.4), formando il prodotto vettoriale tra il vettore ∇ e il vettore f ; pertanto possiamo scrivere rot f = ∇ ∧ f .
6.3 Operatori differenziali notevoli
213
Illustriamo ora il significato dei concetti di divergenza e rotore di un campo vettoriale tridimensionale, mostrando come ad esempio il primo sia legato alla variazione di volume di una particella di materia che si muova sotto l’effetto del campo vettoriale, mentre il secondo sia legato alla rotazione di un solido attorno ad un punto. Sia dunque f : R3 → R3 un campo vettoriale di classe C 1 , che supporremo avere derivate parziali prime limitate su tutto R3 . Per ogni x ∈ R3 , sia Φ(t, x) la traiettoria passante per x al tempo t = 0 generata dal campo f , ossia la soluzione del problema di Cauchy per il sistema differenziale autonomo
Φ = f (Φ) , t > 0 , Φ(0, x) = x . Come vedremo nel Cap. 10, sotto le ipotesi fatte la soluzione esiste per ogni tempo t ≥ 0, ed `e differenziabile con continuit` a tanto rispetto a t quanto rispetto a x. Fissiamo ora un aperto limitato Ω0 , e seguiamone l’evoluzione rispetto al tempo, considerando gli insiemi immagine attraverso Φ Ωt = Φ(t, Ω0 ) = {z = Φ(t, x) : x ∈ Ω0 } . Nel Cap. 8, introdurremo l’integrale triplo di una funzione g definita in Ωt , g(x, y, z) dx dy dz , Ωt
se g `e la funzione costante uguale a 1, esso rappresenta il volume dell’insieme Ωt . Ebbene, si pu` o dimostrare che vale la relazione y
Ω0
x x y
y
Ω1
x y
t=0
Ω2
t t = t1
t = t2
x
Figura 6.1. Evoluzione di una superficie per effetto di un campo bidimensionale a divergenza nulla: l’area si conserva
214
6 Calcolo differenziale per funzioni vettoriali
d dt
dx dy dz =
Ωt
div f dx dy dz ; Ωt
essa mostra come sia proprio la divergenza del campo f ad essere responsabile delle variazioni di volume lungo le traiettorie del campo. In particolare, se f `e tale che div f = 0 in tutto R3 , allora il volume dell’immagine di ogni aperto Ω0 resta costante nel tempo (si veda la Figura 6.1 per l’analoga situazione bidimensionale). Sia poi f (x) = Ax un particolare spostamento rigido di un solido tridimensionale S, e precisamente una rotazione attorno all’asse z di un angolo θ (in senso antiorario). In tal caso, la matrice A `e ortogonale (in quanto lascia invariate le distanze tra punti) ed `e data da ⎛ ⎞ cos θ sin θ 0 ⎜ ⎟ A = ⎝ − sin θ cos θ 0 ⎠ . 0
0
1
Si verifica facilmente che rot f = 0i + 0j − 2 sin θk ; dunque il rotore di f ha un’unica componente non nulla, nella direzione dell’asse di rotazione e dipendente dall’angolo di rotazione. Torniamo ora allo studio sistematico degli operatori gradiente, divergenza e rotore. Osserviamo innanzitutto, come gi` a fatto per il gradiente, che gli operatori divergenza e rotore sono lineari: div (λf + μg) = λ div f + μ div g , rot (λf + μg) = λ rot f + μ rot g per ogni coppia di campi vettoriali f , g e di scalari λ, μ. Inoltre, valgono le seguenti regole, che esprimono l’azione degli operatori gradiente, divergenza e rotore su vari tipi di prodotti tra campi (scalari e vettoriali) di classe C 1 : grad (ϕψ) = ψ grad ϕ + ϕ grad ψ , grad (f · g) = g Jf + f J g , div (ϕf ) = grad ϕ · f + ϕ div f , div (f ∧ g) = g · rot f − f · rot g , rot (ϕf ) = grad ϕ ∧ f + ϕ rot f , rot (f ∧ g) = f div g − g div f + g Jf − f J g . Tali formule sono una facile conseguenza delle definizioni e della regole di derivazione di un prodotto.
6.3 Operatori differenziali notevoli
215
In due casi notevoli, l’applicazione successiva di due degli operatori grad , div , rot su un campo sufficientemente regolare fornisce come risultato il campo nullo. Valgono infatti i seguenti risultati, che discendono facilmente dalle definizioni usando il Teorema 5.17 di Schwarz. Proposizione 6.7 i) Sia ϕ un campo scalare di classe C 2 in un aperto Ω di R3 . Allora rot grad ϕ = ∇ ∧ (∇ϕ) = 0
in Ω .
ii) Sia Φ un campo vettoriale di classe C 2 in un aperto Ω in R3 . Allora div rot Φ = ∇ · (∇ ∧ Φ) = 0
in Ω .
La versione bidimensionale `e la seguente. Proposizione 6.8 Sia ϕ un campo scalare di classe C 2 in un aperto Ω di R2 . Allora rot grad ϕ = 0
e
div rot ϕ = 0
in Ω .
Questi risultati ci portano allo studio dei campi aventi rispettivamente gradiente, rotore o divergenza nulli in un certo aperto Ω; tale problematica `e di notevole interesse applicativo. Gi`a sappiamo (Proposizione 5.13) che un campo scalare ϕ ha gradiente nullo in Ω se e solo se ϕ `e costante su ogni componente connessa di Ω. Per quanto riguarda il rotore e la divergenza, diamo innanzitutto le seguenti definizioni. Definizione 6.9 i) Un campo vettoriale f , definito e differenziabile in un aperto Ω di R3 e tale che ivi rot f = 0 dicesi irrotazionale in Ω. ii) Un campo vettoriale f definito e differenziabile in un aperto Ω di Rn e tale che ivi div f = 0 dicesi solenoidale in Ω.
Definizione 6.10 i) Un campo vettoriale f , definito in un aperto Ω di Rn dicesi conservativo in Ω se esiste un campo scalare ϕ tale che f = grad ϕ in Ω. La funzione ϕ dicesi potenziale (scalare) di f . ii) Un campo vettoriale f definito in un aperto Ω di R3 dicesi di tipo rotore in Ω se esiste un campo vettoriale Φ tale che f = rot Φ in Ω. Il campo Φ dicesi potenziale vettore di f .
216
6 Calcolo differenziale per funzioni vettoriali
Alla luce di queste definizioni, la Proposizione 6.7 pu` o essere riformulata nel modo seguente: i) Se un campo vettoriale f , di classe C 1 in un aperto Ω di R3 , `e ivi conservativo (e dunque ammette un potenziale di classe C 2 ), allora esso `e irrotazionale. ii) Se un campo vettoriale f , di classe C 1 in un aperto Ω di R3 , ammette potenziale vettore di classe C 2 , allora esso `e solenoidale. Equivalentemente, possiamo dire che i) condizione necessaria affinch´e un campo vettoriale f , di classe C 1 in un aperto Ω di R3 , sia conservativo `e che esso sia irrotazionale; ii) condizione necessaria affinch´e un campo vettoriale f , di classe C 1 in un aperto Ω di R3 , ammetta potenziale vettore di classe C 2 `e che esso sia solenoidale. ` naturale chiedersi se le condizioni necessarie ora esposte siano anche sufficienE ti per l’esistenza di un potenziale (rispettivamente scalare o vettore) del campo f . Tale questione verr` a affrontata nel § 9.6, limitatamente ai campi irrotazionali. In assenza di ipotesi aggiuntive sull’aperto Ω, la risposta sar` a negativa. Mostreremo infatti che esistono aperti di R3 , e su di essi campi vettoriali di classe C 1 e irrotazionali, che non sono conservativi. Forniremo per` o delle condizioni sugli aperti Ω, grazie alle quali la condizione necessaria diventa anche sufficiente. In particolare, mostreremo che ogni campo vettoriale di classe C 1 in un aperto convesso di R3 (dunque ad esempio l’interno di un cubo, di una sfera, di un ellissoide) `e irrotazionale se e solo se `e conservativo. Analoghi risultati valgono per i campi solenoidali, relativamente all’esistenza di un potenziale vettore. Esempi 6.11 i) Sia f il campo vettoriale affine f (x) = Ax + b , f : R3 → R3 , ` immediato dove A `e una matrice quadrata di ordine 3 e b `e un vettore di R3 . E verificare che div f = a11 + a22 + a33 , rot f = (a32 − a23 )i + (a31 − a13 )j + (a21 − a12 )k . Dunque, f `e solenoidale in R3 se e solo se la traccia di A, tr A = a11 + a22 + a33 , `e nulla. Invece f `e irrotazionale su R3 se e solo se la matrice A `e simmetrica. Poich´e R3 `e banalmente convesso, dire che f `e irrotazionale equivale a dire che f `e conservativo. Infatti, se A `e simmetrica, `e immediato verificare che un potenziale (scalare) per f `e dato da 1 ϕ(x) = x · Ax − b · x . 2 Similmente, dire che f `e solenoidale equivale a dire che f `e di tipo rotore. Infatti, se A ha traccia nulla, un potenziale vettore per f `e dato da 1 1 Φ(x) = (Ax) ∧ x + b ∧ x . 3 2 Notiamo infine che il campo f (x) = (y + z) i + (x − z) j + (x − y) k ,
6.3 Operatori differenziali notevoli
⎛
0 ⎜ corrispondente alla scelta A = ⎝ 1
1 0
1
217
⎞
⎟ −1 ⎠ e b = 0, `e un esempio di campo
1 −1 0 vettoriale simultaneamente irrotazionale e solenoidale. 3 ii) Sia f ∈ C 1 (Ω) . Per ogni x0 ∈ Ω, sia Jf (x0 ) la matrice jacobiana di f in x0 . Allora, sulla possiamo dire che (div f )(x0 ) = 0 base di quanto visto sopra, se e solo se tr Jf (x0 ) = 0, mentre rot f (x0 ) = 0 se e solo se Jf (x0 ) `e simmetrica. In particolare, il rotore di f `e una misura di quanto la matrice jacobiana di f sia dissimetrica. 2 Da ultimo, riportiamo senza dimostrazione un risultato che mette ulteriormente in luce il ruolo dei concetti introdotti nelle Definizioni 6.5 e 6.6 nello studio dei campi vettoriali. Teorema 6.12 Sia Ω un aperto convesso di R3 . Ogni campo vettoriale di classe C 1 in Ω si decompone (in modo non unico) nella somma di un campo 3 irrotazionale e di un campo solenoidale. In altri termini, dato f ∈ C 1 (Ω) , 3 esistono f (irr) ∈ C 1 (Ω) soddisfacente rot f (irr) = 0 in Ω, e f (sol) ∈ 3 1 C (Ω) soddisfacente div f (sol) = 0 in Ω, tali che f = f (irr) + f (sol) . Una tale rappresentazione prende il nome di decomposizione Helmholtz del campo f .
di
Esempio 6.13 Riprendiamo l’esempio di un campo vettoriale affine in R3 (Esempio 6.11 i)). Decomponiamo la matrice A nella somma della sua parte simmetrica A(sim) = 1 T (asim) = 12 (A − AT ), vale a dire 2 (A + A ) e della sua parte antisimmetrica A A = A(sim) + A(asim) . Ponendo f (irr) (x) = A(sim) x + b e f (sol) (x) = A(asim) x, si ottiene una decomposizione di Helmholtz di f , essendo f (irr) irrotazionale in quanto A(sim) `e simmetrica, ed f (sol) solenoidale in quanto gli elementi diagonali di una matri` poi ovvio che aggiungendo ad A(sim) una ce antisimmetrica sono tutti nulli. E qualunque matrice diagonale D avente traccia nulla e sottraendo ad A(asim) la stessa matrice, si ottengono nuovi campi irrotazionali f (irr) e solenoidali f (sol) che danno luogo a una diversa decomposizione di Helmholtz di f . 2
218
6 Calcolo differenziale per funzioni vettoriali
6.3.2 Operatori del secondo ordine L’applicazione successiva di due operatori differenziali lineari del primo ordine genera usualmente un operatore differenziale lineare del secondo ordine, ovviamente definito su un campo (scalare o vettoriale) sufficientemente regolare. Abbiamo tuttavia gi` a osservato (Proposizione 6.7) come l’applicazione successiva del gradiente e del rotore, oppure del rotore e della divergenza, su un campo di classe C 2 generi l’operatore nullo. Elenchiamo invece alcuni esempi di operatori del secondo ordine non banali e rilevanti nelle applicazioni: i) L’operatore div grad associa ad un campo scalare ϕ ∈ C 2 (Ω) il campo scalare appartenente a C 0 (Ω) div grad ϕ = ∇ · ∇ϕ =
n ∂2ϕ j=1
∂x2j
,
(6.8)
somma delle derivate parziali seconde pure di ϕ. L’operatore div grad viene detto operatore di Laplace, o semplicemente laplaciano, e viene sovente indicato con il simbolo Δ. Si ha quindi direttamente Δ=
∂2 ∂2 e1 + · · · + 2 en , 2 ∂x1 ∂xn
e l’espressione (6.8) pu` o essere scritta come Δϕ. Un’altra notazione comune per l’operatore di Laplace `e ∇2 , motivata in maniera intuitiva dalla seconda delle (6.8). Si noti per` o che l’espressione ∇2 ϕ non significa ∇(∇ϕ), che `e priva di senso rigoroso in quanto il gradiente ∇ non opera sui vettori bens`ı sugli scalari; essa deve essere intesa soltanto come una notazione abbreviata per ∇ · (∇ϕ). Una funzione ϕ soddisfacente Δϕ = 0 in un aperto Ω dicesi armonica in Ω. Le funzioni armoniche godono di importanti propriet` a matematiche, ed intervengono nella descrizione di vari fenomeni fisici. Ad esempio, il potenziale elettrostatico generato nel vuoto da una carica elettrica puntiforme posta nel punto x0 ∈ R3 `e una funzione armonica nell’aperto R3 \ {x0 }. ii) L’operatore di Laplace viene definito anche sui campi vettoriali, operando componente per componente. In altri termini, se f = f1 e1 + · · · fn en , si pone Δf = Δf1 e1 + · · · + Δfn en . n n Dunque il laplaciano vettoriale manda C 2 (Ω) in C 0 (Ω) . iii) L’operatore grad div trasforma n campi vettoriali in campi vettoriali; precisan mente manda C 2 (Ω) in C 0 (Ω) . 3 3 iv) Similmente, l’operatore rot rot manda C 2 (Ω) in C 0 (Ω) . I tre operatori vettoriali appena introdotti sono legati dall’identit` a Δf − grad div f + rot rot f = 0 .
6.4 Derivazione di funzioni composte
219
6.4 Derivazione di funzioni composte Studiamo ora le propriet` a di derivazione della composizione di funzioni vettoriali. Siano f : dom f ⊆ Rn → Rm e g : dom g ⊆ Rm → Rp due funzioni e sia x0 ∈ dom f tale che y0 = f (x0 ) ∈ dom g, in modo tale che sia definita la funzione composta h = g ◦ f : dom h ⊆ Rn → Rp , avendosi x0 ∈ dom h. Abbiamo gi` a osservato che la composizione di due funzioni continue `e continua (Proposizione 4.22). Per quanto riguarda la differenziabilit` a, vale il seguente risultato, la cui dimostrazione `e analoga a quella del caso unidimensionale n = m = p = 1. Teorema 6.14 Sia x0 ∈ dom h. Supponiamo che f sia differenziabile in x0 e g sia differenziabile in y0 = f (x0 ). Allora h = g ◦ f `e differenziabile in x0 e la sua matrice jacobiana `e data da J (g ◦ f )(x0 ) = J g(y0 ) Jf (x0 )
(6.9)
Si noti che Jf (x0 ) `e una matrice m×n, J g(y0 ) `e una matrice p×m e dunque il prodotto matriciale a secondo membro `e ben definito e fornisce una matrice p × n. Esplicitiamo ora la relazione (6.9), esprimendo le derivate parziali delle componenti di h in funzione di quelle di f e di g. A tale scopo poniamo x = (xj )1≤j≤n e siano y = f (x) = fk (x) 1≤k≤m , z = g(y) = gi (y) 1≤i≤p , e
z = h(x) = hi (x) 1≤i≤p .
Allora l’elemento di riga i e colonna j della matrice Jh(x0 ) `e dato da ∂gi ∂hi ∂fk (x0 ) = (y0 ) (x0 ) . ∂xj ∂yk ∂xj m
(6.10)
k=1
Tali relazioni possono essere scritte in forma compatta e di facile memorizzazione come ∂zi ∂zi ∂yk (x0 ) = (y0 ) (x0 ) , ∂xj ∂yk ∂xj m
1 ≤ i ≤ p, 1 ≤ j ≤ n;
(6.11)
k=1
questa formula `e nota come regola della catena per la derivazione delle funzioni composte.
220
6 Calcolo differenziale per funzioni vettoriali
Esempi 6.15 i) Siano f = (f1 , f2 ) : R2 → R2 e g : R2 → R due funzioni differenziabili. Sia h = g ◦ f : R2 → R, la funzione composta, ossia h(x, y) = g f1 (x, y), f2 (x, y) . Allora ∇h(x) = ∇g f (x) Jf (x) , (6.12) ossia, posto u = f1 (x, y) e v = f2 (x, y), ∂h ∂g ∂f1 ∂g ∂f2 (x, y) = (u, v) (x, y) + (u, v) (x, y) ∂x ∂u ∂x ∂v ∂x ∂h ∂g ∂f1 ∂g ∂f2 (x, y) = (u, v) (x, y) + (u, v) (x, y) . ∂y ∂u ∂y ∂v ∂y ii) Sia ϕ : I ⊆ R → R una funzione derivabile, e f : R2 → R una funzione differenziabile. Allora la funzione composta h(x) = f x, ϕ(x) `e derivabile in I e si ha h (x) =
∂f ∂f dh (x) = x, ϕ(x) + x, ϕ(x) ϕ (x) ; dx ∂x ∂y
2 tale risultato segue dal Teorema 6.14, essendo h = f ◦ Φ con Φ : I → R data da Φ(x) = x, ϕ(x) .
Si noti che, quando una funzione dipende da una sola variabile, il simbolo di derivata parziale presente nella formula generale (6.9) viene sostituito dal pi` u preciso simbolo di derivata ordinaria. iii) Consideriamo una curva γ : I ⊆ R → R3 avente componenti γi derivabili e una funzione differenziabile f : R3 → R. Sia h = f ◦ γ : I → R la funzione composta. Allora, h (t) = ∇f γ(t) · γ (t) , (6.13) ossia, posto (x, y, z) = γ(t), si ha dh ∂f dγ1 ∂f dγ2 ∂f dγ3 (t) = (x, y, z) (t) + (x, y, z) (t) + (x, y, z) (t) . dt ∂x dt ∂y dt ∂z dt 2 Come applicazione del Teorema 6.14, possiamo estendere al caso multidimensionale il risultato, noto allo studente, relativo alla derivata della funzione inversa (Vol. I, Teorema 6.9). Mostriamo come, sotto opportune ipotesi, la matrice jacobiana della funzione inversa `e data dall’inversa della matrice jacobiana della funzione. Daremo nel § 7.1.1 una condizione sufficiente affinch´e valgano le ipotesi fatte nel seguente corollario.
6.4 Derivazione di funzioni composte
221
Corollario 6.16 Sia f : dom f ⊆ Rn → Rn una funzione differenziabile in x0 con Jf (x0 ) non singolare; supponiamo inoltre che f sia invertibile in un intorno di x0 , e che la funzione inversa f −1 sia differenziabile in y0 = f (x0 ). Si ha allora −1 J (f −1 )(y0 ) = Jf (x0 ) . Dim.
` sufficiente applicare il teorema con g = f −1 , notando che h = f −1 ◦ f E `e la funzione identit` a (soddisfacente h(x) = x per ogni x in un intorno di x0 ) e dunque J h(x0 ) = I. Si ha quindi J (f −1 )(y0 ) Jf (x0 ) = I , da cui segue la tesi essendo Jf (x0 ) invertibile.
2
6.4.1 Un’applicazione: le funzioni definite mediante integrali Vediamo ora un nuovo modo per definire una funzione, che parte da una funzione data dipendente da due variabili (scalari o vettoriali) e applica l’integrazione definita rispetto ad una delle due variabili. Funzioni cos`ı ottenute intervengono in molteplici applicazioni, ad esempio nella descrizione matematica di campi elettromagnetici. Ci limitiamo nel seguito a trattare il caso in cui la funzione assegnata dipende da due variabili scalari, ma l’estensione a situazioni molto pi` u generali non pone difficolt` a concettuali. Sia dunque g una funzione reale definita sull’insieme R = I × J ⊂ R2 , dove I `e un qualunque intervallo della retta reale mentre J = [a, b] `e un intervallo chiuso e limitato. Supponiamo che g sia continua su R. Introduciamo allora la funzione di una variabile reale b f (x) = g(x, y) dy , (6.14) a
che risulta definita su tutto I, in quanto per ogni x ∈ I la funzione y → g(x, y) `e continua e dunque integrabile su J. Valgono per f le seguenti propriet` a, per la cui dimostrazione si rimanda a ; Complementi al Cap. 6 . Proposizione 6.17 La funzione f definita in (6.14) `e continua su I. Se ∂g inoltre g ammette derivata parziale definita e continua su R, allora f `e ∂x di classe C 1 su I e si ha b ∂g (x, y) dy . f (x) = a ∂x
222
6 Calcolo differenziale per funzioni vettoriali
La relazione precedente `e una regola di derivazione sotto segno di integrale: le operazioni di derivazione rispetto a una delle due variabili e di integrazione rispetto all’altra variabile commutano tra di loro, vale a dire b b d ∂g (x, y) dy . g(x, y) dy = dx a a ∂x La formula precedente pu` o essere facilmente estesa alle derivate di ordine superiore, nella forma b k ∂ g (k) f (x) = (x, y) dy , k ≥ 1, k ∂x a a condizione che la funzione integranda esista e sia continua su R. Una definizione pi` u generale della (6.14) `e la seguente
β(x)
f (x) =
g(x, y) dy ,
(6.15)
α(x)
dove α e β sono funzioni definite su I a valori in [a, b]. Notiamo che la funzione integrale x f (x) = g(y) dy , a
gi` a considerata nell’ambito del calcolo integrale per funzioni di una variabile (Vol. I, § 9.8), rientra come caso particolare nell’espressione precedente. La Proposizione 6.17 si generalizza nel modo seguente. Proposizione 6.18 Se le funzioni α e β sono continue su I, la funzione f ∂g definita in (6.15) `e continua su I. Se inoltre g ammette derivata parziale ∂x definita e continua su R e le funzioni α e β sono di classe C 1 su I, allora f `e di classe C 1 su I e si ha β(x) ∂g (x, y) dy + β (x)g x, β(x) − α (x)g x, α(x) . f (x) = (6.16) α(x) ∂x Dim.
Ci limitiamo ad ottenere la formula precedente, rinviando per la dimostrazione completa a ; Complementi al Cap. 6 . Introduciamo la funzione ausiliaria q F (x, p, q) = g(x, y) dy , p
definita su I × J 2 ; essa ammette in tutto il suo dominio derivate parziali prime continue, date da
6.5 Curve regolari
223
q ∂F ∂g (x, p, q) = (x, y) dy , ∂x ∂x p ∂F ∂F (x, p, q) = −g(x, p) , (x, p, q) = g(x, q) , ∂p ∂q
le ultime due relazioni essendo conseguenza del Teorema fondamentale del calcolo integrale. Il risultato segue allora dal fatto che f (x) = F x, α(x), β(x) , applicando la regola della catena df ∂F (x) = x, α(x), β(x) + dx ∂x ∂F ∂F + x, α(x), β(x) α (x) + x, α(x), β(x) β (x) , ∂p ∂q
2
Esempio 6.19 Consideriamo la funzione
x2
f (x) = x
2
e−xy dy , y −xy 2
che `e della forma (6.15) ponendo g(x, y) = e y , α(x) = x e β(x) = x2 . Notiamo che la funzione g non `e integrabile elementarmente rispetto a y, e dunque non possiamo calcolare esplicitamente i valori di f (x). La funzione g `e di classe C 1 su una qualunque regione chiusa contenuta nel primo quadrante x > 0, y > 0, mentre le funzioni α e β sono ovunque regolari. Possiamo quindi applicare la Proposizione 6.18, e dedurre che f `e di classe C 1 sulla semiretta (0, +∞); la sua derivata `e data da x2 2 f (x) = − ye−xy dy + g(x, x2 ) 2x − g(x, x) x −xy 2 y=x2 e
5 3 2 1 5 −x5 3 −x3 e e + e−x − e−x = − . y y=x x x 2x 2x Possiamo usare tale risultato per studiare il comportamento di f nell’intorno di x0 = 1. Si ha f (1) = 0 e f (1) = e−1 ; inoltre, derivando ulteriormente l’espressione di f (x), otteniamo f (1) = −7e−1 . Concludiamo che 7 1 f (x) = (x − 1) − (x − 1)2 + o (x − 1)2 , x → 1, e 2e ossia f `e positiva, crescente e concava nell’intorno di x0 . 2
=
6.5 Curve regolari Ricordiamo che le curve sono state introdotte nel § 4.6. Diremo che una curva γ : I → Rm `e derivabile se le sue componenti xi : I → R, i ≤ i ≤ m, sono funzioni derivabili su I (ricordiamo che una funzione `e derivabile su un intervallo I se `e derivabile in tutti i punti interni ad I ed `e
224
6 Calcolo differenziale per funzioni vettoriali T (t) S(t)
γ (t0 )
γ(t) σ PΔt = γ(t0 + Δt) P0 = γ(t0 )
Figura 6.2. Vettori tangente e secante a una curva nel punto P0
derivabile unilateralmente negli eventuali estremi appartenenti I). Indichiamo "ad m con γ : I → Rm la funzione derivata γ (t) = xi (t) 1≤i≤m = i=1 xi (t)ei . Definizione 6.20 Una curva γ : I → Rm dicesi regolare se `e derivabile su I con derivata continua (ovvero le componenti sono funzioni di classe C 1 su I) e se γ (t) = 0, per ogni t ∈ I. Una curva γ : I → Rm dicesi regolare a tratti se I `e unione di un numero finito di intervalli su cui γ `e regolare. Se γ `e una curva regolare e se t0 ∈ I, possiamo dare la seguente intepretazione geometrica del vettore γ (t0 ) (si veda la Figura 6.2). Posto P0 = γ(t0 ) sia t0 +Δt ∈ I tale che il punto PΔt = γ(t0 + Δt) sia diverso da P0 . Consideriamo la retta passante per P0 e PΔt ; ricordata la (4.24), tale retta pu` o essere parametrizzata come t − t0 γ(t0 + Δt) − γ(t0 ) S(t) = P0 + PΔt − P0 = γ(t0 ) + (t − t0 ) . Δt Δt
(6.17)
Facendo tendere Δt a 0, il punto PΔt tende a P0 (nel senso che ogni componente di PΔt tende verso la corrispondente componente di P0 ). Nel contempo, grazie γ(t0 + Δt) − γ(t0 ) tende all’ipotesi di regolarit` a di γ, il vettore σ = σ(t0 , Δt) = Δt a γ (t0 ). Dunque la posizione limite della retta (6.17) `e la retta T (t) = γ(t0 ) + γ (t0 )(t − t0 ) ,
t ∈ R,
tangente al sostegno della curva in P0 . Ci` o giustifica la seguente definizione.
6.5 Curve regolari
225
Definizione 6.21 Sia γ : I → Rm una curva regolare, e sia t + 0 ∈ I. Il vettore γ (t0 ) dicesi vettore tangente al sostegno della curva nel punto P0 = γ(t0 ). A rigore, il vettore tangente al sostegno in P0 `e il vettore applicato P0 , γ (t0 ) , ma comunemente lo si indica semplicemente con γ (t0 ). Vedremo nel seguito che la retta tangente al sostegno di una curva in un punto `e intrinseca al sostegno, cio`e non dipende dalla parametrizzazione scelta; invece il vettore tangente dipende dalla parametrizzazione per quanto riguarda modulo e verso. Da un punto di vista cinematico, una curva in R3 rappresenta la traiettoria di una particella che al tempo t occupa la posizione γ(t) nello spazio. Se la curva `e regolare, il vettore γ (t) rappresenta la velocit`a della particella al tempo t. Esempi 6.22 ` facile verificare che tutte le curve considerate negli Esempi 4.33 sono regolari. i) E ii) Sia ϕ : I → R una funzione derivabile con continuit` a sull’intervallo I; la curva γ(t) = t, ϕ(t) , t∈I, `e una curva regolare avente come sostegno il grafico della funzione ϕ. Si osservi infatti che per ogni t ∈ I . γ (t) = 1, ϕ (t) = (0, 0) , iii) L’arco γ : [0, 2] → R2
γ(t) =
(t, 1) , (t, t) ,
t ∈ [0, 1) , t ∈ [1, 2] ,
`e una parametrizzazione della poligonale ABC (si veda la Figura 6.3, a sinistra); invece l’arco ⎧ t ∈ [0, 1) , ⎪ ⎨ (t, 1) , t ∈ [1, 2) , γ(t) = (t, t) , ⎪ ⎩ 4 − t, 2 − 1 (t − 2) , t ∈ [2, 4] , 2 `e una parametrizzazione della poligonale ABCA (si veda la Figura 6.3, a destra). Entrambe le curve sono regolari a tratti. iv) Le curve
√ √ γ(t) = 1 + 2 cos t, 2 sin t , t ∈ [0, 2π] , √ √ 1 (t) = 1 + 2 cos 2t, − 2 sin 2t , γ t ∈ [0, π] ,
sono due parametrizzazioni (la prima antioraria,√la seconda oraria) della stessa circonferenza C, avente centro in (1, 0) e raggio 2. Esse sono regolari e le loro derivate sono date da √ √ 1 (t) = 2 2 − sin 2t, − cos 2t . γ (t) = 2 − sin t, cos t , γ
226
6 Calcolo differenziale per funzioni vettoriali
C
1
1 B
A
O
C
1
B
A
2
O
1
2
Figura 6.3. Poligonale ABC (a sinistra) e ABCA (a destra) definite nell’Esempio 6.22 iii)
Il punto P0 = (0, 1) ∈ C `e immagine mediante γ del valore t0 = 34 π del parametro 1 del valore 1 1 (1 e mediante γ t0 = 58 π del parametro, ossia P0 = γ(t0 ) = γ t0 ). Nel primo caso il vettore tangente `e γ (t0 ) = (−1, −1) e la retta tangente a C in P0 `e data da 3 3 3 T (t) = (0, 1) − (1, 1) t − π = − t + π, 1 − t + π , t ∈ R, 4 4 4 1 (1 mentre nel secondo caso si ha γ t0 ) = (2, 2) e 5 5 5 t ∈ R. T1(t) = (0, 1) + (2, 2) t − π = 2(t − π), 1 + 2(t − π) , 8 8 8 I vettori tangenti in P0 hanno verso e lunghezza diversi, ma la retta tangente `e la stessa. In effetti, ricordando l’Esempio 4.33 i), in entrambi i casi si ottiene y = 1 + x. v) La curva γs : R → [0, +∞) × R2 , definita in coordinate sferiche dalla relazione π 1 γs (t) = r(t), ϕ(t), θ(t) = 1, (1 + sin 8t), t , 2 2 descrive il moto periodico di un punto P (t) giacente sulla superficie della sfera unitaria, che ruota attorno all’asse z e nel contempo oscilla tra i due paralleli di colatitudine ϕmin = π4 e ϕmax = 34 π (si veda la Figura 6.4). La curva `e regolare, essendo γs (t) = (0, 2π cos 8t, 1) . 2
6.5.1 Congruenza tra curve; orientazione Introduciamo ora alcune utili relazioni tra le curve che parametrizzano uno stesso sostegno.
6.5 Curve regolari
227
z
Γ
y x
t=0
Figura 6.4. Moto di un punto sulla superficie sferica (Esempio 6.22 v))
Definizione 6.23 Siano γ : I → Rm e δ : J → Rm due curve regolari. Esse si dicono congruenti se esiste una biiezione ϕ : J → I, derivabile con derivata continua e ovunque diversa da 0, tale che δ =γ◦ϕ (cio`e tale che δ(τ ) = γ ϕ(τ ) per ogni τ ∈ J). ` importante per il seguito osservare che due curve congruenti hanno lo stesso E sostegno. Infatti, x = δ(τ ) se e solo se x = γ(t) con t = ϕ(τ ). Inoltre, i vettori tangenti al loro sostegno in uno stesso punto P0 = γ(t0 ) = δ(τ0 ) sono allineati, in quanto derivando la δ(τ ) = γ ϕ(τ ) in τ0 si ha (6.18) δ (τ0 ) = γ ϕ(τ0 ) ϕ (τ0 ) = γ (t0 )ϕ (τ0 ) , con ϕ (τ0 ) = 0. Ne segue che la retta tangente in P0 `e la stessa per entrambe le curve. Notiamo che la funzione ϕ, che lega tra loro due curve congruenti γ e δ secondo la Definizione 6.23, `e tale che ϕ `e sempre > 0 oppure sempre < 0 in J; infatti per ipotesi ϕ `e una funzione continua diversa da zero su J, dunque `e di segno costante per il Teorema di esistenza degli zeri. Pertanto, possiamo classificare le curve congruenti nel modo seguente. Definizione 6.24 Due curve congruenti γ : I → Rm e δ : J → Rm si dicono equivalenti se la biiezione ϕ : J → I ha derivata strettamente positiva, mentre si dicono anti-equivalenti se ϕ ha derivata strettamente negativa.
228
6 Calcolo differenziale per funzioni vettoriali
Un esempio rilevante di curva anti-equivalente a una curva data `e fornito nel seguito. Definizione 6.25 Sia γ : I → Rm una curva regolare. Detto −I l’intervallo {t ∈ R : −t ∈ I}, la curva −γ : −I → Rm definita da (−γ)(t) = γ(−t) si chiama l’ opposta di γ ed `e anti-equivalente a γ.
Infatti possiamo scrivere (−γ) = γ ◦ ϕ, dove ϕ : −I → I `e la biiezione ϕ(t) = −t. Notiamo che se γ : [a, b] → Rm `e un arco di curva regolare, allora −γ `e un arco regolare definito sull’intervallo [−b, −a]. Osserviamo allora che se γ e δ sono due curve anti-equivalenti, possiamo scrivere δ(τ ) = γ ϕ(τ ) = γ − (−ϕ(τ )) = (−γ) ψ(τ ) avendo posto ψ : J → −I, ψ(τ ) = −ϕ(τ ). Essendo ψ (τ ) = −ϕ (τ ) > 0, le curve δ e (−γ) saranno equivalenti. Dunque siamo giunti alla seguente conclusione. Propriet` a 6.26 Due curve congruenti o sono equivalenti oppure l’una `e equivalente all’opposta dell’altra. Alla luce di questo risultato, useremo la notazione δ ∼ γ per indicare due curve equivalenti, e δ ∼ −γ per indicare due curve anti-equivalenti. Ricordando la (6.18), possiamo affermare che due curve equivalenti hanno vettori tangenti al loro sostegno disposti nello stesso verso, mentre per due curve anti-equivalenti, i vettori tangenti hanno verso opposto. Proseguiamo il nostro studio aggiungendo l’ipotesi che le curve siano semplici. Innanzitutto, `e immediato verificare che tutte le curve congruenti a una curva semplice sono ancora semplici. Inoltre, si pu` o dimostrare la seguente propriet` a. Proposizione 6.27 Se Γ `e il sostegno di una curva regolare e semplice γ, ogni altra curva regolare e semplice δ che ha Γ come sostegno `e necessariamente congruente a γ. Pertanto, tutte le parametrizzazioni di Γ mediante curve semplici e regolari si dividono in due classi: due curve stanno nella stessa classe se sono equivalenti, stanno in classi diverse se sono anti-equivalenti. A ciascuna classe possiamo allora associare un’orientazione o verso di percorrenza di Γ . Presa infatti una qualunque parametrizzazione di Γ , diciamo che il punto P2 = γ(t2 ) segue il punto P1 = γ(t1 ) rispetto a γ se t2 > t1 (si veda la Figura 6.5). Ebbene, `e facile verificare che se δ `e equivalente a γ, allora P2 seguir` a P1 anche rispetto a tale parametrizzazione, cio`e P2 = δ(τ2 ) e P1 = δ(τ1 ) con τ2 > τ1 . Viceversa, se δ `e anti-equivalente
6.5 Curve regolari
229
z
P2
Γ P1
y x Figura 6.5. Un arco Γ in R3 e una sua orientazione
a γ, sar` a P2 = δ(τ2 ) e P1 = δ(τ1 ) con τ2 < τ1 , ossia P1 seguir` a P2 rispetto alla nuova parametrizzazione. In base a quanto detto sopra, l’orientazione di Γ pu` o anche essere individuata dal verso dei vettori tangenti a Γ . Le osservazioni precedenti giustificano il fatto che `e comune pensare a una curva regolare e semplice come a un oggetto geometrico, piuttosto che a una sua parametrizzazione. Diamo quindi la seguente definizione. Definizione 6.28 Un sottoinsieme Γ di Rm `e una curva regolare e semplice se esso pu` o essere descritto come il sostegno di una curva avente tali propriet` a. Se necessario, si associa a Γ una delle due orientazioni possibili. L’assegnazione di Γ e di una sua orientazione determina quindi una classe di curve semplici e regolari tra loro equivalenti; all’interno di tale classe, si andr` a a scegliere la parametrizzazione pi` u opportuna per i propri scopi. Tutte le definizioni e propriet` a date finora per curve regolari possono essere facilmente adattate al caso delle curve regolari a tratti. 6.5.2 Lunghezza di un arco e ascissa curvilinea Sia γ : [a, b] → Rm un arco regolare; definiamo lunghezza di γ il numero
b
(γ) = a
γ (t) dt =
b a
+ ,m , 2 x (t) dt . i
(6.19)
i=1
Tale definizione trova la seguente giustificazione geometrica (si veda la Figura 6.6). Introduciamo una suddivisione di [a, b] mediante i punti a = t0 < t1 < . . . , tK−1 < tK = b e consideriamo i punti Pk = γ(tk ) ∈ Γ , k = 0, . . . , K. Tali punti individuano una poligonale in Rm (eventualmente degenere) la cui lunghezza `e data da
230
6 Calcolo differenziale per funzioni vettoriali PK = γ(tK )
P0 = γ(t0 ) Pk−1
Pk Figura 6.6. Approssimazione mediante una poligonale del sostegno di un arco
(t0 , t1 , . . . , tK ) =
K
dist (Pk−1 , Pk )
k=1
dove dist (Pk−1 , Pk ) = Pk −Pk−1 `e la distanza euclidea di due punti. Osserviamo che si ha + + 2 , m ,m Δxi , 2 , Pk − Pk−1 = xi (tk ) − xi (tk−1 ) = Δtk Δt i=1 i=1 k
avendo posto Δtk = tk − tk−1 e
xi (tk ) − xi (tk−1 ) Δxi . = Δt k tk − tk−1 Si ha dunque (t0 , t1 , . . . , tK ) =
K k=1
Δxi Δt
2 Δtk ; k
si noti l’analogia con l’ultimo integrale della (6.19), di cui tale espressione pu`o considerarsi un’approssimazione. Si dimostra che, se la curva `e regolare a tratti, l’estremo superiore della quantit` a (t0 , t1 , . . . , tK ), al variare di tutte le possibili suddivisioni di [a, b], `e finito e coincide con (γ). Osserviamo che la lunghezza di un arco, cos`ı come definita dalla (6.19), dipende non solo dal sostegno Γ dell’arco, ma anche dalla particolare parametrizzazione scelta. Ad esempio, se parametrizziamo la circonferenza di equazione x2 + y 2 = r2 mediante γ1 (t) = (r cos t, r sin t), t ∈ [0, 2π], abbiamo 2π (γ1 ) = r dt = 2πr , 0
6.5 Curve regolari
231
come ben noto dalla geometria elementare. Se invece usiamo la parametrizzazione γ2 (t) = (r cos 2t, r sin 2t), t ∈ [0, 2π] otteniamo
2π
(γ2 ) =
2r dt = 4πr . 0
In questo secondo caso, la circonferenza `e stata percorsa due volte. Ricordando la (6.18), `e facile verificare che due archi congruenti hanno la stessa lunghezza (si veda anche la successiva Proposizione 9.3, in cui si ponga f = 1). Dimostreremo nel § 9.1 che la lunghezza di un arco semplice (o di Jordan) dipende solo dal suo sostegno Γ ; essa viene detta lunghezza di Γ e indicata con (Γ ). Nell’esempio precedente, γ1 `e semplice mentre γ2 non lo `e; come si `e visto, la lunghezza (Γ ) della circonferenza `e data da (γ1 ). Sia γ una curva regolare definita sull’intervallo I. Fissiamo un punto arbitrario t0 ∈ I e introduciamo la funzione s : I → R definita da
t
s(t) =
γ (τ ) dτ .
(6.20)
t0
Ricordando l’espressione della lunghezza di un ha ⎧ ⎨ (γ|[t0 ,t] ) s(t) = 0 ⎩ −(γ |[t,t0 ] )
arco regolare data dalla (6.19), si t > t0 , t = t0 , t < t0 .
La funzione s permette di definire una curva equivalente a γ che fornisce una nuova parametrizzazione del sostegno di γ. Infatti, ricordando il Teorema fondamentale del calcolo integrale e la definizione di curva regolare, si ha s (t) = γ (t) > 0 ,
∀t ∈ I ;
pertanto la funzione s `e strettamente crescente e dunque invertibile su I. Detto J = s(I), l’intervallo immagine di I attraverso s, indichiamo con t : J → I ⊆ R la funzione inversa di s. In altri termini, esprimiamo il parametro t in funzione 1 : J → Rm definita come di un nuovo parametro s, come t = t(s). La curva γ 1 (s) = γ(t(s)) `e equivalente a γ (in particolare ha lo stesso sostegno Γ ). Se γ 1 (s1 ) con t1 e s1 legati P1 = γ(t1 ) `e un punto arbitrario su Γ , avremo anche P1 = γ dalla relazione t1 = t(s1 ). Il numero s1 `e detto ascissa curvilinea di P1 . Ricordando l’espressione della derivata di una funzione inversa, si osservi che 1 (s) = γ da cui segue
dt dγ γ (t) d1 γ (s) = t(s) (s) = , ds dt ds γ (t) 1 γ (s) = 1 ,
∀s ∈ J .
(6.21)
232
6 Calcolo differenziale per funzioni vettoriali
Questo significa che usando l’ascissa curvilinea il sostegno della curva viene percorso con “velocit`a” costante uguale a 1. Anche in questo caso, le definizioni precedenti di lunghezza di un arco e di ascissa curvilinea possono essere estese in modo ovvio rispettivamente agli archi e alle curve regolari a tratti. Esempio 6.29 Sia γ : R → R3 la curva γ(t) = (cos t, sin t, t) il cui sostegno `e l’elica circolare (vedasi l’Esempio 4.33 vi)). Si ha √ γ (t) = (− sin t, cos t, 1) = (sin2 t + cos2 t + 1)1/2 = 2 . Pertanto, scegliendo t0 = 0, abbiamo t √ t √ s(t) = γ (τ ) dτ = 2 dτ = 2t . 0
0
√
con s ∈ R e l’elica circolare pu`o essere Ne segue che t = t(s) = riparametrizzata mediante l’ascissa curvilinea come √ √ √ 2 2 2 1 (s) = cos s, sin s, s . γ 2 2 2 2 2 2 s,
6.5.3 Elementi di geometria differenziale di una curva In questo paragrafo, introduciamo alcune nozioni che permettono di descrivere la geometria intrinseca di una curva in R3 . Il materiale qui presentato non `e indispensabile per il seguito della nostra trattazione, e quindi pu` o essere omesso in una prima lettura. Sia Γ una curva regolare e semplice in R3 , che assumiamo parametrizzata tramite l’ascissa curvilinea s definita a partire da un suo punto origine P ∗ . Sia γ = γ(s) tale parametrizzazione, definita in un intervallo J ⊆ R; supponiamo che γ sia di classe C 2 in J. Sia t(s) = γ (s) il vettore tangente a Γ nel punto P = γ(s). Ricordando la (6.21), si ha t(s) = 1 ,
∀s ∈ J ,
ossia t(s) `e un versore. Derivando ulteriormente rispetto a s, otteniamo il vettore t (s) = γ (s). Esso risulta ortogonale a t(s); infatti, derivando l’identit` a precedente scritta nella forma t(s)2 =
3
t2i (s) = 1 ,
i=1
otteniamo 2
3 i=1
ti (s)ti (s) = 0 ,
∀s ∈ J ,
6.5 Curve regolari
233
vale a dire t(s) · t (s) = 0. Ricordiamo che se γ(s) rappresenta la traiettoria di una particella in funzione del tempo, essa si muove con velocit`a t(s) di modulo costante = 1. Allora il vettore t (s) ne rappresenta l’accelerazione e dipende esclusivamente dalla variazione della direzione del vettore velocit` a. Dunque l’accelerazione avviene perpendicolarmente alla direzione del moto. Se in un punto P0 = γ(s0 ) il vettore t (s0 ) non `e nullo, possiamo introdurre il versore t (s0 ) , n(s0 ) = (6.22) t (s0 ) che chiamiamo versore normale principale a Γ in P0 . I versori ortogonali t(s0 ) e n(s0 ) giacciono su un piano passante per P0 , che viene detto piano osculatore alla curva Γ in P0 . Tra tutti i piani passanti per P0 , esso rappresenta quello che meglio si adatta alla curva; precisamente, la distanza di un punto γ(s) sulla curva dal piano osculatore `e un infinitesimo di ordine superiore al primo rispetto a s − s0 ` poi ovvio che il piano osculatore di una curva piana `e, in ogni punto, per s → s0 . E il piano su cui giace la curva. Il verso della normale principale `e legato alla convessit`a della curva (si veda la Figura 6.7). Precisamente, si pu` o verificare che, se la curva `e piana, nel sistema di riferimento individuato da t e n, la curva pu` o essere rappresentata in un intorno di P0 come il grafico di una funzione convessa. Lo scalare K(s0 ) = t (s0 ) viene detto curvatura di Γ in P0 , mentre il suo reciproco R(s0 ) viene detto raggio di curvatura. La terminologia pu` o essere motivata nel modo seguente. Supponiamo per semplicit` a che la curva sia piana e, a partire da P0 (s0 ), muoviamoci nella direzione e verso di n per una lunghezza pari a R(s0 ); sia C(s0 ) il punto cos`ı ottenuto, detto centro di curvatura (si veda la Figura 6.8). Allora la circonferenza di centro C(s0 ) e raggio R(s0 ) `e tangente a
t n
b P0 = γ(s0 )
Π Γ Figura 6.7. Piano osculatore e versori tangente, normale, binormale relativi a una curva Γ in P0
234
6 Calcolo differenziale per funzioni vettoriali
t P0 = γ(s0 ) C(s0 )
R(s0 )
n
Π
Figura 6.8. Circonferenza osculatrice e corrispondenti centro e raggio di curvatura in P0
Γ in P0 , e tra tutte le circonferenze che hanno tale propriet`a, `e quella che meglio approssima la curva in un intorno di P0 (circonferenza osculatrice). Introduciamo poi il versore normale al piano osculatore b(s0 ) = t(s0 ) ∧ n(s0 ) ,
(6.23)
che chiameremo versore binormale a Γ in P0 . In tal modo, otteniamo una terna destrorsa (t, n, b) di versori, che definisce un sistema di riferimento mobile lungo la curva. Il versore binormale, essendo ortogonale al piano osculatore, rimane costante lungo la curva se questa `e piana. Pertanto, la variazione del versore binormale misura quanto la curva si discosta da una curva piana. Se la curva `e di classe C 3 , ha dunque senso introdurre il vettore b (s0 ), detto vettore torsione della curva in P0 . Dalla definizione (6.23) di b, per derivazione otteniamo b (s0 ) = t (s0 ) ∧ n(s0 ) + t(s0 ) ∧ n (s0 ) = t(s0 ) ∧ n (s0 ) essendo n(s0 ) allineato a t (s0 ). Ci` o mostra che n (s0 ) `e ortogonale a t(s0 ). D’altro canto, derivando come sopra l’identit` a b(s0 )2 = 1, otteniamo b (s0 ) · b(s0 ) = 0 dunque b (s0 ) `e ortogonale pure a b(s0 ). Ne consegue che b (s0 ) `e parallelo a n(s0 ), e dunque esiste uno scalare τ (s0 ), detto torsione della curva, tale che b (s0 ) = τ (s0 )n(s0 ). Si verifica allora che una curva `e piana se e solo se la torsione `e identicamente nulla. Osserviamo inoltre che derivando la relazione n(s) = b(s) ∧ t(s) si ha n (s0 ) = b(s0 ) ∧ t (s0 ) + b (s0 ) ∧ t(s0 ) = b(s0 ) ∧ K(s0 )n(s0 ) + τ (s0 )n(s0 ) ∧ t(s0 ) = −K(s0 )t(s0 ) − τ (s0 )b(s0 ) .
6.6 Cambiamenti di variabile
235
In definitiva, tra i versori t, n ed b di una curva Γ di classe C 3 valgono le seguenti formule, note come formule di Frenet: t = Kn ,
n = −Kt − τ b ,
b = τ n .
(6.24)
` possibile dare le espressione dei versori t, n, b in termini di una qualunque E parametrizzazione di Γ .
6.6 Cambiamenti di variabile Sia R una regione di Rn avente interno A. Il generico punto P ∈ R `e individuato dalle sue coordinate cartesiane x1 , x2 , . . . , xn , vale a dire dalle componenti di un vettore x; scriviamo P = x. Per i = 1, . . . , n, la retta Ri = x + Rei = {xt = (x1 , . . . , xi−1 , xi + t, xi+1 , . . . , xn ) : t ∈ R} passa per P ed `e parallela all’i-esimo versore della base canonica ei . Dunque le rette Ri , che chiamiamo rette coordinate passanti per P , sono a due a due perpendicolari. Definizione 6.30 Un campo vettoriale Φ : R → R (dove R `e un’altra regione di Rn , di interno A ) definisce un cambiamento di variabile, o cambiamento di coordinate, in R se ha le seguenti propriet` a: i) Φ `e una biiezione tra R e R; ii) Φ `e di classe C 1 in A ; iii) Φ `e regolare in A , ossia la sua matrice jacobiana J Φ `e non singolare in ogni punto di A . Si pu` o dimostrare che l’immagine Φ(A ) `e un aperto contenuto in A mentre l’immagine Φ(∂R ) = Φ(∂A ) `e contenuta nella frontiera ∂R. Indichiamo con Q = u il generico punto di R , avente coordinate cartesiane u1 , . . . , un . Dalla definizione segue che, fissato un punto P0 = x0 ∈ A, per la i) esister`a uno e un solo punto Q0 = u0 ∈ A tale che P0 = Φ(Q0 ), ossia x0 = Φ(u0 ). Dunque P0 pu` o essere identificato, oltrech´e mediante le sue coordinate cartesiane x01 , . . . , x0n , anche attraverso le coordinate cartesiane u01 , . . . , u0n di Q0 ; queste ultime vengono dette le coordinate curvilinee di P0 (relative alla trasformazione Φ). Le rette coordinate passanti per Q0 danno luogo a curve in R, passanti per P0 . Precisamente, per i = 1, . . . , n, l’insieme Γi = {x = Φ(u0 + tei ) : u0 + tei ∈ R con t ∈ Ii } , dove Ii `e un intervallo contenente l’origine, `e il sostegno della curva semplice (grazie alla i)) t → γi (t) = Φ(u0 + tei )
236
6 Calcolo differenziale per funzioni vettoriali u2
x2
R
R
Γ2 Φ
Γ1
τ2 x02
u02
Q0
u01
τ1 P0
u1
x01
x1
Figura 6.9. Cambiamento di coordinate in R
definita in Ii . Chiameremo tali insiemi le curve (o linee) coordinate passanti per P0 (relative al cambiamento di variabile Φ); si veda la Figura 6.9. Se P0 ∈ A, tali curve sono regolari (grazie alla iii)) e dunque esistono i vettori tangenti in P0 τi = γi (0) = J Φ(u0 ) · ei =
∂Φ (u0 ) , ∂ui
1 ≤ i ≤ n.
(6.25)
Essi sono i vettori colonna della matrice jacobiana di Φ in u0 (attenzione a non confonderli con i vettori riga ∇ϕi (u0 ), che sono i gradienti delle componenti di Φ = (ϕi )1≤i≤n ). Pertanto, in base all’ipotesi iii), i vettori τi , 1 ≤ i ≤ n, sono indipendenti tra di loro (e dunque, in particolare, non nulli) e quindi formano una base in Rn . Indicheremo con ti = τi /τi i corrispondenti versori. Se in ogni P0 ∈ A i vettori tangenti risultano ortogonali, cio`e se la matrice J Φ(u0 )T J Φ(u0 ) `e diagonale, il cambiamento di variabile si dir` a ortogonale. In tal caso {t1 , . . . , tn } sar`a una base ortonormale in Rn , associata al punto P0 . Le propriet` a ii) e iii) hanno un’altra importante conseguenza. La funzione u → det J Φ(u) `e una funzione continua su A , in quanto il determinante dipende in modo continuo dagli elementi della matrice; inoltre, si ha det J Φ(u) = 0 per ogni u ∈ A . Da ci`o deduciamo che det J Φ(u) > 0 ,
∀u ∈ A ,
oppure
det J Φ(u) < 0 ,
∀u ∈ A . (6.26)
Infatti, se det J Φ assumesse sia valori positivi sia valori negativi in A , che `e un aperto connesso, necessariamente per il Teorema 4.29 dovrebbe annullarsi in almeno un punto appartenente ad A , contro l’ipotesi iii). Proseguiamo la discussione limitandoci ai casi n = 2 oppure n = 3. In dimensione 2, la prima delle (6.26) (rispettivamente la seconda) equivale a dire che per ogni u0 ∈ A il vettore τ1 pu` o essere ruotato e allineato al vettore τ2 mediante una rotazione di angolo θ ∈ (0, π] in senso antiorario (rispettivamente orario). Infatti, se identifichiamo ciascun vettore τi con il vettore τ˜i = τi + 0k ∈ R3 aventi le prime due componenti uguali a quelle di τi e la terza nulla, si ha τ˜1 ∧ τ˜2 = det J Φ(u0 ) k (6.27)
6.6 Cambiamenti di variabile
237
e dunque la terna (τ˜1 , τ˜2 , k) `e destrorsa o sinistrorsa a seconda che valga la prima o la seconda delle (6.26). In dimensione 3, consideriamo direttamente la terna (τ1 , τ2 , τ3 ). Essa sar` a destrorsa o sinistrorsa a seconda che valga la prima o la seconda delle (6.26); infatti, si ha facilmente (τ1 ∧ τ2 ) · τ3 = det J Φ(u0 ). I cambiamenti di variabile in una regione di Rn possono quindi essere divisi in due classi, a seconda del segno del determinante della loro matrice jacobiana. Quelli a determinante positivo vengono detti destrorsi, gli altri sinistrorsi. Esempio 6.31 L’applicazione x = Φ(u) = Au + b , con A matrice di ordine n non singolare, definisce un cambiamento di variabile affine in Rn . Ad esempio, il cambiamento di variabile nel piano (con x = (x, y) e u = (u, v)) 1 1 x = √ (v + u) + 2 , y = √ (v − u) + 1 , 2 2 rappresenta una traslazione dell’origine nel punto (2, 1) seguita da una rotazione degli assi coordinati di π/4 in senso antiorario (si veda la Figura 6.10). Le linee coordinate u = costante (rispettivamente v = costante) sono date dalle parallele alla bisettrice del primo e terzo quadrante (rispettivamente del secondo e quarto quadrante). Dunque il nuovo sistema di coordinate `e ancora ortogonale, come confermato dal fatto che la matrice A=
√1 2 √ − 12
√1 2 √1 2
`e ortogonale, cio`e soddisfa AT A = I. (In generale, un cambiamento di variabile affine `e ortogonale se la matrice associata `e ortogonale.) Inoltre il cambiamento di variabile `e destrorso, ed infatti det A = 1 > 0. 2 v y
x
1
2
u
Figura 6.10. Cambiamento di variabile affine nel piano
238
6 Calcolo differenziale per funzioni vettoriali
6.6.1 Cambiamenti di variabile notevoli Consideriamo i cambiamenti di variabile associati alle principali trasformazioni del piano e dello spazio. i) Coordinate polari. Indichiamo con Φ : [0, +∞) × R → R2 ,
(r, θ) → (x, y) = (r cos θ, r sin θ)
la trasformazione che ci fa passare dalle coordinate polari di un punto a quelle cartesiane (si veda la Figura 6.11, a sinistra). Essa `e derivabile infinite volte e la sua matrice jacobiana `e data da ∂x J Φ(r, θ) =
∂r ∂y ∂r
∂x ∂θ ∂y ∂θ
=
cos θ sin θ
−r sin θ r cos θ
.
(6.28)
Il determinante det J Φ(r, θ) = r cos2 θ + r sin2 θ = r
(6.29)
`e strettamente positivo in (0, +∞) × R e dunque la matrice jacobiana `e ivi invertibile; la sua inversa, espressa ancora in funzione di r e di θ, `e data da −1
J Φ(r, θ)
=
∂r ∂x ∂θ ∂x
∂r ∂y ∂θ ∂y
=
cos θ sin θ − r
sin θ cos θ r
.
(6.30)
Alla luce di tali risultati, Φ definisce un cambiamento di variabile nel piano se poniamo R = R2 e se scegliamo, ad esempio, R = (0, +∞) × (−π, π] ∪ {(0, 0)}. Il suo interno `e A = (0, +∞) × (−π, π) e l’immagine di tale aperto attraverso y tθ P = (x, y)
y
tr
j P0 r
0
i
x
θ O
x
Figura 6.11. Coordinate polari nel piano (a sinistra); linee coordinate e versori tangenti (a destra)
6.6 Cambiamenti di variabile
239
Φ `e l’aperto R2 \ {(x, 0) ∈ R2 : x ≤ 0}, ossia il piano privato del semiasse delle x negative. Il cambiamento di coordinate risulta ortogonale, essendo J ΦT J Φ = diag (1, r2 ), e destrorso, essendo det J Φ > 0 in A . Le linee coordinate sono le semirette uscenti dall’origine (per θ = costante) e le circonferenze di centro l’origine (per r = costante). I vettori τi , i = 1, 2, tangenti a tali linee, ossia i vettori colonna della matrice J Φ, verranno nel seguito indicati per maggior chiarezza rispettivamente con τr e τθ e rappresentati come vettori riga. Essi sono dati da τr = (cos θ, sin θ) ,
τθ = r(− sin θ, cos θ) .
Normalizzando il secondo, si ottiene la base ortonormale di R2 tr = (cos θ, sin θ) ,
tθ = (− sin θ, cos θ)
(6.31)
formata dai versori tangenti alle linee coordinate in ogni punto P ∈ R2 \ {(0, 0)} (si veda la Figura 6.11, a destra). Sia ora f (x, y) una funzione scalare definita su un sottoinsieme di R2 non contenente l’origine. Essa si esprime attraverso le coordinate polari come f˜(r, θ) = f (r cos θ, r sin θ) , vale a dire f˜ = f ◦ Φ. Supponendo f differenziabile nel suo dominio, abbiamo dalla regola della catena (Teorema 6.14 o, pi` u precisamente, formula (6.12)) ∇(r,θ) f˜ = ∇f(x,y) J Φ , mentre la relazione inversa `e ∇f(x,y) = ∇(r,θ) f˜ J Φ−1 . Omettendo per semplicit`a il simbolo ∼ essendo chiaro dal contesto quali sono le variabili indipendenti di ciascuna funzione, tali identit` a vettoriali si esplicitano mediante le (6.28) e (6.30) in ∂f ∂f ∂f = cos θ + sin θ , ∂r ∂x ∂y
∂f ∂f ∂f = − r sin θ + r cos θ ∂θ ∂x ∂y
(6.32)
∂f ∂g ∂f cos θ = sin θ + . ∂y ∂r ∂θ r
(6.33)
e in ∂f ∂f ∂g sin θ = cos θ − , ∂x ∂r ∂θ r
Se ora g(x, y) = g1 (x, y)i + g2 (x, y)j `e un campo vettoriale definito su un sottoinsieme di R2 privo dell’origine, esso pu` o essere espresso, in ogni punto (x, y) = (r cos θ, r sin θ) del dominio, nella base {tr , tθ } associata al punto, come g = gr tr + gθ tθ
(6.34)
240
6 Calcolo differenziale per funzioni vettoriali
(qui e nel seguito i pedici r e θ non indicano derivate parziali, ma componenti rispetto ai versori della base). Essendo la base ortonormale, si ha gr = g · tr = (g1 i + g2 j) · tr = g1 cos θ + g(x)2 sin θ , gθ = g · tθ = (g1 i + g2 j) · tθ = −g1 sin θ + g(x)2 cos θ .
(6.35)
In particolare, se g `e il gradiente di una funzione scalare differenziabile, ossia se ∂f ∂f i+ j, abbiamo grazie alle (6.32) grad f = ∂x ∂y gr =
∂f ∂f ∂f cos θ + sin θ = , ∂x ∂y ∂r
gθ = −
∂f 1 ∂f ∂f sin θ + cos θ = ; ∂x ∂y r ∂θ
otteniamo dunque la formula grad f =
∂f 1 ∂f tr + tθ , ∂r r ∂θ
(6.36)
che esprime il gradiente di una funzione nella base ortonormale associata alle coordinate polari. Analogamente, possiamo esprimere la divergenza di un campo vettoriale differenziale g in coordinate polari, nel modo seguente: ∂g1 ∂g2 ∂g1 ∂g1 sin θ ∂g2 ∂g2 cos θ + = cos θ − + sin θ + ∂x ∂y ∂r ∂θ r ∂r ∂θ r ∂ 1 ∂ (g1 cos θ + g2 sin θ)+ (−g1 sin θ + g2 cos θ)+(g1 cos θ + g2 sin θ) ; = ∂r r ∂θ
div g =
ricordando le (6.34) e (6.35), otteniamo dunque div g =
1 ∂gr 1 ∂gθ + gr + . ∂r r r ∂θ
(6.37)
Come applicazione, possiamo combinare tale relazione con l’espressione (6.36), per rappresentare in coordinate polari il laplaciano Δf di una funzione di classe C 2 in una regione piana priva dell’origine. Ponendo g = grad f nella (6.37), otteniamo infatti Δf =
1 ∂2f ∂2f 1 ∂f + + . ∂r2 r ∂r r2 ∂θ2
(6.38)
Tornando all’espressione (6.34) di un campo vettoriale piano g in coordinate polari, notiamo che – a differenza dei versori i e j della base canonica – i versori tr e tθ variano da punto a punto; in particolare, dalla (6.31) abbiamo ∂tr = 0, ∂r
∂tr = tθ ; ∂θ
∂tθ = 0, ∂r
∂tθ = −tr . ∂θ
(6.39)
6.6 Cambiamenti di variabile
241
Pertanto, se si vuole derivare g rispetto alle variabili r e θ, si dovr` a applicare l’usuale regola di derivazione di un prodotto, ottenendo ∂g ∂gθ ∂gr = tr + tθ , ∂r ∂r ∂r ∂g ∂gr ∂g θ = − gθ tr + + gr tθ . ∂θ ∂θ ∂θ ii) Coordinate cilindriche. Sia ora Φ : [0, +∞) × R2 → R3 ,
(r, θ, t) → (x, y, z) = (r cos θ, r sin θ, t)
la trasformazione, derivabile infinite volte, che descrive il passaggio dalle coordinate cilindriche di un punto alle sue coordinate cartesiane (si veda la Figura 6.12, a sinistra). Risulta ⎛
cos θ J Φ(r, θ, t) = ⎝ sin θ 0
−r sin θ r cos θ 0
⎞ 0 0⎠ . 1
(6.40)
Anche in questo caso il determinante det J Φ(r, θ, t) = r
(6.41)
`e strettamente positivo in (0, +∞) × R2 e dunque la matrice jacobiana `e ivi invertibile. Inoltre si ha J ΦT J Φ = diag (1, r2 , 1). Pertanto Φ realizza un cambiamento di variabile ortogonale e destrorso tra la regione R = (0, +∞) × (−π, π] × R ∪ {(0, 0, t) : t ∈ R} e R = R3 . L’interno di R z
z
tt P = (x, y, z) tθ P0 O
tr
k
x θ
r
y
O x
P = (x, y, 0)
i
j
y
Figura 6.12. Coordinate cilindriche nello spazio (a sinistra); linee coordinate e versori tangenti (a destra)
242
6 Calcolo differenziale per funzioni vettoriali
`e dato da A = (0, +∞) × (−π, π) × R e l’immagine di tale aperto attraverso Φ `e l’aperto R3 \ {(x, 0, z) ∈ R3 : x ≤ 0, z ∈ R}, ossia lo spazio tridimensionale privato del semipiano delle x negative. Le linee coordinate sono rispettivamente le semirette uscenti dall’asse z e giacenti su un piano orizzontale, le circonferenze aventi centro sull’asse z e giacenti su un piano orizzontale, e le rette verticali. I versori tangenti a tali linee nel generico punto P ∈ R3 \ {(0, 0, z) : z ∈ R} sono dati, con notazioni ovvie, da tr = (cos θ, sin θ, 0) ,
tθ = (− sin θ, cos θ, 0) ,
tt = (0, 0, 1) .
(6.42)
Essi formano una base ortonormale in R3 , associata al punto P (si veda la Figura 6.12, a destra) Se ora f (x, y, z) `e una funzione scalare differenziabile definita su un sottoinsieme di R3 non contenente l’asse z, e se la esprimiamo in coordinate cilindriche come f˜(r, θ, t) = f (r cos θ, r sin θ, t) , possiamo esplicitare la relazione ∇(r,θ,t) f˜ = ∇f(x,y,z) J Φ, nella forma ∂f ∂f ∂f = cos θ + sin θ , ∂r ∂x ∂y
∂f ∂f ∂f = − r sin θ + r cos θ , ∂θ ∂x ∂y
∂f ∂f = . ∂t ∂z
∂f ∂f ∂f cos θ = sin θ + , ∂y ∂r ∂θ r
∂f ∂f = . ∂z ∂t
Le relazioni inverse sono ∂f ∂f ∂f sin θ = cos θ − , ∂x ∂r ∂θ r
I principali operatori differenziali si scrivono in coordinate cilindriche come: ∂f 1 ∂f ∂f tr + tθ + tt , ∂r r ∂θ ∂t 1 ∂ft 1 ∂fθ ∂fr + fr + + , div f = ∂r r r ∂θ ∂t 1 ∂f ∂f ∂f ∂fθ ∂ft 1 ∂fr 1 t r θ − tr + − tθ + − + f θ tt , rot f = r ∂θ ∂t ∂t ∂r ∂r r ∂θ r 2 2 2 1 ∂ f ∂ f 1 ∂f ∂ f + 2 2 + 2 . Δf = + ∂r2 r ∂r r ∂θ ∂t grad f =
iii) Coordinate sferiche. Consideriamo infine la trasformazione, derivabile infinite volte, Φ : [0, +∞) × R2 → R3 ,
(r, ϕ, θ) → (x, y, z) = (r sin ϕ cos θ, r sin ϕ sin θ, r cos ϕ) ,
6.6 Cambiamenti di variabile
243
z z
tr P0
tθ
P = (x, y, z) ϕ
k
tϕ O
r x
O
i
j
y
x θ
y
P = (x, y, 0) Figura 6.13. Coordinate sferiche nello spazio (a sinistra); linee coordinate e versori tangenti (a destra)
che descrive il passaggio dalle coordinate sferiche di un punto alle sue coordinate cartesiane (si veda la Figura 6.13, a sinistra). Si ha ⎛
sin ϕ cos θ ⎜ sin ϕ sin θ J Φ(r, ϕ, θ) = ⎝ cos ϕ
r cos ϕ cos θ r cos ϕ sin θ −r sin ϕ
⎞ −r sin ϕ sin θ r sin ϕ cos θ ⎟ ⎠. 0
(6.43)
Sviluppando il determinante ad esempio rispetto all’ultima riga e ricordando le relazioni sin2 θ + cos2 θ = 1 e sin2 ϕ + cos2 ϕ = 1, si ha det J Φ(r, ϕ, θ) = r2 sin ϕ .
(6.44)
Esso `e strettamente positivo in (0, +∞) × (0, π) × R e dunque la matrice jacobiana `e ivi invertibile. Inoltre si ha J ΦT J Φ = diag (1, r(cos2 ϕ + r sin2 ϕ), r2 sin ϕ). Ne segue che Φ realizza un cambiamento di variabile ortogonale e destrorso tra la regione R = (0, +∞) × [0, π] × (−π, π] ∪ {(0, 0, 0)} e R = R3 . L’interno di R `e dato da A = (0, +∞) × (0, π) × (−π, π) e l’immagine di tale aperto attraverso Φ `e l’aperto R3 \ {(x, 0, z) ∈ R3 : x ≤ 0, z ∈ R}, come nel caso delle coordinate cilindriche. Le linee coordinate sono rispettivamente le semirette uscenti dall’origine, le semicirconferenze aventi centro l’origine e giacenti su un piano verticale (esse, sulla superficie terrestre, formano i meridiani) e le circonferenze aventi centro sull’asse z e giacenti su un piano orizzontale (i paralleli). I versori tangenti nel generico punto P ∈ R3 \{(0, 0, 0)} si ottengono normalizzando le colonne della matrice J Φ, e sono dati da
244
6 Calcolo differenziale per funzioni vettoriali
tr = (sin ϕ cos θ, sin ϕ sin θ, cos ϕ) , tϕ = (cos ϕ cos θ, cos ϕ sin θ, − sin ϕ) ,
(6.45)
tθ = (− sin θ, cos θ, 0) . Essi formano una base ortonormale in R3 , associata al punto P (si veda la Figura 6.13, a destra). Se ora f (x, y, z) `e una funzione scalare differenziabile definita su un sottoinsieme di R3 non contenente l’origine, e se la esprimiamo in coordinate sferiche come f˜(r, ϕ, θ) = f (r sin ϕ cos θ, r sin ϕ sin θ, r cos ϕ) , possiamo esplicitare la relazione ∇(r,ϕ,θ) f˜ = ∇f(x,y,z) J Φ, omettendo il simbolo ∼, nella forma ∂f ∂f ∂f ∂f = sin ϕ cos θ + sin ϕ sin θ + cos ϕ ∂r ∂x ∂y ∂z ∂f ∂f ∂f ∂f = r cos ϕ cos θ + r cos ϕ sin θ − r sin ϕ ∂ϕ ∂x ∂y ∂z ∂f ∂f ∂f = − r sin ϕ sin θ + r sin ϕ cos θ . ∂θ ∂x ∂y Le relazioni inverse sono ∂f ∂f ∂f cos ϕ cos θ ∂f sin θ = sin ϕ cos θ + − ∂x ∂r ∂ϕ r ∂θ r sin ϕ ∂f ∂f cos ϕ sin θ ∂f cos θ ∂f = sin ϕ sin θ + + ∂y ∂r ∂ϕ r ∂θ r sin ϕ ∂f ∂f sin ϕ ∂f = cos ϕ − . ∂z ∂r ∂ϕ r I principali operatori differenziali si scrivono in coordinate sferiche come: ∂f 1 ∂f 1 ∂f tr + tϕ + tθ , ∂r r ∂ϕ r sin ϕ ∂θ 2 tan ϕ 1 ∂fϕ 1 ∂fθ ∂fr + fr + + fϕ + , div f = ∂r r r ∂ϕ r r sin ϕ ∂θ 1 ∂f 1 ∂fr tan ϕ ∂fθ 1 ∂fϕ θ + fθ − tr + − − f θ tϕ rot f = r ∂θ r sin ϕ ∂θ ∂r r ∂fr ∂ϕ 1 ∂fr ϕ + fϕ − tθ , + ∂r r ∂ϕ 1 ∂2f 1 ∂2f ∂2f 2 ∂f tan ϕ ∂f + + Δf = + + . 2 ∂r2 r ∂r r2 ∂ϕ2 r2 ∂ϕ r2 sin ϕ ∂θ2 grad f =
6.7 Superfici regolari
245
6.7 Superfici regolari Ricordiamo che le superfici sono state introdotte nel § 4.7. Definizione 6.32 Una superficie σ : R → R3 dicesi regolare se σ `e di ◦
classe C 1 su A = R e se la matrice jacobiana J σ ha rango massimo (= 2) in ogni punto di A. Una calotta (ossia una superficie definita su una regione R compatta) dicesi regolare se `e la restrizione a R di una superficie regolare definita su un aperto che contiene R. ∂σ ∂σ (u0 , v0 ) e (u0 , v0 ) sono ∂u ∂v linearmente indipendenti per ogni (u0 , v0 ) ∈ A. Ricordando la Definizione 6.1 di matrice jacobiana, tali vettori (pensati come vettori colonna) formano le colonne della matrice J σ, ossia ∂σ ∂σ . Jσ = (6.46) ∂u ∂v La condizione su J σ equivale al fatto che i vettori
Esempi 6.33 i) Le superfici definite negli Esempi 4.36 i), iii), iv) sono regolari, come si verifica con semplici calcoli. ii) La superficie cartesiana definita nell’Esempio 4.36 ii) `e regolare se (e solo se) ϕ `e di classe C 1 in A. Sotto queste condizioni, si ha infatti ⎞ ⎛ 1 0 ⎜ 0 1 ⎟ ⎟ Jσ = ⎜ ⎝ ∂ϕ ∂ϕ ⎠ . ∂u ∂v Il rango 2 di tale matrice `e evidente, considerandone le prime due righe. iii) La superficie σ : R × [0, 2π] → R3 definita da σ(u, v) = u cos v i + u sin vj + u k costituisce una parametrizzazione del cono a due falde di equazione x2 + y 2 − z 2 = 0 . La matrice jacobiana di σ `e data da ⎛ ⎞ cos v −u sin v J σ = ⎝ sin v u cos v ⎠ . 1 0 I determinanti dei tre minori principali sono u, u sin v e −u cos v. Pertanto la superficie non `e regolare in quanto in ogni punto (u0 , v0 ) = (0, v0 ), la cui immagine `e il vertice del cono, tutti i minori principali sono singolari. 2
246
6 Calcolo differenziale per funzioni vettoriali
Prima di proseguire, premettiamo alcune considerazioni che ci permetteranno di semplificare la trattazione successiva (in analogia a quanto fatto nel § 6.5 per le curve). La Definizione 4.35 privilegia il punto di vista analitico nella descrizione ` tuttavia piuttosto comune preferire il punto di vista geomedi una superficie. E trico, che associa il nome superficie al sostegno Σ come particolare sottoinsieme di R3 , riservando alla funzione σ il ruolo di parametrizzazione di tale superficie. Adottiamo nel seguito questo punto di vista, con l’ipotesi aggiuntiva che le parametrizzazioni σ considerate siano semplici. In tal modo, vari concetti che introdurremo avranno una pi` u immediata e intuitiva rappresentazione geometrica. Diamo quindi la seguente definizione. Definizione 6.34 Un sottoinsieme Σ di R3 `e una superficie regolare e semplice (oppure una calotta regolare e semplice) se esiste una parametrizzazione σ : R → Σ di Σ avente tali propriet` a. Sia dunque Σ ⊂ R3 una superficie regolare e semplice parametrizzata da σ : R → Σ, e sia P0 = σ(u0 , v0 ) un punto su Σ immagine di un punto (u0 , v0 ) ∈ A = ◦ ∂σ ∂σ (u0 , v0 ) e (u0 , v0 ) sono, per ipotesi, linearmente R. Ricordando che i vettori ∂u ∂v indipendenti, possiamo introdurre l’applicazione Π : R2 → R3 data da Π(u, v) = σ(u0 , v0 ) +
∂σ ∂σ (u0 , v0 ) (u − u0 ) + (u0 , v0 ) (v − v0 ) , ∂u ∂v
(6.47)
che costituisce una parametrizzazione di un piano passante per P0 (si ricordi l’Esempio 4.36 i)). Chiamiamo tale piano il piano tangente alla superficie in P0 . Per giustificare tale notazione, osserviamo che le funzioni u → σ(u, v0 )
e
v → σ(u0 , v)
ν(u0 , v0 )
∂σ (u0 , v0 ) ∂u
P0
Π ∂σ (u0 , v0 ) ∂v
Σ
Figura 6.14. Piano tangente Π e vettore normale ν ad una superficie in P0
6.7 Superfici regolari
247
definiscono due curve regolari che giacciono su Σ e passano per il punto P0 . I vettori ∂σ ∂σ (u0 , v0 ) e (u0 , v0 ); tangenti a tali curve in P0 sono rispettivamente i vettori ∂u ∂v pertanto, le rette tangenti alle curve in P0 giacciono sul piano tangente a Σ in P0 , e precisamente lo generano attraverso tutte le loro combinazioni lineari. Pi` u in generale, si pu` o dimostrare che il piano tangente contiene il vettore tangente ad una qualsiasi curva regolare passante per P0 e giacente sulla superficie Σ. Definizione 6.35 Il vettore ν(u0 , v0 ) =
∂σ ∂σ (u0 , v0 ) ∧ (u0 , v0 ) ∂u ∂v
(6.48)
dicesi vettore normale alla superficie Σ in P0 . Il versore normale ad esso ν(u0 , v0 ) associato sar` a indicato con n(u0 , v0 ) = . ν(u0 , v0 ) Si noti che, per l’ipotesi di regolarit` a della superficie, ν(u0 , v0 ) non `e nullo. Es∂σ ∂σ so `e ortogonale ai vettori (u0 , v0 ) e (u0 , v0 ) e dunque, se applicato in P0 , ∂u ∂v risulta ortogonale al piano tangente alla superficie in P0 ; ci`o giustifica la sua denominazione (si veda la Figura 6.14). Esempio 6.36 i) Se consideriamo una superficie cartesiana regolare σ : R → R3 data da σ(u, v) = u i + v j + ϕ(u, v) k, con f ∈ C 1 (R) (vedasi l’Esempio 6.33 ii)), si ha facilmente ∂ϕ ∂ϕ (u, v) j + k . ν(u, v) = − (u, v) i − (6.49) ∂u ∂v Si osservi che in ogni punto il vettore normale punta verso l’alto, essendo ν ·k > 0 (si veda la Figura 6.15). ii) Sia σ : [0, π] × [0, 2π] → R3 la parametrizzazione dell’ellissoide di centro l’origine e semiassi a, b, c > 0 (si veda l’Esempio 4.36 iv)). Allora si ha ∂σ (u, v) = a cos u cos v i + b cos u sin v j − c sin u k ∂u ∂σ (u, v) = −a sin u sin v i + b sin u cos v j + 0k , ∂v da cui ν(u, v) = bc sin2 u cos v i + ac sin2 u sin v j + ab sin u cos u k . Si noti che, nel caso di una sfera di raggio r (quando a = b = c = r), abbiamo ν(u, v) = r sin u(r sin u cos v i + r sin u sin v j + r cos u k) e dunque il vettore ν nel punto x sulla superficie sferica `e proporzionale a x, ossia `e disposto lungo il raggio uscente dall’origine. 2
248
6 Calcolo differenziale per funzioni vettoriali z
ν
P0 Π y Σ (u0 , v0 )
x
Figura 6.15. Vettore normale ad una superficie cartesiana
Si pu` o dimostrare che, come la retta tangente per le curve, cos`ı il piano tangente `e intrinseco al sostegno della superficie, vale a dire indipendente dalla sua parametrizzazione. Conseguentemente, la direzione del vettore normale `e intrinseca, mentre modulo e verso dipendono dalla particolare parametrizzazione. 6.7.1 Cambiamenti di parametrizzazione 1 →Σ 1 :R Supponiamo che Σ sia una superficie regolare, e siano σ : R → Σ e σ due sue parametrizzazioni. 1 `e una parametrizzazione di Σ congruenDefinizione 6.37 Si dice che σ 1 → R tale che σ 1 = σ ◦ Φ. te a σ se esiste un cambiamento di variabile Φ : R Se Σ `e una calotta, si richieder` a che Φ sia la restrizione di un cambiamento 1 e R. di variabile che opera tra due aperti rispettivamente contenenti R Bench´e la definizione non richieda che le parametrizzazioni di Σ siano semplici, continuiamo a fare tale ipotesi nel seguito. Notiamo che la propriet` a di una parametrizzazione di essere regolare e semplice si conserva passando a una parametrizzazione congruente. Ricordando quanto visto nel § 6.6 a proposito dei cambiamenti di variabile, 1 rispettivamente gli interni di R e R, 1 si avr` detti A e A a det J Φ > 0
1 in A
oppure
1. det J Φ < 0 in A
1 `e una parametrizzazione equivalente a σ, menNel primo caso, diremo che σ 1 `e anti-equivalente a σ. In altri termini, tre nel secondo caso diremo che σ
6.7 Superfici regolari
249
un cambiamento di variabili destrorso (rispettivamente sinistrorso) induce una parametrizzazione equivalente (rispettivamente anti-equivalente) a quella data. 1 1 ∂σ ∂σ 1 di Σ possono e relativi alla parametrizzazione σ I vettori tangenti ∂u ˜ ∂˜ v ∂σ ∂σ essere facilmente espressi come combinazioni lineari dei vettori e . Infatti, ∂u ∂v ricordando la (6.46) e la regola (6.9) di derivazione delle funzioni composte vettoriali, e omettendo per semplicit`a l’indicazione del punto (u0 , v0 ) = Φ(˜ u0 , v˜0 ) in cui si calcolano le derivate, si ha ∂σ ∂σ 1 ∂σ 1 ∂σ JΦ ; = ∂u ∂v ∂u ˜ ∂˜ v
m11 m12 , tali relazioni si scrivono come ponendo J Φ = m21 m22 1 ∂σ ∂σ ∂σ = m11 + m21 , ∂u ˜ ∂u ∂v
1 ∂σ ∂σ ∂σ = m12 + m22 . ∂˜ v ∂u ∂v
1 ∂σ 1 ∂σ Esse mostrano, da una parte, che i vettori e generano, secondo la (6.47), ∂u ˜ ∂˜ v ∂σ ∂σ lo stesso piano generato dai vettori e ; dunque ∂u ∂v il piano tangente alla superficie Σ `e invariante per parametrizzazioni congruenti. D’altra parte, usando le espressioni precedenti e ricordando la propriet` a (4.8) del prodotto esterno, si ha 1 ∂σ 1 ∂σ ∂σ ∂σ ∂σ ∂σ ∧ = m11 m12 ∧ + m11 m22 ∧ + ∂u ˜ ∂˜ v ∂u ∂u ∂u ∂v +m21 m12
∂σ ∂σ ∂σ ∂σ ∧ + m21 m22 ∧ ∂v ∂u ∂v ∂v
= (m11 m22 − m12 m21 )
∂σ ∂σ ∧ . ∂u ∂v
Ne segue che tra i vettori normali alla superficie nel punto P0 sussiste l’importante relazione ν1 = (det J Φ) ν ; (6.50) ci`o conferma che due diverse parametrizzazioni congruenti generano vettori normali aventi la stessa direzione, mentre il verso `e lo stesso se le parametrizzazioni sono equivalenti (cambiamento di variabili destrorso) ed `e opposto altrimenti (cambiamento di variabile sinistrorso).
250
6 Calcolo differenziale per funzioni vettoriali
6.7.2 Superfici orientabili Abbiamo visto (Proposizione 6.27) che due diverse parametrizzazioni di una curva regolare e semplice Γ in Rm sono tra loro congruenti (e dunque possiamo definire due diverse orientazioni su di essa). Un analogo risultato per le superfici non vale, come illustreremo nel seguito attraverso alcuni controesempi (il nastro di M¨ obius, la bottiglia di Klein). Ha dunque senso dare la seguente definizione. Definizione 6.38 Una superficie regolare e semplice Σ ⊂ R3 dicesi orientabile se, prese due qualunque parametrizzazioni regolari e semplici, esse sono tra loro congruenti. La terminologia `e giustificata dal fatto che, per quanto visto sopra, potremo associare alla superficie due orientazioni o versi di attraversamento, a seconda del verso del vettore normale. Tutte le parametrizzazioni tra loro equivalenti avranno la stessa orientazione, mentre quelle anti-equivalenti avranno l’orientazione opposta. Si pu` o dimostrare che una superficie regolare e semplice, parametrizzabile a partire da una regione aperta R del piano, `e orientabile. Quando la superficie regolare e semplice `e parametrizzata su una regione non aperta, la situazione diventa pi` u complessa e la superficie pu` o essere orientabile o no. Esaminiamo due esempi, che illustrano il problema. Consideriamo dapprima l’anello cilindrico di raggio 1 e altezza 2 mostrato in Figura 6.16, a sinistra. Esso `e una calotta che pu` o essere parametrizzata da σ : [0, 2π] × [−1, 1] → R3 ,
σ(u, v) = cos u i + sin u j + vk .
(6.51)
Tale parametrizzazione `e regolare e semplice, essendo, ad esempio, iniettiva in [0, 2π) × [−1, 1]. Il vettore normale ad essa associato `e dato da ν(u, v) = cos u i + sin u j + 0k e punta costantemente verso l’esterno del cilindro. In modo visivamente intuitivo possiamo dire che una persona immaginaria che compie un giro camminando sulla superficie (ad esempio rimanendo nel piano xy) torna al punto di partenza mantenendo lo stesso verso (concorde o discorde) rispetto al vettore normale. Questa superficie `e orientabile; essa presenta due facce, una interna e l’altra esterna e se la persona vuole passare da una all’altra deve necessariamente attraversare il “bordo” superiore v = 1 oppure inferiore v = −1. (Il concetto di bordo di una superficie verr` a discusso poco sotto.) Consideriamo ora un altro anello, detto nastro di M¨ obius, mostrato in Figura 6.16, a destra. Esso pu`o essere ottenuto dal precedente tagliandolo lungo uno dei segmenti verticali che giacciono sulla superficie e reincollando le due estremit`a dopo averne ruotata una di 180◦ . La parametrizzazione precisa `e data da σ : [0, 2π] × [−1, 1] → R3 definita da
6.7 Superfici regolari
251
n Figura 6.16. Anello cilindrico (a sinistra) e nastro di M¨ obius (a destra)
u v u v u v cos u i + 1 − cos sin u j − sin k . σ(u, v) = 1 − cos 2 2 2 2 2 2 Per il valore u = 0, ossia nel punto P0 = (1, 0, 0) = σ(0, 0) del sostegno, il vettore normale `e dato da ν = 12 k. Al crescere di u, esso varia con continuit` a, ma quando, dopo un intero giro ritorniamo in P0 = σ(2π, 0), otteniamo ν = − 12 k, ossia il vettore opposto rispetto a quello di partenza. Ci` o significa che la nostra persona che parte dal punto P0 con la testa rivolta verso l’alto si ritrova nello stesso punto dopo aver percorso un giro lungo l’anello, senza mai attraversare il bordo, con la testa all’ingi` u! L’anello di M¨ obius `e un esempio di superficie non orientabile; esso ha una sola faccia e anche un solo bordo: infatti partendo da un qualunque punto del bordo si pu` o ritornare nello stesso punto essendo passati per tutti i punti del bordo (ad esempio dopo due giri intorno all’origine). Il nastro di M¨ obius costituisce comunque una situazione “patologica”. Le superfici o le calotte che delimitano i solidi elementari, quali sfere, ellissoidi, cilindri, coni etc., sono tutte orientabili. Pi` u in generale, vale la seguente propriet` a. Proposizione 6.39 Ogni superficie (o calotta) regolare e semplice Σ contenuta nella frontiera ∂Ω di un aperto connesso e limitato Ω ⊂ R3 , `e orientabile. Potremo quindi scegliere per Σ il verso di attraversamento che ci porta dall’interno di Ω verso l’esterno, oppure il verso opposto. Nel primo caso diremo che il versore n normale a Σ `e uscente da Ω, nel secondo diremo che `e entrante in Ω. 6.7.3 Bordo di una superficie; superfici chiuse Un altro importante concetto associato ad una superficie `e quello di bordo, a cui abbiamo gi` a fatto cenno nella discussione precedente. Precisiamo subito che si tratta di un concetto piuttosto delicato se sviluppato nella sua piena generalit` ae con estremo rigore. Ci limitiamo quindi ad una presentazione elementare. Sia Σ ⊂ R3 una superficie regolare e semplice; supponiamo nel seguito che Σ = Σ, ossia che Σ sia un sottoinsieme chiuso di R3 (nel senso della Definizione 4.5).
252
6 Calcolo differenziale per funzioni vettoriali
Sia poi σ : R ⊂ R2 → Σ una sua parametrizzazione, in cui supponiamo che la ◦
regione R sia chiusa. Detto A = R l’interno di R, consideriamo la sua immagine Σσ◦ = σ(A) attraverso σ, che `e un sottoinsieme Σ = σ(R). Possiamo dunque introdurre l’insieme differenza ∂Σσ = Σ \ Σσ◦ , che chiamiamo bordo di Σ (relativo a σ). Gli esempi successivi mostreranno che ∂Σσ contiene tutti i punti che in termini puramente geometrici `e naturale considerare punti di bordo di Σ, ma pu` o contenere anche punti che dipendono da come abbiamo parametrizzato la superficie; ci` o spiega l’aggiunta del pedice σ nella ` dunque naturale definire come bordo di Σ (come oggetto geometrico notazione. E intrinseco della superficie) l’insieme ∂Σ =
2
∂Σσ ,
σ
dove l’intersezione `e fatta su tutte le possibili parametrizzazioni (anche non regolari) di Σ. Si noti che nel § 4.3 abbiamo indicato con ∂Σ la frontiera di Σ come sottoinsieme di R3 ; per una superficie regolare tale insieme coincide con Σ = Σ, non essendovi punti interni ad essa. Nella trattazione delle superfici, interverr` a soltanto il concetto di bordo e non di frontiera. Illustriamo tale definizione con alcuni esempi. Esempi 6.40 i) Consideriamo dapprima la superficie Σ = {(x, y, z) ∈ R3 : x2 + y 2 + (z − 1)2 = 1, z ≥ 1} , vale a dire l’emisfero superiore della sfera di centro (0, 0, 1) e raggio 1. Essa `e ` geometricamente intuitivo (si veda la un insieme chiuso in R3 , ossia Σ = Σ. E Figura 6.17, a sinistra) che il suo bordo `e la circonferenza ∂Σ = {(x, y, z) ∈ R3 : x2 + y 2 + (z − 1)2 = 1, z = 1} . Se parametrizziamo Σ mediante la rappresentazione topografica
σ : R = {(u, v) ∈ R2 : u2 +v 2 ≤ 1} → R3 , σ(u, v) = ui+vj+(1+ u2 + v 2 )k , abbiamo Σσ◦ = {(x, y, z) ∈ R3 : x2 + y 2 + (z − 1)2 = 1, z > 1} , e dunque Σ \ Σσ◦ `e precisamente il bordo sopra indicato. Se invece parametrizziamo Σ attraverso le coordinate sferiche, come 1 = [0, π ]×[0, 2π] → R3 , σ 1 :R 1 (u, v) = sin u cos v i+sin u sin v j +(1+cos u)k , σ 2 π 1 = (0, ) × (0, 2π) e Σ ◦ `e dato dalla parte di superficie sferica stretabbiamo A e σ 2 tamente al di sopra del piano z = 1, privato dell’arco di circonferenza nel piano xz che unisce il punto (0, 0, 2) (polo nord) al punto (1, 0, 1) sull’equatore (si veda la Figura 6.17, a destra); in formule
6.7 Superfici regolari
253
z
z
2 Σ
Σ
1
∂Σ
y
x
∂Σ
y
x
Figura 6.17. Semisfera relativa all’Esempio 6.40 i)
Σσ◦e = {(x, y, z) ∈ R3 : x2 + y 2 + (z − 1)2 = 1, z > 1} \{(x, y, z) ∈ R3 : x > 0, y = 0, x2 + (z − 1)2 = 1} . Ne segue che Σσ◦e contiene oltre ai punti del bordo geometrico, i punti dell’arco 1 tali punti sopra descritto, che sono immagine di una parte della frontiera di R; dipendono dalla particolare scelta della parametrizzazione. ii) Sia ora Σ = {(x, y, z) ∈ R3 : x2 + y 2 = 1, |z| ≤ 1} , l’anello (chiuso) mostrato nella Figura 6.18, il cui bordo geometrico ∂Σ `e dato dall’unione delle due circonferenze definite da x2 + y 2 = 1, z = ±1. Fissato u0 ∈ [0, 2π], possiamo parametrizzare Σ mediante σu0 : [0, 2π] × [−1, 1] → R3 , σu0 (u, v) = cos(u − u0 ) i + sin(u − u0 ) j + vk , che generalizza la parametrizzazione σ = σ0 vista in (6.51). Si ha Σσ◦ u0 = {(x, y, z) ∈ R3 : x2 + y 2 = 1, |z| < 1} \{(cos u0 , sin u0 , z) ∈ R3 : |z| < 1} . Dunque ∂Σσu0 contiene, oltre alle due circonferenze che costituiscono ∂Σ, il segmento verticale {(cos u0 , sin u0 , z) ∈ R3 : |z| < 1} appena introdotto. Facendo l’intersezione di tali bordi, o anche solo di due di essi, si ottiene il bordo geometrico di Σ. iii) Consideriamo infine la superficie Σ = (x, y, z) ∈ R3 : (x, y) ∈ Γ, 0 ≤ z ≤ 1 , dove Γ `e l’arco di Jordan nel piano xy definito da γ1 (t) = ϕ(t) = t(1 − t)2 e γ : [0, 1] → R2 ,
γ2 (t) = ψ(t) = (1 − t)t2
254
6 Calcolo differenziale per funzioni vettoriali z
∂Σ
y Σ x
Figura 6.18. Anello relativo all’Esempio 6.40 ii)
(si veda la Figura 6.19, a sinistra). Parametrizziamo dapprima Σ mediante σ : ` facile convincersi che R → R3 dove R = [0, 1]2 e σ(u, v) = ϕ(u), ψ(u), v . E il bordo ∂Σσ relativo a σ `e dato da ∂Σσ = Γ0 ∪ Γ1 ∪ S0 , dove Γ0 = Γ × {0}, Γ1 = Γ ×{1} e S0 = {(0, 0)}×[0, 1] (si veda la Figura 6.19, a destra). Tuttavia, se estendiamo le funzioni ϕ e ψ per periodicit` a sugli intervalli [k, k + 1], possiamo considerare, per ogni u0 ∈ R, le parametrizzazioni σu0 : R → R3 definite da σu0 (u, v) = ϕ(u − u0 ), ψ(u − u0 ), z , per le quali si ha Σσ◦ u0 = Γ0 ∪ Γ1 ∪ Su0 con Su0 = {γ(u0 )}×[0, 1]. Se ne conclude che il segmento verticale Su0 dipende dalla parametrizzazione, mentre gli anelli inferiore e superiore Γ0 e Γ1 sono comuni a tutte le parametrizzazioni. In definitiva, il bordo di Σ `e dato dall’unione di tali anelli, ossia si ha ∂Σ = Γ0 ∪ Γ1 . 2
z y Γ1
Γ S0
Σ y
Γ0 0
x
x
Figura 6.19. Arco Γ e superficie Σ relativi all’Esempio 6.40 iii)
6.7 Superfici regolari
255
Tra le superfici, sono rilevanti quelle chiuse. Diremo che una superficie regolare e semplice Σ ⊂ R3 `e chiusa se `e limitata (come sottoinsieme di R3 ) e se non ha bordo (∂Σ = ∅). Anche questo concetto, come quello di bordo, `e legato alla geometria della superficie e differisce dal concetto di chiusura topologica nel senso della Definizione 4.5 (precisamente, ogni superficie chiusa `e necessariamente un insieme chiuso in R3 , ma si pu`o avere una superficie topologicamente chiusa ma con bordo). Esempi di superficie chiusa sono la sfera e il toro, che ora discutiamo. Esempi 6.41 i) Ragionando come nell’Esempio 6.40 i), si vede che la parametrizzazione della sfera unitaria Σ = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1} mediante coordinate sferiche (Esempio 4.36 iii)) ha come bordo relativo la semicirconferenza che unisce polo nord e polo sud nel semipiano x ≥ 0, y = 0. Ruotando il sistema di riferimento, si ottengono infinite parametrizzazioni, ognuna delle quali ha come bordo ` immediato una semicirconferenza che unisce due punti tra loro agli antipodi. E convincersi che l’intersezione di tali bordi `e vuota. ii) Un toro si ottiene da un anello quale quello considerato nell’Esempio 6.40 ii), incollando tra loro i bordi superiore ed inferiore. Esso `e il solido Σ ottenuto ruotando di 2π attorno all’asse z una circonferenza di raggio r che si trova in un piano contenente l’asse z, e che ha centro in un punto nel piano xy distante R + r, con R ≥ 0, dall’asse z (si veda la Figura 6.20). Una parametrizzazione di Σ `e data da σ : [0, 2π] × [0, 2π] → R3 con σ(u, v) = (R + r cos u) cos v i + (R + r cos u) sin v j + r sin u k . Il bordo relativo ∂Σσ `e dato dall’unione della circonferenza nel piano z = 0 di centro l’origine e raggio R + r e della circonferenza nel piano y = 0 di centro (R, 0, 0) e raggio r. Anche in questo caso, variando opportunamente la parametrizzazione, si vede che il bordo geometrico ∂Σ `e vuoto, e dunque il toro `e chiuso. 2
z
R r
y x Figura 6.20. Toro relativo all’Esempio 6.41 ii)
256
6 Calcolo differenziale per funzioni vettoriali
Il seguente risultato `e l’analogo del Teorema di Jordan 4.32 per le curve piane. Teorema 6.42 Se una superficie chiusa Σ `e orientabile, essa divide lo spazio R3 in due regioni aperte Ai e Ae , la cui frontiera comune `e Σ. La regione Ai `e limitata e viene detta interna alla superficie, mentre Ae `e non limitata e viene detta esterna alla superficie. Esistono per` o superfici chiuse e non orientabili, che non generano una tale decomposizione. Un esempio classico `e la bottiglia di Klein, ottenuta dal nastro di M¨ obius con un procedimento analogo a quello usato per passare dall’anello al toro (incollando i punti di bordo tra loro). 6.7.4 Superfici regolari a pezzi Estendiamo infine il concetto di superficie regolare, ammettendo che lungo delle curve giacenti sulla superficie possa venire meno l’ipotesi di differenziabilit` a. In questo modo potremo considerare ad esempio le superfici che delimitano i poliedri quali il cubo, il tronco di piramide etc, oppure i solidi di rotazione quali i tronchi di cono o di cilindro etc. Come nel § 6.7.3, supporremo che tutte le superfici considerate nel seguito siano sottoinsiemi chiusi di R3 . Definizione 6.43 Diremo che un sottoinsieme Σ ⊂ R3 `e una superficie (rispettivamente una calotta) regolare a pezzi e semplice se `e l’unione di un numero finito Σ1 , . . . , ΣK di superfici (rispettivamente, calotte) regolari e semplici, aventi la seguente propriet` a: l’intersezione di due qualunque di tali superfici Σh e Σk , ove non vuota o ridotta ad un punto, `e una curva Γhk regolari a tratti e contenuta nel bordo di entrambe. Chiameremo componente o faccia di Σ ogni superficie Σk , e spigolo di Σ ogni curva intersezione tra due facce. Diremo che una tale superficie o calotta Σ `e orientabile se ciascuna sua componente `e orientabile e si pu` o scegliere un orientamento in ciascuna componente in modo tale che nel passaggio attraverso gli spigoli gli orientamenti siano compatibili. La Proposizione 6.39 si estende alle superfici o calotte regolari a pezzi e semplici. Chiameremo bordo ∂Σ di una superficie regolare a pezzi e semplice Σ la chiusura dell’insieme costituito dai punti che appartengono al bordo di una e una sola componente. Equivalentemente, ∂Σ si ottiene dall’unione dei bordi delle singole componenti, togliendo i punti comuni al bordo di due o pi` u componenti, e facendo la chiusura dell’insieme cos´ı ottenuto. Diremo ancora che una superficie regolare a pezzi e semplice `e chiusa se `e limitata e non ha bordo.
6.8 Esercizi
257
Figura 6.21. Cubi relativi agli Esempi 6.44
Esempi 6.44 i) Consideriamo la frontiera di un cubo. Essa `e una superficie regolare a pezzi, le cui componenti sono le sei facce del cubo; essa risulta - in modo ovvio - orientabile e chiusa (Figura 6.21, a sinistra). ii) Consideriamo la superficie regolare a pezzi ottenuta da quella precedente rimuovendo due facce tra loro opposte (Figura 6.21, a destra). Essa rimane orientabile, ma non `e chiusa, avendo come bordo l’unione dei bordi delle due facce rimosse. 2 Osservazione 6.45 Riprendiamo l’esempio ii) precedente per motivare la necessit`a di considerare la chiusura nella definizione di bordo. Supponiamo di considerare un cubo allineato con gli assi cartesiani, da cui abbiamo tolto le facce superiore e inferiore. Allora l’unione dei bordi delle 4 facce che compongono la superficie `e l’unione dei 12 spigoli del cubo. Togliendo i punti comuni al bordo di due facce otteniamo i 4 spigoli orizzontali inferiori e i 4 superiori, privati degli 8 vertici. Chiudendo tale insieme, si aggiungono precisamente gli 8 vertici mancanti e si trova il bordo della superficie considerata, ossia l’unione degli 8 spigoli orizzontali. 2
6.8 Esercizi 1. Calcolare la matrice jacobiana delle seguenti funzioni: a)
f (x, y) = e2x+y i + cos(x + 2y) j
b)
f (x, y, z) = (x + 2y 2 + 3z 3 ) i + (x + sin 3y + ez ) j
258
6 Calcolo differenziale per funzioni vettoriali
2. Calcolare la divergenza dei seguenti campi vettoriali: a)
f (x, y) = cos(x + 2y) i + e2x+y j
b)
f (x, y, z) = (x + y + z) i + (x2 + y 2 + z 2 ) j + (x3 + y 3 + z 3 ) k
3. Calcolare il rotore dei seguenti campi vettoriali: a)
f (x, y, z) = x i + y j + z k
b)
f (x, y, z) = xyz i + z sin y j + xey k x y i+ j f (x, y) = x2 + y 2 x2 + y 2 f (x, y) = grad (logx y)2
c) d)
4. Siano f (x, y) = 3x + 2y e g(u, v) = (u + v) i + uv j. Scrivere esplicitamente la funzione composta f ◦ g e calcolarne il gradiente. 5. Si ripeta l’esercizio precedente per le funzioni: √ x a) f (s, t) = s + t , g(x, y) = xy i + j y b)
f (x, y, z) = xyz ,
g(r, s, t) = (r + s) i + (r + 3t) j + (s − t) k
6. Siano f : R2 → R2 e g : R3 → R2 definite come f (x, y) = sin(2x + y) i + ex+2y j ,
g(u, v, z) = (u + 2v 2 + 3z 3 ) i + (u2 − 2v) j .
a) Calcolare le matrici jacobiane Jf e Jg . b) Determinare la funzione composta h = f ◦ g e calcolarne la matrice jacobiana Jh nel punto (1, −1, 0). 7. Delle seguenti funzioni si calcoli la derivata prima e se ne studi la monotonia nell’intervallo indicato: x arctan x2 y dy , t ∈ [1, +∞) a) f (x) = y 0 √1−x x t ∈ [0, 1] b) f (x) = y 3 8 + y 4 − dy , 2 0 8. Calcolare la lunghezza dei seguenti archi: a)
γ(t) = (t, 3t2 ) ,
t ∈ [0, 1]
b)
γ(t) = (t cos t, t sin t, t) ,
t ∈ [0, 2π]
c)
γ(t) = (t2 , t2 , t3 ) ,
t ∈ [0, 1]
6.8 Esercizi
259
9. Determinare i valori del parametro α ∈ R per cui la lunghezza dell’arco γ(t) = (t, αt2 , t3 ), t ∈ [0, T ], vale (γ) = T + T 3 . 10. Si consideri l’arco chiuso γ il cui sostegno `e l’unione del segmento che unisce A = (− log 2, 1/2) e B = (1, 0), dell’arco di circonferenza di equazione x2 + y 2 = 1 che unisce il punto B con il punto C = (0, 1) e dell’arco della curva γ3 (t) = (t, et ) che unisce C con A. Se ne calcoli la lunghezza. 11. Stabilire se i seguenti archi sono chiusi, regolari o regolari a tratti: a) γ(t) = t(t − π)2 (t − 2πt), cos t , t ∈ [0, 2π] b)
t ∈ [0, 1]
γ(t) = (sin2 2πt, t) ,
12. Determinare i valori del parametro α ∈ R per i quali la curva
γ(t) =
se t < 0 , (αt, t3 , 0) 2 3 (sin α t, 0, t ) se t ≥ 0
`e regolare. 13. Calcolare i vettori normale principale n(s), binormale b(s), torsione b (s), per l’elica circolare γ(t) = (cos t, sin t, t), t ∈ R. 14. Verificare che se una curva γ(t) = x(t)i+y(t)j `e assegnata mediante coordinate polari (r(t), θ(t)), allora γ (t)2 =
dr 2 dt
dθ 2 + r(t) . dt
15. Verificare che se una curva γ(t) = x(t)i + y(t)j + z(t)k `e assegnata mediante coordinate cilindriche r(t), θ(t), z(t) , allora γ (t)2 =
dr 2 dt
dθ 2 dz 2 + r(t) + . dt dt
16. Verificare che se una curva γ(t) = x(t)i + y(t)j + z(t)k `e assegnata mediante coordinate sferiche r(t), ϕ(t), θ(t) , allora γ (t)2 =
dr 2 dt
2 dϕ 2 2 dθ 2 + r(t) + r(t) sin ϕ(t) . dt dt
260
6 Calcolo differenziale per funzioni vettoriali
17. Utilizzando il risultato dell’esercizio 15, calcolare la lunghezza dell’arco γ(t) relativo alle coordinate cilindriche √ π 1 . γ(t) = r(t), θ(t), z(t) = t ∈ 0, 2 cos t, √ t, sin t , 2 2
18. Si consideri la superficie di equazione parametrica σ(u, v) = uv i + (1 + 3u) j + (v 3 + 2u) k . a) b) c) d)
Dire se la superficie `e semplice. Determinare l’insieme R su cui σ `e regolare. Determinare il vettore normale alla superficie in ogni punto di R. Scrivere l’equazione del piano tangente alla superficie in P0 = σ(u0 , v0 ) = (1, 4, 3).
19. Le superfici σ1 (u, v) = cos(2 − u) i + sin(2 − u) j + v 2 k ,
(u, v) ∈ [0, 2π] × [0, 1]
e σ2 (u, v) = sin(3 + 2u) i + cos(3 + 2u) j + (1 − v) k ,
(u, v) ∈ [0, π] × [0, 1]
parametrizzano lo stesso sostegno Σ in R3 . a) Determinare tale sostegno. b) Dire se i versi di attraversamento di Σ definiti da σ1 e σ2 coincidono oppure no. c) Calcolare i versori normali a Σ in P0 = (0, 1, 14 ), associati a σ1 e σ2 . 20. Si consideri la superficie cartesiana σ : R2 → R3 definita da σ(u, v) = u i + v j + (u2 + 3uv + v 2 ) k . a) Calcolare il versore normale n(u, v). b) Determinare i punti sul sostegno Σ della superficie in cui la normale `e perpendicolare al piano di equazione 8x + 7y − 2z = 4.
6.8.1 Soluzioni 1. Matrice jacobiana di funzioni:
e2x+y 2e2x+y a) Jf (x, y) = − sin(x + 2y) −2 sin(x + 2y)
6.8 Esercizi
b) Jf (x, y, z) =
1 4y 1 3 cos 3y
261
2
9z ez
2. Divergenza di campi vettoriali: a)
div f (x, y) = − sin(x + 2y) + e2x+y
b)
div f (x, y, z) = 1 + 2y + 3z 2
3. Rotore di campi vettoriali: a)
rot f (x, y, z) = 0
rot f (x, y, z) = (xey − sin y) i − (ey − xy) j − xz k 2xy c) rot f (x, y) = 2 (x + y 2 )3/2 d) Poich´e f `e un gradiente, grazie alla Proposizione 6.8, il suo rotore `e nullo.
b)
4. Si ha
f ◦ g(u, v) = f g(u, v) = f (u + v, uv) = 3(u + v) + 2uv
e ∇f ◦ g(u, v) = (3 + 2v, 3 + 2u) . 5. Funzioni composte e gradiente: a) Risulta
x = f ◦ g(x, y) = f g(x, y) = f xy, y
e ∇f ◦ g(x, y) =
x xy + y
y y 1 1 x 1 y + , x − . 2 xy 2 + x y 2 xy 2 + x y2
b) Risulta f g(r, s, t) = f (r + s, r + 3t, s − t) = (r + s) (r + 3t) (s − t) e, posto h = f ◦ g, le componenti del gradiente sono ∂h (r, s, t) = (r + 3t) (s − t) + (r + s) (s − t) = 2rs + 2st − 2rt + s2 − 3t2 ∂r ∂h (r, s, t) = (r + 3t) (s − t) + (r + s) (r + 3t) = 2rs + 6st + 2rt − 3t2 + r2 ∂s ∂h (r, s, t) = 3(r + s) (s − t) − (r + s) (r + 3t) = 2rs − 6rt − 6st + 3s2 − r2 . ∂t 6. a) Risulta Jf (x, y) =
2 cos(2x + y) cos(2x + y) ex+2y 2ex+2y
,
Jg(u, v, z) =
1 2u
4v 9z 2 −2 0
.
262
6 Calcolo differenziale per funzioni vettoriali
b) Si ha h(u, v, z) = f (u + 2v 2 + 3z 3 , u2 − 2v) = sin(u2 + 4v 2 + 6z 3 + 2u − 2v) i + e2u
2
+2v 2 +3z 3 +u−4v
j.
Inoltre, g(1, −1, 0) = (3, 3) e dunque Jh(1, −1, 0) = Jf g(1, −1, 0) Jg(1, −1, 0) = Jf (3, 3) Jg(1, −1, 0)
4 cos 9 −10 cos 9 0 2 cos 9 cos 9 1 −4 0 = = 5e9 2 −2 0 2e9 −8e9 0 e9 . 7. Derivate di funzioni definite tramite integrale: a) Risulta arctan x3 > 0, ∀x ∈ R . x Pertanto la funzione `e monotona crescente in [1, +∞). b) Si ha √1−x 1 x −3/2 1 x f (x) = − y 8 + y4 − dy − 3 8 + (1 − x)2 − 6 0 2 2 2 √1−x x −3/2 5 1 1 3 y 8 + y4 − dy + x2 − x + 9 ; =− 2 3 0 2 2 f (x) =
si pu` o osservare facilmente che f (x) ≤ 0 per ogni x ∈ [0, 1] e dunque f `e monotona decrescente su [0, 1]. 8. Lunghezza di archi: ` utile ricordare il seguente integrale indefinito (Vol. I, Esempio 9.13 v)): E 1 1 1 + x2 dx = x 1 + x2 + log( 1 + x2 + x) + c . 2 2 a) Poich´e γ (t) = (1, 6t) risulta
e
γ (t) =
1 + 36t2 ,
1 6 1 + 36t2 dt = 1 + x2 dx 6 0 0 6 1 1 1 2 2 x 1 + x + log( 1 + x + x) = 6 2 2 0 √ 1√ 1 log( 37 + 6) . = 37 + 2 12
(γ) =
1
6.8 Esercizi
b) Poich´e γ (t) = (cos t − t sin t, sin t + t cos t, 1)
e
γ (t) =
2 + t2 ,
risulta
2π
(γ) =
2 + t2 dt = 2
0
√ 2π
1 + x2 dx
0
√2π 1 1 = 2 x 1 + x2 + log( 1 + x2 + x) 2 2 0 √ √ 2 2 = 2π 1 + 2π + log 1 + 2π + 2π .
c) (γ) =
1 27
√ √ 17 17 − 16 2 .
a avere 9. Poich´e γ (t) = (1, 2αt, 3t2 ), si dovr` 3
(γ) = T + T =
T
1 + 4α2 t2 + 9t4 dt .
0
Posto g(T ) = T + T 3 , per il Teorema fondamentale del calcolo integrale, vale g (T ) = 1 + 3T 2 = 1 + 4α2 T 2 + 9T 4 ossia (1 + 3T 2 )2 = 1 + 4α2 T 2 + 9T 4 da cui 4α2 = 6, cio`e α = ± 3/2. 10. Risulta (γ) = (γ1 ) + (γ2 ) + (γ3 ) dove γ1 (t) = t,
1−t , 2(1 + log 2)
γ2 (t) = (cos t, sin t) , γ3 (t) = (t, et ) ,
t ∈ [− log 2, 1] ,
π t ∈ 0, 2
t ∈ [− log 2, 0] .
Dalla geometria elementare si deduce immediatamente che 5 1 2 + 2 log 2 + log2 2 , (γ1 ) = d(A, B) = (1 + log 2) + = 4 4 (γ2 ) =
π 2π = . 4 2
263
264
6 Calcolo differenziale per funzioni vettoriali
Per calcolare (γ3 ), osserviamo che γ3 (t) = (1, et ) e pertanto (γ3 ) =
0
1 + e2t dt .
− log 2
√ Posto u = 1 + e2t , risulta e2t = u2 − 1 e du = (γ3 ) =
√ 2
√ 5/2
u2 du = u2 − 1
2t
√e 1+e2t
dt =
u2 −1 u
dt. Dunque
√ 2
1/2 1/2 − du 1 + √ u−1 u+1 5/2
√ √ √ √ √ u − 1 2 1 5 = u + log + log( 2 − 1)( 5 + 2) . = 2 − √ 2 u+1 2 5/2 In definitiva, π (γ) = + 2
√ √ √ √ 5 5 2 + 2 log 2 + log 2 + 2 − + log( 2 − 1)( 5 + 2) . 4 2
11. Archi chiusi, regolari o regolari a tratti: a) Poich´e γ(0) = (0, 1) = γ(2π), l’arco `e chiuso. Inoltre, γ (t) = 2(t − π)(2t2 − 4πt + π 2 ), − sin t) e quindi γ (t) `e di classe C 1 in [0, 2π]. Notiamo poi che sin t = 0 solo per t = 0, π, 2π e γ (0) = (−2π 3 , 0) = 0, γ (2π) = (−10π 3 , 0) = 0, mentre γ (π) = 0. L’unico punto non regolare `e quindi quello corrispondente a t = π. In conclusione, l’arco `e regolare a tratti. b) Poich´e γ(0) = (0, 0) e γ(1) = (0, 1), l’arco non `e chiuso. Inoltre, γ (t) = (4π sin 2πt cos 2πt, 1) = (0, 0) , ∀t ∈ [0, 1] e quindi l’arco `e regolare. 12. Osserviamo che γ `e continua per ogni t ∈ R e
(α, 3t2 , 0) se t < 0 , γ (t) = 2 2 2 (α cos α t, 0, 3t ) se t ≥ 0 . Certamente γ (t) = 0 per t = 0 e ogni α ∈ R. Per studiare t = 0, notiamo che si ha γ (0− ) = lim γ (t) = (α, 0, 0) , γ (0+ ) = lim+ γ (t) = (α2 , 0, 0) − t→0
t→0
e quindi γ (0) esiste se α = α , ossia se α = 0 oppure α = 1. Se α = 0, γ (0) = 0, mentre se α = 1, γ (0) = (1, 0, 0) = 0. In conclusione l’unico valore del parametro α per cui la curva `e regolare `e α = 1. 2
13. Ricordando l’Esempio 6.29, l’elica circolare pu` o essere riparametrizzata mediante l’ascissa curvilinea come
6.8 Esercizi
√ 2 2 2 1 (s) = cos s, sin s, s , γ 2 2 2 Pertanto, per ogni s ∈ R,
265
√
√
s ∈ R.
√ √ √ √ 2 2 2 2 2 1 (s) = − t(s) = γ sin s, cos s, . 2 2 2 2 2
√
√ √ 2 2 1 1 t (s) = − cos s, − sin s, 0 2 2 2 2 con curvatura K(s) = t (s) = 1/2. Dunque √ √ 2 2 s, − sin s, 0 n(s) = − cos 2 2 e √ √ √ √ √2 2 2 2 2 b(s) = t(s) ∧ n(s) = sin s, − cos s, . 2 2 2 2 2 Infine √ √ 1 2 1 2 cos s, sin s, 0 b (t) = 2 2 2 2 1 e lo scalare torsione vale τ (s) = − 2 . e
14. Ricordando che x = r cos θ ,
y = r sin θ ,
e utilizzando la regola della catena, si ha x (t) =
∂x dr ∂x dθ dr dθ dx = + = cos θ − r sin θ dt ∂r dt ∂θ dt dt dt
y (t) =
∂y dr ∂y dθ dr dθ dy = + = sin θ + r cos θ . dt ∂r dt ∂θ dt dt dt
Dunque, svolgendo i calcoli e usando le relazioni sin2 θ + cos2 θ = 1 per ogni θ ∈ R 2 2 e γ (t)2 = x (t) + y (t) , si ottiene l’uguaglianza desiderata. 16. Ricordando che x = r sin ϕ cos θ ,
y = r sin ϕ sin θ ,
x = r cos ϕ ,
e utilizzando la regola della catena, si ha ∂x dr ∂x dϕ ∂x dθ dx = + + dt ∂r dt ∂ϕ dt ∂θ dt dϕ dθ dr + r cos ϕ cos θ − r sin ϕ sin θ = sin ϕ cos θ dt dt dt
x (t) =
y (t) =
∂y dr ∂y dϕ ∂y dθ dy = + + dt ∂r dt ∂ϕ dt ∂θ dt
266
6 Calcolo differenziale per funzioni vettoriali
= sin ϕ sin θ
dϕ dθ dr + r cos ϕ sin θ + r sin ϕ cos θ dt dt dt
∂z dr ∂z dϕ ∂z dθ dz = + + dt ∂r dt ∂ϕ dt ∂θ dt dϕ dr . = cos ϕ − r sin ϕ dt dt
z (t) =
Dunque, svolgendo i calcoli e usando le relazioni sin2 ξ + cos2 ξ = 1 per ogni ξ ∈ R 2 2 2 e γ (t)2 = x (t) + y (t) + z (t) , si ottiene l’uguaglianza desiderata. 17. Si ha
√ r (t) = − 2 sin t ,
1 θ (t) = √ , 2
z (t) = cos t
e quindi
π/2
(γ) = 0
√ 1 + cos2 t dt = 2 2 sin2 t + 2 cos2 t 2
π/2
dt = 0
√ 2 π. 2
Si noti che il sostegno dell’arco giace sulla superficie dell’ellissoide di equazione √ cartesiana x2 + y 2 + 2z 2 = 2. Il punto iniziale ha coordinate cartesiane ( 2, 0, 0) e quello finale (0, 0, 1) (si veda la Figura 6.22). 18. a) La superficie `e semplice se per (u1 , v1 ), (u2 , v2 ) ∈ R2 vale l’implicazione ⇒
σ(u1 , v1 ) = σ(u2 , v2 )
(u1 , v1 ) = (u2 , v2 ) .
La prima uguaglianza significa !u v = u v 1 1 2 2 1 + 3u1 = 1 + 3u2 v13 + 2u1 = v23 + 2u2 .
z (0, 0, 1)
x
√ ( 2, 0, 0)
y √ (0, 2, 0)
Figura 6.22. Arco relativo all’Esercizio 17
6.8 Esercizi
267
Dalla seconda equazione si ha immediatamente u1 = u2 e sostituendo in una delle altre due si ricava anche v1 = v2 . b) Consideriamo la matrice jacobiana ⎞ ⎛ v u Jσ = ⎝ 3 0 ⎠ . 2 3v 2 I determinanti dei tre minori sono −3u, 9v 2 , 3v 3 − 2u. L’unico punto in cui sono contemporaneamente nulli `e l’origine. Pertanto σ `e regolare su R = R2 \ {(0, 0)}. c) Per (u, v) = 0, si ha ⎞ ⎛ i j k 2 ⎠ = 9v 2 i + (2u − 3v 3 ) j − 3u k . ν(u, v) = det ⎝ v 3 u 0 3v 2 d) Imponendo le condizioni uv = 1 ,
1 + 3u = 4 ,
v 2 + 2u = 3 ,
si vede che il punto P0 = (1, 4, 3) `e immagine tramite σ di (u0 , v0 ) = (1, 1). Pertanto, il piano tangente cercato pu` o essere parametrizzato come ∂σ ∂σ (1, 1) (u − 1) + (1, 1) (v − 1) ∂u ∂v = (1, 4, 3) + (1, 3, 2)(u − 1) + (1, 0, 3)(v − 1) = (u + v − 1) i + (3u + 1) j + (2u + 3v − 2) k .
Π(u, v) = σ(1, 1) +
In coordinate cartesiane x = u + v − 1, y = 3u + 1, z = 2u + 3v − 2 tale piano ha equazione 9x − y − 3z + 4 = 0. 19. a) Al variare di u in [0, 2π], il vettore cos(2 − u) i + sin(2 − u) j percorre la circonferenza unitaria nel piano z = 0, mentre al variare di v in [0, 1], il vettore v2 k percorre il segmento [0, 1] sull’asse z. Ne segue che Σ `e un anello cilindrico di altezza 1 con asse coincidente con l’asse z. b) Applicando la formula (6.48), il vettore normale a Σ definito dalla parametrizzazione σ1 `e dato da ν1 (u, v) = −2v cos(2 − u) i − 2v sin(2 − u) j , mentre quello definito da σ2 `e ν2 (u, v) = 2 sin(3 + 2u) i + 2 cos(3 + 2u) j . Se P = σ(u1 , v1 ) = σ2 (u2 , v2 ) `e un qualunque punto su Σ, dovr` a essere cos(2 − u1 ) = sin(3 + 2u2 ) e
sin(2 − u1 ) = cos(3 + 2u2 ) ;
268
6 Calcolo differenziale per funzioni vettoriali
pertanto, ν1 (u1 , v1 ) = −v1 ν2 (u2 , v2 ) . Poich´e v1 `e non negativo, i versi di attraversamento sono l’uno l’opposto dell’altro. c) Si ha P0 = σ 2 − π2 , 12 = σ π − 23 , 34 . Dunque ν1 (P0 ) = −j, mentre ν2 (P0 ) = 2j. I versori normali saranno quindi n1 (P0 ) = −j e n2 (P0 ) = j. 20. a) Usando l’espressione (6.49), abbiamo ν(u, v) = −(2u + 3v) i − (3u + 2v) j + k ; normalizzando tale vettore, otteniamo n(u, v) = −
(3u + 2v) 1 (2u + 3v) i− j+ k ν ν ν
con ν2 = 13(u2 + v 2 ) + 24uv + 1. b) La condizione di ortogonalit` a si esprime imponendo che ν sia parallelo al vettore 8i + 7j − 2k. Pertanto, imponiamo che ⎧ ⎨ −(2u + 3v) = 8λ −(3u + 2v) = 7λ ⎩ 1 = −2λ . Risolvendo tale sistema, otteniamo λ = −1/2 e u = 1/2, La condizione v = 1. richiesta `e dunque soddisfatta dal punto P0 = σ 12 , 1 = 12 , 1, 11 4 .
7 Applicazioni del calcolo differenziale
Concludiamo in questo capitolo la presentazione del calcolo differenziale per funzioni di pi` u variabili e vettoriali. Due sono gli argomenti trattati: il Teorema della funzione implicita con le sue applicazioni e lo studio degli estremi vincolati di una funzione. Il Teorema della funzione implicita fornisce condizioni sufficienti affinch´e una equazione che lega tra loro due o pi` u variabili indipendenti possa essere esplicitata, esprimendo una delle variabili in funzione delle altre. Il teorema permette di comprendere la natura degli insiemi di livello delle funzioni reali di due o tre variabili, che in condizioni di regolarit` a risultano essere rispettivamente curve e superfici nello spazio. Inoltre, il teorema fornisce gli strumenti per studiare il luogo dei punti definiti come soluzione di equazioni assegnate. Gli estremi vincolati di una funzione, ossia gli estremi della funzione ristretta a un certo sottoinsieme del dominio, vengono studiati attraverso due diversi metodi. Il primo, detto metodo parametrico, riduce il problema alla ricerca di estremi liberi in dimensione inferiore; il secondo, detto metodo dei moltiplicatori di Lagrange, si basa su considerazioni di tipo geometrico, riconducendo il problema allo studio dei punti stazionari di una nuova funzione, nota come lagrangiana del problema.
7.1 Teorema della funzione implicita Un’equazione della forma f (x, y) = 0
(7.1)
stabilisce una relazione implicita tra le variabili x e y; in termini geometrici, essa definisce un luogo nel piano, l’insieme di tutti i punti P = (x, y) le cui coordinate soddisfano l’equazione. Molto spesso, `e possibile esplicitare la relazione esprimendo, almeno localmente, cio`e nell’intorno di una soluzione, una delle due variabili in funzione dell’altra, come y = ϕ(x) oppure x = ψ(y). Ad esempio, l’equazione f (x, y) = ax + by + c = 0 ,
con a2 + b2 = 0 ,
Canuto C, Tabacco A: Analisi Matematica II. © Springer-Verlag Italia, Milano 2008
270
7 Applicazioni del calcolo differenziale
definisce una retta nel piano, ed equivale a y = ϕ(x) = − 1b (ax+c) se b = 0, oppure a x = ψ(y) = − a1 (by + c) se a = 0. Invece, l’equazione f (x, y) = x2 + y 2 − r2 = 0 ,
con r > 0 ,
definisce una circonferenza di centro l’origine e raggio r; se (x0 , y0 ) giace sulla circonferenza e se ad esempio y0 > 0, possiamo ‘ricavare y in funzione√di x’ in un 2 2 intorno di x0 , ossia scrivere la relazione precedente come y = ϕ(x) = r − x ; se 2 2 invece x0 < 0, possiamo scrivere x = ψ(y) = − r − y in un intorno di y0 . Non si pu` o invece esprimere y come funzione di x in un intorno di x0 = r oppure −r, n´e x come funzione di y in un intorno di y0 = r oppure −r, perch´e si violerebbe la condizione di univocit` a dell’immagine di una funzione. Si presti attenzione al fatto che in tutti i casi appena visti in cui si pu` o esplicitare una variabile rispetto all’altra, la derivata parziale di f rispetto a quella variabile risulta diversa da ∂f ∂f ∂f zero ( ∂f ∂y = b = 0, ∂x = a = 0 per la retta, ∂y = 2y0 > 0, ∂x = 2x0 < 0 per la circonferenza); al contrario, notiamo che dove ci` o non `e possibile la derivata parziale `e nulla. Passando a situazioni pi` u complesse, `e opportuno distinguere tra l’esistenza di una funzione tra le variabili indipendenti che rende esplicita la relazione (7.1), e la possibilit` a di rappresentare tale funzione in termini di funzioni elementari note. Ad esempio, la relazione y e2x + cos y − 2 = 0 si esplicita come 1 1 log(2 − cos y) − log y . 2 2 Invece, non siamo in grado di ricavare una variabile in funzione dell’altra nell’equazione x5 + 3x2 y − 2y 4 − 1 = 0 ; x=
tuttavia, uno studio grafico dell’equazione, ad esempio nell’intorno della soluzione (x0 , y0 ) = (1, 0), indica che ivi essa definisce y in funzione di x, ed i risultati teorici che andiamo a stabilire confermeranno rigorosamente tale asserto (si veda l’Esempio 7.2). Ha dunque interesse avere a disposizione dei criteri che, laddove non sia possibile esplicitare in forma analitica chiusa una delle due variabili in funzione dell’altra, garantiscano almeno che una tale funzione esiste, ad esempio per fondare su solidi basi l’uso di metodologie numeriche per il suo calcolo. Il classico Teorema della funzione implicita o del Dini, che presentiamo in questo paragrafo, fornisce una condizione sufficiente per l’esistenza della funzione; essa richiede precisamente il non annullarsi della derivata parziale di f rispetto alla variabile che si vuole esplicitare. Le considerazioni fatte sinora si estendono in modo ovvio al caso di equazioni che legano tra loro tre o pi` u variabili; ad esempio la relazione f (x, y, z) = 0
(7.2)
7.1 Teorema della funzione implicita
271
permette di definire, sotto opportune ipotesi, z in funzione di x e y come z = ϕ(x, y). Un’altra estensione riguarda il caso di sistemi di equazioni. Molteplici sono le applicazioni del Teorema della funzione implicita. Ad esempio, diverse leggi della fisica (si pensi alla termodinamica) legano tra loro due o pi` u grandezze attraverso una o pi` u relazioni implicite, che possono essere di volta in volta esplicitate in dipendenza dello stato specifico del sistema considerato. In geometria, il teorema permette di descrivere, almeno localmente, il luogo dei punti dello spazio le cui coordinate soddisfano la relazione (7.2) come una superficie regolare e semplice; esso `e quindi alla base di una visione ‘intrinseca’ delle superfici, come luoghi di punti definiti da equazioni algebriche e trascendenti. Iniziamo presentando il teorema nel caso bidimensionale. Teorema 7.1 Sia Ω un aperto non vuoto di R2 e sia f : Ω → R una funzione di classe C 1 . Supponiamo che in un punto (x0 , y0 ) ∈ Ω si abbia f (x0 , y0 ) = 0. ∂f Se (x0 , y0 ) = 0, allora esiste un intorno I di x0 e una funzione ϕ : I → R ∂y tali che: i) x, ϕ(x) ∈ Ω per ogni x ∈ I; ii) y0 = ϕ(x0 ); iii) f x, ϕ(x) = 0 per ogni x ∈ I; iv) ϕ `e di classe C 1 in I e la sua derivata `e data da ∂f x, ϕ(x) ϕ (x) = − ∂x . ∂f x, ϕ(x) ∂y
(7.3)
Inoltre, in un intorno di (x0 , y0 ), l’insieme degli zeri della funzione f coincide con il grafico della funzione ϕ. Dim.
; Complementi al Cap. 7
Si noti che la funzione x → γ(x) = x, ϕ(x) `e una curva nel piano, il cui sostegno `e precisamente il grafico della funzione ϕ. Esempio 7.2 Consideriamo l’equazione, gi` a citata nelle considerazioni introduttive, x5 + 3x2 y − 2y 4 = 1 , che ammette come soluzione (x0 , y0 ) = (1, 0). Per studiare l’esistenza di altre soluzioni nell’intorno di tale punto, consideriamo la funzione f (x, y) = x5 + 3x2 y − 2y 4 − 1 .
272
7 Applicazioni del calcolo differenziale
Si ha fy (x, y) = 3x2 − 8y 3 , da cui fy (1, 0) = 3 > 0. Dunque possiamo applicare il teorema precedente, ottenendo l’esistenza di una funzione y = ϕ(x) definita e derivabile in un intorno I di x0 = 1, tale che ϕ(1) = 0 e 4 x5 + 3x2 ϕ(x) − 2 ϕ(x) = 1 , x∈I. 4 Essendo fx (x, y) = 5x + 6xy, si ha fx (1, 0) = 5 e dunque ϕ (1) = − 53 . La funzione ϕ `e quindi decrescente in x0 = 1 e la tangente al suo grafico in tale punto ha equazione y = − 53 (x − 1). 2 ∂f (x0 , y0 ) = 0, si giunge ad un risultato analogo Nel caso in cui si abbia ∂x al Teorema 7.1, in cui il ruolo delle variabili x e y `e scambiato. In definitiva, possiamo sintetizzare quanto visto finora nel modo seguente (la Figura 7.1 illustra tale situazione). Corollario 7.3 Sia Ω un aperto non vuoto di R2 e sia f : Ω → R una funzione di classe C 1 . La relazione f (x, y) = 0 pu` o essere esplicitata nella forma y = ϕ(x) oppure x = ψ(y) nell’intorno di ogni zero (x0 , y0 ) di f in cui si abbia ∇f (x0 , y0 ) = 0 (cio`e di ogni punto regolare). Sorge naturale chiedersi quale sia invece la struttura dell’insieme degli zeri nell’intorno di un punto stazionario in cui f si annulla. Supponendo f di classe y
J y1
f (x, y) = 0 x = ψ(y) (x1 , y1 )
y = ϕ(x) (x0 , y0 ) I
x0
x
Figura 7.1. Intervalli in cui la relazione f (x, y) = 0 `e esplicitabile rispetto a x oppure rispetto a y
7.1 Teorema della funzione implicita
273
C 2 , l’analisi della matrice hessiana Hf (x0 , y0 ) sviluppata nel capitolo precedente fornisce utili informazioni. i) Se Hf (x0 , y0 ) `e definita (positiva o negativa), allora (x0 , y0 ) `e punto di minimo o massimo locale stretto; dunque f sar`a strettamente positiva o negativa in tutto un intorno di (x0 , y0 ), escluso il suo centro. Pertanto, (x0 , y0 ) `e uno zero isolato di f . Un esempio `e l’origine per la funzione f (x, y) = x2 + y 2 . ii) Se Hf (x0 , y0 ) `e indefinita, ossia ha un autovalore λ1 > 0 e un autovalore λ2 < 0, allora si pu` o dimostrare che l’insieme degli zeri di f in un intorno di (x0 , y0 ) non `e il grafico di una funzione, essendo costituito dai sostegni di due curve distinte, che si intersecano in (x0 , y0 ) formando un angolo dipendente dal rapporto degli autovalori. Ad esempio, gli zeri della funzione f (x, y) = 4x2 −25y 2 stanno sulle due rette di equazione y = ± 25 x, che si intersecano nell’origine (Figura 7.2, a sinistra). o dire alcunch´e iii) Se Hf (x0 , y0 ) ha uno o entrambi gli autovalori nulli, non si pu` in generale. Ad esempio, assumendo ancora l’origine come punto (x0 , y0 ), gli √ zeri 3 della funzione f (x, y) = x4 − y 3 coincidono con il grafico della funzione y = x4 (Figura 7.2, al centro). Al contrario, la funzione f (x, y) = x4 −16y 2 si annulla lungo le due parabole di equazione y = ± 14 x2 , che si incontrano nell’origine (Figura 7.2, a destra). Enunciamo ora il Teorema della funzione implicita per le funzioni scalari di tre variabili. Teorema 7.4 Sia Ω un aperto non vuoto di R3 e sia f : Ω → R una funzione di classe C 1 . Supponiamo che in un punto (x0 , y0 , z0 ) ∈ Ω si abbia ∂f (x0 , y0 , z0 ) = 0, allora esiste un intorno A di (x0 , y0 ) f (x0 , y0 , z0 ) = 0. Se ∂z e una funzione ϕ : A → R tali che: i) x, y, ϕ(x, y) ∈ Ω per ogni x ∈ A; ii) z0 = ϕ(x0 , y0 ); iii) f x, y, ϕ(x, y) = 0 per ogni x ∈ A; iv) ϕ `e di classe C 1 in A e le sue derivate parziali sono date da ∂f ∂f x, y, ϕ(x, y) x, y, ϕ(x, y) ∂ϕ ∂ϕ ∂y (x, y) = − ∂x , ∂y (x, y) = − ∂f . (7.4) ∂f ∂x x, y, ϕ(x, y) x, y, ϕ(x, y) ∂z ∂z Inoltre, in un intorno di (x0 , y0 , z0 ), l’insieme degli zeri della funzione f coincide con il grafico della funzione ϕ. La funzione (x, y) → σ(x, y, z) = x, y, ϕ(x, y) definisce una superficie regolare e semplice nello spazio; alcune delle sue propriet` a saranno studiate nel § 7.2.
274
7 Applicazioni del calcolo differenziale y
y y=
2 x 5
x
y=
√ 3
x
y = − 25 x
y x4
y = 14 x2
x y = − 14 x2
Figura 7.2. Insieme degli zeri delle funzioni f (x, y) = 4x2 − 25y 2 (a sinistra), f (x, y) = x4 − y 3 (al centro) e f (x, y) = x4 − 16y 2 (a destra)
Come nel caso precedente, il teorema pu`o essere applicato sotto l’ipotesi che il punto (x0 , y0 , z0 ) sia regolare, eventualmente dopo aver scambiato il ruolo delle variabili indipendenti. I due teoremi precedenti sono casi particolari di un risultato generale, che si applica alle funzioni a valori vettoriali e che ora enunciamo. Siano n ed m interi tali che n ≥ 2 e 1 ≤ m ≤ n − 1. Sia Ω un aperto non vuoto in Rn e sia F : Ω → Rm una funzione di classe C 1 . Selezioniamo m delle n variabili indipendenti x1 , x2 , . . . , xn ; applicando eventualmente una permutazione della numerazione, non `e restrittivo supporre che esse siano le ultime m. Dunque decomponiamo x in (ξ, μ) con ξ = (x1 , . . . , xn−m ) ∈ Rn−m e μ = (xn−m+1 , . . . , xn ) ∈ Rm . Corrispondentemente, decomponiamo la matrice jacobiana di F in un punto x ∈ Ω nella matrice a m righe ed n − m colonne Jξ F (x), formata dalle prime n − m colonne di JF (x), e nella matrice a m righe ed m colonne Jμ F (x) formata dalle ultime m colonne di JF (x). Il risultato seguente permette di esplicitare localmente la relazione F (x) = 0, ossia F (ξ, μ) = 0, nella forma μ = Φ(ξ). Teorema 7.5 (della funzione implicita, o di Dini) Sotto le ipotesi e con le notazioni sopra introdotte, sia x0 = (ξ0 , μ0 ) ∈ Ω un punto tale che F (x0 ) = 0. Se la matrice Jμ F (x0 ) `e non singolare, allora esistono un intorno A ⊆ Ω di x0 e un intorno I di ξ0 in Rn−m , tali che l’insieme {x ∈ A : F (x) = 0} degli zeri di F in A coincide con l’insieme {x = ξ, Φ(ξ) : ξ ∈ I} grafico di una funzione Φ : I → Rm di classe C 1 soddisfacente Φ(ξ0 ) = μ0 . In I, la matrice jacobiana di Φ (avente m righe ed n−m colonne) `e soluzione del sistema lineare Jμ F ξ, Φ(ξ) J Φ(ξ) = −Jξ F ξ, Φ(ξ) . (7.5)
7.1 Teorema della funzione implicita
275
Si noti che i Teoremi 7.1 e 7.4 rientrano in tale enunciato ponendo rispettivamente n = 2, m = 1 e n = 3, m = 1. L’esempio seguente illustra un’altra situazione di interesse. Esempio 7.6 Consideriamo il sistema di due equazioni in tre incognite
f1 (x, y, z) = 0 f2 (x, y, z) = 0 1 con fi definite e di classe C in un aperto Ω di R3 , e sia x0 = (x0 , y0 , z0 ) ∈ Ω una sua soluzione. Ponendo n = 3, m = 2 e F = (f1 , f2 ), il teorema precedente ci assicura che se la matrice ⎛ ∂f ⎞ ∂f1 1 (x0 ) (x0 ) ⎜ ∂y ⎟ ∂z ⎜ ⎟ ⎝ ∂f ⎠ ∂f2 2 (x0 ) (x0 ) ∂y ∂z `e non singolare, allora il sistema ammette, in un intorno di x0 , infinite soluzioni, che si esprimono nella forma x, ϕ1 (x), ϕ2 (x) , con Φ = (ϕ1 , ϕ2 ) : I ⊂ R → R2 di classe C 1 in un intorno I di x0 . Le componenti della derivata prima Φ di Φ in x ∈ I sono soluzioni del sistema lineare ⎛ ∂f 1 x, ϕ1 (x), ϕ2 (x) ⎜ ∂y ⎜ ⎝ ∂f 2 x, ϕ1 (x), ϕ2 (x) ∂y
⎞ ⎞⎛ ∂f1 ϕ1 (x) x, ϕ1 (x), ϕ2 (x) ⎟ ∂z ⎟ ⎟⎜ ⎠= ⎝ ⎠ ∂f2 x, ϕ1 (x), ϕ2 (x) ϕ2 (x) ∂z ⎛ ∂f ⎞ 1 x, ϕ1 (x), ϕ2 (x) ⎜ ∂x ⎟ = −⎝ ⎠. ∂f2 x, ϕ1 (x), ϕ2 (x) ∂x La funzione x → γ(x) = x, ϕ1 (x), ϕ2 (x) rappresenta una curva (regolare) nello spazio. 2 7.1.1 Invertibilit` a locale di una funzione Come applicazione, mostriamo che per funzioni regolari che operano da Rn in s´e, la non singolarit` a della matrice jacobiana in un punto implica l’invertibilit` a della funzione nell’intorno del punto. Questo risultato estende al caso multidimensionale una propriet` a valida per le funzioni reali di variabile reale: se f `e di classe C 1 nell’intorno di un punto x0 ∈ dom f ⊆ R, e se f (x0 ) = 0, allora f `e di segno costante in un intorno di x0 (Teorema della permanenza del segno), dunque ivi strettamente monotona e quindi invertibile; inoltre, f −1 `e derivabile e (f −1 ) (y0 ) = 1/f (x0 ).
276
7 Applicazioni del calcolo differenziale
Proposizione 7.7 Sia f : dom f ⊆ Rn → Rn una funzione di classe C 1 nell’intorno di un punto x0 ∈ dom f . Se Jf (x0 ) `e non singolare, allora la funzione inversa x = f −1 (y) `e definita in un intorno di y0 = f (x0 ), `e ivi di classe C 1 e si ha −1 J (f −1 )(x0 ) = Jf (x0 ) . (7.6) Dim.
Introduciamo la funzione ausiliaria F : dom f × Rn ⊆ R2n → Rn definita da F (x, y) = f (x)−y. Si ha F (x0 , y0 ) = 0 e JF (x0 , y0 ) = ( Jf (x0 ) , I ) (matrice a n righe e 2n colonne). Poich´e Jx F (x0 , y0 ) = Jf (x0 ), possiamo applicare il Teorema 7.5; esiste dunque un intorno Br (y0 ) e unafunzione di classe C 1 g : Br (y0 ) → dom f tale che F g(y), y = 0, ossia f g(y) = y, ∀y ∈ Br (y0 ). Si ha quindi g(y) = f −1 (y), e la relazione (7.6) segue dalla (7.5) 2
Osserviamo che l’espressione della matrice jacobiana della funzione inversa `e gi`a stata ottenuta nel Corollario 6.16, come conseguenza della regola della catena e sotto ipotesi la cui validit` a `e precisamente assicurata dalla proposizione precedente. Il risultato appena stabilito pu` o essere letto in termini di risolubilit` a di un sistema di equazioni. Interpretiamo infatti la relazione f (x) = y
(7.7)
come un sistema (non lineare) di n equazioni in n incognite, in cui y `e il termine noto e x `e la soluzione. Supponiamo, in corrispondenza di un certo dato y0 , di conoscere una soluzione x0 . Allora, se la matrice jacobiana Jf (x0 ) `e non singolare, possiamo concludere che l’equazione (7.7) ammette una e una sola soluzione x, vicina a x0 , per ogni scelta del dato y sufficientemente vicino a y0 . A sua volta, l’invertibilit` a della matrice jacobiana in x0 equivale al fatto che il sistema lineare f (x0 ) + Jf (x0 )(x − x0 ) = y ,
(7.8)
ottenuto linearizzando il primo membro della (7.7) attorno a x0 , ammette soluzione qualunque sia y ∈ Rn (`e infatti sufficiente scrivere tale sistema come Jf (x0 )x = y − f (x0 ) + Jf (x0 )x0 e osservare che il secondo membro assume valori arbitrari in Rn al variare di y in Rn ). Concludiamo che, se conosciamo una soluzione x0 di un’equazione non lineare in corrispondenza di un certo dato y0 , e se l’equazione linearizzata attorno a tale soluzione `e risolubile, allora anche l’equazione non lineare ammetter` a soluzione per ogni valore del dato abbastanza vicino a y0 . Esempio 7.8 Consideriamo il sistema non lineare
3 x + y 3 − 2xy = a 3x2 + xy 2 = b ,
7.2 Curve e superfici di livello
277
che ammette la soluzione (x0 , y0 ) = (1, 2) per (a, b) = (5, 7). Posto f (x, y) = (x3 + y 3 − 2xy, 3x2 + xy 2 ), abbiamo
2 3x − 2y 3y 2 − 2x . Jf (x, y) = 6x + y 2 2xy Essendo
10 4 det Jf (1, 2) = det = 104 > 0 , −1 10 concludiamo che il sistema precedente ammette una e una sola soluzione (x, y) per ogni scelta di a sufficientemente vicino a 5 e di b sufficientemente vicino a 7. 2
7.2 Curve e superfici di livello Possiamo ora riprendere il discorso riguardante gli insiemi di livello L(f, c) di una funzione, gi` a introdotti in (4.19). Gli strumenti del calcolo differenziale elaborati fino ad ora ci permettono di descrivere la loro forma, almeno nel caso in cui la funzione soddisfi opportune ipotesi di regolarit` a. Lo studio degli insiemi di livello fornisce utili informazioni sul comportamento della funzione, facendo variare il valore del parametro di livello c. D’altro canto, la ricerca dell’insieme delle soluzioni di un’equazione del tipo f (x, y) = 0
oppure
f (x, y, z) = 0
pu` o essere interpretata come la determinazione dell’insieme di livello L(f, 0) di f . Come gi`a ricordato, sotto opportune condizioni, tali relazioni implicite tra le variabili indipendenti definiscono rispettivamente delle curve o delle superfici regolari e semplici nel piano o nello spazio. Nel seguito, ci limiteremo a considerare il caso bidimensionale e tridimensionale, iniziando dal primo. 7.2.1 Curve di livello Sia dunque f una funzione reale di due variabili reali; fissato c ∈ im f , sia L(f, c) il corrispondente insieme di livello e sia x0 ∈ L(f, c). Supponiamo che f sia di classe C 1 in un intorno di x0 , e che tale punto sia regolare, ossia ∇f (x0 ) = 0. Se applichiamo il Corollario 7.3 alla funzione f (x) − c, possiamo dire che in un opportuno intorno B(x0 ) di x0 , i punti che appartengono a L(f, c) costituiscono il sostegno di una curva regolare e semplice γ : I → B(x0 ) (data da un grafico rispetto a una delle due variabili); inoltre, il punto t0 ∈ I tale che γ(t0 ) = x0 `e interno ad I. In altri termini, si ha L(f, c) ∩ B(x0 ) = {x ∈ R2 : x = γ(t), con t ∈ I} , e dunque
f γ(t) = 0
∀t ∈ I .
(7.9)
278
7 Applicazioni del calcolo differenziale x = γ(t) γ (t0 ) ∇f (x0 ) x0
Figura 7.3. Curve di livello e gradiente di una funzione
Se questo ragionamento pu` o essere fatto in ogni punto dell’insieme di livello L(f, c), ossia se f `e di classe C 1 in un insieme aperto contenente L(f, c) e ogni punto di L(f, c) `e regolare, allora l’insieme di livello sar`a costituito dall’unione di sostegni di curve regolari e semplici. Si parler` a in tal caso di curve di livello della funzione f . La seguente propriet` a `e particolarmente significativa (si veda la Figura 7.3). Proposizione 7.9 In un punto regolare su una curva di livello, il gradiente della funzione `e perpendicolare alla tangente alla curva nel punto. Dim.
Derivando la (7.9) nel punto t0 ∈ I (si ricordi la (6.13)), abbiamo ∇f (x0 ) · γ (t) = 0 , da cui segue il risultato .
2
Pertanto se ci muoviamo a partire da x0 lungo una curva di livello, il valore della funzione non cambia, mentre se ci muoviamo nella direzione perpendicolare, il valore della funzione subisce la massima variazione (si ricordi la Proposizione 5.10). Pu` o essere di interesse osservare che il rotore rotf del campo scalare f , definito in (6.7), `e sempre ortogonale al gradiente di f e dunque `e tangente alle curve di livello di f . Nella Figura 7.4, `e mostrata la relazione tra le curve di livello e il grafico di una funzione. Si ricordi che le curve di livello definite da f (x, y) = c sono le proiezioni sul piano xy dell’intersezione tra il grafico di f e i piani z = c. Cos`ı se si disegnano le curve di livello di una funzione variando il parametro c con passo costante, esse si addensano (sono pi` u vicine tra loro) laddove il grafico della funzione `e pi` u “ripido”, e si diradano laddove il grafico `e pi` u “piatto”. Esempi 7.10
i) Sia f (x, y) = 9 − x2 − y 2 . Abbiamo mostrato il suo grafico in Figura 4.8. Le curve di livello sono date da 9 − x2 − y 2 = c ossia x 2 + y 2 = 9 − c2 .
7.2 Curve e superfici di livello
279
z
y x
Figura 7.4. Relazione tra grafico di una funzione e curve di livello
Si tratta di una famiglia di circonferenze con centro nell’origine e raggio Si veda la Figura 7.5.
√
9 − c2 .
ii) In Figura 7.6 sono raffigurate curve di livello con il corrispondente grafico. 2 Ovviamente, su un insieme di livello possono esistere punti non regolari di f , ossia punti stazionari. In tal caso, non `e detto che l’insieme di livello si possa rappresentare, nell’intorno del punto, come il sostegno di una curva.
y c=2 c=3
c=1 c=0
x
Figura 7.5. p Rappresentazione grafica di alcune curve di livello relative alla funzione f (x, y) = 9 − x2 − y 2
280
7 Applicazioni del calcolo differenziale y
z
x y x
y z
x
y x 2 −y 2
Figura 7.6. Grafico e alcune curve di livello relative alle funzioni f (x, y) = −xye−x x , in basso in alto, e f (x, y) = − 2 x + y2 + 1
,
Esempio 7.11 L’insieme di livello L(f, 0) della funzione f (x, y) = x4 − x2 + y 2 `e mostrato in Figura 7.7. L’origine `e punto stazionario, di tipo sella. In ogni intorno dell’origine, l’insieme di livello `e costituito da due rami che si intersecano perpendicolarmente; dunque, non pu` o essere il grafico di una funzione rispetto a una delle due variabili. 2 Un tipico esempio di utilizzo delle curve di livello `e costituito dalle mappe topografiche, si veda la Figura 7.8. Le curve di livello di un certo territorio, dette isoipse, sono le curve che uniscono i punti con la stessa altezza rispetto al livello
7.2 Curve e superfici di livello
281
y
−1
1
x
Figura 7.7. Insieme di livello L(f, 0) con f (x, y) = x4 − x2 + y 2
del mare: camminando lungo esse si rimane in piano. Un altro esempio comune `e dato dalla rappresentazione della temperatura del territorio in una dato istante. In questo caso, le curve di livello sono dette isoterme e uniscono localit` a con la stessa temperatura. Analogamente le curve di livello dette isobare uniscono localit` a in cui la pressione atmosferica `e la stessa. 7.2.2 Superfici di livello Anche per le funzioni reali di tre variabili reali possiamo esprimere parametricamente gli insiemi di livello, nell’intorno dei punti regolari. Precisamente, se f `e di classe C 1 nell’intorno di un punto x0 ∈ L(f, c) e se ∇f (x0 ) = 0, allora l’analogo del Corollario 7.3 in dimensione 3 (che discende facilmente dal Teorema 7.4) assicura l’esistenza di un intorno B(x0 ) di x0 e di una superficie regolare e semplice σ : R → B(x0 ) tale che L(f, c) ∩ B(x0 ) = {x ∈ R3 : x = σ(u, v), con (u, v) ∈ R} e dunque
f σ(u, v) = c
∀(u, v) ∈ R .
(7.10)
Figura 7.8. Rappresentazione tridimensionale di un territorio e corrispondenti isoipse
282
7 Applicazioni del calcolo differenziale
In altri termini, L(f, c) si rappresenta localmente come il sostegno di una superficie di livello della funzione f . Vale una propriet` a analoga alla Proposizione 7.9. Proposizione 7.12 In un punto regolare di una superficie di livello il gradiente della funzione `e parallelo al vettore normale alla superficie nel punto. Dim.
Calcolando le derivate parziali della funzione f ◦ σ nel punto (u0 , v0 ) ∈ R tale che σ(u0 , v0 ) = x0 , abbiamo ∂σ (u0 , v0 ) = 0 , ∂u Il risultato segue allora dalla (6.48) ∇f (x0 ) ·
∇f (x0 ) ·
∂σ (u0 , v0 ) = 0 . ∂v 2
Esempi 7.13 i) Le superfici di livello della funzione f√(x, y, z) = x2 + y 2 + z 2 formano una famiglia di sfere concentriche con raggio c. I loro vettori normali sono allineati con il gradiente di f . Si veda la Figura 7.9. ii) Illustriamo come il Teorema della funzione implicita e le sue conseguenze possano essere usati nello studio di una superficie definita attraverso una equazione algebrica. Sia Σ ⊂ R3 il luogo dei punti le cui coordinate soddisfano l’equazione f (x, y, z) = 2x4 + 2y 4 + 2z 4 + x − y − 6 = 0 . Il gradiente ∇f (x, y, z) = (8x3 +1, 8y 3 −1, 8z 3 ) si annulla solo in P0 = (− 12 , 12 , 0), ma tali coordinate non soddisfano l’equazione, cio`e P0 ∈ / Σ. Pertanto, tutti i punti P di Σ sono regolari e quindi Σ `e una superficie regolare e semplice, che nell’intorno di ogni suo punto P si rappresenta in forma cartesiana, esprimendo una delle variabili in funzione delle altre due. Osserviamo poi che si ha facilmente lim f (x) = +∞ , x→∞
e dunque l’aperto Ω = {(x, y, z) ∈ R3 : f (x, y, z) < 0} , contenente l’origine e di cui Σ rappresenta la frontiera, `e limitato; pertanto, Σ `e un insieme compatto. Si pu` o dimostrare che Σ non ha bordo, ossia `e una superficie chiusa. Infine, applicando la Proposizione 7.9 possiamo affermare che, ad esempio, il vettore normale (definito a meno del segno) a Σ in P1 = (1, 1, 1) `e proporzionale a ∇f (1, 1, 1) = (9, 7, 8). Il versore normale ν in P1 , orientato in modo da allontanarsi dall’origine (cio`e tale che ν · x > 0), `e dunque dato da 1 ν=√ (9i + 7j + 8k) . 2 194
7.3 Estremi vincolati
283
x2 + y 2 + z 2 = 4 z
x2 + y 2 + z 2 = 1
x2 + y 2 + z 2 = 9
y x
Figura 7.9. p Rappresentazione grafica di alcune superfici di livello della funzione f (x, y, z) = x2 + y 2 + z 2
7.3 Estremi vincolati Nel § 5.6, abbiamo visto come determinare quegli estremi di una funzione f che sono interni al suo dominio e nei quali f `e sufficientemente regolare. Tuttavia, i procedimenti ivi illustrati non esauriscono la ricerca dei punti di estremo di f , in quanto questi possono trovarsi anche sulla frontiera del dominio di f (oppure essere punti di non regolarit` a). D’altro canto, esistono molteplici situazioni applicative in cui si richiede di cercare i massimi o i minimi di f non su tutto il suo dominio ma su un particolare sottoinsieme, definito ad esempio da una o pi` u equazioni o disequazioni a cui deve soddisfare la variabile indipendente. In quest’ultima situazione, parliamo di estremi vincolati della funzione. Nel presente paragrafo, illustreremo due metodi per la ricerca degli estremi di una funzione, aventi le tipologie appena descritte. Iniziamo con un esempio. Supponiamo √ di voler cercare il minimo della funzione lineare f (x) = a · x, con a = (1, 3) ∈ R2 , sull’insieme dei versori x del piano, ossia restringendo l’argomento a soddisfare il vincolo x = 1. Geometricamente, ci`o significa che il punto P = x = (x, y) `e vincolato a muoversi sulla circonferenza unitaria x2 + y 2 = 1. Detta g(x) = x2 + y 2 − 1 = 0 l’equazione di tale circonferenza, ed indicato con G = {x ∈ R2 : g(x) = 0} l’insieme dei punti soggetti al vincolo, cerchiamo quindi i punti x0 soddisfacenti x0 ∈ G
e
f (x0 ) = min f (x) . x∈G
284
7 Applicazioni del calcolo differenziale z a
a
y
x1 x1 x
y x
x0 G
G x0
Figura 7.10. Linee di livello della funzione f (x) = a · x (a sinistra) e rappresentazione della funzione ristretta al vincolo G (a destra)
Tale problema pu` o essere affrontato con due approcci diversi, che privilegiano rispettivamente il punto di vista analitico e quello geometrico. La prima procedura consiste nel ridursi a un problema di ricerca di un minimo in una variabile, osservando che il vincolo `e un arco semplice e chiuso che quindi pu` o essere espresso in forma parametrica. Precisamente, poniamo γ : [0, 2π] → R2 , γ(t) = (cos t, sin t), in modo che G coincide con il sostegno di γ. Allora, la funzione f ristretta a G si esprime come f ◦ γ, e dunque `e funzione della variabile t; inoltre si ha min f (x) = min f γ(t) . x∈G
t∈[0,2π]
√ Consideriamo dunque la funzione ϕ(t) = f γ(t) = cos t + 3 sin t e cerchiamone gli estremi; notiamo che la funzione `e periodica di periodo 2π, dunque possiamo pensarla come funzione su R, limitando poi i punti di estremo a quelli che cadono √ nell’intervallo [0, 2π]. La derivata prima ϕ (t) = − sin t+ 3 cos t si annulla per t = π 4 π 4 3 oppure 3 π. Essendo ϕ ( 3 ) = −2 < 0 e ϕ ( 3 π) = 2 > 0, abbiamo un massimo in π 4 t = 3 e un minimo in t = 3 π. Ne segue che esiste una e una sola soluzione al nostro √ problema di minimo vincolato, data dal punto x0 = cos 43 π, sin 43 π = − 12 , 23 . Per vedere lo stesso problema in un’ottica di tipo geometrico, facciamo riferimento alla Figura 7.10. Osserviamo che il gradiente di f `e dato da ∇f (x) = a, e ricordiamo che f `e crescente (anzi, ha la massima crescita) nella direzione di a (si veda la Proposizione 5.10); inoltre, le curve di livello di f sono le rette perpendi` allora ovvio che f ristretta alla circonferenza unitaria raggiunger` colari ad a. E a i suoi valori minimo e massimo in corrispondenza di quei punti della circonferenza in cui le sue curve di livello sono tangenti alla circonferenza stessa. Tali
7.3 Estremi vincolati
285
√ − 12 , 23
gi` a determinato, e il suo oppunti sono rispettivamente i punti x0 = √ posto x1 = 12 , 23 . Essi possono equivalentemente essere caratterizzati nel modo seguente. Ricordiamo che il gradiente di una funzione `e perpendicolare alle sue curve di livello, d’altro canto la circonferenza unitaria `e una curva di livello della funzione g(x) che la definisce. Pertanto, dire che le curve di livello di f e di g sono tangenti nei punti xi , i = 0, 1 sopra indicati equivale a dire che in tali punti i gradienti di f e di g sono paralleli; in altri termini, in ciascuno di tali punti esiste una costante λ tale che ∇f (x) = λ∇g(x) . Queste equazioni, insieme a quella del vincolo, g(x) = 0, permettono di determinare i punti di estremo vincolato di f . Infatti, si ha ⎧ 1 ⎨ λx = √ λy = 3 ⎩ 2 x + y2 = 1 ; ricavando x e y dalle prime due equazioni e sostituendo nella terza, si ottiene ⎧ 1 ⎪ ⎪ x= ⎪ ⎪ λ ⎨ √ 3 ⎪ y= ⎪ ⎪ ⎪ ⎩ 2 λ λ =4 ossia λ = ±2 e dunque le soluzioni risultanti sono i punti x0 e x1 . Infine, essendo f (x0 ) < f (x1 ), sar`a x0 punto di minimo e x1 punto di massimo per f . Passiamo ora a considerare il caso generale. Sia f : dom f ⊆ Rn → R una funzione reale di n variabili reali, e sia G ∈ dom f un sottoinsieme proprio del dominio di f , che chiamiamo insieme ammissibile. Definiamo innanzitutto il concetto di punto di estremo vincolato. Definizione 7.14 Un punto x0 ∈ G dicesi punto di estremo relativo per f vincolato a G se x0 `e punto di estremo relativo per la funzione f|G , restrizione di f a G, ossia se esiste un intorno Br (x0 ) tale che ∀x ∈ Br (x0 ) ∩ G
f (x) ≤ f (x0 )
nel caso di un punto di massimo relativo vincolato, oppure ∀x ∈ Br (x0 ) ∩ G
f (x) ≥ f (x0 )
nel caso di un punto di minimo relativo vincolato. I punti di massimo e minimo assoluto vincolato sono definiti dalle relazioni f (x0 ) = max f (x) x∈G
oppure
f (x0 ) = min f (x) . x∈G
286
7 Applicazioni del calcolo differenziale
In generale, un estremo vincolato di f non sar` a necessariamente un estremo libero di f . Ad esempio, la funzione f (x, y) = xy ha nell’origine un punto di sella, ma se la restringiamo alle bisettrici del primo e terzo quadrante (rispettivamente, del secondo e quarto quadrante), allora l’origine `e punto di minimo (rispettivamente, di massimo) assoluto vincolato. Una situazione che occorre frequentemente nelle applicazioni `e quella in cui l’insieme G `e definito come l’insieme dei punti del dominio di f che soddisfano una o pi` u equazioni o disequazioni, dette vincoli. Iniziamo considerando il caso di un solo vincolo di tipo equazione. Precisamente, supponiamo che esista una funzione g : dom g ⊆ Rn → R, con G ⊂ dom g, tale che G = {x ∈ dom g : g(x) = 0} ; in altri termini G `e il luogo degli zeri di g, cio`e l’insieme di livello L(g, 0). Discutiamo per un tale insieme ammissibile i due metodi annunciati per la ricerca dei punti di estremo vincolati di f . Supporremo d’ora in avanti che f e g siano funzioni di classe C 1 in un insieme aperto contenente G. Ricondurremo la ricerca degli estremi vincolati di f a quella dei punti stazionari di opportune funzioni. 7.3.1 Metodo parametrico Il metodo si basa sulla possibilit` a di esprimere l’insieme ammissibile G in forma parametrica, ossia come immagine di una funzione definita su un opportuno sottoinsieme di Rn−1 . Precisamente, supponiamo di conoscere una funzione ψ : A ⊆ Rn−1 → Rn di classe C 1 tale che G = {x ∈ Rn : x = ψ(u) con u ∈ A} . In dimensione 2, ci` o significa che G `e il sostegno di una curva ψ = γ : I → R2 , mentre, in dimensione 3, G `e il sostegno di una superficie ψ = σ : R → R3 . In generale, la funzione ψ pu` o essere ottenuta esplicitando il vincolo g(x) = 0; il Teorema 7.5 della funzione implicita ci assicura che ci`o `e possibile a condizione che tutti i punti di G siano regolari per g. Lo studio della funzione f ristretta a G `e allora equivalente allo studio della funzione composta f ◦ ψ; pertanto, cercheremo gli estremi di tale funzione sull’insieme A, che `e di dimensione inferiore di uno a quella del dominiodi f . In particolare, per n = 2 ci si riconduce cos`ı a studiare la funzione t → f γ(t) di una variabile reale, mentre per n = 3 si studier` a la funzione (u, v) → f σ(u, v) di due variabili reali. Per individuare i punti di estremo vincolati di f , esamineremo dapprima i punti interni ad A, in quanto se uno di tali punti, diciamo u0 , `e punto di estremo per f ◦ ψ allora esso `e punto stazionario per questa funzione e dunque necessariamente si ha, ponendo x0 = ψ(u0 ),
7.3 Estremi vincolati
287
y B
G
C A O
x
Figura 7.11. Curve di livello di f e insieme ammissibile G relativi all’Esempio 7.15
∇u (f ◦ ψ)(u0 ) = ∇f ψ(u0 ) J ψ(u0 ) = 0 . Pertanto si risolver` a tale equazione, e poi ovviamente si dovr` a discutere se i punti stazionari cos`ı trovati siano o meno punti di estremo. Infine, si esaminer` a la frontiera ∂A di A per individuare eventuali altri punti di estremo. Esempio 7.15 Sia f (x, y) = x2 +y −1 e sia G la frontiera del triangolo di vertici O = (0, 0), A = (1, 0) e B = (0, 1). Si veda la Figura 7.11. Vogliamo trovare i massimi e i minimi di f su G, che sicuramente esistono in quanto G `e compatto. Decomponiamo G nell’unione dei tre lati OA, OB e AB, parametrizzati rispettivamente da γ1 (t) = (t, 0), γ2 (t) = (0, t) e γ3 (t) = (t, 1 − t) con 0 ≤ t ≤ 1 in tutti i casi. La funzione f|OA (t) = t2 − 1 ha minimo in O e massimo in A; la funzione f|OB (t) = t − 1 2 ha minimo 1 in1 O e massimo in B, mentre la funzione f|AB (t) = t − t ha minimo in C = 2 , 2 e massimo in A e B. Poich´e f (O) = −1, f (A) = f (B) = 0 e f (C) = − 14 , la funzione raggiunge il suo valore minimo in O e il suo valore massimo in A e B. 2 7.3.2 Metodo dei moltiplicatori di Lagrange Il metodo dei moltiplicatori di Lagrange si basa su una particolare condizione necessaria, soddisfatta da ogni punto regolare di estremo vincolato e illustrato nella Figura 7.12. Vale infatti il seguente risultato. Proposizione 7.16 Sia x0 ∈ G un punto regolare per la funzione g. Allora se x0 `e punto di estremo per f vincolato a G, esiste un’unica costante λ0 ∈ R, detta moltiplicatore di Lagrange, tale che ∇f (x0 ) = λ0 ∇g(x0 ) .
(7.11)
288
7 Applicazioni del calcolo differenziale
∇f ∇g x0 G
Figura 7.12. In un punto di estremo vincolato, i gradienti di f e g sono allineati
Dim.
Per semplicit` a, ci limitiamo a considerare il caso n = 2 oppure n = 3. Nel caso bidimensionale, possiamo applicare alla funzione g quanto visto nel § 7.2.1, essendo x0 ∈ G = L(g, 0) ed essendo verificate tutte le ipotesi 2 ivi fatte. Pertanto esiste una curva regolare e semplice γ : I → R , con x0 = γ(t0 ) per un opportuno t0 interno a I, tale che g(x) = g γ(t) = 0 in un intorno di x0 ; inoltre si ha ∇g(x0 ) · γ (t0 ) = 0 . D’altro canto, per ipotesi la funzione t → f γ(t) ha in t0 un punto di estremo, e tale punto sar`a stazionario per il Teorema di Fermat in dimensione 1. Ne segue che d f γ(t) |t=t = ∇f (x0 ) · γ (t0 ) = 0 . 0 dt I due vettori ∇f (x0 ) e ∇g(x0 ) sono quindi ortogonali allo stesso vettore γ (t0 ) = 0 (essendo la curva γ regolare) e pertanto sono paralleli, ossia vale la (7.11). L’unicit` a di λ0 segue dal fatto che ∇g(x0 ) = 0. La dimostrazione in dimensione 3 `e del tutto analoga, in quanto da una parte avremo g σ(u, v) = 0 in un intorno di x0 per un’opportuna superficie regolare e semplice σ : A → R3 (§ 7.2.2) e dall’altra la funzione f σ(u, v) avr` a un estremo relativo nel punto (u0 , v0 ), interno ad A, tale che σ(u0 , v0 ) = x0 . Dunque sar` a contemporaneamente ∇g(x0 )J σ(u0 , v0 ) = 0 ,
e
∇f (x0 )J σ(u0 , v0 ) = 0 .
Ricordiamo ora che, essendo σ regolare, i vettori colonna della matrice J σ(u0 , v0 ) sono linearmente indipendenti e generano il piano tangente a σ in x0 . Pertanto i due vettori ∇f (x0 ) e ∇g(x0 ) sono entrambi ortogonali a tale piano, dunque sono paralleli. 2
7.3 Estremi vincolati
289
` opportuno sottolineare che la condizione (7.11) pu` E o essere soddisfatta, insieme alla condizione di vincolo g(x) = 0, anche da un punto x0 che non sia punto di estremo vincolato. In altri termini, queste due condizioni sono necessarie ma non sufficienti per l’esistenza di un punto di estremo vincolato. Ad esempio, ponendo f (x, y) = x − y 5 e g(x, y) = x − y 3 , si ha g(0, 0) = 0 e ∇f (0, 0) = ∇g(0, 0) = (1, 0); tuttavia la funzione f ristretta a G = {(x, y) ∈ R2 : x = y 3 } non ha nell’origine n´e un minimo n´e un massimo, essendo data da y → f (y 3 , y) = y 3 − y 5 (y0 = 0 `e punto di flesso a tangente orizzontale per tale funzione). Possiamo dare un’interpretazione equivalente all’enunciato della precedente proposizione, in modo da associare al punto x0 un punto stazionario non vincolato di una nuova funzione dipendente da f e da g, che ora introduciamo. Definizione 7.17 Posto Ω = dom f ∩ dom g ⊆ Rn , la funzione L : Ω × R → R definita da L(x, λ) = f (x) − λg(x) `e detta funzione lagrangiana (o semplicemente lagrangiana) di f vincolata a g. Calcoliamo il gradiente di L rispetto ai suoi argomenti. Abbiamo ∂L (x, λ) = ∇f (x) − λ∇g(x), g(x) . ∇(x,λ) L(x, λ) = ∇x L(x, λ), ∂λ a di L in (x0 , λ0 ) equivale Pertanto la condizione ∇(x,λ) L(x0 , λ0 ) = 0 di stazionariet` al sistema
∇f (x0 ) = λ0 ∇g(x0 ) , g(x0 ) = 0 . La Proposizione 7.16 assicura dunque che ogni punto regolare di estremo vincolato di f rispetto a g individua un unico punto stazionario della lagrangiana L. Alla luce delle considerazioni svolte finora, il metodo dei moltiplicatori di Lagrange si compone dei seguenti passi.
i) Si imposta il sistema di n+1 equazioni nelle n+1 incognite x = (x1 , . . . , xn ) eλ
∇f (x) = λ∇g(x) (7.12) g(x) = 0 e si determinano le eventuali soluzioni; si noti che, in generale, il sistema `e non lineare e dunque pu` o anche ammettere pi` u soluzioni distinte. ii) Per ciascuna soluzione (x0 , λ0 ) trovata, si cerca di determinare, con ragionamenti ad hoc, se il punto x0 sia di estremo vincolato per f .
290
7 Applicazioni del calcolo differenziale
(In genere, il moltiplicatore di Lagrange λ0 esaurisce il suo ruolo nella risoluzione del sistema (7.12) e non interviene pi` u in questa fase.) Ad esempio, se l’insieme G `e compatto, sappiamo dal Teorema 5.24 di Weierstrass che dovranno esistere un punto di minimo e uno di massimo assoluti di f|G (distinti se f non `e costante su G); pertanto (sotto l’ipotesi che G sia tutto composto di punti regolari per g) essi dovranno comparire tra quelli trovati nella fase precedente; il confronto tra i valori che la funzione assume su questi ultimi permetter` a di indicare i punti di massimo e di minimo assoluti. iii) In caso di presenza di punti non regolari (cio`e stazionari) per g in G (o di punti di non differenziabilit` a per f e/o per g) si dovr` a procedere caso per caso, non esistendo una metodologia generale.
Esempio 7.18 Si vogliano determinare i punti di R3 che giacciono sulla variet` a di equazione x4 + y 4 + z 4 = 1 e che hanno minima o massima distanza dall’origine (si veda la Figura 7.13). Il problema consiste nel cercare i minimi e i massimi della funzione f (x, y, z) = x2 = x2 + y 2 + z 2 sull’insieme G definito dalla condizione g(x, y, z) = x4 + y 4 + z 4 − 1 = 0. Si noti che consideriamo il quadrato della distanza dall’origine, piuttosto che la distanza x = x2 + y 2 + z 2 , perch´e le due funzioni hanno gli stessi estremi ma la prima permette calcoli pi` u maneggevoli. Usiamo il metodo dei moltiplicatori di Lagrange e consideriamo il sistema (7.12), ossia ⎧ 2x = λ4x3 ⎪ ⎪ ⎪ ⎨ 2y = λ4y 3 ⎪ 2z = λ4z 3 ⎪ ⎪ ⎩ 4 x + y4 + z4 − 1 = 0 . Poich´e tanto f quanto g sono invarianti rispetto al cambiamento di segno di ciascuno dei loro argomenti, cio`e f (±x, ±y, ±z) = f (x, y, z) e analogamente per g, possiamo limitarci a cercare le soluzioni che appartengono al primo ottante (x ≥ 0, y ≥ 0, z ≥ 0) Le prime tre equazioni ammettono allora rispettivamente le soluzioni 1 1 1 x = 0 oppure x = √ , y = 0 oppure y = √ , z = 0 oppure z = √ , 2λ 2λ 2λ che vanno combinate in tutti i modi possibili. Il punto (x, y, z) = (0, 0, 0) va escluso perch´e non soddisfa la quarta equazione. Le scelte (x, y, z) = √12λ , 0, 0 oppure 0, √12λ , 0 oppure 0, 0, √12λ danno luogo alla quarta equazione 4λ1 2 = 1, ossia λ = 12 (dovendo essere λ > 0). Le scelte (x, y, z) = √12λ , √12λ , 0 oppure √ 1 √ , 0, √1 oppure 0, √12λ , √12λ verificano la quarta equazione con λ = 22 . 2λ 2λ
7.3 Estremi vincolati
291
z
x3 x6
x5 x7
x
x2
x1
y x4
Figura 7.13. Grafico dell’insieme ammissibile G (solo nel primo ottante) e punti stazionari di f su G (Esempio 7.18)
Infine la scelta (x, y, z) = √ 3 2 .
√1 , √1 , √1 2λ 2λ 2λ
λ= In definitiva, abbiamo le seguenti funzione x1 = (1, 0, 0) , f (x1 ) = 1 ; x2 = (0, 1, 0) , f (x2 ) = 1 ; x3 = (0, 0, 1) , f (x3 ) = 1 ; √ 1 1 1 √ √ √ x7 = 4 3 , 4 3 , 4 3 , f (x7 ) = 3 .
verifica la quarta equazione con
soluzioni con accanto il valore della √ 1 1 x4 = √ 2; 4 , √ 4 , 0 , f (x4 ) = √ 12 2 1 √ , f (x x5 = √ , 0, ) = 2; 4 4 5 √ 2 1 12 , f (x6 ) = 2 ; x6 = 0, √ 4 , √ 2 42
In conclusione possiamo dire che nel primo ottante esistono 3 punti in G a minima distanza dall’origine (i punti x1 , x2 , x3 ) e 1 punto a massima distanza dall’origine (il punto x7 ). I punti x4 , x5 , x6 sono tali che la distanza dall’origine `e stazionaria su G, ma ivi non assume valori massimo o minimo relativi. 2 Passiamo ora a considerare brevemente il caso in cui l’insieme ammissibile G sia definito da m < n vincoli di uguaglianza, del tipo gi (x) = 0, 1 ≤ i ≤ m. Se x0 ∈ G `e un punto di estremo vincolato per f su G che `e regolare per ciascuna funzione gi , un risultato analogo a quello della Proposizione 7.16 assicura l’esistenza di m costanti λ0i , 1 ≤ i ≤ m (i moltiplicatori di Lagrange), tali che ∇f (x0 ) =
m
λ0i ∇gi (x0 ) .
i=1
Equivalentemente, posto λ = (λi )i=1,...,m ) ∈ Rm e g(x) = g1 (x) i=1,...,m , la lagrangiana L(x, λ) = f (x) − λ · g(x)
(7.13)
ammette un punto stazionario in (x0 , λ0 ). Per determinare tali punti si imposta il sistema di n + m equazioni nelle n + m incognite date dalle componenti di x e λ,
292
7 Applicazioni del calcolo differenziale
⎧ m ⎪ ⎨ ∇f (x) = λi ∇gi (x) , i=1 ⎪ ⎩ gi (x) = 0 , 1 ≤ i ≤ m, che generalizza il sistema (7.12). Esempio 7.19 Cerchiamo i punti di estremo della funzione f (x, y, z) = 3x + 3y + 8z vincolata all’intersezione dei due cilindri di equazione x2 + z 2 = 1 e y 2 + z 2 = 1. A tale scopo, introduciamo i vincoli g1 (x, y, z) = x2 + z 2 − 1 e g2 (x, y, z) = y 2 + z 2 − 1 di modo che l’insieme ammissibile G `e dato da G = G1 ∩ G2 , con Gi = L(gi , 0). Notiamo che ogni punto di Gi `e regolare per gi , dunque tutti i punti di G sono regolari per entrambi i vincoli. Inoltre, l’insieme G `e compatto e dunque sicuramente f avr` a massimo e minimo assoluti vincolati a G. Essendo ∇f = (3, 3, 8), ∇g1 = (2x, 0, 2z), ∇g2 = (0, 2y, 2z), il sistema (7.13) diventa ⎧ ⎪ 3 = λ1 2x ⎪ ⎪ ⎪ ⎪ 3 = λ2 2y ⎨ 8 = (λ1 + λ2 )2z ⎪ ⎪ ⎪ x2 + z 2 − 1 = 0 ⎪ ⎪ ⎩ 2 y + z2 − 1 = 0 ; 4 dalle prime 3 equazioni si ottiene x = 2λ3 1 , y = 2λ3 2 , z = λ1 +λ , (con λ1 = 0, 2 λ2 = 0, λ1 + λ2 = 0) che sostituiti nelle ultime 2 equazioni forniscono 5 λ1 = λ2 = ± . 2 Posto allora x0 = 35 , 35 , 45 e x1 = −x0 , abbiamo f (x0 ) > 0 e f (x1 ) < 0. Pertanto concludiamo che x0 `e punto di massimo assoluto vincolato, mentre x1 `e punto di minimo assoluto vincolato. 2 Consideriamo infine il caso in cui f sia vincolata ad un insieme G definito da m vincoli di tipo disequazioni; senza ledere la generalit` a, possiamo supporre che essi siano del tipo gi (x) ≥ 0, i = 1, . . . , m. Si studiano allora dapprima i punti interni di G, applicando le tecniche sviluppate nel § 5.6. Successivamente, si prender` a in esame la frontiera ∂G di G, in ciascun punto della quale una almeno delle precedenti disuguaglianze `e soddisfatta come uguaglianza. Si ha quindi un problema di estremo vincolato a ∂G, che si tratta come visto sopra. Data la generalit` a delle situazioni possibili, ci limitiamo a illustrare alcuni esempi. Esempi 7.20 i) Riprendiamo l’Esempio 7.15 e supponiamo ora di voler cercare gli estremi di f su tutto il triangolo di vertici O, A, B, che ora indichiamo con G.
7.3 Estremi vincolati
293
In altri termini, poniamo g1 (x, y) = x, g2 (x, y) = y e g3 (x, y) = 1 − x − y, di modo che G = {(x, y) ∈ R2 : gi (x, y) ≥ 0, i = 1, 2, 3}. Non esistono punti di estremo di f nell’interno di G, in quanto ∇f (x) = (2x, 1) = 0 il che preclude l’esistenza di punti stazionari di f . Gli estremi di f su G, che esistono in quanto G `e compatto, si trovano quindi sul bordo del triangolo, e sono quelli gi` a individuati nell’esempio citato. ii) Riprendiamo l’Esempio 7.18 e supponiamo ora di voler cercare gli estremi di f sull’insieme G definito dalla disequazione x4 + y 4 + z 4 ≤ 1. Essendo ∇f (x) = 2x, l’unico punto di estremo interno a G `e l’origine, in cui f assume il suo minimo assoluto. Poich´e l’insieme G `e compatto, f assumer`a anche massimo assoluto su di esso, e necessariamente lo assumer`a sulla frontiera ∂G. I punti di estremo vincolato a tale insieme sono precisamente quelli studiati nell’esempio citato, e dunque concludere che f raggiunge il suo massimo su G nel punto 1 possiamo 1 1 x7 = √ nel primo ottante, e in tutti quelli che si ottengono da questo 4 , √ 4 , √ 4 3 3 3 per cambiamento di segno di una o pi` u coordinate. 2
2
iii) Studiamo gli estremi della funzione f (x, y) = (x + y)e−(x +y ) soggetta al vincolo g(x, y) = 2x + y ≥ 0. Notiamo subito che f (x, y) → 0 per x → ∞, dunque necessariamente f ammetter`a massimo e minimo assoluti su G. I punti interni all’insieme G in cui il vincolo `e soddisfatto sono quelli appartenenti al semispazio (aperto) y > −2x. Essendo 2 2 ∇f (x) = e−(x +y ) 1 − 2x(x + y), 1 − 2y(x + y) , punto interno f ammette punti stazionari in x = ± 12 , 12 ; di questi, l’unico
1 1 3 1 . Lo studio a G `e x0 = 2 , 2 , per il quale si ha Hf (x0 ) = −e−1/2 1 3 dell’hessiana ci dice che x0 `e un punto di massimo relativo per f . Passiamo ora a studiare il comportamento di f su ∂G, ossia per y = −2x. La funzione composta ϕ(x) = f (x, −2x) = −xe−5x
2
y
x2 x0
x
x1
Figura 7.14. Curve di livello di f e insieme ammissibile G relativi all’Esempio 7.20 iii)
294
7 Applicazioni del calcolo differenziale y D C E x
B A Figura 7.15. Curve di livello di f e insieme ammissibile G relativi all’Esempio 7.20 iv)
ammette massimo assoluto in x = − √110 e minimo assoluto in x = √110 . Posto allora x1 = √110 , − √210 e x2 = − √110 , √210 , potremo senz’altro dire che x1 `e l’unico punto di minimo assoluto per f su G. Per determinare il punto di massimo assoluto, confrontiamo i valori di f assunti in x0 e in x2 . Essendo f (x0 ) = e−1/2 e f (x2 ) = √110 e−1/2 , concludiamo che x0 `e l’unico punto di massimo assoluto per f su G (si veda la Figura 7.14). iv) Cerchiamo i punti di estremo della funzione f (x, y) = x + 2y vincolata all’insieme G definito dalle disuguaglianze x + 2y + 8 ≥ 0 , 5x + y + 13 ≥ 0 , x − 4y + 11 ≥ 0 , 2x + y − 5 ≤ 0 ,
5x − 2y − 8 ≤ 0 .
Tale insieme `e il pentagono (non regolare) rappresentato in Figura 7.15, di vertici A = (0, −4), B = (−2, −3), C = (−3, 2), D = (1, 3) ed E = (2, 1); esso `e ottenuto come intersezione dei 5 semipiani definiti ciascuno da una delle disuguaglianze precedenti. Poich´e ∇f (x) = (1, 2) = 0, la funzione raggiunger` a il suo valore massimo e minimo sul bordo di G; inoltre, essendo f lineare su ciascun lato, ` sufficiente quindi ogni suo estremo sar`a raggiunto in un vertice del poligono. E calcolare e confrontare tra loro i valori di f nei vertici. Si ha f (A) = f (B) = −8 , f (C) = 1 , f (D) = 7 , f (E) = 4 ; pertanto, f in G `e minima in ogni punto del lato AB ed `e massima nel punto D. Il problema ora considerato `e un semplice esempio di problema di Programmazione Lineare (ricerca degli estremi di una funzione lineare sottoposta a vincoli di tipo disequazioni lineari); essa trova applicazione in molti campi, quali l’Ottimizzazione e la Ricerca Operativa. Rimandiamo a testi specialistici per ulteriori approfondimenti. 2
7.4 Esercizi
295
7.4 Esercizi 1. Si consideri l’equazione x3 y + xy 4 = 2. Supponendo di poterla esplicitare nella forma y = ϕ(x), calcolare ϕ (x). Determinare un punto x0 nell’intorno del quale tale operazione sia possibile. 2. Si consideri l’equazione x2 + y 3 z = xz y , che ammette la soluzione (2, 1, 4). Verificare che essa pu`o essere scritta nella forma y = ϕ(x, z), con ϕ definita in un intorno di (2, 4). Calcolare le derivate parziali di ϕ nel punto (2, 4). 3. Verificare che l’equazione ex−y + x2 − y 2 − e(x + 1) + 1 = 0 definisce una funzione y = ϕ(x) in un intorno di x0 = 0. Qual `e la natura di x0 per la funzione ϕ? 4. Verificare che l’equazione x2 + 2x + ey + y − 2z 3 = 0 definisce una funzione y = ϕ(x, z) in un intorno di P = (x0 , z0 ) = (−1, 0). Tale funzione rappresenta una superficie; si scriva l’equazione del piano ad essa tangente in P . 5. a) Verificare che l’equazione x log(y + z) + 3(y − 2)z + sin x = 0 definisce, nell’intorno del punto P0 = (0, 2, −1), una superficie Σ regolare e semplice. b) Determinare in P0 il piano tangente a Σ e il versore normale che forma un angolo acuto con il vettore v = 4i + 2j − 5k. 6. Verificare che il sistema
3x − cos y + y + ez = 0 x − ex − y + z + 1 = 0 .
definisce in un intorno dell’origine una curva in R3 di equazioni parametriche γ(t) = t, ϕ1 (t), ϕ2 (t) , t ∈ I(0) . Scrivere l’equazione della retta tangente nell’origine a tale curva.
296
7 Applicazioni del calcolo differenziale
7. Verificare che l’equazione y 7 + 3y − 2xe3x = 0 definisce una funzione y = ϕ(x), per ogni x ∈ R. Si studi tale funzioni e se ne tracci un grafico qualitativo. 8. Rappresentare le curve di livello delle seguenti funzioni: a) f (x, y) = 6 − 3x − 2y
b) f (x, y) = 4x2 + y 2
c)
d) f (x, y) = 2y − 3 log x
e)
f (x, y) = 2xy f (x, y) = 4x + 3y
f)
f (x, y) = 4x − 2y 2
9. Si accoppino le seguenti funzioni con i grafici, rappresentati nelle Figure 7.16 e 7.17 con le lettere A-F e le curve di livello denotate con i numeri I-VI: 2 2 a) z = cos x2 + 2y 2 b) z = (x2 − y 2 )e−x −y c) z =
15 9x2 + y 2 + 1
d) z = x3 − 3xy 2 f) z = 6 cos2 x −
e) z = cos x sin 2y
1 2 x 10
B C
A
E D
Figura 7.16. Grafici delle funzioni assegnate nell’Esercizio 9
F
7.4 Esercizi
297
I
II
III
IV
V
VI
Figura 7.17. Curve di livello delle funzioni assegnate nell’Esercizio 9
10. Descrivere le superfici di livello delle seguenti funzioni:: a) f (x, y, z) = x + 3y + 5z
b) f (x, y, z) = x2 − y 2 + z 2
11. Determinare i punti di massimo e di minimo della funzione 3 f (x, y) = x2 + y 2 + x + 1 2 sull’insieme G = {(x, y) ∈ R2 : 4x2 + y 2 − 1 = 0}. 12. Determinare i punti di massimo e di minimo della funzione f (x, y) = x+3y +2 sull’insieme compatto G = {(x, y) ∈ R2 : x, y ≥ 0, x2 + y 2 ≤ 1}. 13. Si consideri la funzione f (x, y) = x2 (y + 1) − 2y . a) Trovare i punti stazionari di f e discuterne il tipo. b) Calcolare massimo e minimo assoluto di f sull’insieme G = {(x, y) ∈ R2 : 1 + x2 ≤ y ≤ 2} . 14. Determinare gli estremi della funzione f (x, y) = 2x2 + y 2 sull’insieme G = {(x, y) ∈ R2 : x4 − x2 + y 2 − 5 = 0} .
298
7 Applicazioni del calcolo differenziale
15. Determinare massimo e minimo assoluto della funzione f (x, y) = 4x2 + y 2 − 2x − 4y + 1 sull’insieme G = {(x, y) ∈ R2 : 4x2 + y 2 − 1 = 0} .
7.4.1 Soluzioni 1. Poniamo f (x, y) = x3 y + xy 4 − 2; allora fx (x, y) = 3x2 y + y 4 Pertanto
e
fy (x, y) = x3 + 4xy 3 .
4 3x2 ϕ(x) + ϕ(x) ϕ (x) = − 3 x3 + 4x ϕ(x)
per ogni x = 0 e x2 = −4y 3 . Ad esempio il punto (x0 , y0 ) = (1, 1) `e soluzione dell’equazione e quindi esister`a y = ϕ(x) in un intorno di x0 = 1 in quanto fy (1, 1) = 5 = 0. Inoltre, ϕ (1) = −4/5. 2. Poniamo f (x, y, z) = x2 + y 3 z − fx (x, y, z) = 2x −
z y
fy (x, y, z) = 3y 2 z + fz (x, y, z) = y 3 −
xz y .
Risulta con fx (2, 1, 4) = 0 ,
xz y2
x y
con fy (2, 1, 4) = 20 = 0 , con fz (2, 1, 4) = −1 = 0 .
Quindi `e possibile esplicitare (grazie al Teorema 7.4) la variabile y in funzione di x e z in un intorno del punto (2, 4), ossia `e definita una funzione y = ϕ(x, z) e vale ∂ϕ (2, 4) = 0 , ∂x
∂ϕ 1 (2, 4) = . ∂z 20
3. Poniamo f (x, y) = ex−y + x2 − y 2 − e(x + 1) + 1 e osserviamo che (0, −1) `e una soluzione. Risulta fx (x, y) = ex−y + 2x − e ,
fy (x, y) = −ex−y − 2y
con fx (0, −1) = 0 e fy (0, −1) = 2 − e = 0. Pertano, grazie al Teorema 7.1, esiste una funzione y = ϕ(x) definita in un intorno dell’origine e vale ϕ (0) = −
fx (0, −1) = 0. fy (0, −1)
Dunque il punto x0 = 0 `e un punto critico per ϕ.
7.4 Esercizi
299
4. Poniamo f (x, y, z) = x2 + 2x + ey + y − 2z 3 e osserviamo che f (−1, 0, 0) = 0. Si ha fx (x, y, z) = 2x + 2
con fx (−1, 0, 0) = 0 ,
fy (x, y, z) = ey + 1
con fy (−1, 0, 0) = 2 = 0 ,
fz (x, y, z) = −6z 2
con fz (−1, 0, 0) = 0 .
Per il Teorema 7.4, esiste una funzione y = ϕ(x, z) definita in un intorno di (−1, 0) con ∂ϕ ∂ϕ (−1, 0) = (−1, 0) = 0 . ∂x ∂x L’equazione del piano tangente richiesta `e dunque y = ϕ(−1, 0) + ϕx (−1, 0)(x + 1) + ϕ(−1, 0)(z − 0) = 0 . 5. a) Posto f (x, y, z) = x log(y + z) + 3(y − 2)z + sin x, si ha x x ∇f (x, y, z) = log(y + z) + cos x, + 3z, + 3(y − 2) y+z y+z e dunque ∇f (P0 ) = (1, −3, 0) = 0. Pertanto, grazie al Teorema 7.4, possiamo esprimere x in funzione di y e z, oppure y in funzione di x e z. Ne segue che, nell’intorno di P0 , Σ `e una superficie cartesiana, regolare e semplice. b) Ricordando la Proposizione 7.9, l’equazione del piano tangente in P0 = x0 `e ∇f (x0 ) · (x − x0 ) = x − 3(y − 2) = 0 , ossia x − 3y = −2. Il versore normale in P0 sar`a dato da ν = √σ10 (i − 3j), con σ ∈ {±1} determinato dalla condizione ν · v = − √2σ10 > 0, dunque σ = −1. 6. Facendo riferimento al Teorema 7.5 e all’Esempio 7.6, poniamo
f1 (x, y, z) = 3x − cos y + y + ez f2 (x, y, z) = x − ex − y + z + 1 . Si ha
∂f1 ∂f1 (x, y, z) = sin y + 1 , (x, y, z) = ez , ∂y ∂z ∂f2 ∂f2 (x, y, z) = −1 , (x, y, z) = 1 . ∂y ∂z Consideriamo ora la matrice ⎛ ∂f ⎞ ∂f1 ⎛ ⎞ 1 (0) (0) 1 1 ⎜ ∂y ⎟ ∂z ⎜ ⎟=⎝ ⎠; ⎝ ∂f ⎠ ∂f2 2 −1 1 (0) (0) ∂y ∂z
300
7 Applicazioni del calcolo differenziale
essa `e non singolare e dunque risulta definita, in un intorno di t = 0, una curva γ(t) = t, ϕ1 (t), ϕ2 (t) . scrivere calcolare γ (t) = Per l’equazione della retta tangente, dobbiamo 1, ϕ1 (t), ϕ2 (t) e, in particolare, γ (0) = 1, ϕ1 (0), ϕ2 (0) . Si ha ⎛ ∂f
1
⎜ ∂y ⎜ ⎝ ∂f
2
∂y ossia
(0) (0)
⎞ ⎞ ⎛ ∂f1 ∂f1 ⎛ ⎞ (0) (0) ⎟ ⎟ ϕ1 (0) ⎜ ∂x ∂z ⎟ ⎟⎝ ⎠ = −⎜ ⎠ ⎠ ⎝ ∂f2 ∂f 2 ϕ2 (0) (0) (0) ∂z ∂x 1
1
−1
1
Cos`ı
ϕ1 (0)
=−
ϕ2 (0)
3 0
.
ϕ1 (0) + ϕ2 (0) = −3 ϕ1 (0) − ϕ2 (0) = 0
ovvero ϕ1 (0) = ϕ2 (0) = −3/2. In definitiva, la retta tangente ha equazione 3 3 3 3 T (t) = γ(0) + γ (0)t = 1, − , − t = t, − t, − t . 2 2 2 2 7. Poniamo f (x, y) = y 7 + 3y − 2xe3x , allora fx (x, y) = −2e3x (1 + 3x) ,
fy (x, y) = 7y 6 + 3 > 0 .
Pertanto, per il Teorema 7.1, `e possibile esplicitare y in funzione di x nell’intorno di ogni punto di R2 ; sia y = ϕ(x). Si ha ϕ (x) = −
2e3x (1 + 3x) fx (x, y) = , fy (x, y) 7y 6 + 3
dunque ϕ (x) = 0 per x = −1/3 e ϕ (x) > 0 per x > −1/3. Osserviamo inoltre che f (0, 0) = 0 e quindi ϕ(0) = 0. La funzione passa per l’origine, `e crescente per x > −1/3, decrescente per x < −1/3. Il punto x = −1/3 `e un punto di minimo (assoluto) per ϕ con ϕ(−1/3) < 0. Per calcolare i limiti per x → ±∞ di ϕ, notiamo che 7 ϕ(x) + 3 ϕ(x) = 2xe3x e lim 2xe3x = 0 ,
x→−∞
lim 2xe3x = +∞ .
x→+∞
Sia dapprima = lim ϕ(x), allora dovr` a essere x→−∞
7 + 3 = (6 + 3) = 0
da cui
= 0.
7.4 Esercizi
301
y
− 31 x Figura 7.18. Grafico della funzione implicita definita nell’Esercizio 7
Sia poi m = lim ϕ(x); necessariamente m = +∞, in quanto se fosse m ∈ R si x→+∞
avrebbe m7 + 3m = +∞ il che `e assurdo. In conclusione, si ha lim ϕ(x) = 0 ,
lim ϕ(x) = +∞ ;
x→−∞
x→+∞
Il punto x = −1/3 `e punto di minimo assoluto e il grafico di f `e rappresentato in Figura 7.18. 8. Curve di livello: a) Le curve di livello sono 6 − 3x − 2y = k
ossia
3x + 2y + k − 6 = 0 .
Si tratta di una famiglia di rette parallele con coefficiente angolare −3/2. Si veda la Figura 7.19, a sinistra.
y
y
x
x
Figura 7.19. Curve di livello della funzione f (x, y) = 6 − 3x − 2y, a sinistra, e della funzione f (x, y) = 4x2 + y 2 , a destra
302
7 Applicazioni del calcolo differenziale y
y
k<0
k>0 k=0
x
k>0
x
k<0
Figura 7.20. Curve di livello della funzione f (x, y) = 2xy, a sinistra, e della funzione f (x, y) = 2y − 3 log x, a destra
b) Le curve di livello sono 4x2 + y 2 = k
c) d) e) f)
ossia
y2 x2 + =1 k/4 k
che, per √ k > 0, rappresentano una famiglia di ellissi centrati nell’origine con √ semiassi k/2 e k. Si veda la Figura 7.19, a destra. Si veda la Figura 7.20, a sinistra. Si veda la Figura 7.20, a destra. Si veda la Figura 7.21, a sinistra. Si veda la Figura 7.21, a destra.
9. L’accoppiamento `e il seguente: a-D-IV; b-E-III; c-A-V; d-B-I; e-C-VI; f-F-II. y
y
x
Figura 7.21. Curve di livello della funzione f (x, y) = funzione f (x, y) = 4x − 2y 2 , a destra
x
√
4x + 3y, a sinistra, e della
7.4 Esercizi
303
10. Superfici di livello: a) Si tratta di una famiglia di piani paralleli di equazione x + 3y + 5z − k = 0 . b) Si tratta di una famiglia di iperboloidi a una o due falde con asse coincidente con l’asse delle y. 11. L’insieme G `e un ellisse che possiamo parametrizzare come γ(t) = t ∈ [0, 2π). Allora ϕ(t) = f ◦ γ(t) =
1 2
cos t, sin t ,
1 3 3 3 cos2 t + sin2 t + cos t + 1 = − cos2 t + cos t + 2 4 4 4 4
con ϕ (t) =
3 3 1 3 sin t cos t − sin t = sin t cos t − . 2 4 2 2
Notiamo che ϕ (t) = 0 per sin t = 0 oppurecos t = 12 , ossia per t1 = 0, t2 = π, t3 = π3 , t4 = 53 π. Inoltre ϕ (t) > 0 per t ∈ 0, π3 ∪ π, 53 π e quindi ϕ cresce in 0, π3 e π, 53 π mentre decresce in π3 , π e 53 π, 2π . Pertanto P1 = γ(t1 ) = ( 12 , 0) e P2 = γ(t2 ) = (− 12 , 0) sono punti di minimo locale con f (P1 ) = 2 e f (P2 ) = 12 ; √ √ P3 = γ(t3 ) = ( 14 , 23 ) e P4 = γ(t4 ) = ( 14 , − 23 ) sono punti di massimo locale con f (P3 ) = f (P4 ) = 35 e 35 16 . In particolare il massimo di f su G ` 16 raggiunto sia in P3 che in P4 , mentre il minimo vale 1/2 ed `e raggiunto in P2 . In alternativa, `e possibile risolvere l’esercizio utilizzando il metodo dei moltiplicatori di Lagrange. Posto g(x, y) = 4x2 + y 2 − 1, la funzione lagrangiana `e L(x, y, λ) = f (x, y) − λg(x, y) . Poich´e ∇f (x, y) = (2x + 32 , 2y), ∇g(x, y) = (8x, 2y), occorre risolvere il sistema ⎧ 3 ⎪ ⎨ 2x + 2 = 8λx 2y = 2λy ⎪ ⎩ 2 4x + y 2 = 1 . Dalla seconda equazione si ricava immediatamente λ = 1 oppure y = 0. Per λ = 1, √ 3 1 si ha x = 4 e y = ± 2 (ossia si ritrovano i punti P3 e P4 ); per y = 0, si ha x = ± 12 (ossia si ritrovano i punti P1 e P2 ). Calcolando i valori di f in ciascuno dei punti individuati, si perviene allo stesso risultato trovato in precedenza con il metodo parametrico. 12. Poich´e ∇f (x, y) = (1, 3) = (0, 0) per ogni (x, y), non vi sono punti critici di f nell’interno di G. Cerchiamo quindi gli estremi di f sulla frontiera di G; essi sicuramente esistono per il Teorema di Weierstrass. La frontiera ∂G si pu` o decomporre nell’unione dei due segmenti, rispettivamente sull’asse x e sull’asse y, che
304
7 Applicazioni del calcolo differenziale
uniscono l’origine con il punto A = (1, 0) e B = (0, 1) e dell’arco di circonferenza unitaria che unisce i punti A e B. La funzione ristretta al segmento OA, vale f (x, 0) = x + 2, x ∈ [0, 1] e quindi ha minimo (locale) in x = 0 con f (0, 0) = 2 e massimo (locale) in x = 1 con f (1, 0) = 3. Analogamente, sul segmento OB si ha f (0, y) = 3y + 2, y ∈ [0, 1]; dunque f ha minimo (locale) in y = 0 con f (0, 0) = 2 e massimo (locale) in y = 1 con f (0, 1) = 5. Infine, parametrizziamo l’arco di circonferenza come γ(t) = (cos t, sin t), t ∈ [0, π/2], ottenendo ϕ(t) = f ◦ γ(t) = cos t + 3 sin t + 2 . Poich´e ϕ (t) = − sin t + 3 cos t, si annulla in t0 = arctan 3 e ϕ (t) > 0 per t ∈ [0, t0 ], la funzione f ha un punto di massimo (locale) in γ(t0 ) = (x0 , y0 ). Per calcolare esplicitamente x0 e y0 osserviamo che vale
sin t0 = 3 cos t0 sin2 t0 + cos2 t0 = 1 √ da cui √ 9 cos2 t0 + cos2 t0 = 9x20 + x20 = 10x20 = 1 ossia x0 =√ 1/ 10 e quindi y0 = 3/ 10 (si ricordi che x, y ≥ 0 in G). Inoltre f (x0 , y0 ) = 2+ 10. In definitiva, l’origine `e punto di minimo assoluto per f mentre (x0 , y0 ) `e punto di massimo assoluto. √ 13. a) Poich´e ∇f (x, y) = 2x(y + 1), x2 − 2 , i punti stazionari sono P1 = ( 2, −1) √ e P2 = (− 2, −1). La matrice hessiana
2(y + 1) 2x Hf (x, y) = 2x 0 nei punti stazionari vale 0 √ Hf (P1 ) = 2 2
√
2 2 , 0
Hf (P2 ) =
√
0 −2 2 √ −2 2 0
e quindi entrambi i punti sono di sella. b) Per quanto visto nel punto a), non vi sono punti di estremo per f nell’interno di G. Essendo per`o G compatto, il Teorema di Weierstrass assicura che tali estremi sicuramente esistono e si trovano su ∂G. La frontiera di√G `e l’unione del sostegno √ del segmento orizzontale che unisce il punto A = (− 3, 2) con B = √ ( 3, 2) e dell’arco di curva che unisce A con B di equazione cartesiana y = 1 + x2 (si veda la Figura 7.22). Sul segmento AB si ha √ √ f (x, 2) = 3x2 − 4 , x ∈ [− 3, 3] e quindi √ f ha minimo √ locale per x = 0 con f (0, 2) = −4 e massimo locale per x = ± 3 con f (± 3, 2) = 5.
7.4 Esercizi
305
y √ (− 3, 2)
√ ( 3, 2)
2 √
G
1 + x2
1 x Figura 7.22. Insieme ammissibile G dell’Esercizio 13
√ Sull’arco che unisce A e B lungo y = 1 + x2 , si ha ϕ(x) = f (x, 1 + x2 ) = x2 ( 1 + x2 + 1) − 2 1 + x2 ,
√ √ x ∈ [− 3, 3] .
√ 3x2 + 2 1 + x2 √ ϕ (x) = x 1 + x2 si annulla solo in x = 0 ed `e positiva √ per x > 0, il punto x = 0 `e un minimo locale con f (0, 1) = −2, mentre x = ± 3 sono punti di massimo locale. In √ definitiva, il punto √ P1 = (0, 2) `e di minimo assoluto per f mentre i punti P2 = ( 3, 0) e P3 = (− 3, 0) sono punti di massimo assoluto per f su G.
Poich´e
14. Poniamo g(x, y) = x4 − x2 + y 2 − 5 e utilizziamo il metodo dei moltiplicatori di Lagrange. Poich´e ∇f (x, y) = (4x, 2y) , consideriamo il sistema
∇g(x, y) = (4x3 − 2x, 2y) ,
⎧ ⎨ 4x = λ2x(2x2 − 1) 2y = λ2y ⎩ 4 x − x2 + y 2 − 5 = 0 .
Dalla seconda equazione primo caso, si pu` o√avere si ha λ = 1 oppure y = 0. Nel √ x = 0 oppure x = ± 3/2 e, corrispondentemente,# y = ± 5 oppure y = ± 17/2; √ √ √ nel secondo caso, si ha x2 = 1±2 21 e dunque x = ± 1+2 21 (si noti che 1− 21 < 0 fornisce un valore di x2 non accettabile). In definitiva, i punti √ 3 √17 √ 1 + 21 ,± , P7,8 = ± ,0 P1,2 = (0, ± 5) , P3,4,5,6 = ± 2 2 2 sono di estremo per f vincolati a G. Poich´e f (P1,2 ) = 5 ,
f (P3,4,5,6 ) =
29 , 4
f (P7,8 ) = 1 +
il valore massimo di f `e 29/4, mentre il minimo `e 5.
√ 21
306
7 Applicazioni del calcolo differenziale
15. Utilizziamo il metodo dei moltiplicatori di Lagrange ponendo g(x, y) = 4x2 + y 2 − 1 e osservando che ∇f (x, y) = (4x + 2, 2y − 4) ,
∇g(x, y) = (8x, 2y) .
Impostiamo e risolviamo il sistema ⎧ ⎨ 8x + 2 = 8λx 2y − 4 = 2λy ⎩ 2 4x + y 2 − 1 = 0
⇐⇒
⎧ 1 ⎪ ⎪ x= ⎪ ⎪ 4(λ − 1) ⎪ ⎪ ⎨ 2 y=− ⎪ λ − 1 ⎪ ⎪ ⎪ 1 1 4 ⎪ ⎪ ⎩ + = 1. 4 (λ − 1)2 (λ − 1)2
Notiamo che λ = 1, in quanto per λ = 1 le prime due equazioni del primo sistema √ sono impossibili. Dalla terza equazione del secondo sistema si ricava λ − 1 = ± 217 e dunque x = ± 2√117 e y = ∓ √417 . In definitiva, gli estremi sono raggiunti nei punti 4 4 1 1 √ , −√ e P2 = − √ , √ . 2 17 17 2 17 17 √ √ √ Poich´e f (P1 ) = √ 2 + 17 e f (P2 ) = 2 − 17, il massimo di f `e 2 + 17 mentre il minimo `e 2 − 17. P1 =
8 Calcolo integrale per funzioni in pi` u variabili
L’introduzione dell’integrale definito per funzioni reali di una variabile reale ci ha permesso, nel Vol. I, di definire e calcolare la misura, ossia l’area, di una regione piana sufficientemente regolare. In questo capitolo estendiamo il concetto alle funzioni reali di pi` u variabili reali, introducendo i cosiddetti integrali multipli; in particolare, in dimensione 2 e 3 definiamo rispettivamente gli integrali doppi e tripli. Questi nuovi strumenti si basano sulla nozione di sottoinsieme misurabile di Rn e di corrispondente misura n-dimensionale; quest’ultima estende il concetto di area di una regione piana (n = 2) e di volume di un solido (n = 3) a situazioni pi` u generali. Presentiamo poi vari metodi di calcolo degli integrali multipli. Tra essi, le tecniche di riduzione dimensionale riconducono il problema al calcolo di integrali monodimensionali ai quali si applicano le regole di integrazione gi`a note allo studente. D’altro canto, l’introduzione di un cambiamento di variabili nel dominio di integrazione pu` o portare, come nel metodo di integrazione per sostituzione in una variabile, a un’espressione pi` u facilmente calcolabile dell’integrale multiplo. In seguito, illustriamo il ruolo degli integrali multipli nella formulazione matematica di quantit` a fisiche, quali ad esempio la massa, il baricentro e i vari momenti d’inerzia di un corpo di cui sia assegnata la funzione densit` a. Gli argomenti qui considerati non esauriscono la trattazione del calcolo integrale per funzioni di pi` u variabili. L’integrazione di una funzione dipendente da n variabili su una variet` a di dimensione inferiore d` a origine ad altre tipologie di integrali, aventi grande rilevanza applicativa, quali gli integrali di linea lungo una curva e di flusso attraverso una superficie. Essi saranno presentati nel capitolo successivo, nel quale verr`a anche affrontato il problema della determinazione di una funzione a partire dalla conoscenza del suo gradiente, generalizzando cos`ı i concetti di primitiva e di integrazione indefinita. Il carattere tecnico delle dimostrazioni di molti risultati, le quali sono sovente adattamenti alla dimensione superiore di argomenti gi` a usati in dimensione uno, ci ha suggerito di renderle disponibili soltanto tramite i complementi in rete ; Complementi al Cap. 8 , lasciando ai molti e variegati esempi il compito di illustrare concretamente i vari enunciati.
Canuto C, Tabacco A: Analisi Matematica II. © Springer-Verlag Italia, Milano 2008
308
8 Calcolo integrale per funzioni in pi` u variabili z
a
c d y
b x
Figura 8.1. Rappresentazione grafica del cilindroide di una funzione
8.1 Integrale doppio su rettangoli Consideriamo una funzione reale f : B → R definita su un rettangolo chiuso e limitato B = [a, b] × [c, d] ⊂ R2 e ivi limitata. Definiamo il cilindroide C(f ; B) di f sul rettangolo B come la regione tridimensionale limitata dal rettangolo B e dal grafico di f . In formule, C(f ; B) = {(x, y, z) ∈ R3 : (x, y) ∈ B, 0 ≤ z ≤ f (x, y) oppure f (x, y) ≤ z ≤ 0} (la scelta del vincolo su z dipende dal segno di f (x, y)). Si veda la Figura 8.1. Sotto opportune ipotesi su f , `e possibile associare al cilindroide di f su B un numero, detto integrale doppio di f su B. Nel caso in cui f sia positiva, tale numero rappresenta il volume del cilindroide. In particolare, qualora il cilindroide di f sia una figura elementare (ad esempio un parallelepipedo, una piramide, etc.) esso fornisce la classica espressione del volume di tale regione. Esistono diversi modi per costruire l’integrale doppio di una funzione; illustriamo nel seguito la costruzione associata al nome di Riemann, che estende quanto visto in dimensione 1 nel Vol. I, § 9.4 e 9.5. Consideriamo pertanto partizioni arbitrarie di [a, b] e [c, d], associate a punti ordinati {x0 , x1 , . . . , xp } e {y0 , y1 , . . . , yq }. Ci` o significa che si ha a = x0 < x1 < · · · < xp−1 < xp = b ,
c = y0 < y1 < · · · < yq−1 < yq = d ,
con I = [a, b] =
p 0 h=1
Ih =
p 0 h=1
[xh−1 , xh ] ,
J = [c, d] =
q 0 k=1
Jk =
q 0
[yk−1 , yk ] .
k=1
8.1 Integrale doppio su rettangoli
309
y d = y3
y2 B32 = I3×J2
y1 c = y0
a = x0 x1
x2
x3
b = x4
x
Figura 8.2. Partizione relativa al rettangolo B
Il rettangolo B `e l’unione dei p · q prodotti cartesiani Bhk = Ih × Jk ; abbiamo cos`ı ottenuto una partizione o suddivisione di B, sia essa D = {Bhk : h = 1, . . . p, k = 1, . . . , q}, che `e il prodotto cartesiano della partizioni di [a, b] e [c, d] (si veda la Figura 8.2). Poniamo mhk =
inf
f (x, y)
e
(x,y)∈Bhk
Mhk =
sup
f (x, y)
(x,y)∈Bhk
e definiamo le somme inferiore e superiore di f su B relative alla suddivisione D come p q s = s(D, f ) = mhk (xh − xh−1 )(yk − yk−1 ) , S = S(D, f ) =
k=1 h=1 p q
(8.1) Mhk (xh − xh−1 )(yk − yk−1 ) .
k=1 h=1
Poich´e f `e limitata su B, esistono costanti m e M tali che per ogni suddivisione D di B risulta m(b − a)(d − c) ≤ s(D, f ) ≤ S(D, f ) ≤ M (b − a)(d − c) . Pertanto sono ben definite le quantit` a
f = inf S(D, f )
B
D
e
f = sup s(D, f ) , B
D
(8.2)
310
8 Calcolo integrale per funzioni in pi` u variabili z
z
y
y
x
x Figura 8.3. Somme inferiori (a sinistra) e superiori (a destra)
che chiameremo rispettivamente integrale superiore e inferiore di f su B. Come nel caso monodimensionale, si pu` o facilmente verificare che f≤ f. B
B
Definizione 8.1 Una funzione f limitata su B = [a, b] × [c, d] = I × J si dice integrabile secondo Riemann su B se f= f. B
B
Tale valore comune viene detto integrale doppio di f su B e indicato con uno dei simboli d b f, f, f (x, y) dx dy , f (x, y) dx dy , f (x, y) dx dy . B
B
B
J
I
c
a
Il significato geometrico `e chiaro nel caso in cui f sia una funzione positiva su B. Fissata una partizione D di B, il cilindroide di f `e contenuto nel solido formato dall’unione di parallelepipedi aventi base Bhk e altezza Mhk , mentre contiene il solido formato dall’unione dei parallelepipedi con la stessa base e altezza mhk (si veda la Figura 8.3). L’integrale superiore rappresenta quindi una misura esterna (o per eccesso) del cilindroide di f ; similmente, l’integrale inferiore rappresenta una misura interna (o per difetto). Dunque f `e integrabile se le due misure coincidono, cio`e se al cilindroide `e associabile un numero che ne rappresenta il volume.
8.1 Integrale doppio su rettangoli
311
Esempi 8.2 i) Sia f costante su B. Detto K il suo valore, per ogni suddivisione D di B si ha mhk = Mhk = K; dunque p q K (xh − xh−1 )(yk − yk−1 ) = K (b − a)(d − c) . s(D, f ) = S(D, f ) = k=1 h=1
Pertanto
f = K (b − a)(d − c) = K · area(B) . B
ii) Sia f la funzione di Dirichlet bidimensionale su B = [0, 1] × [0, 1], ossia la funzione definita come
1 se x, y ∈ Q, 0 ≤ x, y ≤ 1, f (x, y) = 0 altrimenti . Allora, per ogni partizione D di B risulta p q 0 · (xh − xh−1 )(yk − yk−1 ) = 0 , s(D, f ) = S(D, f ) =
k=1 h=1 p q
1 · (xh − xh−1 )(yk − yk−1 ) = 1 .
k=1 h=1
2
Pertanto f non `e integrabile su B.
Osservazione 8.3 Esaminiamo in dettaglio analogie e differenze rispetto alla definizione di funzione integrabile secondo Riemann su un intervallo [a, b], data nel ` possibile partizionare il rettangolo B = [a, b] × [c, d] senza utilizzare proVol. I. E dotti cartesiani di partizioni di [a, b] e [c, d]. Ad esempio, si pu` o pensare ad una suddivisione del tipo B = ∪N B , con B rettangoli con i lati paralleli agli assi i i=1 i e aventi a due a due al pi` u parti di frontiera in comune (si veda la Figura 8.4). Ovviamente le partizioni da noi considerate sono un sottoinsieme delle partizioni cos`ı definite. Inoltre, se consideriamo una generica funzione a scala bidimensionale ϕ, associata ad una tale partizione di B in rettangoli, `e possibile definire per essa in modo elementare l’integrale doppio. Precisamente, sia ∀(x, y) ∈ Bi ,
ϕ(x, y) = ci , allora
ϕ= B
N
i = 1, . . . , N ;
ci area(Bi ) .
i=1
Si osservi che le somme inferiore e superiore di una funzione limitata f : B → R, definite in (8.1), altro non sono che l’integrale di una funzione a scala che minora f e di una funzione a scala che maggiora f . Il loro valore costante su ogni sottorettangolo coincide rispettivamente con l’estremo inferiore e l’estremo superiore di f
312
8 Calcolo integrale per funzioni in pi` u variabili
y d
c
a
b
x
Figura 8.4. Generica partizione relativa al rettangolo B
su di esso. Avremmo anche in questo caso potuto considerare l’insieme Sf− (rispettivamente Sf+ ) delle funzioni a scala che minorano (rispettivamente maggiorano) la funzione f . L’integrale inferiore e superiore cos`ı ottenuti, − f = sup{ g : g ∈ Sf } e f = inf{ g : g ∈ Sf+ }, B
B
B
B
coincidono con quelli da noi considerati in (8.2). In altre parole, i due procedimenti di definizione dell’integrale danno lo stesso risultato. 2 Come per il caso monodimensionale, sorge l’esigenza di individuare classi significative di funzioni integrabili e di calcolare l’integrale attraverso regole che evitino di utilizzare direttamente la definizione. Una parziale risposta alla prima domanda `e data dal seguente teorema. Ulteriori esempi di classi di funzioni integrabili verranno studiati nei paragrafi successivi. Teorema 8.4 Se f `e continua nel rettangolo B, allora `e integrabile su B. Il prossimo risultato permette, sotto opportune ipotesi, di ridurre il calcolo di un integrale doppio a quello di due integrali su intervalli in R.
8.1 Integrale doppio su rettangoli
313
Teorema 8.5 Sia f integrabile sul rettangolo B = [a, b] × [c, d]. 3b a) Se, per ogni y ∈ [c, d], esiste l’integrale g(y) = a f (x, y) dx, allora la funzione g : [c, d] → R `e integrabile su [c, d] e vale d
f= B
d
b
g(y) dy = c
f (x, y) dx dy ; c
b) Se, per ogni x ∈ [a, b], esiste l’integrale h(x) = funzione h : [a, b] → R `e integrabile su [a, b] e vale b
f=
b
a
c
f (x, y) dy, allora la
f (x, y) dy dx . a
c
(8.4)
c
In particolare, se f `e continua in B, si ha b d d f= f (x, y) dy dx = B
3d
d
h(x) dx = a
B
(8.3)
a
c
b
f (x, y) dx dy .
(8.5)
a
Le formule (8.3) e (8.4) vengono dette formule di riduzione; quando valgono contemporaneamente, come nel caso di funzioni continue, si dice che `e possibile scambiare l’ordine di integrazione nell’integrale doppio. Esempi 8.6 i) Una situazione particolare `e rappresentata dalle funzioni f (x, y) = h(x)g(y) con h integrabile su [a, b] e g su [c, d]. Allora si pu` o dimostrare che f `e integrabile su B = [a, b] × [c, d] e le formule (8.3) e (8.4) si riducono alla b
B
d
h(x) dx ·
f= a
g(y) dy
,
c
ovvero l’integrale doppio coincide con il prodotto dei due integrali unidimensionali relativi alle funzioni h e g. ii) Calcoliamo l’integrale doppio della funzione f (x, y) = cos(x+y) sul rettangolo B = [0, π4 ] × [0, π2 ]. La funzione `e continua e possiamo usare indifferentemente la (8.3) oppure la (8.4). Ad esempio, si ha π/4 π/2 π/4 y=π/2 sin(x + y) f = cos(x + y) dy dx = dx 0
B
=
0 π/4
sin(x + 0
0
y=0
√ π ) − sin x dx = 2 − 1 . 2
iii) Calcoliamo l’integrale doppio della funzione f (x, y) = x cos xy sul rettangolo B = [1, 2] × [0, π].
314
8 Calcolo integrale per funzioni in pi` u variabili z
a
c
x0
d
b
y
x Figura 8.5. Significato geometrico delle formule di riduzione
Sebbene siano utilizzabili sia la (8.3) sia la (8.4), risulta pi` u conveniente la seconda. Infatti,
2 π x cos xy dx dy = x cos xy dy dx B
1 2
0
y=π
2
2 . π 1 1 La formula (8.3) `e s`ı applicabile, ma conduce a calcoli pi` u elaborati che lo studente pu` o provare a svolgere. 2 =
sin xy
dx =
y=0
sin πx dx = −
Osservazione 8.7 Il significato geometrico delle formule di riduzione `e piuttosto chiaro. Per semplicit` a sia f positiva e continua in B e consideriamo la (8.4). Fissato 3d x0 ∈ [a, b], h(x0 ) = c f (x0 , y) dy rappresenta l’area della regione piana che si ottiene intersecando il cilindroide di f con il piano x = x0 . Il volume del cilindroide si ottiene integrando tali aree tra a e b (si veda la Figura 8.5). 2
8.2 Integrale doppio su insiemi misurabili Per gli integrali monodimensionali la regione su cui integrare `e sempre un intervallo o un’unione finita di intervalli. Per gli integrali doppi limitare la regione di integrazione ai soli rettangoli o alle loro unioni finite sarebbe troppo riduttivo. Definiamo quindi gli insiemi su cui andremo a porre il problema dell’integrabilit` a di una funzione. Sia Ω un qualunque sottoinsieme limitato di R2 , e sia χΩ : R2 → R la sua funzione caratteristica, definita da
1 se x ∈ Ω , χΩ (x) = 0 se x ∈ /Ω (si veda la Figura 8.6). Fissiamo un arbitrario rettangolo B contenente Ω e chiediamoci se la funzione ` facile verificare che se ci`o accade e se B `e un qualunque χΩ sia integrabile su B. E
8.2 Integrale doppio su insiemi misurabili z
x
315
y
Ω B
Figura 8.6. Grafico della funzione caratteristica di un insieme Ω
altro rettangolo Ω, la funzione χΩ `e anche integrabile su B . Inoltre i 3 contenente 3 due integrali B χΩ e B χΩ 3 coincidono, e dunque il valore comune dell’integrale pu` o essere indicato con Ω χΩ . Con queste premesse, possiamo introdurre la nozione di misurabilit` a secondo Peano-Jordan. Definizione 8.8 Un sottoinsieme limitato Ω ⊂ R2 dicesi misurabile se, fissato arbitrariamente un rettangolo B contenente Ω, la funzione χΩ risulta integrabile su B. In tal caso, il numero non negativo |Ω| = χΩ Ω
viene detto misura (o area) di Ω. Ad esempio sono misurabili insiemi elementari quali i poligoni, i cerchi e cos`ı via, e la nozione ora introdotta coincide con il concetto di area. Talvolta scriveremo area(Ω) invece di |Ω|. In particolare, per ogni rettangolo B = [a, b] × [c, d] `e immediato verificare che d b |B| = area(B) = dx dy = dx dy = (b − a)(d − c). B
c
a
Non tutti gli insiemi limitati del piano sono misurabili. Si pensi ai punti del quadrato [0, 1] × [0, 1] con coordinate razionali. La funzione caratteristica di questo insieme altro non `e che la funzione di Dirichlet considerata nell’Esempio 8.2 ii) che abbiamo visto non essere integrabile. Pertanto l’insieme non `e misurabile. Nel seguito sar`a utile la seguente definizione. Definizione 8.9 Si dice che un insieme Ω ha misura nulla se `e misurabile e |Ω| = 0.
316
8 Calcolo integrale per funzioni in pi` u variabili
Tramite tale nozione `e possibile caratterizzare gli insiemi misurabili del piano. Infatti, il successivo risultato viene sovente utilizzato per verificare la misurabilit` a di un dato insieme. Teorema 8.10 Un insieme limitato Ω ⊂ R2 `e misurabile se e solo se la sua frontiera ∂Ω ha misura nulla. ` possibile verificare che sono insiemi di misura nulla: E i) i sottoinsiemi di insiemi di misura nulla; ii) l’unione di un numero finito di insiemi di misura nulla; iii) gli insiemi costituiti da un numero finito di punti; iv) i segmenti; v) i grafici Γ = { x, f (x) } oppure Γ = { f (y), y } di funzioni f : [a, b] → R integrabili su [a, b]; vi) i sostegni di curve piane regolari oppure regolari a tratti. Per quanto riguarda quest’ultimo caso, `e bene non confondere la misura del sostegno di una curva piana in R2 con il concetto di lunghezza, che esprime una misura unidimensionale per insiemi che non sono contenuti in una retta. Sottolineiamo inoltre che un caso particolarmente notevole di insieme di misura nulla `e quello del grafico di una funzione continua su un intervallo chiuso e limitato. Pertanto risultano misurabili gli insiemi limitati la cui frontiera `e data dall’unione di un numero finito di tali grafici o, pi` u in generale, di archi di Jordan regolari. Sono inoltre misurabili gli insiemi convessi e limitati. Valgono le seguenti propriet` a degli insiemi misurabili e della loro misura. Propriet` a 8.11 Se Ω1 e Ω2 sono insiemi misurabili, allora i) se Ω1 ⊆ Ω2 , si ha |Ω1 | ≤ |Ω2 |; ii) gli insiemi Ω1 ∪ Ω2 e Ω1 ∩ Ω2 sono misurabili e si ha |Ω1 ∪ Ω2 | = |Ω1 | + |Ω2 | − |Ω1 ∩ Ω2 | ,
da cui
|Ω1 ∪ Ω2 | ≤ |Ω1 | + |Ω2 | .
Diamo infine un semplice risultato, che sar` a utile nel seguito. Propriet` a 8.12 Sia Ω un insieme misurabile. Allora sono misurabili l’in◦ ˜ u generalmente, tutti gli insiemi Ω terno Ω di Ω, la chiusura Ω di Ω e, pi` ◦
˜ ⊆ Ω. Essi hanno tutti la stessa misura |Ω|. soddisfacenti Ω ⊆ Ω
8.2 Integrale doppio su insiemi misurabili
317
z
y
x
Ω B
Figura 8.7. Estensione di una funzione ad un rettangolo B
Dim.
˜ hanno la stessa frontiera, essendo ∂ Ω ˜ = ∂Ω. DunTutti gli insiemi Ω que, per il Teorema 8.10 essi sono misurabili. Inoltre, essi differiscono per sottoinsiemi di ∂Ω, che hanno quindi misura nulla. 2
Fissato un insieme misurabile Ω, introduciamo il concetto di integrabilit` a per funzioni limitate definite in Ω. Il procedimento che seguiamo `e del tutto analogo a quello usato per selezionare gli insiemi misurabili. Precisamente, se f : Ω → R `e una funzione limitata, consideriamo la funzione ausiliaria f˜ : R2 → R (detta estensione di f a R2 ), ottenuta ponendo
f (x) se x ∈ Ω, ˜ f (x) = (8.6) 0 se x ∈ /Ω (si veda la Figura 8.7). Definizione 8.13 Si dice che f `e integrabile in Ω (secondo Riemann) se f˜ `e integrabile su un qualunque rettangolo B contenente Ω. In tal caso, il valore dell’integrale f˜ non dipende dalla scelta di B, e si pone B
f˜ .
f= Ω
B
Si noti che se f coincide con la funzione caratteristica di Ω, quanto ora definito non `e altro che la misura di Ω. Iniziamo con il descrivere un’ampia classe di funzioni integrabili, definendo una sorta di generalizzazione del concetto di funzione continua a tratti per funzioni di una variabile.
318
8 Calcolo integrale per funzioni in pi` u variabili
Definizione 8.14 Una funzione f : Ω → R definita e limitata su un insieme misurabile Ω dicesi generalmente continua in Ω se l’insieme dei suoi punti di discontinuit` a ha misura nulla. Ovviamente una funzione limitata e continua in Ω `e anche generalmente continua, essendo vuoto l’insieme dei suoi punti di discontinuit` a. Vale allora il seguente teorema. Teorema 8.15 Sia f una funzione generalmente continua su un insieme misurabile Ω. Allora f `e integrabile su Ω. Indichiamo ora un metodo per calcolare un integrale doppio esteso a regioni particolari del piano. A tale scopo, diamo la seguente definizione. Definizione 8.16 Un insieme Ω ⊂ R2 si dice verticalmente convesso (o semplice rispetto all’asse y) se `e della forma Ω = {(x, y) ∈ R2 : a ≤ x ≤ b, g1 (x) ≤ y ≤ g2 (x)} con g1 , g2 : [a, b] → R funzioni continue. Analogamente, Ω si dice orizzontalmente convesso (o semplice rispetto all’asse x) se `e della forma Ω = {(x, y) ∈ R2 : c ≤ y ≤ d, h1 (y) ≤ y ≤ h2 (y)} con h1 , h2 : [c, d] → R funzioni continue. La nozione ora introdotta ha un’interpretazione geometrica naturale. L’insieme Ω `e semplice rispetto all’asse y se ogni retta verticale x = x0 ha intersezione con Ω vuota oppure coincidente eventualmente ridotto ad un punto, di con il segmento, estremi x0 , g1 (x0 ) e x0 , g2 (x0 ) . Analogamente, Ω `e semplice rispetto all’asse x y
y
a
x0
b x
y
a
x0
b x
a
Figura 8.8. Insiemi verticalmente convessi
x0
b x
8.2 Integrale doppio su insiemi misurabili y b
y b
y b
x0
x0
x0
a
a
a
x
x
319
x
Figura 8.9. Insiemi orizzontalmente convessi
se ogni retta orizzontaley = y0 ha intersezione con Ω vuota oppure coincidente con un segmento di estremi h1 (y0 ), y0 e h2 (y0 ), y0 . Esempi di insiemi verticalmente ed orizzontalmente convessi sono mostrati in Figura 8.8 e Figura 8.9. Gli insiemi verticalmente od orizzontalmente convessi risultano ovviamente misurabili, in quanto la loro frontiera `e l’unione di un numero finito di insiemi di misura nulla (grafici di funzioni continue e segmenti). Enunciamo e dimostriamo ora una proposizione che permette di calcolare un integrale doppio mediante l’iterazione di due integrali unidimensionali, generalizzando cos`ı il Teorema 8.5 valido sui rettangoli. Teorema 8.17 Sia Ω un insieme verticalmente convesso. Se f : Ω → R `e continua in Ω, allora vale la formula b
g2 (x)
f= Ω
f (x, y) dy dx . a
(8.7)
g1 (x)
Analogamente, se Ω `e orizzontalmente convesso e se f : Ω → R `e continua in Ω, allora vale la formula d
h2 (y)
f= Ω
Dim.
f (x, y) dx dy . c
(8.8)
h1 (y)
` facile vedere dalla definizione Consideriamo Ω orizzontalmente convesso. E che esso `e un sottoinsieme chiuso e limitato, dunque compatto, in R2 . Applicando il Teorema di Weierstrass 5.24, si deduce che f `e limitata in Ω. Pertanto, per il Teorema 8.15, f `e sicuramente integrabile su Ω. Verifichiamo la (8.8). Sia B = [a, b] × [c, d] un rettangolo contenente Ω e sia f˜ l’estensione di f a B. Si vuole applicare il Teorema 8.5, parte a); a tal fine osserviamo che, per ogni y ∈ [c, d], l’integrale
b
g(y) = a
f˜(x, y) dx
320
8 Calcolo integrale per funzioni in pi` u variabili z
y0 y x
Ω B
Figura 8.10. Illustrazione della formula di integrazione per orizzontali
esiste, in quanto la funzione x → f˜(x, y) ha al pi` u due punti di discontinuit` a (si veda la Figura 8.10). Inoltre
b
f˜(x, y) dx =
h2 (y)
f (x, y) dx h1 (y)
a
e pertanto
f˜ =
f= Ω
B
c
d
˜ f (x, y) dx dy =
b
a
d
h2 (y)
f (x, y) dx dy .
c
h1 (y)
Ci`o mostra la (8.8). La (8.7) si verifica in maniera del tutto analoga.
2
Talvolta ci si riferisce alle (8.7) e (8.8) come alle formule di integrazione per verticali e per orizzontali, rispettivamente. Esempi 8.18 i) Calcoliamo l’integrale doppio (x + 2y) dx dy , Ω
dove Ω `e la regione del piano contenuta nel primo quadrante e limitata dalle curve di equazione y = 2x, y = 3 − x2 , x = 0 (si veda la Figura 8.11, a sinistra). La prima retta e la parabola si intersecano in due punti di ascissa x = −3 e x = 1, il secondo dei quali delimita a destra la regione Ω. L’insieme Ω `e sia verticalmente sia orizzontalmente convesso, ma, vista la forma che assume, per calcolare l’integrale in questione conviene integrare per verticali. L’insieme Ω pu` o infatti essere descritto come Ω = (x, y) ∈ R2 : 0 ≤ x ≤ 1, 2x ≤ y ≤ 3 − x2 .
8.2 Integrale doppio su insiemi misurabili y
321
y 4
3
y = 2x x=
2
√ y
y = 3 − x2
xx
1
2
4
x
Figura 8.11. Insieme Ω = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, 2x ≤ y ≤ 3 − x2 } (a sinistra) e √ Ω = {(x, y) ∈ R2 : 0 ≤ y ≤ 4, y ≤ x ≤ 4} (a destra)
Pertanto, integrando per verticali, si ha 1 3−x2 1 y=3−x2 xy + y 2 (x + 2y) dx dy = (x + 2y) dy dx = dx 0
Ω
=
0
2x
y=2x
1
x4 − x3 − 12x2 + 3x + 9 dx
0
x=1 1 5 1 4 3 129 x − x − 4x3 + x2 + 9x . = 5 4 2 20 x=0 Se volessimo integrare per orizzontali, dovremmo invece esprimere l’insieme di integrazione nel modo seguente Ω = (x, y) ∈ R2 : 0 ≤ y ≤ 3, 0 ≤ x ≤ h2 (y) , dove h2 (y) `e la funzione ⎧ ⎨1 y se 0 ≤ y ≤ 2 , h2 (y) = 2 √ ⎩ 3 − y se 2 < y ≤ 3 . La forma assunta dalla funzione h2 (y) suggerisce chiaramente come sia da preferire l’integrazione per verticali. =
ii) Calcoliamo l’integrale
(5y + 2x) dx dy Ω
dove Ω `e la regione del piano limitata dalle rette y = 0, y = 4, x = 4 e dal √ grafico della funzione x = y (si veda la Figura 8.11, a destra). L’insieme Ω `e sia verticalmente sia orizzontalmente convesso; in questo caso per`o conviene integrare per orizzontali. Infatti, si osserva che si pu`o esprimere Ω come √ Ω = (x, y) ∈ R2 : 0 ≤ y ≤ 4, y ≤ x ≤ 4 ;
322
8 Calcolo integrale per funzioni in pi` u variabili
pertanto, si ha 4 4 (5y + 2x) dx dy = (5y + 2x) dx dy = √ 0
Ω
=
y
4
4
5xy + x2
0
x=4 √ x= y
dy
19y + 16 − 5y 3/2 dy
0
19 2 y + 16y − 2y 5/2 = 2
y=4 = 152.
2
y=0
Come per le funzioni definite sui rettangoli, anche per le funzioni positive e integrabili su un generico insieme misurabile Ω, l’integrale doppio ha una semplice interpretazione geometrica. Esso rappresenta il volume vol(C) del cilindroide C = C(f ; Ω) = {(x, y, z) ∈ R3 : (x, y) ∈ Ω, 0 ≤ z ≤ f (x, y)} . Si veda la Figura 8.12. Esempio 8.19 Calcolare il volume del solido cos`ı definito 3 C = (x, y, z) ∈ R3 : 0 ≤ y ≤ x, x2 + y 2 ≤ 25, z ≤ xy . 4 Il solido `e il cilindroide avente come base l’insieme 3 Ω = (x, y) ∈ R2 : 0 ≤ y ≤ x, x2 + y 2 ≤ 25 4 e come altezza la funzione f (x, y) = xy. La funzione `e integrabile (perch´e continua) sull’insieme Ω che `e sia verticalmente sia orizzontalmente convesso (si veda 3 la Figura 8.13). Pertanto vol(C) = Ω xy dx dy.
z
y
x Ω Figura 8.12. Cilindroide di una funzione positiva
8.2 Integrale doppio su insiemi misurabili
323
y 3 x = 43 y
n
x=
p 25 − y 2
5
x
Figura 8.13. Insieme Ω = (x, y) ∈ R2 : 0 ≤ y ≤ 3,
4 y 3
≤x≤
o p 25 − y 2
La regione Ω `e contenuta nel primo quadrante ed `e delimitata dalla retta y = 34 x e dalla circonferenza di centro origine e raggio 5 di equazione x2 + y 2 = 25. Per semplicit`a, integriamo per orizzontali osservando che l’insieme Ω pu` o essere descritto come 4 Ω = (x, y) ∈ R2 : 0 ≤ y ≤ 3, y ≤ x ≤ 25 − y 2 . 3 Dunque x=√25−y2 3 √25−y2 3 1 2 yx xy dx dy = xy dx dy = dy 4 2 Ω 0 0 x= 43 y 3y 225 1 3 16 . y(25 − y 2 ) − y 3 dy = = 2 2 0 9 8
8.2.1 Propriet` a dell’integrale doppio Enunciamo ora alcune utili propriet` a dell’integrale doppio. Teorema 8.20 Siano f e g funzioni integrabili su un insieme misurabile Ω ⊂ R2 . i) (Linearit` a) Per ogni α, β ∈ R, la funzione αf + βg `e integrabile in Ω e si ha αf + βg = α f +β g. Ω
Ω
Ω
ii) (Positivit` a) Se f ≥ 0 in Ω, allora f ≥ 0. Ω
Inoltre se f `e continua e Ω `e misurabile con |Ω| > 0, vale l’uguaglianza se e solo se f `e identicamente nulla.
324
8 Calcolo integrale per funzioni in pi` u variabili
iii) (Confronto) Se f ≤ g in Ω, allora f≤ g. Ω
Ω
iv) (Maggiorazione) La funzione |f | `e integrabile su Ω e f ≤ |f | . Ω
Ω
v) (Teorema della media) Se Ω `e misurabile e m=
inf
f (x, y) ,
M = sup f (x, y) ,
(x,y)∈Ω
si ha
(x,y)∈Ω
1 m≤ |Ω|
Il numero
1 |Ω|
f ≤M. Ω
f
(8.9)
Ω
`e detto valor medio di f su Ω. vi) (Additivit` a del dominio) Se Ω = Ω1 ∪ Ω2 con Ω1 ∩ Ω2 insieme di misura nulla e se f `e integrabile sia su Ω1 sia su Ω2 , allora f `e integrabile su Ω e si ha f= f+ f. Ω
Ω1
Ω2
vii) Se f = g tranne che su un sottoinsieme di Ω avente misura nulla, allora f= g. Ω
Ω
Osserviamo che la propriet` a vi) `e utile nel calcolo di integrali su insiemi che sono l’unione finita di insiemi semplici rispetto a uno dei due assi. La Propriet` a 8.12 ha la seguente controparte relativa alle funzioni integrabili. Propriet` a 8.21 Sia f una funzione integrabile su un insieme misurabile Ω, e definita sulla chiusura Ω di Ω. Allora f `e integrabile su ogni sottoinsieme ◦ ˜ soddisfacente Ω ⊆ Ω ˜ ⊆ Ω, e si ha Ω
f= ˜ Ω
f. Ω
8.2 Integrale doppio su insiemi misurabili
325
y y = 12 x + 2
Ω2
Ω1
y = |x|
− 34
x
4
Figura 8.14. Insieme Ω relativo all’Esempio 8.22 i)
In altri termini, per una funzione integrabile, l’integrale doppio non dipende dal fatto che parti del bordo dell’insieme di integrazione siano contenute o meno nell’insieme stesso. Esempi 8.22 i) Calcoliamo l’integrale doppio (1 + x) dx dy , Ω
con Ω = {(x, y) ∈ R2 : y > |x|, y < 12 x + 2}. La regione Ω `e rappresentata nella Figura 8.14 ed `e costituita dai punti compresi fra i grafici della funzione y = |x| e la retta di equazione y = 12 x + 2. L’insieme Ω `e sia verticalmente sia orizzontalmente convesso, ma per calcolare l’integrale assegnato conviene integrare per verticali. Inoltre, a causa della presenza della funzione y = |x|, conviene calcolare l’integrale esteso a Ω come la somma di due integrali estesi ai sottoinsiemi Ω1 e Ω2 mostrati in figura. I grafici delle due funzioni y = |x| e y = 12 x + 2 si intersecano in due punti di ascissa x = 4 e x = − 43 . Le regioni Ω1 e Ω2 sono quindi rispettivamente descritte da 1 Ω1 = {(x, y) ∈ R2 : 0 ≤ x < 4, x < y < x + 2} 2 e da 1 4 Ω2 = {(x, y) ∈ R2 : − < x < 0, −x < y < x + 2}. 3 2 Si ha quindi 1 4
2 x+2
(1 + x) dx dy = Ω1
=
e
0
dx = 0
x
1
[y + xy]x2
x+2
dx
4 1 1 3 3 28 − x2 + x + 2 dx = − x3 + x2 + 2x = 2 2 6 4 3 0 0 1 4
0
(1 + x) dx dy = Ω2
4
(1 + x) dy
− 43
2 x+2
−x
0
(1 + x) dy
dx =
− 43
1
x+2
2 [y + xy]−x
dx
326
8 Calcolo integrale per funzioni in pi` u variabili
0 − 43
0 1 3 7 2 3 2 7 20 x + x + 2 dx = x + x + 2x . = 2 2 2 4 27 −4 3
In conclusione, si ottiene (1 + x) dx dy = (1 + x) dx dy + Ω
Ω1
(1 + x) dx dy = Ω2
ii) Calcoliamo
272 28 20 + = . 3 27 27
y dx dy , Ω x+1 essendo Ω la regione nel primo quadrante compresa tra le circonferenze di equa1 zione x2 + y 2 = 25 e x2 + y 2 − 25 4 x = 0 e la retta y = 2 x (si veda la Figura 8.15). La prima circonferenza ha centro nell’origine e raggio 5, mentre la 25 seconda ha centro in ( 25 8 , 0) e raggio 8 . Nel primo quadrante, esse si intersecano 1 in P = (4, 3); inoltre la retta y = 2 x incontra la circonferenza x2 + y 2 = 25 in √ √ Q = (2 5, 5). La regione `e semplice rispetto ad entrambi gli assi; integriamo per verticali suddividendo Ω in due parti Ω1 e Ω2√ , che si proiettano sull’asse orizzontale rispettivamente sui segmenti [0, 4] e [4, 2 5]. Allora y y y dx dy = dx dy + dx dy x + 1 x + 1 x + 1 Ω Ω1 Ω2 4 √ 25 2√5 √25−x2 2 4 x−x y y = dy dx + dy dx x+1 x+1 0 4 x/2 x/2 √ 1 2 5 100 − 5x2 1 4 25x − 5x2 dx + dx = 2 0 x+1 8 4 x+1 √ 1 2 5 30 95 1 4 dx + dx − 5x + 30 − − 5x + 5 + = 8 0 x+1 8 4 x+1 √ √ 5 = 10 + 2 5 − 25 log 5 + 19 log(1 + 2 5) . 2 8
y
x2 + y 2 −
25 x 4
=0
3
Ω2
y = 12 x x2 + y 2 = 25
Ω1 4
5 √
2 5
x
Figura 8.15. Insieme Ω relativo all’Esempio 8.22 ii)
8.3 Cambiamento di variabili negli integrali doppi
327
8.3 Cambiamento di variabili negli integrali doppi In questo paragrafo presentiamo una generalizzazione del metodo di integrazione per sostituzione valido per integrali unidimensionali. Essa costituisce un importante strumento per il calcolo degli integrali e fornisce un’interessante interpretazione del determinante della matrice jacobiana relativa a trasformazioni del piano. Consideriamo una regione misurabile Ω ⊂ R2 e una funzione f continua e limitata su Ω. 3 Sotto tali ipotesi f `e integrabile in Ω e possiamo chiederci come si trasforma Ω f in presenza di un cambiamento di variabili o trasformazione del piano. Precisamente, facendo riferimento alle notazioni del § 6.6, sia Ω una regione del piano e Φ : Ω → Ω, (x, y) = Φ(u, v) un cambiamento di coordinate, secondo la Definizione 6.30; si pu` o allora dimostrare che anche Ω `e misurabile. Vogliamo esprimere l’integrale della funzione f (x, y) su Ω come un integrale su Ω che fa intervenire la funzione composta f˜ = f ◦ Φ, ossia f˜(u, v) = f Φ(u, v) , ivi definita. Per giungere a questo risultato, dobbiamo ricordare che l’integrale `e definito a partire dai valori delle aree di insiemi elementari, quali i rettangoli, in cui si suddivide il dominio di integrazione; pertanto, `e utile capire preliminarmente come si trasformano le aree nel passaggio da Ω a Ω attraverso la trasformazione Φ. Consideriamo quindi un rettangolo B contenuto in Ω , con i lati paralleli agli assi u e v, avente come vertici i punti u0 , u1 = u0 + Δu e1 , u2 = u0 + Δv e2 e u3 = u0 + Δu e1 + Δv e2 (si veda la Figura 8.16, a sinistra); qui Δu, Δv sono incrementi positivi, che supporremo piccoli. L’area di B `e ovviamente data da |B | = ΔuΔv. Indichiamo con B l’immagine di B attraverso Φ (si veda la Figura 8.16, a destra); essa `e un rettangoloide con i lati disposti sulle curve coordinate definite dalla trasformazione Φ, e con i vertici dati da xi = Φ(ui ), i = 0, . . . , 3. Per esprimere l’area di B in funzione di quella di B , `e necessario fare qualche approssimazione, giustificata dalla scelta di Δu e Δv sufficientemente piccoli. Innanzitutto, appros-
y
v
x2 u2
Δv
u3
∼ τ2 Δv
B
x0
Bp
∼ τ1 Δu u0
Δu
u1 u
B x3 x1 x
Figura 8.16. Trasformazione di un rettangolo mediante un cambiamento di variabili
328
8 Calcolo integrale per funzioni in pi` u variabili
simiamo il rettangoloide B con il parallelogramma B p avente in comune con B i vertici x0 , x1 e x2 . La sua area `e data, come noto, dal modulo del prodotto esterno tra i vettori che uniscono gli estremi di due lati consecutivi. Abbiamo dunque |B| ∼ |B p | = (x1 − x0 ) ∧ (x2 − x0 ) . D’altro canto, usando uno sviluppo di Taylor al primo ordine in u0 e ricordando la (6.25), si ottiene x1 − x0 = Φ(u1 ) − Φ(u0 ) ∼
∂Φ (u0 )Δu = τ1 Δu ∂u
e analogamente x2 − x0 ∼ τ2 Δv , Pertanto, si ha
con τ2 =
∂Φ (u0 ) . ∂v
|B| ∼ τ1 ∧ τ2 ΔuΔv = τ1 ∧ τ2 |B | .
Da ultimo, la (6.27) fornisce τ1 ∧ τ2 = | det J Φ(u0 )| . Concludiamo che
|B| ∼ | det J Φ(u0 )| |B | ,
(8.10)
ossia che, a meno di infinitesimi di ordine superiore a Δu e Δv, la quantit` a | det J Φ| rappresenta il fattore di proporzionalit` a tra le aree di due (piccoli) elementi di superficie B ⊂ Ω e B ⊂ Ω, che si trasformano l’uno nell’altro mediante Φ. La relazione appena stabilita viene usualmente scritta in forma simbolica come dx dy = | det J Φ(u, v)| du dv ,
(8.11)
intendendo con du dv l’area di un elemento ‘infinitesimo’ contenuto in Ω e con dx dy l’area dell’elemento immagine contenuto in Ω. Esempi 8.23 i) Sia Φ la trasformazione affine Φ(u) = Au + b, con A matrice non singolare. In tal caso B `e una parallelogramma di vertici x0 , x1 , x2 e x3 , ossia coincide con B p , e tutte le relazioni approssimate viste sopra sono in realt` a esatte. In particolare, i vettori x1 − x0 e x2 − x0 uscenti da x0 e disposti lungo i lati di B sono dati da x1 − x0 = a1 Δu , x2 − x0 = a2 Δv , essendo a1 e a2 i vettori colonna della matrice A. Pertanto |B| = a1 ∧ a2 ΔuΔv = | det A|ΔuΔv = | det J Φ| |B | , e dunque la relazione (8.10) `e esatta.
8.3 Cambiamento di variabili negli integrali doppi θ
329
y
θ0 + Δθ
B B
θ0
∼ rΔθ
Δr
Δθ
r0 r0 + Δr r
x
Figura 8.17. Elemento d’area in coordinate polari
ii) Sia Φ la trasformazione (r, θ) → (r cos θ, r sin θ) associata alle coordinate polari nel piano. L’immagine attraverso Φ di un rettangolo B = [r0 , r0 + Δr] × [θ0 , θ0 + Δθ] nel piano rθ `e il rettangoloide nel piano xy mostrato in Figura 8.17. Esso ha altezza Δr nella direzione radiale e base ∼ rΔθ nella direzione angolare; ricordando che le coordinate polari sono ortogonali, abbiamo quindi |B| ∼ rΔrΔθ = r|B | . Questa `e la forma assunta dalla (8.10) nella presente situazione, essendo infatti r = det J Φ(r, θ) > 0 (si ricordi la (6.29)). 2 Possiamo ora tornare ai cambiamenti di variabili negli integrali. Se D = una partizione di Ω in elementi rettangolari, allora D = {Bi = sar`a una partizione di Ω in rettangoloidi; indichiamo con | det J Φi | il valore che compare nella (8.10) relativo all’elemento Bi . Se fi indica una approssimazione della funzione integranda f su Bi (e dunque anche della funzione trasformata f˜ = f ◦ Φ su Bi ), allora, applicando la (8.10) in ogni elemento, si ha fi |Bi | ∼ fi | det J Φi | |Bi | . {Bi }i∈I `e Φ(Bi )}i∈I
i∈I
i∈I
u fini, ossia formate da rettangoli con lati Considerando partizioni di Ω sempre pi` di lunghezza Δu e Δv tendente a 0, si pu` o dimostrare che, se f `e continua e limitata 3 in Ω, le somme di destra tendono alla quantit` a Ω f Φ(u, v) | det J Φ(u, v)| du dv, 3 mentre le somme di sinistra tendono a Ω f (x, y) dx dy. Siamo quindi giunti a motivare, in modo euristico, il seguente fondamentale risultato (che, ovviamente, pu` o essere dimostrato rendendo rigorosi tutti i passaggi precedenti). Teorema 8.24 Sia Φ : Ω → Ω, con Ω e Ω regioni misurabili di R2 , un cambiamento di variabili in Ω, secondo la Definizione 6.30; siano x = ϕ(u, v)
e
y = ψ(u, v)
330
8 Calcolo integrale per funzioni in pi` u variabili
le componenti di Φ. Se f `e una funzione continua e limitata su Ω, vale la formula f (x, y) dx dy = f ϕ(u, v), ψ(u, v) | det J Φ(u, v)| du dv . (8.12) Ω
Ω
Notiamo che talvolta, nelle applicazioni, `e pi` u conveniente definire la trasformazio −1 ne inversa (u, v) = Ψ(x, y), per cui Ω = Ψ(Ω) e det J Φ(u, v) = det J Ψ(x, y) . Esplicitiamo la formula precedente per due cambiamenti di variabile notevoli, una trasformazione affine del piano e il passaggio alle coordinate polari. trasformazione affine, poniamo x = Φ(u) = Au + b con A = Nel caso di una
a11 a12 b1 eb= ; dunque x = ϕ(u, v) = a11 u + a12 v + b1 e y = ψ(u, v) = a21 a22 b2 a21 u + a22 v + b2 . Se Ω `e una regione misurabile del piano e se Ω = Φ−1 (Ω), si ha
f (x, y) dx dy = | det A| Ω
Ω
f (a11 u + a12 v + b1 , a21 u + a22 v + b2 ) du dv .
Per quanto riguarda le coordinate polari, abbiamo x = ϕ(r, θ) = r cos θ, y = ψ(r, θ) = r sin θ, e det J Φ(r, θ) = r. Dunque si ha
f (x, y) dx dy = Ω
f (r cos θ, r sin θ) r dr dθ . Ω
Esempi 8.25 i) Consideriamo la funzione
f (x, y) = (x2 − y 2 ) log 1 + (x + y)4 definita in Ω = {(x, y) ∈ R2 : x > 0, 0 < y < 2 − x}; tale insieme `e rappresentato 3in Figura 8.18, a destra). La funzione `e continua e limitata su Ω e dunque esiste f (x, y) dx dy. La struttura di f ci suggerisce di porre Ω u=x+y e v = x−y, ossia consideriamo la trasformazione lineare u−v u+v , y = ψ(u, v) = x = ϕ(u, v) = 2 2
1/2 1/2 , con | det A| = 1/2. Inoltre la definita dalla matrice A = 1/2 −1/2 controimmagine di Ω tramite Φ `e l’insieme Ω = {(u, v) ∈ R2 : 0 < u < 2, −u < v < u} rappresentato in Figura 8.18, a sinistra. Allora
8.4 Integrali multipli
v
331
y Ω
Ω
2
2 y =2−x
v = −u
v=u
−2
2
u
2
x
Figura 8.18. Insieme Ω = {(x, y) ∈ R2 : x > 0, 0 < y < 2 − x} (a destra) e Ω = {(u, v) ∈ R2 : 0 < u < 2, −u < v < u} (a sinistra)
1 (x2 − y 2 ) log 1 + (x + y)4 dx dy = uv log(1 + u4 ) du dv 2 Ω Ω
u 1 2 2 v=u 1 2 4 v v dv log(1 + u ) du = log(1 + u4 ) du = 0 . = 2 0 4 v=−u −u 0 ii) Consideriamo 1 f (x, y) = 1 + x2 + y 2 sull’insieme √ Ω = {(x, y) ∈ R2 : 0 < y < 3x, 1 < x2 + y 2 < 4}. Passando a coordinate polari, si ha π Ω = {(r, θ) : 1 < r < 2, 0 < θ < } 3 (si veda la Figura 8.19) e dunque
π/3 2 1 r dθ f (x, y) dx dy = r dr dθ = 2 2 0 1 1+r Ω Ω 1 + r
π/3 2 r 5 π = dθ dr = log . 2 2 1 + r 6 2 0 1
8.4 Integrali multipli La definizione dell’integrale multiplo o integrale n-dimensionale per funzioni di n ≥ 3 variabili reali ricalca quella appena vista per l’integrale doppio per funzioni di 2 variabili. Ci limitiamo ad indicare esplicitamente i cambiamenti dovuti all’aumento della dimensione nel caso n = 3.
332
8 Calcolo integrale per funzioni in pi` u variabili θ
y Ω
π 3
y=
√
3x
Ω
1
2
1 2
r
Figura 8.19. Insieme Ω = {(x, y) ∈ R2 : 0 < y < Ω = {(r, θ) : 1 < r < 2, 0 < θ < π3 } (a sinistra)
√
1
2
x
3x, 1 < x2 + y 2 < 4} (a destra) e
Il ruolo dei rettangoli nel piano `e ora svolto dai parallelepipedi nello spazio. Consideriamo cio`e il generico insieme B = [a1 , b1 ] × [a2 , b2 ] × [a3 , b3 ]. Una partizione D di B `e ottenuta come il prodotto cartesiano di partizioni degli intervalli [a1 , b1 ], [a2 , b2 ] ed [a3 , b3 ], mediante punti {x0 , x1 , . . . , xp }, {y0 , y1 , . . . , yq } e {z0 , z1 , . . . , zr } rispettivamente. Il parallelepipedo B si descrive dunque come l’unione dei parallelepipedi Bhk = [xh−1 , xh ] × [yk−1 , yk ] × [z−1 , z ]. Sia f : B → R una funzione limitata; le somme inferiore e superiore di f su B relative a D sono definite come s = s(D, f ) =
q p r
mhk (xh − xh−1 )(yk − yk−1 )(z − z−1 ) ,
=1 k=1 h=1 q p r
S = S(D, f ) =
Mhk (xh − xh−1 )(yk − yk−1 )(z − z−1 )
=1 k=1 h=1
con mhk =
inf
f (x, y, z) ,
Mhk =
(x,y,z)∈Bhk
sup
f (x, y, z) .
(x,y,z)∈Bhk
Diciamo che la funzione f `e integrabile su B se inf S(D, f ) = sup s(D, f ); D
D
tale valore comune viene detto integrale triplo di f su B e indicato con uno dei simboli f, f, f (x, y, z) dx dy dz . B
B
B
Anche in questa situazione, le funzioni continue risultano integrabili. Vale inoltre un risultato analogo al Teorema 8.5, con le ovvie modifiche nell’enunciato.
8.4 Integrali multipli
333
Esempio 8.26 3 Calcoliamo B xyz dx dy dz, dove B = [0, 1] × [−1, 2] × [0, 2]. Risulta
2 2 1 xyz dx dy dz = xyz dx dy dz −1
0
B
1 = 2
2
0
0
2
3 yz dy dz = 4 −1
2
z dz = 0
3 . 2
2
Volendo ampliare la definizione di integrale triplo a classi opportune di insiemi tridimensionali limitati Ω ⊂ R3 , `e necessario definire il concetto di misurabilit`a per tali insiemi. Ci` o pu` o essere fatto in analogia con la Definizione 8.8, sostituendo al ruolo del rettangolo B quello di un qualunque parallelepipedo contenente Ω. In tal caso, si pone ancora |Ω| = χΩ = χΩ , Ω
B
notando che la definizione `e indipendente dalla scelta di B. Risultano misurabili gli insiemi pi` u comuni della geometria euclidea, quali le sfere, i cilindri, i poliedri e cos`ı via, e la nozione di misura introdotta coincide con l’usuale concetto di volume; talvolta scriveremo |Ω| = vol(Ω). La Definizione 8.9, il Teorema 8.10 e la Propriet` a 8.12, si estendono in modo naturale in dimensione superiore a 2. Ad esempio, se D ⊂ R2 `e misurabile e g : D → R `e integrabile in D, allora il suo grafico ha misura 3-dimensionale nulla. In particolare, i sostegni di superfici regolari risultano avere misura nulla (come sottoinsiemi di R3 ). Sia ora f : Ω → R, con Ω insieme misurabile, una funzione limitata. Fissato un qualunque parallelepipedo B contentente Ω, estendiamo f ponendola uguale a zero su B \ Ω. Denotiamo tale estensione ancora con f˜. Diremo allora che f `e integrabile su Ω se f˜ `e integrabile su B, e in tal caso poniamo f= f˜ ; Ω
B
tale quantit` a, che risulta indipendente dalla scelta di B, viene chiamata integrale triplo di f su Ω. Altre notazioni usate sono f, f (x, y, z) dx dy dz , f dΩ . Ω
Ω
Ω
Anche in questa situazione la Definizione 8.14 e il Teorema 8.15 si estendono senza difficolt` a al caso tridimensionale; allo stesso modo si estende il Teorema 8.20. Con un’analoga costruzione si definisce l’integrale multiplo in dimensione n > 3. Consideriamo ora regioni particolari dello spazio per le quali risulta semplice calcolare esplicitamente l’integrale triplo riducendolo a integrali mono- e bidimensionali. Tali sottoinsiemi di R3 generalizzano gli insiemi verticalmente od orizzontalmente convessi del piano e ci permettono di ottenere formule esplicite di
334
8 Calcolo integrale per funzioni in pi` u variabili z
z
z g2 (x, y)
g1 (x, z)
g1 (y, z)
g1 (x, y) D D
g2 (x, z)
y x
y
y x
D
x
g2 (y, z)
Figura 8.20. Insiemi semplici rispetto agli assi coordinati
riduzione per un integrale triplo. Esaminiamo in dettaglio il caso di regioni semplici rispetto all’asse z; analoghe considerazioni possono essere fatte per descrivere regioni semplici rispetto agli altri due assi coordinati. Definizione 8.27 Un insieme Ω ⊂ R3 si dice semplice (o normale) rispetto all’asse z se `e della forma Ω = {(x, y, z) ∈ R3 : (x, y) ∈ D, g1 (x, y) ≤ z ≤ g2 (x, y)} ,
(8.13)
con D regione misurabile chiusa in R2 e g1 , g2 : D → R funzioni continue. Si veda la Figura 8.20 per una rappresentazione grafica di regioni semplici rispetto agli assi coordinati. La frontiera di tali insiemi, per quanto visto, ha misura nulla e dunque si tratta ` possibile ridurre l’integrale triplo esteso a regioni semplici di insiemi misurabili. E rispetto ad un asse coordinato a integrali doppi e/o monodimensionali iterati. Per fissare le idee, consideriamo regioni Ω semplici rispetto all’asse z e vediamo quale forma esplicita prende l’integrale triplo. Sia dunque Ω definito dalla (8.13); allora vale la seguente formula di riduzione
f= Ω
g2 (x,y)
f (x, y, z) dz D
dx dy .
(8.14)
g1 (x,y)
Essa prende il nome di formula di integrazione per fili (paralleli all’asse z). Si veda la Figura 8.21. ` possibile eseguire una riduzione dimensionale nell’integrazione anche per altre E famiglie di insiemi misurabili. Precisamente, sia Ω ⊂ R3 misurabile tale che la coordinata z dei suoi punti vari in un intervallo [α, β] ⊂ R. Per ogni z0 in tale intervallo, poniamo
8.4 Integrali multipli
335
z
g2 (x, y)
g1 (x, y) y (x, y) D
x
Figura 8.21. Integrazione per fili
Az0 = {(x, y) ∈ R2 : (x, y, z0 ) ∈ Ω} ; l’insieme Az0 altro non `e che la proiezione sul piano xy dell’insieme Ωz0 risultante dall’intersezione di Ω con il piano z = z0 (si veda la Figura 8.22). L’insieme Ω pu` o dunque essere descritto come Ω = {(x, y, z) ∈ R3 : z ∈ [α, β], (x, y) ∈ Az } . Supponiamo allora che ogni Az sia un insieme misurabile in R2 . Ci`o accade ad esempio se la frontiera di Ω `e l’unione di un numero finito di grafici di funzioni, oppure se Ω `e convesso. Se ora f : Ω → 3R `e una funzione continua e limitata, esisteranno tutti gli integrali della forma Az f (x, y, z) dx dy per z ∈ [α, β], e si pu`o dimostrare che vale z β
Ωz α
x
y Az Figura 8.22. Integrazione per strati
336
8 Calcolo integrale per funzioni in pi` u variabili
la seguente formula di riduzione
β
f= Ω
f (x, y, z) dx dy dz .
(8.15)
Az
α
Si parla in questo caso di formula di integrazione per strati (paralleli al piano xy). Esempi 8.28 i) Si vuole calcolare
x dx dy dz , Ω
dove Ω `e il tetraedro limitato dai piani coordinati x = 0, y = 0, z = 0 e dal piano x + y + z = 1 (si veda la Figura 8.23). Si tratta di una regione semplice rispetto all’asse z, essendo Ω = {(x, y, z) ∈ R3 : (x, y) ∈ D, 0 ≤ z ≤ 1 − x − y} dove D = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 − x} . D’altro canto, possiamo anche descrivere Ω come Ω = {(x, y, z) ∈ R3 : 0 ≤ z ≤ 1, (x, y) ∈ Az } dove Az = {(x, y) ∈ R2 : 0 ≤ x ≤ 1 − z, 0 ≤ y ≤ 1 − z − x}. Si veda la Figura 8.24 per una rappresentazione grafica degli insiemi D e Az . Allora, integrando per fili, si ha
1−x−y x dx dy dz = x dz dx dy = (1 − x − y)x dx dy Ω
D
0
D
z
1
Ωz D 1
1 y
x Figura 8.23. Tetraedro relativo all’Esempio 8.28 i)
8.4 Integrali multipli y
337
y
1 1−z y =1−x
y =1−z−x
D Az 1−z
x
1
x
Figura 8.24. Insiemi D (a sinistra) e Az (a destra) relativi all’Esempio 8.28 i)
1
1−x
= 0
0
1 (1 − x − y)x dy dx = − 2
1 1 1 . (1 − x)2 x dx = 2 0 24 Oppure, integrando per strati,
1 x dx dy dz = x dx dy dz =
1
(1 − x − y)2
0
y=1−x x dx y=0
=
Ω
1
0 1−z
Ωz
1 0
x(1 − x − z) dx dz =
= 0
1 = 6
0
1 0
0
1−z 0
1
1
1−x−z
x dy dx dz
0
1 x=1−z x2 (1 − z) − x3 dz 2 3 x=0
1 . (1 − z)3 dz = 24
ii) Si consideri l’integrale
y 2 + z 2 dx dy dz , Ω
dove Ω `e la regione limitata dal paraboloide x = y 2 + z 2 e dal piano x = 2 (si veda la Figura 8.25, a sinistra). Essa pu` o essere descritta come 3 Ω = {(x, y, z) ∈ R : 0 ≤ x ≤ 2, (y, z) ∈ Ax } dove Ax = {(y, z) ∈ R2 : y 2 + z 2 ≤ x} (si veda la Figura 8.25, a destra, per una rappresentazione grafica di Ax ) e pertanto possiamo integrare per strati. Per calcolare l’integrale doppio su Ax , vista la regione e l’espressione della funzione da integrare, `e conveniente utilizzare coordinate polari nel piano yz. Otteniamo 2π √x 2 √ 2 y 2 + z 2 dy dz = r dr dθ = πx x . 3 0 0 Ax
338
8 Calcolo integrale per funzioni in pi` u variabili
z z
Ax
√
y 2
x y
Ω
x
Figura 8.25. Paraboloide (a sinistra) e insieme Ax (a destra) relativi all’Esempio 8.28 ii)
Pertanto
2 √ 2 16 √ y 2 + z 2 dx dy dz = π x x dx = 2π . 3 0 15 Ω Si osservi ora che la regione Ω `e semplice rispetto a tutti gli assi coordinati, e quindi l’integrale pu` o anche essere calcolato per fili; in tal caso, la scelta pi` u naturale `e di considerare Ω come semplice rispetto all’asse x, ossia
Ω = {(x, y, z) ∈ R3 : (y, z) ∈ D, y 2 + z 2 ≤ x ≤ 2} con D = {(y, z) ∈ R2 : 0 ≤ x ≤ y 2 + z 2 }. Si lasciano i dettagli al lettore.
2
8.4.1 Cambiamenti di variabili negli integrali tripli Il Teorema 8.24 sui cambiamenti di variabili assume ora la seguente forma. Teorema 8.29 Sia Φ : Ω → Ω, con Ω e Ω regioni misurabili di R3 , un cambiamento di variabili in Ω; poniamo x = Φ(u). Se f `e una funzione continua e limitata su Ω, vale la formula f (x) dΩ = f Φ(u) | det J Φ(u)| dΩ . (8.16) Ω
Ω
La stessa formula (8.16) vale, con l’ovvio significato delle notazioni, in dimensione n > 3 qualunque. Vediamo in particolare come diventa un integrale triplo in presenza di trasformazioni da coordinate cilindriche e sferiche a cartesiane. Sia Φ la trasformazione che definisce le coordinate cilindriche in R3 , discussa nel § 6.6; la Figura 8.26, a sinistra, mostra un corrispondente elemento di volume. Se
8.4 Integrali multipli z
339
z rΔθ
r sin ϕΔθ
r rΔϕ
ϕ Δr
Δz r
O
O
y Δθ
Δr y
x
x
Δθ
Figura 8.26. Elemento di volume in coordinate cilindriche, a sinistra, e sferiche, a destra
Ω `e un insieme misurabile e se Ω = Φ−1 (Ω), allora, ricordando la formula (6.41), risulta f (x, y, z) dx dy dz = f (r cos θ, r sin θ, t) r dr dθ dt . Ω
Ω
Ovviamente i ruoli delle variabili x, y e z possono essere opportunamente scambiati. Nell’Esempio 8.28 ii), abbiamo di fatto applicato la trasformazione in coordinate cilindriche cos`ı definita Φ(r, θ, t) = (t, r cos θ, r sin θ). Sia ora Φ la trasformazione che definisce le coordinate sferiche in R3 ; il corrispondente elemento di volume `e illustrato nella Figura 8.26, a destra. Se ancora Ω e Ω sono legati da Ω = Φ−1 (Ω), ricordando la formula (6.44) si ha
f (r sin ϕ cos θ, r sin ϕ sin θ, r cos ϕ) r2 sin ϕ dr dϕ dθ .
f (x, y, z) dx dy dz = Ω
Ω
Anche in questa situazione i ruoli delle variabili possono essere scambiati. Esempi 8.30 i) Calcoliamo
(x2 + y 2 ) dx dy dz , Ω
dove Ω `e la regione contenuta all’interno del cilindro x2 + y 2 = 1, al di sotto del piano z = 3 e al di sopra del paraboloide di equazione x2 + y 2 + z = 1 (si veda la Figura 8.27, a sinistra). Utilizzando le coordinate cilindriche l’equazione del cilindro diventa r = 1 e quella del paraboloide t = 1 − r2 . Pertanto, si ha 0 ≤ r ≤ 1,
0 ≤ θ ≤ 2π ,
1 − r2 ≤ t ≤ 3
340
8 Calcolo integrale per funzioni in pi` u variabili z z
Ω
Ω
y
y
x
x Figura 8.27. Regioni relative agli Esempi 8.30 i) e ii)
e quindi (x2 + y 2 ) dx dy dz =
2π
0
Ω
= 2π
1
3
r3 dt dr dθ = 2π
1−r2
0 1
0
(2r3 + r5 ) dr =
1
t=3
r3 t
t=1−r2
dr
4 π. 3
0 ii) Determiniamo il volume del solido individuato dalle condizioni z ≥ x2 + y 2 e x2 + y 2 + z 2 − z ≤ 0. Si tratta della regione Ω al di sopra del cono di equazione 2 z = x2 + y 2 e all’interno della sfera x2 + y 2 + z − 12 = 14 di centro (0, 0, 12 ) e raggio 12 (si veda la Figura 8.27, a destra). 3 Poich´e il volume cercato `e dato dall’integrale triplo Ω dx dy dz, `e conveniente utilizzare le coordinate sferiche. Risulta π 0 ≤ θ ≤ 2π , 0≤ϕ≤ . 4 Per trovare le limitazioni relative ad r, osserviamo che l’equazione della sfera diventa r2 = r cos ϕ, ovvero r = cos ϕ. Dunque 0 ≤ r ≤ cos ϕ. Pertanto 2π π/4 cos ϕ vol(Ω) = dx dy dz = r2 sin ϕ dr dϕ dθ Ω
2 = π 3
0
0
0
ϕ=π/4 1 π cos3 ϕ sin ϕ dϕ = − π cos4 ϕ = . 6 8 ϕ=0
π/4 0
2
8.5 Applicazioni ed estensioni Illustriamo dapprima alcune applicazioni fisiche del concetto di integrale multiplo. Successivamente, consideriamo i solidi di rotazione e vediamo come calcolarne il volume. Infine, estendiamo la definizione di integrale multiplo alle funzioni vettoriali, e a insiemi non limitati di Rn .
8.5 Applicazioni ed estensioni
341
8.5.1 Massa, baricentro e momenti di inerzia Gli integrali doppi e tripli possono essere utilizzati per il calcolo della massa, del baricentro oppure dei momenti di inerzia di regioni piane o di solidi. Supponiamo dapprima di avere un corpo, quale ad esempio una lamina piana, il cui spessore nella direzione z sia molto piccolo rispetto alle sue dimensioni nelle direzioni x e y. Supponiamo che la sezione mediana del corpo, nella direzione z, occupi una regione piana Ω. Sia μ(x, y) la sua densit` a superficiale di massa (ossia la massa per unit` a di area); allora la massa totale del corpo `e data da m= μ(x, y) dx dy . (8.17) Ω
Il baricentro o centro di massa di Ω `e il punto G = (xG , yG ) avente coordinate 1 1 xG = xμ(x, y) dx dy , yG = yμ(x, y) dx dy . (8.18) m Ω m Ω Se il corpo `e omogeneo, ossia se la densit`a di massa `e costante, risulta 1 1 xG = x dx dy , yG = y dx dy , area(Ω) Ω area(Ω) Ω ossia ciascuna coordinata del baricentro di Ω `e il valor medio (si ricordi la (8.9)) della corrispondente coordinata di tutti i punti di Ω. Se r `e una retta, il momento di inerzia di Ω rispetto ad r `e dato da dr2 (x, y)μ(x, y) dx dy Ir = Ω
dove dr (x, y) indica la distanza del punto (x, y) dalla retta r. In particolare, i momenti di inerzia rispetto agli assi coordinati sono Ix = y 2 μ(x, y) dx dy , Iy = x2 μ(x, y) dx dy . Ω
Ω
La loro somma `e il momento di inerzia rispetto all’origine I0 = Ix + Iy = (x2 + y 2 )μ(x, y) dx dy = d02 (x, y)μ(x, y) dx dy , Ω
Ω
essendo d0 (x, y) la distanza del punto (x, y) dall’origine. In modo analogo, se consideriamo un solido Ω in R3 con densit`a volumica di massa μ(x, y, z), si avr` a m= μ(x, y, z) dx dy dz , Ω 1 xμ(x, y, z) dx dy dz , xG = m Ω 1 yG = yμ(x, y, z) dx dy dz , m Ω 1 zμ(x, y, z) dx dy dz . zG = m Ω
342
8 Calcolo integrale per funzioni in pi` u variabili
I momenti di inerzia rispetto agli assi coordinati sono Ix = (y 2 + z 2 )μ(x, y, z) dx dy dz , Ω (x2 + z 2 )μ(x, y, z) dx dy dz , Iy = Ω Iz = (x2 + y 2 )μ(x, y, z) dx dy dz , Ω
mentre il momento di inerzia rispetto all’origine `e (x2 + y 2 + z 2 )μ(x, y) dx dy . I0 = Ix + Iy + Iz = Ω
Esempio 8.31 Consideriamo una lamina piana Ω contenuta nel primo quadrante e limitata dalla parabola x = 1 − y 2 e dagli assi coordinati. Supponendo che abbia densit` a di massa μ(x, y) = y, vogliamo determinarne la massa totale, le coordinate del baricentro e i momenti di inerzia rispetto agli assi coordinati. La regione Ω `e rappresentata in Figura 8.28. Risulta 1 1−y2 1 1 m= y dx dy = dx y dy = y(1 − y 2 ) dy = , 4 Ω 0 0 0 1 1−y2 1 1 xG = 4 xy dy dx = 4 x dx y dy = 2 y(1 − y 2 )2 dy = , 3 Ω 0 0 0 1 1−y2 1 8 , yG = 4 y 2 dy dx = 4 dx y 2 dy = 4 y 2 (1 − y 2 ) dy = 15 Ω 0 0 0 1 1−y2 1 1 3 , Ix = y dy dx = dx y 3 dy = y 3 (1 − y 2 ) dy = 12 Ω 0 0 0 1 1−y2 1 1 1 2 2 . Iy = x y dy dx = x dx y dy = y(1 − y 2 )3 dy = 3 24 Ω 0 0 0 2 8.5.2 Volume dei solidi di rotazione Sia Ω un solido ottenuto facendo ruotare attorno all’asse z il trapezoide T di una funzione f : [a, b] → R, y = f (z) il cui grafico giace nel piano yz (si veda la Figura 8.29). La regione 3T `e anche detta sezione meridiana di Ω. Allora il volume di Ω `e l’integrale triplo Ω dx dy dz. La regione Ωz0 risultante dall’intersezione di Ω con il piano z = z0 `e un cerchio di raggio f (z0 ). Dunque, integrando per strati, si ha
b b 2 vol(Ω) = f (z) dz , dx dy dz = π (8.19) a
Ωz
a
8.5 Applicazioni ed estensioni
343
y
1 x = 1 − y2
x
1
Figura 8.28. Insieme Ω relativo all’Esempio 8.31
2 in quanto l’integrale doppio su Ωz rappresenta l’area di Ωz ed `e uguale a π f (z) . La formula (8.19) pu` o essere interpretata geometricamente utilizzando la nozione di baricentro della sezione meridiana T nel piano yz. Infatti, si ha 3 b f (z) b 2 y dy dz 1 1 yG = 3T = f (z) dz . y dy dz = area(T ) a 0 2area(T ) a dy dz T Pertanto, utilizzando la (8.19), si ottiene yG =
vol(Ω) 2π area(T )
ovvero vol(Ω) = 2πyG area(T ) .
(8.20)
Abbiamo cos`ı dimostrato il seguente teorema che viene detto Teorema di Pappo (o primo Teorema di Guldino). z
b Ωz 0 a
y = f (z) y
x Figura 8.29. Solido di rotazione
344
8 Calcolo integrale per funzioni in pi` u variabili
Teorema 8.32 Il volume di un solido di rotazione `e uguale al prodotto dell’area della sezione meridiana per la lunghezza della circonferenza descritta dal baricentro della sezione attorno all’asse di rotazione.
Esempi 8.33 i) Calcoliamo il volume del solido Ω ottenuto facendo ruotare il triangolo T del piano yz di vertici A = (1, 1), B = (2, 1) e C = (1, 3) attorno all’asse z. In Figura 8.30 `e rappresentato il triangolo T , che ha banalmente area uguale a 1. Poich´e la retta per B e C ha equazione z = −2y + 5, si ha 2 −2y+5
vol(Ω) = 2πyG = 2π y dy dz = 2π dz y dy
1
T
1
2
8 (2 − y)y dy = π . = 4π 3 1 ii) Calcoliamo il volume del solido Ω ottenuto facendo ruotare il cerchio T del piano yz di equazione (y − y0 )2 + (z − z0 )2 = r2 con 0 < r < y0 . Tale solido `e detto toro; si veda la Figura 8.31 per la rappresentazione grafica di Ω e di T . Poich´e area(T ) = πr2 e il baricentro di un cerchio `e il suo centro, si ha vol(Ω) = 2π 2 r2 y0 . 2
z C
3
z = −2y + 5
1 A
B
1
2
y
Figura 8.30. Triangolo T relativo all’Esempio 8.33 i)
8.5 Applicazioni ed estensioni
345
z
T y x Figura 8.31. Toro relativo all’Esempio 8.33 ii)
8.5.3 Integrali di funzioni vettoriali Sia f : Ω ⊂ Rn → Rm una funzione vettoriale definita su un insieme misurabile Ω m (con n ed m ≥ 2 arbitrari); sia f = fi ei la sua rappresentazione rispetto alla i=1
base canonica di Rm . Diremo che f `e integrabile su Ω se tutte le sue coordinate fi lo sono; in tal caso, definiamo l’integrale di f su Ω come il vettore di Rm f dΩ = Ω
m i=1
fi dΩ ei . Ω
Ad esempio, se v `e il campo di velocit`a di un fluido in un dominio misurabile Ω ⊂ R3 , il vettore 1 vΩ = v dΩ |Ω| Ω rappresenta la velocit` a media del fluido in Ω. 8.5.4 Integrali multipli impropri Abbiamo visto nel Vol. I come sia possibile definire integrali di funzioni non limitate oppure integrali estesi a intervalli non limitati. Per funzioni di pi` u variabili, consideriamo solo quest’ultima situazione. Per semplicit` a, sia f (x, y) una funzione reale di due variabili che supponiamo definita su tutto R2 , positiva e integrabile ` chiaro che al tendere di su ogni cerchio BR (0) di centro l’origine e raggio R. E ` quindi naturale dire che f `e integrabile in R a +∞, il cerchio invade tutto R2 . E senso improprio su R2 se esiste finito il limite, per R → +∞, degli integrali di f su BR (0). Precisamente, diamo la seguente definizione.
346
8 Calcolo integrale per funzioni in pi` u variabili
Definizione 8.34 Sia f : R2 → R una funzione positiva e integrabile su ogni cerchio BR (0). Si dice che f `e integrabile in senso improprio su 2 R se esiste finito lim f (x, y) dx dy. Tale limite si dice integrale R→+∞
BR (0)
improprio di f su R2 e si pone f (x, y) dx dy = lim R→+∞
R2
f (x, y) dx dy .
BR (0)
Osservazione 8.35 i) La definizione pu` o essere estesa a funzioni di segno qualunque richiedendo che la funzione |f (x, y)| sia integrabile. Ricordando che ogni funzione pu` o essere scritta come la differenza di due funzioni positive, la sua parte positi va f+ (x, y) = max f (x, y), 0 e la sua parte negativa f− (x, y) = max −f (x, y), 0 , ossia si ha f (x, y) = f+ (x, y) − f− (x, y), si pone f (x, y) dx dy = f+ (x, y) dx dy − f− (x, y) dx dy . R2
R2
R2
ii) Altri tipi di insiemi possono essere utilizzati per invadere R2 . Ad esempio, si possono considerare i quadrati QR (0) = [−R, R] × [−R, R] di lato 2R centrati nell’origine. Si pu` o dimostrare che, se f `e integrabile, vale l’uguaglianza lim f (x, y) dx dy = lim f (x, y) dx dy . R→+∞
R→+∞
BR (0)
QR (0)
iii) Se la funzione non `e definita su tutto R2 ma su un sottoinsieme Ω non limitato, si considera il limite per R → +∞ degli integrali esiste finito, si pone ancora f (x, y) dx dy = lim Ω
R→+∞
BR (0)∩Ω
f (x, y) dx dy. Se esso BR (0)∩Ω
f (x, y) dx dy .
2
Esempi 8.36 1 ` una funzione definita su tutto R2 , positiva i) Sia f (x, y) = .E (3 + x2 + y 2 )3 e continua. Calcoliamone l’integrale sul generico cerchio BR (0) utilizzando le coordinate polari. Si ha 2π R r f (x, y) dx dy = dr dθ (3 + r2 )3 BR (0) 0 0 R 1 1 . = −2π (3 + r2 )−1/2 = 2π √ − √ 0 3 3 + R2
8.6 Esercizi
Dunque
347
1 2π 1 =√ f (x, y) dx dy = lim 2π √ − √ 2 R→+∞ 2 3 3 3+R R 2 ed f risulta integrabile in senso improprio su R . 1 . Procedendo come nell’esempio precedente, si ha 1 + x2 + y 2 2π R r f (x, y) dx dy = dr dθ 1 + r2 0 0 BR (0) R = π log(1 + r2 ) = π log(1 + R2 ) .
ii) Sia f (x, y) =
0
Pertanto
f (x, y) dx dy = lim π log(1 + R2 ) = +∞
lim
R→+∞
R→+∞ 2
BR (0)
e la funzione non risulta integrabile su R .
iii) Utilizziamo quanto visto per calcolare un integrale di fondamentale importanza nel Calcolo delle probabilit` a, relativo alla densit` a gaussiana: +∞ 2 S= e−x dx . 2
−∞
2
In effetti, sia f (x, y) = e−x −y ; osserviamo che
−x2 −y 2 −x2 −y 2 e dx dy = e dx e dy = S 2 . R2
Ma, d’altra parte, 2 2 e−x −y dx dy = R2
R
lim
R→+∞
e
−x2 −y 2
lim π − e−r
2
R→+∞
R 0
2π R
dx dy = lim
R→+∞
BR (0)
=
R
0
2
e−r r dr dθ
0
2
= lim π(1 − e−R ) = π . R→+∞
Dunque
+∞
S= −∞
2
e−x dx =
√
π.
2
8.6 Esercizi 1. Rappresentare graficamente la regione A indicata e successivamente calcolare i seguenti integrali doppi: x a) dx dy con A = [1, 2] × [1, 2] 2 + y2 x A
348
8 Calcolo integrale per funzioni in pi` u variabili
xy dx dy
con
B = {(x, y) ∈ R2 : x ∈ [0, 1], x2 ≤ y ≤ 1 + x}
(x + y) dx dy
con
√ C = {(x, y) ∈ R2 : 2x3 ≤ y ≤ 2 x}
con
D = {(x, y) ∈ R2 : y ∈ [0, 1], y ≤ x ≤ ey }
con
E triangolo di vertici (0, 2), (1, 1), (3, 2)
ey dx dy
con
F = {(x, y) ∈ R2 : 0 ≤ y ≤ 1, 0 ≤ x ≤ y}
x cos y dx dy
con
G limitata da y = 0, y = x2 , x = 1
yex dx dy
con
H triangolo di vertici (0, 0), (2, 4), (6, 0)
b) B
c)
C
√
d)
x dx dy
D
y 3 dx dy
e) E
2
f) F
g)
G
h)
H
2. Sia f (x, y) una generica funzione continua in R2 . Rappresentare graficamente il dominio e cambiare l’ordine di integrazione nei seguenti integrali doppi: 1 x π/2 sin x a) f (x, y) dy dx b) f (x, y) dy dx
0
0
2
0
log x
c)
f (x, y) dy dx
1
f (x, y) dx dy
2
f (x, y) dx dy 0
0 2−y
y2
0
e)
d)
0
4
1
1
π/4
f)
f (x, y) dy dx 0
y/2
arctan x
3. Rappresentare graficamente il dominio di integrazione e calcolare i seguenti integrali doppi: 1 π 1 1 2 sin x dx dy a) b) e−x dx dy x 0 πy 0 y 1 1 √ 1 1 y 3 c) dy dx d) ey dy dx 2 2 √ x 0 x x +y 0 3 9 1 π/2 e) y cos x2 dx dy f) cos x 1 + cos2 x dx dy 0
y2
0
arcsin y
4. Con riferimento alla Figura 8.32, esprimere i domini di integrazione come unione di regioni semplici e calcolare i seguenti integrali doppi: b) a) x2 dx dy xy dx dy A
B
8.6 Esercizi y 1
349
y 1 B1
x = 1 + y2
B2
−1
1 x
1 y = −x2
2
x
B3
−1 Figura 8.32. Rappresentazione grafica degli insiemi A e B relativi all’Esercizio 4.
5. Calcolare l’integrale doppio
y dx dy esteso alla regione piana A definita dalle A
disuguaglianze
R 2 ≤ x2 + y 2 ,
0 ≤ x ≤ 2,
0≤y≤x
al variare del parametro reale R ≥ 0. x dx dy esteso alla regione piana A definita dalle 6. Calcolare l’integrale doppio A
disuguaglianze
R 2 ≥ x2 + y 2 ,
0 ≤ x ≤ 1,
−x ≤ y ≤ 0
al variare del parametro reale R ≥ 0. 7. Calcolare l’integrale doppio
x sin |x2 − y| dx dy A
dove A `e il quadrato unitario [0, 1] × [0, 1]. 8. Calcolare l’integrale doppio
| sin x − y| dx dy A
dove A `e il rettangolo [0, π] × [0, 1]. 9. Calcolare l’integrale doppio
2
ye−α|x−y | dx dy
A
dove A `e il quadrato [0, 1] × [0, 1], al variare del parametro reale α.
350
8 Calcolo integrale per funzioni in pi` u variabili
10. Rappresentare graficamente la regione indicata e successivamente utilizzare cambi di coordinate opportuni per calcolare i seguenti integrali doppi: 1 a) dx dy con A limitata da y = x2 , y = 2x2 , 2 2 A x y e da x = y 2 , x = 3y 2 x5 y 5 dx dy con B nel primo quadrante e limitata da b) 3 3 B x y +1 y = x, y = 3x, xy = 2, xy = 6 c) (3x + 4y 2 ) dx dy con C = {(x, y) ∈ R2 : y ≥ 0, 1 ≤ x2 + y 2 ≤ 4} C xy dx dy con D cerchio con centro nell’origine e raggio 3 d) D 2 2 e−x −y dx dy con E limitata da x = 4 − y 2 e x = 0 e) E y con F = {(x, y) ∈ R2 : 1 ≤ x2 + y 2 ≤ 4, |y| ≤ |x|} arctan dx dy f) x F x dx dy con G = {(x, y) ∈ R2 : y ≥ 0, x + y ≥ 0, g) x2 + y 2 G 3 ≤ x2 + y 2 ≤ 9} h) x dx dy con H = {(x, y) ∈ R2 : x, y ≥ 0, x2 + y 2 ≤ 4, H
x2 + y 2 − 2y ≥ 0} 11. Calcolare, mediante trasformazione a coordinate cartesiane, il seguente integrale doppio espresso in coordinate polari 1 dr dθ 2 cos θ + sin θ/r + 1/r2 A 1 1 π ,r≤ . dove A = (r, θ) : 0 ≤ θ ≤ , r ≤ 2 cos θ sin θ 12. Calcolare, mediante trasformazione a coordinate cartesiane, il seguente integrale doppio espresso in coordinate polari log r(cos θ + sin θ) dr dθ cos θ A π dove A = (r, θ) : 0 ≤ θ ≤ , 1 ≤ r cos θ ≤ 2 . 4
8.6 Esercizi
351
13. Utilizzare le coordinate polari per esprimere la somma di integrali
1
√ 1/ 2
√ 1−x2
√
x
2
xy dy dx +
x
xy dy dx + 1
0
2 √ 2
√ 4−x2
xy dy dx 0
come un unico integrale doppio e calcolarlo. 14. Trovare la massa e il baricentro di una lamina piana triangolare con vertici (0, 0), (1, 0) e (0, 2) se la densit`a vale μ(x, y) = 1 + 3x + y. 15. La densit` a di una lamina semicircolare di raggio a `e proporzionale alla distanza dal centro del cerchio. Trovare il baricentro della lamina. 16. Trovare i momenti di inerzia Ix , Iy , I0 di un disco omogeneo con densit`a costante μ(x, y) = μ, centro nell’origine e raggio a. 17. Sia D un disco circolare dotato di densit`a unitaria, avente centro in C = (a, 0) e raggio a. Verificare la relazione I0 = IC + a2 A dove I0 e IC sono i momenti di inerzia rispetto all’origine e al centro C, rispettivamente e A `e l’area del disco. 18. Calcolare il momento di inerzia rispetto all’origine della lamina piana C definita come C = {(x, y) ∈ R2 : x2 + y 2 ≤ 4, x2 + y 2 − x ≥ 0} sapendo che la densit` a μ(x, y) `e uguale alla distanza di (x, y) dall’origine. 19. Una lamina piana C occupa la parte del disco x2 + y 2 ≤ 1 contenuta nel primo quadrante. Trovarne il baricentro sapendo che la densit` a in ogni punto `e uguale alla sua distanza dall’asse x. 20. Si consideri la lamina piana corrispondente al parallelogramma di vertici (3, 0), (0, 6), (−1, 2), (2, −4). Supponendo che abbia densit` a unitaria, se ne calcoli Iy , il momento di inerzia rispetto all’asse y. 21. Calcolare i seguenti integrali tripli: a) (xy − z 3 ) dx dy dz con A = [−1, 1] × [0, 1] × [0, 2] A 2y dx dy dz con B = {(x, y, z) ∈ R3 : 0 ≤ x ≤ z ≤ 2, b) B √ 0 ≤ y ≤ 4 − z2}
352
8 Calcolo integrale per funzioni in pi` u variabili
xz sin y 5 dx dy dz con C = {(x, y, z) ∈ R3 : 0 ≤ x ≤ y ≤ 1,
c) C
y ≤ z ≤ 2y}
d)
y dx dy dz
con D nel primo ottante, limitata dai
D
piani x + y = 1, y + z = 1
e)
y dx dy dz
con E limitata dal paraboloide y = 4x2 + 4z 2
E
e dal piano y = 4
f)
z dx dy dz
con F nel primo ottante, limitata dal piano
F
y = 3x e dal cilindro y 2 + z 2 = 9 22. Esprimere l’integrale triplo
f (x, y, z) dx dy dz come un integrale iterato in A
almeno tre modi differenti, dove A `e il solido limitato dalle superfici indicate: a) x = 0, x = z, y 2 = 1 − z
b) x2 + y 2 = 9, z = 0, z = 6
23. Si consideri la regione A contenuta nel primo ottante e limitata dai piani x + y − z + 1 = 0 e x + y = a. Si determini il valore del parametro reale a > 0 tale che il volume V (A) = 56 . 24. Calcolare il volume della regione A comune ai cilindri x2 +y 2 ≤ 1 e x2 +z 2 ≤ 1. 25. Calcolare
A
1 dx dy dz 3−z
esteso alla regione A definita dalle disuguaglianze 9z ≤ 1 + y 2 + 9x2 , 0 ≤ z ≤ 9 − (y 2 + 9x2 ) .
26. Si consideri il tetraedro di vertici (1, 0, 0), (0, 2, 0), (0, 0, 3) e (0, 0, 0) e lo si suddivida in due regioni C1 e C2 mediante il piano di equazione x = K. Determinare il parametro reale K in modo che i due solidi abbiano lo stesso volume. 27. Utilizzare cambi di coordinate opportuni per calcolare i seguenti integrali tripli: a) x2 + y 2 dx dy dz A
con A limitata dal cilindro x2 + y 2 = 25 e dai piani z = −1 e z = 2
8.6 Esercizi
353
b)
x dx dy dz B
con B compresa tra i cilindri x2 + z 2 = 1 e x2 + z 2 = 4 e tra i piani y =0 e y =z+2 c) (x + z) dx dy dz C
con C = {(x, y, z) ∈ R3 : 1 ≤ x ≤ 2, x2 + y 2 + z 2 ≤ 4} d) x dx dy dz D
con D contenuta nel primo ottante e limitata dalle sfere x2 + y 2 + z 2 = 1 e x2 + y 2 + z 2 = 4 x2 + y 2 + z 2 dx dy dz e) E
con E limitata dal basso dal cono ϕ =
π 6
e dall’alto dalla sfera r = 2
28. Calcolare i seguenti integrali tripli, utilizzando opportuni cambiamenti di variabile: 1 √1−z 2 2−x2 −z 2 a) (x2 + z 2 )3/2 dy dx dz √
−1
− 1−z 2
x2 +z 2
√ 2 √ 3 9−y 18−x2 −y 2
b) 0
0
√
(x2 + y 2 + z 2 ) dz dx dy
x2 +y 2
29. Calcolare l’integrale triplo Ω
4x2 +
16 2 y + z 2 dx dy dz 9
dove Ω `e il solido delimitato dall’ellissoide
y2 z2 x2 + + = 1. 4 9 16
30. Calcolare la massa e le coordinate del baricentro del solido Ω costituito dalla parte del cilindro x2 + y 2 ≤ 1 contenuta nel primo ottante e limitata dal piano z = 1, avente densit` a di massa μ(x, y, z) = x + y. 31. Calcolare il volume del solido Ω ottenuto ruotando attorno all’asse z la sezione meridiana T sul piano yz definita come T = {(y, z) ∈ R2 : 2 ≤ y ≤ 3, 0 ≤ z ≤ y, y 2 − z 2 ≤ 4} . 32. Calcolare il volume del solido Ω ottenuto ruotando attorno all’asse y la sezione meridiana T sul piano xy delimitata dalle curve y = x2 , y = 4, x = 0 con la condizione 0 ≤ x ≤ 2.
354
8 Calcolo integrale per funzioni in pi` u variabili
33. Calcolare il volume e le coordinate del baricentro del solido Ω ottenuto ruotando attorno all’asse z la sezione meridiana nel piano xz definita come T = {(x, z) ∈ R2 : sin z < x < π − z, 0 < z < π} .
8.6.1 Soluzioni 1. Calcolo di integrali doppi: a) La regione A `e un quadrato. L’integrale vale 1 3 1 I = 7 log 2 − 3 log 5 − 2 arctan 2 − 4 arctan + π . 2 2 2 b) La regione B `e rappresentata in Figura 8.33, a sinistra. L’integrale vale I = 58 . c) La regione C `e rappresentata in Figura 8.33, a destra. L’integrale vale I =
39 35 .
d) La regione D `e rappresentata in Figura 8.34, a sinistra. L’integrale vale I = 4 3/2 − 32 9e 45 . e) La regione E `e rappresentata in Figura 8.34, a destra. Le rette passanti per i vertici del triangolo hanno equazione rispettivamente y = 2, y = 12 (x + 1) e ` conveniente integrare per orizzontali con le limitazioni 1 ≤ y ≤ 2 y = −x+2. E e 2 − y ≤ x ≤ 2y − 1. Si ottiene
2 2y−1 147 . y 3 dx dy = y 3 dx dy = 20 E 1 2−y
y
y y = 2x3 y =1+x
1
√ y=2 x
2
y = x2
1
x
1
x
Figura 8.33. Rappresentazione grafica dell’insieme B relativo all’Esercizio 1 b) (a sinistra) e dell’insieme C relativo all’Esercizio 1 c) (a destra)
8.6 Esercizi y
355
y 2 y=x
x = ey
y =2−x
1
y=
1 2 (x
+ 1)
1
x
1
1
3
x
Figura 8.34. Rappresentazione grafica dell’insieme D relativo all’Esercizio 1 d) (a sinistra) e dell’insieme E relativo all’Esercizio 1 e) (a destra)
` conveniente integrare f) La regione F `e rappresentata in Figura 8.35, a sinistra. E per orizzontali con le limitazioni 0 ≤ y ≤ 1 e 0 ≤ x ≤ y. Si ottiene
1 y 1 2 2 2 y ey dx dy = ey dx dy = ey [x]0 dy 0
F
0
1
2
0
yey dy =
= 0
1 y2 e 2
1 = 0
1 (e − 1) . 2
` conveniente integrare g) La regione G `e rappresentata in Figura 8.35, a destra. E 2 per verticali con le limitazioni 0 ≤ x ≤ 1 e 0 ≤ y ≤ x . Si ottiene 2 1
x cos y dy 0
G
1
x
x cos y dx dy = 0
dx = 0
y
x2
x [sin y]0 dx
y
1
y = x2
y=x
1
x
1
x
Figura 8.35. Rappresentazione grafica dell’insieme F relativo all’Esercizio 1 f) (a sinistra) dell’insieme G relativo all’Esercizio 1 g) (a destra)
356
8 Calcolo integrale per funzioni in pi` u variabili y 4 y = 2x
y =6−x
2
6
x
Figura 8.36. Rappresentazione grafica dell’insieme H relativo all’Esercizio 1 h)
1
1 x sin x dx = − cos x2 2
1
2
= 0
= 0
1 (1 − cos 1) . 2
h) La regione H `e rappresentata in Figura 8.36. Le rette passanti per i vertici ` del triangolo hanno equazione rispettivamente y = 0, y = −x + 6 e y = 2x. E conveniente integrare per orizzontali con le limitazioni 0 ≤ y ≤ 4 e y/2 ≤ x ≤ 6 − y. Si ottiene, integrando per parti, 4
6−y
yex dx dy =
yex dx 0
H
dy = e6 − 9e2 − 4 .
y/2
2. Scambio ordine di integrazione di integrali doppi: a) Il dominio di integrazione A `e rappresentato in Figura 8.37, a sinistra. Scambiando l’ordine di integrazione si ottiene 1 x 1 1 f (x, y) dy dx = f (x, y) dx dy . 0
0
0
y
y
1
1 y=x
y
y = sin x
1
x
π 2
x
Figura 8.37. Rappresentazione grafica dell’insieme A relativo all’Esercizio 2 a) (a sinistra) e dell’insieme B relativo all’Esercizio 2 b) (a destra)
8.6 Esercizi y
357
y 1 √ x
log 2
y =2−x
y = log x
1
2
x
1
2
x
Figura 8.38. Rappresentazione grafica dell’insieme C relativo all’Esercizio 2 c) (a sinistra) e dell’insieme D relativo all’Esercizio 2 d) (a destra)
b) Il dominio di integrazione B `e rappresentato in Figura 8.37, a destra. Scambiando l’ordine di integrazione si ottiene
π/2
sin x
1
π/2
f (x, y) dy dx = 0
f (x, y) dx dy .
0
0
arcsin y
c) Il dominio di integrazione C `e rappresentato in Figura 8.38, a sinistra. Scambiando l’ordine di integrazione si ottiene
2
log x
log 2
2
f (x, y) dy dx = 1
f (x, y) dx dy .
0
ey
0
d) Il dominio di integrazione D `e rappresentato in Figura 8.38, a destra. Per passare all’integrazione per verticali, `e necessario suddividere l’insieme D in due parti, ottenendo
1
2−y
1
f (x, y) dx dy = 0
y2
√ x
2
2−x
f (x, y) dy dx + 0
0
f (x, y) dy dx . 1
0
e) Il dominio di integrazione E `e rappresentato in Figura 8.39, a sinistra. Scambiando l’ordine di integrazione si ottiene 4 2 2 2x f (x, y) dx dy = f (x, y) dy dx . 0
0
y/2
0
f) Il dominio di integrazione F `e rappresentato in Figura 8.39, a destra. Scambiando l’ordine di integrazione si ottiene
1
π/4
π/4
f (x, y) dy dx = 0
arctan x
tan y
f (x, y) dx dy . 0
0
3. Calcolo di integrali doppi: a) Il dominio di integrazione `e l’insieme sia verticalmente sia orizzontalmente convesso A che si pu` o esprimere come
358
8 Calcolo integrale per funzioni in pi` u variabili y
y
4 π 4
y = 2x
y = arctan x
2
x
1 x
Figura 8.39. Rappresentazione grafica dell’insieme E relativo all’Esercizio 2 e) (a sinistra) e dell’insieme F relativo all’Esercizio 2 f) (a destra)
A = {(x, y) ∈ R2 : 0 ≤ y ≤ 1, πy ≤ x ≤ π} = {(x, y) ∈ R2 : 0 ≤ x ≤ π, 0 ≤ y ≤
x }. π
Esso `e rappresentato in Figura 8.40, a sinistra. Vista la forma della funzione integranda, non integrabile elementarmente rispetto alla variabile x, `e necessario cambiare l’ordine di integrazione. Pertanto π x/π π 1 π sin x sin x sin x x/π dx dy = dy dx = [y]0 dx x x x 0 πy 0 0 0 1 π 2 = sin x dx = . π 0 π b) Il dominio di integrazione `e l’insieme sia verticalmente sia orizzontalmente convesso B che si pu` o esprimere come B = {(x, y) ∈ R2 : 0 ≤ y ≤ 1, y ≤ x ≤ 1} = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, 0 ≤ y ≤ x} . y
y
1
1 y=
x π
y=
π
x
√
x
1
x
Figura 8.40. Rappresentazione grafica dell’insieme A relativo all’Esercizio 3 a) (a sinistra) dell’insieme D relativo all’Esercizio 3 d) (a destra)
8.6 Esercizi
359
Esso coincide con l’insieme A relativo all’Esercizio 2.a) ed `e rappresentato in Figura 8.37, a sinistra. Come nell’esercizio precedente, vista la forma della funzione integranda, non integrabile elementarmente rispetto alla variabile x, `e necessario cambiare l’ordine di integrazione. Pertanto
1 1 1 x 1 2 1 −x2 −x2 e dx dy = e dy dx = xe−x dx = (1 − e−1 ) . 2 0 y 0 0 0 c) Il dominio di integrazione `e l’insieme sia verticalmente sia orizzontalmente convesso C che si pu` o esprimere come C = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, x ≤ y ≤ 1} = {(x, y) ∈ R2 : 0 ≤ y ≤ 1, 0 ≤ x ≤ y} . Esso coincide con l’insieme F relativo all’Esercizio 1.f) ed `e rappresentato in Figura 8.35, a sinistra. Come negli esercizi precedenti, vista la forma della funzione integranda, non integrabile elementarmente rispetto alla variabile y, `e necessario cambiare l’ordine di integrazione. Pertanto
1 1 √ 1 y √ y y dy dx = dx dy 2 2 2 2 0 x x +y 0 0 x +y y 1 x π π 1 1 √ 1 y arctan dy = = √ dy = . y y 4 y 2 0 0 0 d) Il dominio di integrazione `e l’insieme D rappresentato in Figura 8.40, a destra. L’integrale vale I = (e − 1)/3. e) Il dominio di integrazione `e l’insieme E rappresentato in Figura 8.41. L’integrale vale I = 14 sin 81. f) Il dominio di integrazione `e l’insieme sia verticalmente sia orizzontalmente convesso F che si pu` o esprimere come π F = {(x, y) ∈ R2 : 0 ≤ y ≤ 1, arcsin y ≤ x ≤ } 2 π = {(x, y) ∈ R2 : 0 ≤ x ≤ , 0 ≤ y ≤ sin x} . 2 y 3 y=
√
x
9
x
Figura 8.41. Rappresentazione grafica dell’insieme E relativo all’Esercizio 1 e)
360
8 Calcolo integrale per funzioni in pi` u variabili
Esso coincide con l’insieme B relativo all’Esercizio 2.b) ed `e rappresentato in Figura 8.37, a destra. Come negli esercizi precedenti, vista la forma della funzione integranda, non integrabile elementarmente rispetto alla variabile x, `e necessario cambiare l’ordine di integrazione. Pertanto 1 π/2 π/2 sin x 2 2 cos x 1 + cos x dx dy = cos x 1 + cos x dy dx 0
arcsin y
0
π/2 0
0
√ 1 2√ 2 2−1 . sin x cos x 1 + cos2 x dx = t dt = 2 1 3
4. Calcolo di integrali doppi: a) L’integrale vale 1. b) Facendo riferimento alla Figura 8.32, suddividiamo l’insieme B nell’unione di 3 sottoinsiemi: B1 = {(x, y) ∈ R2 : −1 ≤ x ≤ 0, −x2 ≤ y ≤ 1} B2 = {(x, y) ∈ R2 : 0 ≤ y ≤ 1, 0 ≤ x ≤ 1 + y 2 } √ B3 = {(x, y) ∈ R2 : −1 ≤ y ≤ 0, −y ≤ x ≤ 1 + y 2 } . Allora, svolgendo i calcoli, si ottiene xy dx dy = xy dx dy + xy dx dy + B
B1
0
B2
1
=
1
−x2
1+y 2
xy dy dx + −1
xy dx dy B3 0
xy dx dy + 0
−1
0
1+y 2 √ −y
xy dx dy
= 0. 2 2 2 5. Osserviamo che, per 0 ≤ x ≤ 2, la circonferenza R Rx + y = R e leR rette y = x si intersecano nel punto di coordinate P = √2 , √2 . Pertanto se √2 > 2, ossia √ R > 2 2, la regione A `e vuota√e dunque l’integrale vale 0. ` Consideriamo √ 0 ≤ R ≤ 2 2. E necessario distinguere due casi: 0 ≤ R ≤ 2 e 2 < R ≤ 2 2. Si veda la Figura 8.42 per la rappresentazione grafica della regione A. Sia 0 ≤ R ≤ 2; facendo ancora riferimento alla Figura 8.42 possiamo scrivere y dx dy = y dx dy + y dx dy A
A1
=
=
R
√ R/ 2
1 2
A2 x
√
2
x
y dy dx
R2 −x2
R
√ R/ 2
y dy dx +
(2x2 − R2 ) dx +
0
R
1 2
2
x2 dx = R
4 1 3 √ + R ( 2 − 2) . 3 6
8.6 Esercizi y
361
y A
A1 A2
R √ 2
R
2
R √ 2
x
2
R
x
√ 2≤R≤2 2
0≤R≤2
Figura 8.42. Rappresentazione grafica dell’insieme A relativo all’Esercizio 5
√ Sia ora 2 < R ≤ 2 2; risulta 2 x y dx dy = √ √ R/ 2
A
=
1 2
y dy dx
R2 −x2
2
√ (2x R/ 2
2
− R2 ) dx =
8 1 − R2 + √ R3 . 3 3 2
6. Risulta ⎧√ 2 3 ⎪ ⎪ ⎪ R ⎪ ⎪ 6 ⎪ ⎨√ 2 3 1 2 x dx dy = R − (R − 1)3/2 ⎪ A ⎪ 6 3 ⎪ ⎪ ⎪ ⎪ ⎩1 3
se 0 ≤ R < 1 , se 1 ≤ R < se R ≥
√
2,
√ 2.
7. Osserviamo che la funzione integranda cambia segno a seconda che (x, y) ∈ A si trovi al di sopra oppure al di sotto del grafico della parabola y = x2 (si veda la Figura 8.43). Precisamente, per (x, y) ∈ A, si ha
se y ≤ x2 , x sin(x2 − y) x sin |x2 − y| = 2 −x sin(x − y) se y > x2 . Pertanto, facendo ancora riferimento alla Figura 8.43, si ha 2 2 x sin |x − y| dx dy = x sin(x − y) dx dy − x sin(x2 − y) dx dy A
A1
1
x
A2 1
2
x sin(x2 − y) dy dx −
= 0
0
0
1
x2
x sin(x2 − y) dy dx
362
8 Calcolo integrale per funzioni in pi` u variabili y
y = x2 1
A2 A1
1
x
Figura 8.43. Rappresentazione grafica dell’insieme A relativo all’Esercizio 7
1
=
0
x2 x cos(x2 − y) 0 dx −
1
x(1 − cos x2 ) dx −
= 0
1
1 0
1 x cos(x2 − y) x2 dx
x cos(x2 − 1) − 1 dx = 1 − sin 1 .
0
8. Risulta I = π − 2. 9. Risulta
⎧ 1 −α ⎪ ⎪ ⎨ 2 (e − 1 + α) 2 α ye−α|x−y | dx dy = ⎪ 1 A ⎪ ⎩ 2
se α = 0 , se α = 0 .
10. Calcolo di integrali doppi: a) La regione A, limitata da 4 parabole, `e rappresentata in Figura 8.44, a sinistra. x y Poniamo u = 2 , v = 2 , che definiscono la trasformazione (u, v) = Ψ(x, y); x y con tale cambio di variabili, la regione A si trasforma nel rettangolo A = [1, 2] × [1, 3]. Inoltre la matrice jacobiana della trasformazione Ψ vale
−2y/x3 1/x2 J Ψ(x, y) = 1/y 2 −2x/y 3 con det J Ψ(x, y) =
4 1 3 − 2 2 = 2 2 = 3u2 v 2 ; x2 y 2 x y x y
dunque, posto Φ = Ψ−1 , si ha det J Φ(u, v) =
1 3u2 v 2 .
Cos`ı
8.6 Esercizi y
y
363
y = 3x
2
y=x y = 2x2
A
x = y2
y=x
x = 3y 2
B
xy = 6
xy = 2 x
x
Figura 8.44. Rappresentazione grafica dell’insieme A relativo all’Esercizio 10 a) (a sinistra) e dell’insieme B relativo all’Esercizio 10 b) (a destra)
1 dx dy = x2 y 2
A
2
3
u2 v 2 1
1
1 2 dv du = . 3u2 v 2 3
b) La regione B, limitata da 2 rette e 2 iperboli, `e rappresentata in Figura 8.44, a destra. y Definiamo la trasformazione (u, v) = Ψ(x, y) ponendo u = xy, v = . La x regione B nel piano xy si trasforma nel rettangolo B = [2, 6] × [1, 3]. Inoltre, si ha
y x y J Ψ(x, y) = , det J Ψ(x, y) = 2 = 2v , 2 x −y/x 1/x da cui, posto Φ = Ψ−1 , si ha det J Φ(u, v) = 1/2v. Pertanto
3 6 5 3 6 2 x5 y 5 u 1 1 u2 dx dy = du dv = log v du u − 3 3 3 1 2 u3 + 1 1 2 u + 1 2v 2 B x y +1 6 1 3 1 9 1 1 3 . = log 3 u − log(u + 1) = log 3 208 + log 2 3 3 6 217 2 c) La regione C `e rappresentata in Figura 8.45, a sinistra. Passando a coordinate polari (r, θ), la regione C si trasforma nel rettangolo C = [1, 2] × [0, π] e quindi π 2 (3x + 4y 2 ) dx dy = (3r cos θ + 4r2 sin2 θ)r dr dθ C
0 π
= 0
=
0
π
1
r3 cos θ + r4 sin2 θ
2 1
π
dθ = 0
7 cos θ + 15 sin2 θ dθ
15 15 π. 7 cos θ + (1 − cos 2θ) dθ = 2 2
364
8 Calcolo integrale per funzioni in pi` u variabili y
y
D
C
1
2
3
x
x
Figura 8.45. Rappresentazione grafica dell’insieme C relativo all’Esercizio 10 c) (a sinistra) e dell’insieme D relativo all’Esercizio 10 d) (a destra)
d) La regione D `e rappresentata in Figura 8.45, a destra. L’integrale vale I = 0 . e) La regione E `e rappresentata in Figura 8.46, a sinistra. L’integrale vale I = π −4 ). 2 (1 − e f) La regione F `e rappresentata in Figura 8.46, a destra. L’integrale vale I = 0. g) La regione G `e rappresentata in Figura 8.47, a sinistra. L’integrale vale I = √ 3 2 2 . h) La regione H `e contenuta nel primo quadrante e consiste dei punti interni al cerchio di centro l’origine e raggio 2 ed esterni al cerchio di centro (0, 1) e raggio 1 (si veda la Figura 8.47, a destra). Passando a coordinate polari, H si trasforma nella regione H del piano (r, θ) caratterizzata dalle condizioni 0 ≤ θ ≤ π2 e 2 sin θ ≤ r ≤ 2, in quanto la circonferenza x2 + y 2 − 2y ≥ 0 si descrive in coordinate polari come r − 2 sin θ ≥ 0. Pertanto si ha y
y
E
F 1
x
1
2
x
Figura 8.46. Rappresentazione grafica dell’insieme E relativo all’Esercizio 10 e) (a sinistra) e dell’insieme F relativo all’Esercizio 10 f) (a destra)
8.6 Esercizi y
365
y
G 1 H √
3
3 x
2
x
Figura 8.47. Rappresentazione grafica dell’insieme G relativo all’Esercizio 10 g) (a sinistra) e dell’insieme H relativo all’Esercizio 10 h) (a destra)
π/2
2
r2 cos θ dr dθ =
x dx dy = 0
H
=
8 3
2 sin θ
1 3
π/2 0
π/2
(cos θ − cos θ sin3 θ) dθ = 0
2 cos θ r3 2 sin θ dθ
π/2 1 8 sin θ − sin4 θ = 2. 3 4 0
11. Passando a coordinate cartesiane, la condizione 0 ≤ θ ≤ π2 , si traduce nel considerare soltanto punti del primo quadrante; mentre le curve r = cos1 θ e r = sin1 θ corrispondono alle rette x = 1 e y = 1. In definitiva, nel piano (x, y), la regione A si trasforma nel quadrato A = [0, 1] × [0, 1]. Pertanto 1 1 √ r dr dθ dr dθ = 2 2 2 2 r cos θ + r sin θ + 1 cos θ + sin θ/r + 1/r A A 1 1 1 1 = dx dy = dx dy 2+y+1 2+y+1 x x 0 0 A 1 1 1 =2 x2 + y + 1 dx = 2 x2 + 2 − x2 + 1 dx 0
0
0
&1 % √ √ 2+1 x 1 x x x2 + 2 + log(x + x2 + 2) − − log(x + x2 + 1) =2 2 2 2 =
√
√ √ 2+ 3 √ . 3 − 2 + log 1+ 2
12. I = 4 log 2 − 2.
0
√ √ 13. Osserviamo che x ∈ √12 , 2 e che le curve y = 1 − x2 e y = 4 − x2 rappresentano due semicirconferenze centrate nell’origine e di raggio rispettivamente 1 e 2. La regione cercata A nel piano (x, y) `e formata da tre sottoinsiemi A1 , A2 , A3 cos`ı definiti: 1 A1 = {(x, y) ∈ R2 : √ ≤ x ≤ 1, 1 − x2 ≤ y ≤ x} 2
366
8 Calcolo integrale per funzioni in pi` u variabili y
A1 A2
A3
1
2
x
Figura 8.48. Rappresentazione grafica dell’insieme A relativo all’Esercizio 13
√ A2 = {(x, y) ∈ R2 : 1 ≤ x ≤ 2, 0 ≤ y ≤ x} √ A3 = {(x, y) ∈ R2 : 2 ≤ x ≤ 2, 0 ≤ y ≤ 4 − x2 } ; essa `e rappresentata in Figura 8.48. In coordinate polari A si trasforma in A = {(r, θ) : 0 ≤ θ ≤ dunque
π/4
2
3
I=
π 4,
r3 sin θ cos θ dr dθ =
r sin θ cos θ dr dθ = A
0
1
1 ≤ r ≤ 2} e 15 . 16
14. La lamina `e rappresentata in Figura 8.49, a sinistra, e si esprime come A = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, 0 ≤ y ≤ 2 − 2x} . Pertanto y
y 2
x2 + y 2 = a2 y = 2 − 2x
1
x
−a
a x
Figura 8.49. Rappresentazione grafica dell’insieme A relativo all’Esercizio 14 (a sinistra) e dell’insieme A relativo all’Esercizio 15 (a destra)
8.6 Esercizi
m(A) =
1
2−2x
μ(x, y) dx dy =
(1 + 3x + y) dy dx = 0
A
0
367
8 ; 3
mentre xB (A) = yB (A) =
1 m(A) 1 m(A)
xμ(x, y) dx dy = A
yμ(x, y) dx dy = A
3 8 3 8
1
0
1
0
2−2x
x(1 + 3x + y) dy dx =
3 8
y(1 + 3x + y) dy dx =
11 16
0 2−2x
0
e dunque il baricentro ha coordinate ( 38 , 11 16 ). 15. Rappresentiamo la lamina A come il semicerchio superiore del cerchio di equazione x2 + y 2 = a2 (si veda la Figura 8.49, a destra). (l’origine) `e Allora la distanza di un punto (x, y) dal centro del cerchio x2 + y 2 . Pertanto, la densit` a si esprime come μ(x, y) = K x2 + y 2 , con K costante fissata > 0. Passando a coordinate polari, risulta π a Kπa3 m(A) = . μ(x, y) dx dy = Kr2 dr dθ = 3 0 0 A Poich´e la lamina e la densit`a sono simmetrici rispetto all’asse y, il baricentro cadr` a su tale asse, ossia xB (A) = 0. Calcoliamo la seconda coordinata: π a 1 3 3a . yB (A) = yμ(x, y) dx dy = Kr3 sin θ dr dθ = m(A) A Kπa3 0 0 2π 3a In conclusione il baricentro ha coordinate (0, 2π ).
16. Passando a coordinate polari si ha 2 2 (x + y )μ dx dy = μ I0 =
2π
r3 dr dθ = 0
D
a
0
π 4 μa . 2
Per simmetria, Ix = Iy ; inoltre dalla relazione I0 = Ix + Iy , si ricava immediatamente π Ix = Iy = μa4 . 4 17. Rappresentiamo in Figura 8.50 il disco D e passiamo a coordinate polari osservando che l’equazione della frontiera del disco (x − a)2 + y 2 = a2 diventa r = 2a cos θ. Cos`ı π/2 2a cos θ 2 2 I0 = (x + y ) dx dy = r3 dr dθ D
−π/2
π/2
0
a4 cos4 θ dθ = 8a4
=4 −π/2
π/2
cos4 θ dθ = 0
3 4 πa 2
368
8 Calcolo integrale per funzioni in pi` u variabili y
1
x
2
Figura 8.50. Rappresentazione grafica del disco D relativo all’Esercizio 17
[(x − a)2 + y 2 ] dx dy =
IC = D
2π
a
1 4 πa . 2
r3 dr dθ =
= 0
(t2 + y 2 ) dt dy D
0
Poich´e A = πa , `e immediato verificare la relazione I0 = IC + a2 A. 2
18. I0 =
64 5 π
−
16 75 .
19. Risulta μ(x, y) = y e pertanto m(A) = y dx dy =
π/2
r2 sin θ dr dθ = 0
C
0
xB (A) = 3
1
π/2
1
r3 sin θ cos θ dr dθ =
xy dx dy = 3 0
C
0
π/2
1
r3 sin2 θ dr dθ =
y 2 dx dy = 3
yB (A) = 3
1 3
0
C
0
3 π. 16
20. Iy = 33. 21. Calcolo di integrali tripli: a) I = −8.
b) I = 4.
c) I =
3 20 (1
− cos 1).
d) Risulta
1
y dx dy dz = 0
D
1−y
y 0
dz 0
1
y(1 − y)2 dy =
= 0
Si veda la Figura 8.51, a sinistra.
1−y
dx 1 . 12
3 8
dy
8.6 Esercizi
369
z 1
z Ey × {y}
x
1
y
y
1 x
Figura 8.51. Regioni relative agli Esercizi 21 d) (a sinistra) e 21 e) (a destra)
e) Risulta
4
y dx dy dz =
dx dz 0
E
y dy
Ey
3
dove Ey = {(x, z) ∈ R2 : x2 + z 2 = y4 }. L’integrale l’area di Ey e pertanto vale π y4 . In definitiva
π y dx dy dz = 4 E
4
y 2 dy = 0
Si veda la Figura 8.51, a destra. f) Risulta 1 √ 3
3
z dx dy dz = 0
F
9−z 2
dx dz rappresenta
Ey
16 π. 3
√ 9−z 2
dx
dy z dz =
0
0
27 . 4
Si veda la Figura 8.52, a sinistra. 22. Integrali tripli: a) Risulta
1
1−y 2
z
1
f (x, y, z) dx dz dy =
I= −1
1
0
1
= 0
x 1
0
√
√ − 1−z
=
1 0
0
x
z 0
1
f (x, y, z) dz dx dy = −1
f (x, y, z) dy dz dx =
1−y 2 1−y 2
√ − 1−z
0
1−z
√ 1−z
0
z
f (x, y, z) dx dy dz 0
√ 1−z
√ − 1−z √ 1−x
√ − 1−x
f (x, y, z) dy dx dz
1−y 2
f (x, y, z) dz dy dx . x
370
8 Calcolo integrale per funzioni in pi` u variabili z z
x x
y
1 3
y
a
D
a
Figura 8.52. Regioni relative all’Esercizio 21 f) (a sinistra) e all’Esercizio 23 (a destra)
b) Risulta
3
6
√9−y2
I= −3
3
−
0
6
= −3
3
√
−
6
3
f (x, y, z) dy dz dx = −3
0
6
3
f (x, y, z) dz dx dy = 9−y 2
3
√9−y2
−3
0
−
−3
0
9−x2
√9−y2 √
6
f (x, y, z) dx dz dy =
9−y 2
√ − 9−x2
0
= −3
√
√
f (x, y, z) dx dy dz
9−y 2
√ 9−x2
√ − 9−x2
√ 9−x2 √ − 9−x2
f (x, y, z) dy dx dz
6
f (x, y, z) dz dy dx . 0
23. Integriamo per fili rispetto all’asse z con 0 ≤ z ≤ x + y + 1 ottenendo x+y+1 V (A) = dz dx dy D
0
con D = {(x, y) ∈ R2 : 0 ≤ x ≤ a, 0 ≤ y ≤ a − x}, si veda la Figura 8.52, a destra. Pertanto, svolgendo i calcoli, a a−x 1 1 V (A) = (x + y + 1) dy dx = a2 + a3 . 2 3 0 0 Imponendo la condizione V (A) = 56 , si ottiene 1 2 1 3 5 a + a = 2 3 6
ossia
(a − 1)(2a2 + 5a + 5) = 0 .
In definitiva, si deve avere a = 1. 24. Per simmetria, `e sufficiente calcolare il volume della regione contenuta nel primo ottante e moltiplicare il risultato per 8. Integrando per strati si ha
8.6 Esercizi
371
z
y
x
Figura 8.53. Regione relativa all’Esercizio 24
1
√ 1−x2
V (A) = 8
√ 1−x2
dz dx dy = 0
0
0
16 . 3
Si veda la Figura 8.53. 25. La superficie 9z = 1 + y 2 + 9x2 rappresenta un paraboloide, mentre z = 9 − (y 2 + 9x2 ) `e un ellissoide centrato nell’origine con semiassi rispettivamente a = 1, b = 3 e c = 3. Integriamo per strati e scriviamo
1 1 1 dx dy dz = dx dy dz . 0 3−z A 3−z Az Per calcolare l’integrale interno, distinguiamo due casi: 0 ≤ z ≤ 19 e 19 ≤ z ≤ 1. √ Nella prima situazione Az `e un ellisse nel piano (x, y) con semiassi a = 13 9 − z 2 √ e b = 9 − z 2 (si veda la Figura 8.54, a sinistra); l’integrale cercato rappresenta l’area di Az e pertanto vale πab = π3 (9 − z 2 ). Per 19 ≤ z ≤ 1, Az `e la regione compresa tra i due ellissi di equazione 9x2 + y 2 = 9z − 1 e 9x2 + y 2 = 9 − z 2 (si veda la Figura 8.54, a destra) con semiassi rispettivamente uguali a √ √ √ 9z − 1 9 − z2 a1 = , b1 = 9z − 1 , , b2 = 9 − z 2 . a2 = 3 3 z
z Az × {z} Az × {z} x
y
x
Figura 8.54. Regioni relative all’Esercizio 25
y
372
8 Calcolo integrale per funzioni in pi` u variabili
Dunque
π π (9 − z 2 ) − (9z − 1) . 3 3
dx dy = πa2 b2 − πa1 b1 = Az
Ritornando all’integrale proposto, si ha
1 π 1/9 9 − z 2 π 1 9 − z2 9z − 1 dz dx dy dz = dz + − 3 0 3−z 3 1/9 3 − z 3−z A 3−z =
=
π 3
1
(3 + z) dz + 0
π 3
1
9+ 1/9
26 z−3
dz
26 9 23 π + π log . 6 3 13
26. Il volume di entrambi i solidi si pu` o esprimere tramite un integrale che calcoliamo per strati rispetto all’asse x ottenendo
K 1 V (C1 ) = dy dz dx = dy dz dx = V (C2 ) . 0
K
Ax
Ax
L’insieme Ax , contenuto nel piano (y, z), `e dato da 3 Ax = (y, z) ∈ R2 : 0 ≤ y ≤ 2(1 − x), 0 ≤ z ≤ 3 − 3x − y ; 2 l’insieme Ax × {x} `e rappresentato in Figura 8.55. Deve dunque valere z
3
Ax × {x} 1 x
2 y
Figura 8.55. Regione relativa all’Esercizio 26
8.6 Esercizi
373
z
y
x
Figura 8.56. Regione relativa all’Esercizio 27 b)
K
0
2(1−x)
0
3−3x− 32 y
1
2(1−x)
3−3x− 32 y
dz dy dx =
0
0
K
dz dy dx
0
ossia, svolgendo i calcoli, 1 − (1 − K)3 = (1 − K)3 √ da cui si ricava k = 1 − 1/ 3 2. 27. Integrali tripli: a) Passando alle coordinate cilindriche, la regione A si trasforma in A = {(r, θ, t) : 0 ≤ r ≤ 5, 0 ≤ θ ≤ 2π, −1 ≤ t ≤ 2} . Pertanto, si ha x2 + y 2 dx dy dz =
2
2π
5
r2 dr dθ dt = 250π . −1
A
0
0
b) Utilizziamo le coordinate cilindriche rispetto all’asse y, ossia x = r cos θ, y = t, z = r sin θ. Allora si ha (si veda la Figura 8.56) B = {(x, y, z) ∈ R3 : 1 ≤ x2 + z 2 ≤ 4, 0 ≤ y ≤ z + 2} , che si trasforma in B = {(r, θ, t) : 1 ≤ r ≤ 2, 0 ≤ θ ≤ 2π, 0 ≤ t ≤ r sin θ + 2} ; pertanto
2π
2
r sin θ+2
r2 cos θ dt dr dθ
x dx dy dz = B
0 2π
1 2
r2 cos θ(r sin θ + 2) dr dθ
= 0
=
0
1 4
1
r4
2 1 1
2
sin2 θ
2π + 0
2 3
r3
2
2π sin θ
1
= 0. 0
374
8 Calcolo integrale per funzioni in pi` u variabili
c) 94 π. d) La regione D si trasforma in coordinate sferiche in D = {(r, ϕ, θ) : 1 ≤ r ≤ 2, 0 ≤ ϕ, θ ≤ Pertanto
2
π/2
π/2
r3 sin2 ϕ cos θ dθ dϕ dr
x dx dy dz = 1
D
0
0
2
r dr 0
1 15 ·1· = 4 2
π/2
π/2 2
cos θ dθ
1
e) 4(2 −
π/2
3
=
√
π }. 2
sin ϕ dϕ 0
0
15 π. 1 − cos 2ϕ dϕ = 16
3)π.
28. Integrali tripli: a) In coordinate cartesiane il solido Ω su cui integrare `e definito dalle disequazioni − 1 − z 2 ≤ x ≤ 1 − z 2 , x2 + z 2 ≤ y ≤ 2 − x2 − z 2 , −1 ≤ z ≤ 1 . La prima e l’ultima condizione individuano l’interno del cilindro x2 + z 2 = 1. ` dunque conveniente utilizzare coordinate cilindriche rispetto all’asse y: E x = r cos θ ,
y = t,
z = r sin θ .
Dunque Ω si trasforma in Ω = {(r, θ, t) : 0 ≤ r ≤ 1, 0 ≤ θ ≤ 2π, r2 ≤ t ≤ 2 − r2 } e pertanto l’integrale vale (x2 + z 2 )3/2 dx dy dz = Ω
b)
√ 2 − 1)π.
0
1
2π
2−r2
r4 dt dθ dr = 0
r2
8 π. 35
486 5 (
29. Utilizziamo le coordinate sferiche generalizzate x = 2r sin ϕ cos θ ,
y = 3r sin ϕ sin θ ,
z = 4r cos ϕ
con dx dy dz = 24r2 sin ϕ dr dϕ dθ; la regione Ω `e allora descritta dalle disequazioni 0 ≤ r ≤ 1 , 0 ≤ θ ≤ 2π , 0 ≤ ϕ ≤ π . Pertanto, si ha 1 2π π 16 1536 π. 4x2 + y 2 + z 2 dx dy dz = 16 · 24 r4 sin ϕ dϕ dθ dr = 9 5 0 0 0 Ω
8.6 Esercizi
375
30. Calcoliamo dapprima la massa, utilizzando le coordinate cilindriche. Poich´e Ω si trasforma in π , 0 ≤ t ≤ 1} , 2
Ω = {(r, θ, t) : 0 ≤ r ≤ 1, 0 ≤ θ ≤ si ha
m=
1
1
π/2
r2 (cos θ + sin θ) dθ dr dt =
(x + y) dx dy dz = 0
Ω
0
0
2 . 3
Osserviamo che, per simmetria, xG = yG ; analogamente a quanto fatto per calcolare la massa, si ottiene xG = =
3 2 3 8
x(x + y) dx dy dz = Ω
3 2
1
1
π/2
r3 cos θ(cos θ + sin θ) dθ dr dt 0
0
0
π/2
(cos2 θ + cos θ sin θ) dθ dr dt = 0
π/2 1 3 θ + sin 2θ + sin2 θ 16 2 0
π 3 1+ = yG , = 16 2 3 3 1 1 π/2 2 1 z(x + y) dx dy dz = t r (cos θ + sin θ) dθ dr dt = . zG = 2 Ω 2 0 0 0 2 31. La sezione meridiana T `e mostrata in Figura 8.57. Applichiamo il Teorema 8.32 per ottenere vol(Ω) = 2π
y dy dz . T
Integrando per verticali, si ha 3
vol(Ω) = 2π 2
= 2π
y
√
y dz
dy = 2π
y 2 −4
3
y2 − y
y 2 − 4 dy
2
1
1 y 3 − (y 2 − 4)3/2 3 3
3 = 2
√ 2 (19 − 5 5)π . 3
32. 8π. 33. La sezione meridiana T `e rappresentata in Figura 8.58, a sinistra. Calcoliamo dapprima il volume, utilizzando il Teorema 8.32: π π−z π vol(Ω) = 2π (π − z)2 − sin2 z dz x dx dz = 2π x dx dz = π
T
0
sin z
0
π 1 1 1 1 1 = π − (π − z)3 − (z − sin 2z) = π 4 − π 2 . 3 2 2 3 2 0
376
8 Calcolo integrale per funzioni in pi` u variabili z z=y
z=
2
3
p
y2 − 4
y
Figura 8.57. Sezione meridiana relativa all’Esercizio 31
Poich´e Ω `e un solido di rotazione attorno all’asse z, il baricentro si trova su tale asse e quindi xG = yG = 0. Per calcolare la coordinata zG , integriamo per strati:
π 1 1 zG = z dx dy dz = z dx dy dz vol(Ω) Ω vol(Ω) 0 Ωz xy della corona circolare Ωz mostrata in Figudove Az `e la proiezione sul piano ra 8.58, a destra. L’integrale dx dy rappresenta l’area di Az e si pu`o calcolare Az elementarmente, ottenendo π (π − z)2 − sin2 z . In definitiva π π 3 π 3 − 3π π 1 π5 − = . zG = z (π − z)2 − sin2 z dx dy dz = vol(Ω) 0 vol(Ω) 12 4 4π 2 − 6 z π z
x = sin z
x=π−z
Ωz π
x
y x
Figura 8.58. Sezione meridiana (a sinistra) e regione Ωz (a destra) relative all’Esercizio 33
9 Calcolo integrale su curve e superfici
Completiamo in questo capitolo lo studio del calcolo integrale per funzioni di pi` u variabili reali. Nella prima parte, definiamo l’integrazione su curve in Rm e superfici nello spazio, considerando dapprima le funzioni scalari e successivamente le funzioni vettoriali; di queste ultime, viene integrata la componente tangenziale su una curva e la componente normale su una superficie. In tal modo, si ottengono i cosiddetti integrali di linea e di flusso, che hanno una immediata interpretazione fisica rispettivamente come lavoro di una forza che si sposta lungo una curva e, ad esempio, come portata attraverso una superficie immersa in un fluido. L’integrazione su curve viene di fatto ricondotta al calcolo di integrali su intervalli della retta reale, cos`ı come l’integrazione su superfici si riduce a quella su regioni del piano. Particolare attenzione `e rivolta allo studio della dipendenza degli integrali dalla parametrizzazione e dall’orientamento della variet` a su cui sono definiti. Gli integrali di linea e di flusso intervengono in una serie di risultati, comprendenti i fondamentali Teoremi di Gauss, Green e Stokes, che traducono in un contesto multidimensionale l’idea che sta alla base della formula di integrazione per parti in una variabile: trasformare l’integrazione su un certo dominio nell’integrazione sul bordo del dominio, con corrispondente trasformazione della funzione integranda. I teoremi sopra citati hanno svariate applicazioni, in particolare intervengono nella traduzione di leggi fisiche in equazioni differenziali; ad esempio, il Teorema della divergenza permette di esprimere la variazione di flusso attraverso il bordo di un elemento di materia mediante un integrale di volume sull’elemento stesso, dando luogo alle cosiddette leggi di conservazione o di bilancio. Da ultimo, affrontiamo il problema di caratterizzare i campi conservativi, cio`e i campi che sono il gradiente di un potenziale scalare, e di calcolare il potenziale noto il campo. Ci`o rappresenta l’estensione alle funzioni di pi` u variabili dell’integrazione indefinita in una variabile, ossia della ricerca delle primitive di una funzione sulla retta reale. Anche in questo caso l’importanza applicativa del concetto di campo conservativo e di potenziale `e ben nota: in diverse situazioni rilevanti, un campo di forza gravitazionale o elettrica risulta essere conservativo, il che permette di calcolare il lavoro svolto dalla forza come semplice differenza di valori del potenziale.
Canuto C, Tabacco A: Analisi Matematica II. © Springer-Verlag Italia, Milano 2008
378
9 Calcolo integrale su curve e superfici
9.1 Integrali curvilinei Introduciamo nel seguito l’integrale su una curva di una funzione scalare di pi` u variabili; esso costituisce un’estensione naturale dell’integrale definito di una funzione di una variabile su un intervallo della retta reale. Ricordiamo che le curve sono state introdotte nel § 4.6 e studiate da un punto di vista differenziale nel § 6.5. Sia γ : I = [a, b] → Rm (con m ≥ 2) un arco di curva regolare, e sia Γ = γ(I) il suo sostegno. Sia poi f : dom f ⊆ Rm → R una funzione definita almeno su Γ , cio`e tale che Γ ⊆ dom f . Supponiamo che la funzione composta f ◦ γ : [a, b] → R, definita come (f ◦ γ)(t) = f (γ(t)), sia continua (a tratti) su [a, b]. Definizione 9.1 L’ integrale curvilineo di f su γ `e il numero
b
f= γ
f γ(t) γ (t) dt .
(9.1)
a
Esso viene anche chiamato integrale curvilineo di prima specie. Notiamo che l’integrale membro della (9.1) `e ben definito in quanto a secondo la funzione integranda f γ(t) γ (t) `e continua (a tratti) su [a, b]. Infatti γ `e per ipotesi regolare, dunque le derivate prime delle sue componenti sono funzioni continue e quindi anche la norma γ (t) ha tale propriet` a, essendo ottenuta componendo funzioni continue; inoltre f γ(t) `e continua (a tratti) per ipotesi. L’integrale curvilineo ha il seguente significato geometrico. Sia γ un arco semplice di curva piana e sia f non negativa su Γ ; sia G(f ) = {(x, y, z) ∈ R3 : (x, y) ∈ dom f, z = f (x, y)} il grafico di f . Indichiamo con Σ = {(x, y, z) ∈ R3 : (x, y) ∈ Γ, 0 ≤ z ≤ f (x, y)} la superficie verticale delimitata inferiormente dal sostegno Γ della curva γ e superiormente dal grafico di f (si veda la Figura 9.1). Allora si pu` o dimostrare che l’area di Σ `e uguale all’integrale curvilineo di f su γ. Ad esempio, se f `e costante e uguale a h su Γ , l’area di Σ `e data dal prodotto dell’altezza h per la lunghezza della base Γ ; in base a quanto visto nel § 6.5.2, tale lunghezza si esprime come 3b (Γ ) = a γ (t) dt e dunque si ha
b
area (Σ) = h (Γ ) = a
f γ(t) γ (t) dt =
f. γ
Nel caso in cui f non `e costante, possiamo suddividere l’intervallo I nell’unione di K sottointervalli Ik = [tk−1 , tk ] di ampiezza Δtk = tk − tk−1 sufficientemente piccola. Sia Γk = γ(Ik ) la parte di Γ individuata da Ik , che ha lunghezza (Γk ) =
9.1 Integrali curvilinei
379
(Pk∗ , f (Pk∗ ))
Σk
G(f )
Σ Pk∗
Γ
Γk
dom f
Figura 9.1. Significato geometrico dell’integrale curvilineo
3 tk
γ (t) dt; sia poi Σk = {(x, y, z) ∈ R3 : (x, y) ∈ Γk , 0 ≤ z ≤ f (x, y)} la parte di Σ che ha come base Γk (si veda ancora la Figura 9.1). Preso un qualunque t∗k ∈ Ik e posto Pk∗ = γ(t∗k ) ∈ Γk , si avr` a tk−1
area(Σk ) f (Pk∗ )(Γk ) =
tk
f γ(t∗k ) γ (t) dt .
tk−1
Sommando su k e facendo tendere a zero la massima ampiezza degli intervalli Ik , si ottiene precisamente la (9.1). Ritornando alla Definizione 9.1, osserviamo che l’ascissa curvilinea s = s(t) definita in (6.20) soddisfa ds = γ (t) ; dt con la notazione di Leibniz, possiamo scrivere tale relazione nella forma ds = γ (t) dt . Il differenziale ds rappresenta l’elemento ‘infinitesimo’ di lunghezza lungo la curva, in corrispondenza di un incremento ‘infinitesimo’ dt del parametro t. Queste considerazioni motivano il fatto che l’integrale definito in (9.1) pu` o essere anche indicato con una delle notazioni f ds , oppure f dγ (9.2) γ
γ
(nel secondo caso, si intende che la funzione scalare s = s(t) sia invece indicata con γ = γ(t), che per` o non deve essere confusa con la notazione vettoriale γ = γ(t) usata per l’arco).
380
9 Calcolo integrale su curve e superfici
Esempi 9.2 i) Sia γ : [0, 1] → R2 l’arco di curva regolare γ(t) = (t, t2 ) che parametrizza la parte della parabola y = x2 compresa √tra i punti O = (0, 0) e A = (1, 1). Si ha γ (t) = (1, 2t) e dunque γ (t) = 1 + 4t2 . Sia poi f : R × [0, +∞) → R √ la funzione definita da f (x, y) = 3x + y. La funzione composta f ◦ γ vale √ f γ(t) = 3t + t2 = 4t. Pertanto 1 f= 4t 1 + 4t2 dt ; γ
0
tale integrale si calcola con la sostituzione r = 1 + 4t2 , ottenendo 1 5√ 1 2 3/2 5 1 √ r f= r dr = = (5 5 − 1) . 2 1 2 3 3 1 γ √
ii) Sia γ : [0, 1] → R3 l’arco regolare γ(t) = ( 13 t3 , 22 t2 , t). Si ha √ γ (t) = (t2 , 2t, 1) e dunque γ (t) = t4 + 2t2 + 1 = (1 + t2 ) . √ Sia ora f (x, y, z) = 3 2xyz 2 ; allora 1 1 1 1 9 . f= t7 (1 + t2 ) dt = t8 + t10 = 8 10 40 0 0 γ iii) Sia γ : [0, 2π] → R2 la parametrizzazione della circonferenza di centro (2, 1) e raggio 2 data da γ(t) = (2 + 2 cos t, 1 + 2 sin t), per la quale si ha γ (t) = 4 sin2 t + 4 cos2 t = 2 , ∀t . Per la funzione f (x, y) = (x − 2)(y − 1) + 1, si ha f γ(t) = 4 sin t cos t + 1 e dunque 2π 2π f =2 (4 sin t cos t + 1) dt = 2 − cos 2t + t 0 = 4π . γ
0
Se invece si parametrizza la stessa circonferenza mediante la curva γ∗ avente le stesse componenti di γ ma con t variabile in [0, 2kπ] (cio`e si percorre la circonferenza k volte), si ha 2kπ 2 f =2 (4 sin t cos t + 1) dt = 4kπ . γ∗
0
L’ultimo esempio considerato mostra che l’integrale curvilineo di una funzione non dipende solo dal sostegno della curva, ma anche dal modo con cui tale sostegno viene parametrizzato. Tuttavia, come vedremo ora, parametrizzazioni congruenti danno luogo allo stesso integrale curvilineo. Sia f una funzione definita sul sostegno di un arco regolare γ : [a, b] → Rm e tale che f ◦ γ sia continua (a tratti), di modo che esista l’integrale curvilineo di f su γ. Allora anche la funzione f ◦ δ, ove δ `e un arco congruente a γ, risulter` a continua (a tratti), in quanto ottenuta componendo una funzione continua tra due intervalli della retta reale con la funzione continua (a tratti) f ◦ γ.
9.1 Integrali curvilinei
381
Proposizione 9.3 Sia γ : [a, b] → Rm un arco di curva regolare, di sostegno Γ , e sia f una funzione definita su Γ e tale che f ◦ γ sia continua (a tratti). Allora si ha f= f, δ
γ
per ogni curva δ congruente a γ. Dim.
Sia δ = γ ◦ ϕ, con ϕ : [c, d] → [a, b], un arco congruente a γ, per cui δ (τ ) = γ ϕ(τ ) ϕ (τ ). Dunque
δ
f γ(ϕ(τ )) γ ϕ(τ ) ϕ (τ ) dτ
f δ(τ ) δ (τ ) dτ =
d
f γ(ϕ(τ )) γ ϕ(τ ) |ϕ (τ )| dτ .
c
=
d
f =
d
c
c
Ora eseguiamo la sostituzione t = ϕ(τ ), da cui dt = ϕ (τ ) dτ . Notiamo che si ha ϕ(c) = a, ϕ(d) = b se ϕ > 0 (δ e γ curve equivalenti), oppure ϕ(c) = b, ϕ(d) = a se ϕ < 0 (δ e γ curve anti-equivalenti). Otteniamo quindi, nel primo caso b f= f γ(t) γ (t) dt = f δ
γ
a
mentre nel secondo si ha a f =− f γ(t) γ (t) dt = δ
b
b a
f γ(t) γ (t) dt =
f. γ
2
In base alla proposizione precedente, si ha immediatamente il seguente risultato. Corollario 9.4 L’integrale curvilineo di una funzione non cambia se all’arco di curva sostituiamo l’arco ad esso opposto. Notiamo ora che, detto c un qualunque punto in (a, b) e posto γ1 = γ|[a,c] e γ2 = γ|[c,b] , si ha, per la propriet` a di additivit` a dell’integrale definito rispetto all’intervallo di integrazione, f= f+ f. (9.3) γ
γ1
γ2
Tale propriet` a suggerisce come estendere in modo naturale il concetto di integrale curvilineo agli archi regolari a tratti. Pi` u precisamente, sia γ : [a, b] → Rm un arco regolare a tratti e siano a = a0 < a1 < . . . < an = b punti di [a, b] tali che gli
382
9 Calcolo integrale su curve e superfici
archi di curva γi = γ|[ai−1 ,ai ] , i = 1, . . . , n, siano archi regolari. Sia ora f , come prima, una funzione definita almeno su Γ e tale che la funzione composta f ◦ γ sia continua (a tratti) su [a, b]. Si pone allora per definizione f= γ
n i=1
f.
(9.4)
γi
Osservazione 9.5 Il calcolo di un integrale curvilineo relativo a un arco regolare a tratti, pu` o essere reso pi` u agevole usando la Proposizione 9.3. Infatti si ha f= γ
n i=1
f,
(9.5)
δi
dove ogni δi `e un arco di curva congruente a γi , i = 1, . . . , n, scelto in modo da semplificare il calcolo del corrispondente integrale a secondo membro. 2 Esempio 9.6
3 Si voglia calcolare γ x2 , dove γ : [0, 4] → R2 del bordo del quadrato unitario [0, 1] × [0, 1] ⎧ γ1 (t) = (t, 0) ⎪ ⎪ ⎪ ⎪ ⎨ γ2 (t) = (1, t − 1) γ(t) = ⎪ γ3 (t) = (3 − t, 1) ⎪ ⎪ ⎪ ⎩ γ4 (t) = (0, 4 − t)
`e la seguente parametrizzazione se 0 ≤ t < 1 , se 1 ≤ t < 2 , se 2 ≤ t < 3 , se 3 ≤ t ≤ 4
(si veda la Figura 9.2, a sinistra). Introduciamo le parametrizzazioni dei lati del quadrato δ1 (t) = γ1 (t) 0 ≤ t ≤ 1, δ1 = γ1 , δ2 (t) = (1, t)
0 ≤ t ≤ 1,
δ2 ∼ γ2 ,
δ3 (t) = (t, 1)
0 ≤ t ≤ 1,
δ3 ∼ −γ3 ,
δ4 (t) = (0, t)
0 ≤ t ≤ 1,
δ4 ∼ −γ4
(si veda la Figura 9.2, a destra). Allora si ha 1 1 1 x2 = t2 dt + 1 dt + t2 dt + γ
0
0
0
0
1
0 dt =
5 . 3
2
Valgono per gli integrali curvilinei le propriet` a di linearit` a, positivit` a, confronto, etc., gi`a viste per altri tipi di integrali.
9.1 Integrali curvilinei
γ3
δ3
γ4
O
γ2
γ1
383
δ4
1
δ2
O
δ1
1
Figura 9.2. Parametrizzazione del quadrato unitario relativo all’Esempio 9.6
Osservazione 9.7 Sia γ : [a, b] → R un arco regolare. Notiamo innanzitutto che la sua lunghezza (γ) pu` o essere espressa come (γ) = 1. (9.6) γ
Inoltre, l’ascissa curvilinea s = s(t) definita dalla (6.20) con t0 = a, soddisfa 3b s(a) = 0 e s(b) = a γ (τ ) dτ = (γ). Usiamo tale parametro per esprimere l’integrale curvilineo di una funzione f , introducendo, come gi` a fatto a pag. 231, 1 (s) = γ(t(s)) equivalente a γ. Si ha allora la parametrizzazione γ (γ) 1 (s) ds . f= f= f γ γ
e γ
0
Questa formula pu` o semplificare il calcolo di un integrale curvilineo, a condizione di conoscere l’espressione analitica dell’ascissa curvilinea. 2 In vista delle successive applicazioni, `e conveniente disporre del concetto di integrale curvilineo di una funzione definita su un arco di curva regolare e semplice Γ , pensato come sottoinsieme di Rm , alla luce della Definizione 6.28. In effetti, abbiamo visto che tutte le parametrizzazioni di Γ mediante archi di curva regolari e semplici sono tra loro congruenti (Proposizione 6.27) e dunque danno luogo allo stesso integrale curvilineo di una funzione f definita e continua (a tratti) su Γ (Proposizione 9.3). Ha quindi senso chiamare integrale curvilineo di f su Γ la quantit` a f= f, (9.7) γ
Γ
dove γ `e una qualunque parametrizzazione regolare e semplice di Γ . Talvolta l’integrale a primo membro potr` a essere indicato con uno dei simboli f ds , f dγ , f d . Γ
Γ
Γ
384
9 Calcolo integrale su curve e superfici
L’estensione al caso degli archi regolari a tratti e semplici `e ovvia. Nel caso in cui l’arco Γ sia chiuso, tale propriet` a potr` a essere evidenziata usando una delle notazioni 4 4 4 4 f, f ds , f dγ , f d . Γ
Γ
Γ
Γ
Osservazione 9.8 L’integrale curvilineo di una funzione f continua (a tratti) pu` o essere definito anche su una curva regolare γ : I → Rm , ove I `e un intervallo limitato ma non chiuso. A tale scopo, la funzione t → f γ(t) γ (t) deve essere integrabile (anche in senso improprio) su I; l’integrale curvilineo sar` a quindi definito come f = f γ(t) γ (t) dt . γ
I
Ad esempio, consideriamo la semicirconferenza di centro l’origine, raggio unitario e contenuta√nel semipiano y ≥ 0 e parametrizziamola mediante γ : [−1, 1] → R2 , γ(t) = (t, 1 −t2 ); tale curva `e regolare soltanto nell’intervallo aperto (−1, 1), t essendo γ (t) = 1, − √1−t . Posto f (x, y) = 1, si ha 2
1
f= −1
γ
√
1 1 dt = arcsin t −1 = π , 2 1−t 2
ove l’integrale a secondo membro `e improprio. 9.1.1 Baricentro e momenti di inerzia di una curva
Come fatto nel § 8.5 per le lamine piane o per i solidi, definiamo mediante gli integrali curvilinei alcune rilevanti quantit` a fisiche relative a un filo materiale sottile disposto lungo un arco di curva Γ ⊂ R3 regolare (a tratti) e semplice. Sia μ = μ(P ) la densit` a lineare di massa (massa per unit`a di lunghezza) del filo nel generico punto P = x = (x, y, z) ∈ Γ , che supponiamo nota. Allora la massa totale del filo `e data da m= μ, Γ
mentre il baricentro G = xG = (xG , yG , zG ) del filo `e definito dalla relazione 1 xG = xμ , m Γ ossia xG =
1 m
xμ , Γ
yG =
1 m
yμ , Γ
zG =
1 m
zμ . Γ
Il momento di inerzia del filo rispetto ad una retta oppure ad un punto `e dato da d2 μ , I= Γ
9.2 Integrali di linea
385
dove d = d(P ) `e la distanza del generico punto P ∈ Γ dalla retta o dal punto considerato. I momenti di inerzia rispetto agli assi coordinati Ix = (y 2 + z 2 )μ , Iy = (x2 + z 2 )μ , Iz = (x2 + y 2 )μ , Γ
Γ
Γ
sono casi particolari notevoli; la loro somma I0 = Ix + Iy + Iz rappresenta il momento d’inerzia del filo rispetto all’origine. Esempio 9.9 Calcoliamo il momento di inerzia rispetto all’origine dell’arco di curva Γ definito dalle condizioni x2 + y 2 + z 2 = 1 , tra i punti A = (1, 0, 0) e B √ γ(t) = ( 1 − 2t2 , t, t) con 0
γ (t) = Pertanto
√
(1 − 2t + t + t ) √ 0
2
y ≥ 0, pu` o essere parametrizzato da
√ 4t2 2 +1+1= √ . 2 1 − 2t 1 − 2t2
√ 2/2 2
I0 =
y = z,
√ √ = (0, 22 , 22 ). L’arco √ ≤ t ≤ 22 ; si ha
2
√
√ 2/2 2 π dt = arcsin 2t 0 = . 2 2 1 − 2t
2
9.2 Integrali di linea Il concetto di integrale curvilineo pu` o essere esteso ai campi vettoriali dando origine alla nozione di integrale di linea, che presentiamo in questo paragrafo. Precisamente, sia ancora I = [a, b] e sia γ : I → Rm un arco regolare avente sostegno Γ = γ(I). Sia f un campo vettoriale in Rm definitoalmeno su Γ . In tal modo `e definita su I la funzione composta f ◦ γ : t → f γ(t) a valori in Rm . Supporremo che tale funzione sia continua (a tratti), vale a dire che tutte le componenti fi γ(t) , definite su I a valori in R, siano funzioni continue (a tratti). Per ogni t ∈ I, ricordiamo che indichiamo con τ (t) = τγ (t) =
γ (t) γ (t)
il versore tangente al sostegno dell’arco nel punto P (t) = γ(t). La funzione scalare fτ = f · τ definita come fτ (t) = f · τ (t) = f γ(t) · τ (t) rappresenta la componente scalare del campo f lungo il versore tangente al sostegno di γ in P (t).
386
9 Calcolo integrale su curve e superfici
Definizione 9.10 L’ integrale di linea di f su γ `e l’integrale curvilineo su γ della funzione fτ , ossia la quantit` a f ·τ = fτ . γ
γ
Tale integrale viene anche chiamato integrale curvilineo di seconda specie. Si osservi che, ricordando la definizione di τ , si ha b f ·τ = f γ(t) · τ (t) γ (t) dt = γ
a
b
f γ(t) · γ (t) dt .
a
Pertanto l’integrale di linea di f su γ pu` o essere calcolato usando la formula
γ
b
f ·τ =
f γ(t) · γ (t) dt .
(9.8)
a
dγ = γ (t) nella forma di Leibniz dγ = γ (t) dt, possiamo Scrivendo la relazione dt anche indicare l’integrale di linea con la notazione f · dγ . γ
Si noti la differenza tra il simbolo vettoriale dγ che compare nell’integrale di linea e il simbolo scalare dγ che compare nella (9.2). Il significato fisico dell’integrale di linea `e di particolare importanza. Se f descrive un campo di forze applicato al sostegno della curva, l’integrale di linea rappresenta il lavoro compiuto dalla forza f nello spostamento lungo il sostegno dell’arco γ. Il seguente risultato `e la controparte della Proposizione 9.3 per tali integrali. Proposizione 9.11 Sia γ : [a, b] → Rm un arco di curva regolare, di sostegno Γ , e sia f un campo vettoriale definito su Γ e tale che f ◦ γ sia continua (a tratti). Allora si ha f · τδ = f · τγ , per ogni arco δ equivalente a γ δ
e
δ
γ
f · τδ = −
γ
f · τγ ,
per ogni arco δ anti-equivalente a γ.
9.2 Integrali di linea
Dim.
387
Il risultato si deduce dalla Proposizione 9.3 osservando che i versori tangenti alle curve indicate soddisfano τδ = τγ se δ ∼ γ, oppure τδ = −τγ se δ ∼ −γ. 2
Corollario 9.12 L’integrale di linea cambia di segno se all’arco sostituiamo l’arco ad esso opposto, ossia f · τ(−γ) = − f · τγ . −γ
γ
Da un punto di vista fisico la proposizione precedente dice che il lavoro di una forza cambia segno cambiando il verso di percorrenza del sostegno dell’arco; una volta scelto il verso, il lavoro dipende soltanto dal sostegno e non dal modo con cui esso viene percorso. Un’altra definizione importante per le applicazioni `e la seguente. Definizione 9.13 Se γ `e un arco di curva regolare e chiuso, l’integrale di linea di un campo vettoriale f viene detto circuitazione di f su γ e indicato con il simbolo 4 f ·τ . γ
Esempi 9.14 i) Sia ora f : R3 → R3 il campo vettoriale definito da f (x, y, z) = (ex , x+y, y+z) e sia γ : [0, 1] → R3 l’arco γ(t) = (t, t2 , t3 ). Abbiamo f γ(t) = (et , t + t2 , t2 + t3 ) e γ (t) = (1, 2t, 3t2 ) . Pertanto, l’integrale di linea di f su γ `e dato da 1 f ·τ = (et , t + t2 , t2 + t3 ) · (1, 2t, 3t2 ) dt γ
0 1
= 0
19 . et + 2(t2 + t3 ) + 3(t4 + t5 ) dt = e + 15
ii) Consideriamo il campo vettoriale piano f : R2 → R2 definito da f (x, y) = 2 2 (y, x). Consideriamo poi l’ellisse x9 + y4 = 1 che parametrizziamo mediante l’arco γ : [0, 2π] → R2 , γ(t) = (3 cos t, 2 sin t). Si ha f γ(t) = (2 sin t, 3 cos t) e γ (t) = (−3 sin t, 2 cos t). Allora, la circuitazione di f lungo l’ellisse `e nulla, essendo 4 2π 2π f ·τ = (2 sin t, 3 cos t) · (−3 sin t, 2 cos t) dt = 6 (− sin2 t + cos2 t) dt γ
0
0
388
9 Calcolo integrale su curve e superfici
2π
(2 cos t − 1) dt = 12
cos2 t dt − 12π = 0 ,
2
=6 poich´e si ha
2π 0
0 2π
2π
1 1 cos t dt = t + sin 2t 2 4 2
0
= π. 0
2
L’integrale di linea pu` o essere definito anche su archi regolari a tratti, ponendo, in analogia con la (9.4) γ
f ·τ =
n γi
i=1
f · τγi ,
(9.9)
dove γi sono gli archi regolari in cui si suddivide γ. Se infine facciamo riferimento al concetto geometrico di arco di curva regolare (a tratti) e semplice (Definizione 6.28) e se Γ ⊂ Rm `e un tale arco, allora l’integrale di linea su Γ pu` o essere definito solo dopo aver scelto una delle due orientazioni di Γ , che possiamo associare al verso del vettore τ tangente a Γ . Fatta questa scelta, potremo definire l’integrale di linea di f su Γ ponendo
f ·τ = Γ
γ
f · τγ ,
(9.10)
dove γ `e una qualunque parametrizzazione regolare (a tratti) e semplice di Γ avente l’orientazione scelta. Ovviamente, cambiando orientazione, l’integrale di linea cambia di segno. La circuitazione di f su un arco di Jordan (arco chiuso e semplice) regolare (a tratti) sar` a indicata con 4 f ·τ . Γ
9.3 Integrali superficiali In perfetta analogia con il caso delle curve, l’integrale di una funzione scalare di tre variabili reali su una superficie rappresenta una naturale estensione dell’integrale doppio di una funzione definita in una regione piana. Dedichiamo questo paragrafo alla presentazione di tali integrali. Ricordiamo che le superfici sono state introdotte nel § 4.7, mentre il calcolo differenziale su di esse `e stato trattato nel § 6.7. Sia σ : R → R3 una calotta regolare avente sostegno Σ e dominio una regione compatta e misurabile R di R2 ; sia ν = ν(u, v) il suo vettore normale nel punto P = σ(u, v), definito dalla (6.48). Sia poi f : dom f ⊆ R3 → R una funzione
9.3 Integrali superficiali
389
definita almeno su Σ. Supponiamo che la funzione composta f ◦σ sia generalmente continua su R. Definizione 9.15 L’ integrale superficiale di f su σ `e il numero f= f σ(u, v) ν(u, v) du dv . σ
(9.11)
R
Si noti che, essendo la superficie regolare, la funzione (u, v) → ν(u, v) `e continua su R, pertanto l’integrando a secondo membro `e generalmente continuo e dunque integrabile. Per motivare la definizione precedente, consideriamo il caso in cui R sia un rettangolo con lati paralleli agli assi nel piano (u, v); suddividiamolo nell’unione di rettangoli Rhk = [uh , uh + Δu] × [vk , vk + Δv] aventi lati di lunghezza Δu e Δv, e ◦
tali che i loro interni Rhk siano a due a due disgiunti (vedi la Figura 9.3, a sinistra). L’immagine del rettangolo Rhk `e il sottoinsieme Σhk di Σ delimitato dalle curve coordinate passanti per i punti σ(uh , vk ), σ(uh + Δu, vk ), σ(uh , vk + Δv) e σ(uh + Δu, vk + Δv) (Figura 9.3, a destra). Se Δu e Δv sono sufficientemente piccoli, tale superficie pu`o essere approssimata con il parallelogramma Πhk , giacente sul piano ∂σ (uh , vk )Δu tangente alla calotta in σ(uh , vk ), individuato dai vettori tangenti ∂u ∂σ (uh , vk )Δv (si veda la Figura 9.4). L’area Δσ di Πhk `e data da e ∂v $ $ $ ∂σ $ ∂σ $ (u (u Δσ = $ , v ) ∧ , v ) h k $ ΔuΔv = ν(uh , vk )ΔuΔv , $ ∂u h k ∂v e quindi tale numero approssima l’area di Σhk . Alla luce di queste considerazioni, possiamo considerare il termine z v Σhk vk + Δv − vk −
Σ
Rhk
−
−
v u
uh uh + Δu
u
Rhk
Figura 9.3. Partizioni del dominio (a sinistra) e del sostegno (a destra) di una calotta
390
9 Calcolo integrale su curve e superfici Phk
∂σ (Phk )Δv ∂v
Πhk
∂σ (Phk )Δu ∂u
Σhk
Figura 9.4. Elemento di superficie Σhk con corrispondente piano tangente Πhk
dσ = ν(u, v) du dv che compare nell’integrale a secondo membro della (9.11) come un elemento ‘infinitesimo’ di area su Σ. In particolare, se la superficie `e semplice, definiremo pi` u avanti l’area di Σ proprio come la quantit` a 1= ν(u, v) du dv . σ
R
Esempio 9.16 Supponiamo che la calotta regolare σ : R → R3 sia la superficie cartesiana σ(u, v) = ui + vj + ϕ(u, v)k. Ricordando la (6.49), si ha 2 2 ∂ϕ ∂ϕ ν(u, v) = 1 + + ∂u ∂v e dunque l’integrale superficiale di una funzione f = f (x, y, z) su σ si esprime come 2 2 ∂ϕ ∂ϕ f= f u, v, ϕ(u, v) 1 + + du dv . ∂u ∂v σ R Ad esempio, se σ`e definita da ϕ(u, v) = uv sul quadrato unitario R = [0, 1]2 e se f (x, y, z) = z/ 1 + x2 + y 2 , si ha 1 1 1 1 uv 1 √ f= 1 + v 2 + u2 du dv = uv du dv = . 2 2 2 4 1+u +v 0 0 0 0 σ Mostriamo ora che l’integrale superficiale `e invariante per parametrizzazioni congruenti.
9.3 Integrali superficiali
391
Proposizione 9.17 Sia σ : R → R3 una calotta regolare di sostegno Σ e sia f una funzione definita su Σ tale che f ◦ σ sia generalmente continua su R. 1 → Σ congruente a σ si ha 1 :R Allora per ogni altra parametrizzazione σ f= f. e σ
Dim.
σ
1 → R il cambiamento di variabile tale che σ 1 = σ ◦Φ. Ricordando Sia Φ : R la (6.50) e il Teorema 8.24, si ha 1 (1 f = f σ u, v1) 1 ν (1 u, v1) d1 u d1 v e e σ R f σ(Φ(1 u, v1)) det J Φ(1 u, v1)ν Φ(1 u, v1) d1 u d1 v = e R f σ(Φ(1 u, v1)) ν Φ(1 u, v1) | det J Φ(1 u, v1)| d1 u d1 v = e R = f σ(u, v) ν(u, v) du dv = f. R σ 2
Il risultato precedente permette di introdurre il concetto di integrale superficiale definito su una calotta regolare e semplice Σ ⊂ R2 pensata come oggetto geometrico (vedasi la Definizione 6.34). Precisamente, chiameremo integrale superficiale di f su Σ la quantit` a f= f, (9.12) σ
Σ
dove σ `e una qualunque parametrizzazione regolare e semplice di Σ. La definizione ha senso, in quanto gi` a sappiamo che tutte le parametrizzazioni regolari e semplici di Σ sono tra loro congruenti. Un’altra notazione usata `e f (σ) dσ oppure f dσ . Σ
Σ
Il concetto di integrale superficiale si estende in modo naturale al caso delle calotte regolari a pezzi, ossia al caso in cui Σ sia l’unione di n calotte regolari e semplici Σ1 , . . . , Σn secondo la Definizione 6.43. In tal caso si pone per definizione f= Σ
n i=1
Σi
f.
392
9 Calcolo integrale su curve e superfici
Osservazione 9.18 Come nel caso degli integrali curvilinei (Osservazione 9.8), anche per gli integrali superficiali `e possibile estenderne la definizione alle superfici che non sono calotte, a condizione che la funzione che compare a secondo membro della (9.11) sia integrabile su R. Ad esempio, la semisfera Σ di centro l’origine e raggio unitario, definita da z ≥ 0,
x2 + y 2 + z 2 = 1 ,
non `e una calotta in coordinate cartesiane, in quanto la parametrizzazione σ(u, v) = u, v, 1 − u2 − v 2 non pu` o essere estesa in modo differenziabile a nessun aperto contenente il disco unitario D. Tuttavia, possiamo ugualmente usare la (9.9) per calcolare ad esempio l’area della semisfera, in quanto la funzione 1 ν(u, v) = √ 1 − u2 − v 2 `e integrabile su D. Abbiamo infatti 2π 1 r √ 1= ν(u, v) du dv = dr dθ = 2π . 2 1 − r2 Σ D 0 0 9.3.1 Area di una calotta Mediante l’integrale superficiale, possiamo definire in modo rigoroso l’area di una calotta Σ regolare (a pezzi) e semplice, ponendo area(Σ) =
1. Σ
Esempio 9.19 i) L’esempio fornito nell’Osservazione 9.18, opportunamente adattato, mostra che l’area di una semisfera Σ di raggio r `e data da area(Σ) = 1 = 2πr2 , Σ
come ben noto dalla geometria elementare. ii) Calcoliamo l’area della superficie laterale Σ di un cilindro di raggio r e altezza L. Facendo coincidere l’asse del cilindro con il segmento [0, L] sull’asse z, la superficie Σ viene parametrizzata da σ(u, v) = r cos u i + r sin u j + v k, con (u, v) ∈ R = [0, 2π] × [0, L]. Si ha facilmente ν(u, v) = r cos u i + r sin u j + 0 k , da cui ν(u, v) = r. Concludiamo che 2π area(Σ) = 0
L
r du dv = 2πrL . 0
Anche questa `e una formula nota dalla geometria elementare.
2
9.3 Integrali superficiali
393
La calotta considerata nell’esempio precedente `e una superficie di rotazione (Esempio 4.36 iii)). L’area di una tale superficie pu` o essere ricondotta facilmente al calcolo di un integrale curvilineo sull’arco meridiano. Proposizione 9.20 Sia Σ una superficie di rotazione attorno all’asse z, generata da un arco Γ giacente sul piano xz. Allora si ha area(Σ) = 2π x. Γ
Dim.
Usando le notazione dell’Esempio 4.36 iii), si ottiene facilmente ν(u, v) = −γ1 (u)γ3 (u) cos v i + γ1 (u)γ3 (u) sin v j + γ1 (u)γ1 (u) cos2 v + γ1 (u)γ1 (u) sin2 v k , da cui ν(u, v) =
#
γ12 (u) (γ1 (u))2 + (γ3 (u))2 = γ1 (u)γ (u) ,
avendo supposto che, sulla curva, x = γ1 (u) sia non negativo. Pertanto si ha 2π area(Σ) = 1= γ1 (u)γ (u) dudv Σ I 0 2 x. = 2π γ1 (u)γ (u) dudv = 2π I
Γ
Osserviamo che la quantit` a 2πx rappresenta la lunghezza della circonferenza ` descritta dal punto P = (x, 0, z) ∈ Γ durante la rotazione attorno all’asse z. E quindi naturale introdurre la coordinata 3 3 x x Γ 3 xG = = Γ (Γ ) 1 Γ del baricentro G di Γ , corrispondente ad una densit` a unitaria di massa lungo la curva, e scrivere la relazione precedente come area(Σ) = 2π xG (Γ ) . Abbiamo quindi dimostrato il seguente risultato, noto come secondo Teorema di Guldino. Teorema 9.21 L’area di una superficie di rotazione Σ `e uguale al prodotto della lunghezza dell’arco meridiano Γ per la lunghezza della circonferenza generata dalla rotazione del baricentro G dell’arco.
394
9 Calcolo integrale su curve e superfici
9.3.2 Baricentro e momenti di inerzia di una superficie Supponiamo che un guscio materiale sottile giaccia su una calotta Σ ⊂ R3 regolare (a pezzi) e semplice. Detta μ = μ(P ) la densit` a superficiale di massa (massa per unit` a di superficie) del guscio nel generico punto P ∈ Σ, la massa totale del guscio `e data da m= μ, Σ
mentre il suo baricentro G = (xG , yG , zG ) `e definito mediante la formula 1 xμ xG = m Σ 1 1 1 xG = xμ , yG = yμ , zG = zμ . m Σ m Σ m Σ Il momento di inerzia del guscio rispetto a una retta oppure ad un punto `e dato da d2 μ , I= ossia
Σ
dove d = d(P ) `e la distanza del generico punto P ∈ Σ dalla retta o dal punto considerato. I momenti di inerzia rispetto agli assi coordinati, 2 2 2 2 Ix = (y + z )μ , Iy = (x + z )μ , Iz = (x2 + y 2 )μ , Σ
Σ
Σ
sono casi particolari notevoli; la loro somma I0 = Ix + Iy + Iz rappresenta il momento d’inerzia del guscio rispetto all’origine.
9.4 Integrali di flusso Dopo aver definito gli integrali superficieli relativi ai campi scalari su una superficie, passiamo ora all’integrazione di campi vettoriali definiti su di essa. Si ottiene in questo modo l’importante concetto di integrale di flusso, oggetto del presente paragrafo. Sia dunque f un campo vettoriale in R3 definito almeno sul sostegno Σ di una calotta regolare σ : R → Σ, con R insieme compatto e misurabile in R2 . Supponiamo che la funzione composta f ◦ σ sia generalmente continua su R. Sia n = n(u, v) il versore normale al sostegno di σ e sia fn = f · n la componente scalare di f lungo n, che chiamiamo componente normale di f sulla superficie. Definizione 9.22 L’integrale di superficie di f su σ `e l’integrale superficiale su σ della funzione fn , ossia la quantit` a f ·n= fn . σ
σ
9.4 Integrali di flusso
395
Ricordando la Definizione 6.35, l’integrale di superficie pu` o essere calcolato come σ
f ·n=
R
f σ(u, v) · ν(u, v) du dv .
(9.13)
Come nel caso degli integrali di linea, anche per gli integrali di superficie l’uso di una parametrizzazione congruente di Σ comporta al pi` u un cambio di segno, come precisato dal risultato seguente. Proposizione 9.23 Sia σ : R → R3 una calotta regolare, di sostegno Σ, e sia f un campo vettoriale definito su Σ e tale che f ◦ σ sia generalmente continua. Allora si ha 1= 1 equivalente a σ f ·n f · n, per ogni calotta σ e σ
e
e σ
Dim.
σ
1=− f ·n
σ
1 anti-equivalente a σ . per ogni calotta σ
f · n,
Il risultato si deduce dalla Proposizione 9.17 osservando che i versori nor1 = n se σ 1 `e equivalente a σ, oppure mali alle superfici indicate soddisfano n 1 = −n se σ 1 `e anti-equivalente a σ . n 2
La proposizione precedente permette di definire l’integrale di superficie di un campo vettoriale f su una calotta Σ regolare (a pezzi) e semplice, pensata come oggetto geometrico in R3 . Alla luce della discussione svolta nel § 6.7.2, `e per`o necessario limitarci a considerare superfici orientabili (Definizione 6.38). Supponiamo dunque che Σ sia orientabile, e che su di essa sia fissato un verso di attraversamento, a cui corrisponde uno dei due versori normali a Σ, che indichiamo con n. Fatta questa scelta, definiamo integrale di flusso di f su Σ la quantit` a
f ·n=
Σ
σ
f · n,
dove σ `e una qualunque parametrizzazione regolare (a pezzi) e semplice di Σ, che induce su di essa l’orientazione scelta. L’integrale ora definito viene anche chiamato flusso di f attraverso Σ. Tale terminologia trae origine dalla Fisica; ad esempio, supponiamo che la superficie sia immersa in un fluido del quale μ = μ(x) indichi la densit` a volumica di massa, mentre v = v(x) indichi la velocit` a della particella che si trova nel punto P = x. Allora, se poniamo f = μv e se ΔΣ `e un elemento di superficie di area Δσ e normale n, la quantit` a (f · n) Δσ rappresenta il flusso
396
9 Calcolo integrale su curve e superfici
di materia attraverso ΔΣ nell’unit` a di tempo; essa viene anche detta portata. Dunque, sommando e passando al limite, l’integrale di flusso di f su Σ rappresenta la portata totale attraverso Σ. Quando la calotta Σ `e chiusa e delimita un aperto Ω, si parla di flusso uscente oppure entrante, a seconda che il versore normale n sia uscente da Ω oppure entrante in Ω. Esempio 9.24 Calcoliamo il flusso del campo f (x) = yi − xj + zk uscente dalla superficie della sfera di centro l’origine e raggio r. Usiamo la parametrizzazione della sfera data dalle coordinate sferiche (Esempio 4.36 iv)), ossia σ : [0, π] × [0, 2π] → R3 , σ(u, v) = r sin u cos v i + r sin u sin v j + r cos u k. Il vettore normale uscente ad essa associato `e dato da (Esempio 6.36 ii)) ν(x) = r sin u x = r sin u(xi + yj + zk) . Ne segue che (f · ν)(x) = r sin uz 2 = r3 sin u cos2 u. Pertanto, ricordando la (9.13), 2π π 4 f ·n= r3 sin u cos2 u dudv = πr3 . 2 3 Σ 0 0
9.5 I Teoremi di Gauss, Green e Stokes I Teoremi di Gauss, Green e Stokes, che presentiamo in questo paragrafo, possono essere considerati come i corrispettivi della formula di integrazione per parti per quanto riguarda l’integrazione multidimensionale. Infatti, ognuno di essi permette di esprimere l’integrale, esteso a un dominio bi- o tri-dimensionale oppure a una superficie, di una espressione differenziale dipendente da uno degli operatori del primo ordine introdotti nel § 6.3.1, come l’integrale, esteso al bordo del dominio di integrazione, di un’altra espressione in cui non compaiono derivate. L’importanza di tali teoremi `e notevole, sia dal punto di vista teorico sia in relazione alle applicazioni. Essi intervengono ad esempio nella traduzione di una legge fisica (quale una legge di conservazione della massa oppure una legge di bilancio energetico) in una o pi` u equazioni matematiche (equazioni alle derivate parziali); essi possono poi intervenire nella determinazione delle condizioni che garantiscono la risolubilit` a di tali equazioni (dimostrazione dell’esistenza e unicit` a della soluzione); infine, vari metodi di risoluzione numerica delle equazioni (quali i metodi dei volumi finiti e degli elementi finiti) sono costruiti applicando opportunamente uno di questi teoremi. Ad un livello pi` u immediato per lo studente, essi permettono di calcolare uno dei due integrali di cui stabiliscono l’uguaglianza sapendo calcolare l’altro, oppure intervengono nello studio dei campi soddisfacenti particolari propriet` a, quali i campi conservativi.
9.5 I Teoremi di Gauss, Green e Stokes
397
Premettiamo alla presentazione dei Teoremi di Gauss, Green e Stokes la definizione di opportune classi di aperti e superfici, che chiameremo ammissibili, per le quali si pu` o dimostrare la validit` a dei teoremi. Una lettura essenziale dei successivi §§ 9.5.2 - 9.5.4 pu` o prescindere da queste definizioni rigorose. 9.5.1 Aperti e superfici ammissibili e loro bordo Aperti nel piano. Sia Γ ⊂ R2 un arco di Jordan regolare a tratti. Fissato un verso di percorrenza dell’arco, sia t = t1 i + t2 j il versore tangente, che esiste in ogni punto P di Γ , tranne al pi` u in un numero finito di essi. Sar` a dunque definita in P la direzione normale a Γ , ossia quella dei vettori v ortogonali a t. In particolare, il versore n = n1 i + n2 j = t2 i − t1 j, normale a Γ in P , `e ottenuto da t mediante una rotazione di π/2 in senso orario (si veda la Figura 9.5); in altri termini, identificando n e t rispettivamente con i versori n + 0k e t + 0k in R3 , la terna (n, t, k) `e destrorsa, essendo (n ∧ t) · k = 1. (Si presti attenzione al fatto che il versore n cos`ı definito pu` o non coincidere con il versore normale principale introdotto in (6.22), il cui verso varia al variare della convessit` a della curva; ovviamente, i due versori differiscono al pi` u per il segno.) Ricordiamo inoltre che, grazie al Teorema 4.32 di Jordan, Γ divide il piano in due regioni, una interna l’altra esterna a Γ . Definizione 9.25 Un aperto limitato Ω ⊂ R2 dicesi G-ammissibile se verifica le seguenti condizioni: i) la sua frontiera ∂Ω `e l’unione di un numero finito di archi di Jordan regolari a tratti Γ1 , . . . , ΓK , a due a due disgiunti; ii) Ω `e tutto contenuto o nell’interno o nell’esterno di ciascun arco Γk . Ogni punto P ∈ ∂Ω star` a dunque su uno e un solo arco Γk ; esister`a quindi (tranne al pi` u in un numero finito di tali punti) un versore n normale a Γk in P , il cui verso sar`a scelto in modo da puntare verso l’esterno di Ω (precisamente, sar`a tale che i punti Q = P + εn con ε > 0 sufficientemente piccolo siano tutti esterni
t n P
Γ
Figura 9.5. Versore tangente a un arco Γ di Jordan, e versore normale ottenuto con una rotazione oraria di π/2
398
9 Calcolo integrale su curve e superfici
n n
τ
Ω
τ
n τ
Figura 9.6. Aperto G-ammissibile del piano
a Ω). Diremo che n `e il versore normale a ∂Ω uscente da Ω, o semplicemente la normale esterna a ∂Ω. La scelta del verso uscente della normale induce un verso di percorrenza del bordo di ∂Ω. Precisamente, su ogni arco Γk che lo compone, si sceglier`a tale verso in modo che, detto t il corrispondente versore tangente, la terna (n, t, k) sia destrorsa. Intuitivamente, possiamo dire che un osservatore tridimensionale che cammina su Γk rimanendo dalla parte del versore k vede localmente Ω sempre alla sua sinistra (si veda la Figura 9.6). Diremo che questo `e il verso positivo di percorrenza di ∂Ω (e il verso opposto `e quello negativo). Aperti nello spazio. Il concetto di aperto G-ammissibile bidimensionale si estende facilmente al caso tridimensionale. A tale scopo, ricordiamo che ogni superficie chiusa e orientabile divide lo spazio in due regioni, una interna e l’altra esterna alla superficie (Teorema 6.42). Definizione 9.26 Un aperto limitato Ω ⊂ R3 dicesi G-ammissibile se verifica le seguenti condizioni: i) la sua frontiera ∂Ω `e l’unione di un numero finito di superfici Σ1 , . . . , ΣK a due a due disgiunte; ii) ciascuna Σk `e una superficie regolare a pezzi, semplice, orientabile e chiusa; iii) Ω `e tutto contenuto o nell’interno o nell’esterno di ciascuna superficie Σk . Per un aperto G-ammissibile, `e ben definita la normale n esterna a ∂Ω; essa coincider` a su ogni superficie Σk con la normale a tale superficie orientata secondo il verso di attraversamento che porta dall’interno verso l’esterno di Ω (si veda la Figura 9.7).
9.5 I Teoremi di Gauss, Green e Stokes
399
n Σ n Σ Σ
n Σ
n
Σ
Figura 9.7. Aperto G-ammissibile in R3 (per il quale K = 1)
Vediamo ora alcuni esempi di aperti G-ammissibili. Esempi 9.27 i) Gli interni dei solidi elementari (parallelepipedi, poliedri, cilindri, coni, sfere) e dei solidi ottenuti da questi per deformazioni regolari, sono aperti G-ammissibili. ii) Diciamo che un aperto limitato Ω ⊂ R3 `e semplice e regolare rispetto a z se Ω `e semplice rispetto a z secondo la Definizione 8.27, e precisamente si ha Ω = (x, y, z) ∈ R3 : (x, y) ∈ D, α(x, y) < z < β(x, y) , con D aperto di R2 il cui bordo ∂D `e un arco di Jordan regolare a tratti, e se α, β sono funzioni di classe C 1 in D. Un tale aperto `e G-ammissibile. Notiamo che il bordo di Ω `e costituito da una sola superficie Σ1 , regolare a pezzi, semplice, orientabile e chiusa; infatti essa si decompone in Σ1 = Σβ ∪ Σα ∪ Σ , dove Σβ = x, y, β(x, y) ∈ R3 : (x, y) ∈ D , Σα = x, y, α(x, y) ∈ R3 : (x, y) ∈ D , Σ = (x, y, z) ∈ R3 : (x, y) ∈ ∂D, α(x, y) ≤ z ≤ β(x, y) . Il versore nβ normale a Σβ e uscente da Ω `e ottenuto normalizzando il vettore ∂β ∂β (x, y) j + k , νβ (x, y) = − (x, y) i − ∂x ∂y essendo Σβ una superficie cartesiana (si ricordi l’Esempio 6.36, i)). In modo analogo, il versore nα normale a Σα e uscente da Ω si ottiene normalizzando il vettore ∂α ∂α (x, y) i + (x, y) j − k . να (x, y) = ∂x ∂y
400
9 Calcolo integrale su curve e superfici
Infine, il vettore n normale a Σ e uscente da Ω `e dato da n = n∂D + 0k , dove n∂D `e il versore bidimensionale uscente da ∂D. In modo analogo, si possono definire aperti semplici e regolari rispetto a x oppure a y. iii) La situazione appena considerata pu` o essere generalizzata nel modo seguente. Diciamo che un insieme di aperti Ω1 , . . . , ΩK forma una partizione di un aperto Ω se gli Ωk sono a due a due disgiunti e l’unione delle loro chiusure coincide con la chiusura di Ω, ossia K 0 Ω= Ωk con Ωh ∩ Ωk = ∅ se h = k . k=1
Diciamo allora che un aperto limitato Ω di R3 `e semplice e regolare a pezzi rispetto a xi (i = 1, 2, 3) se ammette una partizione in aperti semplici e regolari rispetto a xi (si veda la Figura 9.8 per la corrispondente situazione bidimensionale). Un tale aperto `e G-ammissibile. 2 Calotte. Nel seguito indichiamo con Σ una calotta regolare a pezzi, semplice e orientabile, come definita nel § 6.7.4; siano Σk , k = 1, . . . , K, le sue facce, ciascuna delle quali `e una calotta regolare e semplice. Introduciamo il concetto di calotta S-ammissibile, per la quale risulter` a valido il Teorema di Stokes. Definizione 9.28 Una calotta Σ dicesi S-ammissibile se `e regolare a pezzi, semplice e orientabile, e se le sue facce Σk , k = 1, . . . , K, sono parametrizzabili mediante funzioni σk : Rk → Σk dove Rk = Ω k `e la chiusura di un aperto Ωk G-ammissibile del piano.
Ω5 Ω3 Ω6 Ω1
Ω2
Ω4
Figura 9.8. Partizione di un aperto Ω ⊂ R2 nell’unione di aperti semplici rispetto a y
9.5 I Teoremi di Gauss, Green e Stokes
σk
Rk v
Σk n
p0 t n
401
P g
Δk
u Γk
t Π
z x
y
Figura 9.9. Definizione del verso di percorrenza positivo del bordo di una calotta
Data una calotta S-ammissibile Σ, supporremo di aver fissato uno dei suoi due versi di attraversamento, espresso dalla scelta di un versore normale a Σ, che indicheremo con n. Su ciascuna faccia Σk , n coincider` a con uno dei due versori normali a Σk , sia esso nk . Non `e restrittivo supporre che nk sia proprio il versore normale associato alla parametrizzazione σk , secondo la Definizione 6.35. (In caso 1 k decontrario, sar` a sufficiente sostituire ad esempio a σk la parametrizzazione σ 1 k = {(u, v) ∈ R2 : (−u, v) ∈ Rk } da σ 1 k (u, v) = (−u, v), il cui versore finita su R normale associato `e l’opposto di quello associato a σk .) Per definizione di calotta, il versore normale n ora fissato `e definito fin sul bordo di Σ (tranne al pi` u in un numero finito di punti di esso). Grazie ad esso, possiamo allora scegliere un verso di percorrenza di ∂Σ. In termini intuitivi, diremo che ` e positivo il verso percorso da un osservatore ideale che camminando lungo il bordo di Σ stando dalla parte del versore n, vede localmente la superficie alla sua sinistra. Una definizione pi` u rigorosa richiede qualche notazione aggiuntiva. Ogni punto P appartenente a ∂Σ, con l’eccezione di un numero finito di essi, giace sul bordo di una e una sola faccia di Σ, sia essa Σk ; inoltre, in un intorno di P il bordo ∂Σk si rappresenta come un arco regolare Γk in R3 . Infatti, Γk sar`a dato dall’immagine attraverso σk di un arco regolare Δk in R2 , contenuto nel bordo della regione Rk . In altri termini, sar` a Δk = {γk (t) : t ∈ Ik }, dove γk `e la parametrizzazione dell’arco di Jordan contenente Δk , e corrispondentemente Γk = {ηk (t) = σk γk (t) : t ∈ Ik }; il punto P ∈ Γk sar`a immagine attraverso σk di un punto p0 ∈ Δk , identificato da un valore t0 del parametro t, ossia P = σk (p0 ) = σk γk (t0 ) = ηk (t0 ) (si veda la Figura 9.9). Al vettore (colonna) γk (t0 ) tangente all’arco Δk in p0 , corrisponde il vettore (colonna) dηk (t0 ) = J σk (p0 )γk (t0 ) dt
402
9 Calcolo integrale su curve e superfici
(si ricordi la regola della catena) tangente all’arco Γk in P . Sia t il versore associato a tale vettore. Allora, se assumiamo che la parametrizzazione γk induce il verso positivo di percorrenza dell’arco di Jordan su cui giace Δk , diremo che ` e positivo il verso di percorrenza dell’arco Γk ⊂ ∂Σ indotto dal versore t cos`ı ottenuto. Equivalentemente, detto Π il piano tangente a Σ in P , sul quale giace il versore t, indichiamo con g il versore normale a t, giacente su Π e orientato verso l’esterno della calotta Σ; allora il verso di percorrenza positivo di ∂Σ `e quello per cui la terna (g, t, n) risulta destrorsa (si veda ancora la Figura 9.9). Esempio 9.29 Supponiamo che Σ sia la superficie cartesiana (9.14) Σ = {(x, y, z) ∈ R3 : (x, y) ∈ R, z = ϕ(x, y)} , dove R `e una regione chiusa e limitata del piano il cui bordo ∂R `e un arco di Jordan regolare Γ , parametrizzato da γ : I → Γ , mentre ϕ `e una funzione di classe C 1 in un aperto A contenente R; indichiamo con Ω l’interno dell’arco di Jordan Γ . La superficie Σ `e dunqueuna calotta S-ammissibile, parametrizzata da σ : R → Σ definita da σ(x, y) = x, y, ϕ(x, y) . Il corrispondente versore normale a Σ `e dato da ν n= , ove ν = −ϕx i − ϕy j + k . (9.15) ν Allora, se la parametrizzazione γ percorre l’arco Γ in senso positivo, cio`e antiorario, anche il bordo ∂Σ = η(t) = γ1 (t), γ2 (t), ϕ(γ1 (t), γ2 (t) : t ∈ I sar`a percorso in senso positivo, cio`e lasciando Σ costantemente alla sinistra. Il corrispondente versore tangente a ∂Σ sar`a dato da t = ηη , dove (9.16) η (t) = γ1 (t), γ2 (t), ϕx (γ(t))γ1 (t) + ϕy (γ(t))γ2 (t) . 9.5.2 Il Teorema della divergenza o di Gauss Il teorema afferma che – sotto opportune ipotesi – l’integrale della divergenza di un campo vettoriale su un aperto limitato di Rn `e uguale all’integrale del flusso del campo uscente dal bordo. In formule, detto Ω l’aperto ed n la normale esterna al bordo ∂Ω, si ha div f = f · n. (9.17) Ω
∂Ω
Abbiamo volutamente evitato di precisare delle ipotesi sul dominio Ω e sul campo f , perch´e varie scelte sono possibili. Ipotesi sufficientemente restrittive rendono pi` u semplice la dimostrazione del teorema, il quale per` o vale sotto condizioni piuttosto generali; esula dallo scopo del presente testo determinare ipotesi minimali di validit` a del risultato. Nel seguito, ci limitiamo a dare l’enunciato rigoroso del teorema sotto l’ipotesi di G-ammissibilit` a di Ω, introdotta nel § 9.5.1, la quale, lungi dall’essere la pi` u
9.5 I Teoremi di Gauss, Green e Stokes
403
generale, `e verificata nella maggior parte delle situazioni di interesse. Il lettore che voglia prescindere dalla definizione rigorosa pu` o pensare ad un aperto Gammissibile come ad un aperto limitato, la cui frontiera `e costituita da un numero finito di grafici di funzioni regolari, che lasciano l’aperto localmente da una stessa parte. La normale esterna all’aperto sar` a la normale a ciascun grafico, orientata verso l’esterno. Consideriamo dapprima la dimensione tre, e iniziamo con il seguente risultato, che `e propedeutico al teorema della divergenza ma che ha rilevanza di per s´e. Forniamo nei complementi in rete la dimostrazione sotto ipotesi pi` u restrittive sul dominio, ma comunque significative. Proposizione 9.30 Sia Ω ⊂ R3 un aperto G-ammissibile. Sia i ∈ {1, 2, 3} ∂f e sia f ∈ C 0 (Ω) con ∈ C 0 (Ω). Allora ∂xi ∂f dx dy dz = f ni dσ , Ω ∂xi ∂Ω dove ni `e la componente i-esima della normale esterna a ∂Ω. Dim.
; Complementi al Cap. 9
La Proposizione 9.30 `e la pi` u diretta generalizzazione multidimensionale della formula di integrazione per parti su un intervallo limitato della retta reale, a cui si `e fatto cenno nell’introduzione del paragrafo. Tale risultato riveste fondamentale importanza, perch´e da essa possiamo facilmente dedurre i Teoremi di Gauss e di Green. Iniziamo dal primo di questi. Teorema 9.31 (della divergenza o di Gauss) Sia Ω ⊂ R3 un aperto Gammissibile, e sia n la normale esterna a ∂Ω. Per ogni campo vettoriale 3 f ∈ C 1 (Ω) , vale la relazione div f dx dy dz = f · n dσ . (9.18) Ω
Dim.
∂Ω
Ciascuna componente fi del campo f verifica le ipotesi della proposizione precedente, e dunque si ha ∂fi dx dy dz = fi ni dσ per i − 1, 2, 3 . Ω ∂xi ∂Ω Sommando su i si ottiene il risultato.
2
404
9 Calcolo integrale su curve e superfici z
y
Q x
Ω
Figura 9.10. Passaggio dall’aperto bidimensionale Ω all’aperto tridimensionale Q
Esiste in realt` a una versione del Teorema di Gauss in ogni dimensione n ≥ 2. Limitiamoci a mostrare come la seguente versione bidimensionale del teorema si possa facilmente dedurre, con un artificio, da quella tridimensionale. Teorema 9.32 Sia Ω ⊂ R2 un aperto G-ammissibile e sia n la normale 2 esterna a ∂Ω. Per ogni campo vettoriale f ∈ C 1 (Ω) , si ha div f dx dy = f · n dγ . (9.19) Ω
Dim.
∂Ω
Introduciamo l’aperto Q = Ω × (0, 1) ⊂ R3 , che risulta G-ammissibile (si veda la Figura 9.10); introduciamo inoltre il campo vettoriale tridimensio 3 nale Φ = f + 0k ∈ C 1 (Ω) , che `e costante rispetto alla variabile z e per il quale si ha banalmente div Φ = div f . Allora 1 div f dx dy = div f dx dy dz = div Φ dx dy dz . 0
Ω
Ω
Q
D’altro canto, detta N la normale uscente da ∂Q, `e facile vedere che f · n = Φ · N su ∂Ω × (0, 1), mentre Φ · N = 0 su Ω × {0} e Ω × {1}. Pertanto 1 f · n dγ = f · n dγ = Φ · N dσ = Φ · N dσ . ∂Ω
0
∂Ω
∂Ω×(0,1)
∂Q
Il risultato segue applicando il Teorema della divergenza al campo Φ in Q. 2 Esempio 9.33 Vogliamo calcolare il flusso del vettore f (x, y, z) = 2i − 5j + 3k attraverso la superficie laterale Σ del solido Ω definito dalle condizioni x2 + y 2 < 9 − z , 0 < z < 8.
9.5 I Teoremi di Gauss, Green e Stokes
405
Notiamo che si ha ∂Ω = Σ ∪ B0 ∪ B1 , dove B0 `e il cerchio di centro l’origine e raggio 3 nel piano z = 0, mentre B1 `e il cerchio di centro l’origine e raggio 1 nel piano z = 8. Poich´e div f = 0, dal Teorema della divergenza si ha 0= div f dx dy dz = f ·n= f ·n+ f ·n+ f · n. Ω
∂Ω
Essendo
Σ
f ·n= B0
B0
(−3) = −27π
f ·n=
e
B0
concludiamo che
B1
B1
3 = 3π , B1
f · n = 24π .
2
Σ
9.5.3 Il Teorema del rotore; Teorema di Green Continuiamo con la deduzione di relazioni notevoli dalla Proposizione 9.30. Sia Ω ⊂ R3 un aperto G-ammissibile, e f un campo vettoriale di classe C 1 in Ω. Ricordiamo che la prima componente del rotore di f vale (rot f )1 =
∂f3 ∂f2 − . ∂x2 ∂x3
Pertanto, integrando su Ω e applicando ripetutamente la proposizione citata, otteniamo ∂f3 ∂f2 dx dy dz = (rot f )1 dx dy dz = − (n ∧ f )1 dσ . ∂x3 Ω Ω ∂x2 ∂Ω Analoghe identit` a valgono per le altre componenti del rotore di f . Abbiamo quindi ottenuto il seguente risultato, che possiamo chiamare Teorema del rotore. Teorema 9.34 Sia Ω ⊂ R3 un aperto G-ammissibile, e sia n normale 3 esterna a ∂Ω. Per ogni campo vettoriale f ∈ C 1 (Ω) , vale la relazione rot f dx dy dz = n ∧ f dσ . (9.20) Ω
∂Ω
A livello mnemonico, si noti che scrivendo il rotore di f come ∇ ∧ f , nel passaggio dall’integrale su Ω a quello su ∂Ω si sostituisce al vettore ∇ il vettore n. Il Teorema di Green pu` o essere considerato come la versione bidimensionale di tale risultato, come mostrato nei complementi in rete, e pu`o essere facilmente dedotto da questo con lo stesso artificio usato nella dimostrazione del Teorema 9.32. Sia Ω ⊂ R2 un aperto G-ammissibile. Osserviamo che, detta n = n1 i + n2 j la normale esterna a ∂Ω, il versore t = −n2 i + n1 j `e tangente a ∂Ω ed `e orientato nel verso positivo di percorrenza di ∂Ω ossia tale che un osservatore tridimensionale
406
9 Calcolo integrale su curve e superfici
t n
P
Ω
∂Ω
Figura 9.11. Normale esterna e verso positivo di percorrenza di ∂Ω
che cammina su ∂Ω rimanendo dalla parte del versore k vede localmente Ω sempre alla sua sinistra (si veda la Figura 9.11). Ricordiamo che, per ogni campo vettoriale 2 f = f1 i + f2 j ∈ C 1 (Ω) , abbiamo definito in (6.5) la funzione scalare rot f = ∂f2 ∂f1 − . ∂x ∂y Abbiamo cos`ı tutti gli elementi per enunciare il Teorema di Green. Teorema 9.35 (di Green) Sia Ω ⊂ R2 un aperto G-ammissibile il cui bordo ∂Ω sia orientato secondo il verso positivo di percorrenza. Sia f = f1 i + f2 j 2 un campo vettoriale appartenente a C 1 (Ω) . Allora vale la relazione 4 ∂f1 ∂f2 − dx dy = f ·τ . (9.21) ∂x ∂y Ω ∂Ω Dim.
; Complementi al Cap. 9
Presentiamo un’utile applicazione del teorema, che permette di ridurre il calcolo dell’area di un aperto nel piano al calcolo di una circuitazione. Sia Ω ⊂ R2 un aperto G-ammissibile come nelle ipotesi del teorema. Allora 4 area(Ω) = ∂Ω
1 (−yi + xj) · τ . 2
(9.22)
Infatti, applicando il Teorema di Green al campo f (x, y) = −yi + xj il cui rotore rot f `e costante e vale 2, si ha
9.5 I Teoremi di Gauss, Green e Stokes
4
407
f ·τ =2
∂Ω
dx dy , Ω
da cui segue la (9.22). Si noti che un qualunque campo avente rotore costante in Ω pu` o essere usato per ottenere altre espressioni dell’area di Ω. Ad esempio, 4 4 area(Ω) = (−y)i · τ = xj · τ . ∂Ω
∂Ω
Esempio 9.36 2
2
Calcoliamo l’area dell’ellisse E = {(x, y) ∈ R2 : xa2 + yb2 ≤ 1}. Possiamo parametrizzarne la frontiera mediante γ(t) = a cos t i+b sin t j, t ∈ [0, 2π]. Allora, 2π 1 1 2π (ab sin2 t + ab cos2 t) dt = ab dt = πab . area(E) = 2 2 0 2 0 9.5.4 Il Teorema di Stokes Illustriamo nel seguito tale teorema per una classe piuttosto ampia di superfici, vale a dire per le calotte S-ammissibili introdotte nella Definizione 9.28. Prescindendo dalla definizione rigorosa, il lettore pu` o pensare una calotta S-ammissibile come l’unione di un numero finito di superfici cartesiane regolari, che formano una calotta orientabile e semplice. Fissato un suo verso di attraversamento, diremo che il bordo `e percorso positivamente se un osservatore ideale che cammina su di esso stando dalla parte del versore normale, vede localmente la superficie alla sua sinistra. Riformuliamo innanzitutto il Teorema di Green, visto sopra, in un modo equivalente, che ce lo far` a apparire come un caso particolare del Teorema di Stokes. Osserviamo che possiamo identificare la chiusura dell’aperto G-ammissibile Ω, contenuto in R2 , con la calotta Σ = Ω × {0} contenuta in R3 (si veda la Figura 9.12); essa ammette la parametrizzazione banale σ : Ω → Σ, σ(u, v) = (u, v, 0). Tale calotta `e ovviamente regolare, semplice e orientabile; pertanto, risulta essere una calotta S-ammissibile. Il suo bordo `e dato da ∂Σ = ∂Ω × {0}. Scegliamo come verso di attraversamento di Σ quello concorde con il verso positivo di percorrenza dell’asse z, e pertanto, indicando con n il corrispondente versore normale a Σ, si avr` a n = k. Inoltre, il verso di percorrenza positivo del bordo ∂Ω di Ω coincide ovviamente con il verso di percorrenza positivo del bordo ∂Σ di Σ. Introdotto il campo vettoriale tridimensionale Φ = f +0k (costante nella variabile z) e osservato che rot f = (rot Φ)3 = (rot Φ) · n, possiamo allora scrivere la (9.21) come 4 (rot Φ) · n = Φ·τ , Σ
∂Σ
che – come vedremo ora – `e precisamente la relazione espressa dal Teorema di Stokes.
408
9 Calcolo integrale su curve e superfici z
n y Σ
x
∂Σ Figura 9.12. Il Teorema di Green come caso particolare del Teorema di Stokes
Enunciamo dunque il Teorema di Stokes, di cui forniremo la dimostrazione nei complementi in rete solo nel caso in cui le singole facce della calotta siano superfici cartesiane sufficientemente regolari. Teorema 9.37 (di Stokes) Sia Σ ⊂ R3 una calotta S-ammissibile, in cui si sia fissato un verso di attraversamento, definito dal versore normale n; corrispondentemente, si adotti il verso di percorrenza positivo del bordo ∂Σ di Σ. Sia poi f un campo vettoriale tridimensionale, definito in un aperto 3 A ⊆ R3 contenente Σ, e tale che f ∈ C 1 (A) . Allora, vale la relazione 4 (rot f ) · n = f ·τ . (9.23) Σ
∂Σ
In altri termini, il flusso del rotore di f attraverso la superficie uguaglia la circuitazione di f lungo il bordo della superficie. Dim.
; Complementi al Cap. 9
Esempio 9.38 Riprendiamo l’Esempio 9.33 con le stesse notazioni, e usiamo il Teorema di Stokes per giungere allo stesso risultato. L’idea `e quella di scrivere il campo f = 2i − 5j + 3k come f = rot Φ. Poich´e le componenti di f sono costanti, `e naturale cercare Φ nella forma Φ(x, y, z) = (α1 x + α2 y + α3 z)i + (β1 x + β2 y + β3 z)j + (γ1 x + γ2 y + γ3 z)k ; si ha allora rot Φ = (γ2 − β3 )i + (α3 − γ1 )j + (β1 − α2 )k , da cui γ2 − β3 = 2, α3 − γ1 = −5, β1 − α2 = 3. Una soluzione `e dunque Φ(x, y, z) = −5zi + 3xj + 2yk.
9.6 Campi conservativi e potenziale
409
(Si noti che l’esistenza di un campo Φ tale che f = rot Φ `e assicurata dai risultati visti nel § 6.3.1, essendo div f = 0 e Ω convesso.) Si ha quindi dal Teorema di Stokes f ·n=
rot Φ · n =
Σ
Σ
Φ·τ . ∂Σ
Ora ∂Σ = ∂B0 ∪ ∂B1 , dove i cerchi B0 e B1 sono definiti nell’Esempio 9.33; osserviamo che ∂B0 `e percorso in senso antiorario, mentre ∂B1 `e percorso in senso orario. Abbiamo quindi 2π Φ·τ = (0i + 9 cos t j + 6 sin t k) · (3 cos t i + 3 sin t j + 0k) dt 0
B0
2π
cos2 t dt = 27π
= 27 e
0
2π
Φ·τ = −
(−40i + 3 cos t j + 2 sin t k) · (cos t i + sin t j + 0k) dt 0
B1
2π
2π
cos t dt − 3
= 40 0
cos2 t dt = −3π , 0
da cui ancora
f · n = 24π .
2
∂Σ
9.6 Campi conservativi e potenziale Nel § 6.3.1, Definizione 6.10, abbiamo introdotto il concetto di campo conservativo in un aperto Ω di Rn , come di un campo f che `e il gradiente di una funzione scalare ϕ, detta potenziale di f ; in altri termini, si ha f = grad ϕ ,
in Ω .
Gli integrali di linea di un campo conservativo godono di particolari propriet` a. Quella che enunciamo ora pu` o essere considerata per certi versi l’estensione del Teorema fondamentale del calcolo integrale agli archi di curva (si veda in particolare Vol. I, Corollario 9.39). Proposizione 9.39 Sia f = grad ϕ un campo conservativo definito e continuo in Ω ⊆ Rn . Per ogni arco γ : [a, b] → Ω regolare (a tratti) si ha f · τ = ϕ γ(b) − ϕ γ(a) . γ
410
9 Calcolo integrale su curve e superfici
Dim.
` sufficiente considerare il caso di una curva regolare. Ricordiamo la forE mula (9.8) che permette il calcolo dell’integrale di linea. Usando la regola della catena (in particolare la (6.13)), si ha d (grad ϕ) γ(t) · γ (t) = ϕ γ(t) dt e dunque
γ
b
f ·τ = a
b d ϕ γ(t) dt = ϕ γ(t) = ϕ γ(b) − ϕ γ(a) . dt a
2
Corollario 9.40 Sotto le ipotesi della proposizione precedente, se Γ ⊂ Rn `e un arco regolare (a tratti) e semplice, orientato secondo il versore tangente τ , allora si ha f · τ = ϕ(P1 ) − ϕ(P0 ) , Γ
dove P0 e P1 sono rispettivamente l’estremo iniziale e finale di Γ . Una elementare ma significativa applicazione di questo corollario `e che il potenziale di un campo conservativo `e definito a meno di una costante su ciascuna componente connessa di Ω. Dunque i potenziali si caratterizzano in maniera analoga a quanto visto per le primitive in R. Il risultato preciso `e espresso dalla proposizione seguente. Proposizione 9.41 Due campi scalari ϕ e ψ sono potenziali di uno stesso campo vettoriale continuo f in Ω se e solo se per ogni componente connessa Ωi di Ω esiste una costante ci tale che ϕ − ψ = ci in Ωi . Dim.
` ovvio che se ϕ e ψ differiscono per una costante su Ωi , allora ∇ϕ = E ∇ψ. Per mostrare il viceversa, fissiamo arbitrariamente un punto P0 in Ωi ; dato un qualunque punto P ∈ Ωi , sia Γ una poligonale avente come estremo iniziale P0 e come estremo finale P (la sua esistenza `e garantita dall’ipotesi che Ωi sia connesso, secondo la Definizione 4.13). Allora il corollario precedente ci assicura che f · τ = ϕ(P ) − ϕ(P0 ) = ψ(P ) − ψ(P0 ) , Γ
da cui ϕ(P ) − ψ(P ) = ϕ(P0 ) − ψ(P0 ) = ci .
2
La Proposizione 9.39 e il Corollario 9.40 mostrano che l’integrale di linea di un campo conservativo dipende solo dagli estremi dell’arco e non dal modo in cui l’arco unisce i due estremi. Detto in altri termini, due archi aventi gli stessi estremi
9.6 Campi conservativi e potenziale
411
danno luogo allo stesso integrale di linea del campo considerato. In particolare, se ` un fatto di si considerano archi chiusi, la corrispondente circuitazione sar` a nulla. E notevole importanza che ciascuna delle due ultime affermazioni sia una condizione che caratterizza i campi conservativi. Per stabilire questo risultato, introduciamo alcune notazioni che renderanno pi` u agevole lo sviluppo degli argomenti successivi. Se γ : [a, b] → Rn `e un arco di estremi P0 = γ(a) e P1 = γ(b), useremo la notazione γ[P0 , P1 ] per indicare che γ congiunge P0 e P1 . Notiamo che l’arco −γ opposto di γ (si ricordi la Definizione 6.25) congiunge P1 a P0 , ossia si ha −γ[P1 , P0 ] = γ[P0 , P1 ]. Dati due archi γ1 = γ1 [P0 , P1 ] e γ2 = γ2 [P1 , P2 ], indichiamo con γ ∼ γ1 + γ2 un qualunque arco γ avente la seguente propriet` a: se γ : [a, b] → Rn , allora esiste c ∈ (a, b) tale che γ|[a,c] ∼ γ1 e γ|[c,b] ∼ γ2 . (Un esempio di tale γ pu` o essere facilmente ottenuto mediante trasformazioni lineari e crescenti degli intervalli [a, c] e [c, b] rispettivamente sugli intervalli di definizione di γ1 e γ2 .) Osserviamo che si ha γ(c) = P1 e γ = γ[P0 , P1 ], vale a dire γ congiunge P0 a P2 passando per P1 ; inoltre i supporti Γ, Γ1 e Γ2 degli archi soddisfano Γ = Γ1 ∪ Γ2 . La notazione γ ∼ γ1 − γ2 sar`a sinonimo di γ ∼ γ1 + (−γ2 ) qualora si abbia γ1 = γ1 [P0 , P1 ] e γ2 = γ2 [P2 , P1 ]. Ricordando la propriet` a di additivit` a degli integrali curvilinei e di dipendenza degli integrali di linea da parametrizzazioni congruenti (9.5), avremo allora che f ·τ = f ·τ ± f ·τ se γ ∼ γ1 ± γ2 . (9.24) γ
γ1
γ2
Possiamo ora dimostrare il seguente risultato. Teorema 9.42 Sia f un campo definito e continuo in un aperto Ω ⊆ Rn . Sono condizioni equivalenti: i) f `e conservativo; ii) dati comunque due archi γ1 e γ2 regolari (a tratti) con sostegno contenuto in Ω, aventi estremi coincidenti, risulta f ·τ = f ·τ ; γ1
γ2
iii) Per ogni arco chiuso γ regolare (a tratti) e con sostegno contenuto in Ω, risulta 4 f · τ = 0. γ
Dim.
L’implicazione i) ⇒ ii) segue facilmente dalla Proposizione 9.39 applicata a γ1 e γ2 (si veda la Figura 9.13, a sinistra). Per dimostrare l’implicazione inversa, costruiamo esplicitamente un potenziale per il campo f . Sia Ωi una componente connessa di Ω e sia P0 ∈ Ωi un punto fissato. Per ogni punto P ∈ Ωi di coordinate x = (x1 , . . . , xn ), poniamo f ·τ ϕ(x) = γ
412
9 Calcolo integrale su curve e superfici γ[P,P +ΔP ] = (x + tΔx)e1 P γ1
P + ΔP
P1 γ[P0 ,P ]
γ[P0 ,P +ΔP ]
P0 γ2 P0 Figura 9.13. Dimostrazione del Teorema 9.42
dove γ = γ[P0 ,P ] `e un qualunque arco regolare (a tratti) con sostegno contenuto in Ωi che congiunge P0 a P . La definizione di ϕ(x) non dipende dalla scelta dell’arco γ proprio per l’ipotesi ii). Mostriamo che grad ϕ = f , limitandoci a esplicitare la verifica della prima componente di tale uguaglianza, ossia ∂ϕ (x) = f1 (x) . ∂x1 Sia Δx1 = 0 un incremento tale che il punto P + ΔP = x + Δx1 e1 appartenga ancora a Ωi , e sia γ[P,P +ΔP ] la curva γ(t) = x + te1 che unisce P a P + ΔP , con t ∈ [0, Δx1 ] se Δx1 > 0 oppure t ∈ [Δx1 , 0] se Δx1 < 0. Siano inoltre γ[P0 ,P ] e γ[P0 ,P +ΔP ] due curve regolari e semplici che collegano P0 rispettivamente con P e P + ΔP (si veda la Figura 9.13, a destra). Allora si ha γ[P0 ,P +ΔP ] ∼ γ[P0 ,P ] + γ[P,P +ΔP ] e dunque, grazie alla (9.24) e alla (9.8), ϕ(x + Δx1 e1 ) − ϕ(x) 1 = f ·τ − f ·τ Δx1 Δx1 γ[P ,P +ΔP ] γ[P ,P ] =
1 Δx1
0
γ[P,P +ΔP ]
f ·τ =
1 Δx1
0
Δx1
f1 (x1 + t, x2 , . . . , xn ) dt . 0
Osservando che l’ultimo termine `e la media integrale della funzione t → f1 (x1 + t, x2 , . . . , xn ) sull’intervallo di estremi 0 e Δx1 , si ha, grazie alla continuit` a di f e al Teorema della media integrale (Vol. I, Teorema 9.35), ϕ(x + Δx1 e1 ) − ϕ(x) = f1 (x1 + t¯, x2 , . . . , xn ) Δx1 per un certo t¯ tale che |t¯| ≤ |Δx1 |. Passando al limite per Δx1 → 0, si ottiene il risultato. L’equivalenza ii) ⇐⇒ iii) segue immediatamente dalla (9.24), osservando che se γ1 e γ soddisfano la ii) allora ogni γ ∼ γ1 − γ2 soddisfa la iii), mentre se γ soddisfa la iii) allora, come visto sopra, `e la differenza di due archi γ1 e γ2 aventi gli stessi estremi. 2
9.6 Campi conservativi e potenziale
413
Poniamoci ora il problema di caratterizzare i campi conservativi. Iniziamo con la seguente condizione necessaria. Propriet` a 9.43 Sia f un campo vettoriale di classe C 1 in Ω ⊆ Rn . Allora se f `e conservativo, si ha ∂fi ∂fj = ∂xj ∂xi Dim.
∀i = j .
(9.25)
∂ϕ Sia ϕ un potenziale di f , dunque tale che fi = ∂x per i = 1, . . . , n; in i 2 particolare, da ci` o segue che ϕ ∈ C (Ω). La (9.25) non `e altro allora che una riformulazione del Teorema di Schwarz 5.17. 2
Notiamo che la propriet`a precedente `e gi` a stata enunciata nel § 6.3.1, in dimensione due (Proposizione 6.8) e tre (Proposizione 6.7); precisamente, si `e ivi stabilito che condizione necessaria affinch´e un campo vettoriale di classe C 1 sia conservativo `e che sia irrotazionale, cio`e rot f = 0 in Ω. ` naturale chiedersi se e sotto quali condizioni la propriet` E a di irrotazionalit` a sia anche sufficiente per avere un campo conservativo. Proseguiamo la nostra discussione supponendo, d’ora in avanti, che Ω sia un aperto contenuto in R2 oppure R3 . Di norma considereremo il caso tridimensionale, ma metteremo in evidenza alcune particolarit` a del caso bidimensionale. Facendo riferimento alla definizione equivalente di conservativit` a data nel Teorema 9.42 iii), notiamo che se γ `e un qualunque arco regolare e semplice il cui sostegno Γ sia bordo di una calotta Σ regolare e semplice tutta contenuta in Ω, allora il Teorema di Stokes 9.37 ci assicura che, se f `e irrotazionale, 4 f ·τ = rot f · n = 0 . γ
Σ
z
Σ Γ
x
y
Figura 9.14. La calotta Σ, di bordo Γ , `e attraversata dall’asse z
414
9 Calcolo integrale su curve e superfici
Tuttavia, non `e detto che ogni arco chiuso regolare e semplice Γ contenuto in Ω sia bordo di una calotta regolare e semplice Σ tutta contenuta in Ω; la struttura dell’aperto Ω pu` o infatti impedire il verificarsi di tale propriet` a. Se ad esempio Ω `e tutto lo spazio R3 privato dell’asse z, `e evidente che ogni calotta che ha come bordo un arco chiuso che gira attorno a tale asse, deve necessariamente essere attraversata da esso, e dunque non pu` o essere tutta contenuta in Ω (si veda la Figura 9.14); in tal caso, il Teorema di Stokes non `e applicabile. Ci` o di per s´e non implica che la circuitazione di un particolare campo irrotazionale attorno all’asse z non possa essere nulla; ci`o significa soltanto che non possiamo usare il Teorema di Stokes per dimostrare che `e nulla. Tuttavia, se nello stesso Ω consideriamo il campo y x f (x, y, z) = − 2 i+ 2 j + 0k, 2 x +y x + y2 si verifica facilmente che rot f = 0 in Ω, ma 4 f · τ = 2π Γ
se Γ `e la circonferenza nel piano xy di centro l’origine e raggio unitario, percorsa una volta in senso antiorario. Dunque abbiamo un esempio (tra l’altro molto rilevante dal punto di vista fisico, essendo f il campo magnetico generato da una corrente che percorre un filo infinito disposto lungo l’asse z) di campo vettoriale irrotazionale ma non conservativo in Ω. Queste considerazioni ci suggeriscono di restringere la classe degli aperti Ω considerati, in modo che in tale classe sia possibile dimostrare l’implicazione f
irrotazionale
⇒
f
conservativo .
A tale scopo diamo la seguente definizione. Definizione 9.44 Un aperto connesso Ω ⊆ Rn dicesi semplicemente connesso se il sostegno Γ di ogni arco contenuto in Ω pu` o essere deformato con continuit` a fino a ridursi ad un punto, in modo da rimanere sempre all’interno di Ω. In modo pi` u rigoroso, possiamo dire che ogni arco chiuso γ : I → Rn fa parte, come γ = γ1 , di una famiglia ad un parametro di archi chiusi γs : I → Rn per 0 ≤ s ≤ 1, avente le seguenti propriet` a: i) la funzione (t, s) → γs (t) da I × [0, 1] in Rn `e continua; ii) il supporto Γs = γs (I) di ogni arco `e contenuto in Ω; iii) γ0 `e costante, ossia Γ0 `e ridotto ad un punto. Diciamo in tal caso che γ `e omotopa ad un punto, e chiamiamo omotopia la funzione (t, s) → γs (t).
9.6 Campi conservativi e potenziale
415
Figura 9.15. Aperto semplicemente connesso (al centro) e non (a sinistra e a destra)
La propriet` a di semplice connessione di un aperto pu` o essere definita in vari altri modi equivalenti. Ad esempio, se siamo in dimensione 2, possiamo equivalentemente chiedere che • il complementare di Ω in R2 `e un insieme connesso, oppure che • se γ `e un arco di Jordan contenuto in Ω, allora tutto il suo interno Σi `e contenuto in Ω. Intuitivamente parlando, un aperto connesso del piano `e semplicemente connesso se non ha “buchi”. Ad esempio, una corona circolare (aperta) non `e semplicemente connessa (si veda la Figura 9.15, a sinistra). La situazione in dimensione tre `e ben pi` u articolata. Ad esempio, la regione aperta contenuta tra due sfere concentriche `e semplicemente connessa, mentre un toro aperto non lo `e (si veda la Figura 9.15, al centro e a destra). Analogamente, l’aperto ottenuto da R3 togliendo un punto `e semplicemente connesso, mentre quello ottenuto togliendo una retta non lo `e. Si pu` o dimostrare che un aperto connesso Ω di R3 `e semplicemente connesso se e solo se per ogni arco di Jordan regolare (a tratti) con sostegno Γ contenuto in Ω, esiste una calotta regolare σ : R → R3 il cui sostegno Σ `e contenuto in Ω e ha Γ come bordo. Questa caratterizzazione conduce in particolare al risultato (piuttosto sorprendente) secondo cui un qualunque filo nello spazio, che si richiude su se stesso anche
Figura 9.16. Arco chiuso semplice (a sinistra) e calotta regolare di cui l’arco `e il bordo (a destra)
416
9 Calcolo integrale su curve e superfici
P0 P1 P2 Figura 9.17. Aperto stellato rispetto a P0
formando nodi (leggermente aperti, per garantire la semplicit` a dell’arco) `e il bordo di una calotta regolare. Ci` o `e possibile perch´e non si richiede alla calotta di essere semplice, ed in effetti il suo sostegno pu`o essere costituito da parti che si intersecano trasversalmente (vedi Figura 9.16). Tornando al caso generale di un aperto Ω ⊆ Rn , esistono condizioni geometriche che assicurano la semplice connessione di Ω. Ad esempio, si pu` o verificare che sono semplicemente connessi gli aperti convessi e gli aperti stellati rispetto ad un punto; questi ultimi sono aperti in cui esiste un punto P0 ∈ Ω tale che il segmento P0 P che unisce P0 ad un qualunque P ∈ Ω `e tutto contenuto in Ω (vedasi la Figura 9.17). Notiamo che un insieme convesso `e stellato rispetto ad ogni suo punto. Siamo ora in grado di enunciare il seguente importante risultato. Teorema 9.45 Sia Ω ⊆ Rn , con n = 2 oppure 3, un aperto semplicemente connesso. Un campo vettoriale f di classe C 1 in Ω `e conservativo se e solo se `e irrotazionale. Dim.
; Complementi al Cap. 9
Un analogo risultato assicura l’esistenza di un potenziale vettore per un campo solenoidale. 9.6.1 Calcolo esplicito del potenziale Supponiamo che f sia un campo conservativo in un aperto Ω ⊆ Rn , che senza ledere la generalit`a supponiamo connesso. Ci poniamo il problema di trovare un potenziale di f ; gi` a sappiamo che esso sar`a definito a meno di una costante arbitraria. Illustriamo due diversi metodi. Il primo utilizza la rappresentazione del potenziale che abbiamo gi` a fatto intevenire nelle dimostrazioni dei Teoremi 9.42 e 9.45. Precisamente, si fissa un punto
9.6 Campi conservativi e potenziale
417
P0 e si definisce il potenziale in ogni punto P ∈ Ω di coordinate x ponendo f ·τ ,
ϕ(x) = Γ[P0 ,P ]
dove Γ[P0 ,P ] ⊂ Ω `e un arco semplice e regolare (a tratti) che congiunge P0 a P , scelto in modo da rendere il calcolo dell’integrale il pi` u semplice possibile (ricordiamo che l’integrale non dipende dal cammino per la ii) del Teorema 9.42). In molte situazioni, sar` a conveniente considerare una poligonale avente ogni suo lato parallelo ad un asse coordinato; in tal caso, infatti, f · τ dipender` a su ogni lato dalla sola componente di f di indice uguale a quello dell’asse. Esempio 9.46 Consideriamo il campo vettoriale f (x, y) = y 1 + 2xy i + x 1 + 2xy j il quale `e definito nella regione aperta Ω compresa tra i due rami dell’iperbole ` facile verificare che Ω `e stellato rispetto all’origine e rot f = 0 xy = −1/2. E in Ω; dunque il campo `e conservativo. Per calcolare un potenziale, usiamo come arco di integrazione il segmento che unisce l’origine al generico punto P = (x, y), parametrizzato da γ(t) = (tx, ty) con 0 ≤ t ≤ 1. Allora 1 1 2xyt ϕ(x, y) = f γ(t) · γ (t) dt = dt . 1 + 2xyt2 0 0 Eseguendo la sostituzione u = 1 + 2xyt2 , da cui du = 4xyt dt si ha 1+2xy √ 1+2xy 1 √ du = ϕ(x, y) = u = 1 + 2xy − 1 . 2 u 1 1 Il generico potenziale di f in Ω sar`a quindi ϕ(x, y) = 1 + 2xy + c . 2 Il secondo metodo, che in vari casi si rivela pi` u agevole del precedente, consiste nell’effettuare integrazioni indefinite nelle singole variabili, usando in successione le relazioni ∂ϕ ∂ϕ ∂ϕ = f1 , = f2 , . . . , = fn . ∂x1 ∂x2 ∂xn Illustriamo l’idea del procedimento in dimensione 2 e forniamo un esempio esplicito in dimensione 3. Dalla relazione ∂ϕ (x, y) = f1 (x, y) ∂x otteniamo ϕ(x, y) = F1 (x, y) + ψ1 (y) ,
418
9 Calcolo integrale su curve e superfici
dove F1 (x, y) `e una qualunque primitiva di f1 (x, y) rispetto alla variabile x, ossia ∂F1 essa soddisfa (x, y) = f1 (x, y), mentre ψ1 (y) `e una funzione per il momento ∂x incognita, che rappresenta la costante di integrazione rispetto a x, e dunque dipende solo da y. Per determinare tale funzione, deriviamo l’ultima relazione rispetto a y, ottenendo dψ1 ∂ϕ ∂F1 ∂F1 (y) = (x, y) − (x, y) = f2 (x, y) − (x, y) = g(y) . dy ∂y ∂y ∂y ∂F1 (x, y) dipende solo da y, in quanto, ∂y usando la (9.25), la sua derivata rispetto a x si annulla, essendo Notiamo che in effetti la funzione f2 (x, y)−
∂ ∂F1 ∂f2 ∂f1 ∂f2 (x, y) − (x, y) = (x, y) − (x, y) = 0 . ∂x ∂y ∂x ∂x ∂y Detta G(y) una qualunque primitiva di g(y), avremo quindi ψ1 (y) = G(y) + c e dunque in definitiva ϕ(x, y) = F1 (x, y) + G(y) + c . In dimensione superiore, nelle successive integrazioni si determinano funzioni incognite ψ1 (x2 , . . . , xn ), ψ2 (x3 , . . . , xn ), . . . , ψn−1 (xn ) dipendenti da un numero decrescente di variabili. Esempio 9.47 Consideriamo il campo vettoriale in R3 f (x, y, z) = 2yz i + 2z(x + 3y)j + y(2x + 3y) + 2z k . ` immediato verificare che rot f = 0 e dunque il campo `e conservativo. E Integrando la relazione ∂ϕ (x, y, z) = 2yz ∂x otteniamo ϕ(x, y, z) = 2xyz + ψ1 (y, z). Derivando tale identit` a rispetto a y e ∂ϕ ∂ψ1 usando il fatto che (x, y, z) = 2xz + 6yz otteniamo (y, z) = 6yz, da cui ∂y ∂y ψ1 (y, z) = 3y 2 z + ψ2 (z) . ∂ϕ Derivando ora questa identit` a rispetto a z e usando il fatto che (x, y, z) = ∂z 2 2xy + 3y + 2z, abbiamo dψ2 (z) = 2z , dz ossia ψ2 (z) = z 2 + c. Concludiamo che tutti i potenziali di f sono dati dalla formula ϕ(x, y, z) = 2xyz + 3y 2 z + z 2 + c . 2
9.7 Esercizi
419
Concludiamo questo paragrafo segnalando una classe di campi conservativi, per i quali il calcolo del potenziale `e particolarmente agevole. Essi sono i campi radiali, vale a dire della forma f (x) = g(x) x , dove g = g(r) `e una funzione reale definita e continua su un intervallo I di [0, +∞). In altri termini, un campo `e radiale se in ogni punto P esso `e parallelo al vettore ` facile verificare OP e il suo modulo dipende solo dalla distanza di P dall’origine. E n che f `e conservativo in Ω = {x ∈ R : x ∈ I} determinandone esplicitamente un potenziale. Precisamente, poniamo ϕ(x) = G(x) dove G = G(r) `e una qualunque primitiva della funzione rg(r) su I. Si ha infatti, usando la regola della catena e ricordando l’Esempio 5.3 i), ∇ϕ(x) = G (x)
x x = xg(x) = f (x) . x x
x Ad esempio, f (x) = ammette come potenziale ϕ(x) = 1 + x2 . 2 1 + x
9.7 Esercizi 1. Calcolare l’integrale curvilineo della funzione x2 (1 + 8y) f (x, y, z) = 1 + y + 4x2 y sull’arco γ definito da γ(t) = (t, t2 , log t) , t ∈ [1, 2]. 2. Calcolare l’integrale curvilineo della funzione f (x, y) = x sull’arco chiuso Γ definito come l’unione dell’arco di parabola di equazione y = 4 − x2 percorso da A = (−2, 0) a C = (2, 0) e dell’arco di circonferenza di equazione x2 +y 2 = 4 di estremi C e A. 3. Calcolare l’integrale curvilineo della funzione f (x, y) = x + y sull’arco chiuso Γ , contenuto nel primo quadrante, unione del segmento di estremi O = (0, 0) e A =√ (1, 0), dell’arco di ellisse di equazione 4x2 + y 2 = 4 di estremi A e √ B = ( 22 , 2) e del segmento che unisce B all’origine.
420
9 Calcolo integrale su curve e superfici
1 sull’arco x2 + y 2 + 1 chiuso e semplice √ γ il cui sostegno `e l’unione del segmento di estremi l’origine e il punto A = ( 2, 0), dell’arco di cerchio di equazione x2 + y 2 = 2 di estremi A e B = (1, 1) e del segmento che unisce B all’origine.
4. Calcolare l’integrale curvilineo della funzione f (x, y) =
5. Sia γ1 : [0, 23 π] → R2 definito da γ1 (t) = (t cos t, t sin t). Siano inoltre γ2 e γ3 gli archi aventi rispettivamente come sostegni i segmenti congiungenti B = (− π3 , √π3 ) con C = (−π, 0) e C con A = (0, 0). Calcolare la lunghezza dell’arco γ ∼ γ1 + γ2 + γ3 , avente come sostegno l’unione Γ dei sostegni di γ1 , γ2 e γ3 e calcolare l’area della regione interna a Γ . 6. Calcolare le coordinate del baricentro dell’arco Γ , parametrizzato come γ(t) = et cos t i − et sin t j, t ∈ [0, π/2], e avente densit` a di massa unitaria. 7. Si consideri l’arco γ avente sostegno Γ formato dall’unione del segmento di √ estremi l’origine e A = (2 3, −2) e dell’arco di parabola di equazione cartesiana y 2 = 2x congiungente l’origine a B = ( 12 k 2 , k), con densit` a di massa unitaria. Determinare il parametro k in modo che il baricentro di Γ cada sull’asse x. 8. Determinare il momento di inerzia rispetto all’asse z dell’arco Γ , parametriz√ zato come γ(t) = t cos t i + t sin t j + t k, t ∈ [0, 2] e avente densit` a di massa unitaria. 9. Calcolare l’integrale di linea del campo f (x, y) = (x2 , xy) sull’arco γ(t) = (t2 , t), t ∈ [0, 1]. 10. Calcolare l’integrale di linea del campo f (x, y, z) = (z, y, 2x) sull’arco γ(t) = (t, t2 , t3 ), t ∈ [0, 1]. √ 11. Calcolare l’integrale di linea del campo f (x, y, z) = (2 z, x, y) sull’arco γ(t) = (− sin t, cos t, t2 ), t ∈ [0, π2 ]. 12. Calcolare l’integrale di linea del campo f (x, y) = (xy 2 , x2 y) sull’arco Γ formato dai tre segmenti consecutivi di estremi A = (0, 1), B = (1, 1), C = (0, 2) e D = (1, 2). 13. Calcolare l’integrale di linea del campo f (x, y) = (0, y) sull’arco chiuso e semplice il cui sostegno `e l’unione del segmento di estremi l’origine e A =√ (1,√0), dell’arco di circonferenza di equazione x2 +y 2 = 1 di estremi A e B = ( 22 , 22 ) e del segmento che unisce B all’origine.
9.7 Esercizi
421
14. Determinare il parametro k in modo che il lavoro eseguito dalla forza f (x, y) = (x2 − xy)i + (y 2 − x2 )j nello spostamento lungo l’arco di parabola y 2 = 2kx congiungente l’origine con il punto P = (k/2, k), valga 9/5. 15. Determinare il lavoro compiuto dalla forza f (x, y) = (ax2 y − sin x)i + (x3 + y log y)j nello spostamento lungo l’arco Γ , unione degli archi Γ1 , Γ2 e Γ3 aventi rispettivamente equazione cartesiana y = x2 , y = 1 e x = 0. Determinare inoltre il valore del parametro a in modo che tale lavoro risulti nullo. 16. Sia f (x, y, z) = z(y − 2x). Calcolare l’integrale superficiale di f su σ definita 2 su R = {(u, v) ∈ R2 : u ≤ 0, v ≥ 0, u2 + v 2 ≤ 16, u4 + v 2 ≥ 1} come √ σ(u, v) = (u, v, 16 − u2 − v 2 ). 17. Calcolare l’integrale superficiale della funzione y+1 f (x, y, z) = # 2 1 + x4 + 4y 2 2
su Σ, parte del paraboloide ellittico z = − x4 − y 2 situata al di sopra del piano z = −1. 18. Calcolare l’area della calotta Σ parte della superficie di equazione z = 12 y 2 , intercettata dal prisma (infinito) individuato dai piani di equazioni x + y = 4, y − x = 4, y = 0. 19. Calcolare l’area della parte della superficie di equazione cartesiana z = x2 + y 2 situata al di sotto del piano z = √12 (y + 2). 20. Calcolare il momento d’inerzia rispetto all’asse z della parte di superficie Σ del cono z 2 = 3(x2 + y 2 ) per cui si ha 0 ≤ z ≤ 3 e y ≥ x (densit` a di massa unitaria). 21. Determinare la coordinata xG del baricentro della parte di superficie di equazione x = 4 − y 2 − z 2 che si proietta sul piano yz nella regione R unione di R1 = {(y, z) ∈ R2 : y ≤ 0, 1 − (y + 1)2 ≤ z ≤ 4 − y 2 } e R2 = {(y, z) ∈ R2 : y ≥ 0, y ≤ z ≤ (densit` a di massa unitaria).
4 − y2 }
422
9 Calcolo integrale su curve e superfici
22. Usando il Teorema di Green, calcolare il lavoro compiuto dalla forza f (x, y) = xyi + x4 yj nello spostamento lungo l’arco chiuso Γ , percorso in senso antiorario, unione di Γ1 , Γ2 , Γ3 , Γ4 espressi in coordinate cartesiane rispettivamente da x = y 2 , y = 1, x2 + y 2 = 5, y = 0, (x, y ≥ 0). 23. Utilizzando il Teorema di Green, calcolare al variare del parametro a, il lavoro compiuto dalla forza f (x, y) = x2 y 2 i+axj nello spostamento lungo l’arco chiuso Γ , percorso in senso antiorario, unione di Γ1 , Γ2 , Γ3 espressi in coordinate cartesiane rispettivamente come x2 + y 2 = 1, x = 1, y = x2 + 1 (x, y ≥ 0). 24. Calcolare l’area della regione piana Ω limitata dall’arco Γ , unione di γ1 parametrizzato da γ1 (t) = (e−(t−π/4) cos t, sin t), t ∈ [0, π/4], e dei segmenti π/4 congiungenti √ √l’origine con gli estremi di γ1 , ossia i punti A = (e , 0) e B = ( 2/2, 2/2). 25. Utilizzando il Teorema di Gauss, determinare il flusso del campo f (x, y, z) = (x3 + yz)i + (xz + y 3 )j + (xy + z 3 + 1)k uscente da Ω definito dalle relazioni x2 + y 2 + z 2 ≤ 1 ,
x2 + y 2 − z 2 ≤ 0 ,
y ≥ 0,
z ≥ 0.
26. Determinare il flusso del campo vettoriale 1 1 f (x, y, z) = (xy 2 + z 3 )i + (x2 + y 3 )j + 2(x2 z + z 3 + 2)k 3 3 uscente dalla frontiera della calotta definita dalle relazioni x2 + y 2 + z 2 ≤ 2 ,
x2 + y 2 − z 2 ≥ 0 ,
y ≥ 0,
z ≥ 0.
27. Utilizzando il Teorema di Stokes, calcolare la circuitazione del campo f (x, y, z) = xi + yj + xyk lungo il bordo della superficie Σ, intersezione del cilindro x2 + y 2 = 4 e del 2 2 paraboloide z = x9 + y4 , orientata in modo che il versore normale punti verso l’asse z. 28. Dato il campo vettoriale f (x, y, z) = (y + z)i + 2(x + z)j + 3(x + y)k e la superficie sferica di equazione x2 + y 2 + z 2 = 2, calcolare il flusso del rotore di f uscente dalla parte della superficie Σ che sta sopra il piano z = y.
9.7 Esercizi
423
29. Verificare che il campo f (x, y, z) = xi−2yj+3zk `e conservativo e determinarne un potenziale. 30. Determinare la funzione g ∈ C ∞ (R) con g(0) = 0, in modo che il campo f (x, y) = (y sin x + xy cos x + ey )i + g(x) + xey j sia conservativo. Determinare per il campo risultante il generico potenziale. 31. Si consideri il campo f (x, y) =
g(y) + cos y i + (2y log x − x sin y)j . x
a) Determinare la funzione g ∈ C ∞ (R) tale che g(1) = 1, in modo che f sia conservativo. b) Determinare per il campo cos`ı ottenuto, il potenziale ϕ tale che ϕ(1, π2 ) = 0. 32. Si consideri il campo f (x, y) = (2x log y − y sin x)i +
g(x) + cos x j . y
a) Determinare la funzione g ∈ C ∞ (R) tale che g(0) = 1, in modo che f sia conservativo. b) Determinare per il campo cos`ı ottenuto, il potenziale ϕ tale che ϕ( π3 , 1) = 0. 33. Si consideri il campo f (x, y, z) = (3y + cos(x + z 2 ))i + (3x + y + zg(z))j + (y + 2z cos(x + z 2 ))k . a) Determinare la funzione g ∈ C ∞ (R) tale che g(1) = 0, in modo che f sia conservativo. b) Determinare per il campo cos´ı ottenuto, il potenziale ϕ tale che ϕ(0, 0, 0) = 0. 34. Determinare il valore del parametro λ in modo che il campo f (x, y, z) = (x2 + 5λy + 3yz)i + (5x + 3λxz − 2)j + ((2 + λ)xy − 4z)k sia conservativo. Determinare quindi il potenziale ϕ tale che ϕ(3, 1, −2) = 0.
9.7.1 Soluzioni t2 (1 + 8t2 ) , e γ (t) = 1, 2t, 1t , risulta 1. Poich´e per t ∈ [1, 2], si ha f γ(t) = √ 1 + t2 + 4t4
424
9 Calcolo integrale su curve e superfici
f=
γ
1
2
t2 (1 + 8t2 ) 1 √ 1 + t2 + 4t4 dt = 1 + t2 + 4t4 t
2
t(1 + 8t2 ) dt = 1
63 . 2
2. 0. 3. Calcoliamo dapprima le coordinate del punto B appartenente al primo quadrante e punto di intersezione tra la retta y = 2x e l’ellisse 4x2 + y 2 = 4. Si ottiene √ √ facilmente B = ( 22 , 2). Osserviamo che l’arco regolare a tratti γ pu` o essere suddiviso nei tre archi regolari γ1 , γ2 e γ3 i cui sostegni sono rispettivamente il ` possibile definire archi segmento OA, l’arco di ellisse AB e il segmento BO. E δ1 , δ2 e δ3 congruenti rispettivamente a γ1 , γ2 e γ3 , nel modo seguente 0 ≤ t ≤ 1, π 0≤t≤ , 4 √ 2 , 0≤t≤ 2
δ1 (t) = (t, 0) δ2 (t) = (cos t, 2 sin t) δ3 (t) = (t, 2t) per cui
f= γ
Poich´e
δ3 ∼ −γ3 ,
f+ δ2
f. δ3
f δ1 (t) = t ,
f δ2 (t) = cos t + 2 sin t ,
f δ3 (t) = 3t ,
δ1 (t) = (1, 0) ,
δ1 (t) = (− sin t, 2 cos t) , δ2 (t) = sin2 t + 4 cos2 t ,
δ3 (t) = (1, 2) , √ δ3 (t) = 5 ,
δ1 (t) = 1 , si ha
f =
γ
δ2 ∼ γ2 ,
f+ δ1
δ1 = γ1 ,
1
t dt + 0
π/4
cos t + 2 sin t
0
sin2 t + 4 cos2 t dt +
√ 2/2
√ 3 5t dt
0
π/4 π/4 1 3√ 5+ cos t 4 − 3 sin2 t dt + 2 sin t 1 + 3 cos2 t dt = + 2 4 0 0 1 3√ 5 + I1 + I2 . = + 2 4 √ √ Per calcolare I1 , poniamo u = 3 sin t, da cui du = 3 cos t dt, e otteniamo √6/2 1 4 − u2 du . I1 = √ 3 0 Eseguendo la sostituzione v = u2 , si ha √ √ √6/2 5 6 2 1 1 u 2 u 4 − u + 2 arcsin + √ arcsin . = I1 = √ 2 0 4 4 3 2 3
9.7 Esercizi
425
√ √ Analogamente, per calcolare I2 si pone u = 3 cos t, da cui du = − 3 sin t dt e 2 I2 = − √ 3
√ 6/2
√ 3
1 + u2 du .
Risulta √6/2 1 2 2 I2 = − √ u 1 + u + log 1+u +u √ 3 3 √ √ √ √ 5 10 + 6 1 +2+ √ . log(2 + 3) − log =− 2 2 3 4. 2 arctan
√
2+
√ 2 12 π.
5. Poich´e (γ) = (γ1 ) + (γ2 ) + (γ√3 ), calcoliamo separatamente le tre lunghezze. In modo elementare, si ha (γ2 ) = 37 π e (γ3 ) = π. Inoltre,
1 + t2 dt 0 0 2 1 4 2 1 4 = π 1 + π + log π + 1 + π 2 . 3 9 2 3 9
(γ1 ) =
2/3π
γ (t) dt =
2/3π
L’area cercata `e la somma delle aree del triangolo ABC e dell’insieme Ω1 , mostrato 2 nella Figura 9.18. Allora area(ABC) = 2π√3 . Inoltre Ω1 , in coordinate polari si trasforma in 2 Ω1 = (r, θ) : 0 ≤ r ≤ θ, 0 ≤ θ ≤ π . 3 Pertanto, (2/3)π θ 4 3 π . area(Ω1 ) = dx dy = r dr dθ = 81 0 0 Ω1 y B γ2
π √ 3
Ω1 γ1
C
γ3
A
x
Figura 9.18. Arco γ e regione Ω1 relativi all’Esercizio 5
426
9 Calcolo integrale su curve e superfici
6. Risulta xG =
eπ − 2 , 5(eπ/2 − 1)
yG =
2eπ + 1 . 5(1 − eπ/2 )
7. Il parametro k `e determinato dalla condizione yG = 0. Calcoliamo yG , osservando che yG = y+ y γ1
γ2
√ dove γ1 (t) = (− 3t, t), t ∈ [−2, 0] e γ2 (t) = ( 12 t2 , t), t ∈ [0, k]. Allora 0 k 1 2t dt + t 1 + t2 dt = (1 + k2 )3/2 − 13 ; yG = 3 −2 0 √ imponendo la condizione yG = 0, si ricava k = 132/3 − 1. 8. Si ha γ (t) = (cos t − t sin t)i + (sin t + t cos t)j + k e γ (t)2 = 2 + t2 . Allora
√
2
Iz =
2
2
t2
(x + y ) = 0
Γ
√ 3√ 1 2 + t2 dt = 2 − log(1 + 2) . 2 2
9. Poich´e f γ(t) = (t4 , t3 ) e γ (t) = (2t, 1), si ha 1 1 7 4 3 . f · dP = (t , t ) · (2t, 1) dt = (2t5 + t3 ) dt = 12 0 0 γ 9 π ; 11. . 4 4 12. L’arco regolare a tratti γ pu` o essere ristretto ai tre archi regolari γ1 , γ2 e γ3 i ` possibile definire cui sostegni sono rispettivamente i tre segmenti AB, BC e CD. E archi δ1 , δ2 e δ3 congruenti rispettivamente a γ1 , γ2 e γ3 , nel modo seguente 10.
0 ≤ t ≤ 1, 0 ≤ t ≤ 1, 0 ≤ t ≤ 1,
δ1 (t) = (t, 1) δ2 (t) = (t, 2 − t) δ3 (t) = (t, 2) Poich´e f δ1 (t) = (t, t2 ) , δ1 (t) = (1, 0) , si ha
γ
f δ2 (t) = t(2 − t)2 , t2 (2 − t) , δ2 (t) = (1, −1) ,
f · dP =
δ1 1
f · dP −
f δ3 (t) = (4t, 2t2 ) δ3 (t) = (1, 0) ,
δ2
f · dP +
1
(t, t2 ) · (1, 0) dt −
=
δ1 ∼ γ1 , δ2 ∼ −γ2 , δ3 ∼ γ3 ,
0
δ3
f · dP
t(2 − t)2 , t2 (2 − t) · (1, −1) dt
0 1
(4t, 2t2 ) · (1, 0) dt = 2 .
+ 0
9.7 Esercizi
13. 0. 14. Dobbiamo imporre la condizione γ
f ·τ =
427
9 5
1 2 t , t , t ∈ [0, k] (si noti che k = 0, altrimenti l’integrale `e nullo). dove γ(t) = 2k Poich´e γ (t) = k1 t, 1 , si ha
γ
Pertanto risulta
k
f ·τ =
9 3 40 k
15. Il lavoro vale L =
0
t5 9 3 t4 t4 2 k . dt = − + t − 4k3 2k2 4k2 40
= 95 , ossia k = 2. 2 5
−
2 15 a
ed `e nullo se a = 3.
16. Poich´e si tratta di una superficie cartesiana, ricordando la (6.49), si ha ∂ϕ 2 ∂ϕ 2 4 ν(u, v) = 1 + + =√ ∂u ∂v 16 − u2 − v 2 √ dove ϕ(u, v) = 16 − u2 − v 2 . Pertanto, 4 f = 16 − u2 − v 2 (v − 2u) √ du dv 16 − u2 − v 2 σ R = 4 (v − 2u) du dv . R
La regione R `e contenuta nel quarto quadrante ed `e compresa tra la circonferenza di centro l’origine e raggio 4 e l’ellise di semiassi a = 2 e b = 1 (si veda la Figura 9.19). Integrando per verticali e suddividendo il dominio in D1 e D2 , si ottiene v 4
D2 D1
−4
1
−2
u
Figura 9.19. Regioni D1 e D2 relative all’Esercizio 16
428
9 Calcolo integrale su curve e superfici
z
v 1 R −2
y
x
u 2
−1
−1
Figura 9.20. Regione R (a sinistra) e superficie Σ (a destra) relativi all’Esercizio 17
f =4
σ
−2
√ 16−u2
−4
(v − 2u) dv du +
0
0
√ 16−u2
q 2 1− u4
−2
728 . (v − 2u) dv du = 3
17. Una parametrizzazione di Σ `e data da (si veda la Figura 9.20) σ(u, v) = (u, v, −
u2 − v2 ) , 4
Allora ν(u, v)2 = 1 +
u2 4
(u, v) ∈ R = {(u, v) ∈ R2 :
u2 + v 2 = 1} . 4
+ 4v 2 e f= (v + 1) du dv . R
Σ
Passando alle coordinate polari ellittiche, si ottiene 2π 1 f =2 (r sin θ + 1)r dr dθ = 2π . 0
Σ
0
18. Parametrizziamo Σ mediante 1 σ(u, v) = u, v, v 2 , 2
(u, v) ∈ R
dove R `e il triangolo nel piano √uv di vertici (−4, 0), (4, 0) e (0, 4) (si veda la Figura 9.21). Allora ν(u, v) = 1 + v 2 e pertanto area(Σ) = Σ
2 1= 1 + v du dv = R
4 0
√ 14 √ 2 = 17 + 4 log(4 + 17) + . 3 3
4−v
v−4
19. area(Σ) = 8π. 20. Parametrizziamo Σ in coordinate cilindriche come
1 + v 2 du dv
9.7 Esercizi
429
z 8
v 4 v =4+u
R
v =4−u
−4
y
−4
u
4 4
4
x
Figura 9.21. Regione R (a sinistra) e superficie Σ (a destra) relativi all’Esercizio 18
σ(r, θ) = (r, θ,
√
(r, θ) ∈ R = {(r, θ) : 0 ≤ r ≤
3r) ,
√ π 5 3, ≤ θ ≤ π} 4 4
(si veda la Figura 9.22). Allora ν(r, θ) = 2 e
2
2
(x + y ) = 2
21. Si ha xG =
√ 3
r3 dr dθ =
r r dr dθ = 2 R
Σ
(5/4)π
2
0
π/4
9 π. 2
2π π+4 .
522. L’arco `e rappresentato in Figura 9.23. Il lavoro cercato altro non `e che L = f · τ . Per il Teorema di Green, esso coincide con Γ ∂f1 ∂f2 − dx dy L= ∂x ∂y Ω dove Ω `e l’interno di Γ e f1 (x, y) = xy, f2 (x, y) = x4 y. Pertanto, integrando per orizzontali, si ottiene
z
v u=v
3 R
u √
3
x
y y=x
Figura 9.22. Regione R (a sinistra) e superficie Σ (a destra) relativi all’Esercizio 20
430
9 Calcolo integrale su curve e superfici y
x = y2
x=
γ2
p 5 − y2
1 γ1 Ω
0
1
γ4
γ3 2
√
x
3
Figura 9.23. Arco Γ e regione Ω relativi all’Esercizio 22
1
√5−y2 (4x3 y − x) dx dy =
L= y2
0
47 . 6
23. L’arco Γ `e rappresentato in Figura 9.24. Per il Teorema di Green, il lavoro cercato vale 4 L= f ·τ = (a − 2x2 y) dx dy , Γ
Ω
dove Ω `e l’interno di Γ . Integrando per verticali, si ha L= 0
1
x2 +1 √ 1−x2
1
(a − 2x2 y) dy dx =
ay − x2 y 2
0
y=x2 +1 √ y= 1−x2
dx = a
4 3
−
π 26 − . 4 35
24. Applichiamo la (9.22) all’arco Γ (si veda la Figura 9.25). L’integrale sui segmenti OA e OB `e nullo; inoltre, poich´e γ1 (t) = (−e−(t−π/4) (cos t + sin t), cos t), si ha 1 π/4 11 3 area(Ω) = sin t(cos t + sin t) + cos2 t e−(t−π/4) dt = − + eπ/4 . 2 0 20 5 y
y = 1 + x2
2
γ3 1
Ω
y=
√
γ2
γ1 1 − x2 1
x
Figura 9.24. Arco Γ e regione Ω relativi all’Esercizio 23
9.7 Esercizi
431
y B
γ1
Ω 0
A
x
Figura 9.25. Arco Γ e regione Ω relativi all’Esercizio 24
25. Applicando il Teorema di Gauss, si ha f ·n = div f = 3(x2 + y 2 + z 2 ) dx dy dz . ∂Ω
Ω
Ω
Passando alla coordinare sferiche, la regione Ω si trasforma in Ω definita dalle relazioni 0 ≤ r ≤ 1, 0 ≤ ϕ ≤ π/4 e 0 ≤ θ ≤ π. Allora π π/4 1 √ 3 π(2 − 2) . f ·n = 3r4 sin ϕ dr dϕ dθ = 10 ∂Ω Ω 0 0 0 26. Il flusso vale
π 5 (1
−
√ 2).
27. Parametrizziamo Σ come superficie cartesiana: v2 u2 + σ(u, v) = u, v, 9 4
con
(u, v) ∈ R = (u, v) ∈ R2 : u2 + v 2 ≤ 4 .
Allora ν(u, v) = (− 29 u, − v2 , 1) `e orientato come richiesto. Per applicare il Teorema di Stokes, oserviamo che rot f = xi − yj + 0k, e 2 v f ·τ = rot f · n = (ui − vj + 0k) · − u i − j + k du dv 9 2 ∂Σ R Σ 2 2 1 2 = (− u + v ) du dv . 9 2 R Passando alle coordinate polari, 2π 2 2 1 10 π. − cos2 θ + sin2 θ r3 dr dθ = f ·τ = 9 2 9 0 0 ∂Σ 28. Si vuole applicare il Teorema di Stokes con Σ = (x, y, z) ∈ R3 : x2 + y 2 + z 2 = 2, z ≥ y avente bordo ∂Σ = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 2, z = y}. Possiamo parametrizzare ∂Σ come √ γ(t) = ( 2 cos t, sin t, sin t) , t ∈ [0, 2π] ;
432
9 Calcolo integrale su curve e superfici
allora √ √ f γ(t) = 2 sin t i + 2( 2 cos t + sin t) j + 3( 2 cos t + sin t) k , √ γ (t) = − 2 sin t i + cos t j + cos t k e
√ f · τ = 3 2π .
rot f · n = Σ
∂Σ
29. Il campo f `e definito su tutto R3 , insieme ovviamente semplicemente connesso, e il suo rotore `e nullo. Allora, grazie al Teorema 9.45, f `e conservativo. Per calcolarne un potenziale ϕ, osserviamo che ∂ϕ = x, ∂x
∂ϕ = −2y , ∂y
∂ϕ = 3z . ∂z
(9.26)
Pertanto, considerando la prima relazione, si ha ϕ(x, y, z) =
1 2 x + ψ1 (y, z) . 2
Derivando tale espressione rispetto a y e usando la seconda delle (9.26), si ottiene ∂ϕ ∂ψ1 (x, y, z) = (y, z) = −2y , ∂y ∂y da cui ψ1 (y, z) = −y 2 + ψ2 (z)
e
ϕ(x, y, z) =
1 2 x − y 2 + ψ2 (z) . 2
Derivando ora ϕ rispetto a z e utilizzando la terza delle (9.26), ricaviamo ∂ϕ dψ2 (x, y, z) = (z) = 3z ∂z dz
da cui ψ2 (z) =
3 2 z + c. 2
In definitiva, un potenziale per f `e dato da ϕ(x, y, z) =
1 2 3 x − y2 + z2 + c , 2 2
c ∈ R.
` quindi 30. In campo `e definito su tutto R2 , insieme semplicemente connesso. E sufficiente imporre che ∂f1 ∂f2 (x, y) = (x, y) , ∂y ∂x dove f1 (x, y) = y sin x + xy cos x + ey e f2 (x, y) = g(x) + xey , perch´e il campo sia conservativo. Tale condizione si traduce in sin x + x cos x + ey = g (x) + ey ,
9.7 Esercizi
ossia g (x) = sin x + x cos x. Integrando, si ottiene g(x) = (sin x + x cos x) dx = x sin x + c ,
433
c ∈ R.
Imponendo la condizione g(0) = 0, si ha c = 0 e la funzione cercata `e g(x) = x sin x. Per determinare un potenziale ϕ del campo f osserviamo che deve valere ∂ϕ (x, y, z) = y sin x + xy cos x + ey ∂y
e
∂ϕ (x, y, z) = x sin x + xey . ∂y
Dalla seconda equazione, is ottiene ϕ(x, y) = xy sin x + xey + ψ(x) , e, derivando rispetto a x tale espressione e usando la prima, si ha ∂ϕ (x, y, z) = y sin x + xy cos x + ey + ψ (x) = y sin x + xy cos x + ey . ∂x Pertanto ψ (x) = 0 da cui ψ(x) = c con c costante arbitraria in R. In definitiva, ϕ(x, y) = xy sin x + xey + c , 31. a) g(y) = y 2 ; 32. a) g(x) = x2 + 1; 33. a) g(z) = 1 − z1 ;
c ∈ R.
b) ϕ(x, y) = y 2 log x + x cos y. b) ϕ(x, y) = (x2 + 1) log y + y cos x − 12 . b) ϕ(x, y, z) = 3xy + 12 y 2 + yz − y + sin(x + z 2 ).
34. λ = 1 e ϕ(x, y, z) = 13 x3 + 3xyz + 5xy − 2z 2 − 2y + 4.
10 Equazioni differenziali ordinarie
Le equazioni differenziali costituiscono uno degli strumenti di pi` u largo uso nelle applicazioni della Matematica alle altre discipline. In quest’ultimo capitolo, forniamo una presentazione autoconsistente dei principali concetti, risultati e metodi relativi alle cosiddette equazioni differenziali ordinarie. Dopo aver introdotto alcune nozioni generali, ricordiamo le tecniche risolutive per varie famiglie di equazioni scalari. Studiamo poi il problema dell’esistenza e unicit` a della soluzione di un problema ai valori iniziali per la generica equazione vettoriale. Descriviamo in seguito la struttura delle soluzioni dei sistemi lineari, per i quali i metodi algebrici rivestono un ruolo centrale, e delle equazioni scalari di ordine superiore al primo. Infine diamo una essenziale presentazione del concetto di stabilit` a asintotica, con applicazione al moto di un pendolo, con e senza attrito. Data la ricchezza e la complessit`a della materia, la presentazione, che non intende essere esaustiva, si sofferma principalmente sugli aspetti qualitativi, limitando all’essenziale la giustificazione rigorosa dei risultati. Materiale aggiuntivo pu` o essere reperito in rete nei ; Complementi al Cap. 10 .
10.1 Esempi introduttivi Lo studente ha gi` a incontrato esempi di equazioni differenziali nella formulazione matematica di leggi fisiche, a cominciare dalla legge di Newton che esprime il legame tra l’accelerazione di una particella di materia e le forze che agiscono su di essa. In effetti, le equazioni differenziali sono uno strumento naturale e per questo largamente utilizzato per costruire modelli matematici che descrivono fenomeni e processi del mondo reale. Il motivo `e che in molti casi due entit`a, rappresentate ciascuna da una variabile, interagiscono in modo tale che una ha influenza sulla variazione dell’altra; matematicamente, ci` o si esprime attraverso una relazione tra una variabile e una qualche derivata dell’altra. Ad esempio, nella legge di Newton, la forza applicata influenza l’accelerazione, dunque la variazione delle velocit`a della particella, che d’altra parte esprime la variazione dello spostamento. Se la forza dipende a sua volta dallo spostamento, come nel caso di una molla, ecco
Canuto C, Tabacco A: Analisi Matematica II. © Springer-Verlag Italia, Milano 2008
436
10 Equazioni differenziali ordinarie
che otteniamo una equazione dello spostamento in funzione del tempo t, quale ad esempio m
d2 x = −kx , dt2
che esprime il fatto che la forza esercitata dalla molla `e proporzionale allo spostamento rispetto alla posizione di riposo ed agisce nella direzione opposta (essendo k > 0), oppure m
d2 x = −(k + βx2 )x , dt2
in cui la rigidezza della molla cresce all’aumentare dello spostamento; queste sono, appunto equazioni differenziali del secondo ordine nell’incognita t. Un altro esempio, sempre tratto dalla Meccanica e che ci accompagner`a nel corso del capitolo, `e quello di un pendolo semplice che oscilla in un piano verticale per effetto della gravit` a ed eventualmente dell’attrito del perno. In tal caso si ha un legame tra l’angolo θ formato dal pendolo con la verticale e le sue velocit` a e accelerazione angolare, espresso dall’equazione d2 θ dθ + k sin θ = 0 . +α 2 dt dt Se vogliamo descrivere il moto di un sistema costituito da pi` u molle o da un pendolo composto, avremo un sistema di equazioni differenziali che legano tra loro le diverse variabili di spostamento delle masse o di angolo per le aste che compongono il pendolo. Le equazioni differenziali a cui facciamo riferimento, come tutte quelle trattate nel capitolo, sono ordinarie, intendendo con questo termine che le incognite dipendono da una sola variabile indipendente, che convenzionalmente indicheremo con t (facendo prevalere le applicazioni di tipo dinamico o evolutivo, in cui t `e il tempo). Le equazioni differenziali alle derivate parziali esprimono relazioni tra incognite dipendenti da pi` u variabili (ad esempio il tempo e una o pi` u variabili di spazio) e quindi fanno intervenire le derivate parziali delle incognite. Equazioni e sistemi di equazioni differenziali ordinarie sono fondamentali nella descrizione matematica del funzionamento di circuiti elettrici ed elettronici. La situazione pi` u semplice `e quella di un circuito elettrico LRC in cui l’intensit` a di corrente i = i(t) soddisfa un’equazione lineare del secondo ordine del tipo
i d2 i di +r + =f. 2 dt dt c
Le reti elettriche possono essere modellizzate attraverso sistemi di tante equazioni di questo genere quante sono le maglie della rete, a cui si aggiungono opportune condizioni di bilancio nei nodi della rete (quali ad esempio le leggi di Kirchhoff).
10.1 Esempi introduttivi
437
Nel caso di circuiti elettronici, contenenti componenti attive, i modelli differenziali sono in genere non lineari. La Scienza dei materiali e la Chimica, cos`ı come la Biologia e pi` u in generale le Scienze della vita e le Scienze sociali, sono fonti altrettanto importanti di modelli matematici che fanno uso di equazioni differenziali ordinarie. Ad esempio, l’equazione y = ky esprime sia una legge di decadimento della radioattivit` a di un materiale (il tasso di riduzione della quantit` a y di una sostanza radioattiva `e proporzionale, con k < 0, alla quantit` a di sostanza stessa), sia la legge di Malthus relativa alla dinamica di popolazioni (il tasso relativo di variazione y /y di una popolazione `e uguale alla differenza k = n−m tra i tassi di nascita n e di morte m della popolazione, supposti costanti). Il modello di Malthus pu` o essere reso pi` u realistico introducendo una dipendenza del tasso k dalla quantit` a di popolazione stessa, attraverso la cosiddetta equazione logistica y = (k − βy)y . Un altro esempio in questo ambito `e fornito dalle equazioni di Volterra-Lotka
p1 = (k1 − β1 p2 )p1 p2 = (−k2 + β2 p1 )p2 ,
che descrivono l’interazione tra due popolazioni, le prede p1 e i predatori p2 , i cui tassi relativi di variazione pi /pi dipendono non solo dalle caratteristiche della specie (k1 , k2 > 0) ma anche dalla quantit` a della specie antagonista presente sul territorio (β1 , β2 > 0). Segnaliamo infine una fonte, per cos`ı dire intrinseca alla modellistica differenziale, di sistemi di equazioni differenziali ordinarie, spesso di grandi dimensioni: la discretizzazione rispetto alle variabili di spazio di equazioni alle derivate parziali che descrivono fenomeni che evolvono nel tempo. Un semplice esempio `e dato dall’equazione del calore ∂u ∂2u − k 2 = 0, ∂t ∂x
0 < x < L, t > 0,
(10.1)
che descrive l’evoluzione temporale della temperatura u = u(t) in una sbarra metallica di lunghezza L. Se suddividiamo la sbarra in n+1 parti uguali di ampiezza Δx mediante punti xj = jΔx, 0 ≤ j ≤ n + 1 (con (n + 1)Δx = L), possiamo associare ad ogni nodo la variabile uj = uj (t) che descrive la temperatura nel punto xj al variare del tempo. La derivata seconda in spazio pu` o essere approssimata, facendo uso degli sviluppi di Taylor, mediante il rapporto incrementale secondo ∂2u uj−1 (t) − 2uj (t) + uj+1 (t) (xj , t) ∼ , 2 ∂x Δx2
438
10 Equazioni differenziali ordinarie
e quindi l’equazione (10.1) pu` o essere approssimata mediante un sistema di n equazioni differenziali ordinarie lineari, ciascuna associata a un nodo interno: uj −
k (uj−1 − 2uj + uj+1 ) = 0 , Δx2
1 ≤ j ≤ n.
Nella prima e nell’ultima equazione compaiono le temperature u0 e un+1 agli estremi della sbarra, che possono essere determinate mediante opportune condizioni al bordo (ad esempio u0 (t) = φ, un+1 (t) = ψ se la temperatura agli estremi della sbarra `e tenuta fissa mediante termostati).
10.2 Definizioni generali Iniziamo considerando le equazioni differenziali scalari, vale a dire in una sola incognita, a beneficio degli studenti che non abbiano affrontato questo argomento in uno dei corsi precedenti. Per equazione differenziale ordinaria intendiamo una relazione tra una variabile indipendente reale (che indicheremo con t), una funzione incognita y = y(t) e le sue derivate y (k) fino ad un certo ordine n. Tale relazione verr`a scritta come F (t, y, y , ..., y (n) ) = 0,
(10.2)
dove F `e una funzione reale di n + 2 variabili reali. Diremo che l’equazione differenziale `e di ordine n, se n `e l’ordine pi` u alto delle derivate di y che intervengono nella (10.2). Per soluzione (in senso classico) dell’equazione differenziale in un intervallo J della retta reale, intendiamo una funzione y : J → R, derivabile n volte in J, tale che valga la relazione F (t, y(t), y (t), ..., y (n) (t)) = 0
per ogni t ∈ J.
Spesso `e possibile esprimere mediante la (10.2) la derivata di ordine massimo y (n) in funzione di t e delle derivate di ordine inferiore (in diverse applicazioni, questo `e anzi il modo con cui si scrive originariamente l’equazione differenziale). In generale, il Teorema della funzione implicita (§ 7.1) assicura che `e possibile esplicitare y (n) quando la derivata parziale di F rispetto all’ultima variabile non si annulla. In tal caso, possiamo scrivere la (10.2) nella forma y (n) = f (t, y, ..., y (n−1) ),
(10.3)
dove f `e una funzione reale di n + 1 variabili reali. Diremo allora che l’equazione differenziale `e in forma normale. La definizione di soluzione si modifica in modo ovvio nel caso in cui l’equazione sia in forma normale.
10.2 Definizioni generali
439
Come visto negli esempi precedenti, accanto alle equazioni scalari `e di notevole interesse considerare anche i sistemi di equazioni differenziali. La situazione pi` u semplice `e quella di un sistema del primo ordine in n incognite, scritto in forma normale come ⎧ y1 = f1 (t, y1 , y2 , . . . , yn ) ⎪ ⎪ ⎪ ⎪ ⎨ y2 = f2 (t, y1 , y2 , . . . , yn ) (10.4) .. ⎪ ⎪ . ⎪ ⎪ ⎩ y = f (t, y , y , . . . , y ) , n 1 2 n n ` conveniente dove ciascuna fi `e una funzione reale di n + 1 variabili reali. E rappresentare il sistema in notazione vettoriale, come y = f (t, y)
(10.5)
dove y = (yi )1≤i≤n e f = (fi )1≤i≤n . In tal caso una soluzione sar`a una funzione vettoriale y : J → Rn , derivabile in J e soddisfacente y (t) = f t, y(t) per ogni t ∈ J . Una situazione particolarmente importante `e quella dei cosiddetti sistemi lineari, che hanno la forma ⎧ y1 = a11 (t)y1 + a12 (t)y2 + . . . + a1n (t)yn + b1 (t) ⎪ ⎪ ⎪ ⎪ y = a (t)y + a (t)y + . . . + a (t)y + b (t) ⎨ 21 1 22 2 2n n 2 2 . ⎪ .. ⎪ ⎪ ⎪ ⎩ yn = an1 (t)y1 + an2 (t)y2 + . . . + ann (t)yn + bn (t) . ossia, in forma compatta, y = A(t)y + b(t)
(10.6)
con A(t) = aij (t) 1≤i,j≤n , funzione da J a valori nello spazio vettoriale Rn,n delle matrici quadrate reali di ordine n, e b(t) = bi (t) 1≤i≤n funzione da J in Rn . Le equazioni lineari del primo ordine rivestono particolare importanza, sia teorica sia applicativa; infatti, da una parte esse intervengono nella descrizione di importanti problemi di natura lineare, dall’altra esse costituiscono un’approssimazione, ottenuta attraverso il procedimento di linearizzazione (vedi l’Osservazione 10.25), di equazioni pi` u complicate che descrivono fenomeni non lineari. Notiamo che nella scrittura di un’equazione differenziale quale la (10.5) o la (10.6), si `e soliti non evidenziare la dipendenza da t della soluzione y. I sistemi differenziali del primo ordine costituiranno l’oggetto principale del nostro studio, in quanto ad essi `e possibile ricondurre varie altre tipologie di equazioni differenziali, mediante l’introduzione di un numero adeguato di incognite. Per le equazioni scalari, ogni equazione differenziale di ordine n pu` o essere infatti
440
10 Equazioni differenziali ordinarie
facilmente formulata come sistema differenziale del primo ordine in n incognite. Precisamente, data l’equazione (10.3), poniamo yi = y (i−1) ,
1 ≤ i ≤ n,
cio`e y1 = y (0) = y y2 = y = y1 y3 = y = (y ) = y2 .. . yn = y (n−1) = (y (n−2) ) = yn−1 .
(10.7)
Allora l’equazione differenziale si scrive come yn = f (t, y1 , . . . , yn ) . Otteniamo quindi il sistema diferenziale del primo ordine ⎧ y1 = y 2 ⎪ ⎪ ⎪ ⎪ .. ⎨ . ⎪ y ⎪ n−1 = yn ⎪ ⎪ ⎩ y = f (t, y , y , . . . , y ) . 1 2 n n
(10.8)
` ovvio che ogni soluzione dell’equazione scalare (10.3) genera una soluzione y E di tale sistema mediante le (10.7); viceversa, se y `e soluzione del sistema, `e facile convincersi che la sua prima componente y1 `e soluzione dell’equazione scalare. Diremo dunque che il sistema (10.8) `e equivalente all’equazione (10.3). La generalizzazione del sistema (10.4) `e un sistema di n equazioni differenziali scalari in n incognite, in cui ogni equazione `e di ordine maggiore o uguale a 1. Allora, ciascuna equazione scalare di ordine superiore al primo pu` o essere trasformata in un sistema di equazioni del primo ordine mediante il procedimento sopra enunciato. Complessivamente, ci si riconduce quindi ad un sistema globale del primo ordine in m ≥ n equazioni e incognite. Torniamo all’equazione vettoriale (10.5) per introdurre vari concetti generali ad essa collegati. Supponiamo che l’equazione sia definita nell’aperto Ω = I × D ⊆ Rn+1 , dove I ⊆ R `e un intervallo aperto e D ⊆ Rn `e un aperto connesso; supponiamo inoltre che f sia continua in Ω. Definizione 10.1 Una soluzione dell’equazione differenziale (10.5) `e una funzione y = y(t) : J → D, dove J `e un intervallo aperto non vuoto contenuto in I, di classe C 1 su J e tale che y (t) = f t, y(t) , ∀t ∈ J.
10.2 Definizioni generali
441
Si noti che non `e detto che una soluzione dell’equazione differenziale sia definita su tutto I. Osserviamo che una soluzione y(t) altro non `e se non una curva derivabile definita su J e con sostegno contenuto in D. In ogni punto t∗ ∈ J in cui il vettore f t∗ , y(t∗ ) `e diverso da 0, esso rappresenta il vettore tangente al sostegno della curva. Il grafico della funzione y(t), ossia l’insieme G(y) = (t, y(t)) ∈ I × D ⊆ Rn+1 : t ∈ J viene detto curva integrale dell’equazione differenziale (si veda la Figura 10.1). L’equazione differenziale ha, in generale, infinite soluzioni. Usualmente, esse dipendono, oltre che da t, da n costanti arbitrarie c1 , . . . , cn . Indichiamo con y(t; c1 , . . . , cn ) l’insieme delle soluzioni, che prende il nome di integrale generale. Un modo molto naturale per selezionare una soluzione particolare `e quello di imporre che la soluzione ad un certo istante t0 ∈ I assuma un valore assegnato y0 ∈ D. Consideriamo cio`e il problema di trovare y = y(t) soddisfacente
y = f (t, y) in J , y(t0 ) = y0 ,
(10.9)
dove J `e un sottointervallo aperto di I contenente y0 , che in generale dipende dalla soluzione stessa e non `e determinabile a priori. Questo problema prende il nome di problema di Cauchy per l’equazione differenziale. Talvolta si usa chiamare anche problema ai valori iniziali in quanto spesso modellizza l’evoluzione temporale di un sistema fisico, il quale all’istante x0 in cui inizia la simulazione matematica si
y1 y2
t0
t1
t2
t
Figura 10.1. Curve integrali di un’equazione differenziale e relativi vettori tangenti
442
10 Equazioni differenziali ordinarie y2 Γ (y) G(y) y1
t t = t0 Figura 10.2. Curva integrale e corrispondente orbita nel piano delle fasi y1 y2 di un’equazione differenziale autonoma
trova nella configurazione y0 . Dal punto di vista geometrico, la condizione imposta in t0 equivale a chiedere che la curva integrale della soluzione passi per il punto (t0 , y0 ) ∈ Ω. La risolubilit` a del problema di Cauchy in senso locale (cio`e in un intorno J di t0 ), oppure in senso globale (cio`e quando J = I, nel qual caso si parla di soluzione globale) `e trattata rispettivamente nei §§ 10.4.1 e 10.4.3. Una classe particolarmente importante di equazione differenziale `e data dalle equazioni autonome y = f (y) , in cui f non dipende esplicitamente dalla variabile t. Un esempio `e il sistema lineare y = Ay con A ∈ Rn.n fissata, che verr`a studiato nel § 10.6. Per le equazioni differenziali autonome, la struttura delle soluzioni pu` o essere studiata attraverso l’analisi dei loro sostegni nell’aperto D ⊆ Rn . Si dice in tal caso che lo spazio Rn rappresenta lo spazio delle fasi dell’equazione. La proiezione di una curva integrale sullo spazio delle fasi (si veda la Figura 10.2), ossia l’insieme Γ (y) = y(t) ∈ D : t ∈ J dove y `e una soluzione dell’equazione, viene chiamata orbita o traiettoria. In particolare, se y `e soluzione del problema di Cauchy (10.9), essa definisce un’orbita passante per y0 , che si decompone in una semiorbita negativa (per t < t0 ) e positiva (per t > t0 ). L’orbita si dir` a chiusa se `e chiusa come sostegno della curva ` consuetudine visualizzare un’orbita nello spazio delle fasi fornendo anche y. E un’indicazione del verso di percorrenza definito dalla soluzione che l’ha generata. Applicazione: il pendolo semplice (I). Un’asta rigida di lunghezza L `e vincolata a muoversi in un piano verticale, con una estremit`a fissata in un punto O;
10.2 Definizioni generali
443
I
0 θ P S
g θ
y Figura 10.3. Descrizione di un pendolo semplice
l’altra estremit` a, libera, porta un punto materiale P di massa m, che quindi si muove lungo una circonferenza di centro O e raggio L (si veda la Figura 10.3). Sul punto P agisce la forza di gravit` a g, giacente nel piano e diretta verso il basso; supponiamo invece trascurabile la massa dell’asta. Per descrivere il moto del punto, introduciamo un sistema di coordinate polari (r, θ) nel piano, centrato in O e tale che il versore i = (cos 0, sin 0) sia disposto lungo la verticale e orientato verso il basso; siano tr = tr (θ) e tθ = tθ (θ) i versori della base ortonormale polare, definiti in (6.31). La posizione del punto P al variare del tempo `e individuata dal vettore OP (t) = Ltr (θ(t)) ed `e determinata dalla legge di Newton m
d2 OP = g. dt2
(10.10)
Derivando successivamente il vettore OP (t) e usando le relazioni (6.39), otteniamo dtr dθ dθ dOP =L = L tθ , dt dθ dt dt d2 θ d2 OP d2 θ dθ dtθ dθ = L 2 tθ − L = L 2 tθ + L 2 dt dt dt dθ dt dt
dθ dt
2 tr .
D’altro canto, indicando con g il modulo dell’accelerazione di gravit` a, abbiamo g = mgi = mg cos θ tr − mg sin θ tθ , e pertanto la legge di Newton diventa
2 dθ d2 θ mL − tr + 2 tθ = mg cos θ tr − sin θ tθ . dt dt
444
10 Equazioni differenziali ordinarie
Considerando la sola componente angolare e ponendo k = g/L > 0, otteniamo l’equazione del moto d2 θ + k sin θ = 0 ; dt2
(10.11)
si noti che essa non dipende dalla massa del punto. Un modello matematico pi` u realistico tiene conto dell’attrito generato dal moto nel punto O, che pu` o essere rappresentato da un vettore a, proporzionale al vettore velocit`a ma di segno opposto, a = −αmL
dθ tθ , dt
con α > 0 ,
che si aggiunge al vettore g nella legge di Newton. Procedendo come sopra, la legge di moto (10.11) si modifica in d2 θ dθ + k sin θ = 0 . +α dt2 dt
(10.12)
Notiamo che il caso di moto ideale, senza attrito, rientra in questo modello dando ad α il valore 0; supporremo quindi nel seguito α ≥ 0 e k > 0. Per determinare la posizione di P al tempo t, dobbiamo conoscerne la posizione e la velocit`a al tempo iniziale, sia esso t0 = 0. Assegnamo quindi i valori θ0 = θ(0) e θ1 = dθ dt (0). Siamo dunque giunti a formulare il seguente problema di Cauchy per un’equazione scalare del secondo ordine: ⎧ 2 d θ dθ ⎪ ⎨ 2 +α + k sin θ = 0 , dt dt ⎪ ⎩ θ(0) = θ , dθ (0) = θ . 0 1 dt
t > 0, (10.13)
Al fine di studiare le propriet` a del modello, trasformiamo tale problema nella forma (10.34) di sistema del primo ordine, ponendo y = (y1 , y2 ) = (θ,
dθ ), dt
y0 = (θ0 , θ1 ) ,
f (t, y) = f (y) = ( y2 , −k sin y1 − αy2 ) .
Notiamo che il sistema `e autonomo, ed `e posto in I = R e D = R2 . La discussione prosegue a pag. 464.
2
10.3 Equazioni scalari del primo ordine Prima di affrontare lo studio sistematico delle equazioni differenziali, nel seguito esaminiamo, per n = 1, alcuni casi notevoli di equazioni differenziali del primo ordine che si riducono facilmente alla determinazione di una o pi` u primitive.
10.3 Equazioni scalari del primo ordine
445
10.3.1 Equazioni a variabili separabili Tali equazioni sono del tipo y = g(t)h(y),
(10.14)
dove g `e una funzione continua della variabile t e h `e una funzione continua della variabile y. In altri termini, la funzione f (t, y) `e il prodotto di una funzione della sola t e di una funzione della sola y. Se y¯ ∈ R `e uno zero di h, ossia se h(¯ y ) = 0, allora la funzione costante y(t) = y¯ `e un integrale particolare della (10.14), perch´e l’equazione diventa 0 = 0. Dunque, un’equazione a variabili separabili ha innanzitutto tanti integrali particolari del tipo y(t) = costante quanti sono gli zeri distinti di h. Tali integrali si dicono integrali singolari dell’equazione. In ogni intervallo J in cui la funzione h(y) non si annulla, possiamo scrivere la (10.14) come 1 dy = g(t) . h(y) dt 1 (rispetto alla variabile y). Ricordando la formula h(y) di derivazione di una funzione composta, abbiamo
Sia H(y) una primitiva di
d dH dy 1 dy H(y(t)) = = = g(t) dt dy dt h(y) dt e dunque H(y(t)) `e una primitiva di g(t). Pertanto, se G(t) `e una qualunque primitiva di g(t), si avr` a H(y(t)) = G(t) + c ,
c ∈ R.
(10.15)
1 dH = non si annulla, e h(y) dy quindi essendo continua non cambia di segno, la funzione H(y) sar`a strettamente monotona e dunque invertibile in J (Vol. I, Teorema 2.8). Pertanto, si potr` a esplicitare la y(t) nella (10.15), ottenendo
Siccome per ipotesi nell’intervallo J la funzione
y(t) = H −1 (G(t) + c),
(10.16)
dove H −1 indica la funzione inversa di H. Tale espressione rappresenta l’integrale generale dell’equazione (10.14) in ogni intervallo in cui la funzione h(y(t)) non si annulla. Si noti tuttavia che nei casi in cui non sia possibile determinare esplicitamente l’espressione analitica della funzione inversa di H(y), la formula (10.16) ha solo valore teorico. In tali casi, ci si limiter`a a fornire l’espressione implicita (10.15) dell’integrale generale.
446
10 Equazioni differenziali ordinarie
Se l’equazione a variabili separabili (10.14) ammette integrali singolari, essi possono o meno rientrare nell’espressione (10.16) per opportuni valori della costante c. Talvolta, alcuni integrali singolari possono essere ottenuti formalmente dalla (10.16) facendo tendere c a ±∞. Osserviamo che `e possibile arrivare alla formula (10.15) in maniera formale e dy mnemonica, interpretando la derivata come un ‘quoziente’, secondo la notadt zione di Leibniz. Infatti, dividendo la (10.14) per h(y) e ‘moltiplicando’ per dt, otteniamo dy = g(t) dt h(y) da cui, integrando, si ha dy = g(t) dt, h(y) che corrisponde precisamente alla (10.15). Non si dimentichi tuttavia che la dimostrazione rigorosa di tale formula `e quella che abbiamo dato sopra! Esempi 10.2 i) Si voglia risolvere l’equazione y = y(1 − y). Abbiamo g(t) = 1 e h(y) = y(1 − y). Gli zeri di h danno luogo ai due integrali singolari y1 (t) = 0 e y2 (t) = 1. Supponendo poi h(y) diverso da 0, possiamo scrivere l’equazione differenziale come dy = dt, y(1 − y) da cui, integrando a sinistra rispetto a y e a destra rispetto a t, otteniamo y =t+c log 1 − y Passando agli esponenziali, abbiamo y t+c = ket , 1 − y = e dove k = ec `e una qualunque costante > 0. Pertanto y = ±ket = Ket , 1−y dove K `e una qualunque costante diversa da 0. Ricavando y in funzione di t, abbiamo Ket y(t) = . 1 + Ket Si noti che l’integrale singolare y1 (t) = 0 rientra in questa formula dando a K il valore zero, che era escluso dalla deduzione precedente. Invece, l’altro integrale singolare y2 (t) = 1 si ottiene formalmente facendo tendere K all’infinito. ii) Si consideri l’equazione differenziale √ y = y.
10.3 Equazioni scalari del primo ordine
447
Essa ammette l’integrale singolare y1 (t) = 0. Separando le variabili, abbiamo dy dt , √ = y da cui si ottiene √ 2 y = t + c, ossia
2 t +c y(t) = , c ∈ R, 2 avendo sostituito c/2 con c. iii) Consideriamo l’equazione differenziale et + 1 . y = y e +1 1 Si ha g(t) = et + 1, h(y) = y > 0 per ogni valore di y, dunque non vi sono e +1 integrali singolari. Separando le variabili, otteniamo y (e + 1) dy = (et + 1) dt , da cui ey + y = et + t + c ,
c ∈ R.
In tal caso, non `e possibile esplicitare y in funzione di t.
2
10.3.2 Equazioni omogenee Tali equazioni sono del tipo y = ϕ
y
(10.17)
t
dove ϕ = ϕ(z) `e una funzione continua della variabile z. Dunque, la funzione f (t, y) y dipende da t e y soltanto attraverso il loro rapporto ; in forma equivalente, si t pu` o dire che f (λt, λy) = f (t, y) per ogni λ > 0. Un’equazione omogenea si riconduce ad un’equazione a variabili separabili mey y(t) diante la ovvia sostituzione z = , da intendersi come z(t) = . Si ha dunque t t y(t) = tz(t) e y (t) = z(t) + tz (t). Sostituendo nella (10.17), si ottiene ϕ(z) − z , t che `e appunto un’equazione a variabili separabili nell’incognita z. Possiamo pertanto applicare la tecnica risolutiva discussa nel Paragrafo 10.3.1. Ogni soluzione z¯ dell’equazione ϕ(z) = z d` a luogo a un integrale singolare z(t) = z¯, cio`e y(t) = z¯t. Supponendo invece ϕ(z) diverso da z, otteniamo z =
dz = ϕ(z) − z
dt , t
448
10 Equazioni differenziali ordinarie
da cui H(z) = log |t| + c, 1 dove H(z) indica una primitiva di . Indicando con H −1 l’inversa di H, ϕ(z) − z avremo z(t) = H −1 (log |t| + c), e dunque, tornando alla incognita y, l’integrale generale della (10.17) sar` a y(t) = t H −1 (log |t| + c). Esempio 10.3 Si voglia risolvere l’equazione (10.18) t2 y = y 2 + ty + t2 . Riscrivendola in forma normale, si ha y 2 y + + 1, y = t t che `e un’equazione omogenea, con ϕ(z) = z 2 + z + 1. Eseguendo la sostituzione y = tz, si ottiene l’equazione a variabili separabili z2 + 1 . z = t 2 Non vi sono integrali singolari, perch´e z + 1 `e sempre positivo. Integrando per separazione di variabili, si ha arctan z = log |t| + c e pertanto l’integrale generale della (10.18) risulta y(t) = t tan(log |t| + c). Si noti che la costante c pu` o essere scelta indipendentemente in (−∞, 0) e in (0, +∞), a causa della singolarit` a in t = 0. Si noti altres`ı che il dominio di ogni soluzione dipende dal valore della costante c. 2 10.3.3 Equazioni lineari Tali equazioni sono del tipo1 y = a(t)y + b(t)
(10.19)
con a e b funzioni continue su I. In tal caso, la funzione f (t, y) = a(t)y + b(t) `e un polinomio di primo grado in y, a coefficienti dipendenti da t. L’equazione si dice omogenea se b(t) = 0, non omogenea diversamente. 1
Si noti che, rispetto all’analoga presentazione del Vol. I, qui si `e preferito scrivere il termine lineare in y a secondo membro, in modo da essere coerenti con la successiva estensione al caso dei sistemi lineari.
10.3 Equazioni scalari del primo ordine
449
Risolviamo innanzitutto l’equazione omogenea, che scriviamo come y = a(t)y.
(10.20)
Essa `e una particolare equazione a variabili separabili, in cui, facendo riferimento alla (10.14), si ha g(t) = a(t) e h(y) = y. Una soluzione `e la funzione costante y(t) = 0. Altrimenti, separando le variabili, otteniamo 1 dy = a(t) dt. y Se A(t) indica una primitiva di a(t), cio`e se a(t) dt = A(t) + c,
c ∈ R,
(10.21)
abbiamo allora log |y| = A(t) + c vale a dire |y(t)| = ec eA(t) e dunque y(t) = ±KeA(t) , avendo posto K = ec > 0. Notiamo poi che la soluzione particolare y(t) = 0 `e contenuta nella formula precedente se ammettiamo che K possa assumere anche il valore 0. Pertanto, tutte le soluzioni dell’equazione lineare omogenea (10.20) sono rappresentate dalla formula y(t) = KeA(t) ,
K ∈ R,
ove A(t) `e definita dalla (10.21). Passiamo ora all’equazione non omogenea. Applichiamo il cosiddetto metodo di variazione delle costanti, che consiste nel cercare la soluzione nella forma y(t) = K(t) eA(t) , dove ora K(t) `e una funzione della variabile t, da determinarsi. Tale rappresentazione di y(t) `e sempre possibile, essendo eA(t) > 0. Sostituendo nell’equazione (10.19), otteniamo K (t)eA(t) + K(t)eA(t) a(t) + a(t)K(t)eA(t) = b(t), ossia
K (t) = e−A(t) b(t).
Detta B(t) una primitiva della funzione e−A(t) b(t), cio`e c ∈ R, e−A(t) b(t) dt = B(t) + c,
(10.22)
450
10 Equazioni differenziali ordinarie
abbiamo quindi K(t) = B(t) + c, e dunque la soluzione generale della (10.19) risulta essere y(t) = eA(t) B(t) + c ,
(10.23)
con A(t) e B(t) definite rispettivamente nelle (10.21) e (10.22). Essa viene talvolta scritta nella forma pi` u espressiva R
y(t) = e
a(t) dt
e−
R
a(t) dt
b(t) dt,
(10.24)
che mette in luce i passi da compiere per risolvere un’equazione lineare non omogenea: si devono determinare in successione due primitive. Se si deve risolvere il problema di Cauchy
y = a(t)y + b(t) nell’intervallo I, (10.25) y(t0 ) = y0 , con t0 ∈ I e y0 ∈ R, pu` o essere conveniente scegliere come primitiva di a(t) quella che si annulla in t0 , che in base al Teorema fondamentale del calcolo integrale rappresentiamo come t
A(t) =
a(s) ds; possiamo operare analogamente per B(t), definendo t0
t
e
B(t) =
−
Rs
t0
a(u) du
b(s) ds
t0
(si ricordi che le variabili di integrazione sotto segno di integrale definito sono mute). Usando queste espressioni per A(t) e B(t) nella (10.23), ricaviamo y(t0 ) = c e quindi la soluzione del problema di Cauchy (10.25) sar` a quella per cui c = y0 , cio`e precisamente
y(t) = e
Rt
t0
a(u) du
t R − ts a(u) du 0 y0 + e b(s) ds .
(10.26)
t0
Esempi 10.4 i) Si voglia determinare l’integrale generale dell’equazione lineare y = ay + b, dove a = 0 e b sono costanti reali. Scegliendo A(t) = at e B(t) = ab eat , si ottiene l’integrale generale b y(t) = ceat − . a
10.3 Equazioni scalari del primo ordine
451
Notiamo che se a = 1 e b = 0, la formula precedente mostra che tutte le soluzioni dell’equazione y = y sono della forma y(t) = cet . Se invece si vuole risolvere il problema di Cauchy ! y = ay + b in [1, +∞), y(1) = y0 ,
b 1 − e−a(t−1) , ottenendo conviene scegliere A(t) = a(1 − t) e B(t) =
a b b ea(t−1) − . y(t) = y0 + a a Si noti che se a < 0, la soluzione tende al valore −b/a (indipendente dal dato iniziale y0 ) per t → +∞. ii) Si vogliano determinare le curve integrali dell’equazione differenziale ty + y = t2 che giacciono nel primo quadrante del piano (t, y). L’equazione si scrive nella forma (10.19) come 1 y = − y + t, t dunque a(t) = −1/t, b(t) = t. Scegliendo A(t) = − log t, si ha eA(t) = 1/t ed e−A(t) = t; conseguentemente, 1 e−A(t) b(t) dt = t2 dt = t3 + c. 3 Ne segue che, per t > 0, l’integrale generale dell’equazione `e
1 1 3 1 c t + c = t2 + . y(t) = t 3 3 t Se c ≥ 0, si ha y(t) > 0 per ogni t > 0, mentre se c < 0 si ha y(t) > 0 per t > 3 3|c|. 2
Osservazione 10.5 Nel seguito, sar`a utile considerare le equazioni lineari della forma z = λz , (10.27) dove λ `e un numero complesso. Ovviamente in tale situazione si cercher`a la generica soluzione in campo complesso, ossia come funzione z = Re z + i Im z : R → C ivi derivabile (nel senso che le sue parti reale e immaginaria sono funzioni derivabili). Ricordando la relazione (dimostrata nel Vol. I, formula (11.30)), d λt e = λ eλt , dt
t ∈ R,
(10.28)
che estende al caso λ ∈ C l’analoga relazione nota per λ ∈ R, possiamo ancora dire
452
10 Equazioni differenziali ordinarie
che ogni soluzione dell’equazione (10.27) si scrive come z(t) = c eλt
(10.29)
con c ∈ C arbitrario.
2
10.3.4 Equazioni di Bernoulli Tali equazioni hanno la forma y = p(t)y α + q(t)y ,
α = 0, α = 1 ,
(10.30)
con p e q funzioni continue su I. Se α > 0, la funzione costante 0 `e una soluzione. Supponendo invece y = 0 e dividendo per y α , otteniamo y −α y = p(t) + q(t)y 1−α . Notando che (y 1−α ) = (1 − α)y −α y ed eseguendo la sostituzione z = y 1−α , l’equazione si trasforma quindi nell’equazione lineare in z z = (1 − α)p(t) + (1 − α)q(t)z , a cui si applica la tecnica risolutiva illustrata nel paragrafo precedente. Esempio 10.6 Consideriamo l’equazione y = t3 y 2 + 2ty, che `e di Bernoulli con p(t) = t3 , q(t) = 2t e α = 2. Usando la trasformazione indicata, essa si riduce all’equazione 2 z = −(2tz + t3 ), che ha soluzione z(t) = cet − (2 + t2 ). Pertanto, la soluzione cercata `e 1 y(t) = t2 . 2 ce − (2 + t2 )
10.3.5 Equazioni di Riccati Tali equazioni, che intervengono nella trattazione di problemi di controllo ottimo, hanno la forma y = p(t)y 2 + q(t)y + r(t) ,
(10.31)
con p, q, r funzioni continue su I. Siamo in grado di determinarne l’integrale generale, a condizione di conoscere un integrale particolare, che indichiamo con y = u(t). Infatti, ponendo y = u(t) +
1 , z
da cui
y = u (t) −
z , z2
10.3 Equazioni scalari del primo ordine
453
otteniamo u (t) −
1 1 z u(t) + 2 + q(t) u(t) + + r(t) . = p(t) u2 (t) + 2 z2 z z z
Essendo u una soluzione dell’equazione, tale espressione si semplifica in z = − 2u(t)p(t) + q(t) z − p(t) . Ci siamo quindi ricondotti ancora una volta, a una equazione lineare nella nuova incognita z. Esempio 10.7 Consideriamo l’equazione di Riccati
t2 − 1 1 − 2t2 2 y+ , y = ty + t t dove 1 − 2t2 t2 − 1 p(t) = t , q(t) = , r(t) = . t t Essa ammette la soluzione particolare costante u(t) = 1. La trasformazione sopra indicata ci porta allora all’equazione z z = − − t , t c − t3 . Ne segue che la soluzione cercata `e che ha soluzione z(t) = 3|t| 3|t| 2 y(t) = 1 + , c ∈ R. c − t3 10.3.6 Equazioni del secondo ordine riconducibili al primo Se in un’equazione differenziale del secondo ordine non compare esplicitamente la variabile dipendente non derivata, cio`e se l’equazione `e del tipo y = f (t, y ) ,
(10.32)
allora la sostituzione z = y conduce all’equazione del primo ordine z = f (t, z) nell’incognita z = z(t). Se tale equazione `e risolubile e se z(t; c1 ) ne indica l’integrale generale, otterremo tutte le soluzioni della (10.32) risolvendo l’equazione y = z ,
454
10 Equazioni differenziali ordinarie
ossia calcolando tutte le primitive di z(t; c1 ); ci` o introdurr` a una nuova costante di integrazione c2 . L’integrale generale dell’equazione (10.32) ha dunque la forma y(t; c1 , c2 ) =
z(t; c1 ) dt = Z(t; c1 ) + c2 ,
dove Z(t; c1 ) indica una particolare primitiva di z(t; c1 ). Esempio 10.8 Si voglia risolvere l’equazione del secondo ordine y − (y )2 = 1. Ponendo z = y otteniamo l’equazione del primo ordine a variabili separabili z = z 2 + 1, il cui integrale generale `e dato da arctan z = t + c1 , vale a dire z(t, c1 ) = tan(t + c1 ). Integrando ulteriormente, abbiamo y(t; c1 , c2 ) = tan(t + c1 ) dt = − log cos(t + c1 ) + c2 ,
c 1 , c2 ∈ R .
2
Consideriamo infine il caso di un’equazione del secondo ordine e autonoma, ossia della forma y = f (y, y ) .
(10.33)
Per essa indichiamo un metodo di risoluzione valido su ciascun intervallo I ⊆ R in cui y (t) non cambia di segno. In tale situazione, y(t) risulta strettamente monotona e dunque invertibile; possiamo cio`e considerare t come funzione di y, t = t(x), sull’intervallo J = y(I). Conseguentemente, tutte le funzioni in gioco vengono a dipendere da y; in particolare, la funzione z = dy dt va pensata come funzione di y. Si ha allora dz dy dz dz y = = = z, dt dy dt dt da cui, usando l’equazione differenziale y = f (y, z), otteniamo dz 1 = g(y, z) = f (y, z) . dy z Questa `e un’equazione differenziale del primo ordine, in cui y `e la variabile indipendente e z l’incognita. Supponiamo di saperla risolvere e di trovare le soluzioni z = z(y; c1 ). Allora le soluzioni cercate y(t) si ottengono risolvendo l’equazione del primo ordine autonoma dy = z(y; c1 ) , dt che segue dalla definizione di t.
10.4 Esistenza e unicit` a del problema di Cauchy
455
Esempio 10.9 Si voglia risolvere l’equazione differenziale yy = (y )2 ossia (y )2 , (y = 0) . y 2 Posto f (y, z) = zy , risolviamo dapprima l’equazione y =
z dz = g(y, z) = , dy y trovando z(y) = c1 y e successivamente dy = c1 y , dt c1 t che fornisce y(t) = c2 e , con c2 = 0.
2
10.4 Esistenza e unicit` a del problema di Cauchy Torniamo ora a considerare equazioni differenziali nella loro forma pi` u generale (10.5) e occupiamoci della risolubilit` a del problema di Cauchy. Come gi`a visto nel § 10.2, siano I ⊆ R un intervallo aperto e D ⊆ Rn un aperto connesso. Posto Ω = I × D ⊆ Rn+1 , sia f : Ω → Rn una funzione definita in Ω. Fissato un punto t0 in I e un punto y0 in D, consideriamo il problema di Cauchy
y = f (t, y) , y(t0 ) = y0 .
(10.34)
10.4.1 Esistenza e unicit` a locale Come primo passo del nostro studio, diamo delle condizioni su f che garantiscono la risolubilit` a locale, vale a dire almeno in un intorno di t0 , del problema di Cauchy. ` rimarchevole il fatto che la sola continuit` E a di f , rispetto all’insieme delle variabili t e y, sia sufficiente a garantire l’esistenza di una soluzione. Si ha infatti il seguente risultato, noto come Teorema di Peano. Teorema 10.10 (di Peano) Supponiamo che f sia continua in Ω. Allora esiste un intorno chiuso [t0 −α, t0 +α] di t0 e una funzione y : [t0 −α, t0 +α] → D, derivabile con continuit` a, che `e soluzione del problema di Cauchy (10.34). Dim.
; Complementi al Cap. 10 .
2
456
10 Equazioni differenziali ordinarie
` possibile dare una stima dell’ampiezza dell’intervallo di esistenza della soE luzione. Infatti, siano Ba (t0 ) e Bb (y0 ) intorni rispettivamente di t0 e di y0 tali che il compatto K = Ba (t0 ) × Bb (y0 ) sia contenuto in Ω, e si ponga M = max f (t, y). Allora, si pu` o dimostrare che l’enunciato del teorema `e vero con (t,y)∈K
α = min(a, b/M ). Il Teorema di Peano nulla dice sull’unicit` a della soluzione, ed in effetti sotto la sola ipotesi di continuit` a di f possono esistere infinite soluzioni del problema (10.34). Esempio 10.11 Il problema
√ y = 32 3 y , y(0) = 0 , risolubile per separazione di variabili, ammette tanto la√soluzione costante y(t) = 0 (l’integrale singolare), quanto la soluzione y(t) = t3 ; addirittura ammette infinite soluzioni, alcune delle quali sono date da
0 se t ≤ α , y(t) = yα (t) + α ≥ 0, 3 (t − α) se t > α , e sono ottenute ‘incollando’ in modo opportuno le soluzioni indicate prima (si veda la Figura 10.4). 2 ` dunque necessario aggiungere alla continuit` E a qualche ipotesi ulteriore che assicuri l’unicit` a della soluzione, nonch´e la dipendenza continua della soluzione dal dato iniziale. Una delle ipotesi pi` u comunemente verificate a tale proposito `e la seguente. y
yα (t)
α
t
Figura 10.4. Infinite soluzioni del problema di Cauchy considerato nell’Esempio 10.11
10.4 Esistenza e unicit` a del problema di Cauchy
457
Definizione 10.12 Sia f una funzione definita in Ω = I × D. Si dice che f `e lipschitziana in Ω rispetto alla variabile y, uniformemente rispetto alla variabile t se esiste una costante L ≥ 0 tale che f (t, y1 ) − f (t, y2 ) ≤ Ly1 − y2 ,
∀y1 , y2 ∈ D, ∀t ∈ I .
(10.35)
Applicando la Proposizione 6.4 per ogni t ∈ I, `e facile vedere che tale condizione `e verificata se ogni componente di f ammette derivate parziali rispetto ad ogni variabile yj limitate in Ω, ossia se ∂fi sup (t, y) < +∞ , 1 ≤ i, j ≤ n . (t,y)∈Ω ∂yj Esempi 10.13 i) Consideriamo la funzione f (t, y) = y 2 , definita e continua su R × R. Si ha, ∀y1 , y2 ∈ R e ∀t ∈ R, |f (t, y1 ) = f (t, y2 )| = |y12 − y22 | = |y1 + y2 | |y1 − y2 | . Dunque f `e lipschitziana in y, uniformemente in t, su ogni regione Ω = ΩR = R × DR , con DR = (−R, R), R > 0; la corrispondente costante di Lipschitz L = LR vale LR = 2R. Notiamo che la funzione non `e lipschitziana su R × R, in quanto la quantit` a |y1 + y2 | tende a +∞ se y1 , y2 → ∞ mantenendo lo stesso segno. ii) Consideriamo ora la funzione f (t, y) = sin(ty), definita e continua su R × R. In tal caso si ha ∀y1 , y2 ∈ R e ∀t ∈ R, | sin(ty1 ) − sin(ty2 )| ≤ |(ty1 ) − (ty2 )| = |t| |y1 − y2 | , essendo la funzione θ → sin θ lipschitziana su R con costante di Lipschitz uguale a 1. Dunque f `e lipschitziana in y, unifomemente in t, su ogni regione Ω = ΩR = IR × R, con IR = (−R, R), R > 0, con costante di Lipschitz L = LR = R. Anche in questo caso, f non `e lipschitziana su tutto R × R. iii) Consideriamo infine la funzione affine f (t, y) = A(t)y + b(t), dove A(t) ∈ Rn,n , b(t) ∈ Rn sono funzioni definite e continue su un intervallo aperto I ⊆ R. Dunque f `e definita e continua su I × Rn . Per ogni y1 , y2 ∈ Rn e t ∈ I, si ha f (t, y1 ) − f (t, y2 ) = A(t)y1 − A(t)y2 = A(t)(y1 − y2 ) ≤ A(t) y1 − y2 , dove A(t) indica la norma della matrice A(t) definita in (4.9), e la disuguaglianza segue dalla (4.10). Osserviamo ora che la funzione α(t) = A(t) `e continua su I (composizione di funzioni continue). Se essa `e limitata, allora f `e lipschitziana rispetto a y uniformemente in t su Ω = I × R, con costante di Lipschitz L = supt∈I α(t). Altrimenti, possiamo almeno dire che α `e limitata su ogni intervallo chiuso e limitato J ⊂ I (Teorema di Weierstrass), dunque f `e lipschitziana in ogni Ω = J × Rn . 2
458
10 Equazioni differenziali ordinarie
Vale allora il seguente fondamentale risultato, noto come Teorema di Cauchy. Teorema 10.14 (di Cauchy) Supponiamo che f sia continua in Ω e ivi lipschitziana rispetto alla variabile y, uniformemente rispetto alla variabile t. Allora il problema di Cauchy (10.34) ammette una e una sola soluzione y = y(t), definita in un intorno chiuso [t0 − α, t0 + α] di t0 e a valori in Ω, ed ivi derivabile con continuit` a. Dim.
; Complementi al Cap. 10 .
2
L’unicit` a della soluzione e la sua dipendenza continua dal dato iniziale `e conseguenza della seguente propriet` a. Proposizione 10.15 Supponiamo che f verifichi le ipotesi del teorema precedente. Dati due punti y0 e z0 in D, siano y e z soluzioni dei due problemi di Cauchy
y = f (t, y) , z = f (t, z) , e y(t0 ) = y0 , z(t0 ) = z0 , su un intervallo J contenente t0 . Allora vale la disuguaglianza y(t) − z(t) ≤ eL|t−t0 | y0 − z0 ,
∀t ∈ J .
(10.36)
In particolare, se z0 coincide con y0 , allora z coincide con y su J. La propriet` a esprime la dipendenza continua della soluzione del problema (10.34) dal dato iniziale y0 : una perturbazione di ampiezza ε nel dato iniziale si traduce in una perturbazione di ampiezza al pi` u eL|t−t0 | ε nella soluzione in t = t0 . In altri termini, la distanza tra due traiettorie pu` o crescere al pi` u di un fattore eL|t−t0 | nel passaggio da t0 a t. Si noti tuttavia il carattere esponenziale di tale fattore, la cui y
(t, y(t)) y0 Ω D
t0
I
t
Figura 10.5. Esistenza e unicit` a locale di una soluzione
10.4 Esistenza e unicit` a del problema di Cauchy
459
grandezza dipende non solo dalla distanza |t − t0 | ma anche dalla grandezza della costante di Lipschitz della funzione f . Per alcune classi di equazioni, `e per`o possibile sostituire al fattore eL|t−t0 | l’espressione eσ(t−t0 ) se t > t0 e eσ(t0 −t) se t < t0 , con σ < 0 (si veda l’Esempio 10.22 ii) e il § 10.8.1). In tal caso, le soluzioni si avvicinano esponenzialmente per t che si allontana da t0 . Osservazione 10.16 A livello terminologico, tutte le volte che un problema matematico, schematizzabile come P (s) = d (dove d indica i dati del problema ed s indica una soluzione), `e tale che, sotto determinate ipotesi, • esiste una soluzione per ogni dato d, • la soluzione `e unica, • la soluzione dipende dal dato in modo continuo, si dice che il problema `e ben posto (nel senso di Hadamard). I risultati precedenti (il Teorema 10.14 con la successiva proposizione) ci assicurano dunque che il problema di Cauchy (10.34) `e ben posto sotto le ipotesi su f ivi fatte. 2 Dal teorema di Cauchy discendono alcune importanti propriet` a qualitative dell’insieme delle soluzioni dell’equazione differenziale. Precisamente, sotto le ipotesi del teorema si ha che: • due curve integrali che hanno un punto in comune necessariamente coincidono (a causa dell’unicit` a della soluzione del problema di Cauchy in un intorno di ogni punto comune); • per i sistemi autonomi in particolare, le orbite Γ (y) al variare delle soluzioni y costituiscono una partizione disgiunta dello spazio delle fasi; inoltre, si pu` o dimostrare che un’orbita `e chiusa se e solo se la corrispondente soluzione `e una funzione periodica del tempo, ossia soddisfa y(t + T ) = y(t), ∀t ∈ R, per un opportuno T > 0; • le soluzioni dell’equazione differenziale in Ω dipendono da n parametri reali, come anticipato nel § 10.2: infatti, fissato un qualunque punto t0 ∈ I, esiste una soluzione diversa per ogni scelta del dato iniziale y0 nell’aperto D, e le coordinate c1 = y01 , . . . , cn = y0n di y0 possono essere considerate come i parametri liberi da cui dipende la soluzione. 10.4.2 Soluzione massimale Il Teorema di Cauchy assicura l’esistenza di un intervallo chiuso [t0 − α, t0 + α] contenente il punto t0 in cui il problema (10.34) `e risolubile; per maggiore chiarezza, indichiamo nel seguito con u = u(t) la soluzione corrispondente. Tuttavia, tale
460
10 Equazioni differenziali ordinarie
intervallo pu` o non essere l’intervallo massimale di esistenza della soluzione, vale a dire il pi` u grande intervallo contenente t0 in cui il problema `e risolubile. Supponiamo infatti che il punto t1 = t0 + α sia interno ad I e che il punto y1 = u(t1 ) sia interno a D. Allora possiamo ‘ripartire da t1 ’, ossia considerare il nuovo problema di Cauchy
y = f (t, y) , (10.37) y(t1 ) = y1 ; poich´e sono ancora verificate le ipotesi del Teorema 10.14, esso ammetter`a un’unica soluzione, che indichiamo con v = v(t), definita in un intervallo [t1 − β, t1 + β] ⊆ I. Nell’intervallo J = [t0 , t1 ] ∩ [t1 − β, t1 ], che contiene un intorno sinistro di t1 , entrambe le funzioni u e v soddisfano l’equazione differenziale e la condizione u(t1 ) = y1 = v(t1 ). Pertanto, esse sono soluzioni del problema (10.37) in tale intervallo. Possiamo allora applicare la disuguaglianza (10.36) con t0 sostituito da t1 , ottenendo u(t) − v(t) ≤ eL|t1 −t0 | y1 − y1 = 0 ,
∀t ∈ J ;
dunque v coincide con u su J. Poich´e v `e definita anche alla destra di t1 , possiamo allora considerare la funzione
˜ = u(t)
u(t) in [t0 − α, t0 + α] , v(t) in [t0 + α, t0 + α + β] ,
che prolunga la soluzione in precedenza trovata all’intervallo [t0 − α, t0 + α + β] (si veda la Figura 10.6). Un’analoga estensione alla sinistra di t0 − α `e possibile se tale punto `e interno a I e il punto u(t0 − α) `e interno a D. y
y0 y1 u(t) v(t)
J t0 − α
t0
t1 − β
t1 = t 0 + α t1 + β
t
Figura 10.6. Prolungamento di una soluzione alla destra di t1
10.4 Esistenza e unicit` a del problema di Cauchy
461
y
D
t0
t+
t
Figura 10.7. Limite destro t+ dell’intervallo di esistenza massimale Jmax della soluzione di un problema di Cauchy
Il procedimento sopra descritto pu` o essere iterato, estendendo la u ad un intervallo aperto Jmax = (t− , t+ ) i cui estremi sono definiti nel modo seguente: t− = inf{t∗ ∈ I : il problema (10.34) ha soluzione in [t∗ , t0 ]} e t+ = sup{t∗ ∈ I : il problema (10.34) ha soluzione in [t0 , t∗ ]} . Questo `e precisamente l’intervallo massimale di esistenza di una soluzione u del problema (10.34). Se t+ `e strettamente minore dell’estremo superiore dell’intervallo I (e dunque la soluzione non `e ulteriormente estendibile alla destra di t+ pur essendo ivi ancora verificate da f le ipotesi di continuit` a e lipschitzianit` a rispetto a y), allora si pu` o dimostrare che u(t) si avvicina alla frontiera ∂D della regione D per t tendente a t+ (da sinistra). Tale situazione `e illustrata nella Figura 10.7. Analoghe considerazioni valgono per t− . Esempio 10.17 Consideriamo il problema di Cauchy ! y = y2 , y(0) = y0 . Le propriet` a di lipschitzianit` a della funzione f (t, y) = y 2 sono state studiate nell’Esempio (10.13) i). Sappiamo che, per ogni R > 0, f `e lipschitziana in ΩR = R × DR con DR = (−R, R). La soluzione del problema di Cauchy `e data da y0 . y(t) = 1 − y0 t
462
10 Equazioni differenziali ordinarie
Se y0 ∈ DR , non `e difficile verificare che l’intervallo massimale di esistenza della soluzione in DR , ossia l’insieme dei t per cui y(t) ∈ DR , `e dato da ⎧ 1 1 ⎪ ⎪ ( − ∞, − ) se y0 > 0 , ⎪ ⎪ y0 R ⎨ Jmax = (−∞, +∞) se y0 = 0 , ⎪ ⎪ ⎪ 1 1 ⎪ ⎩ ( + , +∞) se y0 < 0 . y0 R o conferma che la Si noti che, ad esempio per y0 > 0, si ha limt→t+ y(t) = R; ci` soluzione raggiunge la frontiera di DR per t → t+ . 2 10.4.3 Esistenza globale Diamo ora delle condizioni su f che garantiscono che ogni soluzione di un problema di Cauchy (10.34) esista su tutto l’intervallo I, vale a dire che si abbia Jmax = I. Si parla in tal caso di esistenza globale, o esistenza in grande della soluzione. La situazione elementare di un sistema autonomo in dimensione 1, y = f (y) , `e gi`a sufficiente ad illustrare vari scenari possibili. La funzione f (t, y) = f (y) = ay + b `e lipschitziana su tutto R × R e le soluzioni della corrispondente equazione differenziale, date da b y(t) = ceat − a (si ricordi l’Esempio 10.4 i)), sono definite su tutto R. Al contrario, la funzione f (t, y) = f (y) = y 2 non `e lipschitziana su tutto R2 (Esempio 10.13 i)) e le sue soluzioni non nulle esistono soltanto su intervalli limitati da destra o da sinistra (Esempio 10.17). Il primo caso rientra nel seguente risultato, che fornisce una condizione sufficiente per l’esistenza in grande. Teorema 10.18 Sia Ω = I ×Rn e valgano in Ω le ipotesi del Teorema 10.14. Allora la soluzione del problema di Cauchy (10.34) `e definita su tutto I. Notiamo che questo risultato `e coerente con il fatto, gi`a osservato, che se l’estremo t+ dell’intervallo massimale Jmax di esistenza della soluzione non coincide con l’estremo superiore di I, allora la soluzione tende verso la frontiera di D per t → t+ . Analogo comportamento si ha per l’estremo t− . Nella presente situazione, D = Rn e quindi la sua frontiera `e vuota; pertanto, ogni estremo di Jmax deve coincidere con il corrispondente estremo di I. L’ipotesi di lipschitzianit` a globale di f pone una stringente limitazione sul comportamento di f per y → ∞: f pu` o crescere, ma non pi` u che linearmente. Infatti, se scegliamo y1 = y ∈ Rn arbitrario e y1 = 0 nella (10.35), deduciamo che f (t, y) − f (t, 0) ≤ Ly ,
∀y ∈ Rn .
10.4 Esistenza e unicit` a del problema di Cauchy
463
Usando la disuguaglianza triangolare f (t, y) = f (t, 0) + f (t, y) − f (t, 0) ≤ f (t, 0) + f (t, y) − f (t, 0) , otteniamo quindi necessariamente f (t, y) ≤ f (t, 0) + Ly ,
y ∈ Rn .
Notiamo che, essendo f continua su Ω, la funzione scalare β(t) = f (t, 0) `e continua su I. L’esempio dell’equazione autonoma y = y log2 y , per la quale f (t, y) = f (y) = y log2 y cresce poco pi` u che linearmente per y → +∞ e che ammette soluzioni della forma y(t) = e−1/(x+c) e dunque non definite su tutto R, mostra che l’ipotesi di crescita al pi` u lineare di f non `e lontata dall’essere ottimale. Tuttavia, qualche utile estensione `e possibile. Infatti, si pu` o giungere allo stesso risultato del teorema precedente ponendo come ipotesi la crescita al pi` u lineare di f in y e indebolendo la condizione di lipschitzianit` a su I ×Rn ; precisamente, `e sufficiente supporre che f sia localmente lipschitziana (rispetto a y) in Ω. Ci` o significa che f `e lipschitziana rispetto a y, uniformemente rispetto a t, su ogni compatto K contenuto in Ω; in tal caso, la costante di Lipschitz LK pu` o dipendere da K. Tutte le funzioni considerate negli Esempi 10.13 sono infatti localmente lipschitziane (su R × R nei primi due esempi, su I × Rn nell’ultimo). Teorema 10.19 Sia f continua in Ω = I ×Rn ed ivi localmente lipschitziana rispetto a y, uniformemente rispetto a t; supponiamo inoltre che f (t, y) ≤ α(t)y + β(t) ,
∀y ∈ Rn , ∀t ∈ I .
(10.38)
con α, β funzioni continue e non negative su I. Allora la soluzione del problema di Cauchy (10.34) `e definita su tutto I. Inoltre, se α e β sono integrabili su I (eventualmente in senso improprio), ogni soluzione `e limitata su I. Un’applicazione particolarmente importante di questo risultato riguarda i sistemi lineari.
464
10 Equazioni differenziali ordinarie
Corollario 10.20 Ogni soluzione del sistema di equazioni differenziali y = A(t)y + b(t) , con A(t) ∈ Rn,n , b(t) ∈ Rn funzioni continue su un intervallo aperto I ⊆ R, `e definita su tutto I. In particolare, il corrispondente problema di Cauchy (10.34) con y0 ∈ Rn arbitrario ammette una e una sola soluzione definita su tutto I. Dim.
La funzione f (t, y) = A(t)y + b(t) `e localmente lipschitziana su I × Rn , per quanto visto nell’Esempio 10.13 iii). Inoltre, ragionando come in tale esempio, si ha f (t, y) ≤ A(t) y + b(t) ,
∀y ∈ Rn , ∀t ∈ I ,
e le funzioni α(t) = A(t) e β(t) = b(t) sono continue per le ipotesi fatte. Pertanto il risultato segue dal teorema precedente. 2 Applicazione: il pendolo semplice (II). Riprendiamo la discussione da pag. 444. Per la funzione f (y) ivi definita, si ha
0 1 Jf (y) = −k cos y1 −α e pertanto le componenti della matrice jacobiana di f sono uniformemente limitate su R2 , essendo ∂fi ∀y ∈ R2 , 1 ≤ i, j ≤ 2 ; ∂yj (y) ≤ max(k, α) , quindi f `e lipschitziana su tutto R2 . Ne segue che, grazie ai Teoremi 10.14 e 10.18, il problema di Cauchy (10.13) ammette esistenza e unicit`a di soluzione per ogni (θ0 , θ1 ) ∈ R2 e la soluzione esiste per tutti i tempi t > 0. Continuiamo la discussione di questa applicazione a pag. 469. 2 10.4.4 Esistenza globale unilaterale In diverse applicazioni, si ha necessit` a di risolvere una equazione differenziale ‘nel futuro’, e non ‘nel passato’. In altri termini, si ha interesse alla soluzione solo per t > t0 , e si vuole garantire che essa esista su un certo intervallo J avente t0 come estremo sinistro (ad esempio [t0 , +∞)), mentre la soluzione per t < t0 non `e rilevante. Presentiamo allora un risultato che, sfruttando una particolare propriet` a della funzione f , assicura l’esistenza globale unilaterale della soluzione di un problema di Cauchy.
10.4 Esistenza e unicit` a del problema di Cauchy
465
Iniziamo con un semplice esempio relativo a un’equazione scalare. Il problema autonomo
y = −y 3 , y(0) = y0 , `e determinato dalla funzione f (y) = −y 3 , che `e localmente lipschitziana su R ma, ovviamente, ha una crescita pi` u che lineare per y → ∞; dunque essa non verifica le ipotesi dei teoremi precedenti, ed infatti la soluzione y0 y(t) = 1 + 2y02 t
(10.39)
non esiste su tutto R. Esiste per`o su tutto l’intervallo [0, +∞), qualunque sia il dato iniziale y0 . Il fatto che la soluzione ‘non esploda’ al crescere di t pu` o essere dedotto ` direttamente dall’equazione differenziale, senza doverla risolvere esplicitamente. E infatti sufficiente moltiplicarla per y ed osservare che
d 1 2 1 dy yy = 2y = y ; 2 dt dt 2 dunque d dt
1 2 y 2
= −y 4 ≤ 0 ,
ossia la quantit` a E(y(t)) = 12 |y(t)|2 `e non crescente al crescere di t. Si ha in particolare 1 1 1 |y(t)|2 ≤ |y(0)|2 = |y0 |2 , ∀t ≥ 0 , 2 2 2 cio`e |y(t)| ≤ |y0 | , ∀t ≥ 0 . Concludiamo che, per tutti gli istanti temporali ‘nel futuro’, il valore assoluto della soluzione `e limitato da quello del dato iniziale, come peraltro `e confermato dall’espressione analitica (10.39). Si noti che nel ragionamento precedente abbiamo usato una propriet` a legata al segno di f (y) (se cambiamo −y 3 in +y 3 la conclusione non `e pi` u valida), la quale ‘non `e vista’ da condizioni quali la (10.35) o la (10.38), che fanno intervenire la norma di f (t, y). Diamo allora una condizione di esistenza globale unilaterale della soluzione, che in qualche modo generalizza l’esempio ora discusso. Proposizione 10.21 Sia Ω = I × Rn e sia f continua in Ω e ivi localmente lipschitziana rispetto a y, uniformemente rispetto a t. Se vale la condizione y · f (t, y) ≤ 0 ,
∀y ∈ Rn , ∀t ∈ I ,
(10.40)
466
10 Equazioni differenziali ordinarie
allora la soluzione del problema di Cauchy (10.34) esiste su tutto l’intervallo J = I ∩ [t0 , +∞) alla destra di t0 . Inoltre si ha y(t) ≤ y0 , Dim.
∀t ∈ J .
(10.41)
Prendendo il prodotto scalare con y di ambo i membri dell’equazione differenziale, abbiamo y · y = y · f (t, y) . Ma y · y =
n i=1
dyi 1d 2 1 d = y = y2 dt 2 i=1 dt i 2 dt n
yi
e dunque
d 1 2 y ≤ 0 , dt 2 da cui si ha y(t) ≤ y0 per ogni t > t0 per cui la soluzione esiste. Ne segue che si pu`o usare il Teorema di esistenza locale per prolungare la soluzione fino all’estremo destro di I. 2 Vediamo ora alcuni esempi notevoli in cui la condizione (10.40) `e verificata. Esempi 10.22 i) Sia y = Ay con A matrice reale antisimmetrica, cio`e tale che AT = −A. In tal caso, si ha y · f (y) = y · Ay = 0 , ∀y ∈ Rn , a poich´e y · Ay = y T Ay = (Ay)T y = y T AT y = −y T Ay e dunque tale quantit` `e nulla. Pertanto vale l’identit` a
d 1 2 y = 0 , dt 2 cio`e la funzione E(y(t)) = 12 y(t)2 `e costante nel tempo. Diciamo che essa `e un integrale primo dell’equazione differenziale, o anche un invariante del moto. Il sistema differenziale dicesi in tal caso conservativo. ii) Sia ora y = −(Ay + g(y)), con A matrice simmetrica e definita positiva e g(y) definita per componenti come g(y) i = φ(yi ) , 1 ≤ i ≤ n, dove φ : R → R `e continua e soddisfa φ(0) = 0 e sφ(s) ≥ 0, ∀s ∈ R (ad esempio, φ(s) = s3 come nella discussione iniziale). In tal caso, ricordando la (4.17), si ha y · f (y) = − (y · Ay + y · g(y)) ≤ −y · Ay ≤ −λ∗ y2 ≤ 0 , con λ∗ > 0. Pertanto, ponendo come sopra E(y) = 12 y2 , si ha d E(y(t)) ≤ −λ∗ y(t)2 , ∀t > t0 , dt
∀y ∈ Rn ,
10.4 Esistenza e unicit` a del problema di Cauchy
467
da cui si pu` o dedurre la disuguaglianza E(y(t)) ≤ e−2λ∗ (t−t0 ) E(y0 ) ,
∀t > t0 ;
ci`o mostra che E(y(t)) decade esponenzialmente al crescere di t. Equivalentemente, si ha t > t0 , y(t) ≤ e−λ∗ (t−t0 ) y0 , dunque tutte le soluzioni tendono esponenzialmente a 0 per t → +∞. Diremo nel § 10.8 che la soluzione costante y = 0 `e asintoticamente uniformemente stabile. Il sistema differenziale in questo caso si definisce dissipativo. Se inoltre la funzione φ `e convessa, si pu`o dimostrare la disuguaglianza y(t) − z(t) ≤ e−λ∗ (t−t0 ) y0 − z0 ,
t > t0 ,
relativa a due soluzioni y e z del problema di Cauchy con dati iniziali rispettivamente y0 e z0 . Essa fornisce una informazione assai pi` u precisa della disuguaglianza (10.36) per t > t0 . La funzione y → E(y) `e una funzione di Liapunov relativa all’origine per il sistema differenziale in esame. Con questo termine, si indica ogni funzione regolare V : B(0) → R, dove B(0) `e un intorno dell’origine, che soddisfa • V (0) = 0 , V (y) > 0 in B(0) \ {0} , d • V (y(t)) ≤ 0 per ogni soluzione y dell’equazione differenziale in B(0). dt
2
10.4.5 Integrali primi Consideriamo ora un’equazione autonoma, y = f (y), con f : D ⊆ Rn → Rn lipschitziana. Definizione 10.23 Una funzione scalare Φ : D → R dicesi integrale primo dell’equazione se Φ `e costante su ciascuna orbita dell’equazione, cio`e se Φ(y(t)) = costante per ogni soluzione y(t) dell equazione. Un integrale primo `e ovviamente definito a meno di una costante additiva. Se l’equazione ammette un integrale primo Φ, ciascuna sua orbita sar` a contenuta in un insieme di livello di Φ. Lo studio di tali insiemi pu` o allora fornire utili informazioni sull’esistenza globale delle soluzioni. Ad esempio, se l’orbita corrispondente a una particolare soluzione giace su un insieme di livello che non raggiunge la frontiera di D, allora siamo certi che quella soluzione esister`a per tutti i tempi. Anche l’analisi della stabilit` a asintotica delle soluzioni (vedasi a tale scopo il § 10.8) pu` o giovarsi di informazioni fornite dalla forma degli insiemi di livello di un integrale primo.
468
10 Equazioni differenziali ordinarie
Consideriamo dapprima un’equazione scalare del secondo ordine autonoma, della forma y + g(y) = 0 , (10.42) con g : R → R di classe C 1 . Essa riveste particolare importanza per i suoi legami con la Meccanica (legge di moto di Newton). Un caso gi`a citato `e l’equazione (10.11) del pendolo senza attrito. Indichiamo con Π una qualunque primitiva di g su R, di modo che si abbia dΠ (y) = g(y) , ∀y ∈ R. Allora, se y = y(t) `e una soluzione definita per t ∈ J, dy possiamo moltiplicare l’equazione (10.42) per y , ottenendo
d dy dy dΠ dy + = 0, dy dt dt dy dt ossia
d dt
1 2 (y (t)) + Π(y(t)) = 0 , 2
∀t ∈ J .
Dunque la quantit` a E(y, y ) =
1 2 (y ) + Π(y) 2
`e costante per ogni soluzione dell’equazione considerata. Diremo che Π(y) `e l’energia potenziale del sistema meccanico descritto da tale equazione, mentre K(y ) = 12 (y )2 sar`a l’energia cinetica ed E(y, y ) = K(y ) + Π(y) l’energia totale, che dunque `e conservata durante il moto. La funzione E risulta un integrale primo, nel senso della Definizione 10.23, per l’equazione vettoriale autonoma nel piano y = f (y) data da
y1 = y2 (10.43) y2 = −g(y1 ) , che equivale alla (10.42) ponendo y1 = y e y2 = y . Si ha cio`e Φ(y) = E(y1 , y2 ) = 1 2 2 y2 + Π(y1 ). Possiamo dunque studiare le curve di livello di Φ nel piano delle fasi y1 y2 per comprendere l’andamento delle soluzioni. Al termine del paragrafo, diamo un esempio, relativo al pendolo senza attrito. Generalizzando la situazione ora considerata, possiamo affermare che un’equazione autonoma y = f (y) posta in un aperto connesso D del piano ammette integrali primi se f `e il rotore di un campo scalare Φ definito in D, ossia se f (y) = rot Φ(y). Propriet` a 10.24 Sia Φ un campo scalare di classe C 1 in D ⊆ R2 . L’equazione y = rot Φ (10.44) ammette Φ come integrale primo.
10.4 Esistenza e unicit` a del problema di Cauchy
Dim.
469
Se y = y(t) `e una soluzione definita per t ∈ J, abbiamo dalla regola della catena d dy Φ(y) = (grad Φ) · = (grad Φ) · (rot Φ) = 0 , dt dt in quanto in due dimensioni il gradiente e il rotore di uno stesso campo scalare sono tra loro ortogonali. 2
Tenendo presente quanto visto nel § 7.2.1 a proposito delle curve di livello, l’equazione (10.44) impone precisamente a y di muoversi lungo una curva di livello di Φ. Ricordiamo che, in base ai risultati del § 9.6, una condizione sufficiente affinch`e valga f = rot Φ per un opportuno Φ `e che f sia solenoidale su un aperto D semplicemente connesso. Notiamo che, nella situazione trattata all’inizio della discussione, si ha f (y) = (y2 , −g(y1 )) = rot E(y1 , y2 ), e div f = 0 su tutto D = R2 . Infine, osserviamo che l’equazione (10.44) pu` o essere estesa alla dimensione 2n, considerando y = (y1 , y2 ) ∈ Rn × Rn = R2n definita dal sistema di 2n equazioni ⎧ ∂Φ ⎪ ⎪ ⎨ y1 = ∂y2 ∂Φ ⎪ ⎪ ⎩ y2 = − , ∂y1
(10.45)
dove Φ `e una funzione scalare di 2n variabili ed i simboli di derivata parziale indicano qui le n componenti del gradiente di Φ relative alle variabili indicate. Un tale sistema si definisce sistema hamiltoniano, e l’integrale primo Φ `e una hamiltoniana del sistema. Un esempio si ottiene partendo da una legge di Newton per n corpi, che generalizza la (10.42), z + grad Π(z) = 0 ,
z ∈ Rn ,
(10.46)
con Π funzione scalare di n variabili, e procedendo come nel caso n = 1 per trasformare l’equazione del secondo ordine in un sistema del primo ordine della forma (10.45). L’hamiltoniana Φ `e l’energia totale del sistema Φ(y1 , y2 ) = E(z, z ) = 1 2 2 z + Π(z). Nel caso D = Rn , si pu` o dimostrare che se l’energia potenziale `e inferiormente limitata, allora le soluzioni dell’equazione differenziale sono definite per tutti i tempi. Applicazione: il pendolo semplice (III). Riprendiamo la discussione da pag. 464. Consideriamo il pendolo senza attrito (α = 0), ossia l’equazione dθ2 + k sin θ = 0 . dt2
470
10 Equazioni differenziali ordinarie
Essa `e del tipo (10.42), con g(θ) = k sin θ; pertanto l’energia potenziale sar`a data da Π(θ) = c − k cos θ, con c costante arbitraria. Si osservi che essa `e certamente limitata dal basso, il che conferma l’esistenza di tutte le soluzioni dell’equazione ` consuetudine scegliere c = k, in modo tale che l’energia per ogni tempo t ∈ R. E potenziale sia nulla per θ = 2π, ∈ Z, in corrispondenza della posizione inferiore S del pendolo, ed assuma il suo massimo valore, 2k > 0, per θ = (2 + 1)π, ∈ Z, in corrispondenza della posizione superiore I del pendolo. Con tale scelta, l’energia totale diventa 1 E(θ, θ ) = (θ )2 + k(1 − cos θ) , 2 ossia, nel piano delle fasi y1 = θ, y2 = θ , E(y1 , y2 ) =
1 2 y + k(1 − cos y1 ) . 2 2
(10.47)
Studiamo questa funzione in R2 . Essa `e sempre ≥ 0 e si annulla nei punti della forma (2π, 0), ∈ Z, che quindi sono punti di minimo assoluto: il pendolo `e fermo nella posizione S. Il suo gradiente ∇E(y1 , y2 ) = (k sin y1 , y2 ) `e nullo nei punti della forma (π,0), ∈ Z; pertanto, oltre ai punti di minimo gi` a visti, abbiamo i punti stazionari (2 + 1)π, 0 , ∈ Z, che facilmente si identificano come punti sella. Le curve di livello E(y1 , y2 ) = c ≥ 0, definite dalle relazioni y2 = ± 2(c − k) + 2k cos y1 , hanno la seguente struttura (si veda la Figura 10.8 per una loro visualizzazione): •
Per c < 2k, sono curve chiuse che circondano i punti di minimo di E; esse corrispondono a oscillazioni periodiche del pendolo con angolo θ compreso tra −θ0 e θ0 (pi` u multipli di 2π), dove θ0 `e definito dalla condizione che tutta l’energia c sia potenziale, ossia da k(1 − cos θ0 ) = c. • Per c = 2k, i rami di curva congiungono due punti di sella di E e corrispondono alla situazione limite in cui il pendolo raggiunge la posizione di equilibrio superiore I con velocit`a nulla (e in un tempo infinito). • Per c > 2k, le curve sono non chiuse e non limitate, e corrispondono ad una velocit`a minima non nulla e dunque in grado di far superare al pendolo il punto di equilibrio superiore; il pendolo gira infinite volte attorno al perno O. La discussione prosegue a pag. 505.
2
10.5 Sistemi di equazioni lineari del primo ordine Questo e il successivo paragrafo sono dedicati allo studio delle equazioni lineari vettoriali del primo ordine y = A(t)y + b(t) ,
(10.48)
10.5 Sistemi di equazioni lineari del primo ordine
471
y2 c > 2k
c = 2k 0 −π
c < 2k π
y1
Figura 10.8. Orbite relative al moto di un pendolo senza attrito. Esse coincidono con le curve di livello dell’energia totale E(y1 , y2 )
con A funzione definita su un intervallo I della retta reale a valori nello spazio vettoriale Rn×n delle matrici quadrate di ordine n, e b funzione definita in I a valori in Rn . Supporremo che A e b siano funzioni continue di t. Ricordiamo che la scrittura (10.48) rappresenta, in forma compatta, un sistema di n equazioni differenziali scalari in n funzioni incognite, e precisamente il sistema ⎧ y1 = a11 (t)y1 + a12 (t)y2 + . . . + a1n (t)yn + b1 (t) ⎪ ⎪ ⎪ ⎪ ⎨ y2 = a21 (t)y1 + a22 (t)y2 + . . . + a2n (t)yn + b2 (t) .. ⎪ ⎪ . ⎪ ⎪ ⎩ yn = an1 (t)y1 + an2 (t)y2 + . . . + ann (t)yn + bn (t) . Osservazione 10.25 L’interesse nello studio delle equazioni differenziali lineari sta nel fatto che svariati modelli matematici fanno intervenire fin dall’origine equazioni di questo tipo. Inoltre, i modelli che si basano su equazioni differenziali non lineari possono sovente essere approssimati da modelli lineari, pi` u semplici e pi` u maneggevoli, attraverso il processo di linearizzazione. Esso consiste nell’applicare uno sviluppo di Taylor arrestato al primo ordine alla funzione non lineare, e nel trascurare il resto. Concretamente, supponiamo che f sia di classe C 1 rispetto alla variabile y in Ω, ¯ e supponiamo che la funzione y(t), t ∈ J ⊆ I, sia una soluzione nota dell’equazione ¯ = y¯0 ). Allora le differenziale y = f (t, y) (ad esempio una soluzione costante y(t) ¯ soluzioni y(t) dell’equazione ‘vicine a y(t)’ possono essere approssimate in questo modo: per ogni t ∈ J, sviluppiamo la funzione y → f (t, y) rispetto a y nell’intorno
472
10 Equazioni differenziali ordinarie
¯ di y(t), ottenendo ¯ ¯ ¯ y − y(t) + g(t, y) (10.49) f (t, y) = f t, y(t) + Jy f t, y(t) ¯ ¯ con g(t, y) = o y − y(t) per y → y(t); il simbolo Jy f indica la matrice jacobiana di f rispetto alle sole variabili y. Poniamo ¯ A(t) = Jy f t, y(t) ¯ ed osserviamo che f t, y(t) = y¯ (t), essendo y¯ una soluzione dell’equazione. Sostituendo la (10.49) nell’equazione y = f (t, y) otteniamo ¯ + g(t, y) ; ¯ = A(t)(y − y) (y − y) trascurando il termine infinitesimo g, possiamo quindi approssimare la soluzione y ponendo z ∼ y − y¯ e risolvendo l’equazione lineare z = A(t)z ; se y0 `e individuata dalla condizione iniziale y(t0 ) = y0 in t0 ∈ J, allora z sar`a ¯ 0 ). Una volta trovato z, determinato dalla condizione iniziale z(t0 ) = y0 − y(t ˜ = y(t) ¯ + z(t). l’approssimazione di y(t) sar`a data da y(t) Nel caso notevole di un sistema autonomo che ammette soluzione costante y¯0 , la matrice A `e indipendente dal tempo. 2 Ritornando all’equazione (10.48), mostreremo nel seguito che essa ammette esattamente n soluzioni linearmente indipendenti; dunque, come anticipato nel § 10.2, l’integrale generale dipende da n costanti arbitrarie, che possono essere determinate associando all’equazione un’opportuna condizione di Cauchy in un punto t0 ∈ I. Inoltre, nel caso in cui A sia indipendente da t, cio`e in cui i coefficienti aij siano costanti, otterremo l’espressione dell’integrale generale a partire dalla conoscenza degli autovalori di A e dei corrispondenti autovettori (da intendersi anche in senso generalizzato, come definito nel seguito). Iniziamo studiando il caso omogeneo, ossia b = 0. 10.5.1 Sistema omogeneo Consideriamo l’equazione omogenea associata alla (10.48) y = A(t)y ,
t∈I,
(10.50)
e mostriamo il seguente fondamentale risultato. Proposizione 10.26 L’insieme S0 delle soluzioni dell’equazione (10.50) `e uno spazio vettoriale di dimensione n.
10.5 Sistemi di equazioni lineari del primo ordine
Dim.
473
Poich´e l’equazione `e lineare, ogni combinazione lineare di soluzioni `e ancora una soluzione, e pertanto S0 `e uno spazio vettoriale. Per dimostrare che `e di dimensione n, costruiamo esplicitamente una sua base. A tale scopo, fissiamo un qualunque punto t0 ∈ I e consideriamo gli n problemi di Cauchy
y = A(t)y , t ∈ I , y(t0 ) = ei , dove {ei }i=1,...,n `e la base canonica di Rn . Ricordando il Corollario 10.20, ciascuno di essi ammette un’unica soluzione y = ui (t) di classe C 1 su I. Le funzioni ui , i = 1, . . . , n, sono tra loro linearmente indipendenti. Infatti, se n n y= αi ui `e la funzione identicamente nulla su I, si ha αi ui (t) = 0 i=1
per ogni t ∈ I, e dunque in particolare in t = t0 si ottiene n
αi ui (t0 ) =
n
i=1
i=1
αi ei = 0 ,
i=1
da cui necessariamente segue αi = 0, ∀i, il che mostra l’indipendenza lineare delle funzioni ui . Infine, se y = y(t) `e un qualunque elemento di S0 , rappresentiamo il n y0i ei ; allora y(t) si esprime come vettore y0 = y(t0 ) nella forma y0 = i=1
y(t) =
n
y0i ui (t)
i=1
grazie all’unicit` a della soluzione del problema di Cauchy, in quanto ambo 2 i membri soddisfano l’equazione e la condizione iniziale in t0 . L’insieme {ui }i=1,...,n delle funzioni soddisfacenti
ui = A(t)ui , t ∈ I , ui (t0 ) = ei ,
(10.51)
`e un esempio di sistema fondamentale di soluzioni, secondo la definizione seguente. Definizione 10.27 Ogni base di S0 dicesi sistema fondamentale di soluzioni dell’equazione (10.50). Il seguente risultato `e utile per verificare se un insieme di n soluzioni dell’equazione (10.50) `e un sistema fondamentale.
474
10 Equazioni differenziali ordinarie
Proposizione 10.28 Siano w1 , . . . , wn ∈ S0 . a) Se in un punto t0 ∈ I i vettori w1 (t0 ), . . . , wn (t0 ) sono linearmente indipendenti, allora w1 , . . . , wn formano un sistema fondamentale di soluzioni. b) Se w1 , . . . , wn formano un sistema fondamentale di soluzioni, allora in ogni punto t0 ∈ I i vettori w1 (t0 ), . . . , wn (t0 ) sono linearmente indipendenti. Dim.
` sufficiente mostrare che le funzioni w1 , . . . , wn sono linearmente a) E indipendenti. Supponiamo quindi che esistano coefficienti ci tali che n
ci wi (t) = 0 ,
∀t ∈ I .
i=1
Scegliendo t = t0 e usando l’ipotesi, deduciamo che ogni ci `e nullo. b) Supponiamo che esistano coefficienti c1 , . . . , cn tali che n
ci wi (t0 ) = 0 .
i=1
Definiamo la funzione z(t) =
n
ci wi (t); essa soddisfa
i=1
z = Az z(t0 ) = 0 ,
e dunque per l’unicit` a del problema di Cauchy si ha z(t) = 0 per ogni 2 t ∈ I. L’ipotesi implica allora che tutti i ci devono essere nulli Grazie a tale proposizione, la verifica della indipendenza lineare di n funzioni vettoriali definite su I `e ridotta alla ben pi` u facile verifica della indipendenza lineare di n vettori di Rn . Vediamo ora come la conoscenza di un sistema fondamentale permette sia di trovare tutte le soluzione dell’equazione (10.50) sia di risolvere un corrispondente problema di Cauchy. Dato quindi un sistema fondamentale {w1 , . . . , wn }, possiamo associare ad esso, per ogni t ∈ I, la matrice di ordine n W (t) = w1 (t), . . . , wn (t) le cui colonne sono i vettori wi (t); in base al punto b) della proposizione precedente, essa `e non singolare perch´e le sue colonne sono linearmente indipendenti. Tale
10.5 Sistemi di equazioni lineari del primo ordine
475
matrice viene detta matrice fondamentale e permette di scrivere le n equazioni vettoriali wi = A(t)wi , i = 1, . . . , n, nella forma matriciale compatta W = A(t)W .
(10.52)
Inoltre, ogni soluzione y = y(t) dell’equazione (10.50) si rappresenta come y(t) =
n
ci wi (t)
i=1
per opportune costanti ci ∈ R. Equivalentemente, posto c = (c1 , . . . , cn )T , si ha y(t) = W(t) c . La soluzione del generico problema di Cauchy
in I , y = Ay y(t0 ) = y0 ,
(10.53)
(10.54)
viene quindi determinata risolvendo il sistema lineare W(t0 ) c = y0 ;
(10.55)
pertanto essa si pu`o esprimere formalmente come y(t) = W(t)W −1(t0 ) y0 . Una particolare semplificazione si ottiene considerando la matrice fondamentale U (t) associata alla base speciale {ui } definita dalle (10.51); essa `e soluzione del problema di Cauchy in forma matriciale
U = A(t)U in I , (10.56) U (t0 ) = I , e permette di scrivere la soluzione del problema di Cauchy (10.54) nella forma y(t) = U(t) y0 . Lo studio dell’equazione (10.50) prosegue nel § 10.6 sotto l’ipotesi aggiuntiva che A sia costante. 10.5.2 Sistema non omogeneo Ritorniamo all’equazione (10.48). Indicando con Sb l’insieme delle sue soluzioni, esso pu` o essere caratterizzato a partire dalla conoscenza di una soluzione particolare, detta anche integrale particolare.
476
10 Equazioni differenziali ordinarie
Proposizione 10.29 Sia yp una soluzione dell’equazione (10.48). Allora, Sb `e lo spazio affine Sb = yp + S0 . Dim.
Se y ∈ Sb , allora per linearit` a y − yp `e una soluzione dell’equazione omogenea (10.50), e quindi y − yp ∈ S0 . 2
La proposizione afferma che, dato un qualunque sistema fondamentale w1 , . . . , wn di soluzioni dell’equazione omogenea, ogni soluzione della (10.48) si pu` o scrivere nella forma n y(t) = W(t) c + yp (t) = ci wi (t) + yp (t) i=1
per un opportuno c = (c1 , . . . , cn )T ∈ Rn . Un diverso modo di esprimere l’integrale generale della (10.48) `e dato dal metodo di variazione delle costanti, gi` a introdotto per il caso scalare nel § 10.3.3. Ricordando la (10.53), cerchiamo la soluzione nella forma y(t) = W(t) c(t) con c(t) funzione derivabile da determinarsi. Sostituendo nell’equazione, abbiamo W (t) c(t) + W(t) c (t) = A(t)W(t) c(t) + b(t) . Facendo uso della (10.52), tale espressione si riduce a W(t) c (t) = b(t) ,
da cui
ossia c(t) =
c (t) = W −1(t) b(t) ,
W −1(t) b(t) dt ,
(10.57)
dove il simbolo di integrale indefinito indica il calcolo delle primitive di ciascuna componente del vettore W −1(t) b(t). Concludiamo che l’integrale generale della (10.48) si esprime come y(t) = W(t)
W −1(t) b(t) dt .
Esempio 10.30 Consideriamo l’equazione ⎛ 1 e4t √ − 2 −2 ⎜ 1 − t2 1 + t2 y = y+⎜ ⎝ 1 e4t −2 2 √ − 1 + t2 1 − t2
(10.58)
⎞ ⎟ ⎟. ⎠
(10.59)
10.5 Sistemi di equazioni lineari del primo ordine
477
` facile verificare che un sistema fondamentale di soluzioni dell’equazione omoE genea `e data da
1 1 w1 (t) = , w2 (t) = e4t −1 1 (nel paragrafo successivo vedremo come arrivare a questo risultato). Pertanto la matrice fondamentale e la sua inversa sono
1 1 e4t 1 1 −1 W (t) = , W (t) = . 1 −e4t 2 e−4t −e−4t Ne segue che ⎛ ⎞ 1 √ 2 ⎟ ⎜ W −1 (t)b(t) = ⎝ 1 − t ⎠ 1 e dunque
1 + t2
arcsin t + c1 . W (t)b(t) dt = arctan t + c2 Pertanto, grazie alla (10.58), l’integrale generale dell’equazione data `e
arcsin t + c1 + e4t (arctan t + c2 ) y(t) = . arcsin t + c1 − e4t (arctan t + c2 )
−1
Qualora si voglia risolvere il problema di Cauchy
y = A(t)y + b(t) in I , y(t0 ) = y0 ,
2
(10.60)
`e conveniente scrivere la (10.57) nella forma equivalente t W −1(s) b(s) ds . c(t) = c + t0
con c ∈ Rn arbitrario. La (10.58) diventa allora t W(t)W −1(s) b(s) ds ; y(t) = W(t)c + t0
ponendo t = t0 , si ha y(t0 ) = W(t0 )c, e dunque c `e ancora determinato risolvendo il sistema (10.55). In definitiva, la soluzione del problema di Cauchy si pu` o rappresentare come y(t) = yom (t) + yp (t) , dove yom (t) = W(t)W −1(t0 )y0 risolve il sistema omogeneo (10.54), mentre
t
yp (t) =
W(t)W −1(s) b(s) ds
t0
risolve il problema non omogeneo con dato nullo in t = t0 .
(10.61)
478
10 Equazioni differenziali ordinarie
Esempio 10.31 Risolviamo il problema di Cauchy (10.60) per la stessa equazione dell’esempio precedente, con y(0) = (4, 2)T . Scriviamo l’integrale generale sopra trovato come
c1 + e4t c2 arcsin t + e4t arctan t y(t) = + ; c1 − e4t c2 arcsin t − e4t arctan t il primo addendo a secondo membro `e la soluzione yom dell’equazione omogenea associata, mentre il secondo addendo `e la soluzione particolare yp che si annulla in t = 0. Le costanti c1 e c2 si determinano ponendo t = 0 e risolvendo il sistema lineare
1 1 c1 4 , = 1 −1 2 c2 da cui c1 = 3 e c2 = 1. 2
10.6 Sistemi lineari con matrice A costante Riprendiamo lo studio dell’equazione (10.48), sotto l’ipotesi aggiuntiva che A sia indipendente dal tempo. Indichiamo nel seguito una procedura per determinare un sistema fondamentale di soluzioni dell’equazione omogenea y = Ay
in I = R .
(10.62)
Essa si fonda sulla conoscenza degli autovalori di A, ossia delle radici del cosiddetto polinomio caratteristico dell’equazione, definito da χ(λ) = det(A − λI) , e dei corrispondenti autovettori (eventualmente generalizzati, come definito nel seguito). Alla base di tutti i risultati che ora presentiamo sta la seguente fondamentale propriet` a: se λ `e autovalore di A e se v `e un corrispondente autovettore, allora la funzione w(t) = eλt v `e soluzione dell’equazione (10.62) (a valori complessi se λ `e complesso). Infatti, usando la (10.28) e la relazione Av = λv, si ha d λt deλt e v = v = λeλt v = eλt Av = A eλt v = Aw(t) . dt dt Dividiamo la presentazione in tre parti: dapprima esplicitiamo i passi da compiere per arrivare all’espressione del sistema fondamentale; successivamente, illustriamo la procedura su alcuni esempi e, infine, forniamo una giustificazione teorica. w (t) =
10.6 Sistemi lineari con matrice A costante
479
Per semplicit`a espositiva, preferiamo trattare separatamente il caso in cui A sia diagonalizzabile. Tale caso include la situazione notevole delle matrici simmetriche (i cui autovalori e autovettori sono tutti reali), e pi` u in generale, delle matrici normali (si veda il § 4.2). Successivamente, prendiamo in esame il caso, pi` u complesso, di una matrice non diagonalizzabile. Da ultimo, descriviamo una procedura di risoluzione dell’equazione non omogenea, per alcuni casi notevoli di termine noto b(t). 10.6.1 Sistema omogeneo con A diagonalizzabile Supponiamo che la matrice A ammetta autovalori reali λ1 , . . . , λ ed n − autovalori complessi, che, essendo A reale, compaiono come m coppie di autovalori complessi coniugati λ+1 , λ+1 , . . . , λ+m , λ+m ; supponiamo qui che gli autovalori siano ripetuti secondo la loro molteplicit` a algebrica, e dunque si abbia + 2m = n. Corrispondentemente, a ciascun autovalore reale λk , 1 ≤ k ≤ , corrisponde un autovettore reale vk , mentre a ciascuna coppia (λ+k , λ+k ), 1 ≤ k ≤ m, corrisponde una coppia di autovettori (v+k , v +k ) complessi coniugati. Essendo A diagonalizzabile, possiamo supporre che tali autovettori siano linearmente indipendenti (su C). •
Per ogni autovalore reale λk , 1 ≤ k ≤ , introduciamo la funzione wk (t) = eλk t vk .
•
Per ogni coppia (λ+k , λ+k ), 1 ≤ k ≤ m di autovalori complessi coniugati, decomponiamo autovalori e autovettori in parte reale e parte immaginaria, (1) (2) ponendo λ+k = σk + iωk e v+k = vk + ivk . Introduciamo allora la coppia di funzioni (1) (1) (2) wk (t) = Re eλ+k t v+k = eσk t vk cos ωk t − vk sin ωk t (1) (2) (2) wk (t) = Im eλ+k t v+k = eσk t vk sin ωk t + vk cos ωk t .
Proposizione 10.32 Con le notazioni sopra introdotte, l’insieme di funzio(1) (2) (1) (2) ni {w1 , . . . , w , w1 , w1 , . . . , wm , wm } costituisce un sistema fondamentale di soluzioni dell’equazione (10.62). Pertanto l’integrale generale di tale equazione si scrive nella forma y(t) =
ck wk (t) +
k=1 (1)
m
(1) (1) (2) (2) ck wk (t) + ck wk (t) ,
k=1 (2)
(1)
(2)
con c1 , . . . , c , c1 , c1 , . . . , cm , cm ∈ R.
(10.63)
480
10 Equazioni differenziali ordinarie
L’espressione (10.63) non `e altro che la particolarizzazione della formula generale (10.53) alla specifica situazione qui considerata; W (t) `e la matrice fondamentale associata al sistema sopra introdotto. Esempi 10.33 i) La matrice
A=
−1 2 2 −1
ammette autovalori λ1 = 1 e λ2 = −3; i corrispondenti autovettori sono
1 1 e v2 = . v1 = 1 −1 Conseguentemente, la (10.63) fornisce l’integrale generale dell’equazione (10.62):
t
c1 e + c2 e−3t 1 1 t −3t + c2 e = . y(t) = c1 e 1 −1 c1 et − c2 e−3t Per determinarne una soluzione particolare, possiamo ad esempio considerare il problema di Cauchy che impone la condizione iniziale
2 y(0) = y0 = , 1 corrispondente al sistema lineare
c 1 + c2 = 2 c1 − c2 = 1 . Otteniamo quindi c1 = 3/2 e c2 = 1/2 e pertanto la soluzione cercata `e
1 3et + e−3t . y(t) = 2 3et − e−3t ii) La matrice
⎞ 1 1 0 A = ⎝ 0 −1 1 ⎠ 0 −10 5 ⎛
` ammette gli autovalori λ1 = 1, λ2 = 2 + i con il suo coniugato λ2 = 2 − i. E facile verificare che i corrispondenti autovettori sono ⎛ ⎞ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎛ ⎞ 0 1 0 1 1 1 v1 = ⎝ 0 ⎠ , v2 = ⎝ 1 + i ⎠ = ⎝ 1 ⎠ + i ⎝ 1 ⎠ , v 2 = ⎝ 1 ⎠ − i ⎝ 1 ⎠ . 4 2 4 0 2 + 4i 2 (1)
(2)
Pertanto, dalla (10.63) (in cui per semplicit` a poniamo c2 = c2 e c3 = c2 ), deduciamo che l’integrale generale della (10.62) `e dato da ⎤ ⎛ ⎞ ⎛ ⎞ ⎡⎛ ⎞ 0 1 1 y(t) = c1 et ⎝ 0 ⎠ + c2 e2t ⎣⎝ 1 ⎠ cos t − ⎝ 1 ⎠ sin t⎦ + 4 0 2
10.6 Sistemi lineari con matrice A costante
⎤ ⎛ ⎞ ⎡⎛ ⎞ 0 1 + c3 e2t ⎣⎝ 1 ⎠ sin t + ⎝ 1 ⎠ cos t⎦ 4 2 ⎡ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎤ 1 1 0 = c1 ⎝ 0 ⎠ et + ⎣c2 ⎝ 1 ⎠ − c3 ⎝ 1 ⎠⎦ e2t cos t + 0 2 4 ⎛ ⎞ ⎛ ⎞⎤ ⎡ 0 1 + ⎣−c2 ⎝ 1 ⎠ + c3 ⎝ 1 ⎠⎦ e2t sin t 4 2 ⎞ ⎛ c1 et + c2 e2t cos t + c3 e2t sin t ⎟ ⎜ = ⎝ (c2 − c3 )e2t cos t + (c3 − c2 )e2t sin t ⎠ . (c2 − 4c3 )e2t cos t + (2c3 − 4c2 )e2t sin t
481
2
Giustificazione. Poich´e autovalori e autovettori di A possono essere complessi, `e conveniente pensare l’equazione (10.62) come formulata in campo complesso. In altri termini, consideriamo y = y(t) come funzione da R a valori in Cn ; le sue parti reale yr (t) e immaginaria yi (t) sono soluzioni dei sistemi reali yr = Ayr
yi = Ayi
e
in I = R .
Tutte le operazioni algebriche successive sono da intendersi effettuate in campo complesso (ovviamente l’aritmetica complessa non `e necessaria se A `e diagonalizzabile in campo reale, ossia se tutti i suoi autovalori, e conseguentemente gli autovettori, sono reali). Sia Λ = diag(λ1 , . . . , λn ) la matrice diagonale avente gli autovalori di A sulla diagonale principale, e P = (v1 , . . . , vn ) la matrice quadrata avente gli autovettori di A come colonne. Possiamo dunque rappresentare A come A = P ΛP −1 .
(10.64)
Sia y una qualunque soluzione complessa della (10.62); sostituendo l’espressione (10.64) nella (10.62) e moltiplicando ambo i membri a sinistra per P −1 , otteniamo −1 P y = Λ P −1 y , grazie alla propriet` a associativa del prodotto matriciale. Ponendo quindi z = P −1 y ,
ossia
y = Pz ,
(10.65)
l’equazione (10.62) si trasforma nella forma diagonale z = Λz ,
(10.66)
482
10 Equazioni differenziali ordinarie
ossia nelle n equazioni scalari zk = λk zk ,
1 ≤ k ≤ n.
Ricordando l’Osservazione 10.5, esse ammettono le soluzioni zk (t) = dk eλk t ,
1 ≤ k ≤ n,
con dk ∈ C costanti arbitrarie. Introducendo la matrice diagonale eΛt = diag eλ1 t , . . . , eλn t
(10.67)
e il vettore costante d = (d1 , . . . , dn )T ∈ Cn , possiamo quindi scrivere le soluzioni di (10.66) come z(t) = eΛt d . Ritornando all’incognita y mediante la seconda delle (10.65), abbiamo pertanto y(t) = P eΛt d ;
(10.68)
essa rientra nella forma generale (10.53), ponendo W (t) = P eΛt . Esplicitando le colonne di tale matrice, abbiamo y(t) = d1 eλ1 t v1 + · · · + dn eλn t vn = d1 w1 (t) + · · · + dn wn (t) ,
(10.69)
avendo posto 1 ≤ k ≤ n.
wk (t) = eλk t vk ,
Ne segue che ogni soluzione complessa dell’equazione (10.62) si rappresenta come combinazione lineare (a coefficienti in C) delle n soluzioni wk , che quindi formano un sistema fondamentale in C. Per rappresentare le soluzioni reali, consideriamo il generico autovalore λ con il corrispondente autovettore v. Se λ ∈ R (e dunque v ∈ Rn ), poniamo w(t) = eλt v e notiamo che tale funzione `e una soluzione reale della (10.62). Se invece λ = σ + iω ∈ C e, conseguentemente v = v (1) + iv (2) ∈ Cn , le funzioni w(1) (t) = Re eλt v = eσt v (1) cos ωt − v (2) sin ωt , w(2) (t) = Im eλt v = eσt v (1) sin ωt + v (2) cos ωt , sono soluzioni reali della (10.62); ci` o si vede prendendo parte reale e immaginaria di ambo i membri dell’equazione e usando il fatto che A `e reale. In questo modo, facendo riferimento alle notazioni della Proposizione 10.32, otteniamo n soluzioni reali w1 (t), . . . , w (t) e
(1)
(2)
(1) (2) w1 (t), w1 (t), . . . , wm (t), wm (t) .
10.6 Sistemi lineari con matrice A costante
483
Non resta che verificare che esse sono linearmente indipendenti (su R), il che pu` o essere fatto usando la Proposizione 10.28, in cui `e conveniente scegliere t0 = 0. (1) (2) (1) (2) In tal caso si deve verificare che i vettori v1 , . . . , v , v1 , v1 , . . . , vm , vm sono ` un semplice esercizio di algebra lineare mostrare linearmente indipendenti su R. E che ci`o segue dalla indipendenza lineare degli autovettori v1 , . . . , vn su C (anzi, `e ad essa equivalente). Osservazione 10.34 Riprendendo l’espressione (10.68) della soluzione del sistema y = Ay, se imponiamo la condizione iniziale y(0) = y0 in t0 = 0 otteniamo P d = y0 , cio`e d = P −1 y0 . Pertanto, la soluzione del problema di Cauchy
y = Ay in I = R , y(0) = y0 , si pu` o rappresentare come
y(t) = eAt y0 ,
(10.70)
avendo introdotto la matrice esponenziale eAt = P eΛt P −1 . La formula precedente generalizza l’espressione y(t) = eat y0 per la soluzione del problema di Cauchy scalare y = ay, y(0) = y0 . La stessa rappresentazione (10.70) vale anche se la matrice A non `e diagonalizzabile. In tal caso, per` o, si fa ricorso ad una diversa definizione della matrice esponenziale, quale ad esempio eAt =
∞ 1 k (tA) . k!
k=0
Essa `e suggerita dallo sviluppo in serie (2.23) della funzione esponenziale ex ; la serie converge per ogni matrice A e per ogni valore di t ∈ R. 2 10.6.2 Sistema omogeneo con A non diagonalizzabile Indichiamo qui con λ1 , . . . , λp una numerazione degli autovalori distinti di A. Indichiamo con μi la molteplicit` a algebrica di λk , ossia la molteplicit`a della radice λk del polinomio caratteristico det(A − λI); si ha quindi n = μ1 + . . . + μp . Sia invece mk ≤ μk la molteplicit` a geometrica di λk , ossia il massimo numero di autovettori linearmente indipendenti vk,1 , . . . , vk,mk associati all’autovalore λk . Ricordiamo che A `e diagonalizzabile se e solo se le molteplicit`a algebrica e geometrica di ogni suo autovalore coincidono; nel seguito, supponiamo dunque che si abbia mk < μk per almeno un autovalore λk . In tale situazione, `e possibile dimostrare che esistono dk = μk − mk vettori rk,1 , . . . , rk,dk , detti autovettori generalizzati associati
484
10 Equazioni differenziali ordinarie
all’autovalore λk , tali che i μk vettori vk,1 , . . . , vk,mk , rk,1 , . . . , rk,dk sono tra loro linearmente indipendenti. Inoltre, l’insieme di tutti gli autovettori e autovettori generalizzati, al variare di k = 1, . . . , p, costituisce una base di Cn . Per costruire gli autovettori generalizzati associati ad un autovalore λk per cui mk < μk , procediamo nel modo seguente. Per ogni autovettore vk, , 1 ≤ ≤ mi , (0) poniamo rk, = vk, e cerchiamo se esiste una soluzione del sistema (0)
(A − λk I)r = rk, .
(10.71)
Notiamo che la matrice A − λk I `e singolare, per definizione stessa di autovalore. Pertanto il sistema precedente pu` o non essere risolubile. In tal caso, l’autovettore vk, non dar` a luogo ad autovettori generalizzati. Se invece il sistema ammette una (1) soluzione, indichiamola con rk, : tale vettore sar` a uno degli autovettori genera(1)
(0)
lizzati associati a λk . Ripetiamo allora la nostra ricerca, sostituendo rk, a rk, nella (10.71), e cos`ı via. Definiamo quindi una cascata di sistemi lineari (1)
(0)
(2)
(1)
(A − λk I)rk, = rk, , (A − λk I)rk, = rk, , .. .
(10.72)
(h)
che si interrompe non appena il sistema (A − λk I)r = rk, , h ≥ 0, non ammette soluzione. In tal modo, vengono generati qk, = h − 1 autovettori generalizzati. Dopo aver considerato tutti i valori di = 1, . . . , mk , avremo cos`ı costruito tutti i dk = qk,1 + . . . + qk,mk autovettori generalizzati associati a λk . Passiamo ora a definire un sistema fondamentale di soluzioni dell’equazione (10.62). •
Per ogni autovalore λk (1 ≤ k ≤ p) e per ogni autovettore vk, (1 ≤ ≤ mk ) ad esso associato, poniamo (0)
wk, (t) = eλk t vk, . (h)
• Se qk, > 0, ossia se esistono autovettori generalizzati di tipo rk, (1 ≤ h ≤ qk, ), costruiamo le seguenti funzioni (0) (1) (1) (1) wk, (t) = eλk t t rk, + rk, = eλk t t vk, + rk, , 1 2 (0) (1) (2) t rk, + t rk, + rk, , 2 e cos`ı via; in generale, si definir` a (2)
wk, (t) = eλk t
(h)
wk, (t) = eλk t
h j=0
1 (j) th−j rk, , (h − j)!
1 ≤ h ≤ qk, .
10.6 Sistemi lineari con matrice A costante
485
Proposizione 10.35 Con le notazioni sopra introdotte, l’insieme di funzioni (h) {wk, : 1 ≤ k ≤ p, 1 ≤ ≤ mk , 0 ≤ k ≤ qk, } costituisce un sistema fondamentale di soluzioni in C dell’equazione (10.62). Pertanto l’integrale generale di qiesta equazione si scrive nella forma y(t) =
−1 p mk qk,
(k)
(h)
ck wk, (t) ,
(10.73)
k=1 =1 h=0 (h)
con ck ∈ C. Per rappresentare le sole soluzioni reali, osserviamo che se λk ∈ R, allora tutti i corrispondenti autovettori propri e generalizzati saranno reali, e dunque anche (h) le funzioni wk, (t) costruite a partire da essi. Invece, in presenza di una coppia λk , λk = λk di autovalori complessi coniugati, anche i relativi autovettori (gene` pertanto sufficiente ralizzati e non) compariranno a coppie complesse coniugate. E sostituire a ciascuna coppia di funzioni complesse coniugate definite mediante tali vettori, la parte reale e la parte immaginaria di una di esse. In tal modo si ottiene un sistema fondamentale di soluzioni reali della (10.62). Osservazione 10.36 Abbiamo sopra supposto che A sia non diagonalizzabile. In realt`a, il procedimento appena descritto si applica anche se la matrice `e diagonalizzabile (in presenza di autovalori di molteplicit` a algebrica maggiore di 1, non `e possibile a priori sapere se la matrice sia o meno diagonalizzabile, salvo ad esempio quando essa `e simmetrica). Se la matrice `e diagonalizzabile, i sistemi (10.71) risulteranno impossibili, e la rappresentazione della soluzione data in (10.73) sar` a equivalente a quella data nel § 10.6.1. 2 Esempi 10.37 i) La matrice
⎞ 4 0 −1 A = ⎝1 5 1 ⎠ 1 0 2 ⎛
ammette autovalori λ1 = 5 e λ2 = 3. Il primo ha molteplicit` a algebrica μ1 = 1 e v11 = (0, 1, 0)T `e un autovettore ad esso associato. Il secondo ha molteplicit`a algebrica μ2 = 2 e molteplicit` a geometrica m2 = 1. Il vettore v21 = (1, −1, 1)T `e un autovalore associato a λ2 . Risolvendo il sistema (A − 3I)r = v21 otteniamo (1) un autovettore generalizzato r21 = (1, −1, 0)T che forma, insieme con v11 e v21 , 3 una base in R . Pertanto, l’integrale generale dell’equazione (10.62) ha la forma ⎞⎤ ⎞ ⎞ ⎛ ⎛ ⎞ ⎛ ⎡ ⎛ 1 0 1 1 y(t) = c1 e5t ⎝ 1 ⎠ + c2 e3t ⎝ −1 ⎠ + c3 e3t ⎣t ⎝ −1 ⎠ + ⎝ −1 ⎠⎦ . 0 0 1 1
486
10 Equazioni differenziali ordinarie
ii) La matrice
⎞ 3 0 0 A = ⎝0 3 0⎠ 1 0 3 ⎛
ha un unico autovalore λ = 3 con molteplicit` a geometrica m = 2. Infatti v11 = (0, 1, 0)T e v12 = (0, 0, 1)T sono due autovettori linearmente indipendenti ad esso associati. Inoltre, il sistema (A − 3I)r = v11 non ammette soluzioni, mentre il sistema (A − 3I)r = v12 (1)
ha, ad esempio, il vettore r12 = (1, 0, 0)T come soluzione. In definitiva, l’integrale generale dell’equazione (10.62) ha la forma ⎛ ⎞ ⎛ ⎞ ⎡ ⎛ ⎞ ⎛ ⎞⎤ 1 0 0 0 y(t) = c1 e3t ⎝ 1 ⎠ + c2 e3t ⎝ 0 ⎠ + c3 e3t ⎣t ⎝ 0 ⎠ + ⎝ 0 ⎠⎦ . 0 0 1 1 iii) La matrice
⎞ 1 5 0 A = ⎝0 1 0⎠ 4 0 1 ⎛
ha un unico autovalore λ = 1 associato ad un unico autovettore v11 = (0, 0, 1)T (ossia la molteplicit` a geometrica `e m = 1). Pertanto, ricordando che l’insieme degli autovettori propri e generalizzati `e una base di R3 , necessariamente la cascata (10.72) fornir` a due autovettori generalizzati. Infatti la cascata di sistemi (1)
(A − I)r11 = v11 (2)
(1)
(A − I)r11 = r11
(1)
(2)
ha come soluzioni gli autovettori generalizzati r11 = (1/4, 0, 0)T e r11 = (0, 1/20, 0)T . In definitiva, l’integrale generale dell’equazione (10.62) ha la forma ⎞⎤ ⎛ ⎞ ⎡ ⎛ ⎞ ⎛ 1/4 0 0 y(t) = c1 et ⎝ 0 ⎠ + c2 et ⎣t ⎝ 0 ⎠ + ⎝ 0 ⎠⎦ + 0 1 1 ⎞⎤ ⎞ ⎛ ⎛ ⎛ ⎞ 0 1/4 0 1 +c3 et ⎣ t2 ⎝ 0 ⎠ + t ⎝ 0 ⎠ + ⎝ 1/20 ⎠⎦ . 2 0 0 1 ⎡
2
Giustificazione. Tutti i risultati relativi agli autovettori, propri e generalizzati, di A si possono dedurre a partire dalla cosiddetta forma canonica di Jordan
10.6 Sistemi lineari con matrice A costante
487
di una matrice, la cui trattazione esula dagli scopi di questo corso. Possiamo invece facilmente giustificare l’indipendenza lineare delle funzio(h) ni wk, (t), che intervengono nella Proposizione 10.35, applicando la Proposizione 10.28 con t0 = 0. Si ha infatti (h)
(h)
wk, (0) = rk,
per ogni k, , h e dunque il risultato segue dall’analoga propriet` a degli autovettori della matrice A. 10.6.3 Sistema non omogeneo Consideriamo ora l’equazione non omogenea y = Ay + b(t) .
(10.74)
Alla luce della Proposizione 10.29, `e sufficiente determinarne un integrale particolare yp . Ricordiamo che il metodo di variazione delle costanti, ed in particolare la formula (10.61), fornisce un modo generale per risolvere tale problema. Tuttavia, in molte situazioni di interesse applicativo, il termine noto b(t) ha una struttura riconducibile alle funzioni elementari di tipo esponenziale, polinomiale e trigonometrico. In tal caso, `e possibile determinare facilmente un integrale particolare avente una analoga struttura. Nel seguito, chiameremo polinomi e indicheremo con p(t), q(t), . . ., le funzioni vettoriali da R in Rn le cui componenti sono polinomi algebrici reali; diremo che il polinomio ha grado m se ogni componente ha grado ≤ m ed almeno una di esse ha grado effettivo m. Un tale polinomio si pu` o scrivere come q(t) = c0 tm + c1 tm−1 + . . . + cm−1 t + cm , con cj ∈ Rn e c0 = 0. Supponiamo dunque che il termine noto abbia la forma b(t) = eαt p(t)
(10.75)
con α ∈ R e p(t) polinomio di grado m. Esiste allora un integrale particolare della forma yp (t) = eαt q(t) , dove q(t) `e un polinomio di grado • m se α non `e autovalore della matrice A, • m + μ se α `e autovalore di molteplicit` a algebrica μ ≥ 1 di A.
(10.76)
488
10 Equazioni differenziali ordinarie
Con un linguaggio preso a prestito dalla Fisica, ci si riferisce a quest’ultima situazione come al caso di risonanza. I coefficienti incogniti di q(t) vengono determinati sostituendo l’espressione (10.76) nella (10.74), semplificando il termine esponenziale e uguagliando tra loro i coefficienti delle potenze di t di pari grado dei due polinomi a primo e secondo membro. Si ottiene in questo modo una cascata di sistemi lineari con matrice A−αI, che permettono di determinare, procedendo secondo le potenze decrescenti di t, delle soluzioni c0 , c1 , . . . , cm+μ . Si noti che, nel caso di risonanza, la matrice A − αI `e singolare; allora, il primo sistema della cascata altro non dice se non che c0 `e un autovettore di A, mentre i successivi sistemi richiedono l’imposizione di opportune condizioni di compatibilit` a per essere risolubili. Per maggiori dettagli teorici si rimanda a ; Complementi al Cap. 10 , mentre un calcolo esplicito `e fornito nell’Esempio 10.38 ii). Se il termine noto ha la forma b(t) = eαt p(t) cos ωt
oppure
b(t) = eαt p(t) sin ωt ,
(10.77)
con α ∈ R e p(t) polinomio di grado m e ω = 0, allora un integrale particolare avr` a la forma yp (t) = eαt q1 (t) cos ωt + q2 (t) sin ωt (10.78) con q1 (t) e q2 (t) polinomi di grado • m se α + iω non `e autovalore della matrice A, • m + μ se α + iω `e autovalore di molteplicit` a algebrica μ ≥ 1 di A. Il secondo caso viene ancora definito di risonanza. I coefficienti incogniti dei due polinomi si determinano come sopra, separando preliminarmente i termini moltiplicati per cos ωt da quelli moltiplicati per sin ωt. Esempi 10.38 i) Si voglia determinare un ⎛ 0 A = ⎝1 1
integrale particolare della (10.74), in cui ⎞ ⎛ ⎞ 0 −1 0 0 0⎠ e b(t) = ⎝ t ⎠ . t2 0 2
Facendo riferimento alla (10.75), si ha α = 0 e p(t) = b0 t2 + b1 t con b0 = (0, 0, 1)T , b1 = (0, 1, 0)T (e b2 = 0). Poich´e α non `e radice del polinomio caratteristico χ(λ) = (2 − λ)(λ2 + 1), cerchiamo l’integrale particolare nella forma yp (y) = q(t) = c0 t2 + c1 t + c2 . Sostituendo nella (10.74), abbiamo 2c0 t + c1 = Ac0 t2 + Ac1 t + Ac2 + b0 t2 + b1 t , da cui, uguagliando i termini corrispondenti alle stesse potenze di t, otteniamo
10.6 Sistemi lineari con matrice A costante
la cascata di sistemi lineari
489
!
Ac0 = −b0 Ac1 = 2c0 − b1 Ac2 = c1 . Risolvendo tali sistemi, otteniamo c0 = (0, 0, −1/2)T , c1 = (−1, 0, 0)T e c2 = (0, 1, 0)T . In definitiva, un integrale particolare ha la forma ⎞ ⎞ ⎛ ⎞ ⎛ ⎛ ⎛ ⎞ −t 0 0 −1 yp (t) = ⎝ 0 ⎠ t2 + ⎝ 0 ⎠ t + ⎝ 1 ⎠ = ⎝ 1 ⎠ . − 12 t2 0 −1/2 0 ii) Consideriamo ora l’equazione (10.74) con
1 9 −4 . A= e b(t) = et 0 8 −3 Poich´e α = 1 `e radice del polinomio caratteristico χ(λ) = (λ−5)(λ−1), abbiamo risonanza e dunque cerchiamo l’integrale particolare nella forma yp (t) = et (c0 t + c1 ) , avendo posto b0 = (1, 0)T . Sostituendo nell’equazione e cancellando il termine esponenziale, otteniamo c0 + c0 t + c1 = Ac0 t + Ac1 + b0 da cui
(A − I)c0 = 0 (A − I)c1 = c0 − b0 . La prima equazione dice che c0 `e un autovettore associato all’autovalore λ = 1; esso ha la forma c0 = (γ, 2γ)T per un’opportuna costante γ ∈ R. Tale costante viene determinata dalla condizione che il secondo sistema sia risolubile, ossia che il vettore c0 − b0 sia una combinazione lineare delle colonne della matrice A − I. Poich´e tale matrice ha rango 1, cio´e le sue due colonne sono linearmente dipendenti, la condizione equivale al fatto che c0 − b0 sia multiplo di una delle altre colonne, ossia (γ − 1, 2γ)T = k(1, 1)T , cio´e γ − 1 = 2γ da cui γ = −1. Sostituendo nella seconda si ottiene c0 = (−1, −2)T e, ad esempio, c1 = (1, 5/2)T . In definitiva, un integrale particolare ha la forma
1 −1 −t + 1 = et t+ . yp (t) = et 5/2 −2 −2t + 5/2 iii) Calcoliamo un integrale particolare della (10.74), in cui ⎛ ⎞ ⎛ ⎞ 0 −1 0 1 A = ⎝1 0 0 ⎠ e b(t) = ⎝ 0 ⎠ sin 2t . 0 1 −1 0 Rispetto alla (10.77) si ha α = 0, p(t) = (1, 0, 0)T = p0 e ω = 2. Il numero complesso α + iω = 2i non `e uno degli autovalori di A (questi sono dati da −1 e ±i) e quindi la (10.78) avr` a la forma yp (t) = q1 cos 2t + q2 sin 2t con q1 , q2 ∈ R3 . Sostituendo nella (10.74), si ha −2q1 sin 2t + 2q2 cos 2t = Aq1 cos 2t + Aq2 sin 2t + p0 sin 2t ;
490
10 Equazioni differenziali ordinarie
uguagliando i termini moltiplicati rispettivamente per sin 2t e cos 2t si ottiene la coppia di sistemi lineari
−2q1 = Aq2 + p0 2q2 = Aq1 , le cui soluzioni sono q1 = (−2/3, 0, 1/6)T e q2 = (0, −1/3, −1/12)T . Concludiamo che un integrale particolare `e dato da ⎞ ⎞ ⎛ ⎛ ⎛ ⎞ 0 −2/3 8 cos 2t 1 ⎠. 2 yp (t) = ⎝ 0 ⎠ cos 2t − ⎝ 1/3 ⎠ sin 2t = − ⎝ 4 sin 2t 12 1/12 1/6 sin 2t − 2 cos 2t
Principio di sovrapposizione Se infine b(t) `e una somma di termini del tipo (10.75) oppure (10.77), allora, grazie alla linearit` a dell’equazione, una soluzione particolare yp sar` a data dalla somma di soluzioni particolari relative ai singoli addendi. In altri parole, se b = b1 + b2 + . . . + bK e se ypk `e soluzione di y = Ay + bk per k = 1, . . . , K, allora yp = yp1 + . . . + ypK `e soluzione di y = Ay + b. Infatti, si ha yp = yp1 + . . . + ypK = (Ayp1 + b1 ) + . . . + (AypK + bK ) = A(yp1 + . . . + ypK ) + (b1 + . . . + bK ) = Ayp + b .
Tale propriet` a prende il nome di principio di sovrapposizione. Una sua applicazione `e illustrata nell’Esempio 10.42 ii).
10.7 Equazioni lineari scalari di ordine n Affrontiamo ora lo studio delle equazioni scalari lineari y (n) + a1 y (n−1) + . . . + an−1 y + an y = b(t) ,
(10.79)
dove n `e un intero ≥ 2, i coefficienti a1 , . . . , an sono costanti reali e b `e una funzione reale definita e continua su un intervallo I della retta reale. Indichiamo con Ly l’espressione a primo membro; l’operatore L : y → Ly `e lineare, grazie alla propriet` a di linearit` a della derivazione. L’equazione Ly = y (n) + a1 y (n−1) + . . . + an−1 y + an y = 0 , dicesi equazione omogenea associata alla (10.79).
(10.80)
10.7 Equazioni lineari scalari di ordine n
491
Le basi teoriche per tale studio possono essere dedotte dai risultati relativi ai sistemi di equazioni lineari del primo ordine, stabiliti nel paragrafo precedente. Infatti, abbiamo gi` a osservato nel § 10.2 che una qualunque equazione differenziale di ordine n `e equivalente ad un sistema di n equazioni differenziali del primo ordine. Nella fattispecie, ponendo yi (t) = y (i−1) (t) per 1 ≤ i ≤ n, la (10.79) `e equivalente al sistema lineare ⎧ y1 = y 2 ⎪ ⎪ ⎪ ⎨ y = y 3 2 .. ⎪ ⎪ ⎪ ⎩ . yn = −a1 yn − . . . − an−1 y2 − an y1 + b(t) ; esso pu`o essere scritto nella forma (10.48), e precisamente come y = Ay + b(t) ,
(10.81)
se si pone ⎛
⎞ y1 ⎜ y2 ⎟ ⎟ y=⎜ ⎝ .. ⎠ , . yn
⎛
0 ⎜ 0 ⎜ A=⎜ ⎜ ⎝ ... −an
1 0 .. .
0 1
... 0
... −an−1
0 ...
0 ...
⎞ ... ... ⎟ ⎟ ⎟, ⎟ 1 ⎠ −a1
⎞ 0 . ⎜ .. ⎟ ⎟ b(t) = ⎜ ⎝ 0 ⎠. ⎛
b(t)
Ricordiamo che la prima componente del vettore y `e precisamente la soluzione dell’equazione (10.79). Equazione omogenea L’equazione omogenea (10.80) corrisponde quindi al sistema omogeneo associato alla (10.81). Da tale equivalenza, possiamo immediatamente dedurre il seguente fondamentale risultato. Proposizione 10.39 i) L’insieme S0 delle soluzioni dell’equazione omogena (10.80) `e uno spazio vettoriale di dimensione n. ii) L’insieme Sb delle soluzioni della (10.79) `e lo spazio affine Sb = yp + S0 , dove yp `e una qualunque soluzione di tale equazione. Dim.
i) S0 `e uno spazio vettoriale in quanto l’equazione (10.80) `e lineare. Ricordando la Proposizione 10.26, sia w1 , . . . , wn un sistema fondamentale di soluzioni dell’equazione omogenea y = Ay. Indichiamo con zi = wi · e1 le prime componenti di tali vettori, che ovviamente sono soluzioni della (10.80). Se y ∈ S0 , la funzione vettoriale y ad essa associata `e una combinazione lineare delle wi ; dunque in particolare la sua prima componente `e una
492
10 Equazioni differenziali ordinarie
combinazione lineare delle zi . Pertanto S0 `e generato da tali soluzioni. La tesi segue allora se mostriamo che le funzioni z1 , . . . , zn sono linearmente indipendenti. Se n ci zi (t) = 0 , ∀t ∈ R , i=1
allora derivando successivamente si ha, per 1 ≤ k ≤ n − 1, n
(k)
∀t ∈ R .
ci zi (t) = 0 ,
i=1 (k)
Ricordando che zi `e la componente (k + 1)-esima di wi , le relazioni precedenti equivalgono alla relazione vettoriale n
ci wi (t) = 0 ,
∀t ∈ R ,
i=1
e dunque otteniamo c1 = . . . = cn = 0 dall’indipendenza lineare delle wi . ii) Si ragiona come per l’analoga affermazione relativa ai sistemi del primo ordine (Proposizione 10.29). 2 Per determinare una base dello spazio S0 , non `e necessario ricondursi al sistema lineare associato alla (10.80), ma si pu` o operare direttamente su tale equazione. Precisamente, cerchiamo se esistono soluzioni nella forma y(t) = eλt , con λ costante eventualmente complessa. Sostituendo nella (10.80) e ricordando la (10.28), otteniamo L(eλt ) = (λn + a1 λn−1 + . . . + an−1 λ + an ) eλt = 0 , ossia L(eλt ) = χ(λ)eλt = 0 , avendo indicato con χ(λ) = λn + a1 λn−1 + . . . + an−1 λ + an il polinomio caratteristico dell’equazione differenziale (10.79). Essendo eλt sempre diverso da 0, ne segue che y(t) = eλt `e soluzione dell’equazione omogenea se e solo se λ `e radice del polinomio caratteristico, ossia se e solo se λ soddisfa l’equazione caratteristica λn + a1 λn−1 + . . . + an−1 λ + an = 0 .
(10.82)
Il problema differenziale `e dunque ricondotto ad un problema puramente algebrico, la cui risolubilit` a ci viene assicurata dal Teorema fondamentale dell’Algebra. Sappiamo infatti che l’equazione (10.82) ammette p soluzioni distinte λ1 , . . . , λp , con 1 ≤ p ≤ n; ogni radice λk , 1 ≤ k ≤ p, ha molteplicit` a μk ≥ 1, in modo che complessivamente si ha μ1 + . . . + μp = n. Le radici dell’equazione caratteristica altro non sono che gli autovalori della matrice A del sistema (10.81), in quanto si pu` o dimostrare che det(A − λI) = (−1)n χ(λ) .
10.7 Equazioni lineari scalari di ordine n
493
In questo modo, otteniamo immediatamente p soluzioni distinte dell’equazione (10.80), ossia e λ1 t , . . . , e λp t . Se p < n, ogni radice λk di molteplicit` a μk > 1 fornisce μk − 1 ulteriori soluzioni nella forma t eλk t , t2 eλk t , . . . , tμk −1 eλk t . Si dimostra che le n soluzioni cos`ı trovate sono linearmente indipendenti. Possiamo dunque enunciare il seguente risultato. Proposizione 10.40 Le funzioni zk, (t) = t eλk t ,
1 ≤ k ≤ p,
0 ≤ ≤ μk − 1 ,
formano una base dello spazio S0 delle soluzioni dell’equazione (10.80). Equivalentemente, ogni soluzione di tale equazione si scrive nella forma y(t) =
p
qk (t) eλk t ,
k=1
con qk polinomio di grado ≤ μk − 1. In presenza di radici complesse (coniugate) dell’equazione (10.82), le corrispondenti funzioni di base indicate sopra sono a valori complessi. Possiamo invece ottenere una base interamente reale sostituendo, per ogni coppia λk = σk + iωk , λk = σk − iωk di autovalori complessi coniugati, alle funzioni t eλk t e t eλk t la parte reale e la parte immaginaria di una di esse, vale a dire t eσk t cos ωk t
e
t eσk t sin ωk t .
Si ottengono in questo modo n soluzioni reali linearmente indipendenti. Esempi 10.41 i) Esplicitiamo la costruzione precedente nel caso notevole di un’equazione di secondo grado, y + a1 y + a2 y = 0 . (10.83) 2 2 Sia Δ = a1 − 4a2 il discriminante dell’equazione caratteristica λ + a1 λ + a2 = 0. √ Se Δ > 0, si hanno due radici reali e distinte λ1,2 = (−a1 ± Δ)/2 e dunque la generica soluzione della (10.83) si scrive come y(t) = c1 eλ1 t + c2 eλ2 t . (10.84)
494
10 Equazioni differenziali ordinarie
Se Δ = 0, si ha la radice reale λ1 = −a1 /2 con molteplicit`a μ1 = 2; pertanto la generica soluzione della (10.83) si scrive come y(t) = (c1 + c2 t) eλ1 t . (10.85) Infine, se Δ < 0 si ha la coppia di radici complesse coniugate λ1 = σ + iω = −a/2 + i |Δ| e λ2 = σ − iω = −a/2 − i |Δ|; concludiamo che la generica soluzione della (10.83) ha la forma y(t) = eσt (c1 cos ωt + c2 sin ωt) .
(10.86)
ii) Consideriamo l’equazione omogenea del quarto ordine y (4) + y = 0 . Le radici dell’equazione caratteristica λ4 + 1 = 0 sono le radici quarte di −1, √ 2 date da λ1,2,3,4 = 2 (±1 ± i). Pertanto y si scrive come √ √ √ √ √ √ 2 2 2 2 ( 2/2) t −( 2/2) t t + c2 sin t +e t + c4 sin t . c1 cos c3 cos y(t) = e 2 2 2 2 2 Equazione non omogenea Come nel caso dei sistemi del primo ordine, `e possibile determinare facilmente un integrale particolare nel caso in cui il termine noto b(t) abbia una specifica forma. Ad esempio, se b(t) = eαt p(t)
(10.87)
con α ∈ R e p(t) polinomio algebrico a coefficienti reali di grado m, esiste un integrale particolare della forma yp (t) = eαt tμ q(t) ,
(10.88)
dove μ ≥ 0 `e la molteplicit` a di α come radice dell’equazione caratteristica χ(λ) = 0 (si pone μ = 0 se α non `e radice di tale equazione, mentre se μ ≥ 1 si ha la cosiddetta risonanza), e q(t) `e un polinomio di grado m, i cui coefficienti sono incogniti. Essi vengono determinati sostituendo l’espressione (10.88) nella (10.79), semplificando il fattore comune eαt e uguagliando tra loro i coefficienti delle potenze di pari grado di t nei due membri. Se invece b(t) ha la forma b(t) = eαt p(t) cos ωt
oppure
b(t) = eαt p(t) sin ωt ,
(10.89)
con α ∈ R, p(t) polinomio algebrico a coefficienti reali di grado m e ω = 0, esiste un integrale particolare della forma yp (t) = eαt tμ q1 (t) cos ωt + q2 (t) sin ωt ,
(10.90)
10.7 Equazioni lineari scalari di ordine n
495
dove μ ≥ 0 `e la molteplicit` a di α + iω come radice dell’equazione caratteristica e q1 , q2 sono polinomi incogniti di grado m, la cui determinazione si effettua come sopra, separando preliminarmente i termini in cos ωt da quelli in sin ωt. Come nel caso dei sistemi del primo ordine, se il termine noto b(t) `e una somma di termini bk (t) di tipo (10.87) oppure (10.89), si applica il principio di sovrapposizione: un integrale particolare della (10.79) sar` a la somma degli integrali particolari relativi ai singoli termini bk (t), determinati con la procedura sopra illustrata. Esempi 10.42 i) Calcoliamo l’integrale generale dell’equazione y − y − 6y = te−2t . L’equazione caratteristica λ2 − λ − 6 = 0 ha radici λ1 = −2 e λ2 = 3, per cui l’integrale generale dell’equazione omogenea associata `e dato da yom (t) = c1 e−2t + c2 e3t . Poich´e siamo in presenza di risonanza tra il termine noto e una componente di yom , cerchiamo un integrale particolare nella forma yp (t) = t(at + b)e−2t . Derivando successivamente e sostituendo le espressioni trovate nell’equazione si perviene all’espressione −10at + 2a − 5b = t (il coefficiente di t2 a primo membro `e nullo, come conseguenza della risonanza), da cui otteniamo −10a = 1 e 2a − 5b = 0, cio`e a = −1/10 e b = −1/25. Concludiamo che l’integrale generale `e 1 1 y(t) = − t2 − t + c1 e−2t + c2 e3t . 10 25 ii) Si voglia ora trovare l’integrale generale dell’equazione y + y = cos t − 2e3t . Dal principio di sovrapposizione si ha y(t) = yom (t) + yp1 (t) − 2yp2 (t) , dove yom `e l’integrale generale dell’equazione omogenea, mentre yp1 e yp2 sono integrali particolari corrispondenti rispettivamente ai termini noti cos t e e3t . L’equazione caratteristica `e λ3 + λ = 0, che ammette le radici λ1 = 0, λ2,3 = ±i. Dunque si ha yom (t) = c1 + c2 cos t + c3 sin t . Cerchiamo yp1 nella forma yp1 (t) = t(a cos t + b sin t), essendo in presenza di risonanza. Calcolando le derivate successive di yp1 e sostituendole nell’equazione yp1 + yp 1 = cos t ,
si ottiene −2a cos t − 2b sin t = cos t, da cui a = −1/2 e b = 0. Dunque yp1 (t) = − 12 cos t.
496
10 Equazioni differenziali ordinarie
Cerchiamo poi yp2 nella forma yp2 (t) = de3t . Derivando e sostituendo nell’equazione yp2 + yp 2 = e3t , 1 3t si trova d = 1/30 e dunque yp2 (t) = 30 e . In definitiva l’integrale generale `e 1 1 y(t) = c1 + c2 − t cos t + c3 sin t − e3t . 2 2 15
10.8 Stabilit` a Una problematica di notevole rilevanza teorica e applicativa riguarda il comportamento delle soluzioni di equazioni differenziali per tempi lunghi. Un’ampia classe di sistemi dinamici, vale a dire di sistemi il cui stato dipende dal tempo ed `e modellizzato da una o pi` u equazioni differenziali, ammette soluzioni definite per ogni tempo t successivo ad un certo tempo iniziale t0 . Il comportamento di una particolare soluzione pu` o essere dei pi` u disparati: ad esempio, dopo un transitorio fortemente dipendente dai dati iniziali, la soluzione pu` o tendere asintoticamente verso una soluzione limite, indipendente dal tempo; oppure, pu` o avere un andamento periodico o quasi-periodico, o pu` o avvicinarsi sempre pi` u ad una tale configurazione; oppure ancora pu` o mostrare un comportamento del tutto imprevedibile o, come si dice, caotico, al crescere del tempo. Forse pi` u che lo studio di una singola soluzione, ha interesse capire quale sia il comportamento reciproco di una famiglia di soluzioni, che differiscono tra loro a causa di una qualche perturbazione dei dati iniziali o della stessa equazione. Infatti, il comportamento per tempi lunghi di una singola soluzione pu` o non essere rappresentativo di quello delle soluzioni che inizialmente le stavano vicino. Inoltre, sovente il modello matematico che d` a luogo all’equazione `e soltanto una approssimazione di una situazione fisica pi` u complessa; ha quindi fondamentale importanza per valutare l’affidabilit` a del modello comprendere quanto siano ‘robuste’, rispetto ad eventuali errori del modello, le informazioni che si possono trarre da esso. In aggiunta, nella maggior parte dei casi, la risoluzione dell’equazione viene effettuata per via numerica, introducendo quindi ulteriori perturbazioni legate alla discretizzazione. Queste e altre ragioni inducono a chiedersi se soluzioni inizialmente vicine rimangano vicine per tutti i tempi, oppure se addirittura convergano verso un’unica configurazione limite, oppure se al contrario divergano l’una dall’altra. Problematiche di questo tipo vanno sotto il generico nome di questioni di stabilit` a (asintotica). Si noti che alla domanda precedente non possiamo dare risposta applicando i risultati di dipendenza continua dai dati stabiliti nel § 10.4.1, (in particolare la Proposizione 10.15). Essi infatti forniscono informazioni solo su intervalli temporali limitati: la costante eL|t−t0 | che compare nella (10.36) cresce ` dunque necessaria un’analisi pi` esponenzialmente quando ci si allontana da t0 . E u mirata. Tratteremo di stabilit`a esclusivamente nel caso di soluzioni stazionarie; lo studio della stabilit` a delle orbite periodiche e di altre orbite pi` u generali, fino ad
10.8 Stabilit` a
497
arrivare ai comportamenti caotici, `e argomento di grandissimo fascino ma esula dagli scopi di questo testo. Consideriamo dunque il problema di Cauchy
y = f (t, y) , t > t0 , y(t0 ) = y0 ,
(10.91)
e supponiamo che un elemento y¯0 , appartenente a D, sia tale che f (t, y¯0 ) = 0 per ogni t ≥ t0 . Dunque, y(t) = y¯0 , ∀t ≥ t0 , `e una soluzione costante dell’equazione, che chiameremo soluzione stazionaria, o di equilibrio. Il punto y¯0 sar`a detto punto critico, o stazionario, o di equilibrio dell’equazione. Supponiamo inoltre che il problema (10.91) ammetta soluzioni definite per tutti i tempi t > t0 , per qualunque ¯ di y¯0 ; indicheremo d’ora in avanti con dato iniziale y0 in un opportuno intorno B y(t, y0 ) una tale soluzione. Ha dunque senso confrontare queste soluzioni con y¯0 sull’intervallo temporale [t0 , +∞). A tale fine, i concetti di stabilit` a (nel senso di Liapunov) e di attrattivit` a sono fondamentali. Definizione 10.43 La soluzione stazionaria y¯0 = y(t, y¯0 ) del problema (10.91) dicesi stabile se per ogni intorno Bε (y¯0 ) di y¯0 esiste un intorno Bδ (y¯0 ) tale che ¯ ∩ Bε (y¯0 ) y0 ∈ B
y(t, y0 ) ∈ Bδ (y¯0 ) ∀t ≥ t0 .
=⇒
La condizione `e illustrata nella Figura 10.9.
y2 δ()
(t, y(t, y0 )) y0
y¯0
(t, y¯0 ) y1
t=0
t
Figura 10.9. Condizione di stabilit` a secondo Liapunov
498
10 Equazioni differenziali ordinarie
Definizione 10.44 La soluzione stazionaria y¯0 dicesi attrattiva se esiste ¯ tale che un intorno B(y¯0 ) ⊆ B y0 ∈ B(y¯0 )
=⇒
lim y(t, y0 ) = y¯0 ,
t→+∞
e dicesi uniformemente attrattiva se il limite precedente `e uniforme in y0 , ossia se lim sup y(t, y0 ) − y¯0 ) = 0 . t→+∞ y ∈B(y ¯0 ) 0
Le propriet` a di stabilit` a e di attrattivit` a sono indipendenti tra loro. Diremo che y¯0 `e uniformemente asintoticamente stabile se `e contemporaneamente stabile e uniformemente attrattiva. Esempio 10.45 La situazione pi` u semplice (ma, come vedremo, gi`a piuttosto significativa) `e quella del problema scalare lineare e autonomo
y = λy , t > 0, λ ∈ R, y(t0 ) = y0 , che ammette y¯0 = 0 come unica soluzione stazionaria. La soluzioni sono date da y(t, y0 ) = eλt y0 , e dunque 0 `e stabile se e solo se λ ≤ 0 (in tal caso nella condizione di stabilit` a si potr` a scegliere δ = ε). Inoltre, se λ = 0, il punto 0 non `e attrattivo (tutte le soluzioni sono banalmente costanti), mentre se λ < 0, il punto 0 `e uniformenente attrattivo (e dunque uniformemente asintoticamente stabile): posto ad esempio B(0) = B1 (0) = (−1, 1), si ha infatti sup |y(t, y0 )| = eλt → 0
y0 ∈B(0)
per t → +∞ .
Notiamo che se scegliamo λ ∈ C (e dunque le soluzioni sono a valori complessi), valgono risultati analoghi ai precedenti per quanto riguarda la stabilit` a, sostituendo nella discussione λ con Re λ. 2 L’esempio precedente ha come generalizzazione diretta quella di un sistema lineare autonomo, che ora consideriamo. 10.8.1 Sistemi lineari autonomi Supponiamo che f (t, y) = f (y) = Ay + b con A ∈ Rn,n e b ∈ Rn indipendenti dal tempo. Le soluzioni stazionarie del problema (10.91) corrispondono alle soluzioni del sistema lineare Ay = −b (dunque ne esiste una e una sola se A `e non singolare). Detta y¯0 una tale soluzione, il cambiamento di variabile dipendente z = y − y¯0 ci conduce a studiare la stabilit` a della soluzione nulla dell’equazione omogenea z = Az. Pertanto, non `e restrittivo considerare d’ora in avanti il problema della
10.8 Stabilit` a
stabilit` a della soluzione y(t, 0) = 0 del problema omogeneo
y = Ay , t > 0, y(t0 ) = y0 .
499
(10.92)
Ricordiamo dal § 10.6, ed in particolare dalla Proposizione 10.35, che ogni soluzione y(t, y0 ) `e una combinazione lineare di funzioni della forma w(t) = eλt p(t) , dove λ ∈ C `e uno degli autovalori di A, mentre p(t) `e un polinomio in t a valori vettoriali, dipendente dall’autovettore (o da uno degli autovettori) associato a λ. Se λ ha molteplicit` a algebrica e geometrica coincidenti, ogni p(t) associato ad esso `e di grado 0 e dunque costante, altrimenti esistono polinomi di grado > 0, che quindi tendono a ∞ per t → +∞. Ne segue che: • se tutti gli autovalori di A hanno parte reale negativa, tutte le funzioni di base w(t) tendono a 0 per t → +∞ (si ricordi che eσt tβ → 0 per t → +∞ se σ = Re λ < 0, qualunque sia β); • se tutti gli autovalori di A hanno parte reale negativa o nulla, e quelli con parte reale nulla hanno molteplicit` a algebrica e geometrica coincidenti, tutte le w(t) sono limitate su [0, +∞); • se esistono autovalori di A con parte reale positiva, o con parte reale nulla ma con molteplicit` a algebrica maggiore di quella geometrica, alcune w(t) tendono a ∞ per t → +∞. Traduciamo ora questi risultati nel linguaggio della stabilit` a. Proposizione 10.46 a) L’origine y(t, 0) = 0 `e soluzione stabile del problema (10.92) se e solo se tutti gli autovalori λ di A soddisfano Re λ ≤ 0, e quelli con Re λ = 0 hanno molteplicit` a algebrica e geometrica coincidenti. b) L’origine `e soluzione uniformemente attrattiva (e dunque uniformemente asintoticamente stabile) se e solo se tutti gli autovalori di A soddisfano Re λ < 0. Esaminiamo ora in dettaglio i vari comportamenti possibili nel caso di sistemi piani, ossia in dimensione n = 2. 10.8.2 Sistemi piani
Sia A=
a c
b d
la generica matrice di ordine 2, che ha determinante detA = ad − bc e traccia trA = a + d. I suoi autovalori sono le radici del polinomio caratteristico χ(λ) = λ2 − trA λ + detA, e dunque
500
10 Equazioni differenziali ordinarie
λ=
trA ±
(trA)2 − 4 detA . 2
Ne segue che gli autovalori sono distinti se (trA)2 = 4 detA; in tal caso essi sono necessariamente semplici e dunque la matrice `e diagonalizzabile. Se invece (trA)2 = 4 detA, l’autovalore doppio λ = trA/2 ha molteplicit` a geometrica 2 se e solo se b = c = 0, ossia se A `e diagonale; altrimenti, A non `e diagonalizzabile. Supponiamo dapprima che A sia diagonalizzabile. In tal caso, sappiamo dalla Proposizione 10.32 che ogni soluzione del problema (10.92) si scrive come y(t, y0 ) = z1 (t)v1 + z2 (t)v2 ,
(10.93)
dove v1 e v2 sono due vettori linearmente indipendenti (precisamente, essi sono i due autovettori nel caso di autovalori reali, e due vettori costruiti a partire dalle parti reale e immaginaria di un autovettore complesso nel caso di autovalori complessi coniugati), mentre z1 (t) e z2 (t) sono funzioni reali di variabile reale, che in particolare soddisfano z1 (0)v1 + z2 (0)v2 = y0 . Per comprendere i vari comportamenti asintotici delle soluzioni, `e utile rappresentare le loro orbite Γ (y) = {y(t, y0 ) = (y1 (t), y2 (t)) : t ≥ 0} nel piano delle fasi R2 avente y1 e y2 come coordinate. Come vedremo ora, `e ` possibile eliminare t e ricavare una relazione funzionale esplicita tra y1 e y2 . E anzi preferibile effettuare dapprima tale operazione sulle variabili z1 e z2 , ossia rappresentare l’orbita Γ (z) = {(z1 (t), z2 (t)) : t ≥ 0} nel piano delle fasi R2 avente z1 e z2 come coordinate, e poi passare al piano y1 y2 mediante la trasformazione lineare definita dalla (10.93). Distinguiamo vari casi. i) Due autovalori reali non nulli: λ2 ≤ λ1 < 0 oppure 0 < λ1 ≤ λ2 . In tal caso si ha z1 (t) = d1 eλ1 t , z2 (t) = d2 eλ2 t , con d1 , d2 dipendenti da y0 . Se d1 = 0 oppure d2 = 0, le orbite giacciono sugli assi coordinati z1 = 0 oppure z2 = 0. Altrimenti si ha
z2 (t) = d2 e
λ1 t
λλ2 1
= d2
z1 (t) d1
λλ2 1
,
ossia le orbite sono i grafici delle funzioni z2 = dz1α ,
con α ≥ 1
(si noti che esse sono semirette se λ1 = λ2 .) Le orbite sono percorse verso l’origine, che dunque `e un punto uniformemente asintoticamente stabile, se gli autovalori sono negativi (si veda la Figura 10.10, a sinistra), sono percorse nel verso opposto
10.8 Stabilit` a z2
501
y2
z1
y1
Figura 10.10. Orbite del sistema y = Ay nel piano z1 z2 (a sinistra) e nel piano y1 y2 (a destra): caso λ2 < λ1 < 0 (nodo)
se gli autovalori sono positivi. Nel piano y1 y2 le corrispondenti orbite sono rappresentate nella Figura 10.10, a destra, ove si `e supposto per fissare le idee che v1 = (3, 1) e v2 = (−1, 1). L’origine viene detta nodo (o stella, se λ1 = λ2 ), rispettivamente stabile o instabile a seconda del segno degli autovalori. ii) Due autovalori reali, di cui almeno uno nullo: λ2 ≤ λ1 = 0 o 0 = λ1 ≤ λ2 . In tal caso z1 (t) = d1 `e costante. Dunque se λ2 = 0, le orbite sono delle semirette verticali, percorse verso l’asse z2 = 0 se λ2 < 0, nel verso opposto se λ2 > 0 (si veda la Figura 10.11). Se invece λ2 = 0, allora la matrice A `e nulla (avendola supposta diagonalizzabile), e dunque tutte le orbite sono costanti. In ogni caso, z2
y2
z1
y1
Figura 10.11. Orbite del sistema y = Ay nel piano z1 z2 (a sinistra) e nel piano y1 y2 (a destra): caso λ2 < λ1 = 0
502
10 Equazioni differenziali ordinarie z2
y2
z1
y1
Figura 10.12. Orbite del sistema y = Ay nel piano z1 z2 (a sinistra) e nel piano y1 y2 (a destra): caso λ2 < 0 < λ1 (sella)
l’origine `e punto di equilibrio stabile, ma non attrattivo. iii) Due autovalori reali, di segno opposto: λ2 < 0 < λ1 . In tal caso, le orbite nel piano z1 z2 sono sia i semi-assi coordinati, sia le curve di equazione z2 = dz1α , con α < 0 (esse sono delle iperbole se α = −1). Le orbite sono percorse come indicato nella la Figura 10.12). L’origine, detta sella o colle, non `e n´e stabile n´e attrattiva. iv) Due autovalori immaginari puri: λ = ±iω , ω = 0. In tal caso si ha z1 (t) = d1 cos(ωt + d2 )
e
z2 (t) = d1 sin(ωt + d2 ) ,
dunque le orbite sono cerchi concentrici nel piano z1 z2 ed ellissi concentriche nel piano y1 y2 (si veda la Figura 10.13). L’origine, detta centro, `e stabile ma non attrattiva. v) Due autovalori complessi coniugati, con parte reale non nulla: λ = σ ± iω, con ω = 0 e σ < 0 oppure σ > 0. In tal caso si ha z1 (t) = d1 eσt cos(ωt + d2 )
e
z2 (t) = d1 eσt sin(ωt + d2 ) ,
dunque le orbite sono spirali che si avvolgono attorno all’origine, percorse verso l’origine se σ < 0, nel verso opposto se σ > 0 (si veda la Figura 10.14). Nel primo caso l’origine `e uniformemente asintoticamente stabile. L’origine viene detta fuoco, rispettivamente stabile o instabile a seconda del segno di σ.
10.8 Stabilit` a z2
503
y2
z1
y1
Figura 10.13. Orbite del sistema y = Ay nel piano z1 z2 (a sinistra) e nel piano y1 y2 (a destra): caso λ = ±ω (centro)
Consideriamo infine il caso di matrice A non diagonalizzabile: ci` o accade quando essa ammette un autovalore reale doppio ma con molteplicit` a geometrica uguale a 1. In questo caso, nella (10.93) v1 `e l’unico autovettore, mentre v2 `e l’autovettore generalizzato associato, definito come nella (10.71). vi) Un autovalore reale doppio λ, di molteplicit` a geometrica 1. In tal caso si ha z1 (t) = d1 eλ1 t ,
z2 (t) = eλ2 t (d2 + d1 t) .
Se λ = 0 e se d1 = 0, le orbite sono rette verticali percorse come indicato in Figura 10.15; se d1 = 0, le orbite sono punti fissi sull’asse z1 = 0. Pertanto, l’origine non `e n´e stabile n´e attrattiva. z2
y2
z1
y1
Figura 10.14. Orbite del sistema y = Ay nel piano z1 z2 (a sinistra) e nel piano y1 y2 (a destra): caso λ = σ ± ω (fuoco)
504
10 Equazioni differenziali ordinarie z2
y2
z1
y1
Figura 10.15. Orbite del sistema y = Ay nel piano z1 z2 (a sinistra) e nel piano y1 y2 (a destra): caso λ1 = λ2 = 0, bc = 0
Se invece λ = 0, si ricava t in funzione di z1 come t = ottiene
z1 d1 1 log z1 . z2 = + d2 |λ| d1
1 |λ|
log dz11 , e dunque si
Le corrispondenti orbite sono mostrate in Figura 10.16, e sono percorse verso l’origine, che quindi `e punto uniformemente asintoticamente stabile, se λ < 0, nel verso opposto se λ > 0. L’origine viene ancora detta nodo, rispettivamente stabile o instabile a seconda del segno dell’autovalore. y2
z2
z1
y1
Figura 10.16. Orbite del sistema y = Ay nel piano z1 z2 (a sinistra) e nel piano y1 y2 (a destra): caso λ1 = λ2 =
0, bc = 0 (nodo)
10.8 Stabilit` a
505
Applicazione: il pendolo semplice (IV). Riprendiamo la discussione da pag. 470. Il sistema dinamico y = f (y) possiede infiniti punti di equilibrio y¯0 . Infatti, f (y¯0 ) = 0
se e solo se
y¯2 = 0 e y¯1 = π con ∈ Z .
Le soluzioni θ(t) = π con pari corrispondono all’asta del pendolo posta in posizione verticale, con l’estremit` a P situata nel punto inferiore S (si veda ancora ` la Figura 10.3); quelle con dispari corrispondono alla posizione superiore I. E evidente dal punto di vista fisico che spostando di poco il punto P dalla posizione S, esso tender`a a ritornarvi; al contrario, uno spostamento per quanto piccolo di P dalla posizione I lo allontaner` a sempre pi` u da tale punto negli istanti successivi. Questa `e una manifestazione di stabilit` a della posizione S e di instabilit` a della posizione I. Per rendere rigoroso il ragionamento, e applicare i risultati di stabilit` a ottenuti nel § 10.8.2, consideriamo dapprima un modello semplificato di pendolo, ottenuto linearizzando l’equazione (10.12) attorno a una posizione di equilibrio. Nell’intorno del punto θ¯ = 0, si ha sin θ ∼ θ, e dunque in luogo della (10.12) possiamo considerare l’equazione d2 θ dθ + kθ = 0 , +α 2 dt dt
(10.94)
che descrive le piccole oscillazioni del pendolo attorno alla posizione di equilibrio S; per α = 0, si ha l’equazione del moto armonico. La corrispondente soluzione del problema di Cauchy (10.13) pu` o essere facilmente calcolata facendo riferimento all’Esempio 10.4. Equivalentemente, il problema di Cauchy si scrive nella forma (10.92), con
0 1 = Jf (0, 0) , A= −k −α √ −α ± α2 − 4k i cui autovalori sono dati da λ = . Pertanto, grazie ai risultati del 2 § 10.8.2, abbiamo che: • se α2 ≥ 4k, l’origine y¯0 = (0, 0) `e nodo uniformemente asintoticamente stabile [casi i) oppure vi)] ; • se 0 < α2 < 4k, l’origine `e un fuoco uniformemente asintoticamente stabile [caso v)] ; • se α = 0, l’origine `e un centro [caso iv)] . In ogni caso, la posizione inferiore S del pendolo `e stabile. Linearizzando invece l’equazione (10.12) attorno al punto di equilibrio θ¯ = π, ci riconduciamo, dopo aver effettuato il cambiamento di variabile ϕ = θ − π che fornisce sin θ = − sin ϕ, ad un problema della forma (10.92) con
0 1 = Jf (π, 0) . A= k −α
506
10 Equazioni differenziali ordinarie
−α ±
√
α2 + 4k , quindi sempre non nulli e di segno 2 discorde. Il punto y¯0 = (π, 0) `e pertanto un colle [caso iii)] e dunque instabile. Ci` o conferma che la posizione superiore I del pendolo `e di equilibrio instabile. La discussione si conclude a pag. 507. 2
I suoi autovalori sono λ =
10.8.3 Cenno alla stabilit` a non lineare Alcuni dei risultati di stabilit` a per sistemi lineari vengono ereditati dai sistemi non lineari che possono essere considerati come una loro perturbazione. Precisamente, supponiamo che la funzione f (t, y) che compare nella (10.91) sia della forma f (t, y) = Ay + g(t, y) ,
(10.95)
con g continua e soddisfacente g(t, y) = o(y) per y → 0 , uniformemente in t ;
(10.96)
ci`o significa che esiste una funzione continua φ : R+ → R+ e tale che φ(s) → 0 per s → 0+ , per cui si abbia, in un intorno B(0) dell’origine, g(t, y) ≤ φ(y)y ,
∀y ∈ B(0) , ∀t > t0 .
Nelle ipotesi fatte, l’origine `e punto di equilibrio dell’equazione (10.91). Sulla sua stabilit` a asintotica, possiamo dire quanto segue. Teorema 10.47 Sia f data da (10.95), con g soddisfacente (10.96). a) Se tutti gli autovalori di A hanno parte reale strettamente negativa, allora l’origine `e punto di equilibrio uniformemente asintoticamente stabile per il problema (10.91). b) Se esiste un autovalore di A con parte reale strettamente positiva, allora l’origine `e instabile. Dunque nelle condizioni considerate le propriet` a di stabilit` a dell’origine per il sistema non lineare y = Ay + g(t, y) sono le stesse del sistema lineare associato y = Ay; si noti che quest’ultimo non `e altro che la linearizzazione attorno all’origine del primo sistema (si veda l’Osservazione 10.25). Nulla invece pu` o dirsi se gli autovalori di A hanno tutti parte reale non positiva e qualche autovalore `e immaginario puro: la stabilit` a dipende allora da propriet` a ulteriori di g. Una importante conseguenza del teorema riguarda i sistemi autonomi, in corrispondenza di un punto di equilibrio y¯0 . Si ha il seguente risultato, noto come Principio della stabilit` a linearizzata.
10.8 Stabilit` a
507
Corollario 10.48 Sia f : D ⊆ Rn → Rn di classe C 1 e sia y¯0 ∈ D tale che f (y¯0 ) = 0. Sia inoltre A = J f (y¯0 ) la matrice jacobiana di f in y¯0 . Per il sistema differenziale autonomo y = f (y), valgono i seguenti risultati di stabilit` a. a) Se tutti gli autovalori di A hanno parte reale strettamente negativa, allora y¯0 `e punto di equilibrio uniformemente asintoticamente stabile per il problema (10.91). b) Se esiste un autovalore di A con parte reale strettamente positiva, allora il punto y¯0 `e instabile. Dim.
Mediante lo sviluppo di Taylor (5.15) di f in y¯0 , abbiamo f (y) = f (y¯0 ) + J f (y¯0 )(y − y¯0 ) + g(y) = A(y − y¯0 ) + g(y) , con g(y) = o(y − y¯0 ) per y → y¯0 . Effettuando il cambiamento di variabile z = y − y¯0 , ci riconduciamo alla situazione considerata nel teorema precedente. 2
I risultati ora esposti sono di tipo locale. Informazioni di natura pi` u globale sulla stabilit` a di un punto stazionario possono essere ottenute, per sistemi autonomi, dalla conoscenza di un integrale primo (§ 10.4.5), oppure di una funzione di Liapunov (Esempio 10.22 ii)). Nel caso di un sistema conservativo corrispondente a una equazione del tipo (10.42), oppure (10.46), e che quindi ammette come integrale primo l’energia totale E, possiamo dire, grazie a un teorema dovuto a Lagrange, che se l’origine `e punto di minimo stretto per l’energia potenziale Π, allora essa `e punto di equilibrio stabile per il sistema. Alla stessa conclusione possiamo arrivare se l’origine `e punto stazionario di un sistema che ammette una corrispondente funzione di Liapunov V . Se inoltre la derivata di V lungo ogni traiettoria `e strettamente negativa al di fuori dell’origine, allora l’origine `e attrattiva. Applicazione: il pendolo semplice (V). I risultati ottenuti nel paragrafo precedente sull’equazione linearizzata (10.94) ci danno informazioni sulla stabilit` a dei punti stazionari per l’equazione non lineare (10.12), nel caso in cui sia presente l’attrito. Infatti, possiamo applicare il Principio della stabilit` a linearizzata (Corollario 10.48) e, se α > 0, la matrice J f (y¯0 ) = A ha due autovalori con parte reale strettamente negativa per y¯0 = (0, 0) e un autovalore con parte reale strettamente positiva per y¯0 = (π, 0). Concludiamo che, come per il problema linearizzato, la posizione di equilibrio inferiore S `e uniformemente asintoticamente stabile, mentre quella superiore I `e instabile. Una porzione delle corrispondenti orbite `e mostrata in Figura 10.17. Si noti che, moltiplicando l’equazione (10.12) per dθ dt otteniamo d E(θ, θ ) = −α dt
dθ dt
2 ≤ 0,
508
10 Equazioni differenziali ordinarie y2
y1 −π
π
Figura 10.17. Orbite relative al moto di un pendolo con attrito (nella striscia |y1 | ≤ π). La regione scura `e il bacino di attrazione dell’origine. I punti immediatamente al di sopra (rispettivamente, al di sotto) di tale regione, fino alla successiva orbita rappresentata, sono attratti dal punto stazionario (2π, 0) (rispettivamente, (−2π, 0)), e cos`ı via
ossia l’energia totale `e una funzione di Liapunov dell’equazione, e dunque decresce sulle orbite (si confronti con la Figura 10.8). Nel caso senza attrito, il comportamento dei punti di equilibrio per il problema non lineare `e ancora lo stesso di quello per il problema lineare, ma tale risultato viene stabilito con altri metodi. In particolare, la stabilit` a dell’origine segue dal fatto che essa `e punto di minimo stretto dell’energia potenziale, grazie al Teorema di Lagrange. 2
10.9 Esercizi 1. Si determini l’integrale generale delle seguenti equazioni differenziali a variabili separabili: a) y =
(t + 2)y t(t + 1)
b) y =
1 y2 − t log t t log t
2. Si determini l’integrale generale delle seguenti equazioni differenziali omogenee: a) 4t2 y = y 2 + 6ty − 3t2
b) t2 y − y 2 et/y = ty
3. Si determini l’integrale generale delle seguenti equazioni differenziali lineari: a) y =
3t + 2 1 y− t t3
b) ty = y +
2t2 1 + t2
10.9 Esercizi
509
4. Si determini l’integrale generale delle seguenti equazioni differenziali di Bernoulli: t 1 1 a) y = y − y 2 b) y = y + log t t t y 5. Determinare l’integrale particolare dell’equazione differenziale y =
1 − e−y 2t + 1
soddisfacente la condizione y(0) = 1. 6. Stabilire se esistono soluzioni dell’equazione differenziale y = −2y + e−2t che hanno derivata nulla nell’origine. √ 7. Risolvere, sulla semiretta [ 4 e, +∞), il problema di Cauchy ! y e y = 4t3 log t(1 + ey ) √ y( 4 e) = 0. 8. Si risolva, nell’intervallo (−2, 2), il seguente problema di Cauchy ⎧ ⎨ y = 3t |y| t2 − 4 ⎩ y(0) = −1. 9. Data l’equazione differenziale y sin 2t − 2(y + cos t) = 0,
π , t ∈ 0, 2
determinarne l’integrale generale e indicare la soluzione che si mantiene limitata per t → π2 − . 10. Risolvere il problema di Cauchy ⎧ ⎨ d (y 2 ) = y 2 + t dt y ⎩ y(0) = 1 .
510
10 Equazioni differenziali ordinarie
11. Risolvere il problema di Cauchy ⎧ y 8t3 ⎪ ⎨ 3/2 = (t4 + 1)2 1 + (y ) ⎪ ⎩ y(1) = 0 , y (1) = 0 . 12. Risolvere il problema di Cauchy ⎧ ⎨ y = 4 y3 ⎩ y(0) = 2 ,
√ y (0) = − 3 .
13. Determinare l’integrale particolare dell’equazione differenziale yy − (y )2 = y 2 log y che soddisfa le condizioni y(0) = y (0) = 1. 14. Trovare, al variare di α ∈ R, la soluzione dell’equazione differenziale y = (2 + α)y − 2eαt per cui y(0) = 3. 15. Siano a, b numeri reali arbitrari. Risolvere il problema di Cauchy !
y y = a + 3tb t y(2) = 1
sulla semiretta [2, +∞). 16. Data l’equazione differenziale, dipendente dal parametro reale k, y (t) = −3ty(t) + kt , se ne trovi la soluzione che si annulla nell’origine. 17. Data l’equazione differenziale y =
y 2 − 2y − 3 , 2(1 + 4t)
a) determinarne l’integrale generale; b) determinarne l’integrale particolare y0 (t) che soddisfa y0 (0) = 1;
10.9 Esercizi
511
√ 18. Considerata l’equazione y = f (t, y) = t + y, determinare gli aperti Ω = I × D = (α, β) × (γ, δ) nel dominio di f , per i quali sono verificate le ipotesi del Teorema di Cauchy. 19. Determinare l’intervallo massimale di esistenza delle soluzioni dell’equazione autonoma y = f (y) con: a) f (y) = b) f (y) =
# 1 + y12 + y22 i + arctan(y1 + y2 ) j sin y2 y log (2 + y2 ) 3
in R2
in Rn
20. Verificare che le equazioni differenziali autonome y = f (y), con y2 y1 a) f (y) = i− j 2 4 1 + 3y1 + 5y2 1 + 3y12 + 5y24 b) f (y) = (4y12 y23 + 2y1 y2 )i − (2y1 y24 + y22 )j ammettono in R2 un integrale primo, e calcolarlo. 21. Determinare l’integrale generale del sistema omogeneo y = Ay per le seguenti matrici:
3 −4 9 −4 b) A = a) A = 4 3 8 −3 ⎞ ⎞ ⎛ ⎛ 13 0 −4 4 3 −2 c) A = ⎝ 15 2 −5 ⎠ d) A = ⎝ 3 2 −6 ⎠ 30 0 −9 1 3 1 ⎞ ⎛ ⎞ ⎛ 0 1 0 4 0 0 0 1 ⎠ e) A = ⎝ 0 f) A = ⎝ 0 −2 9 ⎠ 0 −10 −6 0 4 −2 ⎞ ⎞ ⎛ ⎛ 1 5 0 3 0 0 h) A = ⎝ 0 1 0 ⎠ g) A = ⎝ 0 3 0 ⎠ 4 0 1 1 0 3 22. Determinare un integrale particolare dei seguenti sistemi: ⎞ ⎛ ⎞ ⎛ 0 0 −1 0 a) y = ⎝ 1 0 0 ⎠ y + ⎝ t ⎠ t2 1 0 2 ⎞ ⎛ ⎞ ⎛ 1 −1 −1 0 b) y = ⎝ 1/8 0 −1 ⎠ y + ⎝ 1 ⎠ e−2t 0 0 1/8 −1
512
10 Equazioni differenziali ordinarie
⎛
0 −1 c) y = ⎝ 1 0 0 1
⎞ ⎛ ⎞ 1 0 0 ⎠ y + ⎝ 0 ⎠ sin 2t 0 −1
23. Trovare la soluzione del sistema ⎧ ⎨ y1 = 2y1 + y3 y = y3 ⎩ 2 y3 = 8y1 soddisfacente y1 (0) = y2 (0) = 1 e y3 (0) = 0. 24. Trovare la soluzione del sistema
y1 + y2 = 5y2 3y1 − 2y2 = 5y1
soddisfacente y1 (0) = 2 e y2 (0) = −1. 25. Determinare, al variare del parametro reale b, le soluzioni del sistema
−1 b y = y b −1 soddisfacenti la condizione y(0) = (1, 1)T . 26. Determinare, al variare del parametro reale a, l’integrale generale del sistema ⎞ ⎛ 1+a 0 1 y = ⎝ a − 2 3a − 1 1 − a ⎠ y . 0 0 a 27. Trovare l’integrale generale del sistema
x = 2x − y y = −10x + 5y − 2y . 28. Si determini l’integrale generale delle seguenti equazioni differenziali lineari del secondo ordine: a) y + 3y + 2y = t2 + 1
b) y − 4y + 4y = e2t
c) y + y = 3 cos t
d) y − 3y + 2y = et
e) y − 9y = e−3t
f) y − 2y − 3y = sin t
10.9 Esercizi
513
29. Risolvere i seguenti problemi di Cauchy: ⎧ ⎧ ⎪ ⎪ ⎨ y + 2y + 5y = 0 ⎨ y − 5y + 4y = 2t + 1 a) y(0) = 0 y(0) = 78 b) ⎪ ⎪ ⎩ ⎩ y (0) = 2 y (0) = 0 30. Si determini l’integrale generale delle seguenti equazioni differenziali lineari di ordine n: a) y + y − 2y = 0 c)
b) y − 2y + y = 0
y (4) − 5y + 7y − 5y + 6y = sin t
31. Determinare l’integrale generale dell’equazione differenziale y + y − 6y = ekt al variare del parametro reale k. 32. Determinare l’integrale generale dell’equazione differenziale y −2y +(1+k)y = 0 al variare del parametro reale k. 33. Determinare l’integrale generale dell’equazione differenziale y − 2y + 49y − 98y = 48 sin t + (β 2 + 49)eβt al variare del parametro reale β in R. 34. Determinare l’integrale generale dell’equazione differenziale y + 9ay = cos 3t al variare del parametro reale a. 35. Studiare la stabilit` a dell’origine per l’equazione in R3 ⎞ ⎛ −3 0 −5 y = Ay con A = ⎝ 0 −1 0 ⎠ . 5 0 −2 36. Studiare la stabilit` a del punto stazionario y0 = (−3, 1) per l’equazione in R2 y = f (y)
con f (y) = (3y1 y2 − 2y22 + 11)i + (y1 + 3y2 )j .
10.9.1 Soluzioni 1. Equazioni differenziali a variabili separabili: a) La funzione h(y) = y ha uno zero per y = 0 che quindi `e un integrale singolare
514
10 Equazioni differenziali ordinarie
dell’equazione. Supponiamo ora y = 0 e separiamo le variabili, ottenendo t+2 ct2 1 dy = dt = log , c > 0. y t(t + 1) |t + 1| Allora, passando agli esponenziali, y = y(t) = c
t2 , t+1
c = 0 .
Osserviamo che l’integrale singolare y = 0 rientra in questa formula per c = 0. 1 + c log2 t c) y = y(t) = , c ∈ R. 1 − c log2 t 2. Equazioni differenziali omogenee: a) Supponendo t = 0 e dividendo per 4t2 , si ottiene y =
3 1 y2 3y − . + 2 4t 2t 4
Con la sostituzione z = yt , si ha y = z + tz da cui z + tz = ovvero
3 1 2 3 z + z− , 4 2 4
4tz = (z − 1)(z + 3) .
Osserviamo che ϕ(z) = (z − 1)(z + 3) si annulla per z = 1 e z = −3, ossia le funzioni y = t e y = −3t sono integrali singolari dell’equazione data. Per ricavare l’integrale generale, separiamo le variabili, ottenendo 1 4 dz = dt . (z − 1)(z + 3) t Allora risulta
z − 1 = log c|t| , log z + 3
c > 0,
e, passando agli esponenziali ed esplicitando rispetto a z, si ha z=
1 + 3ct , 1 − ct
c ∈ R,
avendo inglobato nella formula anche l’integrale singolare z = 1. In definitiva, tornando alla funzione y, l’integrale generale dell’equazione `e y=
t + 3ct2 , 1 − ct
c ∈ R.
10.9 Esercizi
b) y = y(t) = −
t , log log c|t|
515
c > 0.
3. Equazioni differenziali lineari: a) Applichiamo la formula (10.24) con a(t) = 1t e b(t) = − 3t+2 t3 , ottenendo
R 1 R 1 2 3t + 2 3 + 2 + ct , dt = c ∈ R. y = e t dt e− t dt − 3 t 2t 3t b) y = 2t arctan t + ct ,
c ∈ R.
4. Equazioni differenziali di Bernoulli: a) Con le notazioni del § 10.3.4, si ha p(t) = −1 ,
q(t) =
1 , t
α = 2.
Poich´e α = 2 > 0, la funzione y(t) = 0 `e una soluzione. Dividiamo ora per y 2 , ottenendo 1 1 − 1. y = 2 y ty Poniamo z = z(t) = y 1−2 = y1 ; allora z = − y12 y e l’equazione si trasforma in z = 1 − 1t z. Risolvendo l’equazione lineare in z, si ottiene z = z(t) =
t2 + c , 2t
c ∈ R.
In definitiva, y = y(t) =
1 2t = 2 , z(t) t +c
c∈R
a cui va aggiunta la funzione y(t) = 0. b) Risulta p(t) = t log t ,
q(t) =
1 , t
α = −1 .
Poniamo z = y 2 , allora z = 2yy e l’equazione si trasforma in z =
2 z + 2t log t . t
Pertanto, integrando l’equazione lineare in z cos`ı ottenuta, si ha z = z(t) = t2 (log2 t + c) , In definitiva,
c ∈ R.
# y = y(t) = ±t
log2 t + c ,
c ∈ R.
516
10 Equazioni differenziali ordinarie
5. Si tratta di un’equazione differenziale a variabili separabili. La soluzione costante y = 0 non `e accettabile in quanto non soddisfa la condizione iniziale y(0) = 1. Separando le variabili, otteniamo 1 1 dx ; dy = −y 1−e 2t + 1 integrando, si ha log |1 − ey | =
1 log |2t + 1| + c , 2
c ∈ R.
Infine, esplicitando rispetto a y e inglobando la soluzione costante y = 0 corrispondente a c = 0, si ottiene l’integrale generale dell’equazione: y = log 1 − c |2t + 1| , c ∈ R. Imponiamo ora la condizione iniziale y(0) = 1: si ha c = 1 − e, quindi la soluzione cercata sar`a y = log 1 + (e − 1) |2t + 1| . 6. L’integrale generale dell’equazione differenziale lineare risulta R R c ∈ R. y = e− 2 dt e 2 dt e−2t dt = e−2t (t + c) , La condizione richiesta si esprime come y (0) = 0. Ponendo x = 0 nell’equazione differenziale y (t) = −2y(t) + e−2t , tale condizione equivale a y(0) = 12 da cui si ottiene c = 12 . Pertanto la soluzione cercata `e
1 −2t . t+ y=e 2 4 1 7. y = log 2et (log t− 4 ) − 1 .
8. y = −
8 . (4 − t2 )3/2
9. y =
sin t − 1 . cos t
10. L’equazione risulta essere 2yy = y 2 +
t y
y =
ossia
t 1 y+ 2. 2 2y
Si riconosce un’equazione di Bernoulli con p(t) =
t , 2
q(t) =
1 , 2
α = −2 .
Posto z = z(t) = y 3 , si ottiene z = 3y 2 y e z = 32 z + 32 t. Risolvendo in z, si ha z = z(t) = ce(3/2)t − t −
2 . 3
10.9 Esercizi
Pertanto,
y = y(t) =
3
ce(3/2)t − t −
517
2 . 3
Imponendo la condizione y(0) = 1, si ricava c = 5/3. In definitiva, la soluzione cercata `e 2 3 5 (3/2)t y = y(t) = e −t− . 3 3 2 1 3 1 t + − . 6 2t 3 12. Si tratta di un’equazione del secondo ordine riconducibile al primo ponendo 1 4 y = z(y) e osservando che z = . Allora la funzione z = z(y) soddisfa z 2 = z y3 − y42 + c1 . Usando le condizioni iniziali e la relazione y = z(y) si deve avere 11. y = y(t) =
√ (− 3)2 = −1 + c1 Allora
cio`e c1 = 4 .
2 2 y −1 y √ (la scelta del segno meno `e dovuto alla condizione y (0) = − 3). Siamo giunti ad un’equazione a variabili separabili nella funzione y della forma z2 =
4 2 (y − 1) e dunque y2
y = − Risolvendo tale equazione, si ha
z=−
2 2 y − 1. y
y 2 − 1 = −2t + c2 .
√ Imponiamo la condizione y(0) = 2, per ottenere c2 = 3. In definitiva, # √ y = y(t) = 1 + ( 3 − 2t)2 . 13. y = y(t) = esinh t . 14. L’equazione da risolvere `e un’equazione differenziale lineare e si ottiene immediatamente l’integrale generale R R (2+α) dt y=e e− (2+α) dt (−2eαt ) dt = eαt (1 + c e2t ) , c ∈ R. Imponendo la condizione y(0) = 3, si ha 3 = 1+c, ossia c = 2. La soluzione cercata `e quindi y = eαt (1 + 2e2t ).
518
10 Equazioni differenziali ordinarie
15. Direttamente dalla formula risolutiva per le equazioni differenziali lineari, si ha
R R a 1t dt −a 1t dt b a b−a y=e 3 e t dt = t 3 t dt
⎧ 3 ⎨ ta se b − a = −1, tb−a+1 + c b−a+1 = ⎩ a t (3 log t + c) se b − a = −1 , ⎧ 3 ⎨ tb+1 + c ta se b − a = −1, = b−a+1 ⎩ a se b − a = −1. 3t log t + cta Imponendo la condizione iniziale y(2) = 1, nei due casi, risulta ⎧ 3 ⎨ 2b+1 + c 2a = 1 se b − a = −1, b−a+1 ⎩ se b − a = −1 , 3 · 2a log 2 + c 2a = 1 da cui
⎧ ⎨ c = 2−a 1 − ⎩
3 2b+1 b−a+1
se b − a = −1,
c = 2−a − 3 log 2
se b − a = −1.
Pertanto la soluzione cercata sar`a ⎧
3 3 ⎪ b+1 −a b+1 ⎨ t 2 1− ta +2 b−a+1 y = b−a+1 ⎪ ⎩ a 3t log t + 2−a − 3 log 2 ta
se b − a = −1, se b − a = −1.
16. Si tratta di un’equazione differenziale lineare e si ottiene facilmente l’integrale generale R R 3 2 k −3 t dt e3 t dt kt dt = + c e− 2 t , c ∈ R. y=e 3 Imponendo la condizione y(0) = 0, si ha 0 = k3 + c da cui c = − k3 . La soluzione cercata `e quindi 3 2 k y= 1 − e− 2 t . 3 2
−2y−3 17. Risoluzione dell’equazione differenziale y = y2(1+4t) : 3 + c |1 + 4t| con c ∈ R e la soluzione costante y(t) = −1. a) y(t) = 1 − c |1 + 4t| 3 − |1 + 4t| ; b) y0 (t) = 1 + |1 + 4t|
10.9 Esercizi
519
18. Si ha dom f = {(t, y) ∈ R2 : t + y ≥ 0}. Poich´e
1 1 √ , √ , ∇f = 2 t+y 2 t+y f sar`a lipschitziana rispetto a y in ogni Ω in cui la quantit` a Abbiamo 1 1 √ = √ sup 2 t + y 2 α +γ t∈(α,β), y∈(γ,δ)
√1 2 t+y
sia limitata.
e dunque la condizione `e verificata per ogni α e γ reali tali che α + γ > 0. Gli estremi sinistri β e δ sono arbitrari, e possono anche coincidere con +∞. 19. Intervallo massimale di esistenza di una soluzione: a) Si ha ∂f1 yj = , ∂yj 1 + y12 + y22
∂f2 1 = , ∂yj 1 + (y1 + y2 )2
1 ≤ j ≤ 2,
∂fi ≤ 1 in tutto R2 . Pertanto f `e lipschitziana su D = R2 e in dunque ∂yj definitiva ogni soluzione esiste su tutto I = R. b) La funzione f `e certamente differenziabile su tutto Rn , con derivate parziali continue (perch´e composizione di funzioni elementari di classe C 1 ; inoltre il denominatore non `e mai nullo). Pertanto, le derivate parziali su ogni compatto sono limitate per il Teorema di Weierstrass e dunque f `e localmente lipschitziana in Rn . Inoltre si ha f (y) ≤
1 y , (log 2)3
∀y ∈ Rn .
Dunque sono verificate le ipotesi del Teorema 10.19, e ogni soluzione esiste su tutto I = R. 20. Esistenza di un integrale primo: a) Si ha y · f (y) = 0, dunque l’equazione `e conservativa e quindi Φ(y) = 12 y2 `e un integrale primo (Esempio 10.22 i)). b) Si ha div f (y) = 8y1 y23 + 2y2 − (8y1 y23 + 2y2 ) = 0 in R2 , dunque f `e un rotore e quindi l’equazione ammette un integrale primo Φ tale che rot Φ = f . Si ha ∂Φ = 4y12 y23 + 2y1 y2 , ∂y2
−
∂Φ = −(2y1 y24 + y22 ) ; ∂y1
integrando la prima si ha Φ(y) = y12 y24 + y1 y22 + c(y1 ) e sostituendo nella seconda si ha c(y1 ) = costante. Dunque una famiglia di integrali primi `e data da Φ(y) = y12 y24 + y1 y22 + c .
520
10 Equazioni differenziali ordinarie
21. Integrali generali:
1 1 t 5t + c2 e . a) y(t) = c1 e 2 1
cos 4t − sin 4t 3t 3t b) y(t) = c1 e + c2 e . sin 4t cos 4t c) La matrice A ha autovalori λ1 = 1, λ2 = 2 e λ3 = 3 con corrispondenti autovettori v1 = (1, 0, 3)T ,
v2 = (0, 1, 0)T ,
v1 = (2, 5, 5)T .
L’integrale generale pertanto ha la forma ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 0 2 y(t) = c1 et ⎝ 0 ⎠ + c2 e2t ⎝ 1 ⎠ + c3 e3t ⎝ 5 ⎠ . 3 0 5 d) La matrice A ha autovalori λ1 = 3, λ2,3 = 2±3i con corrispondenti autovettori v1 = (2, 0, 1)T ,
v2,3 = (1, ±i, 1)T .
L’integrale generale pertanto ha la forma ⎞ ⎞ ⎛ ⎞ ⎛ ⎛ 2 cos 3t sin 3t y(t) = c1 e3t ⎝ 0 ⎠ + c2 e2t ⎝ − sin 3t ⎠ + c3 e2t ⎝ cos 3t ⎠ . 1 cos 3t sin 3t ⎞ ⎞ ⎛ ⎞ ⎛ ⎛ 1 cos t − sin t e) y(t) = c1 ⎝ 0 ⎠ + c2 e−3t ⎝ −3 cos t − sin t ⎠ + c3 e−3t ⎝ − cos t + 3 sin t ⎠ . 0 8 cos t + 6 sin t 6 cos t − 8 sin t f) La matrice A ha autovalori λ1 = 4, con molteplicit` a 2 e λ2 = −8. Gli autovet(1) (2) tori corrispondenti a λ1 sono v1 = (1, 0, 0)T e v1 = (0, 3, 2)T , mentre l’autovettore corrispondente a λ2 `e v2 = (0, 3, −2)T . L’integrale generale pertanto ha la forma ⎞ ⎛ ⎛ ⎞ ⎛ ⎞ 0 1 0 y(t) = c1 e−8t ⎝ 3 ⎠ + c2 e4t ⎝ 0 ⎠ + c3 e4t ⎝ 3 ⎠ . −2 0 2 g) La matrice A ha un unico autovalore λ = 3, con molteplicit` a 3. Vi sono due (1) (2) T autovettori lineramente indipendenti v1 = (0, 1, 0) e v1 = (0, 0, 1)T . Inoltre, associato al secondo si trova un autovettore generalizzato r1 = (1, 0, 0)T . L’integrale generale pertanto ha la forma ⎛ ⎞ ⎛ ⎞ ⎛ ⎛ ⎞ ⎛ ⎞⎞ 1 0 0 0 3t ⎝ ⎠ 3t ⎝ ⎠ 3t ⎝ ⎝ ⎠ 1 + c2 e 0 + c3 e y(t) = c1 e t 0 + ⎝ 0 ⎠⎠ . 0 0 1 1
10.9 Esercizi
521
h) La matrice A ha un unico autovalore λ = 1, con molteplicit` a 3. Vi `e un solo autovettore v1 = (0, 0, 1)T . Ad esso sono associati due autovettori generalizzati r1 = (1/4, 0, 0)T e r2 = (0, 1/20, 0)T . L’integrale generale pertanto ha la forma ⎞⎞ ⎛ ⎞ ⎛ ⎛ ⎞ ⎛ 1/4 0 0 y(t) = c1 et ⎝ 0 ⎠ + c2 et ⎝t ⎝ 0 ⎠ + ⎝ 0 ⎠⎠ 0 1 1 ⎞⎞ ⎞ ⎛ ⎛ ⎛ ⎛ ⎞ 0 1/4 0 2 t +c3 et ⎝ ⎝ 0 ⎠ + t ⎝ 0 ⎠ + ⎝ 1/20 ⎠⎠ . 2 0 0 1 22. Integrali particolari: a) Si ha
⎞ ⎞ ⎛ ⎞ ⎛ 0 0 −1 y(t) = ⎝ 0 ⎠ t2 + ⎝ 0 ⎠ t + ⎝ 1 ⎠ . 0 −1/2 0 ⎛
b) Si ha
⎞ −25/18 y(t) = ⎝ −7/18 ⎠ e−2t . 7/144
c) Si ha
⎞ ⎛ ⎞ −2/3 0 y(t) = ⎝ 0 ⎠ cos 2t + ⎝ −1/3 ⎠ sin 2t . 1/6 −1/12
⎛
⎛
23. Si ha y1 (t) =
1 −2t 2 4t e + e , 3 3
y2 (t) =
2 −2t 1 4t e + e , 3 3
24. Il sistema scritto in forma normale diventa
y = Ay ,
con
A=
4 4 y3 (t) = − e−2t + e4t . 3 3
1 −1
2 3
.
Gli autovalori della matrice A sono λ1,2 = 2 ± i con autovettori v1,2 = (2, 1 ± i)T . Allora l’integrale generale ha la forma
2 cos t 2 sin t 2t + c2 . c1 y=e cos t − sin t cos t + sin t Imponendo le condizioni assegnate, si ricava c1 = 1 e c2 = −2.
−1 b sono λ1,2 = −1 ± b. 25. Gli autovalori della matrice A = b −1 Se b = 0, essi sono distinti e i corrispondenti autovettori sono v1 = (1, 1)T e v2 = (1, −1)T . L’integrale generale `e allora
522
10 Equazioni differenziali ordinarie
y(t) = c1 e
(b−1)t
1 1 −(1+b)t + c2 e . 1 −1
Se b = 0, gli autovettori sono ancora gli stessi e l’integrale generale ha la forma
1 1 −t −t y(t) = c1 e + c2 e . 1 −1 In entrambi i casi, la condizione iniziale fornisce c1 = 1 e c2 = 0. Pertanto la soluzione cercata `e, per ogni b,
1 (b−1)t . y(t) = e 1 26. Risulta, per a = 12 , a = 1, ⎞ ⎞ ⎛ ⎛ ⎛ ⎞ 2a − 1 2a − 2 0 y = c1 eat ⎝ 3 − 2a ⎠ + c2 e(1+a)t ⎝ 2 − a ⎠ + c3 e(3a−1)t ⎝ 1 ⎠ ; 1 − 2a 0 0 per a = 1,
⎞⎞ ⎞ ⎛ ⎞ ⎛ ⎛ ⎞ ⎛ −1 1 0 0 y = c1 et ⎝ 1 ⎠ + c2 e2t ⎝ 1 ⎠ + c3 e2t ⎝t ⎝ 1 ⎠ + ⎝ 0 ⎠⎠ ; 0 −1 0 0
per a = 1/2,
⎛
⎞⎞ ⎞ ⎛ ⎞ ⎛ ⎛ ⎞ ⎛ −1/2 −1 0 0 y = c1 e(3/2)t ⎝ 3/2 ⎠ + c2 e(1/2)t ⎝ 1 ⎠ + c3 e(1/2)t ⎝t ⎝ 1 ⎠ + ⎝ 0 ⎠⎠ ; 1/2 0 0 0 ⎛
27. Poniamo y1 = x, y2 = y, y3 = y e siamo ricondotti al sistema y = Ay con ⎞ ⎛ 2 −1 0 0 1 ⎠. A=⎝ 0 −10 5 −2 La matrice A ammette gli autovalori λ1 = 0, λ2 = 3 e λ3 = −3; i corrispondenti autovettori sono v1 = (1, 2, 0)T ,
v2 = (1, −1, −3)T ,
v3 = (1, 5, −15)T .
Conseguentemente, l’integrale generale `e ⎞ ⎞ ⎛ ⎞ ⎛ ⎛ 1 1 1 y = y(t) = c1 ⎝ 2 ⎠ + c2 e3t ⎝ −1 ⎠ + c3 e−3t ⎝ 5 ⎠ 0 −3 −15 ossia x = x(t) = c1 + c2 e3t + c3 e−3t ,
y = y(t) = 2c1 − c2 e3t + 5c3 e−3t .
10.9 Esercizi
523
28. Equazioni differenziali lineari del secondo ordine: a) y = c1 e−t + c2 e−2t + 12 t2 − 32 t + 94 , c1 , c2 ∈ R . b) Risolviamo dapprima l’equazione omogenea associata. L’equazione caratteristica λ2 − 4λ + 4λ = 0 ha un’unica soluzione λ = 2 di molteplicit` a doppia; dunque l’integrale generale dell’equazione omogenea sar` a y0 (t; c1 , c2 ) = (c1 + c2 t)e2t ,
c1 , c2 ∈ R .
Poich´e μ = λ = 2, cerchiamo l’integrale particolare nella forma yp (t) = αt2 e2t . Calcolando yp e yp e sostituendo nell’equazione, abbiamo 2αe2t = e2t , da cui α = assegnata `e
1 2.
Pertanto yp (t) =
1 2 2t 2t e
e l’integrale generale dell’equazione
1 y(t; c1 , c2 ) = (c1 + c2 t)e2t + t2 e2t , 2
c 1 , c2 ∈ R .
c) L’equazione caratteristica λ2 + 1 = 0 ha discriminante Δ = −4; abbiamo σ = 0 e ω = 1. Dunque l’integrale generale dell’equazione omogenea sar` a y0 (t; c1 , c2 ) = c1 cos t + c2 sin t ,
c 1 , c2 ∈ R .
Poich´e μ = σ = 0, cerchiamo l’integrale particolare nella forma yp (t) = t(α cos t + β sin t). Calcolando yp e yp e sostituendo nell’equazione, abbiamo −2α sin t + 2β cos t = 3 cos t , da cui α = 0 e β = 32 . Pertanto yp (t) = dell’equazione assegnata `e
3 2 t cos t
3 y(t; c1 , c2 ) = c1 cos t + c2 sin t + t cos t , 2
e l’integrale generale
c 1 , c2 ∈ R .
d) y = c1 et + c2 e2t − tet , c1 , c2 ∈ R . e) L’equazione caratteristica λ2 − 9 = 0 ammette le soluzioni λ = ±3. Dunque l’integrale generale dell’equazione omogenea sar`a y0 (t; c1 , c2 ) = c1 e−3t + c2 e3t ,
c1 , c2 ∈ R .
Cerchiamo l’integrale particolare nella forma yp (t) = αte−3t . Calcolando yp e yp e sostituendo nell’equazione, abbiamo −6αe−3t = e−3t , da cui α = − 16 . Pertanto yp (t) = − 16 te−3t e l’integrale generale dell’equazione assegnata `e 1 y(t; c1 , c2 ) = c1 e−3t + c2 e3t − te−3t , 6
c1 , c2 ∈ R .
524
10 Equazioni differenziali ordinarie
f) y = c1 e−t + c2 e3t +
1 10
cos t −
1 5
sin t , c1 , c2 ∈ R .
29. Problemi di Cauchy: a) y = e−t sin 2t . b) Risolviamo dapprima l’equazione omogenea associata. L’equazione caratteristica λ2 − 5λ + 4 = 0 ammette le soluzioni λ = 1 e λ = 4. Dunque l’integrale generale dell’equazione omogenea sar`a y0 (t; c1 , c2 ) = c1 et + c2 e4t ,
c1 , c2 ∈ R .
Cerchiamo l’integrale particolare nella forma yp (t) = αt + β. Calcolando yp e yp e sostituendo nell’equazione, abbiamo −5α + 4αt + 4β = 2t + 1 , da cui α = 12 e β = dell’equazione `e
7 8.
Pertanto yp (t) =
1 2t
+
7 1 y(t; c1 , c2 ) = c1 et + c2 e4t + t + , 2 8
7 8
e l’integrale generale
c1 , c2 ∈ R .
Imponendo le condizioni iniziali, si perviene al sistema ! c 1 + c2 = 0 1 c1 + 4c2 + = 0 2 da cui c1 =
1 6
e c2 = − 16 . Dunque la soluzione cercata `e y=
1 t 1 4t 1 7 e − e + t+ . 6 6 2 8
30. Equazioni differenziali lineari di ordine n: a) Il polinomio caratteristico `e χ(λ) = λ3 + λ2 − 2 che ammette la radice reale λ1 = 1 e le due radici complesse coniugate λ2,3 = −1 ± i. Allora l’integrale generale in forma reale `e y = y(t) = c1 et + c2 e−t cos t + c3 e−t sin t ,
c 1 , c2 , c3 ∈ R .
b) y(t) = c1 et + c2 tet + c3 , c1 , c2 , c3 ∈ R . c) Il polimonio caratteristico χ(λ) = λ4 − 5λ3 + 7λ2 − 5λ + 6 ha radici λ1 = 2, λ2 = 3, λ3,4 = ±i. L’integrale generale dell’equazione omogenea associata `e dunque y0 (t) = c1 e2t + c2 te3t + c3 cos t + c4 sin t ,
c 1 , c2 , c3 , c4 ∈ R .
Poich´e vi `e risonanza, cerchiamo un integrale particolare dell’equazione completa della forma yp (t) = t(α sin t + β cos t) .
10.9 Esercizi
525
Derivando tale espressione, sostituendo nell’equazione assegnata e uguagliando i coefficienti dei termini simili, si giunge al sistema
α + β = 0, α = 1/20 , da cui 10α − 10β = 1 , β = −1/20 . In definitiva, l’integrale generale `e y = y(t) = y0 (t) +
1 t(sin t − cos t) . 20
31. L’equazione omogenea associata ha integrale generale y0 (t) = c1 e2t + c2 e−3t , come si verifica facilmente. L’integrale particolare dell’equazione completa ha una forma che varia con il parametro k. Precisamente,
kt se k = 2, k = −3 , αe yp (t) = kt αte se k = 2, oppure k = −3 con α costante da determinare. Derivando tale espressione nei diversi casi e sostituendo nell’equazione completa, si ottiene ⎧ 1 ⎪ ⎪ se k = 2, k = −3 , ⎨ (k − 2)(k + 3) α= ⎪ 1 ⎪ ⎩ se k = 2, oppure k = −3 . 2k + 1 In definitiva, ⎧ 1 ⎪ 2t −3t ⎪ ekt + ⎨ c1 e + c 2 e (k − 2)(k + 3) y(t) = ⎪ 1 ⎪ ⎩ c1 e2t + c2 e−3t + tekt 2k + 1 32. Risulta
se k = 2, k = −3 , se k = 2, oppure k = −3 .
⎧ √ √ t ⎪ ⎨ e c1 cos k t + c2 sin k t se k > 0 , y(t) = et (c1 + tc2 ) se k = 0 , ⎪ √ ⎩ (1+√−k)t (1− −k)t c1 e + c2 e se k < 0 ,
con c1 , c2 ∈ R. 33. Il polinomo caratteristico `e χ(λ) = λ3 − 2λ2 + 49λ − 98 = (λ − 2)(λ2 + 49) , e le sue radici sono λ1 = 2 e λ2,3 = ±7i.
526
10 Equazioni differenziali ordinarie
L’integrale dell’equazione omogenea associata `e y0 (t) = c1 e2t + c2 cos 7t + c3 sin 7t ,
c 1 , c2 , c3 ∈ R .
Per il principio di sovrapposizione, posto b1 (t) = 48 sin t e b2 (t) = (β 2 + 49)eβt , iniziamo con il cercare un integrale particolare dell’equazione completa con termine noto b1 nella forma yp1 (t) = a cos t + b sin t. Derivando, sostituendo nell’equazione completa e uguagliando i termini simili, si ottiene a = −1/5 e b = −2/5. Il termine noto b2 , dipende dal parametro β. Se β = 2, cerchiamo un integrale particolare nella forma yp2 (t) = aeβt . Procedendo come d’uso, si trova a = 1/(β − 2). Se β = 2, cerchiamo un integrale particolare nella forma yp2 (t) = ate2t . In questo caso si ricava a = 1. In definitiva, l’integrale generale vale ! 1 y0 (t) + β−2 eβt − 15 cos t − 25 sin t se β = 2 , y(t) = y0 (t) + te2t − 15 cos t − 25 sin t se β = 2 . 34. Risulta ⎧ √ √ 1 3 −a t ⎪ ⎪ sin 3t se a < 0 , + c3 e−3 −a t + ⎪ c 1 + c2 e ⎪ 27(a − 1) ⎪ ⎪ ⎪ ⎪ 1 ⎪ ⎪ ⎨ c 1 + c2 t + c 3 t2 − sin 3t se a = 0 , 27 y(t) = √ √ 1 ⎪ ⎪ ⎪ sin 3t se a > 0, a = 1 , c1 + c2 cos 3 a t + c3 sin 3 a t + ⎪ ⎪ 27(a − 1) ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ c1 + c2 cos 3t + c3 sin 3t − t cos 3t se a = 1 . 18 √
35. Gli autovalori di A sono λ1 = −1 e λ2,3 = − 5± 2 163 e dunque Re λ < 0 per ciascuno di essi. Pertanto l’origine `e uniformemente asintoticamente stabile (Proposizione 10.46).
36. Si ha Jf (y) =
3y1 − 4y2 3
3y2 1
La matrice Jf (−3, 1) =
−9 1
−11 3
.
ha autovalori λ1 = −8 e λ2 = 2. Dunque l’origine `e instabile (Corollario 10.48).
Definizioni e formule notevoli
Successioni e serie Successione geometrica ⎧ 0 ⎪ ⎪ ⎪ ⎨1 lim q n = n→∞ ⎪ +∞ ⎪ ⎪ ⎩ non esiste
(p. 3): se se se se
|q| < 1, q = 1, q > 1, q ≤ −1
Numero e (p. 3): ∞ 1 n 1 e = lim 1 + = n→∞ n n! k=0
Serie geometrica (p. 7): ⎧ 1 ⎪ ⎪ converge a ⎪ ∞ ⎨ 1−q qk diverge a + ∞ ⎪ ⎪ k=0 ⎪ ⎩ `e indeterminata
se |q| < 1 , se q ≥ 1 , se q ≤ −1
Serie di Mengoli (p. 7): ∞ k=2
1 =1 (k − 1)k
Serie armonica generalizzata (p. 15):
converge se α > 1 , ∞ 1 kα diverge se α ≤ 1
k=1
.
528
Definizioni e formule
Serie di potenze
Raggio di convergenza (p. 49): ∞ ak xk converge R = sup x ∈ R : k=0
Criterio del rapporto (p. 51): ⎧ se = +∞ , ⎨0 ak+1 = =⇒ R = +∞ se = 0 , lim ⎩ k→∞ ak 1/ se 0 < < +∞ Criterio della radice (p. 51): lim k |ak | =
⎧ ⎨0 R = +∞ ⎩ 1/
=⇒
k→∞
se = +∞ , se = 0 , se 0 < < +∞
Sviluppo in serie di una funzione analitica (p. 57): ∞ f (k) (x0 )
f (x) =
k!
k=0
(x − x0 )k
Sviluppi in serie di potenze notevoli (p. 56 e 59): ∞
1 = xk , 1−x
x ∈ (−1, 1)
k=0
∞
1 = (−1)k x2k , 1 + x2 k=0 ∞
α k x , (1 + x)α = k
x ∈ (−1, 1) x ∈ (−1, 1)
k=0
ex =
∞ xk k=0
k!
x∈R
,
log(1 + x) =
∞ (−1)k k=0
sin x =
k+1
xk+1 =
∞ (−1)k x2k+1 , (2k + 1)!
∞ (−1)k−1 k=1
k
xk ,
x ∈ (−1, 1) x∈R
k=0
cos x =
∞ (−1)k k=0
(2k)!
x2k ,
x∈R
.
Definizioni e formule
Serie di Fourier
Coefficienti di Fourier di una funzione f (p. 84): 2π 1 a0 = f (x) dx 2π 0 ak =
bk =
ck =
1 π 1 π
2π
f (x) cos kx dx ,
k≥1
f (x) sin kx dx ,
k≥1
0
1 2π
2π 0
2π
f (x)e−ikx dx ,
k ∈ ZZ
0
Serie di Fourier di una funzione f ∈ C˜2π (p. 87): f ≈ a0 +
∞
+∞
(ak cos kx + bk sin kx) ≈
k=1
ck eikx
k=−∞
Identit` a di Parseval (p. 94): 2π +∞ +∞ 2 2 2 2 |f (x)| dx = 2πa0 + π (ak + bk ) = 2π |ck |2 0
k=1
Onda quadra ⎧ ⎨ −1 f (x) = 0 ⎩ 1
k=−∞
(p. 88): se −π < x < 0 , se x = 0, ±π , se 0 < x < π ,
∞ 1 4 sin(2m + 1)x f≈ π m=0 2m + 1
Onda raddrizzata (p. 89): f (x) = | sin x| ,
f≈
∞ 1 4 2 − cos 2mx 2 π π m=1 4m − 1
Dente di sega (p. 89): f (x) = x ,
x ∈ (−π, π) ,
∞ 2 (−1)k+1 sin kx f≈ k k=1
529
530
Definizioni e formule
Funzioni scalari Derivata parziale (p. 161): ∂f f (x0 + Δx ei ) − f (x0 ) (x0 ) = lim Δx→0 ∂xi Δx Gradiente (p. 161): ∇f (x0 ) = grad f (x0 ) =
∂f ∂xi
(x0 )
1≤i≤n
Differenziale (p. 166): dfx0 (Δx) = ∇f (x0 ) · Δx Derivata direzionale (p. 167): ∂f ∂f ∂f (x0 ) = ∇f (x0 ) · v = (x0 ) v1 + · · · + (x0 ) vn ∂v ∂x1 ∂xn Derivata parziale seconda (p. 172):
∂2f ∂f ∂ (x0 ) (x0 ) = ∂xj ∂xi ∂xj ∂xi Matrice hessiana (p. 173): Hf (x0 ) = (hij )1≤i,j≤n
con
hij =
∂2f (x0 ) ∂xj ∂xi
Sviluppo di Taylor con resto di Peano (p. 177): 1 f (x) = f (x0 ) + ∇f (x0 ) · (x − x0 ) + (x − x0 ) · Hf (x0 )(x − x0 ) + o(x − x0 2 ) 2
Rotore in dimensione 2 (p. 212): rot f =
∂f ∂f i− j ∂x2 ∂x1
Identit` a fondamentale (p. 215): rot grad f = ∇ ∧ (∇f ) = 0 Operatore di Laplace (p. 218): n ∂2f Δf = div grad f = ∇ · ∇f = ∂x2j j=1
Definizioni e formule
Funzioni vettoriali
Matrice jacobiana (p. 208): ⎛ ⎞ ∇f1 (x0 ) ∂f ⎜ ⎟ i ... Jf (x0 ) = (x0 ) 1 ≤ i ≤ m = ⎝ ⎠ ∂xj 1 ≤ j≤ n ∇fm (x0 ) Differenziale (p. 209): dfx0 (Δx) = Jf (x0 )Δx Divergenza (p. 211): ∂fj ∂fn ∂f1 + ··· + = ∂x1 ∂xn ∂xj j=1 n
div f = ∇ · f =
Rotore in dimensione 3 (p. 211):
∂f1 ∂f2 ∂f2 ∂f3 ∂f1 ∂f3 i+ j+ k − − − rot f = ∇ ∧ f = ∂x2 ∂x3 ∂x3 ∂x1 ∂x1 ∂x2 Rotore in dimensione 2 (p. 212): rot f =
∂f1 ∂f2 − ∂x1 ∂x2
Identit` a fondamentale (p. 215): div rot f = ∇ · (∇ ∧ f ) = 0 Derivata di una funzione composta–Regola della catena (p. 219): J (g ◦ f )(x0 ) = J g(y0 ) Jf (x0 ) Retta tangente ad una curva (p. 224): T (t) = γ(t0 ) + γ (t0 )(t − t0 ) ,
t∈R
Lunghezza di una curva (p. 229): b (γ) = γ (t) dt a
Piano tangente ad una superficie (p. 246): ∂σ ∂σ (u0 , v0 ) (u − u0 ) + (u0 , v0 ) (v − v0 ) ∂u ∂v Vettore normale ad una superficie (p. 247): ∂σ ∂σ (u0 , v0 ) ∧ (u0 , v0 ) ν(u0 , v0 ) = ∂u ∂v
Π(u, v) = σ(u0 , v0 ) +
531
532
Definizioni e formule
Coordinate polari Trasformazione da coordinate polari a coordinate cartesiane (p. 238): Φ : [0, +∞) × R → R2 ,
(r, θ) → (x, y) = (r cos θ, r sin θ)
Matrice jacobiana e suo determinante (p. 238):
cos θ −r sin θ , det J Φ(r, θ) = r J Φ(r, θ) = sin θ r cos θ Legami tra derivate parziali (p. 239): ∂f ∂f = cos θ + ∂r ∂x ∂f ∂f = cos θ − ∂x ∂r
∂f sin θ , ∂y ∂g sin θ , ∂θ r
∂f ∂f ∂f = − r sin θ + r cos θ ∂θ ∂x ∂y ∂f ∂g ∂f cos θ = sin θ + ∂y ∂r ∂θ r
Cambiamento di variabili negli integrali doppi (p. 330): f (x, y) dx dy = f (r cos θ, r sin θ) r dr dθ Ω
Ω
Coordinate cilindriche Trasformazione da coordinate cilindriche a coordinate cartesiane (p. 241): Φ : [0, +∞) × R2 → R3 ,
(r, θ, t) → (x, y, z) = (r cos θ, r sin θ, t)
Matrice jacobiana e suo determinante (p. 241): ⎛ ⎞ cos θ −r sin θ 0 J Φ(r, θ, t) = ⎝ sin θ r cos θ 0 ⎠ , det J Φ(r, θ, t) = r 0 0 1 Legami tra derivate parziali (p. 242): ∂f ∂f = cos θ + ∂r ∂x ∂f ∂f = cos θ − ∂x ∂r
∂f sin θ , ∂y ∂f sin θ , ∂θ r
∂f ∂f ∂f ∂f ∂f = − r sin θ + r cos θ , = ∂θ ∂x ∂y ∂t ∂z ∂f ∂f ∂f cos θ ∂f ∂f = sin θ + , = ∂y ∂r ∂θ r ∂z ∂t
Cambiamento di variabili negli integrali tripli (p. 339): f (x, y, z) dx dy dz = f (r cos θ, r sin θ, t) r dr dθ dt Ω
Ω
Definizioni e formule
533
Coordinate sferiche
Trasformazione da coordinate sferiche a coordinate cartesiane (p. 243): Φ : [0, +∞) × R2 → R3 , (r, ϕ, θ) → (x, y, z) = (r sin ϕ cos θ, r sin ϕ sin θ, r cos ϕ) Matrice jacobiana (p. 243): ⎛ sin ϕ cos θ r cos ϕ cos θ ⎜ sin ϕ sin θ r cos ϕ sin θ J Φ(r, ϕ, θ) = ⎝ cos ϕ −r sin ϕ
⎞ −r sin ϕ sin θ r sin ϕ cos θ ⎟ ⎠ 0
Determinante matrice jacobiana (p. 243): det J Φ(r, ϕ, θ) = r2 sin ϕ Legami tra derivate parziali (p. 242): ∂f ∂f ∂f ∂f = sin ϕ cos θ + sin ϕ sin θ + cos ϕ ∂r ∂x ∂y ∂z ∂f ∂f ∂f ∂f = r cos ϕ cos θ + r cos ϕ sin θ − r sin ϕ ∂ϕ ∂x ∂y ∂z ∂f ∂f ∂f = − r sin ϕ sin θ + r sin ϕ cos θ ∂θ ∂x ∂y ∂f ∂f ∂f cos ϕ cos θ ∂f sin θ = sin ϕ cos θ + − ∂x ∂r ∂ϕ r ∂θ r sin ϕ ∂f ∂f cos ϕ sin θ ∂f cos θ ∂f = sin ϕ sin θ + + ∂y ∂r ∂ϕ r ∂θ r sin ϕ ∂f ∂f sin ϕ ∂f = cos ϕ − ∂z ∂r ∂ϕ r Cambiamento di variabili negli integrali tripli (p. 339): f (x, y, z) dx dy dz = f (r sin ϕ cos θ, r sin ϕ sin θ, r cos ϕ) r2 sin ϕ dr dϕ dθ Ω
Ω
534
Definizioni e formule
Integrali multipli
Integrazione per verticali (p. 319): b g2 (x) f= f (x, y) dy dx Ω
a
g1 (x)
Integrazione per orizzontali (p. 319): d h2 (y) f= f (x, y) dx dy Ω
c
h1 (y)
Integrazione per fili (p. 334): g2 (x,y) f= f (x, y, z) dz dx dy Ω
D
g1 (x,y)
Integrazione per strati (p. 336):
β f= f (x, y, z) dx dy dz Ω
α
Az
Cambiamento di variabili negli integrali multipli (p. 338): f (x) dΩ = f Φ(u) | det J Φ(u)| dΩ Ω
Ω
Primo Teorema di Guldino (p. 343): vol(Ω) = 2πyG area(T )
.
Definizioni e formule
Integrali su curve e superfici
Integrale curvilineo (p. 378): b f= f γ(t) γ (t) dt γ
a
Integrale di linea (p. 386): b f ·τ = fτ = f γ(t) · γ (t) dt γ
γ
a
Integrale superficiale (p. 389): f= f σ(u, v) ν(u, v) du dv σ
R
Integrale di superficie (p. 395): f ·n= fn = f σ(u, v) · ν(u, v) du dv σ
σ
R
Teorema di Gauss o della divergenza (p. 402): div f = f ·n Ω
∂Ω
Teorema di Green (p. 406): 4 ∂f1 ∂f2 − dx dy = f ·τ ∂x ∂y Ω ∂Ω Teorema di Stokes (p. 408): 4 (rot f ) · n = f ·τ Σ
∂Σ
.
535
536
Definizioni e formule
Quadriche notevoli z Ellissoide y
y2 z2 x2 + + =1 a2 b2 c2
x
z Paraboloide iperbolico y
z y2 x2 =− 2 + 2 c a b
x
z
Paraboloide ellittico z y2 x2 = 2 + 2 c a b x
y
Definizioni e formule z
Cono
y
x
z2 x2 y2 = 2 + 2 2 c a b
z
Iperboloide a una falda y x
y2 z2 x2 + 2 − 2 =1 2 a b c
z
Iperboloide a due falde
x
y
x2 y2 z2 − 2 − 2 =1 2 c a b
537
Indice analitico
Arco, 142 chiuso, 142 di Jordan, 142 estremi di, 142 lunghezza di un, 229, 231 meridiano, 148, 342 semplice, 142 Area, 315, 378, 389, 392 Ascissa curvilinea, 231 Autovalore, 118 Autovettore, 118 generalizzato, 483 Baricentro, 341, 384, 394 Base canonica, 114 Binormale, 234 Bordo, 252, 256 Bottiglia di Klein, 256 Calotta, 146, 245, 392, 400 S-ammissibile, 400 regolare, 245, 246 semplice, 246 Cambiamento di variabile, 235, 327, 329, 338 Campo, 131 conservativo, 215, 409 di tipo rotore, 215 irrotazionale, 215, 416 radiale, 419 solenoidale, 215 vettoriale, 162
Centro di curvatura, 233 di una serie, 46 Chiusura, 123 Cilindroide, 308, 322 Circuitazione, 387 Coefficienti di Fourier, 87 di una serie di potenze, 46 Componente, 256 connessa, 128 Convergenza assoluta, 18, 42 puntuale, 36, 42, 96 quadratica, 93 semplice, 20 uniforme, 37, 43, 98 Coordinate cilindriche, 241, 338 curvilinee, 235 polari, 238, 329 sferiche, 242, 339 Criterio del confronto, 2, 10 del confronto asintotico, 11 del rapporto, 3, 12, 51 della radice, 13, 51 di convergenza assoluta, 19 di Leibniz, 17 di Weierstrass, 44 integrale, 14
540
Indice analitico
Curva, 141 anti-equivalente, 227 congruente, 227 coordinata, 236 derivabile, 223 di livello, 277 equivalente, 227 integrale, 441 lunghezza di una, 229 omotopa, 414 opposta, 228, 381 piana, 142 regolare, 224, 229 regolare a tratti, 224 semplice, 142, 229 sostegno di una, 142 Curvatura, 233 Decomposizione di Helmholtz, 217 Dente di sega, 94 Derivata direzionale, 163 parziale, 160, 163, 172, 175 Determinante, 118 Differenziale, 166, 209 Disuguaglianza di Cauchy-Schwarz, 114 triangolare, 114 Divergenza, 211, 402 Elicoide, 148 Ellissoide, 148 Equazione differenziale a variabili separabili, 445 autonoma, 442 di Bernoulli, 452 di Riccati, 452 lineare, 448 non omogenea, 448, 494 omogenea, 447, 448, 491 ordinaria, 438 soluzione, 438, 440 Esistenza globale, 462 locale, 455 Esterno, 123 di una curva, 143 Estremo libero, 178 vincolato, 283, 285
Faccia, 256 Fenomeno di Gibbs, 97 Flusso, 395 Forma normale, 438 quadratica, 120, 181 Formule di Frenet, 235 di riduzione, 313, 319, 334, 336 Frequenza, 80 Frontiera, 123 Funzione C 1 a tratti, 98 analitica, 58 armonica, 218 continua, 133 continua a tratti, 82 degli errori, 60 dente di sega, 94 derivata parziale, 162 di Bessel, 64 di classe C k , 175 di Liapunov, 467 di pi` u variabili, 129 differenziabile, 165, 209 generalmente continua, 318 gradiente, 162 implicita, 269, 271, 273, 274 integrabile, 310, 317, 332, 346 lagrangiana, 289 limite, 36 lipschitziana, 170, 209, 457 localmente lipschitziana, 463 monotona a tratti, 96 onda quadra, 88, 97, 98 onda raddrizzata, 89, 98 periodica, 78 regolare a tratti, 96 regolarizzata, 82 scalare, 129 sviluppabile, 58 vettoriale, 130, 207 Gradiente, 161, 211 Identit` a di Parseval, 94, 100 Insieme G-ammissibile, 397 aperto, 123
Indice analitico chiuso, 123 chiusura di un, 123 compatto, 126 connesso, 127 convesso, 127 di convergenza, 36, 42 di livello, 130, 277 esterno, 123 frontiera di un, 123 interno, 123 limitato, 126 misurabile, 315 normale, 334 orizzontalmente convesso, 318 semplice, 318, 334 semplicemente connesso, 414 stellato, 416 verticalmente convesso, 318 Integrale curvilineo, 378, 383, 386 di flusso, 394, 395 di linea, 386, 388 di superficie, 394 doppio, 307, 308 generale, 441 improprio, 345, 346 inferiore, 310 multiplo, 307, 331, 345 particolare, 475, 487 primo, 467 singolare, 445 superficiale, 389, 391 superiore, 310 triplo, 307, 331, 332 Integrazione per fili, 334 per strati, 336 Interno, 123 di una curva, 143 Intorno, 122 Lagrangiana, 289 Laplaciano, 218 Lemma di Riemann-Lebesgue, 94 Limite, 135, 139, 140 Linearizzazione, 471 Lunghezza, 229 Massa, 341, 384
Massimo, 179 Matrice, 116 definita, 120 determinante di una, 118 diagonalizzabile, 119 esponenziale, 483 hessiana, 173 identit` a, 117 indefinita, 121 inversa, 118 jacobiana, 208 minore di una, 117 non singolare, 118 norma di una, 117 normale, 117 ortogonale, 117 quadrata, 116, 117 rango di una, 117 semi-definita, 120 simile, 119 simmetrica, 117 trasposta, 117 Minimo, 179 Minore, 117 Misura, 315 Molteplicit` a algebrica, 119 geometrica, 119 Moltiplicatore di Lagrange, 287 Momento di inerzia, 341, 384, 394 Nastro di M¨ obius, 250, 256 Norma euclidea, 114, 117 infinito, 38 quadratica, 82 Normale, 233 Omotopia, 414 Onda quadra, 88, 97, 98 raddrizzata, 89, 98 Operatore di Laplace, 218 differenziale, 218 Orbita, 442 chiusa, 442 Ordine, 438 Orientazione, 228, 250
541
542
Indice analitico
Parametrizzazione, 246, 248 anti-equivalente, 248 equivalente, 248 Parseval, identit` a di, 94, 100 Partizione, 308 Piano osculatore, 233 tangente, 165, 246 Poligonale, 127 Polinomio caratteristico, 118, 478, 492 di Taylor, 176 trigonometrico, 81 Potenziale, 215, 416 Problema ai valori iniziali, 441 di Cauchy, 441 Prodotto alla Cauchy, 21 esterno, 115 scalare, 82, 114 Pseudo-derivata, 97 Punto centro, 502 critico, 180, 497 di minimo, 179 di accumulazione, 125 di equilibrio, 497 di estremo, 179 di frontiera, 122 di massimo, 179 di sella, 184 esterno, 122 fuoco, 502 interno, 122 isolato, 125 nodo, 501 regolare, 180 sella, 502 stazionario, 180, 497 Raggio di convergenza, 49, 51 di curvatura, 233 spettrale, 119 Rango, 117 Regione, 128 Regola della catena, 219 Resto di Lagrange, 176
di Peano, 177 di una serie, 9, 15, 17 Risonanza, 488, 494 Rotore, 211, 405 Scarto quadratico, 85 Serie a termini positivi, 9 armonica, 11, 15, 18 assolutamente convergente, 18 binomiale, 53, 60 centro di una, 46 coefficienti di una, 46 condizionatamente convergente, 20 convergente, 5 derivata, 55 derivazione per, 44, 55 di Fourier, 77, 87, 99 di funzioni, 42 di Maclaurin, 58 di Mengoli, 7 di potenze, 46 di segno alterno, 16 di Taylor, 58 divergente, 5 esponenziale, 46, 59 geometrica, 6, 43 indeterminata, 5 integrazione per, 43, 56 numerica, 4, 5 prodotto di, 21 raggio di una, 49, 51 resto di una, 9, 15, 17 semplicemente convergente, 20 somma di una, 5, 42 telescopica, 8 termine generale, 5 Sezione meridiana, 342 Sistema autonomo, 498 conservativo, 466 dissipativo, 467 fondamentale, 473 hamiltoniano, 469 lineare, 472 non omogeneo, 475, 487 omogeneo, 472, 479, 483 ortonormale, 83, 114
Indice analitico Soluzione attrattiva, 498 di equilibrio, 497 di un’equazione differenziale, 438, 440 globale, 442 massimale, 459 stabile, 497 stazionaria, 497 uniformemente attrattiva, 498 Somma, 5, 42 inferiore, 309 superiore, 309 Sostegno, 146 di una curva, 142 di una superficie, 146 Spazio delle fasi, 442 Spigolo, 256 Stabilit` a, 496 linearizzata, 506 Successione convergente, 1, 36 delle ridotte, 4 delle somme parziali, 4 di funzioni, 36 divergente, 2 geometrica, 3 indeterminata, 2 numerica, 1 Superficie, 146, 245 bordo di una, 252, 256 cartesiana, 147 chiusa, 255 di livello, 277, 281 di rotazione, 148, 393 elicoidale, 148 esterna, 256 interna, 256 orientabile, 250, 256 regolare, 245, 246 regolare a pezzi, 256 semplice, 146, 246 sferica, 148 topografica, 147
Sviluppo di Taylor, 176, 177 Teorema del confronto, 2 del rotore, 405 della divergenza, 402 della media, 324 di sostituzione, 3 di Abel, 50 di Cauchy, 458 di Dini, 274 di Fermat, 180 di Gauss, 402 di Green, 405 di Guldino, 343, 393 di Jordan, 143 di Lagrange, 169 di Pappo, 343 di Peano, 455 di Schwarz, 173 di Stokes, 407 di Weierstrass, 179 Terna destrorsa, 116, 237, 402 Toro, 151, 255, 344 Traiettoria, 442 Verso di attraversamento, 250 di percorrenza, 228, 401 Versore, 114 binormale, 234 normale, 247, 251 tangente, 232 versore normale, 398 Vettore, 113 binormale, 234 normale, 233, 247 ortogonale, 114 tangente, 225, 232 torsione, 234 Vincolo, 286 Volume, 322, 342
543
Collana Unitext - La Matematica per il 3+2 a cura di F. Brezzi (Editor-in-Chief) P. Biscari C. Ciliberto A. Quarteroni G. Rinaldi W.J. Runggaldier Volumi pubblicati. A partire dal 2004, i volumi della serie sono contrassegnati da un numero di identificazione. I volumi indicati in grigio si riferiscono a edizioni non più in commercio A. Bernasconi, B. Codenotti Introduzione alla complessità computazionale 1998, X+260 pp. ISBN 88-470-0020-3 A. Bernasconi, B. Codenotti, G. Resta Metodi matematici in complessità computazionale 1999, X+364 pp, ISBN 88-470-0060-2 E. Salinelli, F. Tomarelli Modelli dinamici discreti 2002, XII+354 pp, ISBN 88-470-0187-0 S. Bosch Algebra 2003, VIII+380 pp, ISBN 88-470-0221-4 S. Graffi, M. Degli Esposti Fisica matematica discreta 2003, X+248 pp, ISBN 88-470-0212-5 S. Margarita, E. Salinelli MultiMath - Matematica Multimediale per l’Università 2004, XX+270 pp, ISBN 88-470-0228-1
A. Quarteroni, R. Sacco, F. Saleri Matematica numerica (2a Ed.) 2000, XIV+448 pp, ISBN 88-470-0077-7 2002, 2004 ristampa riveduta e corretta (1a edizione 1998, ISBN 88-470-0010-6) 13. A. Quarteroni, F. Saleri Introduzione al Calcolo Scientifico (2a Ed.) 2004, X+262 pp, ISBN 88-470-0256-7 (1a edizione 2002, ISBN 88-470-0149-8) 14. S. Salsa Equazioni a derivate parziali - Metodi, modelli e applicazioni 2004, XII+426 pp, ISBN 88-470-0259-1 15. G. Riccardi Calcolo differenziale ed integrale 2004, XII+314 pp, ISBN 88-470-0285-0 16. M. Impedovo Matematica generale con il calcolatore 2005, X+526 pp, ISBN 88-470-0258-3 17. L. Formaggia, F. Saleri, A. Veneziani Applicazioni ed esercizi di modellistica numerica per problemi differenziali 2005, VIII+396 pp, ISBN 88-470-0257-5 18. S. Salsa, G. Verzini Equazioni a derivate parziali - Complementi ed esercizi 2005, VIII+406 pp, ISBN 88-470-0260-5 2007, ristampa con modifiche 19. C. Canuto, A. Tabacco Analisi Matematica I (2a Ed.) 2005, XII+448 pp, ISBN 88-470-0337-7 (1a edizione, 2003, XII+376 pp, ISBN 88-470-0220-6) 20. F. Biagini, M. Campanino Elementi di Probabilità e Statistica 2006, XII+236 pp, ISBN 88-470-0330-X
21. S. Leonesi, C. Toffalori Numeri e Crittografia 2006, VIII+178 pp, ISBN 88-470-0331-8 22. A. Quarteroni, F. Saleri Introduzione al Calcolo Scientifico (3a Ed.) 2006, X+306 pp, ISBN 88-470-0480-2 23. S. Leonesi, C. Toffalori Un invito all’Algebra 2006, XVII+432 pp, ISBN 88-470-0313-X 24. W.M. Baldoni, C. Ciliberto, G.M. Piacentini Cattaneo Aritmetica, Crittografia e Codici 2006, XVI+518 pp, ISBN 88-470-0455-1 25. A. Quarteroni Modellistica numerica per problemi differenziali (3a Ed.) 2006, XIV+452 pp, ISBN 88-470-0493-4 (1a edizione 2000, ISBN 88-470-0108-0) (2a edizione 2003, ISBN 88-470-0203-6) 26. M. Abate, F. Tovena Curve e superfici 2006, XIV+394 pp, ISBN 88-470-0535-3 27. L. Giuzzi Codici correttori 2006, XVI+402 pp, ISBN 88-470-0539-6 28. L. Robbiano Algebra lineare 2007, XVI+210 pp, ISBN 88-470-0446-2 29. E. Rosazza Gianin, C. Sgarra Esercizi di finanza matematica 2007, X+184 pp, ISBN 978-88-470-0610-2 30. A. Machì Gruppi - Una introduzione a idee e metodi della Teoria dei Gruppi 2007, XII+349 pp, ISBN 978-88-470-0622-5
31. Y. Biollay, A. Chaabouni, J. Stubbe Matematica si parte! A cura di A. Quarteroni 2007, XII+196 pp, ISBN 978-88-470-0675-1 32. M. Manetti Topologia 2008, XII+298 pp, ISBN 978-88-470-0756-7 33. A. Pascucci Calcolo stocastico per la finanza 2008, XVI+518 pp, ISBN 978-88-470-0600-3 34. A. Quarteroni, R. Sacco, F. Saleri Matematica numerica (3a Ed.) 2008, XVI+510 pp, ISBN 978-88-470-0782-6 35. P. Cannarsa, T. D’Aprile Introduzione alla teoria della misura e all’analisi funzionale 2008, XII+268 pp, ISBN 978-88-470-0701-7 36. A. Quarteroni, F. Saleri Calcolo scientifico (4a Ed.) 2008, XIV+358 pp. ISBN 978-88-470-0837-3 37. C. Canuto, A. Tabacco Analisi Matematica I (3a Ed.) 2008, XIV+452 pp, ISBN 978-88-470-0871-7 38. S. Gabelli Teoria delle Equazioni e Teoria di Galois 2008, XVI+410 pp, ISBN 978-88-470-0618-8 39. A. Quarteroni Modellistica numerica per problemi differenziali (4a Ed.) 2008, XVI+558 pp, ISBN 978-88-470-0841-0 40. C. Canuto, A. Tabacco Analisi Matematica II 2008, X+544 pp, ISBN 978-88-470-0873-1