Indice
Indice
v
Prefazione I
II
III
IV
ix
Equazioni differenziali § 1 Equazioni differenziali e modelli . . § 2...
338 downloads
2788 Views
14MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Indice
Indice
v
Prefazione I
II
III
IV
ix
Equazioni differenziali § 1 Equazioni differenziali e modelli . . § 2 Equazioni a variabili separabili . . . § 3 Equazioni lineari del primo ordine . § 4 Equazioni lineari del secondo ordine Esercizi . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
1 1 7 10 13 18
Successioni e serie di funzioni § 1 Serie di potenze . . . . . . . . § 2 Serie di Taylor . . . . . . . . . § 3 Soluzioni in serie . . . . . . . § 4 Serie di Fourier . . . . . . . . § 5 Convergenza uniforme . . . . Esercizi . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
35 37 46 52 54 62 73
. . . . . . .
97 98
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Vettori e calcolo geometrico § 1 Successioni finite: n-uple e vettori . . . . . . § 2 Sistemi di equazioni di primo grado, indipendenza lineare e dimensione . . . . . § 3 Coordinate cartesiane e geometria analitica § 4 Area di un parallelogramma . . . . . . . . . § 5 Volume di un parallelepipedo . . . . . . . . § 6 Il prodotto vettoriale . . . . . . . . . . . . . § 7 Rette e piani: sottospazi lineari . . . . . . . § 8 Coordinate non cartesiane . . . . . . . . . . Esercizi . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . .
99 106 112 116 123 127 138 141
Matrici e operatori lineari § 1 Spazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . § 2 Matrici e trasformazioni lineari . . . . . . . . . . . . . .
163 164 170
v
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
vi
Indice
§ 3 Prodotto scalare e isometrie § 4 Il determinante . . . . . . . § 5 Forme quadratiche . . . . . j § 6 Autovalori e autovettori . . Esercizi . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
178 186 197 203 211
Curve, grafici e superfici nello spazio § 1 Curve parametriche . . . . . . . . . . § 2 Derivazione per componenti . . . . . § 3 Integrazione per componenti . . . . § 4 Lunghezza di una curva . . . . . . . § 5 Curvatura, torsione, terna intrinseca § 6 Funzioni di due variabili . . . . . . . § 7 Insiemi del piano . . . . . . . . . . . § 8 Limiti e continuità . . . . . . . . . . § 9 Superfici parametriche . . . . . . . . Esercizi . . . . . . . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
227 227 231 235 239 242 247 250 252 256 258
Calcolo differenziale per funzioni di più variabili § 1 Derivate parziali . . . . . . . . . . . . . . . . . . § 2 Derivate direzionali . . . . . . . . . . . . . . . . . § 3 Differenziabilità e approssimazioni lineari. . . . . § 4 Piano tangente ad una superficie parametrica . . § 5 Funzioni composte . . . . . . . . . . . . . . . . . § 6 Derivate successive. Il Teorema di Schwarz . . . . § 7 Valori di massimo e di minimo . . . . . . . . . . . § 8 Massimi e minimi su domini chiusi . . . . . . . . § 9 Il metodo dei moltiplicatori di Lagrange . . . . . j § 10 Funzioni implicite . . . . . . . . . . . . . . . . . Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
275 275 279 280 287 290 292 294 301 304 307 311
Funzioni differenziabili tra spazi vettoriali § 1 Spazi metrici . . . . . . . . . . . . . . . . . . . . . § 2 Successioni, limiti e continuità in (X, d). . . . . . . § 3 Insiemi chiusi e limitati in Rn . . . . . . . . . . . . . § 4 Proprietà delle funzioni continue . . . . . . . . . . § 5 Spazi metrici completi e Teorema delle contrazioni § 6 Linearizzazione . . . . . . . . . . . . . . . . . . . . § 7 Funzioni composte . . . . . . . . . . . . . . . . . . § 8 Campi vettoriali . . . . . . . . . . . . . . . . . . . . § 9 Derivate successive . . . . . . . . . . . . . . . . . . § 10 Formula di Taylor . . . . . . . . . . . . . . . . . . . § 11 Ottimizzazione libera . . . . . . . . . . . . . . . . . § 12 Il Teorema delle funzioni implicite . . . . . . . . . § 13 Ottimizzazione vincolata . . . . . . . . . . . . . . . Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
331 332 333 338 340 342 348 353 355 358 360 362 365 369 371
V
. . . . .
. . . . .
. . . . .
. . . . .
VI
VII
Indice
vii
VIII Sistemi di equazioni differenziali § 1 Campi di vettori e curve tangenti . . . . . . . . § 2 Il problema ai valori iniziali . . . . . . . . . . . j § 3 Esistenza e unicità delle soluzioni per il problema ai valori iniziali . . . . . . . . . § 4 Equazioni differenziali lineari . . . . . . . . . . § 5 Sistemi lineari omogenei a coefficienti costanti § 6 Sistemi lineari non omogenei . . . . . . . . . . § 7 Proprietà qualitative dei sistemi autonomi . . . § 8 Sistemi non lineari . . . . . . . . . . . . . . . . Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . IX
X
. . . . . . . . . .
387 390 392
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
397 404 412 423 427 433 439
Integrali multipli § 1 Somme di Riemann ed integrale come limite . . § 2 Il calcolo degli integrali doppi su rettangoli . . § 3 Integrazione su domini generici . . . . . . . . . § 4 Integrazione su regioni semplici . . . . . . . . . § 5 Applicazioni dell’integrale doppio . . . . . . . . § 6 Cambiamento di variabile negli integrali doppi § 7 Integrali doppi in coordinate polari . . . . . . . § 8 Aree di superfici cartesiane . . . . . . . . . . . § 9 Integrale triplo . . . . . . . . . . . . . . . . . . Esercizi . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
457 458 461 465 467 472 477 483 485 487 495
Integrali su curve e superfici § 1 Integrali curvilinei . . . . . . . . . . . . . . § 2 Integrali curvilinei di campi vettoriali . . . . § 3 Campi conservativi . . . . . . . . . . . . . . § 4 Teorema di Gauss–Green . . . . . . . . . . . § 5 Superfici regolari fino al bordo. Orientabilità § 6 Integrali di superficie . . . . . . . . . . . . . § 7 Integrali di superficie di campi vettoriali . . § 8 Teoremi del rotore e della divergenza . . . . Esercizi . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
515 515 519 522 529 532 536 540 542 550
. . . . . . . . .
. . . . . . . . .
Soluzioni degli esercizi
571
Note
647
Riferimenti bibliografici
651
Indice analitico
653
Prefazione
I
n questo secondo volume si prosegue (com’è ovvio) il percorso di avvicinamento all’analisi, e piú in generale, alla Matematica iniziato nel primo volume, per quei corsi di studio in cui questa viene usata per risolvere problemi scientifici e applicativi. Mentre però lo scopo del primo volume era quello di introdurre i concetti e gli strumenti fondamentali dell’analisi infinitesimale (differenziale e integrale), cercando di contestualizzare i vari aspetti della materia, in questo secondo volume l’orizzonte si amplia in modo significativo, dal momento che lo scopo non è solo quello di approfondire e generalizzare a piú variabili quei metodi, ma anche di studiare nel dettaglio alcune importanti applicazioni classiche dei metodi analitici. Si tratta sí di un libro di analisi in piú variabili, con i contenuti tipici di un secondo corso universitario, ma si è voluto fornire anche alcuni strumenti per approfondire e motivare la prospettiva unitaria ch’era alla base del primo volume (riquadri di approfondimento, intermezzi storici, esercizi e problemi teorici guidati, ma anche interi capitoli dedicati ad argomenti importanti, come le equazioni differenziali o l’algebra lineare). Questo ha fatto sí che le dimensioni dell’opera potrebbero risultare eccessive per un normale corso semestrale, e al lettore è richiesto un certo impegno per poterla considerare in toto. La distribuzione degli argomenti nei vari capitoli è stata perciò pensata al fine di massimizzare la libertà di scelta di possibili sotto-percorsi, pur conservando una certa consistenza logica (nei prerequisiti e nelle applicazioni). All’inizio di ogni capitolo si è descritto brevemente quali sono gli argomenti che sono necessari per affrontarlo, e quali capitoli sono ragionevolmente affrontabili in seguito. Come nel primo volume, ci sono piú livelli di percorso: un livello base, e un livello piú avanzato, contrassegnato con il simbolo j. Questo rivela una discontinuità di livello locale, cioè relativa al capitolo in cui ci si trova, e non assoluta. Questo perché alcuni capitoli sono in sé piú densi e impegnativi degli altri (per esempio i capitoli IV, VII e VIII). Per permettere questo accesso a vari livelli, abbiamo scelto alcune soluzioni non convenzionali. Le equazioni differenziali sono affrontate in due capitoli, a due livelli diversi: nel Capitolo I la trattazione avviene principalmente attraverso esempi ed esercizi, mentre la sistematizzazio-
x
Prefazione
ne teorica e gli approfondimenti sono rimandati al Capitolo VIII, che richiede una certa consapevolezza degli strumenti dell’analisi in piú variabili. In un corso di analisi non ridotto ai minimi termini i due capitoli possono essere anche svolti contemporaneamente (l’uno fornendo materiale per le esercitazioni dell’altro). Similmente, l’approccio al calcolo differenziale per funzioni in piú variabili è sviluppato ad un livello elementare (limitato a funzioni di due variabili reali e focalizzato alle applicazioni) nel Capitolo VI, mentre le strutture astratte che permettono una trattazione piú rigorosa sono oggetto del Capitolo VII. Di nuovo, tempo permettendo, i due capitoli possono essere svolti in contemporanea. Viceversa, laddove la minimalità del corso impedisca tali approfondimenti, abbiamo voluto lasciare al lettore interessato la possibilità di completare in modo autonomo la propria formazione. Per quanto riguarda gli elementi di geometria e di algebra lineare, che solitamente non vengono affrontati nei testi di analisi, abbiamo voluto inserirli proprio per cercare di ricomporre la prospettiva unitaria menzionata sopra (anche perché gli esempi significativi di spazio lineare sono proprio quelli di spazi di funzioni e di soluzioni di equazioni differenziali). Essi si trovano nel Capitolo III ad un livello molto elementare, e nel Capitolo IV ad un livello significativamente piú impegnativo. Completano il volume quattro capitoli con una esposizione piú tradizionale dei classici argomenti del secondo corso, con una particolare attenzione all’interdisciplinarietà: il Capitolo II (successioni e serie di funzioni), il Capitolo V (curve e superfici nello spazio), il Capitolo IX (integrali multipli) e il Capitolo X (integrali di linea e superficie e calcolo vettoriale). Alla fine di ogni capitolo sono stati selezionati un certo numero di esercizi, rappresentativi o di particolare interesse, da guardare prima di dedicarsi ai numerosi esercizi da svolgere (tutti con soluzione dettagliata in appendice). Rispetto al primo volume, la variabilità della natura e della difficoltà degli esercizi è aumentata, per cui i simboli che segnalano alcune tipologie di esercizi non standard non sono solo la ✩ (per gli esercizi di maggiore difficoltà e interesse teorico), ma anche K (per gli esercizi di natura prevalntemente teorica, che richiedono un certo tempo di riflessione), o (esercizi di tipo “enigmistico–ludico”), b (esercizi di calcolo), Ï (esercizi al calcolatore – pochi in realtà). In questo modo si è cercato di fornire qualche indicazione utile per poter fruire del testo, sia da parte del docente, che da parte del lettore. La stesura di quest’opera ha richiesto uno sforzo non banale da parte degli autori, che, forse perché sotto stress e pressione, possono aver inserito qua e là porzioni di testo prive di quella compostezza e gravità che il caso richiederebbe, nonché hanno certamente mancato di privare completamente l’opera di errori tipografici e non. Speriamo che il Lettore si mostri benevolo a riguardo. Milano, 8–I–2008 (Gli Autori)
I think I may fairly make two postulata. First, That food is necessary to the existence of man. Secondly, That the passion between the sexes is necessary and will remain nearly in its present state. An Essay on the Principle of Population (1798) T HOMAS R. M ALTHUS (1766–1834)
C APITOLO
I Equazioni differenziali
Le equazioni differenziali permettono di studiare l’evoluzione di molti sistemi fisici di interesse nelle scienze naturali, sociali ed economiche. In molti casi, infatti, è possibile prevedere l’evoluzione futura di un fenomeno, a partire da uno stato attuale osservabile, attraverso un modello matematico. Molto spesso un tale modello prevede delle regole sulle modalità di variazione delle funzioni coinvolte nella descrizione del fenomeno e tali relazioni prendono appunto il nome di equazioni differenziali. In questo capitolo impareremo ad
utilizzare le equazioni differenziali in alcuni semplici contesti applicativi e a risolverle nei casi più elementari, attraverso numerosi esempi, rimandando una trattazione più sistematica e rigorosa delle equazioni differenziali al Capitolo VIII. In un corso di Analisi Matematica avanzato lo studio delle equazioni ordinarie può prendere inizio direttamente dalla trattazione teorica del Capitolo VIII, utilizzando il contenuto di questo capitolo a scopo esemplificativo e di esercitazione.
P
er studiare l’evoluzione nel tempo di un sistema fisico attraverso un suo modello matematico è naturale cercare di individuare le relazioni fra le variazioni delle quantità che lo descrivono, pensate come funzioni del tempo, e lo stato del sistema al momento attuale. Come sappiamo dal primo volume, l’operazione adatta a quantificare la velocità di variazione di una funzione è la derivazione. Una equazione differenziale è appunto un’equazione che contiene una funzione incognita e alcune sue derivate. Iniziamo con qualche semplice esempio.
§ 1. Equazioni differenziali e modelli Modelli di crescita delle popolazioni Supponiamo di conoscere il numero di individui p0 di una popolazione di (ad esempio) batteri ad un certo istante t = 0 e di volerne prevedere
Il modello matematico di un feno-
meno fisico viene individuato tipicamente attraverso considerazioni intuitive sulle qualità del fenomeno o a partire da una legge fisica basata sull’evidenza sperimentale, e consiste nella determinazione di un certo numero di quantità adatte alla descrizione del fenomeno (posizione, temperatura, densità, . . . ) e delle relazioni fra esse. Perciò, di norma, un modello matematico consiste in un insieme di funzioni che rappresentano gli stati possibili del sistema ed un certo numero di relazioni fra queste.
2
Equazioni differenziali
l’andamento demografico, vale a dire il numero di individui nel generico istante t. Indichiamo con p(t) tale numero. Per determinare la funzione incognita p dobbiamo fare delle ipotesi sul comportamento della popolazione, ipotesi che generalmente vengono dedotte sperimentalmente. Uno dei modelli più semplici assume che una popolazione cresca ad un tasso proporzionale al suo numero di individui. In effetti, se m ed n rappresentano i tassi percentuali rispettivamente di mortalità e natalità della popolazione (che supponiamo costanti) all’istante t muoiono mp(t) batteri e ne nascono np(t). In generale, sappiamo che il tasso di crescita di una quantità dipendente dal tempo è semplicemente la derivata prima della quantità stessa. Ne segue che la funzione p deve soddisfare l’equazione differenziale (1)
p′ (t) = np(t) − mp(t) = kp(t),
dove abbiamo posto n−m = k (il tasso percentuale di crescita di p). Questo modello è noto come la legge di Malthus (si veda il riquadro a pagina 5). Dobbiamo quindi trovare una soluzione della precedente equazione che soddisfi anche la condizione iniziale p(0) = p0 . Ovviamente la funzione p(t) ≡ 0 soddisfa le nostre richieste quando p0 = 0: stiamo semplicemente dicendo che in assenza di batteri all’istante t = 0 non ne possono nascere di nuovi! Supponiamo perciò p0 > 0 e cerchiamo delle soluzioni dell’equazione che non si annullino. Data la presenza di p′ , per determinare p ci aspettiamo di dover eseguire una qualche operazione di integrazione. Se supponiamo p(t) , 0 per ogni t, possiamo dividere i due membri della (1) per p(t) ottenendo p′ (t) = k. p(t) Il Lettore attento avrà già riconosciuto a primo membro la derivata della funzione ln |p(t)|. Otteniamo Z Z ′ p (t) dt = k dt = kt + C. ln |p(t)| = p(t) La presenza della costante arbitraria di integrazione ci dice che l’equazione (1) ha infinite soluzioni; per selezionare quella richiesta possiamo sfruttare la condizione iniziale. Sostituiamo perciò t = 0 e p(0) = p0 > 0 nella precedente equazione ottenendo ln p0 = C. Abbiamo perciò ln |p(t)| = kt + ln p0 ,
Stiamo facendo qui l’ipotesi che p
sia una funzione derivabile. Poiché la funzione p(t) rappresenta un numero di individui, la dovremmo supporre a valori interi. Ne seguirebbe che p, quando non costante, non sarebbe di certo una funzione continua, né tantomeno derivabile. Il fatto di assumere, come facciamo, che p assuma valori non necessariamente interi implica che p sia un’approssimazione del numero di individui.
Al
momento non c’è motivo per ritenere che se p0 , 0 allora p(t) , 0 per ogni t (cioè che la popolazione non possa estinguersi). Ritroveremo tale risultato a posteriori, dopo aver risolto l’equazione.
Eseguendo il cambiamento di va-
riabili P = p(t) otteniamo dP = p′ (t) dt e quindi Z ′ Z p (t) 1 dt = dP p(t) P = ln |P| + C
= ln |p(t)| + C.
In altre
parole, per prevedere l’evoluzione di un fenomeno non è sufficiente sapere come si evolve, ma serve conoscere il suo stato iniziale.
|p(t)| = ekt+ln p0 = ekt eln p0 = p0 ekt
e, ricordando che il numero di individui di una popolazione non può essere negativo, otteniamo la soluzione cercata: p(t) = p0 ekt .
Perciò p(0) = p0 .
O
meglio scartando la soluzione (negativa) p(t) = −p0 ekt , che non soddisfa p(0) = p0 .
§ 1. Equazioni differenziali e modelli
La popolazione dunque aumenta esponenzialmente se k > 0, cioè se il tasso di natalità è maggiore di quello di mortalità e si estingue esponenzialmente quando si verifica la situazione opposta; nel caso, estremamente improbabile, in cui natalità e mortalità si compensino esattamente (k = 0), la popolazione rimane costante nel tempo (si veda la Figura I.1). La situazione è sostanzialmente analoga se supponiamo che i tassi di natalità e mortalità varino nel tempo, ad esempio per effetto dell’alternanza luce–buio o del susseguirsi delle stagioni (si veda anche l’Esercizio 1 a pagina 29). Il modello in cui il tasso percentuale di crescita di p è costante, vale a dire quando p′ (t)/p(t) = k, è realistico solo in condizioni ideali (ambiente illimitato, nutrimento adeguato, . . . ). Se le risorse sono limitate è ragionevole attendersi che la popolazione possa crescere esponenzialmente solo in presenza di pochi individui, e comunque mai arbitrariamente. Possiamo modificare il nostro modello supponendo che il tasso percentuale di crescita non sia costante, ma diminuisca al crescere di p. Una possibile scelta è richiedere che p soddisfi l’equazione
3
Abbiamo veramente risolto il pro-
blema di partenza? In effetti abbiamo trovato l’espressione di una soluzione, ma a priori potrebbero essercene delle altre. Come vedremo può capitare di avere diverse soluzioni per la stessa equazione differenziale con lo stesso dato iniziale, anche se non è questo il caso (si veda a questo proposito l’Esercizio 25 a pagina 31). Quando l’equazione modella un fenomeno reale è auspicabile che ad ogni dato iniziale corrisponda una unica soluzione.
p′ (t) = k − hp(t), p(t) o equivalentemente (2)
p′ (t) = p(t)(k − hp(t)),
dove k, h sono costanti positive. Questa equazione è detta equazione logistica; venne proposta dal matematico belga Pierre-François Verhulst nel XIX secolo come modello per studiare la crescita della popolazione mondiale (si veda il riquadro a pagina 5). Risolveremo nei dettagli l’equazione logistica nell’Esercizio (I.1) a pagina 18, per ora ci limitiamo a descriverne alcune proprietà qualitative. Osserviamo innanzitutto che le funzioni costanti p(t) ≡ 0 e p(t) ≡ k/h risolvono l’equazione. Queste soluzioni sono dette di equilibrio, nel senso che se il dato iniziale p0 vale 0 oppure k/h allora il numero di individui non varia nel tempo. Se 0 < p0 < k/h allora il secondo membro della (2) è positivo, perciò p′ (0) > 0 e la popolazione cresce; viceversa se p0 > k/h, p′ (0) < 0 e la popolazione decresce. Notiamo che, in entrambi i casi, se la popolazione si avvicina alla quantità k/h, p′ tende a zero, cioè la popolazione tende a stabilizzarsi. Dunque ci aspettiamo che le soluzioni dell’equazione logistica abbiano grafici del tipo illustrato in Figura I.1 (a destra). La quantità k/h viene detta capacità dell’ambiente.
Equazioni del moto Consideriamo un oggetto libero di muoversi lungo una retta, ad esempio l’asse delle x di un piano cartesiano, ed indichiamo con x(t) la sua posizione all’istante t. Allora la sua velocità è definita come tasso di variazione della posizione, l’accelerazione come tasso di variazione della velocità: v(t) = x′ (t),
a(t) = v′ (t) = x′′ (t).
Altri modelli di crescita
delle popolazioni sono descritti e studiati negli Esercizi 8 e 9 alla fine del capitolo.
Infatti
queste due costanti sono quelle che annullano il secondo membro e allo stesso tempo hanno ovviamente derivata nulla.
4
Equazioni differenziali
F I.1: i grafici a sinistra rappresentano il numero di individui di una popolazione p(t), che si evolve secondo la legge di Malthus, p′ (t) = kp(t). Abbiamo supposto che al tempo t = 0 ci fossero 1000 individui e considerato k = 1, k = 0 e k = −1. A destra invece alcune soluzioni dell’equazione logistica, p′ (t)/p(t) = k − hp(t), quando k = 1, k/h = 1000, al variare del numero di individui al tempo t = 0.
In assenza di attrito, se l’oggetto è sottoposto ad una forza di intensità costante f (diretta lungo l’asse x) allora la sua accelerazione è costante ed è data dalla Legge di Newton, ovvero x′′ (t) = a(t) ≡
f . m
Si intende
“l’intensità dell’accelerazione”, infatti l’accelerazione è un vettore parallelo alla forza, quindi diretto lungo l’asse x.
Integrando successivamente deduciamo x′ (t) = v(t) =
f t + C1 m
e
x(t) =
f 2 t + C1 t + C2 , 2m
con C1 e C2 costanti arbitrarie. Per determinarle abbiamo bisogno di conoscere dei dati supplementari. Ad esempio possiamo fissare la posizione e la velocità del corpo ad un certo istante t0 ; supponendo t0 = 0 e imponendo x(0) = x0 , v(0) = v0 otteniamo C1 = v0 ,
C2 = x0
e quindi x(t) =
In questo
caso per determinare il moto dell’oggetto, cioè per selezionare una soluzione dell’equazione di partenza, abbiamo bisogno di due condizioni, cioè di tante condizioni quante sono le costanti di integrazione. Risulta naturale imporle misurando la posizione x e la velocità x′ nello stesso istante t0 di inizio dell’esperimento.
f 2 t + v0 t + x0 . 2m
Se la forza f (t) dipende dal tempo si può procedere allo stesso modo a patto di saper calcolare gli integrali coinvolti. Un caso frequente che non è trattabile come i precedenti è quello in cui la forza che agisce sull’oggetto dipende dalla posizione e/o dalla velocità dell’oggetto stesso, che sono incognite. Supponiamo per esempio che la forza sia esercitata da una molla e che il corpo sia in posizione di
OttenendoZ
t
x′ (t) = v(t) = e
Z
t
s
x(t) = 0
f (s) ds + v0 0
Z 0
! f (u) du ds + v0 t + x0 .
§ 1. Equazioni differenziali e modelli
Malthus e Verhulst: la nascita della dinamica delle popolazioni La prima versione di An Essay on the Principle of Population fu pubblicata in forma anonima nel 1798. L’autore fu presto identificato nel reverendo inglese Thomas Robert Malthus (1766–1834). Anche se questo non è il primo libro sullo studio della teoria delle popolazioni è senza dubbio il più celebre. L’autore prende spunto da due postulati (quelli con cui abbiamo aperto questo capitolo) e ne ricava una teoria quantitativa per lo sviluppo della popolazione umana: “Assuming then my postulata as granted, I say, that the power of population is indefinitely greater than the power in the earth to produce subsistence for man. Population, when unchecked, increases in a geometrical ratio”. Nel linguaggio odierno, le argomentazioni di Malthus asseriscono che la crescita di una popolazione, se incontrollata, è di tipo esponenziale, mentre l’economia agraria cresce solo in modo lineare; se ciò avviene per un sufficiente periodo di tempo, la crescita della popolazione sopravanza quella delle risorse. Da questo Malthus conclude che la crescita della popolazione umana viene naturalmente controllata dalla miseria, dal vizio e simili. Ogni fase di crescita incontrollata (come potrebbe accadere nel caso di emigrazione in nuove colonie, come il continente americano ai tempi di Malthus, oppure in seguito a guerre ed epidemie) deve essere seguita da una “cata-
5
strofe” (la catastrofe malthusiana, appunto) che quindi può essere vista come direttamente causata dalla crescita indiscriminata della popolazione. Uno degli effetti del libro di Malthus fu quello di alimentare la discussione sulla grandezza della popolazione britannica, fino a portare al Census Act del 1800, che istituì il censimento decennale degli abitanti della Gran Bretagna (tuttora in vigore). Nonostante le sue deduzioni, Malthus non traduce mai le sue leggi in termini strettamente matematici. L’articolo fondante della dinamica delle popolazioni può essere considerato la breve nota “Notice sur la loi que la population suit dans son accroissement”, pubblicata dal matematico belga Pierre François Verhulst (1804–1849) nel 1838. Verhulst traduce in termini matematici, probabilmente per la prima volta, la legge di Malthus come l’equazione (1). Osserva poi che la velocità di crescita della popolazione è diminuita dalla sua stessa crescita, e propone come più semplice dei modelli l’equazione (2), chiamando le sue soluzioni curve logistiche. Negli anni successivi, Verhulst approfondirà ulteriormente lo studio dei modelli da lui proposti, arrivando a prevedere la soglia massima raggiungibile dalla popolazione del Belgio in nove milioni e quattrocentomila individui (la popolazione attuale è di circa dieci milioni). [J. Mawhin, The legacy of Pierre-François Verhulst and Vito Volterra in population dynamics.]
equilibrio in x = 0. Dalla Legge di Hooke, secondo cui la forza elastica di richiamo è proporzionale alla distanza del corpo dalla posizione di equilibrio, abbiamo, indicando con k > 0 la costante elastica della molla, fmolla = −kx e quindi mx′′ (t) = −kx(t). Oltre a quella legata alla presenza della molla, altre forze potrebbero agire sul corpo, ad esempio la forza d’attrito fattrito = −γx′
Basandoci sull’esempio fisico del-
la molla, possiamo cercare di indovinare l’espressione delle soluzioni dell’equazione differenziale qui a lato, che ponendo ω2 = k/m diventa x′′ (t) = −ω2 x(t). Visto che il corpo compie oscillazioni periodiche è naturale provare a vedere se funzioni del tipo sin t o cos t non risolvano l’equazione. Ciò è vero soltanto se ω = 1. Più in generale le funzioni sin(ωt) e cos(ωt) sono soluzioni. La quantità ω assume quindi il significato di frequenza (propria) di oscillazione. Di nuovo, è necessario chiedersi se le funzioni periodiche di frequenza ω siano le uniche soluzioni o ve ne possano essere altre.
6
Equazioni differenziali
Prede e predatori Vito Volterra (1860–1940) è uno dei maggiori matematici italiani. È considerato, fra l’altro, uno dei padri fondatori dell’Analisi Funzionale, disciplina che trasferisce l’oggetto di studio dalla singola funzione reale di variabile reale agli spazi di funzioni, e che è a tutt’oggi campo di una intensa ricerca in matematica. Fu un personaggio di spicco nella politica scientifica e culturale, tanto da essere nominato senatore del Regno da Giolitti nel 1905. Volterra aveva sempre mostrato interesse per le applicazioni della matematica alla biologia e i suoi studi sulla dinamica delle popolazioni rappresentano una pietra miliare nella nascita del programma scientifico della biologia matematica. Lo zoologo Umberto D’Ancona, genero di Volterra, aveva compiuto degli studi statistici sulle popolazioni dei pesci dell’Adriatico, rilevando un aumento della percentuale dei pesci predatori sul totale del pescato negli anni immediatamente successivi alla prima guerra mondiale; e aveva ipotizzato che ciò fosse dovuto all’interruzione della pesca causata dalla guerra navale. Volterra elaborò una teoria generale della convivenza di un numero qualsiasi di specie animali in competizione fra di loro, a cui diede il nome di teoria matematica della lotta per la vita. Il modello di base - che descrive la coesistenza fra una specie di prede e una di predatori - consisteva in un sistema di due equazioni differenziali non lineari, oggi note come equazioni di Lotka– Volterra (in quanto introdotte contemporaneamente dallo statistico statunitense Alfred J. Lotka). Dall’analisi di questo modello, che studieremo nel Capitolo VIII a pagina 437, Volterra ricavò tre leggi. La prima asserisce che le densità delle due popolazioni hanno un andamento ciclico, cioè sono funzioni periodiche
del tempo. La seconda legge stabilisce che le medie della densità delle due popolazioni in un periodo T non dipendono dai valori iniziali. La terza legge dimostra che un prelievo indiscriminato delle due popolazioni (come avviene nella pesca) determina un aumento del numero delle prede e una diminuzione del numero dei predatori (si veda a questo proposito l’Esercizio 42 a pagina 455). In tal modo, veniva mostrata la validità dell’ipotesi di D’Ancona. La terza legge di Volterra ha avuto un’applicazione spettacolare all’entomologia agraria, confermando l’ipotesi, che già era stata avanzata sulla base delle osservazioni empiriche, che il ricorso alla lotta biologica sia più efficace dell’uso degli insetticidi. Basti pensare a un ecosistema composto di due specie: insetti fitofagi ed insetti entomofagi che si nutrono dei primi. Il risultato di Volterra suggerisce che il ricorso agli insetticidi può essere controproducente. Difatti, trattandosi di un prelievo indiscriminato di entrambe le specie (una sorta di pesca), esso produrrà un incremento delle prede (ovvero degli insetti dannosi per le piante) e una diminuzione dei benefici predatori. [Vito Volterra, Variazioni e fluttuazioni del numero d’individui in specie animali conviventi, Atti della R. Accademia nazionale dei Lincei. Memorie della Classe di scienze fisiche, matematiche e naturali, (VI) 2 (1926), p. 31-113.] Il Regio Decreto n. 1227 del 28 agosto 1931 dispose che i professori di ruolo prestassero giuramento di fedeltà alla Patria e al Regime fascista. Il 18 novembre Vito Volterra, invitato a presentarsi dal Rettore dell’Università per il giuramento, così espresse il suo fermo rifiuto: «Sono note le mie idee politiche, per quanto esse risultino esclusivamente dalla mia condotta nell’ambito parlamentare, la quale è tuttavia insindacabile in forza all’Art. 51 dello Statuto fondamentale del Regno. La S. V. Ill.ma comprenderà quindi come io non possa in coscienza aderire all’invito da Lei rivoltomi [...] relativa al giuramento dei professori». Conseguentemente, il 29 dicembre Vito Volterra fu licenziato.
(γ > 0 è il coefficiente di attrito dinamico) oppure una generica forza esterna festerna = f (t). La forza risultante è data dalla somma di tutti questi contributi, perciò x(t) soddisfa la relazione (3)
mx′′ (t) = −kx(t) − γx′ (t) + f (t).
In questa situazione non possiamo, almeno a prima vista, procedere con delle semplici integrazioni che ci permettano di calcolare la posizione
§ 2. Equazioni a variabili separabili
x(t). Vedremo nel seguito del capitolo come trattare questo genere di equazioni.
Equazioni differenziali
7
In
particolare studieremo le soluzioni dell’equazione (3) negli Esercizi (I.7) e (I.8), svolti alla fine del capitolo.
Una relazione che coinvolge una funzione incognita ed alcune delle sue derivate è detta equazione differenziale. La più semplice delle equazioni differenziali è y′ (t) = f (t) dove f è una funzione nota. Sappiamo già che l’insieme delle soluzioni dell’equazione è l’integrale indefinito Z y(t) = f (t) dt = F(t) + C , F′ = f . L’ordine dell’equazione è quello della derivata di ordine maggiore che vi compare. Per esempio l’equazione (1) è di primo ordine, la (3) di secondo. In entrambe queste equazioni la variabile indipendente è t e rappresenta il tempo. Una soluzione dell’equazione differenziale è una funzione che verifica l’equazione. Nella gran parte dei contesti è naturale richiedere che la soluzione sia continua su un intervallo di definizione. Ad esempio le restrizioni della funzione y(x) = −1/x sugli intervalli (−∞, 0) e (0, +∞) sono due diverse soluzioni dell’equazione y′ (x) = y2 (x). Questa richiesta permette di evitare il problema di definire la soluzione successivamente all’occorrenza di fenomeni “catastrofici”, quali le discontinuità, che pure sono di interesse interpretativo dal punto di vista delle applicazioni. Ci aspettiamo dagli esempi visti finora che l’integrale generale di un’equazione differenziale, cioè l’insieme di tutte le sue soluzioni, dipenda tipicamente da una (o più) costanti di integrazione.
Se per
esempio f è una funzione
continua.
Quindi in particolare una soluzio-
ne ammette almeno tante derivate quanto è l’ordine dell’equazione. Abbiamo già visto nel primo volume come risulti opportuno definire la primitiva di una funzione solo su un intervallo e non su un dominio generico. Dato il legame tra le equazioni differenziali ed il calcolo integrale non stupisce che la richiesta venga ripetuta anche in questo contesto.
Per i fenomeni catastrofici, da ad esempio l’Esercizio pagina 30.
si ve14 a
§ 2. Equazioni a variabili separabili Consideriamo l’equazione differenziale y′ (t) = ty2 (t) e, in prima battuta, osserviamo che la funzione nulla y ≡ 0 risolve l’equazione. Ci proponiamo quindi di cercare le soluzioni dell’equazione che non si annullano; a tal fine se supponiamo y(t) , 0 e dividiamo per y2 (t) entrambi i membri otteniamo y′ (t) = t. y2 (t)
Al
solito, a priori non abbiamo motivo per ritenere che ci siano soluzioni che non si annullano mai.
8
Equazioni differenziali
Notiamo che il termine a sinistra dipende solo da y e dalla sua derivata, a destra invece rimane una funzione della variabile indipendente t. Integrando ora rispetto a t si ha Z ′ Z y (t) dt = t dt, y2 (t)
Stiamo
da cui
Nel primo integrale abbiamo ese-
1 1 − = t2 + C , y(t) 2
C ∈ R.
separando la variabile dipendente da quella indipendente (nel senso che non appaiono contemporaneamente nello stesso membro dell’equazione).
guito il cambiamento si variabili Y = y(t) da cui dY = y′ (t) dt e Z Z ′ y (t) dY 1 dt = = − + C. Y y2 (t) Y2
Poiché −1/y è invertibile (laddove è definita), possiamo esplicitare la funzione incognita y e concludere che le soluzioni dell’equazione di partenza che non si annullano sono della forma y(t) = −
1 , +C
t2 /2
C ∈ R.
Più in generale, ci proponiamo di studiare un’equazione differenziale del tipo (4)
y′ = 1(t)h(y)
con 1, h continue. Un’equazione di questo tipo viene detta equazione a variabili separabili. Supponiamo dapprima che il valore y¯ annulli la funzio¯ = 0; allora la funzione costantemente uguale a y¯ è una sone h, cioè h( y) luzione (costante) dell’equazione (4). Per determinare le soluzioni dell’equazione che non intersecano le soluzioni costanti, supponiamo h(y) , 0 e dividiamo entrambi i termini dell’equazione per h(y); otteniamo ′
y (t) = 1(t). h(y(t))
Si
osservi che la variabile indipendente, t, e quella dipendente, y, compaiono come argomento di due funzioni diverse moltiplicate tra loro.
Nel
paragrafo precedente abbiamo incontrato una importante equazione a variabili separabili: l’equazione logistica (2). Rimandiamo la sua risoluzione all’Esercizio svolto (I.1).
Le
soluzioni costanti di un’equazione differenziale, in questo caso ¯ = 0, sono dette y ≡ y¯ con h( y) soluzioni (o integrali ) singolari.
Integrando rispetto alla variabile indipendente t si ha Z Z y′ (t) dt = 1(t) dt, h(y(t)) ovvero Z
1 dy = h(y)
Z 1(t) dt.
Dette ora H e G le primitive rispettivamente di 1/h e 1 dall’espressione precedente otteniamo H(y) = G(t) + C
Integrale
generale dell’equazione a variabili separabili.
§ 2. Equazioni a variabili separabili
9
con C costante arbitraria. Sarà dunque possibile esplicitare la funzione incognita y negli intervalli in cui la funzione H risulta essere invertibile. Per quanto detto la funzione ottenuta sarà una soluzione dell’equazione fin tanto che h(y(t)) , 0, cioè fino a che il suo grafico non interseca quello di una soluzione costante (fatto che si può escludere sotto opportune ipotesi, si veda l’Esercizio 27 a pagina 31). (I.1) Esempio. Riprendiamo l’equazione y′ (t) = ty2 (t); secondo la notazione introdotta, abbiamo 1(t) = t, h(y) = y2 entrambe continue su tutta la retta reale. Poiché h si annulla se (e solo se) y = 0, l’equazione ammette come (unica) soluzione costante la retta y = 0. Abbiamo già visto che le soluzioni che non si annullano sono y(t) = −1/(t2/2 + C), C ∈ R. Osserviamo che l’espressione precedente ha senso quando t2 /2 + C , 0. Quindi, poiché le soluzioni devono essere definite su intervalli, ogni soluzione√(che non si annulla) R quando C > 0, su √ √ sarà definita su tutto √ (−∞, − −2C), su (− −2C, −2C) oppure su ( −2C, +∞) quando C < 0, su (−∞, 0) oppure su (0, +∞) quando C = 0. La scelta dell’intervallo di definizione dipende da un’eventuale richiesta di passaggio per un punto del piano. Se ad esempio vogliamo che y(0) = y0 (y0 , 0) otteniamo y(0) = −
1 C
e quindi
C=−
1 . y0
2 ; possiamo quindi cony0 cludere che se y0 < 0 la soluzione trovata su tutto R mentre se p p è definita y0 > 0 lo è soltanto sull’intervallo (− 2/y0 , 2/y0).
Come vedremo nei prossimi esem-
pi, la costante C può essere calcolata associando all’equazione differenziale un dato iniziale.
F I.2: alcune soluzioni dell’equazione y′ = ty2 . Attenzione: per ogni valore di C < 0 abbiamo tre diverse soluzioni!
Imponendo
la condizione iniziale possiamo determinare la costante di integrazione C, e quindi selezionare una delle soluzioni calcolate.
La soluzione corrispondente è definita se t2 ,
(I.2) Esempio. L’equazione y′ (t) =
t 3 + cos y(t)
è a variabili separabili con 1(t) = t e h(y) = 1/(3 + cos y). Sia 1 che h sono continue su tutta la retta reale; inoltre h è strettamente positiva poiché, per ogni y, si ha cos y ≥ −1, quindi non esistono soluzioni costanti. Se dividiamo per h(y) e calcoliamo la primitiva di entrambi i termini troviamo Z Z (3 + cos y(t))y′(t) dt = t dt ovvero H(y) = 3y + sin y = t2 /2 + C. La funzione H è strettamente monotona su tutto R e quindi invertibile, ma non riusciamo a determinare una forma esplicita della sua inversa. Le soluzioni dell’equazione differenziale risultano quindi definite implicitamente. (I.3) Esempio. L’equazione a variabili separabili y′ (t) = t2 y(t)
Questo è l’intervallo più esteso, su
cui la soluzione trovata è definita, a cui appartiene l’istante iniziale t0 = 0.
Stiamo
quindi moltiplicando per 3 + cos y(t).
Infatti H′ (y) = 3 + cos y > 0.
10
Equazioni differenziali
ammette come unica soluzione costante y ≡ 0. Inoltre supponendo h(y) = y , 0 si ricava Z Z ′ y (t) t3 dt = t2 dt e quindi ln |y| = + C. y(t) 3 La funzione logaritmo è invertibile e la sua inversa è la funzione esponenziale; otteniamo perciò 3
|y(t)| = Ket
/3
,
F I.3: alcune soluzioni dell’equazione y′ = t2 y.
con K = eC > 0.
Possiamo quindi concludere che le soluzioni non nulle sono definite su 3 tutto l’asse reale e sono sempre positive, y(t) = Ket /3 , o sempre nega3 tive, y(t) = −Ket /3 . Osserviamo inoltre che le soluzioni positive sono crescenti, quelle negative decrescenti e che se y(t) è una soluzione positiva, −y(t) è una soluzione negativa. Alcune soluzioni dell’equazione sono rappresentate in Figura I.3.
§ 3. Equazioni lineari del primo ordine Iniziamo a considerare l’equazione differenziale ty′ (t) + y(t) = t. Per trovare le sue soluzioni possiamo semplicemente osservare che il termine a sinistra è la derivata di un prodotto. Infatti se poniamo f (t) = t abbiamo ty′ (t) + y(t) = ty(t) ′ |{z} |{z} f y′
f′y
e l’equazione di partenza diventa ty(t) ′ = t. Ricaviamo quindi (per t , 0) ty(t) =
t2 +C 2
=⇒
y(t) =
t C + , 2 t
C ∈ R.
Se invece consideriamo l’equazione y′ (t) + y(t) = t, apparentemente non possiamo procedere come prima, infatti il primo membro non è più la derivata di un prodotto: mancano dei coefficienti moltiplicativi ai termini y′ ed y, che giochino il ruolo rispettivamente
Questo
fatto non deve stupirci, infatti dall’equazione differenziale di partenza abbiamo che y′ ha lo stesso segno di y, poiché t2 è una quantità positiva.
§ 3. Equazioni lineari del primo ordine
11
di f ed f ′ . Possiamo tuttavia aggirare facilmente questo problema moltiplicando per f (t) = et entrambi i membri dell’equazione: otteniamo infatti h i′ et y′ (t) + et y(t) = et y(t) = et t |{z} |{z}
f (t) = et otteniamo f ′ (t) = f (t). f viene detto fattore integrante, nel senso che se moltiplichiamo l’equazione per f allora il suo primo membro diventa integrabile esplicitamente.
Scegliendo
f′y
f y′
Integrando per parti si ha infatti
da cui
Z
Z
et y(t) =
et t dt = et (t−1)+C
=⇒
y(t) = (t−1)+Ce−t ,
C ∈ R.
Z
et t dt = et t −
et dt.
Modifichiamo ora leggermente l’equazione e studiamo y′ (t) + 3y(t) = t. Nemmeno ora a sinistra abbiamo la derivata di un prodotto, e questa volta dobbiamo moltiplicare per una funzione f tale che 3 f (t) = f ′ (t). Scegliamo quindi f (t) = e3t e otteniamo h i′ e3t y′ (t) + 3e3t y(t) = e3t y(t) = e3t t, da cui
Z 3t
e y(t) =
e3t t dt =
Si osservi che stiamo sempre moltiplicando per delle funzioni che non si annullano.
1 3t e (t − 1) + C 3
ovvero y(t) =
1 (t − 1) + Ce−3t , 3
C ∈ R.
Affrontiamo ora il caso più generale, ovvero studiamo l’equazione differenziale (5)
y′ (t) − a(t)y(t) = b(t)
con a e b continue su un comune intervallo di definizione. Procedendo come negli esempi precedenti, cerchiamo un fattore integrante f (non nullo) tale che f ′ (t) = −a(t) f (t)
perché, grossolanamente parlando, i suoi membri sono polinomi di primo grado rispetto alla funzione incognita e alla sua derivata (ma non necessariamente rispetto a t). Chiariremo il concetto di linearità nel Capitolo IV, ad esso dedicato.
Moltiplichiamo
Se A(t) è una primitiva di a(t), ovvero A′ (t) = a(t), dall’equazione precedente (a variabili separabili nell’incognita f ) troviamo f (t) = e−A(t) ; moltiplichiamo quindi entrambi i membri di (5) per f (t) e otteniamo h i′ e−A(t) y′ (t) + e−A(t) (−a(t))y(t) = e−A(t) y(t) = e−A(t) b(t) | {z } | {z } f y′
Tale equazione viene detta lineare
f′y
che, ricordando che A(t) =
R
a(t) dt, è equivalente alla formula
il primo membro dell’equazione per f tale che f y′ − f ay = f y ′ = f y′ + f ′ y ovvero − f a = f ′ .
12
Equazioni differenziali
R
(6)
y(t) = e
Z b(t)e−
a(t) dt
R
a(t) dt
! dt + C ,
Integrale
generale dell’equazione lineare del primo ordine. È ovviamente lasciata al Lettore la scelta se utilizzare i propri preziosi neuroni per mandare a memoria questa formula o piuttosto il procedimento che permette di ricavarla.
C ∈ R.
(I.4) Esempio. Consideriamo l’equazione y′ (t) = −y(t) +
1 . et
Confrontandola con la (5) abbiamo a(t) = −1 e b(t) = 1/et . Dalla formula appena vista, dato che le funzioni a e b sono definite e continue su R, ci aspettiamo che lo siano anche le soluzioni. Come primitiva di a scegliamo A(t) = −t; si ha quindi eA(t) = e−t ,
e−A(t) = et
ed infine dalla formula (6) otteniamo ! ! Z Z 1 t A(t) −A(t) −t e dt + C y(t) = e b(t)e dt + C = e et t+C = t , C ∈ R. e Il grafico di alcune delle soluzioni è rappresentato in Figura I.4.
y(t) y′ (t) = + t cos t. t In questo caso abbiamo a(t) = 1/t e b(t) = t cos t. Il loro insieme comune di definizione e continuità è R r {0}; le soluzioni dell’equazione saranno quindi definite su (−∞, 0) oppure su (0, +∞). Utilizziamo la formula risolutiva (6) per calcolarle. Se cerchiamo le soluzioni su (0, +∞) otteniamo R che una primitiva della funzione a(t) è A(t) = 1/t dt = ln t, inoltre Z Z −A(t) ln(1/t) −A(t) e =e = 1/t e b(t)e dt = cos t dt = sin t + C. Z A(t)
y(t) = e
−A(t)
b(t)e
! dt + C = t(sin t + C),
di a scegliamo come costante arbitraria quella nulla: stiamo cercando un fattore integrante, non tutti i fattori integranti.
(I.5) Esempio. Troviamo ora le soluzioni dell’equazione
Quindi
Nell’integrazione
F I.4: alcune soluzioni dell’equazione y′ = −y + 1/et .
Sottolineiamo
di nuovo che questa coincidenza tra gli intervalli di continuità dei termini dell’equazione e quelli di definizione delle soluzioni è vera per le equazioni lineari, in quanto giustificata dalla formula (6), ma è falsa per equazioni generali (si veda l’Esempio (I.1) a pagina 9).
C ∈ R.
Sull’intervallo (−∞, 0) le soluzioni hanno esattamente la stessa espressione, infatti A(t) = ln(−t), e−A(t) = eln(−1/t) = −1/t, eA(t) = eln(−t) = −t, quindi y(t) = −t(− sin t + C) = t(sin t − C), con C costante arbitraria. In Figura I.5 sono rappresentati i grafici di alcune soluzioni. Notiamo che, benché a(t) non sia definita per t = 0, potremmo pensare di estendere con continuità le soluzioni trovate anche in t = 0, tutte con valore 0. Ovviamente, nel compiere questa operazione, sarebbe necessario precisare che senso dare all’equazione differenziale per t = 0.
F I.5: in figura è rappresentata la funzione y(t) = t(sin t+1) soluzione dell’equazione differenziale separatamente sugli intervalli (−∞, 0) e (0, +∞).
§ 4. Equazioni lineari del secondo ordine
13
§ 4. Equazioni lineari del secondo ordine In questo paragrafo prendiamo in considerazione le equazioni del secondo ordine del tipo ax′′ (t) + bx′ (t) + cx(t) = f (t), dove x(t) è la funzione incognita, a, b e c sono delle costanti ed f è data. L’esempio modello è quello del moto rettilineo di un corpo descritto dall’equazione (3) a pagina 6. Ci limiteremo a descrivere un metodo per determinare una classe di soluzioni, dimostreremo nel Capitolo VIII che quelle trovate sono tutte e sole le soluzioni di un’equazione lineare di secondo ordine a coefficienti costanti. Il metodo si divide in due parti, quella riguardante le cosiddette equazioni omogenee (cioè in cui f (t) ≡ 0) e quella dedicata alle equazioni non omogenee (in cui f (t) . 0).
Tali
equazioni vengono dette equazioni lineari a coefficienti costanti.
Caso omogeneo (I.6) Esempio. Consideriamo l’equazione differenziale x′′ (t) − 3x′ (t) + 2x(t) = 0. Il fatto che la somma della funzione incognita con alcune sue derivate (moltiplicate per dei coefficienti) debba essere nulla suggerisce di cercare delle soluzioni che siano proporzionali alle loro derivate. Per questo motivo ci domandiamo se xλ (t) = eλt risolva l’equazione di partenza per qualche valore di λ. Le derivate prima e seconda di xλ sono x′λ (t) = λeλt ,
2 λt x′′ λ (t) = λ e .
Un’altra
motivazione per cercare soluzioni di questo tipo viene dalle equazioni lineari di primo ordine a coefficienti costanti, infatti le soluzioni di x′ (t) + ax(t) = 0
sono tutte e sole le funzioni x(t) = ke−at , k ∈ R.
Sostituendo nell’equazione otteniamo che xλ è soluzione se e solo se λ2 eλt − 3λeλt + 2eλt = 0, ovvero (dividendo per la quantità strettamente positiva eλt ) se e solo se λ2 − 3λ + 2 = 0. Ricaviamo quindi i valori λ1 = 1, λ2 = 2, che forniscono le due soluzioni x1 (t) = et
e
x2 (t) = e2t
dell’equazione differenziale di partenza. Osserviamo inoltre che tutte le funzioni x(t) = C1 et + C2 e2t ,
C1 , C2 ∈ R
Il polinomio λ2 − 3λ + 2 viene chiamato polinomio caratteristico associato all’equazione.
14
Equazioni differenziali
sono soluzioni dell’equazione . Abbiamo così trovato una famiglia di infinite soluzioni, al variare di due costanti arbitrarie. Come vedremo nel Capitolo VIII, queste sono tutte le soluzioni dell’equazione data, e non è un caso che le costanti arbitrarie siano in numero pari all’ordine dell’equazione. Nell’esempio precedente abbiamo ricondotto la ricerca di soluzioni dell’equazione di partenza a quella delle radici del polinomio caratteristico. Il caso preso in considerazione era abbastanza favorevole, in quanto tale polinomio ammette due radici reali e distinte. Con qualche accorgimento si vede che il metodo è efficace anche quando le radici sono reali ma coincidenti, oppure addirittura complesse coniugate. (I.7) Esempio. Il polinomio caratteristico associato all’equazione lineare omogenea
La verifica è semplice; infatti x′ (t) = C1 et + 2C2 e2t , x′′ (t) = C1 et + 4C2 e2t , quindi x′′ (t) − 3x′ (t) + 2x(t) =
C1 et + 4C2 e2t − 3C1 et − 6C2 e2t + 2C1 et + 2C2 e2t = 0.
Cioè
quando il suo discriminante è strettamente positivo.
Rispettivamente
quando il discriminante è nullo oppure strettamente negativo.
x′′ (t) − 4x′ (t) + 4x(t) = 0 è λ2 − 4λ + 4 = 0 ed ammette due radici coincidenti λ1 = λ2 = 2. La funzione esponenziale x1 (t) = e2t è quindi una soluzione dell’equazione, e assieme ad essa tutte le funzioni del tipo Ce2t con C ∈ R. Seguendo l’idea intuitiva che la presenza di due derivazioni nell’equazione provochi soluzioni che dipendono da due costanti arbitrarie, ci proponiamo di trovare una seconda soluzione che non sia della forma precedente. L’idea è di non discostarci troppo da questa prima soluzione trovata e di tentare di determinare una funzione C(t), non costante, tale che ¯ = C(t)e2t x(t)
Stiamo
facendo “variare la costante arbitraria” della soluzione nota!
risolva l’equazione. Calcoliamo le derivate di x¯ x¯′ (t) = C′ (t)e2t + 2C(t)e2t , x¯′′ (t) = C′′ (t)e2t + 4C′ (t)e2t + 4C(t)e2t
Tutti
i termini contenenti C(t) e C′ (t) si elidono!
quindi, sostituendo nell’equazione, otteniamo C′′ (t)e2t = 0
=⇒
C′′ (t) = 0.
Quindi una funzione C(t) che soddisfa la nostra richiesta è C(t) = t e abbiamo così dimostrato che la funzione x2 (t) = te2t
st’equazione sono C(t) = C1 +C2 t, da cui x(t) = (C1 + C2 t) e2t ,
risolve l’equazione di partenza. Ancora una volta osserviamo che al variare di C1 , C2 ∈ R abbiamo la seguente famiglia di soluzioni x(t) = C1 e2t + C2 te2t .
In effetti tutte le soluzioni di que-
in perfetto accordo con la conclusione dell’esempio.
§ 4. Equazioni lineari del secondo ordine
15
(I.8) Esempio. Rimane da considerare il caso in cui il polinomio caratteristico ha due radici complesse. Ad esempio l’equazione x′′ (t) − 2x′ (t) + 2x(t) = 0 ammette come polinomio caratteristico λ2 − 2λ + 2 le cui radici sono λ1 = 1 + i
e
λ2 = 1 − i.
Pertanto, ragionando come nell’Esempio (I.6), otteniamo che le funzioni (a valori complessi) x˜1 (t) = e(1+i)t = et (cos t + i sin t) e
x˜2 (t) = e(1−i)t = et (cos t − i sin t)
risolvono, almeno formalmente, l’equazione. Anche tutte le funzioni del tipo x(t) = D1 x˜1 (t) + D2 x˜2 (t),
Ricordiamo la definizione di esponenziale di un numero complesso data dalla Formula di Eulero
ex+iy = ex eiy = ex (cos y + i sin y) con x, y ∈ R. A tal proposito si veda anche l’approfondimento a pagina 51.
D1 , D2 ∈ C
sono allo stesso modo soluzioni. Volendo però selezionare solo quelle a valori reali dobbiamo imporre che D1 + D2 ∈ R e i(D1 − D2 ) ∈ R, da cui ricaviamo che D1 e D2 sono numeri coniugati. Perciò, se D1 = α + iβ e D2 = α − iβ, dall’espressione precedente otteniamo
Infatti D1 x˜1 (t) + D2 x˜2 (t) = et [(D1 + D2 ) cos t + i(D1 − D2 ) sin t].
x(t) = (α + iβ)[et (cos t + i sin t)] + (α − iβ)[et (cos t − i sin t)] = 2αet cos t − 2βet sin t.
Ponendo infine C1 = 2α e C2 = −2β abbiamo la famiglia di soluzioni reali x(t) = et (C1 cos t + C2 sin t).
Possiamo ora estendere il metodo risolutivo visto negli Esempi (I.6), (I.7) e (I.8) ad una generica equazione lineare del secondo ordine a coefficienti costanti omogenea (7)
ax′′ (t) + bx′ (t) + cx(t) = 0,
a, b, c ∈ R.
Abbiamo visto che un’equazione di questo tipo ammette una famiglia di soluzioni dipendente da due parametri reali e dalle radici del polinomio caratteristico P2 (λ) = aλ2 + bλ + c. Se ∆ = b2 − 4ac, riassumiamo le situazioni che si possono presentare nella seguente tabella:
∆>0 ∆=0 ∆<0
radici di P2 (λ) λ1 , λ2 λ1 = λ2 λ1,2 = α ± iβ
famiglia di soluzioni al variare di C1 , C2 ∈ R x(t) = C1 eλ1 t + C2 eλ2 t x(t) = (C1 + C2 t)eλ1 t x(t) = eαt [C1 cos(βt) + C2 sin(βt)]
Supponiamo a , 0. Se a = 0 l’equazione è in realtà una lineare del primo ordine, che abbiamo imparato a risolvere nel paragrafo precedente.
16
Equazioni differenziali
A questo punto ci si può chiedere: esistono soluzioni diverse da quelle trovate? La risposta è negativa, ma al momento non abbiamo modo di giustificarla. Per ora ci limitiamo ad affermare che tutte le soluzioni di un’equazione lineare di secondo ordine omogenea a coefficienti costanti sono quelle della tabella precedente; vedremo una giustificazione rigorosa di questo fatto nel Capitolo VIII.
Caso non omogeneo Se f è una funzione continua, ci chiediamo quando, ed eventualmente in che modo, possiamo determinare le soluzioni dell’equazione non omogenea (o completa) (8)
ax′′ (t) + bx′ (t) + cx(t) = f (t),
f (t) viene spesso detto termine noto dell’equazione.
a, b, c ∈ R.
Come prima cosa osserviamo che se x1 (t) e x2 (t) sono due soluzioni di (8) allora la loro differenza risolve l’equazione omogenea associata (7). A questo punto se supponiamo di conoscere una soluzione particolare dell’equazione completa, xp , abbiamo il seguente risultato (Esercizio 34 ): x è soluzione di (8) ⇐⇒ x = xo + xp , con xo soluzione di (7).
La
dimostrazione di questo fatto è lasciata al Lettore, si veda l’Esercizio 33 al fondo del capitolo.
Questa proprietà è un caso particolare del Principio di sovrapposizione (si veda l’Esercizio 37 ).
Di conseguenza, note tutte le soluzioni dell’equazione (7), per determinare tutte quelle dell’equazione (8) è sufficiente trovarne una particolare e sommarla all’integrale generale dell’equazione omogenea associata. Concludiamo questo paragrafo descrivendo in che modo, per alcune f particolari, è possibile trovare la soluzione xp per “similitudine” con la funzione f . Per un metodo più generale rimandiamo all’Esercizio 42 e al Capitolo VIII. (I.9) Esempio. Consideriamo l’equazione differenziale x′′ (t) − x(t) = e2t . L’equazione omogenea associata x′′ (t) − x(t) = 0 ha polinomio caratteristico P2 (λ) = λ2 − 1, perciò ammette la famiglia di soluzioni C1 et + C2 e−t , con C1 , C2 ∈ R. Per una soluzione dell’equazione non omogenea, la differenza fra la sua derivata seconda e la funzione stessa deve essere uguale e2t ; è quindi sensato cercare una soluzione del tipo xp (t) = Ce2t . 2t Derivando otteniamo x′p (t) = 2Ce2t e x′′ p (t) = 4Ce ; sostituendo nell’equazione abbiamo 2t 2t 2t e2t = x′′ p (t) − xp (t) = 4Ce − Ce = 3Ce
La funzione e2t , come già osservato, ha la proprietà di rimanere proporzionale a se stessa quando la si deriva un numero qualsiasi di volte.
§ 4. Equazioni lineari del secondo ordine
17
da cui si ricava C = 1/3. Abbiamo quindi trovato che xp (t) = 1/3 e2t è una soluzione dell’equazione di partenza. Possiamo dunque concludere che tutte le soluzioni dell’equazione sono 1 x(t) = C1 et + C2 e−t + e2t , 3
C1 , C2 ∈ R.
(I.10) Esempio. Se modifichiamo il termine noto dell’equazione dell’esempio precedente e consideriamo x′′ (t) − x(t) = et , ci accorgiamo che, in questo caso, è del tutto inutile cercare di determinare una soluzione particolare nella famiglia di funzioni Cet . Proviamo invece a determinarne una nella forma xp (t) = Ctet . t t Otteniamo x′p (t) = C(et + tet ) e x′′ p (t) = C(2e + te ) da cui t t t t x′′ p (t) − xp (t) = C(2e + te ) − Cte = 2Ce .
Se imponiamo che xp soddisfi l’equazione otteniamo 2Cet = et , quindi C = 1/2. Concludiamo che le soluzioni dell’equazione sono 1 x(t) = C1 e + C2 e + tet , 2 t
−t
C1 , C2 ∈ R.
(I.11) Esempio. Prendiamo ora in considerazione l’equazione dell’Esempio (I.7), il cui polinomio caratteristico ammette due radici reali coincidenti uguali a 2. Se ora aggiungiamo come termine noto proprio la funzione e2t otteniamo l’equazione completa x′′ (t) − 4x′ (t) + 4x(t) = e2t ; questa volta non è nemmeno più sufficiente cercare xp del tipo Cte2t , infatti questa sarebbe già una soluzione dell’equazione omogenea. In questo caso proviamo a determinare una soluzione nella famiglia xp (t) = Ct2 e2t . Derivando otteniamo x′p (t) = C(2te2t + 2t2 e2t )
e
2t 2t 2 2t x′′ p (t) = C(2e + 8te + 4t e )
e quindi sostituendo nell’equazione di partenza C(2e2t + 8te2t + 4t2 e2t ) − 4C(2te2t + 2t2 e2t ) + 4Ct2 e2t = e2t ovvero 2C + 8Ct + 4Ct2 − 8Ct − 8Ct2 + 4Ct2 = 1 da cui ricaviamo C = 1/2. Concludiamo quindi che le soluzioni dell’equazione completa studiata sono 1 x(t) = C1 + C2 t + t2 e2t . 2
Infatti
le funzioni di questa famiglia sono già soluzioni dell’equazione omogenea associata al problema, perciò sostituite a primo membro fanno sempre 0! Ispirandoci a quanto fatto nell’Esempio (I.7), possiamo utilizzare il metodo della variazione della costante arbitraria e cercare una soluzione della forma x¯p (t) = C(t)et .
Otteniamo l’equazione C′′ + 2C′ = 1, da cui ricaviamo che C(t) = t/2 è una soluzione.
18
Equazioni differenziali
Dai tre esempi visti deduciamo che per determinare una soluzione particolare di un’equazione completa con termine noto del tipo eλt è fondamentale sapere se λ è uno zero del polinomio caratteristico, P2 , e quale è la sua molteplicità. Con ragionamenti del tutto analoghi si riescono anche a determinare soluzioni particolari di equazioni con termine noto contenente funzioni seno e/o coseno, moltiplicate eventualmente per funzioni esponenziali. In questi casi possiamo determinare una soluzione particolare secondo la seguente tabella. f (t)
xp (t)
Qk (t)
aeλt
Q˜ k (t)
se P2 (0) , 0
tQ˜ k (t)
se 0 è radice di P2 di molt. 1
t2 Q˜ k (t)
se 0 è radice di P2 di molt. 2
Aeλt
se P2 (λ) , 0
Ateλt
se λ è radice di P2 di molt. 1
At2 eλt
se λ è radice di P2 di molt. 2
eαt [A sin(βt) + B cos(βt)] se P2 (α ± iβ) , 0
aeαt cos(βt) (o sin(βt))
teαt [A sin(βt) + B cos(βt) se α ± iβ sono radici di P2 .
È inoltre possibile estendere questi ragionamenti al caso in cui le funzioni esponenziali, seno, coseno sono moltiplicate per dei polinomi, come si può vedere nell’Esercizio (I.9) svolto a pagina 27.
Esercizi (I.1) È data l’equazione logistica p′ (t) = kp(t) − hp2 (t), con la condizione iniziale p(0) = p0 . Determinare p(t) (per t > 0), supponendo che k e h siano due costanti positive. Soluzione. Dobbiamo risolvere l’equazione a variabili separabili p′ (t) = p(t)(k − hp(t)). Si osserva immediatamente la presenza di due soluzioni costanti p≡0
e
p≡
k . h
Supponendo quindi p(t) , 0 e p(t) , k/h dividiamo entrambi i termini dell’equazione per p(t)(k − hp(t)) ed integriamo rispetto alla variabile
Qk (t)
grado k.
e Q˜ k (t) sono polinomi di
Osserviamo che quando 0 è radice doppia del polinomio caratteristico l’equazione differenziale può essere risolta integrando due volte!
Esercizi
19
indipendente t Z dp = t + C. p(k − hp) Otteniamo quindi p ln = k(t + C) k − hp
Una =⇒
p(t) = Dekt , k − hp(t)
D , 0,
da cui ricaviamo p(t) = Dekt k − hp(t)
⇐⇒ ⇐⇒
k = −hDekt k − hp(t) h 1 p(t) = 1 − k 1 + hDekt
1−
primitiva del termine a sinistra è # Z Z " dp 1 h 1 = + dp p(k − hp) k p k − hp 1 ln |p| − ln |k − hp| = k |p| 1 = ln . k |k − hp|
e concludiamo (9)
p(t) =
kDekt . 1 + hDekt
Imponendo la condizione iniziale p(0) = p0 possiamo quindi ricavare la costante di integrazione D D=
p0 . k − hp0
Osserviamo che la soluzione trovata è definita quando il suo denominatore è non nullo ovvero 1 + hDekt , 0; sostituendo il valore della costante di integrazione D otteniamo la condizione ekt , 1 − k/(hp0 ) che è sempre verificata quando t > 0 essendo 1 − k/(hp0 ) < 1. Quindi la soluzione trovata è definita su [0, +∞) e si ha
Ricordiamo
che siamo supponendo p(t) , k/h, quindi in particolare p0 , k/h.
k kDekt = . t→+∞ 1 + hDekt h
lim p(t) = lim
t→+∞
Possiamo quindi concludere che quando lasciamo evolvere una popolazione con p0 individui all’istante iniziale secondo la legge logistica (con h, k costanti strettamente positive) essa tenderà a stabilizzarsi verso un numero di circa k/h individui, che rappresenta la capacità dell’ambiente. Dall’espressione di p′ , p′ (t) = p(t)(k − hp(t)), potevamo già dedurre che le soluzioni dell’equazione sarebbero state delle funzioni (strettamente) crescenti quando p(t) ∈ (0, k/h), decrescenti se p(t) > k/h. i grafici di alcune soluzioni sono rappresentati in Figura I.1 (a destra), pagina 4. (I.2) Un serbatoio con una capacità di 1000 lt viene riempito di acqua in cui vengono sciolti 5 kg di sale. Una soluzione di acqua e sale al 2% entra nel serbatoio con una velocità di 10 lt/min. La soluzione viene continuamente rimescolata ed esce dal serbatoio alla stessa velocità. Quanto sale contiene il serbatoio dopo 5 minuti?
Per uno studio completo della famiglia di soluzioni trovata, rimandiamo all’Esercizio 6 a pagina 29.
20
Equazioni differenziali
Soluzione. La variazione della quantità di sale presente nel serbatoio è uguale alla differenza tra la sua velocità di entrata, ve , e quella di uscita, vu . Detta s(t) la quantità di sale al tempo t, misurata in kg, l’equazione che descrive il fenomeno è s′ (t) = ve (t) − vu (t). Osserviamo che la quantità di sale per ogni litro di soluzione al tempo t è s(t)/1000. Le velocità di entrata e di uscita sono rispettivamente ve (t) =
1 [kg/min] 5
e
vu (t) =
s(t) [kg/min]. 100
Infatti, la soluzione entrante contiene il 2% di sale, quindi ogni minuto entrano 0,2 kg di sale, disciolto in 10 lt di acqua; inoltre, essendo s(t)/1000 la quantità di sale per ogni litro di soluzione al tempo t il sale uscente ogni minuto è pari a 10 volte questa quantità. Otteniamo s′ (t) =
1 (20 − s(t)). 100
L’equazione differenziale trovata è sia lineare di primo ordine sia a variabili separabili; la risolviamo nel secondo modo, dopo aver osservato che la soluzione da determinare deve verificare la condizione iniziale s(0) = 5. La soluzione costante s(t) ≡ 20 non è dunque quella cercata. Supponiamo quindi s(t) , 20, dividiamo per 20 − s(t) e, dopo aver calcolato la primitiva di entrambi i termini abbiamo ln |20 − s(t)| = −
1 t+C , C ∈ R 100
⇒
20 − s(t) = Ke−t/100 , K > 0.
Ricordando che s(0) = 5 otteniamo K = 15 e quindi s(t) = 20 − 15e−t/100 ; in particolare dopo 5 minuti nel serbatoio sono presenti 20 − 15e−1/20 ≃ 5, 7 kg di sale. (I.3) (Equazione omogenea) Determinare le soluzioni dell’equazione differenziale y′ (t) =
y(t) − e y(t)/t . t
Soluzione. Osserviamo che l’equazione è priva di significato quando t = 0, le sue soluzioni non saranno dunque definite in t = 0. Effettuiamo ora la sostituzione z(t) =
y(t) t
Essendo
s(0) < 20 e avendo supposto s(t) , 20, abbiamo potuto togliere il valore assoluto, infatti 20 − s(t) > 0 laddove s(t) è definita.
Esercizi
21
e, derivando la funzione z rispetto alla variabile indipendente t, otteniamo z′ (t) =
y′ (t) y(t) z(t) − ez(t) z(t) − 2 = − t t t t
=⇒
z′ (t) = −
ez(t) . t
Abbiamo così trasformato l’equazione differenziale di partenza in un’equazione differenziale a variabili separabili, siamo quindi in grado di determinare la funzione incognita z(t) e da questa ricavare y(t) = tz(t). L’equazione trovata non ha soluzioni costanti. Dividendo per −ez(t) e integrando otteniamo Z Z dt −z ⇐⇒ e−z(t) = ln |t| + C , C∈R − e dz = t
Più
in generale, per risolvere un’equazione del tipo ! y(t) y′ (t) = f t
si effettua la sostituzione y(t) z(t) = t per ricondursi all’equazione differenziale a variabili separabili f (z) − z . t Dopo aver risolto quest’ultima si trovano le soluzioni del problema iniziale sostituendo y(t) = tz(t). z′ =
e quindi z(t) = − ln(ln |t| + C),
definita se |t| > e−C .
Le soluzioni del problema di partenza quindi sono y(t) = −t ln(ln |t| + C) e sono definite su (−∞, −e−C) oppure su (e−C , +∞); in Figura I.6 ne sono rappresentate alcune. (I.4) Una tazza di caffè alla temperatura di 75◦ C viene posta in una stanza a 25◦ C. Supponendo che il raffreddamento segua la Legge di Newton, secondo la quale la velocità di raffreddamento è proporzionale alla differenza di temperatura tra il corpo e l’ambiente che lo circonda, e sapendo che nei primi 5 minuti la tazza si è raffreddata di 25◦ C scrivere l’equazione differenziale che descrive il raffreddamento del caffé. Determinare dopo quanto tempo il caffè raggiunge i 35◦ C. Soluzione. Se chiamiamo T la temperatura del caffé (supponiamo che la temperatura del liquido sia uniforme) la legge di Newton assicura l’esistenza di una “costante di raffreddamento” K < 0 tale che T′ (t) = K(T(t) − 25). Ancora una volta siamo di fronte ad un’equazione differenziale al tempo stesso a variabili separabili e lineare di primo ordine. Applichiamo questa volta la formula risolutiva vista a pagina 12, con a(t) = K e b(t) = −25K per determinare T(t) ! Z Kt −Kt T(t) = e −25Ke dt + C = 25 + CeKt . Per determinare la costante di integrazione C usiamo la condizione iniziale T(0) = 75, ottennendo 75 = C + 25, da cui C = 50. Per determinare
F I.6: alcune soluzioni dell’equazione omogenea y′ = y/t − ey/t .
22
Equazioni differenziali
la costante di raffreddamento utilizziamo la seconda informazione che viene fornita: dopo cinque minuti la temperatura del caffè è di 50◦ C. Abbiamo 50 = T(5) = 50e5K + 25
⇐⇒
K=−
ln 2 . 5
L’equazione differenziale che descrive il raffreddamento del caffé è quindi T′ (t) = −
ln 2 (T(t) − 25) 5
e la temperatura al tempo t è T(t) = 50e− ln 2 t/5 + 25. Per determinare t¯ > 0 tale che T(t¯) = 35 è dunque sufficiente sostituire 35 = 50e− ln 2 t/5 + 25 da cui si ottiene t¯ = 5 ln 5/ ln 2 ≃ 11, 6. Quindi il caffè raggiunge i 35◦ C dopo 11 minuti e 36 secondi (circa). ✩ (I.5) (Equazione di Bernoulli) Si consideri l’equazione differenziale p y′ (t) = 2(tan t)y(t) + 2 y(t) definita per t , π/2 + kπ, k ∈ Z. Dopo aver effettuato una opportuna sostituzione per ricondursi a una equazione lineare, determinare le soluzioni dell’equazione data. Soluzione. Osserviamo che y ≡ 0 è soluzione. Per y(t) > 0 definiamo p z(t) = y(t). La derivata di z è z′ (t) =
i h p p 1 1 y′ (t) = p 2(tan t)y(t) + 2 y(t) = (tan t) y(t) + 1, p 2 y(t) 2 y(t)
quindi z soddisfa l’equazione lineare z′ (t) = (tan t)z(t) + 1. Possiamo applicare la formula risolutiva (6) per determinare z; abbiamo a(t) = tan t, b(t) = 1, quindi A(t) = − ln | cos t| e ! Z 1 sin t + C z(t) = | cos t| dt + C =⇒ z(t) = | cos t| cos t grazie all’arbitrarietà della costante di integrazione C ∈ R. Innanzitutto osserviamo che l’espressione di z ottenuta (come anche l’equazione) ha senso quando t , π/2 + kπ, k ∈ Z. Però, come abbiamo
Più
in generale ci proponiamo di risolvere un’equazione del tipo y′ (t) = a(t)y(t) + b(t)yα (t) con α ∈ R (se α = 0, 1 siamo già in grado di risolvere l’equazione). Dopo aver osservato che y ≡ 0 è soluzione quando α > 0, tentiamo di ricondurci ad un’equazione di cui sappiamo calcolare le soluzioni effettuando la sostituzione z(t) = yβ (t), con β ∈ R opportuno. Derivando otteniamo z′ (t) = βyβ−1 (t)y′ (t) e quindi z′ (t) = βyβ−1 (t) a(t)y(t) + b(t)yα (t) h i = β a(t)z(t) + b(t)yα+β−1 (t) . Affinché quest’ultima equazione sia lineare (e quindi facilmente risolubile) dev’essere β = 1 − α. Abbiamo quindi capito che se poniamo z(t) = y(t)1−α l’equazione di partenza si trasforma nell’equazione lineare z′ (t) = (1 − α) [a(t)z(t) + b(t)]
di cui conosciamo la forma esplicita delle soluzioni.
Esercizi
23
più volte osservato, le soluzioni di un’equazione differenziale devono essere definite su degli intervalli. Otteniamo quindi molteplici famiglie di soluzioni, definite su intervalli disgiunti: π π sin t + C , t ∈ − + kπ, + kπ . z(t) = cos t 2 2 A questo punto p possiamo calcolare la funzione incognita di partenza. Poiché z(t) = y(t), la funzione z trovata non può essere negativa. Questo impone una ulteriore restrizione sull’intervallo di definizione di z, almeno per alcuni valori di C. Infatti sin t + C ≥ 0 e cos t > 0 oppure z(t) ≥ 0 ⇐⇒ sin t + C ≤ 0 e cos t < 0. Sotto queste condizioni sin t + C 2 y(t) = cos t
con t ∈ I,
dove l’intervallo di definizione I dipende da k e da C ed è definito nel modo seguente: π π − + kπ, + kπ , se k è pari e C ≥ 1 o k è dispari e C ≤ −1 2 2 π − arcsin C + kπ, + kπ , se k è pari e − 1 < C < 1 2 π − + kπ, − arcsin C + kπ , se k è dispari e − 1 < C < 1. 2 (I.6) (Equazione logistica a coefficienti variabili) Usando la sostituzione z(t) = 1/p(t), determinare la soluzione per k(t) e h(t) variabili nel tempo dell’equazione logistica p′ (t) = k(t)p(t) − h(t)p2(t). Soluzione. Come suggerito, utilizziamo la sostituzione z(t) = 1/p(t) e calcoliamo la derivata della funzione z z′ (t) = −
p′ (t) k(t)p(t) − h(t)p2 (t) 1 + h(t) = − = −k(t) p(t) p2 (t) p2 (t)
da cui ricaviamo che z è soluzione dell’equazione lineare z′ (t) = −k(t)z(t) + h(t). Possiamo quindi applicare la formula risolutiva (6) per determinarne le soluzioni ! Z K(t) −K(t) h(t)e dt + C . z(t) = e
Stiamo
risolvendo un’equazione di Bernoulli con α = 2; si veda l’Esercizio (I.5).
24
Equazioni differenziali
dove K(t) è una qualsiasi primitiva di k. Per trovare p(t) sarà sufficiente considerare il reciproco dell’espressione trovata, ovvero Z K(t)
K(t)
p(t) = e
h(t)e
!−1 dt + C .
(I.7) (Oscillatore armonico) Studiare le soluzioni dell’equazione mx′′ (t) = −kx(t) − γx′ (t). al variare della costante elastica della molla k > 0 e del coefficiente d’attrito γ > 0.
Si osservi l’analogia tra la soluzione trovata e la (9).
Come
abbiamo visto a pagina 3 questa è l’equazione differenziale soddisfatta dalla posizione x(t) di un corpo di massa m vincolato a muoversi su una guida rettilinea, soggetto sia ad una forza generata da una molla (con posizione di equilibrio in x = 0) che alla forza d’attrito.
Soluzione. Dividendo l’equazione differenziale per m > 0 otteniamo x′′ (t) + 2δx′ (t) + ω2 x(t) = 0, dove abbiamo posto (per comodità di calcolo che capiremo a breve) δ=
γ 2m
e
ω2 =
k . m
Il polinomio caratteristico associato a quest’ultima equazione è P2 (λ) = λ2 + 2δλ + ω2 ed ammette come radici √ √ λ1 = −δ + δ2 − ω2 e λ2 = −δ − δ2 − ω2 . A seconda del segno della quantità sotto radice, δ2 − ω2 , deduciamo tre possibili comportamenti. Caso 1: δ > ω. Il polinomio caratteristico ha due radici reali e distinte, quindi l’equazione ammette le seguenti soluzioni x(t) = C1 eλ1 t + C2 eλ2 t . Osserviamo che entrambi gli zeri del polinomio caratteristico sono negativi, quindi le soluzioni trovate tendono a zero in modo esponenziale quando t → +∞. Fisicamente questo significa che se la costante d’attrito è grande (rispetto alla costante di elasticità della molla), allora il corpo non oscilla, ma viene trascinato verso la posizione di equilibrio. Al variare delle costanti C1 e C2 le funzioni x(t) hanno un andamento come quello delle curve in Figura I.7. Caso 2: δ = ω. In questo caso il polinomio ha due radici reali coincidenti λ1 = λ2 = −δ, si ha quindi la famiglia di soluzioni x(t) = (C1 + C2 t)eλ1 t ,
C1 , C2 ∈ R.
Anche in questo caso le soluzioni decrescono in modo esponenziale al crescere del tempo t. Il grafico di alcune soluzioni è rappresentato in Figura I.7.
Infatti
√ δ2 − ω2 < δ.
Esercizi
25
F I.7: da sinistra a destra sono rappresentati alcuni possibili moti di un oscillatore armonico rispettivamente nei casi in cui δ > ω, δ = ω e δ < ω, al variare della posizione e della velocità iniziali dell’oscillatore. L’andamento delle curve è molto simile nei primi due casi, in cui l’attrito è grande rispetto alla costante di elasticità della molla. Nel terzo caso risulta invece evidente il carattere oscillatorio del moto, compreso tra i grafici delle curve esponenziali ±re−δt .
Caso 3: δ < ω. Le radici del polinomio caratteristico sono due numeri complessi coniugati, ovvero √ λ1,2 = −δ ± iω¯ con ω¯ = ω2 − δ2 . Abbiamo quindi la famiglia di soluzioni x(t) = C1 e−δt sin(ωt) ¯ + C2 e−δt cos(ωt), ¯
C1 , C2 ∈ R.
Per riuscire a dare una interpretazione fisica del risultato ottenuto riscriviamo quest’ultima espressione effettuando le seguenti sostituzioni q C1 r = C21 + C22 e ϕ = arctan − C2 da cui otteniamo x(t) = re−δt cos(ωt ¯ + ϕ),
C1 , C2 ∈ R.
Da quest’ultima espressione risulta evidente il carattere oscillatorio del moto. In questo caso quindi l’attrito non è sufficiente per smorzare il moto oscillatorio causato dalla molla. L’effetto dell’attrito si può osservare nel decadimento esponenziale dell’ampiezza dell’oscillazione: il grafico di x(t) è compreso tra la coppia di curve ±re−δt (si veda la Figura I.7, a destra). (I.8) (Oscillatore armonico con forzante) Studiare il moto di un corpo di massa m vincolato a muoversi senza attrito su una guida rettilinea, soggetto ad una forza generata da una molla con costante elastica k > 0 e ad una forza esterna di intensità f (t) = A cos(φt) con A, φ parametri reali. Soluzione. Abbiamo visto a pagina 3 che in questo caso l’equazione soddisfatta dalla posizione x(t) del corpo è mx′′ (t) + kx(t) = A cos(φt).
Osserviamo che
in assenza di attrito, cioè quando δ = 0 si ottiene il moto puramente oscillatorio x(t) = r cos(ωt + ϕ).
26
Equazioni differenziali
F I.8: a sinistra un esempio di moto di un oscillatore armonico con forzante a cos(φt) non in risonanza; a destra invece la forzante è in risonanza, cioè φ = ω.
Se dividiamo per m e poniamo ω2 = k/m e a = A/m otteniamo x′′ (t) + ω2 x(t) = a cos(φt). Dall’esercizio precedente deduciamo l’espressione delle soluzioni dell’equazione omogenea associata, ovvero x(t) = C1 sin(ωt) + C2 cos(ωt), al variare di C1 , C2 in R. Vogliamo ora cercare una soluzione particolare dell’equazione completa. Essendo ±iω le radici del polinomio caratteristico, possono presentarsi due situazioni: Caso 1: φ , ω. In questo caso cerchiamo una soluzione particolare del tipo
È il caso δ = 0.
xp (t) = b cos(φt) + c sin(φt). 2 la cui derivata seconda è x′′ p (t) = −φ (b cos(φt) + c sin(φt)). Sostituendo nell’equazione otteniamo 2
2
(ω − φ )(b cos(φt) + c sin(φt)) = a cos(φt)
=⇒
a b= 2 , c = 0. ω − φ2
Le soluzioni dell’equazione completa quindi sono x(t) = C1 sin(ωt) + C2 cos(ωt) +
a cos(φt), ω2 − φ2
C1 , C2 ∈ R.
Se effettuiamo ancora una volta le sostituzioni r = (C21 + C22 )1/2 e ϕ = arctan(−C1 /C2 ) otteniamo x(t) = r cos(ωt + ϕ) +
a cos(φt). 2 ω − φ2
Il moto del corpo risulta quindi essere la sovrapposizioni di due moti oscillatori con ampiezze e periodi diversi (Figura I.8, a sinistra).
Non dobbiamo stupirci che la co-
stante c sia nulla, infatti se xp fosse somma di una funzione pari e di una dispari allora anche x′′ p avrebbe la stessa struttura (la derivata di una funzione pari è dispari e viceversa). 2 Dunque x′′ p (t) + ω xp (t) non potrebbe essere uguale ad a cos(φt), che è pari. Potevamo quindi dedurre senza fare calcoli che c = 0 e cercare direttamente una soluzione particolare del tipo xp (t) = b cos(φt).
Per
quali valori di φ il moto è periodico?
Esercizi
27
Caso 2: φ = ω. In questo caso la soluzione particolare dev’essere cercata della forma xp (t) = bt cos(ωt) + ct sin(ωt).
x′p (t) = c(sin(ωt) + tω cos(ωt)) 2 x′′ p (t) = c(2ω cos(ωt) − tω sin(ωt)) 2 x′′ p (t) + ω xp (t) = 2cω cos(ωt) = a cos(φt)
=⇒
c=
a . 2ω
Otteniamo le soluzioni dell’equazione completa x(t) = C1 sin(ωt) + C2 cos(ωt) + ovvero, sostituendo r =
x(t) = r cos(ωt + ϕ) +
+
C22 )1/2
a t sin(ωt), 2ω
C1 , C2 ∈ R
e ϕ = arctan(−C1 /C2 ),
a t sin(ωt). 2ω
Da quest’ultima espressione deduciamo che per ogni successione (tn )n≥1 divergente a +∞ del tipo tn = t0 + 2π/ωn, con t0 , 0 si ha che |x(tn )| → +∞ e quindi il corpo, al crescere del tempo t, compie delle oscillazioni di ampiezza sempre più grandi (si veda la Figura I.8 a destra). Questo fenomeno viene chiamato risonanza. (I.9) Determinare le soluzioni delle equazioni differenziali x′′ (t) + x(t) = t2
e
φ della forzante è uguale alla frequenza propria ω dell’oscillatore.
Invece
In realtà possiamo subito dire che b = 0, infatti t cos(ωt) è una funzione dispari e, come nel caso precedente, xp non può essere la somma di una funzione dispari e una pari. Derivando xp e sostituendo nell’equazione otteniamo
(C21
Cioè la frequenza
x′′ (t) + x(t) = t sin t.
Soluzione. Le soluzioni dell’equazione omogenea associata ad entrambe le equazioni sono C1 cos t + C2 sin t, con C1 , C2 ∈ R, infatti il polinomio caratteristico è P2 (λ) = λ2 + 1 e i suoi zeri sono ±i. Il termine noto della prima equazione è il polinomio di secondo grado Q2 (t) = t2 e λ = 0 non annulla il polinomio caratteristico; cerchiamo dunque una soluzione particolare del tipo xp (t) = at2 + bt + c con a, b, c ∈ R da determinare. Se imponiamo che xp sia soluzione dell’equazione otteniamo 2 2 x′′ p (t) + xp (t) = (2a) + (at + bt + c) = t
di sfidare la sorte nel tentativo di indovinare la forma dell’integrale particolare, possiamo ragionare nel modo seguente. Prendiamo φ , ω. Dall’espressione dell’integrale generale a x(t) = r cos(ωt+ϕ)+ 2 cos(φt), ω − φ2
selezioniamo la soluzione con r = −a/(ω2 − φ2 ) e ϕ = 0: a cos(ωt) x(t) = − 2 ω − φ2 a cos(φt) + 2 ω − φ2 =a
cos(φt) − cos(ωt) ω2 − φ2
.
Se, fissato t, passiamo al limite per φ → ω, utilizzando la formula di de l’Hôpital otteniamo lim a
φ→ω
cos(φt) − cos(ωt) ω2 − φ2
=
at sin(ωt) . 2ω
28
Equazioni differenziali
da cui ricaviamo a = 1, b = 0 e c = −2. Le soluzioni della prima equazione sono quindi le funzioni x(t) = C1 cos t + C2 sin t + t2 − 2. Il termine noto della seconda equazione è invece del tipo f (t) = Qk (t)eαt sin(βt) con Qk polinomio di grado k = 1, α = 0 e β = 1. Poiché α ± iβ = ±i sono radici del polinomio caratteristico cerchiamo una soluzione particolare del tipo xp (t) = Q1 (t)t sin t + R1 (t)t cos t dove Q1 (t) = at + b ed R1 (t) = ct + d sono polinomi di primo grado da determinare. Se calcoliamo le derivate di xp (t) ed imponiamo che risolva l’equazione troviamo xp (t) = (at2 + bt) sin t + (ct2 + dt) cos t x′p (t) = (2at + b) sin t + (at2 + bt) cos t + (2ct + d) cos t − (ct2 + dt) sin t = (−ct2 − dt + 2at + b) sin t + (at2 + bt + 2ct + d) cos t
2 x′′ p (t) = (−2ct − d + 2a) sin t + (−ct − dt + 2at + b) cos t
+ (2at + b + 2c) cos t − (at2 + bt + 2ct + d) sin t
= (−at2 − bt − 4ct − 2d + 2a) sin t + (−ct2 − dt + 4at + 2b + 2c) cos t
x′′ p (t) + xp (t) = (−4ct − 2d + 2a) sin t + (4at + 2b + 2c) cos t = t sin t. e quindi −4c = 1,
−2d + 2a = 0,
4a = 0,
2b + 2c = 0
da cui ricaviamo a = d = 0 e b = −c = 1/4. Abbiamo quindi trovato una soluzione particolare dell’equazione completa xp (t) =
1 1 t sin t − t2 cos t. 4 4
Le soluzioni della seconda equazione quindi sono (si veda la Figura I.9) 1 1 x(t) = C1 cos t + C2 sin t + t sin t − t2 cos t. 4 4 ❊❊❊
F I.9: alcune soluzioni dell’equazione di second’ordine x′′ +x = t sin t.
Esercizi
29
✎ Diamoci da fare. . . (Soluzioni a pagina 571) 1 Sia k : [0, +∞) → R una funzione continua. Supposto che una popolazione p = p(t) si evolva con un tasso percentuale di crescita k(t) e che p(0) = p0 > 0, determinare il numero di individui all’istante t > 0. Sotto quali condizioni su k la popolazione si estingue? 2 Una popolazione di batteri inizialmente conta 500 individui, dopo 3 ore ne conta 8000. Supponendo che la crescita della popolazione sia proporzionale al numero dei suoi individui: (a) determinare un’espressione per il numero di batteri dopo t ore; (b) determinare il numero di batteri dopo 4 ore; (c) dire dopo quanto tempo ci saranno 32000 batteri. o 3 Una popolazione cresce con tasso relativo costante. Dopo 2 ore i batteri sono 600, dopo 8 sono 75000. (a) Determinare la popolazione iniziale; (b) determinare il numero di batteri dopo t ore; (c) dopo quanto tempo ci saranno 375000 batteri? 4 Le sostanze radioattive decadono (emettendo spontaneamente radiazioni) ad una velocità proporzionale alla massa residua m(t) secondo una costante k < 0 (il tasso di decadimento). I fisici spesso esprimono il tasso di decadimento in termini di tempo di dimezzamento ovvero il tempo necessario per il decadimento di metà di una certa quantità. Sapendo che il tempo di dimezzamento del radio è di 1590 anni, preso un campione di radio di 100 g: (a) trovare la formula che dice quanto radio rimane dopo t anni; (b) trovare la massa residua dopo 1000 anni; (c) dire dopo quanto tempo la massa sarà ridotta a soli 30 mg. 5 Per datare gli oggetti antichi, viene spesso usato il metodo della datazione al carbonio. Nell’atmosfera è presente carbonio 14 C, un isotopo radioattivo con un tempo di dimezzamento di 5730 anni. I vegetali assorbono il 14 C e, tramite la catena alimentare, lo passano agli animali. Quando un albero o un animale muoiono, la quantità di 14 C presente nel loro corpo comincia a diminuire secondo la legge di decadimento radioattivo. È stato scoperto un frammento di pergamena contenente circa il 75% della quantità di 14 C presente nei vegetali in vita. Stimare l’età della pergamena.
6 Determinare gli intervalli di definizione delle soluzioni dell’equazione logistica con coefficienti costanti p′ (t) = p(t)(k − hp(t)) studiata nell’Esercizio (I.1), svolto a pagina 18, quando ammettiamo che sia il tempo t che la condizione iniziale p0 = p(0) possano assumere anche valori negativi. 7 Mostrare che se p(t) soddisfa l’equazione logistica (Esercizio 6 ) allora p′′ (t) = p(t)(k − hp(t))(k − 2hp(t)). Dedurre che se p0 ∈ (0, 2k/h) allora la popolazione cresce con velocità massima quando raggiunge la metà della capacità dell’ambiente. 8 Si consideri l’equazione differenziale p′ (t) = (k − hp(t))(p(t) − m) con k, h, m costanti positive ed m < k/h. Se p(t) rappresenta il numero di individui di una popolazione al tempo t, questa equazione è una variazione dell’equazione logistica studiata nell’Esercizio (I.1), e differisce da quest’ultima per la presenza del fattore (1 − m/p(t)) a secondo membro. m indica il valore minimo sotto il quale la popolazione inizia ad estinguersi. (a) L’equazione data ammette soluzioni costanti? Quali? (b) Studiare il segno del tasso di crescita della popolazione. Come varia il numero di individui se p0 = p(0) ∈ (0, m)?
(c) Determinare l’espressione analitica delle soluzioni non costanti dell’equazione assumendo che per t = 0 la popolazione abbia p0 > 0 individui.
(d) Descrivere il comportamento della popolazione nelle seguenti situazioni: p0 ∈ (0, m), p0 ∈ (m, k/h) oppure p0 > k/h. 9 Un altro modello di funzione di crescita limitata per popolazioni è la funzione di Gompertz, ovvero una soluzione dell’equazione differenziale p′ (t) = p(t) log k − log(hp(t)) , h, k > 0. (a) Determinare le soluzioni costanti. (b) Studiare il segno del tasso di crescita della popolazione al variare della popolazione stessa (supporre p(t) > 0).
30
Equazioni differenziali
(c) Determinare l’espressione analitica delle soluzioni non costanti assumendo p(0) = p0 > 0 individui.
(b) y′ (x) = y2 (x) + x2 − 1; (c) y′ (x) = x2 − y2 (x).
10 Un modello per la diffusione di un’epidemia si ba- b 17 Trovare le soluzioni delle seguenti equazioni difsa sull’ipotesi che la velocità di propagazione sia conferenziali a variabili separabili prestando particolare temporaneamente proporzionale al numero di individui attenzione agli intervalli in cui sono definite. infetti e a quello di individui sani. In una città isolata (a) r′ (t) = r(t) − r3 (t), con r(t) ≥ 0; di 5000 abitanti, 160 erano malati all’inizio della settit3 mana e 1200 lo sono alla fine della stessa settimana. In ; (b) y′ (t) = − (y(t) + 1)2 quanto tempo verrà infettato l’80% della popolazione? (c) (1 + x3 )y′ (x) − x2 y(x) = 0; 11 Determinare le soluzioni dell’equazione differen(d) (1 + x)y′ (x) = y(x) + 1; ziale a variabili separabili, 1 (e) x′ (s) = ; p ex(s) eex(s) y′ (t) = 2 y(t) (f) y′ (x) = ex−y(x) ; prestando particolare attenzione all’intervallo di defini2xy(x) (g) y′ (x) = 2 ; zione delle soluzioni che non si annullano. x −1 t+y(t) ′ (h) e y (t) + t = 0. 12 Il corpo della vittima è stato rinvenuto sul luogo del delitto alle 2:20 di notte. Dopo mezz’ora la temperatura del corpo è di 15◦ C. Quando è stato commesso l’omicidio se all’ora del ritrovamento la temperatura del corpo è di 20◦ C e se la temperatura esterna è di -5◦ C? 13 Una torta viene tolta dal forno alle 17:00 quando è bollente (100◦ C). Dopo 10 minuti la sua temperatura è di 80◦ C, alle 17:20 è di 65◦ C. Determinare la temperatura della stanza. 14 Prima di appiccare fuoco ad un deposito di gas, un piromane attento vuole determinare il momento esatto dell’esplosione in funzione della quantità di gas inizialmente posta in combustione. Egli assume che la velocità con cui il gas prende fuoco sia proporzionale alla temperatura del deposito e che questa sia a sua volta proporzionale al quadrato del gas in combustione. Suppone inoltre che la quantità totale di gas sia infinita. Quando avviene l’esplosione? 15 Sia y(t) una soluzione dell’equazione differenziale ′
4
3
2
y (t) = y (t) − 3y (t) + 2y (t). Per quali valori di y(t) tale funzione risulta essere strettamente crescente? Per quali strettamente decrescente? Quali soluzioni costanti ammette l’equazione? 16 Per le seguenti equazioni determinare in quali sottoinsiemi del piano le (eventuali) soluzioni sono funzione crescenti, in quali punti hanno tangente orizzontale e infine dove sono decrescenti. (a) y′ (x) = x + y(x);
18 Dopo aver determinato le (due) soluzioni costanti dell’equazione x′ (t) = x2 (t) − 4, determinare quelle che non intersecano tali soluzioni. In particolare selezionare le soluzioni passanti per i punti (0,0), (0,3) e (0,-3) e dire su quale intervallo sono definite. b 19 Trovare le soluzioni (eventualmente in forma implicita) delle seguenti equazioni differenziali a variabili separabili passanti per il punto indicato. (a) y′ (t)y(t)(et + 1) = et , (0, −1);
(b) su(s)u′ (s) = 1 + s2 , (1, 1);
(c) x(1 + y2 (x))y′ (x) = 3, (1, 0); 4y(x) , (1, 0); (d) y′ (x) = x(y(x) − 3) (e) y′ (t) sin y(t) = sin t + 1, (0, π/2); 20 Determinare la curva passante per il punto (3, 2) con la seguente proprietà: tracciando la normale ad ogni punto P della curva (ovvero la retta passante per P ed ortogonale alla tangente in P), l’intersezione tra la normale e l’asse y è sempre il punto di coordinate (0, 6). 21 Su quale intervallo è definita l’unica soluzione dell’equazione differenziale omogenea (si veda l’Esercizio (I.3) a pagina 20) y′ (t) = 2
y(t) − 1. t
passante per il punto (1, 0)?
Esercizi
31
22 Risolvere le seguenti equazioni omogenee seguendo il procedimento descritto nell’Esercizio (I.3) svolto a pagina 20. y2 (x) y(x) + ; x2 x x(t) (b) x′ (t) = − ex(t)/t ; t (c) x2 y′ (x) = y2 (x) + xy(x) + x2 ; (a) y′ (x) =
(d) y′ (t) =
y2 (t) + t2 . ty(t) − t2
23 Trovare quale curva contenuta nel primo quadrante passa per il punto (1, 1) e soddisfa la seguente proprietà: il segmento di tangente, in un generico punto P, contenuto nel primo quadrante viene bisecato da P. 24 Determinare le curve del piano tali che la distanza di un qualsiasi loro punto P da T, intersezione tra la tangente alla curva in P e l’asse delle x, sia uguale alla distanza di T dall’origine.
(e) x′ (t) = et x(t) + et ; 2
(f) y′ (t) = 2ty(t) + et ; x+1 2 . (g) y′ (x) = y(x) + x x 29 Riferendosi all’esercizio precedente, determinare le soluzioni delle equazioni (a), (b), (c), (d) e (e) passanti rispettivamente per i punti (0, 0), (π/2, 0), (−3, −4), (1, 2e) e (0, 4). 30 Determinare le soluzioni delle seguenti equazioni di Bernoulli utilizzando il procedimento descritto nell’Esercizio (I.5) svolto a pagina 22. 2 p (a) y′ (t) = 4ty(t) + et y(t); (b) y′ (x) − y(x) = xy5 (x); 1 1 (c) y′ (x) + y(x) = y4 (x)(1 − 2x); 3 3 p (d) y′ (x) + xy(x) + x y(x) = 0; x (e) y′ (x) = y(x) + . y(x)
25 Si consideri l’equazione differenziale lineare y′ (t) = a(t)y(t)+b(t) con a e b funzioni continue su un certo inter- o 31 Si consideri l’equazione differenziale del primo ordine vallo (c, d) con −∞ ≤ c < d ≤ +∞. Dimostrare che se y1 e y2 sono due soluzioni distinte dell’equazione, ovvero se y′ (t) = a(t)y(t) + b(t)y2 (t) + c(t), esiste t¯ ∈ (c, d) tale che y1 (t¯) , y2 (t¯), allora y1 (t) , y2 (t) per ogni t ∈ (c, d). con a, b, c continue (su un comune intervallo di definizione). Se c ≡ 0 abbiamo un’equazione di Bernoulli, 26 Date le funzioni continue a e b sull’intervallo (c, d) quando invece b ≡ 0 ci si riduce ad una lineare. Se con −∞ ≤ c < d ≤ +∞ e un punto P = (t0 , y0 ) ∈ (c, d)×R, b, c . 0, un’equazione di questo tipo prende il nome trovare l’espressione dell’unica (si veda l’esercizio 25 ) ′ di Equazione di Riccati e non esistono metodi generasoluzione dell’equazione lineare di primo ordine y (t) = li per la sua risoluzione. Nota però una sua soluzione a(t)y(t) + b(t) passante per il punto P. particolare, ψ, se ci proponiamo di cercare la soluzione ✩ 27 Si consideri l’equazione differenziale y′ (t) = generale dell’equazione nella forma 1(t)h(y(t)) + b(t) con 1 e b funzioni continue su un cery(t) = ψ(t) + z(t), to intervallo (c, d) con −∞ ≤ c < d ≤ +∞, e h′ continua. Dimostrare che se y1 e y2 sono due soluzioni disi verifica facilmente che z deve soddisfare l’equazione stinte dell’equazione, ovvero se esiste t¯ ∈ (c, d) tale che di tipo Bernoulli y1 (t¯) , y2 (t¯), allora y1 (t) , y2 (t) per ogni t ∈ (c, d). (Sug gerimento: si applichi il risultato dell’Esercizio 25 alla z′ (t) = a(t) + 2b(t)ψ(t) z(t) + b(t)z2 (t). differenza y1 (t) − y2 (t).) Possiamo quindi ricavare la funzione z e dunque l’inteb 28 Determinare le soluzioni delle seguenti equazioni grale generale dell’equazione di partenza sommandole lineari di primo ordine. ψ. Utilizzando questo procedimento risolvere (a) y′ (t) + y(t) = 2t + 2; y′ (t) = y2 (t) − ty(t) + 1 cos x ′ = 0; (b) y (x) + sin 2x + 2y(x) sin x sapendo che è soddisfatta da ψ(t) = t. x−1 ′ 2 (c) y (x) = y(x) + x ; b 32 Determinare le soluzioni delle seguenti equaziox ni lineari di secondo ordine a coefficienti costanti y(t) + t2 et ; (d) y′ (t) = 2 omogenee. t
32
Equazioni differenziali
(a) y′′ − 4y′ = 0; ′′
′
(b) 2y + y − y = 0; ′′
′
(c) y − 4y + 3y = 0;
(d) y′′ + 4y′ + 4y = 0; (e) y′′ + 6y′ + 10y = 0; (f) y′′ − y′ + y = 0;
(g) y′′ + 2y′ + 2y = 0; 33 Dimostrare che se x1 (t) e x2 (t) sono due qualsiasi soluzioni dell’equazione lineare di second’ordine x′′ (t) + b(t)x′ (t) + c(t)x(t) = f (t) allora la loro differenza risolve l’equazione omogenea associata x′′ (t) + b(t)x′ (t) + c(t)x(t) = 0. 34 Nota xp (t), soluzione dell’equazione lineare di second’ordine x′′ (t) + b(t)x′ (t) + c(t)x(t) = f (t), dimostrare che x(t) risolve tale equazione se e solo se x(t) = xp (t) + xo (t) dove xo (t) è una qualsiasi soluzione dell’omogenea associata x′′ (t) + b(t)x′ (t) + c(t)x(t) = 0. b 35 Determinare le soluzioni y = y(x) delle seguenti equazioni lineari di secondo ordine a coefficienti costanti non omogenee. (a) y′′ + y′ − 6y = 2e−x ;
(b) y′′ + y′ − 2y = x2 ;
(c) y′′ − 4y′ + 3y = x + 2;
(d) y′′ + 2y′ = x2 − 1; (e) y′′ − y = cos x;
(f) y′′ + 4y = cos x;
(a) x′′ + 2x′ = et + e−2t ; (b) 2x′′ + x′ − x = te−t + sin(2t). o 38 (Variazione delle costanti) Per determinare una soluzione particolare di un’equazione lineare di secondo ordine a coefficienti costanti non omogenea, si può procedere nel modo seguente. Prima si calcola la famiglia di soluzioni a due parametri dell’equazione omogenea, C1 u1 (t) + C2 u( t); quindi si cerca una soluzione dell’equazione non omogenea del tipo C1 (t)u1 (t) + C2 (t)u2 (t), con C1 (t) e C2 (t) funzioni da determinare che soddisfano la relazione C′1 (t)u1 (t) + C′2 (t)u2 (t) = 0. Con questo metodo determinare una soluzione particolare per le equazioni: (a) y′′ (t) + y(t) =
1 ; cos t
(b) y′′ (t) − 2y′ (t) + y(t) =
12et . t3
39 La Figura I.10 mostra un circuito RLC, cioè un circuito elettrico contenente un generatore di forza elettromotrice, E = E(t), un condensatore di capacità C, un resistore di resistenza R e una induttanza L, disposti in serie.
(g) y′′ + 4y = ex cos x; (h) y′′ + 2y′ = ex ; (i) y′′ − 2y′ + y = ex ;
(j) y′′ + y = (x2 + 1)ex .
36 Per le equazioni (a), (b), (e) dell’Esercizio 35 determinare la soluzione che soddisfa la condizione iniziale y(0) = 1, y′ (0) = 0 (giustificheremo l’esistenza e l’unicità di tale soluzione nel Capitolo VIII). 37 (Principio di sovrapposizione) Dimostrare che se x1 e x2 risolvono x′′1 + bx′1 + cx1 = f1 e x′′2 + bx′2 + cx2 = f2 , allora x1 + x2 è soluzione dell’equazione x′′ + bx′ + cx = f1 + f2 . Dedurre che le soluzioni di quest’ultima equazione sono tutte e sole le funzioni della forma x(t) = xo (t) + x1 (t) + x2 (t) con xo (t) soluzione dell’omogenea associata x′′ + bx′ + cx = 0. Trovare quindi le soluzioni delle seguenti equazioni:
Figura I.10 Se indichiamo con q = q(t) la quantità di carica e con i(t) l’intensità di corrente che attraversa il circuito allora q′ (t) = i(t). Inoltre la forza elettromotrice E(t) è pari alla differenza di potenziale agli estremi del generatore; ricordando che la differenza di potenziale tra le armature di un condensatore è q(t)/C, quella agli estremi della resistenza è Ri(t), mentre quella ai capi dell’induttanza è Li′ (t) si ottiene E(t) = Li′ (t) + Ri(t) +
q(t) . C
Esercizi
33
La corrente e la carica soddisfano quindi il sistema di equazioni lineari di primo ordine (con coefficienti costanti) q(t) E(t) R ′ − i(t) − i (t) = L L LC ′ q (t) = i(t). Determinare l’equazione lineare di second’ordine a coefficienti costanti soddisfatta da i(t). 40 Trasformare il sistema lineare di primo ordine ( ′ x (t) = ax(t) + by(t) y′ (t) = cx(t) + dy(t) in un’equazione lineare di second’ordine. Quindi, utilizzando questo procedimento, determinare le soluzioni del sistema ( ′ x (t) = 2x(t) + y(t) y′ (t) = x(t) + 2y(t). 41 Si consideri un circuito RLC dell’Esercizio 39 . Nel caso di un generatore di forza elettromotrice alternata, ovvero se E(t) = E0 sin(ω0 t), l’equazione diventa Li′′ (t) + Ri′ (t) +
1 i(t) = E0 ω0 cos(ω0 t). C
dove ϕ ∈ (−π/2, π/2) è lo sfasamento e l’intensità massima della corrente è data da i0 =
E0 , Z
con s Z=
1 2 R2 + ω0 L − ω0 C
l’impedenza del circuito. ✩ 42 (Metodo di d’Alembert) Sia u(t) una soluzione di ay′′ (t) + by′ (t) + cy(t) = 0,
a, b, c ∈ R.
Dimostrare che se α(t) risolve aα′′ (t)u(t) + α′ (t)(2au′ (t) + bu(t)) = f (t) allora la funzione α(t)u(t) risolve l’equazione completa ay′′ (t) + by′ (t) + cy(t) = f (t). Questo metodo permette di determinare una soluzione di un’equazione lineare di secondo ordine non omogenea (si osservi che non è necessario che i coefficienti siano costanti, si veda l’Esercizio 43 ) a partire da una soluzione dell’omogenea, risolvendo un’equazione lineare di prim’ordine nella variabile α′ (t).
Si osservi l’analogia con l’equazione dell’oscillatore armonico studiato nell’Esercizio (I.7), svolto a pagina 24, quando E0 = 0; ritrovare i risultati dell’esercizio citato ✩ 43 Usare il Metodo di d’Alembert descritto nell’Eserponendo δ = R/2L e ω2 = 1/(CL). Verificare quindi che, cizio 42 per determinare una seconda soluzione delle nel caso generale E0 , 0, la funzione i(t) = i0 sin(ω0 t+ϕ) seguenti equazioni nota la soluzione u(t): risolve l’equazione se si pone (a) (1 − t2 )y′′ (t) − 2ty′ (t) + 2y(t) = 0, u(t) = t; √ 1 1 ω0 L − , tan ϕ = (b) t2 y′′ (t) + ty′ (t) − 2y(t) = 0, u(t) = t 2 . R ω0 C
Eternal sunshine of the spotless mind! Each pray’r accepted, and each wish resign’d; Eloisa to Abelard A LEXANDER P OPE (1688–1744)
C APITOLO
II Successioni e serie di funzioni
Il suono si può scomporre in una somma di armoniche fondamentali, la luce può essere scomposta in uno spettro di molti colori. In moltissime applicazioni le quantità fisicamente rilevanti si decompongono in maniera naturale in somme di funzioni fondamentali. Le somme possono contare infiniti termini: parleremo allora di serie di funzioni. Gli elementi fondamentali, dal canto loro, possono essere monomi, nel caso delle serie di potenze
(dette anche di Taylor), oppure onde armoniche, nel caso delle serie di Fourier. In questo capitolo introdurremo e studieremo le proprietà di base delle serie di Taylor e di Fourier in vista delle loro possibili applicazioni fisiche. Successivamente introdurremo un concetto generale di fondamentale importanza, quello di convergenza uniforme, e ne analizzeremo le principali conseguenze teoriche.
Q
uando vogliamo risolvere un’equazione differenziale, o anche solo calcolare un integrale, e non siamo in grado di trovare le soluzioni in forma di una combinazione di funzioni elementari, possiamo pensare di ampliare l’insieme delle funzioni in cui lavoriamo, aggiungendone di nuove. Si tratta di un artificio molto vicino a quello che abbiamo già utilizzato nell’estendere l’insieme dei numeri razionali, aggiungendovi quei numeri con un allineamento decimale infinito, al fine di permettere la risoluzione dell’equazione x2 = 2. Allo stesso modo possiamo pensare di estendere la classe delle funzioni elementari, aggiungendovi le loro somme infinite: parleremo allora di serie di funzioni. (II.1) Esempio. Il nostro primo esempio di serie di funzioni è la funzione zeta di Riemann, definita da ζ(x) =
m ∞ X X 1 1 = lim . nx m→+∞ nx n=1
n=1
Nel primo volume abbiamo tratta-
to lePserie numeriche, espressioni di tipo ∞ n=0 an dove ogni an è un numero reale. Ricordiamo che la somma di una serie è il limite della successione delle somme parziali, quando questo esiste finito, cioè ∞ m X X an = lim an ; n=0
m→+∞
n=0
si dice in questo caso che la serie converge, mentre se il limite vale +∞ o −∞ si dice che la serie diverge, altrimenti si dice che è indeterminata. Lo stesso si dirà per le serie di funzioni, la cui convergenza o meno dipenderà dal valore assunto dalla variabile x.
36
Successioni e serie di funzioni
Nel primo volume abbiamo studiato questo tipo di serie, le serie armoniche generalizzate di esponente x. Per studiare la loro convergenza abbiamo applicato il Criterio del confronto con l’integrale improprio, deducendo che queste serie convergono quando l’esponente x è maggiore di uno e divergono per x ≤ 1. In generale, data una serie di funzioni, ci saranno valori di x per cui la serie numerica corrispondente converge e altri per cui diverge o oscilla. L’insieme in cui converge si chiama insieme di convergenza. (II.2) Esempio. Un esempio di fondamentale importanza nello studio di tutti i fenomeni ondulatori, nello studio delle vibrazioni di membrane elastiche e della trasmissione del calore, è la classe delle funzioni di Bessel, due delle quali sono definite tramite le serie seguenti J0 (x) =
∞ X (−1)n 2n x , 22n (n!)2 n=0
J1 (x) =
∞ X n=0
(−1)n x2n+1 . 22n+1 n!(n + 1)!
Come vedremo in seguito, tali funzioni risolvono l’equazione differenziale di Bessel 2 ′′
′
2
2
x y (x) + xy (x) + (x − ν )y(x) = 0,
F II.1: Friedrich Wilhelm Bessel (1784–1846).
per ν = 0 e ν = 1 rispettivamente. Le funzioni di Bessel sono somme infinite di combinazioni di potenze della variabile x, sono infatti della forma ∞ X cn x n n=0
dove (cn )n∈N è una successione di numeri reali assegnata. Le serie di potenze sono la naturale estensione della nozione di polinomio e di funzione elementare. Esse permettono di ampliare lo spettro delle funzioni note allo scopo principale di risolvere equazioni differenziali. (II.3) Esempio. Se scegliamo come coefficienti della generica serie di potenze cn ≡ 1, otteniamo la serie geometrica di ragione x, a noi ben nota dal primo volume: ∞ X
xn .
n=0
La convergenza o meno della serie dipende dal valore assunto da x. Ad P n esempio la scelta x = 1/2 porta alla seriePconvergente ∞ 1/2 = 2, n=0 ∞ n mentre per x = 2 la serie corrispondente n=0 2 diverge a +∞. Più in generale, sappiamo che la serie geometrica è convergente per ogni valore di x in modulo minore di 1, mentre se |x| ≥ 1 la serie non è convergente. Abbiamo quindi ∞ X n=0
xn =
1 1−x
per |x| < 1.
F II.2: grafici delle funzioni di Bessel J0 e J1 .
P∞
qn è stata studiata nel primo volume. Dalla formula elementare per il calcolo di somme finite m X 1 − qm+1 qn = 1−q
La serie geometrica
n=0
n=0
ricaviamo che la serie geometrica converge se e solo se |q| < 1 e la sua somma vale ∞ X 1 . qn = 1−q n=0
§ 1. Serie di potenze
Normalmente non sarà possibile studiare la convergenza di una serie di funzioni calcolandone esplicitamente le somme parziali per poi passare al limite. Utilizzeremo invece dei ragionamenti indiretti basati sui criteri di convergenza per le serie numeriche enunciati nel primo volume.
37
Molti
di questi criteri sono brevemente richiamati nei commenti a fianco del testo.
(II.4) Esempio. Consideriamo la serie ∞ X
nxn
n=0
Osserviamo innanzitutto che la serie converge se x = 0, perché tutti i n termini in questo caso sono nulli. Fissiamo P∞ora x , 0 e poniamo an = nx : studiamo ora la convergenza della serie n=0 an . A questo scopo possiamo servirci del Criterio del rapporto: n+1 an+1 (n + 1)x n + 1 |x|. = an = nxn n Valutando il limite di questo rapporto troviamo n+1 an+1 = lim lim |x| = |x|. n→+∞ n→+∞ an n Il Criterio del rapporto garantisce la convergenza della serie per ogni valore di x tale che |x| < 1 e assicura la non convergenza se |x| > 1. Il Criterio non fornisce informazioni nel caso in cui il limite valga uno, cioè per x = −1 e x = 1. Possiamo però verificare direttamente che per tali P n valori di x laPserie non converge: per x = −1 si ha ∞ n=0 (−1) n mentre in x = 1 si ha ∞ n=0 n, e in entrambi casi è violata la condizione necessaria di convergenza. L’insieme di convergenza è quindi (−1, 1).
§ 1. Serie di potenze (II.5) Definizione. Una serie di potenze è una serie di tipo ∞ X n=0
Ricordiamo il Criterio del rapporto, che verrà utilizzato sistematicamente in queste pagine. Sia an , 0, e supponiamo che esista a lim n+1 = L. n→+∞ an P Se 0 ≤ L < 1 allora n an converge. P Se 1 < L ≤ +∞ allora n an non converge.
Dunque la serie converge per −1 <
x < 1 e non converge se x > 1 o x < −1.
La Condizione necessaria per la convergenza di una serie afferma che X an converge =⇒ lim an = 0. n→+∞
In altre parole una serie i cui termini non tendano a zero non è mai convergente.
cn (x − x0 )n = c0 + c1 (x − x0 ) + c2 (x − x0 )2 + ... + cn (x − x0 )n + ...
dove i numeri cn sono costanti reali chiamate coefficienti della serie e x0 ∈ R è il centro della serie, mentre x ∈ R è una variabile. Come abbiamo visto negli esempi, una serie di potenze può convergere per certi valori di x e non convergere per altri. Osserviamo che l’insieme di convergenza di una serie di potenze non è mai vuoto: infatti se x = x0 tutti i termini da uno in poi sono nulli e la serie converge in x = x0 (con somma c0 ).
La
serie della definizione viene detta serie di potenze centrata in x0 . Benché non abbia senso la potenza 00 , si adotta la convenzione (x − x0 )0 = 1 anche quando x = x0 .
38
Successioni e serie di funzioni
(II.6) Esempio. Vogliamo stabilire per quali valori di x la serie ∞ X
n!xn
n=0
è convergente. Per scoprirlo fissiamo x , 0, definiamo an = n!xn e valutiamo il limite del rapporto |an+1 /an |: n+1 an+1 (n + 1)!x = |x|(n + 1) → +∞. an = n!xn
Sicuramente
converge per x = 0 (è il centro della serie).
Grazie al Criterio del rapporto scopriamo che la serie non converge per alcun x , 0: l’insieme di convergenza in questo caso è ridotto al punto x = 0.
Non
si tratta di una serie qualunque: le sue somme parziali sono i polinomi di Taylor con centro nell’origine della funzione esponenziale f (x) = ex :
(II.7) Esempio. Mostriamo che la serie ∞ X xn n=0
n!
converge per ogni valore di x. Per x = 0, centro della serie di potenze, la serie converge con somma 1. Come negli esempi precedenti fissiamo ora x , 0 poniamo an = xn /n! e studiamo il rapporto |an+1 /an |. Risulta n+1 n! |x| an+1 x an = (n + 1)! · xn = n + 1 → 0.
Tm (x) =
m X f (n) (x0 ) (x − x0 )n . n! n=0
Vedremo fra poco che questa serie converge proprio alla funzione esponenziale stessa. Diverse funzioni che già conosciamo hanno la proprietà di essere la somma delle proprie serie di Taylor.
Questa volta il Criterio del rapporto garantisce la convergenza della serie per ogni x diverso da zero: dunque l’insieme di convergenza è tutto R. È un fatto notevole che l’insieme di convergenza di una serie di potenze sia sempre un intervallo, centrato nel centro della serie x0 , eventualmente ridotto ad un solo punto o coincidente con R. Il teorema che segue afferma che questa situazione è del tutto generale. (II.8) Teorema. Data una serie di potenze sempre una delle seguenti situazioni
P∞
n=0 cn (x
La dimostrazione si trova nell’approfondimento a pagina 39.
n
− x0 ) si verifica
① la serie converge solo per x = x0 ; ② la serie converge assolutamente per ogni x ∈ R; ③ esiste un numero reale R > 0 tale che la serie converge assolutamente per ogni valore di x con |x − x0 | < R e non converge per |x − x0 | > R. Si dice che la serie ha raggio di convergenza nullo nel primo caso, infinito nel secondo e R nell’ultimo caso.
Ricordiamo che si dice che una serie converge assolutamente quando converge la serie dei P valori assoluti dei suoi termini n |an |. Abbiamo visto nel primo volume che la convergenza assoluta implica quella semplice (ma non viceversa).
§ 1. Serie di potenze
Dimostrazione del Teorema (II.8). Il teorema discende immediatamente dal Criterio del rapporto nel caso in cui esista il limite del rapporto |cn+1 /cn |, che però non è una ipotesi necessaria. Nel caso generale, la dimostrazione si basa sul seguente risultato. P n Proposizione. Se la serie numerica cn r , (r , 0) conP verge, allora la serie di potenze cn (x − x0 )n converge assolutamente per ogni x tale che |x − x0 | < |r|. P Dimostrazione. Siccome la serie cn rn converge, la successione dei suoi termini tende a zero, ed è pertanto una successione limitata: in altre parole, esiste una costante K > 0 tale che |cn rn | ≤ K per ogni valore di n. Dunque si ha n n (x − x0 ) x − x0 . |cn (x − x0 )n | = |cn rn | ≤ K rn r P x−x0 n r è una serie geoOsserviamo che la serie metrica di ragione |(x − x0 )/r| e dunque converge se
39
|(x − x0 )/r| < 1, ovvero se |(x − x0 )| < |r|. Il Criterio permette di concludere che anche P di confronto cn (x − x0 )n converge per |(x − x0 )| < |r|. Grazie al precedente risultato, possiamo ora dimostrare il teorema in questione. Dimostrazione delPTeorema (II.8). Consideriamo ora la serie di potenze cn (x − x0 )n e studiamo la struttura del suo insieme di convergenza A. Se A = {x0 } oppure A = R ricadiamo nei primi due casi. Supponiamo allora che A contenga punti diversi da x0 ma non coincida con P l’asse reale: questo significa che esiste y , x0 tale che cn (y−x0 )n non converge. In base alla proposizione precedente A non può contenere alcun punto x tale che |x − x0 | > |y − x0 |: quindi A è un insieme limitato. Il raggio di convergenza è dunque l’estremo superiore R ≥ 0 dell’insieme dei numeri x − x0 = r ≥ 0 nei quali P la serie cn (x − x0 ) converge, ovvero X n o R = sup r ≥ 0 : cn rn converge .
Dunque l’analisi della convergenza di una serie di potenze si riconduce alla determinazione del suo raggio di convergenza. Nel caso questo sia finito (e non nullo), per completare lo studio è necessario ancora stabilire se la serie converge o meno agli estremi dell’intervallo di convergenza. (II.9) Esempio. La serie ∞ X xn n=1
La serie converge quindi per |x| < 1 e non converge per |x| > 1. Studiamo ora la convergenza agli estremi dell’intervallo (−1, 1). Per x = 1 troviamo la nota serie armonica divergente
n=1
1 n
(si veda anche l’Esempio (II.1) sulle serie armoniche generalizzate). Per x = −1 troviamo invece la serie a termini di segno alterno ∞ X (−1)n n=1
a determinare il raggio di convergenza, occorre dunque studiare le serie numeriche corrispondenti alla scelta x = x0 − R e x = x0 + R.
n
ha raggio di convergenza R = 1. Infatti, ponendo come al solito an = xn /n, per applicare il Criterio del rapporto calcoliamo n|x|n+1 an+1 = |x|. lim = lim n→+∞ an n→+∞ (n + 1)|x|n
∞ X
Oltre
n
,
Ricordiamo anche l’enunciato
del Criterio di Leibniz, utile per determinare la convergenza delle serie a termini di segno alterno Se bn è una successione decrescente che tende a zero allora la serie ∞ X (−1)n bn n=1
è convergente. P∞ n Inoltre, detta S = n=1 (−1) bn la somma della serie, si può stimare l’errore con il primo termine tralasciato: m X n (−1) bn ≤ bm+1 . |Rm | = S − n=1
40
Successioni e serie di funzioni
che converge per il Criterio di Leibniz riportato qui a fianco. In definitiva l’insieme di convergenza è l’intervallo aperto a destra [−1, 1). L’esempio precedente suggerisce come derivare dal Criterio del rapporto per le serie una formula generale per la determinazione del raggio di convergenza di una serie di potenze. (II.10) Teorema. Il raggio di convergenza della serie di potenze P n n cn (x − x0 ) è cn (1) R = lim , n→+∞ cn+1
Questo risultato è dimostrato nell’
Esercizio 2 a pagina 92. Si veda anche l’analogo Criterio della radice per la determinazione del raggio di convergenza, enunciato nell’Esercizio 3 .
sempre che il limite esista (eventualmente +∞). (II.11) Esempio. La serie di potenze ∞ X (x + 1)n (n + 1)2n n=0
ha centro in x0 = −1 e coefficienti positivi cn = 1/((n+1)2n). Applicando il Teorema (II.10) possiamo calcolare il raggio di convergenza R valutando il limite n+2 1 cn n+1 · 2 (n + 2) = 2. lim lim = lim = 2 n→+∞ n→+∞ cn+1 n→+∞ 2n (n + 1) n+1 Dunque R = 2 e l’insieme di convergenza è un intervallo di estremi x0 − R = −1 − 2 = −3 e x0 + R = −1 + 2 = 1. Dobbiamo ora studiare il comportamento della serie agli estremi di tale intervallo: ponendo P P∞ (−1)n (−2)n x = −3 troviamo la serie ∞ n=0 (n+1)2n = n=0 (n+1) ; si tratta di una serie armonica a termini di segno alterno, chePconverge per P il Criterio di Leib∞ 1 2n niz. Per x = 1 invece troviamo la serie ∞ n=0 n+1 , che è la n=0 (n+1)2n = nota serie armonica divergente. Possiamo ora concludere che l’insieme di convergenza è l’intervallo [−3, 1). (II.12) Esempio. Per determinare il raggio di convergenza della serie di Bessel dell’Esempio (II.2) J1 (x) =
∞ X n=0
(−1)n x2n+1 , + 1)!
22n+1 n!(n
non possiamo applicare il Teorema (II.10) perché tutti i coefficienti cn di posto pari (corrispondenti cioè a potenze pari di x) sono nulli. Per studiare la convergenza della serie fissiamo dunque x, poniamo an = (−1)n x2n+1 /22n n!(n + 1)! e studiamo la convergenza della serie numerica
Questo
esempio invita ad applicare con giudizio la formula per la determinazione del raggio di convergenza; infatti potrebbe porsi il caso che il limite non esista oppure che non abbia senso fare il rapporto dei coefficienti, perché infiniti fra essi di annullano, (come nel caso di serie che contengono solo termini dispari o pari). Questo non significa che il raggio di convergenza non esista (esso esiste sempre, eventualmente infinito) ma che la sua determinazione richiede un uso appropriato dei criteri di convergenza per le serie numeriche.
§ 1. Serie di potenze
41
Operazioni sulle serie di potenze
nell’intervallo di raggio r centrato in x0 , ovvero ∞ X f (x)+1(x) = (an +bn )(x−x0 )n , per ogni x ∈ (x0 −r, x0 +r).
Date due serie di potenze centrate nello stesso punto x0 , ∞ ∞ X X an (x − x0 )n e bn (x − x0 )n ,
Ciò non significa tuttavia che la serie somma abbia proprio r come suo raggio di convergenza (ad esempio, se an = −bn , la serie somma è sempre identicamente nulla e converge su tutto R). Nella situazione sopra descritta, per ogni x ∈ (x0 − r, x0 + r), il prodotto delle serie di potenze è la serie di potenze f · 1 definita mediante le formule seguenti: ∞ ∞ X X n n f (x) · 1(x) = an (x − x0 ) bn (x − x0 ) n=0 n=0 n ∞ X ∞ ∞ X X X i+j = ai b j (x − x0 ) = ai bn−i (x − x0 )n .
n=0
n=0
n=0
possiamo definire una nuova serie di potenze, detta la somma delle due serie, i cui coefficienti sono le somme termine a termine dei coefficienti delle due serie: ∞ X (an + bn )(x − x0 )n . n=0
Indichiamo ora con f e 1 le somme delle due serie di potenze, ed r > 0 il più piccolo fra i due raggi di convergenza. È un semplice esercizio dimostrare che la serie delle somme converge alla funzione f + 1
n=0
i=0 j=0
i=0
Si vedano a questo proposito gli Esercizi 7 e 8 a pagina 92.
P
an , come abbiamo fatto nei primi esempi. Ora an , 0, perciò possiamo applicare il Criterio del rapporto. Risulta n+1 2(n+1)+1 22n n!(n + 1)! x2 an+1 (−1) x an = 22(n+1) (n + 1)!(n + 2)! · (−1)nx2n+1 = 4(n + 2)(n + 1) .
Osserviamo che per qualunque x si ha an+1 lim = 0 < 1. n→+∞ an Dunque per il Criterio del rapporto la serie converge sempre. Ne discende che il raggio di convergenza è R = +∞.
Derivazione e integrazione della serie di potenze Per ogni x nell’intervallo di convergenza di una serie di potenze è definita la somma della serie: f (x) = c0 + c1 (x − x0 ) + c2 (x − x0 )2 + c3 (x − x0 )3 + · · · =
∞ X n=0
cn (x − x0 )n .
In generale possiamo compiere diverse operazioni sulle serie di potenze: possiamo sommarle, moltiplicarle fra loro, elevarle ad una potenza, ottenendo sempre nuove serie di potenze. In questo paragrafo ci poniamo il problema di derivare ed integrare la somma di una serie di potenze. A
Si
sopra.
veda l’approfondimento qui
42
Successioni e serie di funzioni
Le funzioni di Bessel e la diffrazione Vi è un limite teorico alla risoluzione degli strumenti ottici come cannocchiali o macchine fotografiche, dovuto alla diffrazione della luce passante attraverso l’obiettivo. Il fatto che la luce viaggi in linea retta è vero soltanto approssimativamente: nel passaggio attraverso una piccola apertura infatti, i raggi vengono deviati e interferiscono fra loro, con l’effetto di cancellarsi in qualche luogo e di sommarsi in altri. Per esempio la figura di diffrazione prodotta dal passaggio della luce attraverso un obiettivo circolare di diametro d produce una serie di anelli concentrici nell’intensità della luce stessa. Questi vengono chiamati dischi di Airy e corrispondono alle curve di livello minimo della funzione J12 (ρ)/ρ2 (si vedano gli Esercizi 13 e 23 a pagina 93) dove J1 è la funzione di Bessel di indice uno, definita nell’Esempio (II.2), il cui grafico è riportato (non in scala) qui sotto.
ghezza d’onda e f la distanza della schermo dall’obiettivo. Questo fenomeno diventa sempre più significativo al decrescere del diametro dell’apertura, relativamente alla lunghezza d’onda della luce e dà luogo ad un limite teorico per la risoluzione, comparabile con il raggio del primo disco di Airy. Lo stesso fenomeno si riscontra al passaggio della luce attraverso una lente (di un telescopio, per esempio).
Inoltre ρ = 2πrR/λ f , dove R è il raggio sul piano dell’immagine dal centro dell’obiettivo, λ è la lun-
questo fine è naturale chiedersi se la proprietà di linearità della derivata si possa estendere anche alle somme infinite di funzioni, e, in particolare, alle serie di potenze. In tal caso dovrebbe valere la formula f ′ (x) = c1 + 2c2 (x − x0 ) + 3c3 (x − x0 )2 + 4c4 (x − x0 )3 + . . . ∞ ∞ X X = ncn (x − x0 )n−1 = (n + 1)cn+1 (x − x0 )n . n=0
n=0
(II.13) Esempio. Conosciamo la somma della serie geometrica dell’Esempio (II.3), f (x) =
X 1 xn = 1 + x + x2 + x3 + . . . , = 1 − x n=0 ∞
definita in (−1, 1). Possiamo facilmente derivare la funzione f per ogni x ∈ (−1, 1); quindi abbiamo f ′ (x) =
2 1 = f (x) . 2 (1 − x)
La
derivata di una somma finita di funzioni è infatti la somma delle derivate. Vedremo che questo non è sempre vero per tutte le somme infinite di funzioni, si vedano gli Esercizi 20 e 21 a pagina 94.
§ 1. Serie di potenze
43
D’altra parte, sappiamo anche calcolare il quadrato della serie geometrica (il calcolo è svolto nell’Esercizio (II.1) a pagina 73) ∞ 2 2 X xn = 1 + x + x2 + x3 + . . . n=0
= 1 + 2x + 3x2 + · · · =
∞ X
(n + 1)xn .
n=0
Quindi, in questo caso, la derivata della somma f coincide con la somma della serie che si ottiene derivando termine a termine la serie di potenze di f . La situazione descritta nell’esempio corrisponde ad un fatto generale: è infatti possibile derivare e integrare tutte le serie di potenze all’interno dell’insieme di convergenza, nel senso precisato dal seguente teorema, la cui dimostrazione è rimandata al § 5. (II.14) Teorema. La somma di una serie di potenze f (x) =
∞ X n=0
cn (x − x0 )n = c0 + c1 (x − x0 ) + c2 (x − x0 )2 + c3 (x − x0 )3 + . . .
è derivabile (e quindi continua) nell’intervallo di convergenza (x0 −R, x0 + R). Inoltre risulta, per ogni x ∈ (x0 − R, x0 + R) (2)
f ′ (x) =
∞ X n=0
Z
(n + 1)cn+1 (x − x0 )n
x
x0
∞ X c n=1
n−1
n
(x − x0 )n
c2 c1 = c0 (x − x0 ) + (x − x0 )2 + (x − x0 )3 + . . . 2 3 I raggi di convergenza delle serie in (2) e (3) sono entrambi R. Osserviamo che le due formule si possono scrivere nella forma ∞ ∞ X d X d n [cn (x − x0 )n ], cn (x − x0 ) = dx n=0 dx n=0 Z x X ∞ Z x ∞ X n [cn (t − x0 )n ] dt. cn (t − x0 ) dt = x0
f ′ (x) =
∞ X n=0
ncn (x − x0 )n−1 .
= c1 + 2c2 (x − x0 ) + 3c3 (x − x0 )2 + 4c4 (x − x0 )3 + . . . f (t) dt =
(3)
n=0
n=0
x0
Z
x
f (t) dt = x0
∞ X cn (x − x0 )n+1 . n+1 n=0
Il Teorema stabilisce che il raggio di convergenza è lo stesso per la serie di potenze, la serie delle derivate e quella degli integrali. Questo non significa che l’insieme di convergenza sia lo stesso per le tre serie: si veda a tal proposito l’Esercizio 21 a pagina 94. Se la serie converge in x0 ±R, allora la formula di integrazione vale anche con secondo estremo x = x0 ± R: si vedano i commenti a pagina 71, dove si discute la dimostrazione del Teorema (II.14). Osserviamo inoltre che questo risultato discende dal più generale Teorema (II.46).
44
Successioni e serie di funzioni
(II.15) Esempio. Vediamo come il teorema precedente si possa applicare per calcolare alcune serie di potenze a partire da altre serie di cui è nota la Si consideri ad esempio la serie geometrica di ragione −x, P∞somma. n n n=0 (−1) x . Sappiamo che ha raggio di convergenza R = 1 e somma 1/(1 + x): (4)
X 1 = (−1)n xn . 1+x ∞
n=0
Integrando il termine generale della serie si ha Z x xn+1 (−1)n tn dt = (−1)n n+1 0 e in corrispondenza Z x 1 dt = [ln(1 + t)]t=x t=0 = ln(1 + x). 0 1+t
Il Lettore accorto avrà già ricono-
La formula (3) permette allora di dire che le due funzioni coincidono: (5)
ln(1 + x) =
∞ X
(−1)n
n=0
sciuto, nelle somme parziali m–sime della serie a secondo membro, lo sviluppo di Taylor di ordine m, centrato in 0, della funzione ln(1 + x).
n+1
x , n+1
x ∈ (−1, 1).
Se invece applichiamo la formula (2) e deriviamo termine a termine l’espressione (4) otteniamo la somma della serie che ha termine generale d n n n n−1 : dx (−1) x = (−1) nx ∞ X
(−1)n nxn−1 =
n=0
d 1 1 =− dx 1 + x (1 + x)2
per ogni x ∈ (−1, 1).
(II.16) Esempio. La formula (3) si può utilizzare per calcolare mediante una serie numerica alcuni integrali definiti di cui la funzione integranda non ammette una primitiva in forma elementare. Ad esempio possiamo calcolare Z 1 ln(1 + x) dx. x 0 Abbiamo appena visto che ln(1 + x) è la somma della serie di potenze P∞ n xn+1 n=0 (−1) n+1 nell’intervallo (−1, 1), quindi X ln(1 + x) 1 X xn+1 xn (−1)n (−1)n = = , x x n=0 n + 1 n=0 n+1 ∞
∞
x ∈ (−1, 1).
2
Ad esempio e−x , sin x/x, ln(1 + x)/x, etc. Per una discussione su questo argomento si rimanda al Capitolo X del primo volume.
§ 1. Serie di potenze
45
Il Teorema di Abel
e dunque abbiamo, passando al limite per m → +∞:
A complemento dell’enunciato del Teorema (II.14) riguardante la continuità di una serie di potenze all’interno dell’intervallo di convergenza, abbiamo il seguente risultato: Teorema di Abel. Nella situazionePdel Teorema (II.14), supponiamo che la serie numerica cn Rn sia convergente. Allora X cn Rn . lim − f (x) = x→(x0 +R)
n
Un’applicazione immediata del Teorema è la seguente: poiché, in conseguenza del Criterio di Leibniz, la serie (5) converge anche per x = 1, deduciamo che +∞ X (−1)n+1 = lim− ln(1 + x) = ln 2 . x→1 n n=1 Dimostrazione. Con un cambio di variabile ci si può facilmente ricondurre al caso x0 = P 0 ed R = 1. Consideriamo le somme parziali sn = nk=0 ck . Poiché cn = sn − sn−1 , possiamo scrivere (ponendo s−1 = 0) m X
cn xn =
n=0
m X n=0
sn xn −
m X
sn−1 xn =
n=0
m X n=0
sn xn −x
m−1 X n=0
sn xn
f (x) = (1 − x)
+∞ X n=0
Sapendo anche che deduciamo che
sn xn , per |x| < 1.
P
f (x) − s = (1 − x)
n
xn = 1/(1 − x), per |x| < 1,
+∞ X (sn − s)xn . n=0
Poiché sn → s, per ogni ε > 0 esiste N tale che |s − sn | < ε/2 se n > N. Per tale N, stimiamo,per x vicino ad 1 N +∞ X X f (x) − s ≤ (1 − x) |sn − s| xn + (1 − x) |sn − s| xn n=0
≤ (1 − x)
n=N+1
N X
+∞ X ε |sn − s| xn + (1 − x) xn < ε , 2 n=0 n=N+1
a patto di scegliere δ > 0 tale che 1 − δ < x < 1 =⇒ (1 − x) Dunque limx→1− f (x) = s.
N X n=0
|sn − s| xn <
ε . 2
Applicando la formula di integrazione per serie abbiamo Z
1 0
X ln(1 + x) dx = x n=0 ∞
=
∞ X n=0
Z
1
(−1)n 0
(−1)n n+1
Z
xn dx n+1 1
∞ X (−1)n x dx = . (n + 1)2 n=0 n
0
Vedremo nell’Esercizio (II.9) a pagina 81 che questa serie ha somma π2 /12; in generale non sarà possibile calcolare esattamente il valore della serie ma ottenerne un’approssimazione accurata quanto si desidera sostituendo alla serie la sua somma m-esima con m opportuno. La formula di derivazione termine a termine si può applicare più volte. Infatti la funzione f ′ è ancora una serie di potenze di raggio R e il teorema si può applicare per ottenere l’espressione della serie di potenze derivata di f ′ , cioè f ′′ , che è di nuovo una serie di potenze dello stesso
[Maximum remedium irae, mora est]
Ad
esempio, utilizzando la stima dell’errore del Criterio di Leibniz sappiamo che basta sommare i primi 9 termini della serie per avere una stima della serie con un errore inferiore a 1/100.
46
Successioni e serie di funzioni
raggio di convergenza R: f ′′ (x) = 2c2 + 3 · 2c3 (x − x0 ) + 4 · 3c4 (x − x0 )2 + 5 · 4c4 (x − x0 )3 + . . . ∞ ∞ X X = (n + 2)(n + 1)cn+2 (x − x0 )n = n(n − 1)cn (x − x0 )n−2 . n=0
n=2
E poi, sempre nell’intervallo (x0 − R, x0 + R), possiamo derivare una terza volta: f ′′′ (x) = 3 · 2c3 + 4 · 3 · 2c4 (x − x0 ) + 5 · 4 · 3c5 (x − x0 )2 + . . . ∞ X = (n + 3)(n + 2)(n + 1)cn+3 (x − x0 )n n=0
=
∞ X n=3
n(n − 1)(n − 2)cn (x − x0 )n−3 .
Procedendo in questo modo possiamo determinare l’espressione della derivata k-esima della somma f . (II.17) Corollario. La somma di una serie di potenze è una funzione che ha derivate di ogni ordine nell’intervallo di convergenza (x0 − R, x0 + R). Inoltre, in tale intervallo, f (k) (x) =
∞ X (n + k)(n + k − 1) · · · (n + 1)cn+k (x − x0 )n .
Si dice che la serie di potenze è indefinitamente derivabile e si scrive f ∈ C∞ .
n=0
C’è una relazione di fondamentale importanza fra i coefficienti cn della serie e le derivate successive della funzione f valutate in x = x0 . Se nella formula (2) poniamo x = x0 , troviamo infatti che f ′ (x0 ) = c1 . Dall’espressione delle derivate seconda e terza ricaviamo poi le relazioni f ′′ (x0 ) = 2 · 1 · c2
e
f ′′′ (x0 ) = 3 · 2 · 1 · c3 .
Ora è facile indovinare la formula che lega i coefficienti della serie alle derivate successive di f nel punto x0 : f (k) (x0 ) = k(k − 1) · · · 3 · 2 · 1 · ck = k! · ck
⇐⇒
ck =
f (k) (x0 ) . k!
§ 2. Serie di Taylor Ci proponiamo ora di rovesciare il punto di vista: finora siamo partiti da una serie di potenze per studiare quando converge ad una funzione;
Come
si deduce facilmente dal Corollario (II.17) ponendo x = x0 (l’unico termine non nullo della somma è quello con n = 0).
§ 2. Serie di Taylor
47
adesso vogliamo vedere, data una funzione f , se questa sia uguale alla somma di una serie di potenze. Per quanto detto alla fine del precedente paragrafo, se f è la somma di una serie di potenze centrata in x0 allora, necessariamente, i suoi coefficienti sono legati al valore delle derivate di f in x0 secondo la formula
cn =
f (n) (x0 ) . n!
Si tratta quindi della serie le cui somme parziali sono i polinomi di Taylor della funzione f . Tale serie verrà detta serie di Taylor con centro in x0 della funzione f e si scriveTaylor!serie di
T (x) =
+∞ (n) X f (x0 ) (x − x0 )n . n! n=0
Ricordiamo
che il polinomio di Taylor di f centrato in x0 di ordine m è definito come m X f (n) (x0 ) (x − x0 )n . Tm (x) = n! n=0
Vi è quindi una unica serie di potenze la cui somma possa eguagliare una funzione assegnata f : quella di Taylor della funzione stessa. Come vedremo qui sotto, molte (ma non tutte) delle funzioni elementari che già conosciamo, come ad esempio sin x, ln(1 + x), ex , sono in effetti uguali alla loro serie di Taylor. Vediamo alcuni esempi. (II.18) Esempio. Calcoliamo i polinomi di Taylor centrati in x0 = 0 della funzione f (x) = 1/(1 − x), che abbiamo esaminato nell’Esempio (II.3) a pagina 36. Poiché f (n) (x) = n!/(1 − x)n+1 , abbiamo f (n) (0) = n! e dunque Tm (x) =
m m X f (n) (0) n X n x . x = n! n=0 n=0
Poiché già sappiamo che f (x) =
+∞ X
xn ,
n=0
x ∈ (−1, 1),
possiamo concludere che f (x) = lim Tm (x) = T (x), m→+∞
per ogni x ∈ (−1, 1).
ovvero che la funzione f (x) = 1/(1 − x) è la somma della sua serie di Taylor per ogni x nell’intervallo (−1, 1). (II.19) Esempio. Consideriamo la funzione f (x) = sin x. Abbiamo imparato nel primo volume a costruire i polinomi di Taylor di f di ogni ordine, poiché f è indefinitamente derivabile, e le sue derivate sono f 2n (x) = (−1)n sin x f 2n+1 (x) = (−1)n cos x
⇒
⇒
f 2n (0) = 0 f 2n+1 (0) = (−1)n
Tutte
la volte che prendiamo in considerazione una serie di Taylor supporremo implicitamente che la funzione sia derivabile indefinitamente, almeno in un intervallo centrato in x0 .
48
Successioni e serie di funzioni
F II.3: grafico dei primi 16 polinomi di Taylor centrati nell’origine della funzione sin x. Ognuno di essi costituisce una buona approssimazione del seno al tendere di x a zero, ma l’approssimazione diviene via via peggiore nel discostarsene. Tuttavia la serie converge alla funzione seno, al tendere di m all’infinito, per ogni x.
Poiché
per ogni n = 0, 1, 2, .... Risulta così m X
T2m+1 (x) = T2m+2 (x) = n=0
(−1)n
x2n+1 . (2n + 1)!
Dalla formula di Taylor con resto di Lagrange sappiamo che, per ogni x, (6)
f 2m+3 (ξ) 2m+3 x sin x = T2m+1 (x) + (2m + 3)!
per qualche ξ compreso tra 0 e x. Vogliamo mostrare che per ogni x ∈ R si ha ∞ X x2n+1 (7) sin x = (−1)n = T (x), ∀x ∈ R. (2n + 1)! n=0 Si tratta di verificare che, per ogni x fissato, la differenza m X
x2n+1 R2m+1 (x) = sin x − (−1)n (2n + 1)! n=0 tende a 0 per m → +∞. Dalla (6) otteniamo 2m+3
0 ≤ |R2m+1 (x)| =
|f (ξ)| 2m+3 |x|2m+3 |x| ≤ . (2m + 3)! (2m + 3)!
Ma allora, visto che |x|2m+3 = 0, m→+∞ (2m + 3)! lim
grazie al Teorema dei due carabinieri anche lim |R2m+1 (x)| = 0.
m→+∞
Possiamo finalmente concludere che vale la formula (7), cioè che la funzione sin x è una serie di potenze.
le derivate di ordine pari si annullano nell’origine, i polinomi di Taylor di ogni ordine hanno grado effettivo dispari.
La Formula di Taylor con resto di
Lagrange, che abbiamo studiato nel primo volume, afferma che se la funzione f è derivabile m + 1 volte, per ogni x ∈ R esiste un valore ξ, dipendente da x (e da m, ovviamente), compreso tra x0 e x tale che Rm (x) = f (x) − Tm (x) =
f (m+1) (ξ) (x − x0 )m+1 . (m + 1)!
Poiché la serie è definita come limite delle somme parziali, dimostrare questa identità significa mostrare m X x2n+1 (−1)n che lim = sin x. m→+∞ (2n + 1)! n=0
Abbiamo
usato il fatto che tutte le derivate di f sono comprese tra −1 e 1 in ogni punto.
Applicando
la Condizione necessaria per la convergenza di una serie a quella dell’Esempio (II.7) si verifica immediatamente che, per ogni a fissato, an /n! → 0 per n → +∞. Ricordiamo la versione per successioni del Teorema dei due carabinieri : se an ≤ bn ≤ cn per ogni n e limn→+∞ an = limn→+∞ cn , allora anche bn è convergente, allo stesso limite. Nel caso in questione, an ≡ 0.
§ 2. Serie di Taylor
49
Funzioni analitiche Abbiamo scoperto alla fine del § 1 che se f è sviluppabile in serie di potenze in x0 , necessariamente, i coefficienti della serie sono legati al valore delle derivate di f in x0 secondo la formula cn = f (n) (x0 )/n!. Questo semplice fatto ha alcune conseguenze importanti. Principio di identità per le seriePdi potenze. Se n due centrate in x0 , ∞ n=0 an (x − x0 ) e P∞ serie di potenze n b (x − x ) , convergono e hanno uguale somma 0 n=0 n in un qualunque intervallo contenente il centro stesso allora hanno gli stessi coefficienti per ogni intero n (e dunque lo stesso raggio di convergenza): f (n) (x0 ) , per ogni intero n. n! In pratica, se due funzioni analitiche coincidono in un piccolo intervallo, per quanto minuscolo, esse dovranno essere uguali nel più grande insieme in cui esse sono entrambe sviluppabili in serie di Taylor. Le conseguenze di questa osservazione sollevano interessanti problemi filosofici sulla natura dei modelli fisici. Se stiamo analizzando un modello fisico e supponiamo an = bn =
che il sistema sia descritto da funzioni analitiche, per esempio, di una variabile spaziale, stiamo allora implicitamente supponendo che il comportamento in una regione per quanto minuscola dello spazio determini il comportamento del sistema in tutto lo spazio. Ugualmente, se immaginiamo che la variabile rappresenti il tempo, dedurremo che gli eventi occorrenti in un qualunque intervallo di tempo infinitesimo determinino completamente l’evoluzione del sistema per sempre. Nei fatti, il principio di identità è ancora più forte di quanto non abbiamo appena enunciato. È infatti sufficiente, affinché siano identiche, che le due funzioni assumano gli stessi valori su di una successione convergente al centro della serie: P Principio di continuazione unica. Sia f = ∞ n=0 cn (x− x0 )n una serie di potenze centrata in x0 . Supponiamo che esista una successione xk → x0 tale che f (xk ) = 0, per ogni intero k. Allora cn = 0, per ogni n, e dunque f ≡ 0. Gli zeri di una funzione analitica possono, al contrario di quelli dei polinomi, essere infiniti (si pensi alle funzioni trigonometriche), ma gli spazi fra l’uno e l’altro non possono tendere a zero in un intervallo.
Ci poniamo ora il problema di stabilire quando una generica funzione f (x) sia la somma di una serie di potenze. (II.20) Definizione. La funzione si dice sviluppabile in serie di Taylor centrata in x0 (o anche analitica in x0 ), se esiste r > 0 tale che, nell’intervallo (x0 − r, x0 + r), f è la somma della sua serie di Taylor: ∞ X f (n) (x0 ) f (x) = (x − x0 )n = T (x) n! n=0
per ogni x in (x0 − r, x0 + r). (II.21) Esempio. Proviamo che f (x) = ex è sviluppabile in serie di Taylor in x0 = 0. Come già sappiamo, la serie di Taylor di f è ∞ ∞ X f (n) (0) n X xn x = . n! n! n=0 n=0
Abbiamo già visto nell’Esempio (II.7) all’inizio del capitolo che questa serie converge per ogni x ∈ R. Secondo la Definizione (II.20) dobbiamo verificare che, posto Rm (x) = f (x) − Tm (x) = f (x) −
m X f (n) (0) n x , n! n=0
Sappiamo
già dal Corollario (II.17) che f deve essere indefinitamente derivabile.
In altre parole, f (x) = lim Tm (x). m→+∞
Si dice che una funzione è analitica in un intervallo se lo è in ogni punto dell’intervallo stesso.
Infatti
f (n) (0) = e0 = 1 per ogni n.
50
Successioni e serie di funzioni
F II.4: polinomi esponenziale.
di
Taylor
della
funzione
allora limn→+∞ Rn (x) = 0. Dalla Formula di Taylor con resto di Lagrange abbiamo Rm (x) =
f (m+1) (ξ) m+1 eξ x = xm+1 , (m + 1)! (m + 1)!
da cui, essendo 0 < |ξ| < |x|, otteniamo 0 < |Rm (x)| ≤ e|x|
|x|m+1 . (m + 1)!
Come nell’Esempio (II.19), essendo x fissato, l’ultimo membro tende a 0 per m → +∞, perciò possiamo concludere che lim Rm (x) = 0,
m→+∞
∀x ∈ R.
Dunque la funzione f è sviluppabile in serie di potenze su tutto R e possiamo scrivere
(8)
ex =
∞ X xn n=0
n!
,
∀x ∈ R.
Il tipo di ragionamento visto nell’esempio può essere usato per stimare la differenza fra il valore di una funzione generica f con quello del suo polinomio di Taylor di ordine m, scrivendola come resto in forma di Lagrange. Nel caso generale otteniamo il seguente teorema. (II.22) Teorema (Criterio di sviluppabilità). Se f è dotata di derivate di ogni ordine in I = (x0 − r, x0 + r) ed esiste M > 0 tale che (9) f (n) (x) ≤ M n! r−n , per ogni x ∈ I e n ∈ N, allora f risulta sviluppabile in serie di Taylor centrata in x0 in I.
La
dimostrazione del teorema è svolta nell’Esercizio 15 a pagina 93.
§ 2. Serie di Taylor
Serie a valori in C e funzione esponenziale complessa Le serie numeriche e di potenze trovano la loro collocazione naturale in campo complesso. Per parlare di convergenza di una serie di numeri complessi (anziché reali) occorre estendere il concetto di limite di una successione di numeri complessi cn ∈ C a c ∈ C: diremo che cn → c se per ogni ε > 0 esiste N tale che n > N ⇒ |cn − c| < ε,
dove | · | è il modulo di un numero complesso. In altre parole, la distanza nel piano tra cn e c è infinitesima per n P → ∞. Analogamente una serie di numeri complessi ∞ si dice convergente al valore n=0 cn dove cn ∈ C P n S se la successione sm = m n=0 c di numeri complessi ha limite S. Si verifica facilmente che la convergenza della serie a termini complessi cn = xP n +iyn è equivalenP∞ te alla convergenza delle due serie ∞ n=0 xn e n=0 yn . Inoltre anche per le serie a termini complessi la convergenzaPassoluta (cioè la convergenza della serie dei n moduli ∞ n=0 |c| ) implica la convergenza della serie. Consideriamo ora la serie di potenze ∞ X bn (z − z0 )n , bn , z0 ∈ C n=0
con coefficienti complessi e variabile z ∈ C. In base alle considerazioni precedenti è facile dimostrare l’analogo del Teorema (II.8), e si trova che l’insieme di convergenza è descritto dalla relazione |z − z0 | < R con R come in (1). Ovvero è un cerchio nel piano complesso centrato in z0 e raggio R se R > 0, è ridotto al solo z0 se R = 0 oppure tutto C se R = ∞. Questa osservazione permette di estendere al campo complesso tutte le funzioni analitiche che abbiamo
51
incontrato in questo capitolo. Ad esempio la serie ∞ X zn (10) ez = n! n=0 converge qualunqueP sia il numero complesso z; infatti |z|n la serie dei moduli ∞ n=0 n! è convergente (Esempio (II.10)) in tutto R. La somma di questa serie di potenze definisce una funzione da C a C, detta esponenziale complessa. In modo del tutto analogo, basandoci sulle formule (19) e (7), definiamo il seno ed il coseno di un numero complesso: ∞ ∞ X X z2n z2n+1 cos z = (−1)n sin z = (−1)n . (2n)! (2n + 1)! n=0 n=0 Ora, proviamo a calcolare l’esponenziale del numero complesso iz per z ∈ C. Ricordando che in vale ciclicamente (da n = 0) 1, i, −1, −i, abbiamo ∞ n n ∞ ∞ X X X i z z2n z2n+1 eiz = = +i . (−1)n (−1)n n! (2n)! (2n + 1)! n=0 n=0 n=0 Riconosciamo a destra le rappresentazioni in serie di cos z e sin z : abbiamo così dimostrato la Formula di Eulero eiz = cos z + i sin z, giustificando la definizione data nel primo volume di esponenziale di un numero complesso. Come vedremo nell’Esercizio 7 a pagina 92, si prova che ez · ew = ez+w
per ogni z, w ∈ C.
Di conseguenza troviamo le note formule per le funzioni circolari: sin(z + w) = sin z cos w + sin w cos z, cos(z + w) = cos z cos w − sin w sin z.
Si osservi che la condizione è sicuramente verificata se tutte le derivate di f sono (equi)limitate, cioè se esiste una costante K > 0 tale che per ogni x ∈ (−r, r) f (n) (x) ≤ K. Concludiamo il paragrafo con una osservazione: in tutti gli esempi che abbiamo visto la funzione considerata è uguale alla propria serie di Taylor. Ciò però non è vero in generale: esistono funzioni indefinitamente derivabili che non sono uguali alla propria serie di Taylor in un intervallo. Vedremo un esempio di questo fatto nell’Esercizio (II.4) a pagina 76.
Più
in generale, la (9) è soddisfatta se per ogni n sufficientemente grande e per ogni x ∈ (−r, r) vale f (n) (x) ≤ Ln .
52
Successioni e serie di funzioni
§ 3. Soluzioni in serie Le serie di potenze vengono usate frequentemente per rappresentare alcune delle funzioni che si presentano in matematica, fisica e chimica. Ad esempio le serie dell’Esempio (II.12) a pagina 40 prendono il nome dall’astronomo tedesco Friedrich Bessel (1784-1846), che le incontrò nel risolvere l’equazione di Keplero al fine di determinare la legge oraria dei pianeti; da allora le funzioni di Bessel hanno trovato applicazione nello studio di una moltitudine di fenomeni fisici, come il moto di una membrana vibrante, la diffrazione, la propagazione del calore. Esse sono definite come soluzioni in serie dell’equazione differenziale di Bessel
A
tal proposito si veda anche l’approfondimento a pagina 84.
(11) x2 y′′ (x) + xy′ (x) + (x2 − ν2 )y(x) = 0, dove ν ∈ N è un parametro. Cerchiamo una soluzione della forma y(x) =
∞ X
cn x n .
n=0
Supponendo che il raggio di convergenza non sia nullo, possiamo utilizzare la formula (2) per calcolare le derivate y′ e y′′ nell’intervallo di convergenza: ∞ X y′ (x) = (n + 1)cn+1 xn = c1 + 2c2 x + 3c3 x2 + . . . ,
F II.5: convergenza della serie alla funzione di Bessel J0 .
n=0 ∞ X y′′ (x) = (n + 2)(n + 1)cn+2 xn = c2 + 3 · 2c3 x + 4 · 3c4 x2 + . . . . n=0
Possiamo ancora scrivere
Da cui otteniamo ∞ X xy′ (x) = (n + 1)cn+1 xn+1 = c1 x + 2c2 x2 + 3c3 x3 + . . . ,
xy′ (x) = c1 x +
∞ X
(n + 2)cn+2 xn+2 .
n=0
n=0 ∞ X (n + 2)(n + 1)cn+2 xn+2 = c2 x2 + 3 · 2c3 x3 + . . . . x2 y′′ (x) = n=0
D’altra parte abbiamo x2 y(x) =
∞ X
cn xn+2 .
n=0
Sostituendo nell’equazione di Bessel con ν = 0, troviamo c1 x +
∞ X
[((n + 2)(n + 1) + (n + 2)) cn+2 + cn ] xn+2 = 0.
n=0
Dopo aver osservato che ((n + 2)(n + 1) + (n + 2)) = (n + 2)2 , ricaviamo ancora c1 x +
∞ h X n=0
i (n + 2)2 cn+2 + cn xn+2 = 0.
Abbiamo raccolto i termini xn+2 .
§ 4. Serie di Fourier
53
Utilizzando il principio di identità delle serie di potenze (visto nell’approfondimento a pagina 49) otteniamo le condizioni: cn+2 = −
c1 = 0 ,
cn . (n + 2)2
Notiamo che tutti i coefficienti di posto dispari devono annullarsi: c1 = 0, c3 = −
c1 c3 = 0, c5 = − = 0, . . . 9 25
mentre quelli di posto pari sono determinati da c0 tramite la relazione di ricorrenza c2n c2n+2 = − , 4(n + 1)2
Trattandosi
dei coefficienti pari, scriviamo 2n al posto di n.
da cui ricaviamo c2n =
(−1)n c0 . 22n (n!)2
Per esempio ragionando per induzione.
Osserviamo infine che, ragionando come nell’Esempio (II.12), si dimostra facilmente che il raggio di convergenza della serie è infinito. Questo fatto giustifica l’uso della formula (2) in tutto R. Vediamo ora come modificare il ragionamento appena esposto per coprire il caso ν = 1. Sostituendo nell’equazione di Bessel otterremo stavolta c1 x +
∞ h X n=0
Per ν
generico rimandiamo all’Esercizio 12 a pagina 93.
∞ X i cn xn = 0. (n + 2)2 cn+2 + cn xn+2 − ν2 n=0
Da cui otteniamo, dopo aver scorporato i primi due termini, −ν2 c0 + (1 − ν2 )c1 x +
∞ h X n=0
∞ X i cn+2 xn+2 = 0. (n + 2)2 cn+2 + cn xn+2 − ν2 n=0
Per ν = 1 ricaviamo quindi le condizioni cn+2 = −
c0 = 0 ,
cn . (n + 2)2 − 1
Stavolta si dovranno annullare tutti i coefficienti di posto pari mentre quelli di posto dispari soddisfano la relazione di ricorrenza c2n+3 = −
c2n+1 c2n+1 , =− 4(n + 1)(n + 2) (2n + 3)2 − 1
da cui possiamo infine dedurre l’espressione dei coefficienti di posto dispari c2n+1 =
(−1)n . 22n+1 n!(n + 1)!
F II.6: a Bessel è intitolato un cratere lunare nella parte meridionale del Mare Serenitatis.
54
Successioni e serie di funzioni
F II.8: a sinistra sono rappresentate alcune onde armoniche unidimensionali, φ(x, t) = A sin(kx − ωt + ϕ). Sull’asse orizzontale varia x, mentre ogni grafico corrisponde ad un valore di t fissato. Ad ogni istante t troviamo una funzione sinusoidale di x il cui profilo si sposta rigidamente sull’asse x al variare di t. A destra è riportato il grafico della funzione sin(10x) + sin(11x). Profilo della sovrapposizione delle onde armoniche sin(10x + ω1 t) e sin(11x + ω2 t) quando t = 0. Se le due onde si propagano con uguale velocità vedremo il profilo della figura viaggiare con la medesima velocità. Se invece le due onde viaggiano con velocità opposte di modo che le due frequenze abbiamo ugual modulo, ma segno opposto, cioè w1 = −ω2 = ω l’onda risultante sarà una onda stazionaria, di espressione sin(10x − ωt) + sin(11x + ωt) = 2(sin(10x) + sin(11x)) cos(ωt). In un’onda stazionaria quindi il profilo non si propaga orizzontalmente, ma oscilla verticalmente.
§ 4. Serie di Fourier Le serie di potenze hanno una importanza fondamentale in analisi, ma costituiscono una classe di funzioni inadatte ad alcune applicazioni. Per esempio, sono poco efficaci nell’approssimazione delle funzioni trigonometriche, nel senso che i polinomi approssimanti perdono la proprietà di periodicità, come risulta evidente dalla Figura II.3. D’altra parte, la periodicità caratterizza diverse funzioni di fondamentale interesse fisico, quali le onde acustiche, quelle elettromagnetiche e le vibrazioni elastiche. Inoltre, come abbiamo osservato nel Corollario (II.17), soltanto le funzioni estremamente regolari, che ammettano derivate di ogni ordine, possono venire sviluppate in serie di Taylor. Esse non si prestano quindi alla modellizzazione di fenomeni discontinui o impulsivi. Introduciamo in questo paragrafo le serie trigonometriche, o serie di Fourier dal nome del matematico che le introdusse nel ’700, e che hanno la proprietà di rappresentare funzioni più generali, addirittura discontinue, purché periodiche.
Funzioni periodiche e polinomi trigonometrici Moltissimi fenomeni fisici, da quelli acustici a quelli elettromagnetici, si possono rappresentare per mezzo di onde che si propagano viaggiando nello spazio. Una onda armonica unidimensionale elementare è una funzione della forma φ(x, t) = A sin(kx − ωt + ϕ).
F II.7: Jean Baptiste Joseph Fourier (1768–1830).
Ricordiamo che una funzione f è periodica di periodo T se vale la proprietà f (x + T) = f (x) per ogni x del dominio (si sottintende che anche x + T appartenga al dominio). È possibile pertanto disegnare il grafico di f su tutto il suo dominio a partire da quello su un intervallo di ampiezza T (ad esempio su [0, T) o su (−T/2, T/2]) per semplice replicazione e traslazione.
§ 4. Serie di Fourier
55
La quantità c = ω/k è la velocità di propagazione dell’onda lungo l’asse x, k è detto il numero d’onda, λ = 2π/k è la lunghezza dell’onda e f = ω/2π la frequenza. I massimi vengono detti cresta dell’onda di cui A è l’altezza o intensità e ϕ è la fase. Le onde elementari obbediscono al principio di sovrapposizione, cioè interagiscono semplicemente sommandosi in ogni punto; ciò può aumentare l’altezza in alcuni punti del profilo (interferenza costruttiva) e diminuirla in altri (interferenza distruttiva). Questi effetti sono visibili nella Figura II.8, a destra. La sovrapposizione di armoniche elementari con frequenza multipla di una fissata frequenza f , dà luogo a un polinomio trigonometrico di periodo 1/ f . Infatti, utilizzando le basilari formule di addizione per le funzioni trigonometriche, l’armonica elementare può essere espressa come A sin(kx + ϕ) = α cos kx + β sin kx con α = A sin ϕ e β = A cos ϕ. Per convenzione, lavoreremo con la frequenza fondamentale f = 1/2π. (II.23) Definizione. Un polinomio trigonometrico di ordine m è una funzione di periodo 2π di tipo m X
Pm (x) = a0 +
(an cos nx + bn sin nx) ,
n=1
dove i numeri an e bn sono detti coefficienti di Pm . (II.24) Esempio. Ovviamente sommando o sottraendo due polinomi trigonometrici otteniamo ancora un polinomio trigonometrico. Può sembrare strano, ma sono polinomi trigonometrici anche i prodotti di polinomi trigonometrici, e quindi tutte le potenze di seni e coseni e le loro combinazioni. Per esempio, abbiamo cos2 t =
cos(2t) + 1 2
cos(2t) cos t + cos t cos(3t) + 3 cos t = 2 4 cos(3t) cos t + 3 cos t cos t cos4 t = cos3 t cos t = 4 cos(4t) + cos 2t + 3 cos 2t + 3 cos(4t) + 4 cos 2t + 3 = . = 8 8 cos3 t = cos2 t cos t =
Più in generale, possiamo facilmente ricavare della formule di prostaferesi le uguaglianze seguenti, dette formule di Werner 1 [cos((n + m)x) + cos((n − m)x)] 2 1 (12) sin(nx) sin(mx) = [cos((n − m)x) − cos((n + m)x)] 2 1 sin(nx) cos(mx) = [sin((n + m)x) + sin((n − m)x)] . 2 cos(nx) cos(mx) =
F II.9: grafico di cos(2.5 sin(x) − x), periodica di periodo 2π.
È facile vedere che le funzioni cos nx, sin nx sono 2π–periodiche per ogni n intero. Quindi anche ogni polinomio trigonometrico lo è, perciò d’ora in poi restringeremo lo studio di tali polinomi (e poi delle serie di Fourier) all’intervallo [−π, π].
Qui
abbiamo utilizzato ripetutamente l’identità cos(x + y) + cos(x − y) . cos x cos y = 2
56
Successioni e serie di funzioni
F II.10: grafico di alcuni dei polinomi trigonometrici delle serie
X n6 cos nx X cos nx rispettivamente. e n! n3/2 n n
Tali formule giustificano l’affermazione che il prodotto fra due qualunque polinomi trigonometrici sia a sua volta un polinomio trigonometrico. Benché alcune funzioni possano essere polinomi trigonometrici sotto mentite spoglie, una volta smascherate possiamo asserire che esse determinano univocamente i coefficienti an e bn . Possiamo estendere l’ambito dei polinomi trigonometrici prendendo in considerazione somme infinite anziché somme finite, in modo del tutto analogo a quanto abbiamo fatto passando dai polinomi alle serie di potenze. Tali serie verranno dette serie trigonometriche o serie di Fourier ed hanno la forma a0 +
∞ X
(an cos nx + bn sin nx) .
n=1
(II.25) Esempio. La serie trigonometrica ∞ X n6 cos nx n=1
n!
converge per ogni x ∈ [−π, π], come si può facilmente dedurre dal Criterio del confronto: n6 cos nx n5 = cn . ≤ n! (n − 1)! P Infatti si verifica facilmente che la serie ∞ n=1 cn è convergente, per esempio utilizzando il Criterio del rapporto. Notiamo che in generale i termini delle serie di Fourier non hanno segno costante. Faremo quindi sistematicamente ricorso alla nozione di convergenza assoluta ed ai criteri di convergenza relativi. Analogamente, anche la serie trigonometrica ∞ X cos nx n=0
n3/2
Vale in fatti un principio
di identità dei polinomi trigonometrici : due polinomi trigonometrici definiscono la stessa funzione se e soltanto se hanno uguali coefficienti. Questo principio discende immediatamente dalle formule (14), (15) e (16), che vedremo tra qualche pagina, che legano i coefficienti an e bn agli integrali di f moltiplicata per le armoniche fondamentali.
§ 4. Serie di Fourier
Onde elettromagnetiche Le onde elettromagnetiche si trasmettono nello spazio alla velocità della luce (si veda l’approfondimento a pagina 361): perciò vengono largamente utilizzate per la trasmissione dei segnali nelle telecomunicazioni. Per segnali si intendono delle variazioni di grandezze fisiche che trasportano informazioni. Poiché la velocità c delle onde elettromagnetiche è costante, vi è una relazione fissa fra la lunghezza di un’onda e la sua frequenza: c = f λ. Un’onda elettromagnetica è quindi determinata dai tre parametri: altezza, frequenza e fase. Il termine modulazione indica la variazione nel tempo della forma di un’onda assegnata; nel campo delle telecomunicazioni è il sistema più comune per trasportare un segnale e consiste nel variare, nel tempo, i tre parametri che definiscono l’onda, a partire da valori prefissati (dell’onda cosiddetta portante); in altre parole, se la portante è definita da un’onda sinusoidale di ampiezza A, frequenza fp e fase ϕp : xp (t) = A cos(2π fp t + ϕp ), la modulazione di ampiezza (AM) consisterà nel prendere un’ampiezza variabile nel tempo A = A(t), come raffigurato nel grafico:
57
za (FM) consiste invece nel produrre una variazione nella frequenza dell’onda portante. Il primo sistema a modulazione di frequenza (FM) per le comunicazioni radio fu messo a punto nel 1936, dall’inventore statunitense Edwin H. Armstrong. Il principale vantaggio di questo sistema rispetto a quello a modulazione di ampiezza consiste nell’essere meno soggetto a scariche e interferenze. Detto xm (t) il segnale da trasmettere (ed immaginiamo che l’ampiezza sia piccola: |xm (t)| ≤ 1), il segnale modulato avrà espressione: ! Z t xt (t) = A cos 2π f (τ) dτ 0
= A cos 2π
Z th
i
!
fp + f∆ xm (τ) dτ
0
con f (t) = fp + f∆ xm (t). In questa relazione, f (t) è la frequenza istantanea dell’oscillazione e f∆ la sua deviazione rispetto alla frequenza della portante fp . La modulazione di un’onda portante sinusoidale da parte di un segnale sinusoidale a sua volta di frequenza inferiore si può scrivere come: xp (t) = A cos(2π fp t + β sin(2π fm t)) +∞ X =A Jn (β) cos(2π( fp + n fm )t) n=−∞
dove Jn (β) è la funzione di Bessel di prima specie (si veda l’Esercizio 12 a pagina 93).
La modulazione di ampiezza è stata la prima modulazione impiegata nelle trasmissioni via etere da Guglielmo Marconi agli inizi del secolo, in quanto la più facile da concepire e da realizzare, anche se è molto sensibile ai disturbi. La modulazione di frequen-
converge assolutamente per ogni x ∈ [−π, π]. Possiamo infatti maggiorare 1 cos nx n3/2 ≤ n3/2 e usufruire del Criterio del confronto, ricordando la convergenza della serie armonica generalizzata di esponente 3/2 > 1. Il Lettore attento avrà già capito come formulare un semplice Criterio di convergenza per le serie di Fourier (che discende immediatamente del Criterio del confronto fra serie).
Osserviamo che, apparentemente,
quest’ultima serie trigonometrica ha una cuspide in x = 0 (si veda la Figura II.10).
58
Successioni e serie di funzioni
(II.26) Teorema (Convergenza della serie di Fourier). Se ∞ X n=1
(|an | + |bn |) < +∞
allora le serie di Fourier a0 +
∞ X
(an cos nx + bn sin nx) converge
n=1
assolutamente per ogni x ∈ R.
Costruzione della serie di Fourier associata ad una funzione f Sia ora f (x) una funzione reale di periodo 2π. Ci proponiamo di stabilire se esista una serie trigonometrica la cui somma sia proprio f (x). Diremo allora che la funzione f è sviluppabile in serie di Fourier. A questo scopo procediamo come nel § 2 per la determinazione della serie di Taylor e cerchiamo di determinare quale sia la relazione che lega i coefficienti dei polinomi trigonometrici alla funzione somma. Supponiamo perciò che f sia sviluppabile in serie di Fourier, cioè che effettivamente (13) f (x) = a0 +
∞ X
Per funzioni periodiche di periodo diverso da 2π si veda pagina 85.
(an cos nx + bn sin nx)
n=1
per ogni x in R e vediamo di determinare an e bn . A questo scopo seguiamo un procedimento dovuto a Fourier stesso; per determinare am con m fissato in N, consideriamo la (13), moltiplichiamo entrambi i membri per cos mx ed integriamo tra −π e π. Supponiamo nei nostri calcoli che la serie in (13) sia integrabile termine a termine Z π Z π f (x) cos mx dx = a0 cos mx dx+ −π
∞ X n=1
Z
π
an
−π
Z
sin nx cos mx dx .
cos nx cos mx dx + bn −π
!
π
Vedremo
nell’Esercizio (II.12) alcune condizioni su f che assicurano di poter integrare termine a termine la sua serie di Fourier, analogamente a quanto visto per le serie di potenze nel Teorema (II.14).
−π
Osserviamo ora che gli integrali contenuti nella serie sono nulli o valgono π, in dipendenza dal valore di n. Valgono infatti le formule seguenti. (II.27) Formule di ortogonalità. Z π 0 cos nx cos mx dx = π −π Z π 0 sin nx sin mx dx = π −π Z π sin nx cos mx dx = 0, −π
n,m n = m(, 0), n,m n = m(, 0), ∀n ∈ N, m ∈ N.
Le formule di ortogonalità si deducono immediatamente dalle formule di Werner (12) che, integrate fra −π e π danno sempre zero salvo quando n = m, nei primi due casi. Una dimostrazione alternativa, per chi non ricordasse le formule di prostaferesi, si può trovare nell’Esercizio 22 a pagina 94.
§ 4. Serie di Fourier
59
Grazie a queste formule scopriamo che l’unico integrale non nullo nella nostra espressione è quello corrispondente al coefficiente am e vale π. Si ricava così la relazione
(14) am =
1 π
Z
π
f (x) cos mx dx
m = 1, 2, 3, . . . .
−π
Il coefficiente a0 si ricava prendendo il valor medio della funzione
(15) a0 =
1 2π
Z
te in (14) e (16) si possono calcolare a partire da qualunque funzione f che sia integrabile, per esempio continua, oppure con un numero finito di discontinuità a salto, tra −π e π.
L’unico
termine non nullo, integrando la funzione f su un periodo è proprio 2πa0 .
π
f (x) dx. −π
Utilizzando le formule di ortogonalità ricaviamo ancora 1 (16) bm = π
Osserviamo che le costanti defini-
Z
π
f (x) sin mx dx,
m = 1, 2, 3, . . . .
−π
La determinazione dei coefficienti
bm si ottiene in modo del tutto analogo, ma questa volta moltiplicando la serie di partenza (13) per sin mx invece che per cos mx: Z π f (x) sin mx dx −π
In questo modo abbiamo espresso i coefficienti di una serie di Fourier in funzione della sua somma f (x). Gli integrali (14) e (16) vengono detti coefficienti di Fourier di f . (II.28) Definizione. Sia f periodica di periodo 2π. La serie trigonometrica a0 +
∞ X
(an cos nx + bn sin nx)
n=1
con a0 , an e bn definiti in (15), (14) e (16) rispettivamente, si chiama serie di Fourier di f . La serie di Fourier di un polinomio trigonometrico è chiaramente il polinomio stesso, si veda a questo proposito anche l’Esercizio 37 a pagina 95. Indicheremo il polinomio di Fourier di grado m associato ad f con Fm (x) = a0 +
m X
(an cos nx + bn sin nx)
n=1
dove a0 , an , bn sono i coefficienti di Fourier di f . Osservazioni sul calcolo dei coefficienti di Fourier. Se f è periodica di periodo 2π i coefficienti della sua serie di Fourier si possono calcolare
Z = bm
π −π
sin2 mx dx = πbm .
Tutti gli altri integrali sono nulli per le formule di ortogonalità.
60
Successioni e serie di funzioni
integrando su un qualunque intervallo di ampiezza 2π. Infatti risulta, ∀a ∈ R, Z a+2π Z −π Z π Z a+2π f (x) dx = f (x) dx + f (x) dx + f (x) dx. a
−π
a
π
Nell’ultimo integrale si può effettuare la sostituzione x = t + 2π, ottenendo Z a+2π Z a Z −π f (x) dx = f (t) dt = − f (t) dt. −π
π
a
Quest’ultimo integrale si cancella col primo e rimane Z
Z
a+2π
π
f (x) dx =
f (x) dx. −π
a
Se f è pari, i coefficienti bn sono nulli: infatti la funzione f (x) sin nx è una funzione dispari dunque il suo integrale su un intervallo simmetrico (rispetto a x = 0) è nullo. Analogamente se f è dispari sono nulli i coefficienti a0 e an , risultando dispari la funzione f (x) cos nx. Dunque lo sviluppo di una funzione pari contiene solo coseni, quello di una funzione dispari è fatto soltanto di seni. (II.29) Esempio. Consideriamo la funzione f , periodica di periodo 2π, ottenuta prolungando il grafico di (x − π)2 su (0, 2π] (Figura II.12). Osserviamo che la funzione è continua su R ed è pari, dunque i coefficienti bn sono tutti nulli. Si ha invece Z 2π π2 1 1 [(x − π)3 ]2π = , (x − π)2 dx = a0 = 0 2π 0 6π 3
F II.11
e per n = 1, 2, . . . Z
2π
πan = 0
(x − π)2 cos nx dx
Z 2π 2π sin nx sin nx −2 (x − π)2 (x − π) dx n n 0 0 Z 2π 2π 4π 2 − cos nx 2 cos nx dx = 2 . =0− (x − π) − 2 n n n 0 n 0
=
La serie di Fourier associata alla funzione è dunque X cos nx π2 . +4 3 n2 ∞
n=1
Alcune sue somme parziali sono rappresentate in Figura II.11.
F II.12
§ 4. Serie di Fourier
Convergenza della serie di Fourier In analogia all’analisi che abbiamo svolto nel caso delle serie di Taylor, affrontiamo ora il problema di stabilire sotto quali condizioni è vero che una funzione f (x) è uguale alla somma della sua serie di Fourier. Detti Fm i corrispondenti polinomi di Fourier ci chiediamo dunque: fissato x, è vero che lim Fm (x) = f (x)?
m→+∞
Per enunciare correttamente un risultato di convergenza per le serie di Fourier diamo la seguente definizione. (II.30) Definizione. Diciamo che la funzione f : [a, b] → R soddisfa la condizione (D) nell’intervallo [a, b] se esistono un numero finito di punti a ≤ x1 < x2 < · · · < xN ≤ b, tali che f è derivabile in (xi−1 , xi ) e esistono finiti i limiti limx→x+i f ′ (x) e limx→x−i f ′ (x), per ogni i = 1, . . . , N. Ad esempio soddisfano questa condizione √ tutte le funzioni studiate negli esempi precedenti; la funzione f (x) = x su [0, 1] non la √ soddisfa perché in x = 0 il limite da destra della derivata f ′ (x) = 1/(2 x) è +∞. Vale il seguente risultato. (II.31) Teorema (Convergenza puntuale della serie di Fourier.). Sia f una funzione periodica di periodo 2π, soddisfacente la condizione (D) della Definizione (II.30) in [−π, π]. Allora per ogni x ∈ R la serie di Fourier di f converge, e il suo valore in x è
61
Possiamo
cercare di esaminare il problema della convergenza delle serie di Fourier utilizzando un software per disegnare i grafici di f e Fm per alcuni m. Se consideriamo la funzione “a gradino” dell’Esempio (II.32) i polinomi di Fourier ricostruiscono bene l’andamento del grafico di f , tranne nei punti di salto (Figura II.14). Dagli esempi analizzati sembra che la serie di Fourier di una funzione converga sempre e che in ogni punto x di continuità di f il valore della serie sia proprio f (x). Purtroppo questo risultato non è vero per una generica funzione continua: gli esempi però sono troppo complicati per essere trattati in questa sede. Equivalentemente, f soddisfa la condizione (D) se la restrizione di f ′ a (xi−1 , xi ) è prolungabile con continuità all’intervallo chiuso [xi−1 , xi ].
La dimostrazione di questo risultato è piuttosto complicata: verrà svolta in più tappe negli Esercizi 39 e 40 .
1 [ f (x+ ) + f (x− )] 2 dove f (x± ) = lim y→x± f (x) sono il limite destro e sinistro di f in x. Le funzioni che soddisfano la condizione (D) risultano quindi uguali alla propria serie di Fourier in ogni punto in cui sono continue; negli eventuali punti di discontinuità (necessariamente di tipo salto), i polinomi di Fourier di f tendono a regolarizzare la funzione e ad attribuirle il valore medio tra il limite destro e il limite sinistro di f : il punto medio del salto di f in x. (II.32) Esempio. La funzione “gradino”, detta anche onda quadra viene largamente utilizzata nelle trasmissione dei segnali digitali. È un segnale elettrico caratterizzato dall’avere solamente due stati possibili, zero e uno, cioè tensione assente o presente. Si tratta della funzione periodica di periodo 2π la cui restrizione all’intervallo (−π, π] è 0 x ∈ (−π, 0], ˜ f (x) = 1 x ∈ (0, π].
F II.13: nei punti di salto della funzione, si verifica il fenomeno di Gibbs: le somme parziali hanno delle rapide oscillazioni in vicinanza della discontinuità. Si veda a tal proposito l’Esercizio 36 .
62
Successioni e serie di funzioni
F II.14: grafico della funzione “gradino” ottenuta prolungando per periodicità 2π la funzione definita in (−π, π] come 0 per x ∈ (−π, 0) e 1 per x ∈ (0, π); di fianco alcuni suoi polinomi di Fourier.
Osserviamo
che cos nπ assume valore +1 per ogni n pari, mentre è −1 se n è dispari: scriveremo quindi
Calcoliamo i coefficienti di Fourier: Z π Z π 1 1 1 a0 = f (x) dx = dx = , 2π −π 2π 0 2 Z π Z π π 1 1 1 1 sin nx = 0, an = f (x) cos nx dx = cos nx dx = π −π π 0 π n 0 Z π Z π 1 1 f (x) sin nx dx = sin nx dx bn = π −π π 0 π 1 − (−1)n 1 1 1 − cos nx = = [− cos nπ + 1] = . π n πn πn 0
cos nπ = (−1)n
(è invece ovvio che sin nπ = 0 per ogni n intero).
Se n = 2k è un numero pari, allora bn = 0, se invece n = 2k + 1 è un 2 numero dispari, allora bn = πn ; in conclusione la serie di Fourier di f è 1 2 X sin(2k + 1)x + . 2 π 2k + 1 ∞
k=0
Essendo f costante a tratti (e quindi soddisfacente la condizione (D) della Definizione (II.30)), vale il teorema di convergenza puntuale in ogni punto, con somma [ f (x+ ) + f (x− )]/2; ad esempio in x = 0 la serie di Fourier vale 1/2, la media del “salto” di f in x = 0. Se x = π/2 si ha 1 = f (π/2) =
L’onda
quadra contiene quindi tutte le onde armoniche fondamentali dispari, e la sua serie di Fourier è convergente, ma non assolutamente convergente. L’altezza della terza armonica è infatti un terzo di quella della prima, quella della quinta un quinto, etc.
1 2 X sin[(2k + 1)π/2] + 2 π 2k + 1 ∞
k=0
da cui
1 2
=
2 π
π=4
P∞
(−1)k k=0 2k+1 ,
e moltiplicando per 2π,
∞ X (−1)k . 2k + 1
Questa
formula può essere utilmente usata per calcolare π con l’approssimazione desiderata!
k=0
§ 5. Convergenza uniforme La convergenza delle serie di potenze e delle serie di Fourier in un punto x ∈ R si riconduce, a livello teorico, all’esistenza del limite lim fn (x)
n→+∞
§ 5. Convergenza uniforme
Convergenza in media quadratica
I polinomi trigonometrici di Fourier godono di una proprietà importante che si può riassumere nel modo seguente: lo scarto quadratico medio tra f e un generico polinomio trigonometrico di ordine m è reso minimo dalla somma parziale m-esima della serie di Fourier associata ad f . Vale infatti il seguente: Teorema. Sia f periodica di periodo 2π una funzione soddisfacente la condizione (D) della Definizione (II.30) in [−π, π] e sia Fm la somma parziale m-esima della serie di Fourier associata ad f . Allora valgono le seguenti affermazioni: ① (Scarto quadratico medio) al variare di Pm (x), tra i polinomi trigonometrici di ordine m, la quantità Z π 1 | f (x) − Pm (x)|2 dx, 2π −π risulta minima per Pm = Fm ; ② (Disuguaglianza di Bessel) Z π ∞ X 1 | f (x)|2 dx ≥ 2a20 + a2n + b2n . π −π n=1
63
La dimostrazione di questi fatti segue da tecniche elementari, si veda il prossimo riquadro a pagina 64. In effetti, si può dimostrare (con strumenti niente affatto elementari e che esulano dagli scopi di questo libro) che la disuguaglianza di Bessel in realtà è una uguaglianza, nota col nome di identità di Bessel–Parseval Z π ∞ X | f (x)|2 dx = π 2a20 + a2n + b2n . −π
n=1
Usando tale identità si arriva a dimostrare che la successione dalle somma parziali m-esime della serie di Fourier associata ad f converge in media quadratica ad f: Z π | f (x) − Fm (x)|2 dx = 0. lim m→+∞
−π
Questo importante risultato è vero per qualunque funzione periodica per la quale è possibile definire la serie di Fourier: ciò suggerisce che la convergenza “più naturale” per le serie di Fourier non è quella puntuale né quella uniforme, bensì la convergenza in media quadratica (si veda a tal proposito anche l’Esempio (IV.51) a pagina 185).
per successioni di funzioni fn che sono polinomi o polinomi trigonometrici di grado n. Consideriamo ora successioni di funzioni del tutto generali e ci poniamo il problema di stabilire per quali x la successione numerica fn (x) risulta convergente. (II.33) Esempio. Sia fn (x) =
nx2 . enx
Osserviamo che il denominatore ha un comportamento che dipende dal segno di x. Se x > 0 si ha limn→+∞ enx = +∞ e di conseguenza lim fn (x) = 0.
n→+∞
Se invece x è negativo il denominatore tende a 0 e concludiamo che il limite della successione è +∞. Se x = 0 si ha fn (0) = 0 ed essendo la successione identicamente nulla, il suo limite è 0. Riassumendo, la successione fn non converge per x < 0, mentre converge per x ≥ 0 alla funzione f (x) = 0.
Infatti, poiché x è fissato abbiamo t nx2 = x lim t = 0 , n→+∞ enx t→+∞ e come si può facilmente verificare applicando all’ultimo limite la Regola di del l’Hôpital, nota dal primo volume. lim
64
Successioni e serie di funzioni
Dimostrazione della disuguaglianza di Bessel. Se Fm è il polinomio di Fourier di ordine m associato ad f , è facile vedere, usando le formule di ortogonalità riportate a pagina 59, che Z π f (x) − Fm (x) · Pm (x) dx = 0
Dato che il primo addendo non dipende da Pm la somma è minima quando Pm = Fm , e quindi vale ①. Per quanto riguarda ②, con calcoli analoghi si prova che Z π m 2 X 2 2 f (x) · Fm (x) dx = π 2a0 + (an + bn ) e
−π
per ogni polinomio trigonometrico Pm di ordine m. Abbiamo quindi Z π 2 f (x) − Pm (x) dx = −π Z π 2 = f (x) − Fm (x) + Fm (x) − Pm (x) dx −π Z π Z π 2 f (x) − Fm (x) dx + [Fm (x) − Pm (x)]2 dx. = −π
−π
−π
Z
π −π
da cui
Z
n=1
m 2 X 2 2 Fm (x) · Fm (x) dx = π 2a0 + (an + bn ) , n=1
π −π
| f (x) − Fm (x)|2 dx Z
π
= −π
m X | f (x)|2 dx − π 2a20 + (a2n + b2n ) , n=1
che, essendo il primo membro non negativo,equivale alla tesi.
(II.34) Definizione. Siano fn funzioni definite (almeno) su un insieme I ⊂ R. Se per ogni x ∈ I esiste il limite lim fn (x)
n→+∞
diciamo che la successione di funzioni fn converge puntualmente in I. La funzione f : I → R definita come f (x) = lim fn (x) n→+∞
si chiama funzione limite. (II.35) Esempio. Consideriamo in I = [0, 1] la successione fn (x) = xn . Fissando x in I si ha ( 0 x ∈ [0, 1) n lim x = 1 x=1 n→+∞ Quindi la successione fn converge puntualmente alla funzione f definita in I come f (x) = 0 per x , 1 e f (1) = 1. Osserviamo che, nonostante le funzioni fn siano continue, ciò non è più vero per il limite f . La convergenza puntuale per successioni di funzioni è dunque una nozione troppo debole per mantenere nel passaggio al limite da fn a f alcune proprietà importanti, come la continuità (o la derivabilità). Per ovviare a questo, introduciamo la nozione di convergenza uniforme, che garantisce invece il passaggio al limite di molte proprietà, tra cui la continuità, l’integrabilità e, in un senso opportuno, la derivabilità.
L’insieme di tutti gli x ∈ R in cui esiste il limite della successione, ovvero il più grande insieme in cui si ha convergenza puntuale, si chiama insieme di convergenza.
§ 5. Convergenza uniforme
65
F II.15: i grafici raffigurano il ruolo di ε nella convergenza uniforme, per due valori di ε. Il grafico di tutti gli elementi della successione fm , per ogni m sufficientemente grande, deve essere contenuto nella striscia di ampiezza ε intorno al grafico della funzione limite: {(x, y) ∈ R2 : x ∈ I, |y − f (x)| < ε}.
Quando una successione converge puntualmente nell’intervallo I, per ogni x fissato nell’intervallo, e per ogni ε > 0, possiamo trovare un indice N = N(x, ε) > 0 a partire dal quale fn (x) si discosta dal limite f (x) meno di ε: n > N ⇒ | fn (x) − f (x)| < ε. Può avvenire che l’indice di “soglia” N, a partire dal quale si ha | fn (x) − f (x)| < ε, dipenda effettivamente da ε e anche dal punto x prescelto. Ciò avviene, nell’Esempio precedente, in cui |xn | < ε , ⇐⇒ n >
ln ε ; ln x
ln ε l’indice N = N(ε, x) > ln x dovrà tendere all’infinito mano a mano che x si avvicina al valore uno. Se, al contrario, è possibile scegliere N indipendentemente da x ∈ I, allora la convergenza viene detta uniforme.
(II.36) Definizione. Diciamo che la successione di funzioni fn converge uniformemente in I ad f se risulta lim sup | fn (x) − f (x)| = 0,
n→+∞ x∈I
ovvero se per ogni ε > 0 esiste N = N(ε) > 0 tale che n > N ⇒ | fn (x) − f (x)| < ε,
∀x ∈ I.
Quando la convergenza è uniforme, l’indice soglia N = N(ε), a partire dal quale si ha | fn (x) − f (x)| < ε, dipende solo da ε e non dal punto x: vi è dunque una unica soglia N per tutti i punti x dell’intervallo. In particolare, se fn converge uniformemente a f allora vi converge anche puntualmente.
66
Successioni e serie di funzioni
Dal punto di vista grafico, l’affermazione “ fn converge uniformemente ad f in I” significa dire che il grafico di fn , per ogni n sufficientemente grande, è contenuto nell’insieme del piano {(x, y) : x ∈ I, |y − f (x)| < ε.} Come si vede nella Figura II.15, gli insiemi rappresentati sono striscie di larghezza ε intorno al grafico di f . (II.37) Esempio (Continuazione dell’esempio precedente). Come osservato, la convergenza non è uniforme in I: infatti N = N(ε, x) non può ln ε venire scelto in modo indipendente da x, poiché si deve avere N > ln x e 1/ ln x è arbitrariamente grande quando x si avvicina a 1. Nella Figura II.16, si vede che, fissato 0 < ε < 1, la striscia di ampiezza ε centrata in f è il rettangolo {(x, y) : 0 ≤ x < 1, −ε < y < ε} unito al segmento verticale {(1, y) : 1−ε < y < 1+ε}. I grafici delle funzioni fn non sono mai (per nessun indice n) contenute nella striscia, la convergenza quindi non è uniforme in [0, 1). La convergenza ad f risulta invece essere uniforme in ogni intervallo del tipo J = [0, a] con 0 < a < 1: su questo intervallo, infatti, il limite f è la funzione nulla e la scelta N = N(ε) = ln ε/ ln a va bene per tutto l’intervallo. L’utilità della convergenza uniforme risulta evidente dai prossimi teoremi. (II.38) Teorema. Sia fn una successione di funzioni che converge uniformemente in I = [a, b] a una funzione f . Allora valgono i seguenti fatti. ➔ (Continuità del limite). Se le fn sono continue in I, anche f è continua in I. ➔ (Passaggio al limite sotto il segno di integrale). Se le fn sono continue in I allora vale la formula Z
Z
b n→+∞
fn (x) dx. a
(II.39) Teorema (Passaggio al limite sotto il segno di derivata). Se le fn sono derivabili in I con derivate fn′ continue in I, le fn′ convergono uniformemente in I ad una funzione 1 e le fn convergono puntualmente in almeno un punto x0 ∈ I allora le fn convergono su I ad f derivabile con derivata continua in I, e f ′ (x) = lim fn′ (x) = 1(x), n→+∞
La convergenza uniforme delle fn permette di scambiare l’ordine fra l’operazione di limite rispetto all’indice n e le operazioni di passaggio limite rispetto alla variabile x/integrazione.
b
f (x) dx = lim a
F II.16: la convergenza di fn (x) = xn a f (x) = 0 non è uniforme in [0, 1): il grafico di fn non è contenuto nella striscia di raggio ε intorno al grafico di f . Il grafico delle fn ristrette a J = [0, a] è invece contenuto nella striscia {(x, y) : 0 ≤ x ≤ a, −ε < y < ε}, per ogni n abbastanza grande se 0 < a < 1.
per ogni x ∈ I.
Per scambiare l’operazione di passaggio al limite rispetto da n e quella di derivazione è necessaria la convergenza uniforme delle derivate e quella puntuale, anche in un solo punto, delle funzioni.
§ 5. Convergenza uniforme
67
Abbiamo già osservato nell’Esempio (II.35) che una successione di funzioni continue può convergere puntualmente ad una funzione discontinua. Vediamo ora alcuni esempi che mostrano come la sola convergenza puntuale non sia sufficiente a garantire i passaggi al limite sotto il segno di integrale o di derivata. (II.40) Esempio. Sia I = [0, 1] e consideriamo la successione 2
fn (x) = 2nxe−nx . A x fissato la successione numerica fn (x) converge a 0, dunque fn converge puntualmente in I alla funzione f (x) = 0. Calcoliamo l’integrale definito di fn in I: Z
Z
1
1
fn (x) dx = 0
0
limk→+∞ ke−k = 0, come si verifica immediatamente usando il Teorema di De l’Hôpital.
Infatti
h i 2 2 x=1 = 1 − e−n , 2nxe−nx dx = −e−nx x=0
perciò Z
1
fn (x) dx = lim 1 − e−n = 1.
lim
n→+∞
D’altra parte
n→+∞
0
R1 0
f (x) dx = 0 e
Z
1
f (x) dx = 0.
fn (x) dx ,
1 = lim
n→+∞
Z
1 0
0
In base al teorema appena visto possiamo concludere che la successione (di funzioni continue) non converge uniformemente su I. In effetti la Definizione (II.36) non è soddisfatta; se consideriamo ! r 1 2n −nx2 −nx2 sup |2nxe − 0| = max |2nxe | = fn √ = x∈I e 2n x∈I quest’ultima quantità diverge a +∞ quando n tende a +∞.
(II.41) Esempio. La successione di funzioni fn (x) =
1 sin nx, n
n→+∞
L’estremo
superiore è in realtà un massimo, grazie al Teorema di Weierstrass ( fn è continua sull’intervallo chiuso e limitato); quindi studiando il segno della derivata prima di fn si trova che fn è massima in √ 1/ 2n.
x∈R
converge uniformemente a f (x) = 0 per ogni x ∈ R. Inoltre ogni fn è derivabile e fn′ (x) = cos nx su tutto R. Per vedere che l’affermazione f ′ (x) = lim fn′ (x)
F II.17: la successione 2 fn (x) = 2nxe−nx non converge uniformemente al suo limite.
per ogni x ∈ I.
è falsa, basta guardare cosa succede in x = 0, dove risulta fn′ (0) = 1 per ogni n, e dunque limn→+∞ fn′ (0) = 1, mentre f ′ (0) = 0.
Si
veda anche l’Esercizio (II.14) alla fine del capitolo per un esempio di limite uniforme di funzioni derivabili che non è derivabile.
68
Successioni e serie di funzioni
Convergenza uniforme per le serie Formalizziamo ora il concetto di serie di funzioni, già incontrato nel caso di serie di potenze e serie di Fourier: data una successione di funzioni fn definite su I, si chiama serie di funzioni l’espressione ∞ X n=0
fn = f1 + f2 + · · · + fn + · · ·
Il valore f (x) della serie di funzioni in x ∈ I è il valore della serie numerica P ∞ fn (x), ovvero il limite della successione delle somme parziali sm (x) = Pn=0 m n=0 fn (x) — se esiste. Dalle definizioni di convergenza puntuale e uniforme per successioni di funzioni si ricavano quindi immediatamente le corrispondenti convergenze per le serie di funzioni. (II.42) Definizione. Si dice che la serie a f in I se risulta lim
m→+∞
m X
fn (x) = f (x),
n=0
P∞
n=0 fn
converge puntualmente
∀x ∈ I.
La serie converge uniformemente a f in I se m X lim sup fn (x) − f (x) = 0. m→+∞ x∈I n=0 P Vale la pena di osservare che la serie ∞ n=0 fn (x) converge alla sua somma f (x) se e soltanto se la successione dei resti | f (x) − sm(x)| tende a 0, infatti ∞ m ∞ X X X 0 = lim | f (x)−sm (x)| = lim fn (x) − fn (x) = lim fn (x) . m→+∞ m→+∞ m→+∞ n=m+1 n=0 n=0 Sfruttando questa relazione possiamo caratterizzare la convergenza uniforme per le serie in un modo molto efficace e utile nelle applicazioni: P (II.43) La serie di funzioni ∞ n=0 fn converge uniformemente in I se e solo se è puntualmente convergente in I e risulta ∞ X fn (x) = 0. lim sup m→+∞ x∈I n=m P (II.44) Esempio. La serie ∞ n=1 fn con x fn (x) = 4 x + n4 converge x ∈ R, per confronto con la serie armonica generaP per ogni 4 lizzata ∞ 1/n . Mostriamo ora che la convergenza è uniforme in R. n=1
L’insieme di tutti gli x ∈ R in cui la serie converge si chiama insieme di convergenza.
Grazie a questa
caratterizzazione è possibile studiare la convergenza uniforme di una seria anche senza conoscere il valore della sua somma, cosa che è possibile calcolare in rarissimi casi. Ad esempio la somma della serie ∞ X x n=0
x4 + n4
non è nota, ma nell’Esempio (II.44) mostriamo che è uniformemente convergente su R sfruttando la Proposizione (II.43).
§ 5. Convergenza uniforme
69
Dimostrazione dei Teoremi (II.38) e (II.39) (Continuità del limite). Fissiamo x0 ∈ I e verifichiamo che f è continua in x0 . Per l’ipotesi di convergenza uniforme, fissato ε > 0 esiste N > 0 tale che | fn (x) − f (x)| < ε/3,
∀n > N, ∀x ∈ I.
Fissiamo n0 = N + 1 e scriviamo | f (x) − f (x0 )|
≤ | f (x)− fn0 (x)|+| fn0 (x)− fn0 (x0 )|+| fn0 (x0 )− f (x0 )|.
Grazie alla prima relazione otteniamo che
| f (x) − f (x0 )| ≤ ε/3 + | fn0 (x) − fn0 (x0 )| + ε/3.
Ora sfruttiamo la continuità in x0 della funzione fn0 : esiste infatti δ > 0 tale che |x − x0 | < δ ⇒ | fn0 (x) − fn0 (x0 )| < ε/3.
Sommando abbiamo che per x ∈ I
|x − x0 | < δ ⇒ | f (x) − f (x0 )| < ε,
e questa è proprio la continuità di f in x0 . (Passaggio al limite sotto il segno di integrale). Per la continuità del limite appena dimostrata, sappiamo che f è continua in [a, b] ed esiste dunque il suo integrale Rb f (x) dx. Inoltre vale la disuguaglianza a Z b Z b Z b [ f (x) − fn (x)] dx f (x) dx − fn (x) dx = a
a
Z
≤
a
a
b
| f (x) − fn (x)| dx.
Per l’ipotesi di convergenza uniforme, fissato ε > 0
esiste N > 0 tale che | fn (x) − f (x)| < ε, ˜
Dunque per ogni n > N possiamo continuare le maggiorazioni con Z b Z b Z b f (x) dx − f (x) dx ε dx = ε(b − a), n ≤ a
a
m→+∞
∞ X
a
da cui, per definizione di limite Z b Z b fn (x) dx = 0, f (x) dx − lim n→+∞ a a che implica la tesi. (Passaggio al limite sotto il segno di derivata). Applichiamo il Teorema di Valutazione ad ognuna delle fn′ : abbiamo, per ogni n Z x fn′ (t) dt = fn (x) − fn (x0 ), ∀x ∈ I, x0
dove fn (x0 ) → l per ipotesi. Dato che la successione fn′ converge uniformemente in I a 1(x), essa è continua e vale la formula di passaggio al limite sotto il segno di integrale, che porta a Z x lim fn (x) = lim fn (x0 ) + 1(t) dt, ∀x ∈ I, n→+∞
n→+∞
da cui
x0
Z
x
f (x) = lim fn (x) = l + n→+∞
1(t) dt, x0
∀x ∈ I.
Abbiamo scoperto che f è la funzione integrale di 1 su I: dunque il Teorema Fondamentale del Calcolo garantisce che f è derivabile e f ′ (x) = 1(x),
Chiamiamo P Mn = supx∈R | fn (x)|: se riusciamo a mostrare che la serie numerica ∞ n=1 Mn è convergente, la convergenza uniforme della serie di funzioni segue immediatamente applicando la Proposizione (II.43). Infatti la convergenza della serie di termine Mn si può formulare come lim
∀n > N, ∀x ∈ I.
Mn = 0.
n=m
Poiché per definizione si ha | fn (x)| ≤ Mn per ogni x ∈ R, risulta anche supx∈R | fn (x)| ≤ Mn e infine (dalla disuguaglianza triangolare del valore
∀x ∈ I.
70
Successioni e serie di funzioni
assoluto) ∞ ∞ ∞ X X X | fn (x)| ≤ Mn . fn (x) ≤ sup sup x∈R n=m x∈R n=m n=m Passando al limite per m → +∞ si ottiene proprio la convergenza uniforme della successione! Cerchiamo allora Mn , per n fissato. Questo significa calcolare l’estremo superiore della funzione | fn | in R: per questo è sufficiente cercare i punti di massimo locale e confrontare i valori di fn in quei punti coi limiti di fn a ±∞. Intanto osserviamo che fn è una funzione dispari, quindi basta studiarne il comportamento per x > 0, dove è positiva. Cominciamo col limite: lim
x→+∞ x4
x = 0. + n4
Cerchiamo ora gli estremi locali: essendo fn derivabile i punti candidati si trovano annullando la derivata di fn in x > 0: fn′ (x) =
3n4 − 3x4 x4 + 3n4 − 4x4 = . (x4 + n4 )2 (x4 + n4 )2
L’equazione fn′ (x) = 0 si risolve in x > 0 solo per x = n, dove risulta n 1 fn (n) = n4 +3n 4 = 4n3 . Possiamo quindi concludere che Mn =
1 , 4n3
∀n.
Essendo la serie di termine 1/n3 (serie armonica generalizzata) convergente, dalla discussione precedente la nostra serie di funzioni converge uniformemente in R. Ripercorrendo l’argomento usato nell’Esempio precedente, si può dimostrare un risultato estremamente utile per studiare la convergenza uniforme di una serie di funzioni. (II.45) Teorema (Criterio di Weierstrass). Data la successione di funzioni fn definite in I, se esistono costanti positive Mn per cui ① | fn (x)| ≤ Mn ,
∀x ∈ I; P ② la serie numerica ∞ n=0 Mn è convergente; P allora la serie di funzioni ∞ n=0 fn (x) converge uniformemente in I. Concludiamo la trattazione teorica delle serie di funzioni osservando che i Teoremi (II.38) e (II.39) di passaggio al limite sotto il segno di derivata e di integrale per le successioni di funzioni implicano immediatamente la possibilità di derivare per serie e integrare per serie.
Stiamo pensando n fissato!
§ 5. Convergenza uniforme
71
(II.46) Teorema (Teorema di derivazione e integrazione per serie). P Sia fn una successione di funzioni continue tale che ∞ n=0 fn converge uniformemente in I = [a, b]. Valgono i seguenti fatti. P∞ ① n=0 fn è continua in I. ② Vale la formula Z b X ∞ ∞ Z b X dx = f (x) fn (x) dx. n a a n=0
n=0
③ P Se le fn sono derivabili in I con derivate fn′ continue in I, e se la serie ∞ ′ n=0 fn converge uniformemente in I, allora la serie è derivabile con derivata continua in I e risulta ∞ ′ ∞ X X = f (x) fn′ (x), ∀x ∈ I. n n=0
n=0
Convergenza uniforme della serie di potenze e della serie di Fourier In questo paragrafo analizziamo la convergenza uniforme delle due classi di serie di funzioni che abbiamo studiato in precedenza: le serie di potenze e le serie di Fourier. (II.47) Teorema (Convergenza uniforme della serie di potenze). Se la serie di potenze ∞ X n=0
cn (x − x0 )n
ha raggio di convergenza R > 0, allora converge uniformemente in ogni intervallo chiuso e limitato contenuto in (x0 − R, x0 + R). Dimostrazione. Se fissiamo un qualunque r ∈ (0, R) la serie valutata in x0 + r converge, dunque la successione numerica cn rn (essendo infinitesima) è limitata: esiste M > 0 tale che cn rn < M,
∀n ∈ N.
Prendiamo ora x ∈ [x0 − r, x0 + r]; risulta |cn (x − x0 )n | = |cn rn |
|x − x0 |n |x − x0 |n ≤ M , rn rn
e la serie di termine generale Mn = |x − x0 |n /rn è convergente, perché si tratta di una serie geometrica di ragione |x − x0 |/r < 1. Risultano così verificate le ipotesi
Per quest’ultimo punto non è necessaria la convergenza uniforme della serie di partenza ma solo quella puntuale in almeno un punto.
72
Successioni e serie di funzioni
del Criterio (II.45) e la serie di potenze converge uniformemente nell’intervallo [x0 − r, x0 + r]. Ne segue la convergenza uniforme in ogni [a, b] ⊂ (x0 − R, x0 + R), è infatti possibile scegliere r positivo e minore di R tale che [a, b] ⊂ [x0 −r, x0 +r].
Abbiamo così scoperto che una serie di potenze converge uniformemente in ogni intervallo chiuso contenuto nell’insieme di convergenza: da questa proprietà discende immediatamente la dimostrazione del Teorema di integrazione e derivazione per serie di potenze (II.14), come caso speciale del Teorema generale (II.46). Per quanto riguarda le serie di Fourier di una funzione f la situazione è più complessa. Come abbiamo visto nel § 4, sappiamo garantire la convergenza puntuale della serie se f soddisfa la condizione (D) della Definizione (II.30) . Fortunatamente, basta aggiungere l’ipotesi che f sia continua per avere anche la convergenza uniforme. (II.48) Teorema (Convergenza uniforme della serie di Fourier). Sia f una funzione periodica di periodo 2π, come nella Definizione (II.30) in [−π, π] ma continua su R. Allora la serie di Fourier di f converge uniformemente in R.
Grazie al Teorema di Abel discus-
so nell’approfondimento § 1, il secondo estremo di integrazione può coincidere con gli estremi dell’intervallo di convergenza.
Stesse ipotesi del teorema di convergenza puntuale, in più si chiede che f sia continua su tutto R.
Dimostrazione. In base al Criterio (II.45) basta dimostrare che la serie (17)
∞ X n=1
(|an | + |bn |)
è convergente. Per ottenere questo risultato, consideriamo la funzione f ′ , che è periodica di periodo 2π, ed ha un numero finito di discontinuità di tipo salto in (−π, π]. La disuguaglianza di Bessel applicata ai coefficienti della serie di Fourier di f ′ (che indichiamo con a′n e b′n ) assicura che ∞ X 1Z π | f ′ (x)|2 dx < ∞. |a′n |2 + |b′n |2 ≤ π −π n=1
È facile vedere che sussiste la relazione nan = −b′n ,
nbn = a′n
∀n ∈ N
tra i coefficienti di Fourier di f e di f ′ . Sostituendo l’espressione di a′n e b′n nella relazione precedente, otteniamo la convergenza della serie ∞ X n=1
n2 a2n + b2n < ∞.
Ora ci avvaliamo della disuguaglianza elementare, valida per ogni coppia di numeri reali x, y: 2xy ≤ x2 + y2 e maggioriamo 2|an | = 2 n|an | 1/n ≤ n2 a2n + 1/n2 . |{z} |{z} |{z} |{z} x
y
x2
y2
Si veda l’Esercizio (II.11).
Esercizi
73
Analogamente si ha 2|bn | ≤ n2 b2n + 1/n2 . Ma allora la serie (17) risulta maggiorata dalla serie di termine generale n2 (a2n + b2n )+1/n2 , che è convergente perché somma di due serie convergenti. La serie (17) converge quindi, per il Criterio del confronto, come volevamo dimostrare.
Come conseguenza del teorema possiamo dedurre ancora che, se f è continua e soddisfa la condizione (D) della Definizione (II.30), applicando il Teorema (II.46) è possibile derivare/integrare termine a termine la sua serie di Fourier per avere la serie di Fourier di f ′ o per calcolare un integrale definito di f .
Esercizi
In
realtà vedremo che questo risultato per le serie di Fourier vale anche senza l’ipotesi di continuità per f , Esercizio (II.12).
(II.1) Utilizzando la serie geometrica dell’Esempio (II.3), dimostrare che: ∞ X 1 n 1 , per ogni x con |x| < |a|; x = n+1 a − x a n=0 ∞ X b−a 1 1 xn = − (b) , per |x| < |a| < |b|; n+1 n+1 (a − x)(b − x) a b n=0
(a)
(c)
∞ X n+1 n=0
an+2
xn =
1 , (a − x)2
per |x| < |a|.
Soluzione. La prima identità si ottiene sostituendo x con x/a nella serie geometrica: ∞ n X x n=0
a
=
1 1−
Più precisamente, abbiamo lim
x,
|x| < |a|
m→+∞
m n X x n=0
a
=
1 1−
x, a
|x| < |a|.
a
e dividendo entrambi i membri per a. Per la (b), osserviamo che se |x| < |a| ≤ |b| possiamo sottrarre le due serie ∞ X 1 1 n x = n+1 a − x a n=0
e
∞ X 1 n 1 x = n+1 b − x b n=0
ottenendo ∞ X 1 1 1 1 b−a − xn = − = . n+1 n+1 a − x b − x (a − x)(b − x) a b n=0
Di
nuovo, più precisamente, sottraiamo le somme parziali per poi passare al limite.
74
Successioni e serie di funzioni
Per dimostrare l’ultima identità prendiamo le somme parziali della prima serie: m+1 x m 1− X 1 n 1 a x = a n=0 an a−x
Questa
parte dell’esercizio può sembrare un po’ ostica. È utile svolgerla proprio per sviluppare una maggiore padronanza nel calcolo delle somme finite.
e deriviamo rispetto ad x entrambi i termini. Otteniamo a sinistra 1 X n n−1 1 X n + 1 n X n + 1 n x x = x = a an a an+2 an+1 m
m−1
m−1
n=1
n=0
n=0
e destra invece −(m + 1)
m m+1 x 1 x (a − x) + 1 − a a a . 2 (a − x)
Quindi otteniamo l’uguaglianza m−1 X n+1 n=0
an+2
xn =
m 1 m+1 x m x x − − . (a − x)2 a(a − x) a a(a − x)2 a
Se ora facciamo tendere m a +∞, m|x| < a, otteniamo mricordando che x x che (m + 1) tendono a 0. l’uguaglianza cercata, infatti sia a a (II.2) Determinare l’insieme di convergenza delle serie di potenze ∞ X (x − 1)n √ n n=1
e
∞ X n=1
xn . ln(1 + n)
Soluzione. Determiniamo il raggio di convergenza della prima serie utilizzando il Teorema (II.10): r n+1 cn R = lim = 1. = lim n→+∞ cn+1 n→+∞ n A questo punto il Teorema (II.8) garantisce la convergenza della serie per ogni valore di x tale che |x − 1| < 1 e assicura la non convergenza della serie se |x − 1| > 1. Essendo |x − 1| < 1 ⇔ −1 < x − 1 < 1 ⇔ 0 < x < 2, la serie converge per 0 < x < 2 e diverge se x > 2 o x < 0. Ci occupiamo ora della convergenza agli estremi dell’intervallo (0, 2). Cominciamo a studiare il primo estremo sostituendo √ nella serie il valore P direttamente n n, che converge per il x = 0. Si ottiene la serie numerica ∞ (−1) / n=1
Il Teorema
(II.8) non fornisce informazioni sulla convergenza della serie agli estremi dell’intervallo (x0 − R, x0 +R), cioè nei punti x = 0 e x = 2.
Esercizi
75
Criterio di Leibniz. In corrispondenza al valore x = 2 si ha invece la serie √ P armonica generalizzata ∞ n=1 1/ n che non converge, perché l’esponente è inferiore di 1. Riassumendo, l’insieme di convergenza risulta essere l’intervallo [0, 2). La seconda serie è una serie di potenze centrata in 0, con coefficienti cn = 1/ ln(1+n). Anche in questo caso per determinare il raggio di convergenza possiamo sfruttare il risultato (II.10), essendo cn , 0. Dobbiamo quindi studiare il limite ln(2 + n) cn . lim = lim n→+∞ cn+1 n→+∞ ln(1 + n) Applicando la Regola di de L’Hôpital al quoziente delle funzioni ln(2+x) e ln(1 + x), si trova che il limite esiste ed vale 1. L’insieme di convergenza è dunque l’intervallo di estremi −1 e 1: vogliamo ora capire se negli estremi la serie converge. Cominciamo ponendo x = 1: si ottiene così la serie numerica ∞ X n=0
Sulle serie armoniche generalizzate si veda anche l’Esempio (II.1).
Si ha infatti lim
x→+∞
ln(2 + x) 1+x = lim = 1. ln(1 + x) x→+∞ 2 + x
1 ln(1 + n)
che è divergente grazie al Criterio del confronto con la serie armonica di termine 1/n (che sappiamo essere divergente). Essendo infatti ln(1 + n) ≤ n per ogni n ≥ 1, si ha 1 1 ≥ . ln(1 + n) n
La funzione
logaritmo ln(1 + x) è infatti una funzione concava e y = x è la sua retta tangente nell’origine.
Se invece poniamo x = −1 troviamo la serie ∞ X n=0
(−1)n ln(1 + n)
che converge per il Criterio di Leibniz. Riassumendo, abbiamo mostrato che l’insieme di convergenza è [−1, 1). (II.3) Studiare la sviluppabilità in serie di Taylor delle funzioni arctan x e cos x. Soluzione. Per quanto riguarda la funzione arctan x, ricordiamo che la sua derivata è [arctan x]′ = 1/(1 + x2 ) e quindi possiamo servirci della serie di Taylor di 1/(1 + x2 ) e del Teorema (II.14) per avere immediatamente lo sviluppo richiesto, col vantaggio di non dover calcolare (e successivamente maggiorare) le derivate della funzione. Sappiamo che X 1 = (−1)n x2n , 1 + x2 n=0 ∞
∀x ∈ (−1, 1)
Infatti an = 1/ ln(1 + n) tende a 0 decrescendo.
76
Successioni e serie di funzioni
F II.18: polinomi di Taylor della funzione coseno. Di nuovo, osserviamo che, per ogni m fissato il polinomio Tm è una buona approssimazione di cos x vicino all’origine, ma non lo è per grandi valori di x. Tuttavia, per ogni x il limm Tm (x) = cos x.
essendo 1/(1 + x2 ) la somma della serie geometrica di ragione −x2 . Basta ora integrare termine a termine la serie; per ogni x ∈ (−1, 1) si ottiene Z x ∞ Z x X dt = (−1)n t2n dt arctan x = 2 0 0 1+t n=0 possiamo quindi concludere che ∞ X x2n+1 (18) arctan x = (−1)n , 2n + 1
∀x ∈ (−1, 1).
n=1
Per studiare la sviluppabilità di cos x ricordiamo che abbiamo già mostrato nell’Esempio (II.19) che la funzione sin x è uguale alla sua serie di Taylor centrata in 0. Ragioniamo dunque in modo analogo e applichiamo il Criterio (II.22). Le derivate di ogni ordine di f (x) = cos x si trovano facilmente f (2n) (x) = (−1)n cos x,
f (2n+1) (x) = (−1)n+1 sin x,
e sono tutte limitate su R, risultando | f (k) (x)| ≤ 1,
∀x ∈ R.
Grazie al Criterio di sviluppabilità (II.22) possiamo allora affermare che cos x è la somma della sua serie di Taylor. Le sue derivate nell’origine sono f (2n+1) (0) = 0 e f (2n) (0) = (−1)n , quindi otteniamo
(19) cos x =
∞ X n=0
x2n , (−1) (2n)! n
In
realtà potevamo giungere alla stessa conclusione sfruttando la formula (7) di sviluppo in serie della funzione sin x insieme al Teorema di derivazione per serie (II.46), osservando che cos x è la derivata di sin x. Vale quindi ∞ d X x2n+1 n cos x = (−1) dx (2n + 1)! n=0
∀x ∈ R.
=
=
(II.4) Verificare che la funzione ( −1/x e x>0 f (x) = 0 x≤0 non è sviluppabile in serie di Taylor.
∞ X n=0 ∞ X n=0
(−1)n
2n + 1 2n x (2n + 1)!
(−1)n
x2n . (2n)!
Esercizi
77
Soluzione. Cominciamo a verificare che f ammette tutte le derivate in 0 e che f (n) (0) = 0. Bisogna ricorrere alla definizione di derivata come limite del rapporto incrementale e ricordare che f risulta essere derivabile in 0 se e solo se esistono finiti e sono uguali i limiti destro e sinistro del rapporto incrementale in 0. Essendo lim+
h→0
f (0 + h) − f (0) 1 = lim+ e−1/h = 0, h h→0 h
Per
calcolare il limite si usa la Regola di De l’Hôpital. Con la sostituzione x = 1/h si ha x = 0. lim x→+∞ ex
deduciamo che f ′ (0) = 0, infatti il limite sinistro è certamente nullo, essendo f costante quando x ≤ 0. Analogamente, per il calcolo di f (n) (0) si ricorrerà al limite del rapporto incrementale di f (n−1) : è dunque necessario calcolare le derivate di ogni ordine della funzione 1(x) = e−1/x per x > 0. Calcoliamo le prime quattro derivate 1′ (x) = e−1/x x−2 1′′ (x) = e−1/x −2x−3 + x−4 1(3) (x) = e−1/x 6x−4 − 6x−5 + x−6 1(4) (x) = e−1/x −24x−5 + 36x−6 − 12x−7 + x−8 Possiamo a questo punto congetturare che la derivata n-esima di 1 sia data da (20) 1(n) (x) = pn−1 (x)
e−1/x x2n
dove pn−1 è un polinomio di grado n − 1 nella variabile x. Per dimostrare questa formula possiamo sfruttare l’induzione matematica: essa è vera per n = 0 e supponendola vera per n − 1, dimostriamola per n. Si ha −1/x
d (n−1) e [1 (x)] = 2n dx x
x2 pn−3 (x) + xpn−2 (2 − 2n) + pn−1 (x)
dove la parte in parentesi è un polinomio di grado n − 1: dunque la formula (20) è vera. A questo punto vogliamo dimostrare che f (n) (0) = 0. Procediamo ancora per induzione. Abbiamo già dimostrato che f ′ (0) = 0. Ora supponiamo che f (n−1) (0) = 0 (e quindi che f ammetta derivata (n − 1)-esima continua su tutto R) e calcoliamo il limite del rapporto incrementale destro di f (n−1) in 0, ovvero lim+
h→0
Infatti
" # d e−1/x pn−2 (x) 2(n−1) dx x = pn−3 (x)
e−1/x x2n−2
+ pn−2 (x)(2 − 2n) + pn−1 (x)
e−1/x x2n−1
e−1/x 1 . x2n−2 x2
f (n−1) (0 + h) − f (n−1) (0) 1 pn−2 (h)e−1/h . = lim+ h h→0 h h2(n−1)
Tale limite risulta essere nullo grazie al Teorema di De l’Hôpital. Concludiamo quindi che tutte le derivate di f nell’origine esistono e sono nulle. P f (n) (0) n La serie di Taylor di f in x0 = 0 è dunque ∞ n=0 n! x = 0, cioè la funzione identicamente nulla. Ma 0 , e−1/x se x , 0, dunque f non è la somma della sua serie di Taylor in x , 0.
Come nel caso precedente è sufficiente sostituire x = 1/h e applicare Teorema di De l’Hôpital un numero finito di volte.
78
Successioni e serie di funzioni
(II.5) Dati gli integrali Z
π 0
Z
sin x dx, x
1 0
arctan x dx x
verificare l’applicabilità del teorema di integrazione per serie e sfruttare il teorema per calcolarli. Quanti termini della serie basta sommare per ottenere un valore della somma approssimato a meno di 1/1000? Soluzione. Grazie allo sviluppo in serie di Taylor di sin x a pagina 48 possiamo scrivere sin x X x2n = (−1)n x (2n + 1)! ∞
n=0
Questa serie di potenze converge su tutto R e quindi si può applicare la formula di integrazione per serie (3) per valutare l’integrale su [0, π] Z
π 0
X 1 sin x (−1)n dx = x (2n + 1)! n=0 ∞
=
∞ X n=0
(−1)n
Z
1
x2n dx 0
2n+1
π . (2n + 1)!(2n + 1)
L’ultima serie è una serie numerica a segni alterni e infinitesimi per n → +∞: il Criterio di Leibniz ne garantisce la convergenza e stabilisce che arrestando la somma al termine an si commette un errore che è in modulo inferiore a an+1 . Per avere una stima della somma della serie con un errore inferiore a 1/1000 basta quindi considerare il primo intero n per cui risulta 1 π2n+1 < . (2n + 1)!(2n + 1) 1000 Si trova facilmente (con l’aiuto di una calcolatrice!) che il primo intero utile è n = 5: la stima richiesta dell’integrale è 4 X n=0
(−1)n
π2n+1 ∼ 1.852. (2n + 1)!(2n + 1)
Per calcolare il secondo integrale ricordiamo lo sviluppo in serie di Taylor della funzione arctan x visto nell’Esempio (II.3) e moltiplicando per 1/x abbiamo arctan x X x2n = , (−1)n x (2n + 1) ∞
n=1
∀x ∈ (−1, 1).
Esercizi
79
Grazie al Criterio di Leibniz la serie di potenze converge anche per x = 1 e possiamo applicare la formula di integrazione per serie (3) sull’intero intervallo [0, 1]: Z 1 Z 1 ∞ ∞ X X arctan x 1 1 dx = (−1)n x2n dx = (−1)n . x (2n + 1) 0 (2n + 1)2 0 n=0 n=0
Si veda il commento a pagina 43.
Anche in questo caso possiamo stimare la somma della serie col Criterio di Leibniz: basta trovare il primo intero n per cui risulta 1 1 . < 2 1000 (2n + 1) Si trova n = 16 e la corrispondente stima del valore dell’integrale Z 1 15 X 1 arctan x ∼ 0.915 dx ∼ (−1)n x (2n + 1)2 0 n=0 (II.6) Determinare le soluzioni in serie di potenze dell’equazione di Airy: y′′ (t) − ty(t) = 0. Soluzione. Vogliamo determinare i coefficienti della serie y(t) =
∞ X
an t n .
n=0
Secondo la formula di derivazione delle serie di potenze (2), la derivata seconda di y è la serie ′′
y (t) =
∞ X
F II.19: George Biddell Airy (1801–1892).
Si ha infatti n
(n + 2)(n + 1)an+2 t .
y′ (t) =
n=0
∞ X n=0
nan tn−1 =
an tn+1 =
∞ X
an−1 tn .
n=2
n=1
n=0
n
=
(n + 2)(n + 1)an+2 t −
∞ X
∞ X n=1
∞ X
(n + 2)(n + 1)an+2 tn .
n=0
an−1 tn = 0.
n=1
In questo modo possiamo facilmente raccogliere la potenza n-esima di t, ma abbiamo ancora un problema: la seconda serie comincia con n = 1, mentre la prima con n = 0. Perciò scorporiamo il termine di indice n = 0: 2a2 +
(n+1)an+1 tn ,
e, derivando una seconda volta, ∞ X y′′ (t) = n(n − 1)an tn−2
Imponendo che valga l’equazione differenziale otteniamo ∞ X
∞ X n=0
n=1
D’altra parte abbiamo ty(t) =
∞ X
( (n + 2)(n + 1)an+2 − an−1 ) tn = 0.
Ovviamente si scrive ∞ X (n + 2)(n + 1)an+2 tn = n=0
2 · 1 · a2 +
∞ X n=1
(n + 2)(n + 1)an+2 tn .
80
Successioni e serie di funzioni
La serie di potenze a primo membro è identicamente nulla: se tutti i suoi coefficienti si annullano, ovvero ( 2a2 = 0
In
(n + 2)(n + 1)an+2 − an−1 = 0,
per n = 1, 2, 3, . . .
Troviamo quindi le relazioni fra i coefficienti della serie: a2 = 0 an−1 an+2 = (n + 1)(n + 2) , per n = 1, 2, 3, . . . Possiamo concludere che i termini a2 , a5 , a8 , . . . si annullano: cioè a3n+2 = 0,
conseguenza del Principio di identità delle serie di potenze visto nell’approfondimento a pagina 49. Abbiamo: a0 . a3 = 2·3 Continuiamo: a a4 = 1 3·4 a2 =0 a5 = 4·5 a0 a6 = . (2 · 3)(5 · 6)
per n = 0, 1, 2, 3, . . .
I termini a3 , a6 , a9 , . . . sono invece multipli di a0 , ovvero, a3n =
1 · a0 , (2 · 3)(5 · 6) · · · ((3n − 1) · (3n))
per n = 1, 2, 3, . . .
E infine i termini a4 , a7 , a10 , . . . sono multipli di a1 : a3n+1 =
1 · a1 , (3 · 4)(6 · 7) · · · ((3n) · (3n + 1))
per n = 1, 2, 3, . . .
Abbiamo trovato una famiglia di soluzioni dipendenti dai parametri a0 e a1 (che sono in effetti i valori di y(0) e di y′ (0)). Queste funzioni prendono il nome di funzioni di Airy. (II.7) Dimostrare che, per ogni p ∈ R, la serie di Taylor centrata in 0 della funzione f (x) = (1 + x)p è ! ∞ X p n x , n n=0 e determinarne il raggio di convergenza.
F II.20: grafico di due delle funzioni di Airy.
I
coefficienti binomiali sono definiti, per ogni p reale, come ! p(p − 1) . . . (p − n + 1) p = n n!
per ogni n = 1, 2, 3, . . . , se invece n = 0 si pone np = 1.
Soluzione. Cominciamo a calcolare la serie di Taylor della funzione; servono le derivate di ogni ordine di f , che valgono f (n) (x) = p(p − 1) . . . (p − n + 1)(1 + x)p−n quindi f (n) (0) = p(p − 1) . . . (p − n + 1) e la serie di Taylor di f è ! ∞ X p n x . n n=0 Osserviamo ora che se p è un intero la serie si riduce a un polinomio di ordine p perché i coefficienti binomiali np sono nulli per ogni n > p. Se
Per p ∈ N quindi non c’è nulla da dimostrare!
Esercizi
81
p < N, i coefficienti della serie sono tutti diversi da zero, e per studiare l’intervallo di convergenza della serie calcoliamo p n+1 p − n = . n + 1 p n
Il limite per n → +∞ di questo rapporto è 1 e possiamo concludere grazie al Teorema (II.10) che R = 1. (II.8) Dimostrare che √
1+x=
! ∞ X 1/2 n x , n n=0
∀x ∈ (−1/2, 1/2).
Soluzione. Conosciamo dall’Esercizio precedente la serie di Taylor della funzione. Per cercare di mostrare che la somma della serie è proprio f nell’intervallo (−1/2, 1/2), possiamo rifarci al Criterio di sviluppabilità (II.22). Dobbiamo allora riuscire a controllare le derivate di f in modo indipendente da x, precisamente vogliamo la stima | f (n) (x)| ≤ Mn!r−n , per ogni x ∈ (−1/2, 1/2), con r = 1/2. Abbiamo √ 1 · 3 · . . . · (2n − 3) 1 + x 113 2n − 3 (n) 1/2−n | f (x)| = . ... |1 + x| ≤ 222 2 2n (1 + x)n Non è difficile convincersi che 1 1 3 5 2n − 3 (n − 1)! n! < . · · ≤ · ...· 2 2 2 2 2 4 4 |{z} |{z} |{z} |{z} | {z } ≤1/2
≤1/2
≤2
≤3
≤n−1
Inoltre, poiché x ∈ (−1/2, 1/2), avremo 1/2 < 1 + x < 3/2 e dunque √ p 1+x ≤ 2n 3/2 . n (1 + x) √ In definitiva, posto M = 3/32 ed r = 1/2 troviamo | f (n) (x)| ≤ Mn!r−n , come richiesto per poter applicare il Criterio (II.22) in (−1/2, 1/2). (II.9) Determinare la serie di Fourier della funzione periodica di periodo 2π la cui restrizione all’intervallo (−π, π] è f (x) = x2 . Dimostrare che la somma della serie di Fourier è f (x) in ogni x ∈ R e sfruttare il risultato per mostrare che ∞ X 1 π2 = 6 n2 n=1
e
∞ X (−1)n n=1
n2
=
π2 . 12
Vedremo nell’Esercizio 16 che la formula in realtà è valida per ogni x in (−1, 1); più in generale mostreremo che ! ∞ X p n x ∀x ∈ (−1, 1). (1+x)p = n n=0
per ogni p ∈ R. La dimostrazione è però piuttosto complicata, poiché il Criterio (II.22) si rivela in questo caso inadeguato.
82
Successioni e serie di funzioni
Soluzione. Risulta chiaro che f è una funzione pari, e questo permette subito di concludere che i coefficienti di Fourier bn definiti a pagina 59 sono nulli. Il coefficiente a0 si ottiene immediatamente Z π 1 1 x2 dx = π2 , a0 = 2π −π 3 mentre per il calcolo di an occorre integrare per parti due volte: Z π Z π π sin nx sin nx π − an = 2x dx x2 cos nx dx = x2 2 n 0 n 0 0 Z 2π 2 cos nx π 2 π cos nx + dx = 2 cos nπ. =0− −x − n n n 0 n n 0 Ricaviamo quindi (−1)n n2
an = 4
e la serie di Fourier associata a f è dunque X (−1)n π2 cos nx, +4 3 n2 ∞
∀x ∈ R.
n=1
OsserviamoPche |an | ≤ 4/n2
e poiché la serie 1/n2 è convergente, per il criterio di Weierstrass questa serie converge uniformemente su R.
La funzione f verifica le ipotesi del Teorema di convergenza puntuale (II.31): infatti in (−π, π) è derivabile con f ′ (x) = 2x; agli estremi dell’intervallo esistono finiti i limiti lim f ′ (x) = −2π,
lim f ′ (x) = 2π
x→π−
x→−π+
e dunque f soddisfa la condizione (D) della Definizione (II.30). Inoltre è continua su R e dunque dal Teorema (II.31) si ha l’uguaglianza f (x) =
X (−1)n π2 +4 cos nx, 3 n2 ∞
n=1
∀x ∈ R.
In particolare, per x = π si trova f (π) = π2 =
X (−1)n π2 cos nπ +4 3 n2 ∞
n=1
l’uguaglianza di Parseval vista nell’approfondimento a pagina 63 è utile per calcolare la somma di serie numeriche. Dalla relazione ∞ X 1 Z π a2n +b2n = | f (x)|2 dx−2a20 , π −π n=1
otteniamo Z π ∞ X 1 1 2 = 16 x4 dx − π4 4 π −π 9 n n=1 e poiché l’integrale vale
ovvero ∞
n=1
Con la scelta x = 0 si può calcolare la somma della serie ∞ X (−1)n
n2
=−
2 4 5π
∞ X π4 1 = . 4 90 n n=1
π2 X 1 = . 6 n2
n=1
Anche
π2 . 12
(Per il calcolo della stessa serie si veda anche l’Esercizio 32 ).
Esercizi
83
(II.10) Determinare la serie di Fourier della funzione f periodica di periodo 2π la cui restrizione a (−π, π] è definita da f˜(x) = x,
x ∈ (−π, π].
Studiare quindi la convergenza puntuale della serie trovata.
F II.21
Soluzione. La funzione da studiare è detta “a dente di sega” ed è disegnata in Figura II.21. Osserviamo che essendo f dispari, i coefficienti an sono nulli per ogni n = 0, 1, 2, . . . . Per calcolare bn scriviamo Z π Z 2 π 1 x sin nx dx = x sin nx dx bn = π −π π 0 Z π π 1 2 2 − x cos nx + cos nx dx = π n πn 0 0 π 2 2 1 2 = − π cos nπ + sin nx = − cos nπ. nπ πn n n 0 Abbiamo trovato che la serie di Fourier di f è 2
∞ X (−1)n+1 n=1
n
sin nx.
Per studiare la convergenza della serie usiamo il Teorema (II.31); possiamo concludere che la funzione “dente di sega” è uguale alla sua serie di Fourier in ogni x ∈ (−π, π), essendo f derivabile in questo intervallo. Invece in x = π, dove f non è continua, si ha che la serie di Fourier ha somma [ f (π+ ) + f (π− )] = [(−π) + (π)]/2 = 0 , f (π) = π. (II.11) Sia f periodica di periodo 2π continua in [−π, π] e soddisfi la condizione (D) della Definizione (II.30). Dimostrare che si ha nan = −b′n ,
nbn = a′n ,
∀n ∈ N
dove a′n e b′n sono i coefficienti di Fourier della funzione derivata f ′ e an , bn quelli di f . Soluzione. Le proprietà sono facile conseguenza della formula di integrazione per parti, che possiamo applicare date le ipotesi si f . Risulta così Z n π nan = f (x) cos nx dx π −π Z π 1 1 π f ′ (x) sin nx dx = [ f (x) sin nx]−π − π π −π Z π 1 =− f ′ (x) sin nx dx = −b′n . π −π
F II.22: alcuni polinomi di Fourier della funzione “dente di sega”.
84
Successioni e serie di funzioni
Soluzione in serie di Fourier dell’equazione di Keplero
In virtù della legge delle aree, il segmento ps spazza aree uguali in tempi uguali e dunque il punto y deve muoversi con velocità costante.
Vogliamo trovare una funzione f (t) che verifichi, per ogni t, ωt = f (t) − ε sin( f (t)).
Come vedremo nell’Esercizio 28 , la soluzione dell’equazione si scrive come serie di Fourier ∗∞ X 2Jn (nε) sin(nωt) f (t) = ωt + n n=1 dove Jn è la n-esima funzione di Bessel definita nell’Esercizio 12 a pagina 93. Ora mostriamo come la risoluzione dell’equazione, detta equazione di Keplero, permetta di determinare la legge oraria del moto di un pianeta che ruota su un’ellisse, di cui il Sole occupa un fuoco, obbedendo alla legge delle aree (si veda il riquadro di approfondimento a pagina 235). Nell’equazione, ε ∈ [0, 1] rappresenta l’eccentricità dell’ellisse (nulla nel caso di una circonferenza), mentre la funzione E = f (t) rappresenta l’anomalia eccentrica, il cui fra poco illustreremo il significato geometrico. Per piccoli valori dell’eccentricità (verificata dalle orbite di tutti pianeti del sistema solare eccetto Plutone) la soluzione dell’equazione di Keplero permette di calcolare le orbite con una ottima approssimazione: 1 3 1 f (t) ≈ ωt+ ε − ε3 sin(ωt)+ ε2 sin(2ωt)+ ε3 sin(3ωt)+· · · 8 2 8
Immaginiamo di fissare l’origine nel centro c dell’ellisse e di porre il semiasse maggiore dell’ellisse lungo l’asse orizzontale. Definiamo p = p(t) la posizione del pianeta, s quella del Sole. Il punto c è il centro dell’ellisse, cioè il punto medio fra i due fuochi: se a è il semiasse maggiore dell’ellisse, l’eccentricità vale √ ε = |cs|/a e il semiasse minore è b = a 1 − ε2 . Indichiamo con ϑ l’angolo fra il segmento ps e l’asse orizzontale. L’angolo ϑ è detta anomalia vera. Ora tracciamo, come illustrato nella figura, una circonferenza ausiliaria di raggio a e definiamo x il punto di tale circonferenza su cui si proietta verticalmente il punto p. In questa operazione le ordinate vengono moltiplicate di un fattore a/b. Lo stesso fattore moltiplicherà quindi le aree delle figure che hanno uguale proiezione sull’asse orizzontale. In particolare, in questo modo l’area del settore circolare |zsx| è uguale a a/b per l’area del corrispondente settore ellittico |zsp|. L’anomalia eccentrica E è definita come l’angolo fra il segmento xc e l’asse orizzontale. Il punto y sulla circonferenza ausiliaria è invece definito in modo che l’area del settore circolare ycz sia uguale a a/b per quella del settore ellittico psz.
Se P è il periodo di una rivoluzione, posto ω = 2π/P avremo quindi M = ωt . M viene detta anomalia media. L’uguaglianza delle aree dei settori curvi a2 M a = |zcy| = |zsp| = |zsx| 2 b ed il calcolo a2 E aεa sin E − |zsx| = |zcx| − |scx| = 2 2 implicano che a2 M a2 E aεa sin E = − 2 2 2 da cui finalmente discende l’equazione di Keplero: M = E − ε · sin E.
Ricaviamo infine la relazione fra l’anomalia eccentrica e quella vera (cioè fra gli angoli E e ϑ). La definizione di E si può scrivere come a cos E = aε + r cos ϑ, dove r = |ps| è il raggio. Anche l’equazione dell’ellisse si esprime con una relazione fra r e ϑ 1 − ε2 1 + ε cos ϑ Utilizzando l’identità trigonometrica tan2 possiamo scrivere infine r ϑ 1+ε E tan = tan . 2 1−ε 2 r=a
x 2
=
1−cos x 1+cos x
Esercizi
85
Analogamente si prova la seconda relazione. (II.12) Dimostriamo il Teorema di integrazione termine a termine della serie di Fourier. Sia f periodica di periodo 2π e soddisfi la condizione (D) della Definizione (II.30) in [−π, π]. Fissato x0 ∈ [−π, π] vale la formula Z
x x0
f (t) dt = a0 (x − x0 ) +
∞ Z X n=0
x
(an cos nt + bn sin nt) dt, x0
dove a0 , an e bn sono i coefficienti di Fourier di f . Soluzione. Consideriamo la funzione integrale Z x ∀x ∈ [−π, π], f (t) − a0 dt, F(x) = −π
estesa su R per periodicità di periodo 2π. La funzione F è continua in [−π, π] e si annulla agli estremi; infatti Z π F(π) = f (t) dt − 2πa0 = 0. −π
Dunque F è continua in tutto R e grazie al Teorema (II.48) la serie di Fourier di F converge uniformemente a F in R. Chiamiamo An e Bn i coefficienti di Fourier di F: grazie all’Esercizio (II.11) sappiamo che nAn = −bn ,
nBn = an ,
∀n ∈ N.
Fissati quindi x0 e x in [−π, π] risulta Z x f (t) − a0 dt = F(x) − F(x0 ) x0
=
∞ X
[An (cos nx − cos nx0 ) + Bn (sin nx − sin nx0 )]
n=0 ∞ X
cos nx − cos nx0 sin nx − sin nx0 + an n n n=0 " # Z Z ∞ x x X = bn sin nt dt + an cos nt dt =
n=0
−bn
x0
x0
e la tesi risulta provata.
Periodi diversi da 2π Considerare funzioni di periodo 2π è solo un fatto di comodità e di semplicità nelle notazioni. Si possono infatti considerare serie di Fourier
Non
stiamo supponendo la continuità di f , e quindi non abbiamo, in generale la convergenza uniforme della serie di Fourier di f . Questo risultato quindi non discende dal teorema generale di integrazione per serie (II.46).
86
Successioni e serie di funzioni
costruite con funzioni tipo 2πn 2πn x sin x , cos T T tutte periodiche di periodo T. Data una qualunque funzione periodica di periodo T, integrabile su (−T/2, T/2), la serie di Fourier associata ad f avrà l’aspetto a0 +
∞ X
an cos
n=0
∞ X 2πn 2πn x + x bn cos T T n=0
dove le formule per i coefficienti (14),(15) e (16) vengono sostituite da a0 = an = bn =
1 T 2 T 2 T
Z
T/2
f (x) dx, −T/2 Z T/2
2πn x dx, T 2πn x dx. f (x) sin T
f (x) cos Z
−T/2 T/2 −T/2
(II.13) Sia f la funzione di periodo T = 2 ottenuta prolungando per periodicità f˜(x) = |x|, x ∈ (−1, 1]. Calcolare la serie di Fourier sul periodo T e studiarne la convergenza alla funzione f . Soluzione. Poiché f è pari, i coefficienti bn sono tutti nulli. Si ricava facilmente a0 Z Z 1 1 1 1 a0 = |x| dx = x dx = , 2 −1 2 0 e, integrando per parti, per n ≥ 1 Z 1 Z an = |x| cos(πnx) dx = 2 −1
0
F II.23 1
x cos(πnx) dx =
Z 1 1 1 1 x sin(πnx) − 2 sin(πnx) dx πn πn 0 0 1 1 2 [sin πn − 0] − 2 − 2 2 cos(πnx) = πn πn 0 2 2 (−1)n − 1 = 0 + 2 2 [cos πn − 1] = 2 . π n π n2 Dunque se n è pari, il coefficiente an è nullo, se invece n = 2k + 1 si ha
= 2
a2k+1 = −
4 . π2 (2k + 1)2
Esercizi
87
La serie di Fourier di f è ∞ 4 X cos[π(2k + 1)x] 1 − 2 . 2 π (2k + 1)2 k=0
Per il Teorema (II.31) la serie converge a f (x) per ogni x ∈ R: infatti f è derivabile in (−1, 1) e esistono finiti limx→−1+ f ′ (x) = −1 e limx→1− f ′ (x) = 1; inoltre f è continua su R essendo f (−1) = f (1). (II.14) Studiare la convergenza puntuale e uniforme della successione di funzioni r 1 x ∈ R. fn (x) = x2 + 2 n
Soluzione. Per ogni x fissato in R si ha r √ 1 x2 + 2 = x2 = |x|. lim n→+∞ n Dunque l’insieme di convergenza puntuale è tutto R e la funzione limite è f (x) = |x|. Per studiare la convergenza uniforme occorre valutare la successione r √ 1 2 2 Mn = sup | fn (x) − f (x)| = sup x + 2 − x . n x∈R x∈R
F II.24: grafico di fn (x) = q x2 + n12 per alcuni n e il suo limite f (x) = |x|.
Risulta, per ogni fissato x: r
1 1 x2 + 2 − x2 √ 2 1 1 n x2 + 2 − x2 = r ≤ n1 = . n n √ 1 n x2 + 2 + x2 n
Ma allora 0 ≤ Mn ≤ 1/n che tende a 0 per n → +∞: la convergenza è uniforme su R. Osserviamo che fn è derivabile in ogni punto di R, ma la funzione limite f non è derivabile in x = 0: abbiamo quindi un esempio di successione di funzioni uniformemente convergente che non conserva al limite la derivabilità delle fn .
q Abbiamo moltiplicato e diviso per x2 +
1 n2
+
√ x2 e poi sfruttato la
2 2 formula q (a + b)(a − b)√= a − b con 1 2 2 a = x + n2 e b = x . Infine ab-
biamo osservato che il denominatore è maggiore di 1/n.
88
Successioni e serie di funzioni
(II.15) Studiare la convergenza puntuale della successione di funzioni fn (x) = nx(1 − x2 )n
x ∈ R.
Stabilire se la convergenza è uniforme in [−1, 1]. Verificare che Z
fn (x) dx ,
lim
n→+∞
Z
1 0
1
lim fn (x) dx.
0 n→+∞
Soluzione. Per x fissato si deve calcolare il limite: lim nx(1 − x2 )n .
n→+∞
Osserviamo subito che se |1 − x2 | > 1, si ha limn→+∞ (1 − x2 )n = +∞. In questo caso quindi la √ successione √ fn (x) non può convergere. Se invece |1 − x2| < 1, cioè se − 2 < x < 2, si che fn (x) converge a 0; infatti, posto a = 1 − x2 si ha |a| < 1 e √ lim n 1 − aan = 0.
Ovvero per −1 > 1 − x2 oppure √ 1 − x2 > 1, che √ equivale a x > 2 oppure x < − 2. Si potrebbe avere convergenza so-
lo se x = 0, che non verifica |1 − x2 | > 1.
n→+∞
√ √ √ Infine se x = ± 2 si ha fn (± 2) = ±n 2(−1)n che non ammette limite per n → +∞. √ Possiamo quindi concludere che l’insieme di convergenza √ puntuale è (− 2, 2) e la funzione √ √limite, definita su tale intervallo, è f (x) = 0. Poiché [−1, 1] ⊂ (− 2, 2), fn converge puntualmente alla funzione nulla su [−1, 1]. Vediamo se la convergenza è uniforme, valutando la quantità Mn = sup | fn (x) − f (x)| = max | fn (x)|.
Stiamo
ancora una volta usando il Teorema di Weierstrass.
[−1,1]
[−1,1]
Essendo fn dispari, il suo valore assoluto è una funzione pari, quindi Mn = max | fn (x)| = max fn (x). [0,1]
[0,1]
Inoltre, per n ∈ N fissato, fn è derivabile in (0, 1), non negativa in [0, 1] e si annulla solo negli estremi dell’intervallo. Allora il massimo è assunto in un punto xn di (0, 1) e, grazie al Teorema di Fermat, fn′ (xn ) = 0. Poiché fn′ (x) = n(1 − x2 )n + n2 x(1 − x2 )n−1 (−2x) = n(1 − x2 )n−1 (1 − x2 − 2nx2 ) √ la derivata si annulla solo in xn = 1/ 2n + 1, che è necessariamente il punto di massimo cercato. In corrispondenza si trova n
1 Mn = √ 1− 2n + 1 2n + 1
n
(2n)n = √ . n 2n + 1 (2n + 1) n
F II.25: grafico di fn (x) = nx(1 − x2 )n per alcuni n.
Esercizi
89
Risulta allora limn→+∞ Mn = +∞ e la convergenza non è dunque uniforme in [0, 1] e nemmeno in [−1, 1]. Cerchiamo ora in quali sottoinsiemi di [0, 1] si ha convergenza uniforme. Osservando che xn → 0, sarà necessario considerare insiemi che escludono l’origine, ad esempio insiemi della forma [b, 1] con 0 < b < 1. Definiamo quindi ˜ n = max nx(1 − x2 )n . M [b,1]
Ricordiamo che fn′ (x) > 0 per x < xn e fn′ (x) < 0 per ogni x > xn . Scegliendo n abbastanza grande da avere che xn < b, si avrà in particolare che fn′ (x) < 0 per ogni x ∈ (b, 1), cioè la funzione fn , per n grande è monotona decrescente. Questo significa che
√ imporre 1/ 2n + 1 < b e dunque 2n + 1 > 1/b2 .
Basta
˜ n = max fn (x) = fn (b) = nb(1 − b)n . M [b,1]
Si ottiene così ˜n =0 lim M
n→+∞
e questo prova la convergenza uniforme di fn a 0 in ogni intervallo di tipo [b, 1] con 0 < b < 1. Per concludere l’esercizio osserviamo che il limite degli integrali è Z 1 Z 1 n lim fn (x) dx = lim − (−2x)(1 − x2 )n dx n→+∞ 0 n→+∞ 2 0 n 1 = lim = n→+∞ 2(n + 1) 2 mentre l’integrale del limite è 0. (II.16) Data la serie ∞ X
enx ,
n=0
determinare l’insieme di convergenza puntuale e discutere la convergenza uniforme. Soluzione. Osserviamo che si può scrivere enx = (ex )n : dunque a x fissato si tratta di una serie geometrica di ragione q = ex . La serie geometrica converge se e solo se |q| < 1, ovvero se −1 < ex < 1
cioè se x < 0.
L’insieme di convergenza puntuale della serie è (−∞, 0); sappiamo anche calcolare la somma che è f (x) =
1 . 1 − ex
Grazie alla simmetria di fn si ha convergenza uniforme anche in ogni intervallo di tipo [−1, −b], con 0 < b < 1.
90
Successioni e serie di funzioni
Essendo nota la somma della serie, per valutare se la convergenza è uniforme possiamo servirci della definizione (II.42). Dobbiamo calcolare m X 1 nx e . − lim sup x m→+∞ x<0 1 − e n=0 Valutando la differenza abbiamo: X 1 1 − e(m+1)x e(m+1)x 1 − − = enx = x x x 1−e 1−e 1−e 1 − ex m
n=0
ed essendo lim−
x→0
e(m+1)x = +∞ 1 − ex
l’estremo superiore della funzione in x < 0 è +∞ (per ogni m fissato). Dunque il limite è infinito e la convergenza non è uniforme in x < 0. Dai conti fatti è facile accorgersi che la convergenza sarà uniforme su ogni semiretta di tipo (−∞, b] con b < 0. Infatti risulta m X 1 e(m+1)x e(m+1)b nx = sup − = e sup x x 1 − eb x≤b 1 − e x≤b 1 − e n=0 e il limite di questa quantità per m → +∞ è 0. La convergenza uniforme su (−∞, b] si poteva ottenere anche più rapidamente sfruttando il Criterio di Weierstrass (II.45); per questo basta osservare che enx ≤ enb
b < 0.
per ogni x ≤ b
e che la serie geometrica di ragione eb < 1 è convergente. (II.17) Dimostrare che la serie ∞ X cos(2n x) n=1
Si ha limm→+∞ e(m+1)b = 0 perché
2n
converge nell’intervallo [−π, π], ma che la sua somma non è derivabile nell’origine. (Suggerimento: per dimostrare la non derivabilità in 0, scegliere h = π/2l nel rapporto incrementale.) Soluzione. Per stabilire la convergenza è sufficiente utilizzare il criterio del confronto; infatti vale la maggiorazione n 1 cos(2 x) 2n ≤ 2n .
Non si riesce ad applicare Il Crite-
rio di Weierstrass in x < 0 perché la stima migliore che vale in questo caso è enx < e0 = 1 e la serie di termine generale 1 diverge.
Esercizi
91
F II.26: alcune somme parziali della serie e (a tratto marcato) la sua somma. Si vede come, benché le somme parziali siano funzioni derivabili, il limite presenti punti angolosi.
Chiamiamo quindi f (x) la somma della serie per ogni x ∈ [−π, π]. Osserviamo che f (0) =
∞ ∞ X X 1 1 1 = −1= −1=1. n n 2 2 1 − 1/2 n=0 n=1
Inoltre la funzione f è pari, quindi se fosse derivabile in 0 la sua derivata dovrebbe essere nulla. In particolare se, come suggerito, valutiamo il rapporto incrementale di f tra 0 e i punti π/2l dovrebbe valere lim
l→+∞
f (π/2l ) − f (0) = 0. π/2l
Mostriamo ora che questo non è possibile valutando ∞ X cos(2n−l π) π f l = 2n 2 n=1
=
∞ cos(π/2l−1 ) cos(π/2l−2 ) cos(π/2) cos(π) X 1 + + + +···+ 2 4 2n 2l−1 2l n=l+1
∞ −1 X 1 1 1 1 ≤ + + · · · + l−2 + 0 + l + 2 4 2n 2 2 n=l+1
=
Nei
primi l − 2 termini utilizziamo semplicemente la maggiorazione cos(2n−l π) ≤ 1. Dal termine n = l + 1 in poi, abbiamo invece cos(2n−l π) = cos(2π) = 1.
∞ X 1 1 1 1 1 − l−1 − l − l = 1 − l−2 . n 2 2 2 2 2 n=1
Quindi f (π/2l ) − f (0) 1 − 1/2l−2 − 1 2l −1 4 ≤ = =− π 2l−2 π π/2l π/2l e il rapporto incrementale dovrebbe avere limite minore della quantità (strettamente negativa) 4/π. Concludiamo quindi che f non è derivabile in 0.
Osserviamo che la serie ∞ X cos(2n x) 2n
n=l+1
è simmetrica rispetto alla retta π/2l e si può dunque ripetere lo stesso ragionamento dopo aver traslato la funzione di π/2l .
92
Successioni e serie di funzioni
✎ Diamoci da fare. . . (Soluzioni a pagina 575) b 1 Verificare che l’intervallo di convergenza della serie ✩ 5 Trovare il cerchio di convergenza, C, della serie di di potenze data è l’intervallo E. potenze a valori complessi (approfondimento a pagina 51). ∞ X ∞ ∞ X n X (z − 2i)n (a) x , E = (−1, 1); n n (d) . (a) i z ; n=0 n3n n=1 n=0 ∞ X ∞ ∞ X xn X 1 + 2ni n n (b) , E = [−1, 1); (b) (1 + ni)zn ; (e) z . n n=1 n + 2i n=0 n=1 ∞ ∞ X X xn , E = [−1, 1]. (c) (c) z2n /2n ; n2 n=1 n=1
K 2 Dimostrare il Teorema (II.10) per la determinazione del raggio di convergenza di una serie di potenze, enunciato a pagina 40. 3 Ragionando come nell’Esercizio 2 dimostrare che, data la serie di potenze della Definizione (II.5), il suo raggio di convergenza è (se il limite esiste) 1 R = lim √ . n→∞ n |c | n
∞ X (3x − 1)n ;
(k)
n=1
∞ X 3n n (c) x ; n! n=1
(d) (e) (f)
∞ X n=0 ∞ X n=2 ∞ X n=1
n xn ; n + 4 2n 2n + 1 2n x ; n(n − 1) n−1 (x + 3)n ; n+1
∞ X (−2)n (g) √ (x + 3)n ; n n=1 ∞ X n(x − 2)n (h) ; (n + 1)2 n=0
(i)
∞ X (−1)n n x ; n2 − 1 n=2
f (x) =
(l)
n=1
(m)
∞ X n=1
(n)
n=0
(o)
Dopo aver verificato che la serie converge per x = 1/4, utilizzando la definizione di cn , dimostrare che nell’intervallo di convergenza si ha
n3n
(n + 1)n
n X
ak bn−k .
k=0
2n−1
∞ X (x + 2)n n! n=1
(q)
n 2n + 1
x . 1 − x − x2
Usufruendo dell’Esercizio (II.1) dedurne che !n !n 1 2 2 1 − √ . cn = √ √ √ 5 −1 − 5 5 −1 + 5
cn =
n(x + 3)n ; 2n+1
∞ X (x + 5)2n−1 n=1
(p)
n3 (2x − 1)n ;
∞ X
cn xn .
Calcolare infine il raggio di convergenza della serie. P P∞ ✩ 7 Date due serie di potenzeP ∞ n=0 an e n=0 bn si ∞ definisce la serie prodotto come n=0 cn con
∞ X (−2)n n x ; n4 + 3n n=1 ∞ X
∞ X n=0
f (x) =
b 4 Determinare il raggio R e l’insieme di convergenza E delle seguenti serie di potenze. ∞ ∞ X X (x + 1)n 2n n ; x ; (j) (a) 2 2 n n=2 n ln n n=1 (b)
o 6 Consideriamo la successione di Fibonacci: c0 = 0, c1 = 1, c2 = 1, . . . , cn = cn−1 + cn−2 , . . . e definiamo
xn ;
;
;
∞ 2 X n+1 n (x−1)n ; n n=0
Dimostrare che se le serie di partenza sono assolutamente convergenti allora converge anche la serie prodotto e vale la relazione fra le somme: ∞ ∞ ∞ X X X · = a b cn . n n n=0
n=0
n=0
✩ 8 Mostrare che ∞ ∞ ∞ X zn X wn X (z + w)n · . = n! n! n! n=0 n=0 n=0
Esercizi
9 Applicando P il nrisultato del Teorema (II.14), mostrare che f (x) = ∞ n=0 x /n! risolve l’equazione y′ (x) = y(x). Usando la proprietà di unicità delle soluzioni dell’equazione differenziale lineare dell’Esercizio 25 del Capitolo I, dedurre che f (x) = ex . o 10 Dimostrare che per ogni intero k si ha: Z π (2k)! 1 sin2k x dx = 2k 2 . π 0 2 (k!)
93
(a) Dimostrare che tali serie hanno raggio di convergenza infinito. (b) Dimostrare che Jν è soluzione dell’equazione di Bessel x2 y′′ (x) + xy′ (x) + (x2 − ν2 )y(x) = 0, (c) Dimostrare che vale l’identità: d ν [x Jν (x)] = xν Jν−1 (x). dx
Si osservi che, in modo del tutto equivalente, possiamo o 13 Nell’approssimazione di Fraunhofer, l’intensità dell’onda diffratta da un’apertura circolare D di diametro scrivere Z π d, nel punto (x, y) del piano dell’immagine dipende so1 sin2k x dx = (−1)k J0(2k) (0) lamente dalla distanza R del punto (x, y) dall’asse foπ 0 cale nel piano dell’immagine e, come spiegheremo neldove J0 è la funzione di Bessel definita nell’Eseml’Esercizio 23 a pagina 511, si può esprimere come un pio (II.2). (Suggerimento: si dimostri che vale la relazione integrale doppio: di ricorrenza: ! Z d/2 Z 2π Z π Z π 2πrR 2k + 1 Ψ(R) = r cos sin ϑ dϑ dr . 2k 2k+2 sin x dx , sin x dx = λf 0 0 2(k + 1) 0 0 per ogni intero k.)
dove λ è la lunghezza dell’onda ed f la distanza focale. Calcolare il valore di Ψ(R) in termini della funzione di Bessel J1 . (Suggerimento: utilizzare i risultati degli Esercizi 11 e 12 (c).)
o 11 Le funzioni di Bessel J0 e J1 sono state definite nell’Esempio (II.2). Dimostrare che valgono le due identità: Z π ✩ 14 Dimostrare che i multipli delle funzioni di Bessel 1 cos(x sin t) dt, J0 (x) = Jν sono le uniche soluzioni in serie di potenze centrate π 0 Z π nell’origine dell’equazione di Bessel. 1 J1 (x) = cos(x sin t − t) dt. π 0 K 15 Dimostrare il Criterio di sviluppabilità in serie di Taylor (II.22). (Suggerimento: utilizzare lo sviluppo in serie di Taylor della funzione coseno, insieme all’Esercizio 10 .) o 12 Le funzioni di Bessel di prima specie di ordine ν sono definite dalle serie ∞ X (−1)n x2n+ν . Jν (x) = 2n+ν 2 n!(ν + n)! n=0
✩ 16 In riferimento all’Esercizio (II.7), mostrare che per ogni p ∈ R e ogni x ∈ (−1, 1) vale lo sviluppo (1 + x)p =
! ∞ X p n x . n n=0
17 Determinare la soluzione generale di y′′ (x) = (x − 1)2 y(x) nella forma di serie di potenze
P∞
n=0
an (x − 1)n .
18 Determinare una soluzione in serie di potenze dell’ equazione Figura II.27: grafici delle prime 8 funzioni di Bessel.
3xy′′ (x) + 2y′ (x) + y(x) = 0.
94
Successioni e serie di funzioni
✩ 19 Determinare due soluzioni indipendenti in serie di potenze dell’equazione di Hermite y′′ (x) − 2xy(x) + νy(x) = 0. Per quali valori di ν l’equazione ha una soluzione polinomiale?
26 Utilizzando gli sviluppi ottenuti nell’Esercizio 25 , dimostrare che la serie di Fourier di f (t) = cos(µt+e sin t) (dove e è un parametro reale e µ un intero assegnato) è ∞ X n=0
Jn (e) cos((µ − n)t) + Jn (−e) cos((µ + n)t).
20 Verificare che la serie
o 27 Utilizzando l’Esercizio precedente, dimostrare che vale l’identità: Z π 1 cos(x sin t − νt) dt. Jν (x) = π 0 converge per ogni x, ma che la serie delle derivate non converge per x = 2kπ, per ogni k ∈ N. ∞ X sin nx n2 n=1
21 Determinare gli intervalli di convergenza di f , f ′ e o 28 Dato ε ∈ (0, 1) determinare una funzione y = f (t) che verifichi, per ogni t, f ′′ , dove f (x) =
∞ X xn . n2 n=1
ωt = f (t) − ε sin( f (t)). (Suggerimento: scrivere f (t) − ωt come serie di Fourier e utilizzare le relazioni dell’Esercizio 27 .)
22 Dimostrare le formule di ortogonalità (II.27) svolgendo gli integrali per parti. ✩ 23 Dimostrare, mediante opportune relazioni di ricorrenza, che se m ≤ k valgono le formule: Z π 2π(−1)m (2k)! sin2k t cos(2mt) dt = 2k 2 (k − m)!(k + m)! −π Z π 2π(−1)m (2k + 1)! sin2k+1 t sin((2m + 1)t) dt = 2k+1 2 (k − m)!(k + m + 1)! −π mentre gli integrali sono nulli per m ≥ k + 1. 24 Usufruendo delle formule dimostrate nell’Esercizio 23 , ricavare le seguenti espressioni delle funzioni sinn t (come polinomi trigonometrici) sin2k t =
k X n=0
sin2k+1 t =
k X n=0
2π(−1)n (2k)! cos(2nt) − n)!(k + n)!
22k (k
2π(−1)n (2k + 1)! sin((2n + 1)t). − n)!(k + n + 1)!
22k+1 (k
o 25 Sviluppare in serie di Fourier le funzioni f (t) = cos(e sin t) e
1(t) = sin(e sin t),
dove e è un parametro reale. (Suggerimento: esprimere i coefficienti di Fourier in termini delle funzioni di Bessel dell’Esercizio 12 . A questo fine, utilizzare lo sviluppo in serie di Taylor delle funzioni trigonometriche, insieme all’Esercizio 23 .)
29 Sviluppare in serie di Fourier i prolungamenti 2π periodici delle funzioni indicate. Determinare la somma della serie nei punti di discontinuità e negli estremi dell’intervallo dato. ( 1 in (−π, 0] (a) f (x) = −2 in (0, π]; ( x/2 in (−π, 0] (b) f (x) = 2x in (0, π]; ( 0 in (−π, 0] (c) f (x) = sin x in (0, π]; (d) f (x) =
π−x 2
in [0, 2π);
(e) f (x) = cosh x, in [−π, π); ( −1 in (−π, 0] (f) f (x) = 2 in (0, π]; (g) f (x) = x sin x, in [−π, π). 30 Nell’Esercizio 39 a pagina 32 abbiamo associato un’equazione differenziale ad un circuito elettrico contenente un generatore di forza elettromotrice, E = E(t), un condensatore di capacità C, un resistore di resistenza R e una induttanza L, disposti in serie. Supponiamo che la forza elettromotrice venga accesa e spenta in modo alternato, in un periodo di 2π, cioè ( 0 x ∈ (−π, 0], E(t) = 1 x ∈ (0, π]. Determinare un’espressione in serie di Fourier per l’intensità di corrente.
Esercizi
95
31 Disegnare le funzioni che si ottengono prolungando per periodicità T su R le funzioni indicate. Determinare gli sviluppi di Fourier associati. (b) f (x) = x in (0, 2], T = 2;
36 Sia f la funzione 2π periodica definita da f (x) = x in (−π, π] (si veda l’Esercizio (II.10) a pagina 83). Dimostrare che Z π π sin x lim Fm π − =2 dx m→+∞ m x 0
(c) f (x) = x2 in (0, 2π], T = 2π; ( x in (0, 1] (d) f (x) = T = 2; 2 − x in (1, 2],
e analogamente Z π sin x π = −2 dx. lim Fm −π + m→+∞ m x 0
(a) f (x) = 1 in (0, 1], T = 1;
(e) f (x) = ex in −1 < x ≤ 1, T = 2;
(f) f (x) = |x| in (−2, 2], T = 4; ( x + 1 in (−1, 0] T = 2; (g) f (x) = x − 1 in (0, 1], (h) f (x) = sin x, (−π/2, π/2], T = π. 32 Sviluppare in serie di Fourier il prolungamento periodico della funzione x4 su (−π, π]. Dedurre la formula ∞ X 1 π4 = . 4 n 90 n=1
✩ 33 Scrivere la serie di Fourier associata al prolungamento 6-periodico della funzione |x| su (−3, 3]. Dedurre le formule ∞ X n=1
∞ X
π2 1 = , (2n − 1)2 8
n=1
1 π4 = . (2n − 1)4 96
Si osservi che il valore del salto della funzione in x = π è 2π ∼ 2 · 3.1415, mentre il valore dell’integrale (ottenuto con una integrazione per serie nell’Esercizio (II.5) a pagina 78) è Z π sin x 2 dx ∼ 3.7038. x 0 Lo scarto tra f (π− ) = π e l’integrale è dunque circa il 9% del salto di f nella discontinuità: è questo il fenomeno osservato da Gibbs negli anni 20. 37 Dimostrare che la serie di Fourier di una somma di funzioni ha per coefficienti la somma dei coefficienti delle serie di ciascuna funzione.
K 38 (Lemma di Riemann–Lebesgue) Dalla disuguaglianza di Bessel dedurre che se f è limitata e integrabile in [−π, π] allora Z π Z π lim f (x) sin nx dx = lim f (x) cos nx dx = 0. ✩ 34 Scrivere la serie di Fourier associata alla funzion→+∞ −π n→+∞ −π ne pari definita da f (x) = sin x su [0, π]. Calcolare la somma delle due serie (per la seconda usare ancoraK✩ 39 Dimostrare la formula di Dirichlet: per ogni n ∈ N l’uguaglianza di Bessel–Parseval) si ha (Suggerimento: per la seconda uguaglianza utilizzare l’uguaglianza di Bessel-Parseval vista nell’approfondimento a pagina 63.)
∞ X n=1
1 , 4n2 − 1
∞ X n=1
sin(n + 1/2)x 1 + cos x + cos 2x + · · · + cos nx = . 2 2 sin(x/2)
1 . (4n2 − 1)2
35 Scrivere la serie di Fourier associata alla funzione f (x) = | cos x|. Dedurre la formula ∞ X (−1)n+1 π 1 = − . 2 −1 4n 4 2 n=1
Dedurre che la somma parziale n-esima della serie di Fourier di una funzione f periodica di periodo 2π vale Z π sin(n + 1/2)y 1 Fn (x) = f (x + y) dy. π −π 2 sin(y/2)
K✩ 40 Utilizzando l’Esercizio 39 , dimostrare il Teorema (II.31) di convergenza della serie di Fourier.
96
Successioni e serie di funzioni
41 Determinare l’insieme I di convergenza delle serie indicate. Stabilire se la convergenza è uniforme in I e se è applicabile il teorema di derivabilità termine a termine. √ ∞ ∞ X X n 1 ; ; (a) (d) x n (x − 2)n n=0 n=1 (b)
∞ X
2n sin
n=0
x ; 3n
(e)
∞ X cos nx (c) ; enx n=1
∞ X (−1)n+1 e−n sin x . n=0
o 42 Si dimostri che la serie ∞ X sin x + n (−1)n n2 n=1
converge uniformemente su R. Si noti che non è possibile applicare il Criterio di Weierstrass. (Suggerimento: usare il Criterio di Leibniz per stimare il resto della serie.) o 43 Si dimostri che la serie ! ∞ X xn+1 xn − (−1)n n n+1 n=1 è uniformemente convergente in I = [−1, 1]. Verificare che la serie delle derivate non converge uniformemente in I e che la serie data non è derivabile termine a termine. (Suggerimento: si osservi che si tratta di una somma telescopica e che vale la formula (pag. 445 del primo P volume) m n=0 (an − an+1 ) = a0 − am+1 .) 44 Sia data la successione di funzioni −nx
ne . fn (x) = 2 n + e−2nx ① Calcolare il limite puntuale. ② Stabilire se la successione converge uniformemente [0, +∞). ③ Stabilire se converge uniformemente in [−1, 1]. 45 Sia data la successione di funzioni fn (x) =
x . 1 + nx2
① Stabilire se converge uniformemente in R. ② Stabilire se la successione delle derivate { fn′ (x)}n converge uniformemente in R. 46 Studiare convergenza puntuale e uniforme della successione di funzioni √ nx |x| fn (x) = + . x 1 + n2 x2
47 Sia data la successione di funzioni fn (x) =
1 + sin(nx) . 1 + (n2 x2 − 1)2
① Trovare il limite puntuale. ② Stabilire se converge uniformemente in [−1, 1]. ③ Stabilire se converge uniformemente in [1, +∞)? 48 Sia 1 n ≤ x ≤ n + 1 fn (x) = 0 altrove. Mostrare che fn converge puntualmente a 0 su R. Mostrare che converge uniformemente su ogni insieme della forma (−∞, a] ma non su R. 49 Sia 0 nx fn (x) = 2 − nx 0
x≤0 0 < x < 1/n 1/n < x ≤ 2/n x > 2/n
① Mostrare che fn converge puntualmente a 0 su R, ma che la convergenza non è uniforme su ogni intervallo aperto che contiene l’origine. P ② Mostrare che fn (x) è assolutamente convergente su R, ma non uniformemente convergente.
. . . We try to find out as much as we can about the spatial and temporal surroundings of the place in which we find ourselves put by birth. . . (2) Science and Humanism (1951) E RWIN S CHRÖDINGER (1887–1961)
C APITOLO
III Vettori e calcolo geometrico
In questo capitolo introdurremo la geometria analitica, intesa come calcolo geometrico e vettoriale. Dopo aver definito le n-uple e i vettori di numeri reali, con le operazioni che si possono definire su di esse, affronteremo i due principali argomenti (e strumenti) del capitolo: i sistemi di equazioni lineari e le coordinate cartesiane. Potremo quindi passare allo studio delle aree e volumi, introducendo una forma semplice di determinante, e il
L
prodotto vettoriale. Chiuderemo il capitolo con un revival della geometria euclidea e qualche cenno alle coordinate non cartesiane. Le parole più usate nel capitolo sono «vettore» (usata più o meno 250 volte, un po’ meno della metà del numero di volte in cui compare nel libro), «punto» (178 volte), «retta» (147) e «piano» (106). Sono questi i semplici concetti che andremo ad analizzare.
a Geometria ebbe plausibilmente origine come arte di misurare senza errore lunghezze, aree e volumi, e la Geometria Analitica può essere detta l’arte della misura con strumenti analitici. Come scrisse Sylvestre François Lacroix (1765–1843) nella prefazione del suo Traité de calcul (1797), «Nella scelta di evitare accuratamente tutte le costruzioni geometriche, ho voluto che il Lettore realizzasse che esiste un modo di guardare alla Geometria che si potrebbe chiamare “Geometria Analitica”, e che consiste nel dedurre le proprietà dello spazio dal più piccolo numero possibile di principi con metodi puramente analitici, come Lagrange ha fatto con la Meccanica a proposito delle proprietà di equilibrio e di movimento.»(1) Nel capitolo che stiamo per affrontare abbiamo cercato di sintetizzare alcuni aspetti elementari della Geometria Analitica ottocentesca (spesso con una notazione moderna). Mettiamo però in guardia il Lettore che puta caso si ritrovi interessato agli argomenti della Geometria (più o meno moderni): l’evoluzione successiva è affare recente o contemporaneo, e nelle prossime pagine non ve n’è traccia alcuna. Non solo, dei pochi argomenti che abbiamo scelto per convenienza, scarsa fantasia o conformismo, la trattazione è lontano dall’essere completa o esaurien-
98
Vettori e calcolo geometrico
te. Il medesimo Lettore interessato dovrebbe quindi procurarsi altri testi, sicuramente più ricchi e dettagliati, e a volte un po’ più impegnativi del nostro. Ne elenchiamo un certo numero nelle Note Bibliografiche a pagina 651.
§ 1. Successioni finite: n-uple e vettori Il calcolo vettoriale consiste in un sistema di operazioni analoghe a quelle del calcolo algebrico, ma in cui gli enti sui quali si eseguiscono i calcoli, invece che numeri, sono vettori, che andiamo a definire.(3) Ricordiamo per prima cosa che una successione finita u1 , u2 , . . . , un di numeri reali è anche chiamata una n-upla (u), e si indica con la scrittura u = (u1 , u2 , . . . , un ). I numeri u1 , u2 , . . . , un si dicono le componenti della n-upla, mentre l’intero n è la sua dimensione. Se n = 2, si ha una coppia di numeri, √ se n = 3 si ha una terna di numeri. Sono quindi n-uple: (1, 2), (5, 6, 2), (−1, 1, −1, 1). Definiamo ora due operazioni importanti sulle n-uple con componenti numeriche: il prodotto per un numero reale c e la somma tra due n-uple della stessa dimensione. (III.1) Definizione (Riscalamento). Sia c ∈ R un numero e u = (u1 , u2 , . . . , un ) una n-upla. Allora il prodotto cu = uc è la n-upla che ha per componenti le componenti di u moltiplicate una per una per c: cu = c(u1 , u2 , . . . , un ) = (cu1 , cu2 , . . . , cun ). Se c = −1, si indica semplicemente (−1)u = u(−1) = −u. Per esempio, 3(1, 2) = (3, 6), √ ! √ 1 2 5 5, 6, 2 = , 3, , 2 2 2 −(−1, 1, −1, 1) = (1, −1, 1, −1). (III.2) Definizione (Somma). Se u = (u1 , u2 , . . . , un ) e v = (v1 , v2 , . . . , vn ) sono due n-uple di dimensione n, la somma u + v ha per componenti le somme delle componenti di u e v: u + v = (u1 , u2 , . . . , un ) + (v1 , v2 , . . . , vn ) = (u1 + v1 , u2 + v2 , . . . , un + vn ). Per esempio, (1, 2) + (2, 1) = (3, 3), (1, 2) − (2, 1) = (−1, 1), (1, 2, 3) + (2, 3, 1) + (3, 1, 2) = (6, 6, 6).
Se invece le prossime saranno ma-
gari non il primo ma certamente l’ultimo mazzetto compiuto di pagine di argomento geometrico che il Lettore dovrà digerire nel corso degli studi, ed egli si sente un po’ come a trovarsi per caso a una cena di sushi, rognoni o foie gras, o addirittura si immedesima di più con l’oca all’ingrasso che con il gourmet, e purtroppo il rifiuto, il digiuno o la fuga non sono un’opzione. . . beh, pazienza.
Si veda alla fine del § 6 nel Capitolo ℵ del primo volume. Quindi una n-upla di numeri reali è una funzione u : {1, 2, . . . , n} → R.
ATTENZIONE! Generalmente indicheremo una n-upla con una lettera in grassetto e le sue componenti con la stessa lettera (non in grassetto) indicizzata.
⊚
Vedremo dopo, a pagina 107, il motivo per cui chiamiamo riscalamento questa operazione.
§ 2. Sistemi di equazioni di primo grado, indipendenza lineare e dimensione
La n-upla con tutte le componenti nulle si indica con il simbolo 0 = (0, 0, . . . , 0), la cui dimensione deve essere chiara dal contesto. Quando intendiamo possibile effettuare tali operazioni, invece di nuple useremo il termine vettori. Detto in altro modo, i vettori di dimensione n sono n-uple di numeri reali con il prodotto per un numero reale e la somma definiti come sopra. A volte, per sottolineare la differenza tra vettori di numeri e numeri, si usa chiamare i numeri gli scalari. (III.3) Definizione (Combinazione lineare). Se u e v sono due vettori della stessa dimensione e a, b sono due numeri reali, allora il vettore
99
Di
nuovo, invitiamo il Lettore a non confondere la n-upla 0 ed il numero 0.
Per ora, ci accontentiamo di que-
sta definizione. Nel Capitolo IV, a pagina 164, estenderemo il significato del termine: un vettore sarà quindi un elemento di uno spazio (astratto) sui cui è possibile eseguire le operazioni di somma e prodotto per uno scalare.
au + bv è detto combinazione lineare di u e v con coefficienti a e b. Più in generale, la combinazione lineare di k vettori u1 , u2 , . . . , uk con coefficienti c1 , c2 , . . . , ck è il vettore c1 u1 + c2 u2 + . . . + ck uk . Concludiamo questa introduzione ai vettori elencando le proprietà algebriche di cui essi godono, la cui dimostrazione è facile e quindi lasciata al Lettore. (III.4) (Proprietà dei vettori) Siano u, v, w tre vettori della stessa dimensione e c, d due scalari. Allora ① (commutativa) u + v = v + u, cu = uc. ② (associativa) (u + v) + w = u + (v + w), (cd)u = c(du).
I simboli u1 , u2 non sono le componenti di un vettore u, ma sono loro i vettori! Purtroppo con questa notazione dovremmo scrivere che le componenti di u1 sono u1 1 , u1 2 , . . . , u1 n ! Si può ovviare al problema di avere due indici sovrapposti chiamando le componenti dei vettori con nomi standard (per esempio (x, y), (x, y, z) invece che u1 , u2 , u3 ), oppure evitare sempre di indicizzare successioni di vettori (poco pratico), oppure decidere una volta per tutte con quale ordine si considerano i doppi indici. Torneremo sul problema dopo (nel Capitolo IV), quando introdurremo le matrici.
③ (distributiva) c(u + w) = cu + cw, (c + d)u = cu + du. ④ (vettore zero) u + 0 = u, u − u = 0, 0u = 0 ⑤ (uno) 1u = u. (III.5) Definizione. L’insieme di tutti i vettori di dimensione n, o anche l’insieme di tutte le n-uple, si indica con il simbolo Rn .
§ 2. Sistemi di equazioni di primo grado, indipendenza lineare e dimensione Ricordiamo che una equazione lineare (o anche di primo grado) nelle incognite x1 , x2 , . . . , xn con certi coefficienti ai e y è una equazione della
Le variabili xi vengono anche det-
te indeterminate, mentre i coefficienti ai le variabili determinate, o costanti.
100
Vettori e calcolo geometrico
forma (1)
a1 x1 + a2 x2 + . . . + an xn = y.
Una soluzione dell’equazione è semplicemente una n-upla (x¯ 1 , x¯ 2 , . . . , x¯ n ) che soddisfa l’equazione (1). L’equazione è detta omogenea se y = 0. Un sistema di equazioni non è altro che un insieme di equazioni che devono essere tutte simultaneamente soddisfatte. Se tutte le equazioni sono di primo grado (cioè lineari), si dice che è un sistema di equazioni di primo grado. Se tutte le equazioni sono omogenee, si dice sistema omogeneo. Vediamo come legare non solo le n-uple, ma anche le proprietà dei vettori ai sistemi di equazioni. Consideriamo un sistema di 2 equazioni di primo grado in 3 incognite x1 , x2 e x3 , in cui i coefficienti ai , bi , ci e yi (i = 1, 2) sono da considerare noti: ( a1 x1 + b1 x2 + c1 x3 = y1 (2) a2 x1 + b2 x2 + c2 x3 = y2 .
Cioè una n-upla è soluzione del si-
stema se e solo se soddisfa tutte le equazioni del sistema.
A
volte si dice che il sistema è compatibile se ha almeno una soluzione, non compatibile se non ne ha. Se la soluzione è (x1 , x2 , . . . , xn ) = 0, spesso questa viene chiamata la soluzione banale.
I coefficienti possono essere scritti come vettori a = (a1 , a2 ), b = (b1 , b2 ), c = (c1 , c2 ), y = (y1 , y2 ). Se introduciamo un nuovo modo di rappresentare i vettori, disponendone i coefficienti per colonne, il sistema di equazioni si può anche scrivere come " # " # " # " # y c b a1 x1 + 1 x2 + 1 x3 = 1 . y2 c2 b2 a2
O
anche, tenendo conto delle Proprietà dei vettori (III.4), " # " # " # " # a b c y x1 1 + x2 1 + x3 1 = 1 . a2 b2 c2 y2
Le soluzioni di (2) saranno quindi tutte le terne (x1 , x2 , x3 ) che soddisfano le equazioni (2), cioè (riscritte con la notazione vettoriale) tutte le terne per cui (3)
x1 a + x2 b + x3 c = y.
Risolvere un sistema di equazioni lineari nelle tre incognite x1 , x2 e x3 è quindi equivalente a trovare tutti i modi con cui y può essere scritto come combinazione lineare dei tre vettori a, b e c. Ogni sistema di equazioni di primo grado (dette anche lineari) nelle incognite x1 , x2 , x3 (il sistema (2)) può quindi essere scritto come una unica equazione vettoriale nelle stesse incognite (l’equazione (3)), che esprime un vettore noto come combinazione lineare dei vettori dei coefficienti. Un metodo, all’apparenza lento ma certamente infallibile, per risolvere i sistemi di primo grado è quello della eliminazione successiva delle variabili. Analizziamo il seguente esempio. (III.6) Esempio. Determiniamo le soluzioni del sistema di equazioni 2x1 − x3 = 1 5x1 − x2 = −1 (4) x2 + x3 = 0,
Vedremo
più avanti di giustificare l’infallibilità. Come abbiamo detto sopra, i sistemi di primo grado sono anche detti lineari.
§ 2. Sistemi di equazioni di primo grado, indipendenza lineare e dimensione
101
cioè descriviamo (in qualche modo) l’insieme di tutte le terne (x1 , x2 , x3 ) che soddisfano l’equazione vettoriale 2 0 −1 1 5 −1 x1 + x2 + x3 0 = −1 . 0 1 1 0 La terza equazione in (4) può essere riscritta come x3 = −x2 ; possiamo quindi sostituire nelle prime due l’espressione −x2 al posto di x3 , ed ottenere un sistema di due equazioni nelle due incognite rimanenti x1 e x2 : ( ( 2x1 + x2 = 1 2x1 − (−x2 ) = 1 ⇐⇒ (5) 5x1 − x2 = −1, 5x1 − x2 = −1 cioè " # " # " # 2 1 1 x1 + x2 = . 5 −1 −1 L’insieme delle soluzioni di (5) naturalmente non è uguale all’insieme delle soluzioni di (4), dato che uno è un insieme di coppie mentre l’altro è un insieme di terne, ma c’è una corrispondenza biunivoca tra i due insiemi. A questo punto possiamo ripartire da capo, ed eliminare la variabile x2 nel sistema (5). La seconda equazione in (5) può essere riscritta come x2 = 5x1 + 1, e possiamo quindi sostituire nella prima equazione l’espressione 5x1 + 1 al posto di x2 , ed ottenere finalmente una unica equazione nell’incognita rimanente x1 : (6)
2x1 + (5x1 + 1) = 1
⇐⇒
7x1 = 0
⇐⇒
x1 = 0.
Come prima, gli insiemi delle soluzioni di (5) e (6) sono in corrispondenza biunivoca, e dunque esiste una unica soluzione. Sostituendo all’indietro i valori trovati otteniamo x1 = 0
=⇒
x2 = 5 · 0 + 1 = 1
=⇒
x3 = −x2 = −1,
cioè l’unica soluzione del sistema (4) è la terna (x1 , x2 , x3 ) = (0, 1, −1).
È facile immaginare come la tecnica illustrata nell’esempio precedente possa essere applicata in generale a sistemi di k equazioni in n incognite x1 ,x2 , . . . , xn : per eliminare la variabile xn basta scrivere una delle
Se
(x1 , x2 , x3 ) è una soluzione di (4), allora (x1 , x2 ) è una soluzione di (5) e, viceversa, se (x1 , x2 ) è una soluzione di (5) allora ponendo x3 = −x2 si ottiene una terna che è soluzione di (4). Si dice cioè che i due sistemi sono equivalenti.
102
Vettori e calcolo geometrico
equazioni come xn = . . . e poi sostituire in tutte le altre equazioni l’espressione così trovata al posto di xn . L’insieme delle soluzioni del primo sistema è in corrispondenza biunivoca con l’insieme delle soluzioni del nuovo sistema di k − 1 equazioni in n − 1 incognite. Procedendo in questo modo per un certo numero di volte ci si può quindi ridurre ad avere una sola equazione in una o più incognite, oppure mostrare che non ci sono soluzioni. Naturalmente ci sono sistemi più efficienti per risolvere i sistemi lineari; per ora ci serve sapere che tutti i sistemi lineari si possono risolvere in un numero finito di passaggi. Questo metodo, chiamato anche metodo di eliminazione di Gauss, è facilmente implementabile al calcolatore perché consiste della ripetizione in sequenza solo delle seguenti operazioni elementari ➔ Scrivere una delle variabili come combinazione lineare delle altre. ➔ Utilizzando un’equazione della forma xi = . . . (del punto precedente), eliminare la variabile xi da tutte le altre equazioni per ridurre il numero di variabili e il numero di equazioni del sistema. Per formalizzare il problema in modo più adatto al calcolo meccanico, osserviamo che le equazioni hanno delle operazioni algebriche proprio come i vettori definiti poco sopra: si possono moltiplicare per uno scalare (entrambi i membri) e sommare (membro a membro). Non solo, le proprietà formali dei vettori (quelle della Proposizione (III.4) di pagina 99) sono tutte verificate. È quindi possibile scrivere una equazione di primo grado come vettore? Certo che sì. Basta scrivere la successione dei coefficienti delle variabili (quando questi stanno tutti a sinistra dell’uguale) e il termine noto (quando questo sta a destra). Per esempio, le tre equazioni del sistema (4) corrispondono, nell’ordine, ai vettori 2x1 − x3 = 1 (2, 0, −1, 1) 5x1 − x2 = −1 (5, −1, 0, −1) ∼ x2 + x3 = 0. (0, 1, 1, 0) La moltiplicazione per uno scalare e la somma di due equazioni risultano, in questa rilettura, proprio le operazioni sulle componenti dei vettori. Ora vogliamo mostrare come le due operazioni elementari descritte sopra possono essere ridotte ulteriormente, proprio alle operazioni sui vettori, ancora più semplici: ➔ Moltiplicare un vettore–equazione per uno scalare diverso da zero (cioè moltiplicare entrambi i membri dell’equazione per un numero diverso da zero). ➔ Sommare un vettore–equazione ad un altro vettore–equazione (cioè sommare membro a membro due equazioni). Sia c1 x 1 + c2 x 2 + . . . + cn x n = y
Se
necessario dividendo entrambi i membri dell’equazione per il coefficiente di xn .
Vedremo
negli Esercizi (III.1), (III.2) e (III.3) a pagina 141 alcuni esempi di questa procedura.
Le
operazioni elementari hanno l’importante proprietà di lasciare invariato l’insieme delle soluzioni del sistema!
§ 2. Sistemi di equazioni di primo grado, indipendenza lineare e dimensione
103
una delle equazioni, corrispondente al vettore (c1 , c2 , . . . , cn , y). Se vogliamo scrivere x1 come combinazione lineare delle altre variabili (supponendo quindi che c1 , 0), non facciamo altro che dividere per c1 l’equazione. Il vettore–equazione che ne risulta è 1 (c1 , c2 , . . . , cn , y) = (1, c2 /c1 , . . . , cn /c1 , y/c1 ). c1 A meno quindi di moltiplicazione per uno scalare (e chiamando ancora ci e y i coefficienti) possiamo supporre l’equazione ridotta al tipo x1 = −c2 x2 − . . . − cn xn + y
∼
(1, c2, . . . , cn , y).
Supponiamo ora di voler eliminare la variabile x1 così ottenuta da un’altra equazione d1 x1 + d2 x2 + . . . + dn xn = z
∼
(d1 , d2 , . . . , dn , z).
Se d1 = 0, allora x1 è già eliminato e non c’è nulla da fare. Altrimenti, dividendo per d1 possiamo sempre supporre che d1 = 1. Sostituendo otteniamo −c2 x2 − . . . − cn xn + y + d2 x2 + . . . + dn xn = z che in forma di vettore–equazione si scrive come (0, d2 − c2 , . . . , dn − cn , z − y) : questa non è altro che la differenza tra i due vettori, che si ottiene moltiplicando (0, c2 , . . . , cn , y) per −1 e sommando il risultato a (0, d2 , . . . , dn , z). Abbiamo dimostrato senza sforzo la proposizione seguente. (III.7) Ogni sistema di k equazioni in n incognite può essere ridotto ad un sistema di k − 1 equazioni in n − 1 incognite (le cui soluzioni sono in corrispondenza biunivoca con le soluzioni del primo sistema) applicando in una opportuna sequenza le seguenti operazioni elementari: ➔ Moltiplicare una equazione per uno scalare diverso da zero. ➔ Sommare (un multiplo scalare di) una equazione ad un altra equazione. Siano ora a, b e c tre vettori. Abbiamo visto che, per definizione di combinazione lineare, esistono soluzioni (x1 , x2 ) dell’equazione (7)
ax1 + bx2 = c
se e solo se c è combinazione lineare di a e b. Ma in quanti modi c può essere scritto come combinazione lineare di a e b? L’esistenza o la non-esistenza di soluzioni per equazioni del tipo ax1 + bx2 = 0 è un concetto importante, che andiamo a definire in modo preciso nel caso generale.
Il metodo
di Gauss di eliminazione delle variabili può essere riscritto come un algoritmo che modifica la matrice dei coefficienti di un sistema di equazioni, in un numero finito di passi (e in un senso opportuno). La versione più completa dell’algoritmo di calcolo si chiama metodo di eliminazione di Gauss–Jordan, ed è quella che permette di ottenere le soluzioni esplicitamente.
104
Vettori e calcolo geometrico
(III.8) Definizione. Si dice che k vettori a1 , a2 , . . . , ak di dimensione n sono linearmente dipendenti se l’equazione (8)
a1 x1 + a2 x2 + . . . + ak xk = 0
ha almeno una soluzione non nulla (x1 , x2 , . . . , xk ) , 0. Se non sono linearmente dipendenti, allora si dicono linearmente indipendenti.
Se k = 1, un vettore da solo è sempre linearmente indipendente (tranne quando è il vettore 0).
(III.9) Osservazione. È facile osservare che i vettori se a1 , a2 , . . . , ak sono dipendenti, allora uno di loro è uguale ad una combinazione lineare degli altri: sia (x1 , x2 , . . . , xk ) una soluzione non zero dell’equazione (8). Dato che (x1 , x2 , . . . , xk ) , 0, esiste un indice i per cui xi , 0. Per semplicità supponiamo che sia i = 1. Se dividiamo la (8) per x1 otteniamo l’equazione a1 + a2
x2 xk 1 + . . . + ak = 0 = 0, x1 x1 x1
che può anche essere scritta come a1 = −a2
xk x2 − . . . − ak , x1 x1
e quindi a1 è combinazione lineare degli altri. Viceversa, se esistono k − 1 coefficienti c2 , . . . , ck per cui a1 = c2 a2 + . . . + ck ak , allora l’equazione (8) ha per soluzione (x1 , x2 , . . . , xk ) = (1, −c2, . . . , −ck ) , 0. In particolare, se k = 2, due vettori sono linearmente dipendenti quando uno è un multiplo dell’altro. Due vettori linearmente dipendenti (e non nulli) si dicono anche paralleli. Vediamo ora, iniziando con un esempio, come descrivere l’insieme di soluzioni di un sistema di equazioni, anche quando ce ne sono infinite. (III.10) Esempio. Determiniamo l’insieme di tutte le 4-uple (x1 , x2 , x3 , x4 ) che soddisfano il sistema di equazioni ( x1 + x3 = 1 (9) x1 + x2 + x3 + x4 = −1. Procediamo come sopra, eliminando le variabili con le operazioni di (III.7). Usiamo la prima per eliminare x1 dalla seconda (scrivendo la prima come x1 = 1 − x3 ): sottraendo la prima dalla seconda si ottiene x2 + x4 = −2, che possiamo anche scrivere come x2 = −2 − x4. Adesso non
Teniamo a mente questa definizione: sarà chiaro in seguito (§ 7) il motivo di questo termine.
§ 2. Sistemi di equazioni di primo grado, indipendenza lineare e dimensione
105
ci sono più equazioni, e non ci resta che ragionare sulle equazioni che abbiamo ottenuto nella riduzione: ( x1 = 1 − x3 (10) x2 = −2 − x4 . Interpretiamo questa equazione pensando che le due variabili x3 e x4 possono assumere qualsiasi valore, senza restrizioni, mentre le variabili x1 e x2 ovviamente dipendono dai valori di x3 e x4 . Per sottolineare questa differenza di ruolo, introduciamo due nuove variabili s e t, libere di assumere qualsiasi valore, che chiamiamo parametri liberi. Quindi per indicare che x3 e x4 possono assumere qualsiasi valore scriviamo x3 = s x4 = t, e quindi riscriviamo la (10) come ( x1 = 1 − s x2 = −2 − t.
Ne deduciamo che le soluzioni del sistema (9) sono tutte le 4-uple (x1 , x2 , x3 , x4 ) le cui componenti si scrivono come x1 x2 x3 x4
=1−s
= −2 − t =s = t,
cioè l’insieme delle soluzioni può essere scritto con la notazione vettoriale come 0 −1 1 −2 −1 0 . Soluzioni = + s + t : s, t ∈ R 0 1 0 0 1 0 (III.11) Osservazione. Abbiamo scritto l’insieme delle soluzioni di un sistema come somma di un vettore con tutte le possibili combinazioni lineari di altri due vettori. (III.12) Teorema. Sia X l’insieme di soluzioni di un sistema di equazioni in n incognite. Se X , ∅, allora esiste una n-upla A e d vettori linearmente indipendenti v1 , v2 , . . . , vd tali che le soluzioni sono tutte e sole le n-uple che si scrivono come somma di A con una qualsiasi combinazione lineare dei vi : (11) Soluzioni = {A + t1 v1 + t2 v2 + . . . + td vd : t1 , t2 , . . . , td ∈ R}
Questo
è un esempio di parametrizzazione di un insieme, con due parametri s e t liberi.
106
(III.13) Definizione (dimensione). La dimensione di un insieme del tipo (11) è il numero d di parametri liberi che si usano nella sua parametrizzazione. Osserviamo che Rn è l’insieme delle combinazioni lineari degli n vettori (versori) linearmente indipendenti e1 = (1, 0, . . . , 0), e2 = (0, 1, . . . , 0), . . . , en (= (0, . . . , 0, 1), e quindi ha dimensione n. L’insieme di tutti i vettori di dimensione n (nel senso di dimensione di un vettore) è quindi uno spazio di dimensione n (nel senso di dimensione di un insieme di vettori). In generale ci possono essere insiemi di dimensione d di vettori di dimensione n, con n , d (per esempio, una retta nel piano è un insieme di dimensione 1 di vettori di dimensione 2). Riguardando la Definizione (III.13), ci si accorge che, al contrario della dimensione di un vettore che è immediata da verificare, la dimensione di un insieme X di soluzioni è una proprietà di una sua particolare parametrizzazione (il numero dei parametri liberi), e non del sistema di equazioni (due sistemi diversi possono avere le stesse soluzioni) né dell’insieme stesso. Può cambiare se si ottiene un’altra parametrizzazione, per esempio se si risolve un sistema in un altro modo (eliminando le variabili in un altro ordine)? In che modo cambia? In altre parole, la dimensione dello spazio delle soluzioni è ben definita? Torneremo sotto su questo importante problema nel prossimo Capitolo IV, per la Proposizione (IV.13).
§ 3. Coordinate cartesiane e geometria analitica Una delle interpretazioni di n-uple evettori più naturali è quella geometrica. Come abbiamo visto nei Capitoli I e II del primo volume, la retta è una interpretazione geometrica del continuum dei numeri reali, e i punti del piano possono essere rappresentati da coppie di numeri reali (che corrispondono a loro volta ai numeri complessi). In modo analogo, i punti dello spazio tridimensionale (lo spazio fisico in cui ci troviamo) possono essere associati a terne di coordinate cartesiane (x, y, z), come vedremo tra poco. Il primo passo è fissare un sistema di riferimento (cartesiano) nello spazio. Sulla retta questo è dato da un punto (l’origine), una unità di misura e un verso di percorrenza: equivalentemente, l’origine O (che corrisponde a 0) e un punto A , O punto sulla retta che corrisponde a 1. Nel piano, un sistema di riferimento è costituito da due rette ortogonali che si incontrano nell’origine O, che rappresentano le due coordinate dei punti del piano, su ognuna delle quali si sceglie il punto corrispondente all’unità (cioè unità di misura e verso di percorrenza). Nello spazio il sistema di riferimento sarà dato da tre rette a due a due ortogonali, chiamati gli assi del sistema di riferimento, passanti per un punto fissato chiamato origine, indicato ancora con la lettera O. Sui tre assi si suppone scelto un sistema di riferimento con origine in O; s’intende che, a parte la scelta del verso di percorrenza degli assi, per tutti
Vettori e calcolo geometrico
Per il Teorema (III.12), possiamo quindi definire la dimensione dell’insieme di soluzioni di un sistema di equazioni lineari.
x y
z
F III.1: terna destrorsa.
Anche se a volte questa interpre-
tazione è un po’ fuorviante. A volte l’immaginare situazioni geometriche aiuta a comprendere e ricordare concetti o metodi, ma bisogna fare attenzione a che l’intuizione visiva non cerchi di sostituirsi al rigore logico del ragionamento che si cerca di seguire.
Si
possono prendere anche riferimenti in cui le due rette non sono ortogonali.
§ 3. Coordinate cartesiane e geometria analitica
e tre si è scelta la stessa unità di misura. Come vedremo, la terna di assi può essere scelta (a meno di rotazioni dello spazio) essenzialmente in due modi. La consuetudine è di preferire sistemi di riferimento in cui gli assi orientati costituiscono una terna destrorsa, come in Figura III.1. Dato un sistema di riferimento, è possibile mettere in corrispondenza biunivoca i punti dello spazio con le terne di numeri reali (chiamate coordinate cartesiane dei punti). Dati i tre assi x, y, z (su cui i punti sono rappresentati dai numeri reali x, y e z), la coordinata x di P è l’intersezione con l’asse delle x del piano parallelo al piano yz (quello che contiene gli assi y e z) e passante per P. La coordinata y di P è l’intersezione con l’asse delle y del piano parallelo al piano xz e passante per P, e la coordinata z di P è l’intersezione con l’asse delle z del piano parallelo al piano xy e passante per P. Per essere certi della coerenza della nostra definizione di coordinate, dovremmo mostrare che le tali intersezioni esistono e sono uniche: a tal fine basta osservare che l’asse z è ortogonale al piano xy, e quindi non può essere parallelo né contenuto in nessun piano parallelo a xy. Renderemo più rigorosa questa affermazione nell’Esercizio (III.13) a pagina 151. I vettori di R3 con coordinate (1, 0, 0), (0, 1, 0) e (0, 0, 1) si indicano con i simboli i, j, k e sono anche detti i versori del sistema di riferimento canonico di R3 . Come procedere nella direzione inversa, cioè trovare il punto a partire dalle sue coordinate? Come si può vedere in Figura III.2 il punto di coordinate (x, y, z) si ottiene in tre passi: partendo dall’origine ci si sposta nella direzione dell’asse x fino a raggiungere (x, 0, 0); di qui ci si sposta nella direzione dell’asse y fino a raggiungere il punto (x, y, 0); finalmente, si sale nella direzione verticale dell’asse z e si finisce in (x, y, z), “tracciando” un segmento di lunghezza z a partire da (x, y, 0). È importante capire che per costruire questa corrispondenza abbiamo utilizzato due concetti: quello di punto (cioè una posizione nello spazio) e quello di spostamento tra due punti (e qui si aggiunge una componente dinamica alla geometria dello spazio) lungo una direzione. È l’analogo, se si vuole, della piccola differenza che abbiamo introdotto tra n-uple e vettori: gli spostamenti hanno una struttura algebrica più ricca di quella dei punti dello spazio. Infatti, si possono riscalare (non è difficile immaginare uno spostamento che è una frazione o un multiplo di uno spostamento dato: questa operazione corrisponde alla moltiplicazione per un opportuno scalare) e sommare: se ci si sposta da A a B e poi da B a C, lo spostamento risultante sarà quello da A a C. Anche se queste operazioni si possono comunque eseguire allo stesso modo sui punti, il significato geometrico non è lo stesso. Non si è capito niente? Riprendiamo da capo. In un sistema di riferimento cartesiano fissato, se A e B sono due punti dello spazio, definiamo il vettore spostamento: #» (12) AB = B − A,
107
Questa
costruzione si basa sui seguenti due fatti generali: ① se P è un punto dello spazio e r un piano qualsiasi che non contiene P, allora esiste un unico piano r′ parallelo a r che contiene P; ② l’intersezione di un piano con una retta è un unico punto, tranne quando la retta è parallela al piano (e quindi non c’è intersezione) oppure quando è contenuta nel piano (e quindi l’intersezione è tutta la retta). z (0, 0, z)
(0, y, z)
(x, 0, z) (x, y, z)
O
(0, y, 0) y
(x, 0, 0) (x, y, 0) x
F III.2: coordinate cartesiane dello spazio.
Un altro motivo per cui moltiplicare per uno scalare è detto riscalamento è il fatto che quando si cambia unità di misura sugli assi, le lunghezze risultano riscalate, cioè moltiplicate per un opportuno fattore di conversione.
108
Vettori e calcolo geometrico
#» cioè l’unico vettore tale che B = A + AB (lo spostamento che da A porta in B) come indicato in Figura III.3, le cui componenti non sono altro che le differenze delle coordinate di B e A. Ne segue che le coordinate # » del punto A e del vettore spostamento OA sono le stesse. La somma di vettori spostamento ha la proprietà che ci aspettiamo: spostarsi da A a B e poi da B a C significa in totale andare da A a C
B
#
AB A
#» #» # » AB + BC = AC, dato che B − A + C − B = C − A. Se fissiamo un vettore spostamento v, allora la trasformazione dello spazio Rn in sé definita da
F III.3: vettore spostamento da A a B.
P 7→ P + v si dice traslazione di vettore v. Vedremo più avanti (Esercizio (III.6) a pagina 145) la nota proposizione che le traslazioni mandano ogni retta in una retta ad essa parallela, e rette parallele in rette parallele, per cui possiamo interpretare geometricamente la somma di vettori con la regola del parallelogramma.
C
#
BC
B
#
AC
#
(III.14) Se a e b sono due vettori, allora i quattro punti (indicati in Figura III.5)
AB A
A, B = A + a, C = A + b, D = A + a + b sono i vertici di un parallelogramma.
F III.4: somma di vettori spostamento.
Dimostrazione. Osserviamo che la traslazione con vettore a manda A in B e C in D: dunque la retta per A e B va nella retta per C e D, che le è quindi parallela. Analogamente, la traslazione con vettore b manda A in C e B in D, e quindi la retta per A e C è parallela alla retta per B e D.
Consideriamo ora due punti A e B nello spazio, come indicato in Figura III.6. Se le coordinate di A sono (xA , yA , zA ) e quelle di B sono (xB , yB, zB ), è facile utilizzare due volte il Teorema di Pitagora e vedere che la distanza tra A e B (cioè la lunghezza del segmento AB) è uguale a q Lunghezza AB = (xB − xA )2 + (yB − yA )2 + (zB − zA )2 . Motivati da questo calcolo, definiamo in generale la norma di un vettore in modo tale da poter scrivere poi questa formula in modo più sintetico. (III.15) Definizione (Norma di un vettore). La norma di un vettore v = (v1 , v2 , . . . , vn ), indicata con il simbolo kvk, è uguale a q v21 + v22 + . . . + v2n
D
#
CD
#
BD
C
#
a+
b = AC
b B
#
a = AB A
F III.5: regola del parallelogramma.
Si può scrivere, con il simbolo di sommatoria, anche come v t n X v2i . kvk = i=1
§ 3. Coordinate cartesiane e geometria analitica
109
z
B
A
C
y
x
F III.6: distanza di punti nello spazio cartesiano. Scelto un sistema di riferimento cartesiano, possiamo usare due volte il Teorema di Pitagora, una volta per calcolare la distanza tra i punti nel piano (xA , yA ) e (xB , yB ), e una seconda volta applicato al triangolo ABC, dove le coordinate di C sono (xB , yB , zA ).
Con questa notazione, osserviamo che la distanza tra due punti dello spazio non è altro che la norma del vettore differenza (spostamento), e quindi possiamo riscrivere in modo più sintetico come #» Distanza tra A e B = kABk = kB − Ak. Si tratta in fondo di una riscrittura nel linguaggio moderno del teorema di Pitagora. Forse qualcuno ricorda che c’è una generalizzazione del teorema di Pitagora, nota come il Teorema del coseno, o anche Teorema di Carnot, che dice quanto segue: se a, b e c indicano le lunghezze dei lati BC, CA e AB di un triangolo ABC e γ indica l’angolo in C, allora
A b
c γ
C
B a
F III.7
A
(13) c2 = a2 + b2 − 2ab cos γ. Possiamo definire i seguenti vettori #» c = AB #» a = CB #» b = CA
=⇒ =⇒ =⇒
kck = c,
kak = a,
c = a − b,
γ C
da cui
c2 = kck2 = ka − bk2 .
a
B
F III.8
kbk = b,
e ridisegnare la Figura III.7 indicando esplicitamente i vettori, come in Figura III.8. Nel sistema di riferimento che abbiamo scelto i vettori a, b e c avranno coordinate che, come sopra, indichiamo con (a1 , a2 , . . . , an ), #» #» #» # » #» (b1 , b2 , . . . , bn ) e (c1 , c2 , . . . , cn ). Dato che AB = AC + CB = −CA + CB, possiamo scrivere
c
b
In
questa forma generale la formula ha senso per n = 2 (nel piano), oppure n = 3 (nello spazio), o anche negli spazi a dimensioni più alte, senza difficoltà di sorta.
110
Vettori e calcolo geometrico
Per definizione di norma si ha c2 = ka − bk2 = (a1 − b1 )2 + (a2 − b2 )2 + . . . + (an − bn )2
= a21 + b21 − 2a1 b1 + a22 + b22 − 2a2 b2 + . . . + a2n + b2n − 2an bn
= a21 + a22 + . . . + a2n + b21 + b22 + . . . + b2n −2 (a1 b1 + a2 b2 + . . . + an bn ) | {z } | {z } =kak2 =a2 2
=kbk2 =b2
2
= kak + kbk − 2 (a1 b1 + a2 b2 + . . . + an bn ) . Per il Teorema del coseno (13) risulta quindi c2 = a2 + b2 − 2ab cos γ. =⇒ 2 2 = a + b − 2 (a1 b1 + a2 b2 + . . . + an bn )
a1 b1 +a2 b2 +. . .+an bn = ab cos γ.
Come nel caso della norma e il teorema di Pitagora, possiamo introdurre una operazione tra vettori che ci consente di riassumere in pochi simboli quanto detto. (III.16) Definizione (Prodotto scalare). Siano a e b due vettori di dimensione n. Il loro prodotto scalare, che si indica con il simbolo a · b, è a · b = a1 b1 + a2 b2 + . . . + an bn . Alcune volte useremo anche il simbolo equivalente ha, bi. Possiamo riassumere quanto visto sopra nella seguente proposizione. (III.17) Proposizione. Se a e b sono due vettori e γ è l’angolo tra a e b, allora a · b = kak kbk cos γ. Le seguenti proprietà seguono immediatamente dalla definizione di prodotto scalare e di norma. (III.18) (Proprietà del prodotto scalare) Se a, b e c sono vettori qualsiasi di Rn e c è uno scalare, allora: ① a e b sono ortogonali se e solo ④ a · (b + c) = a · b + a · c. se a · b = 0. ⑤ (ca) · b = c(a · b). ② a · a = kak2 . ③ a · b = b · a.
⑥ 0 · a = 0.
Non importa con quale ordine si scelgano i due vettori, dal momento che cos γ = cos(−γ). Non solo: due vettori individuano due angoli γ e 2π − γ, almeno uno dei quali è compreso tra 0 e π. Ma cos(2π − γ) = cos(−γ) = cos γ, quindi il coseno dei due angoli è lo stesso, e in genere consideriamo sempre l’angolo compreso tra 0 e π.
§ 3. Coordinate cartesiane e geometria analitica
111
(III.19) Valgono le due disuguaglianze ① (Cauchy–Schwarz) Per ogni a, b ∈ Rn |a · b| ≤ kak kbk, e vale l’uguaglianza se e solo se a e b sono paralleli. ② (Disuguaglianza triangolare) Per ogni a, b ∈ Rn ka + bk ≤ kak + kbk e vale l’uguaglianza se e solo se a e b sono paralleli e a · b ≥ 0. j Dimostrazione. Per la prima, osserviamo che |a · b| ≤ kakkbk se e solo se (a · b)2 ≤ kak2 kbk2 , e quindi, se a = (a1 , a2 , . . . , an ) e b = (b1 , b2 , . . . , bn ), se e solo se 2 n n n X X X b2j a2i ai bi ≤
(e forse più semplice) della disuguaglianza di Cauchy–Schwarz si veda anche pagina 178.
j=1
i=1
i=1
Per una dimostrazione alternativa
n n n n X X X X b2j a2i a j b j ≤ ai bi
⇐⇒
n X
⇐⇒
i,j=1
⇐⇒
2
X
1≤i<j≤n
j=1
i=1
j=1
i=1
ai bi a j b j ≤ ai bi a j b j ≤
⇐⇒
0≤
⇐⇒
0≤
n X
a2i b2j
i,j=1
X
(a2i b2j + a2j b2i )
Si cancellano tutti i termini per i = j.
1≤i<j≤n
X
1≤i<j≤n
X
1≤i<j≤n
(a2i b2j + a2j b2i − 2ai bi a j b j ) (ai b j − a j bi )2 .
Quest’ultima è sempre vera, e vale l’uguaglianza quando ai b j = a j bi per ogni i < j. Ma questo è vero se e soltanto se a e b sono paralleli, cioè se esiste c ∈ R tale che b = ca (si veda l’Esercizio 53 ). Per la seconda, osserviamo che ka + bk ≤ kak + kbk se e solo se
A
ka + bk2 ≤ (kak + kbk)2 ,
#
CA
e quindi
A′
γ
⇐⇒
⇐⇒
⇐⇒
(a + b) · (a + b) ≤ kak2 + kbk2 + 2kakkbk
kak2 + 2a · b + kbk2 ≤ kak2 + kbk2 + 2kakkbk a · b ≤ kakkbk.
Quest’ultima è sempre vera per la disuguaglianza di Cauchy–Schwarz, e vale l’uguaglianza quando a · b ≥ 0 e a e b sono paralleli.
Come si vede dalla Figura III.9, il prodotto scalare può essere usato per calcolare la proiezione di un punto su una retta. Infatti, la proiezione del punto A sulla retta per CB è l’unico punto A′ sulla retta CB per cui
C
|CA| cos γ
#
CA′
F III.9
B
112
Vettori e calcolo geometrico
# » #» il vettore AA′ è ortogonale a CB. Il segmento CA′ ha quindi lunghezza |CA| cos γ, che può essere scritto anche come #» |CA| cos γ = kCAk cos γ # » #» # » CA · CB = kCAk # » # » kCAkkCBk # » #» CA · CB = #» . kCBk #» #» Se indichiamo con a = CA e b = CB, possiamo scrivere il punto A′ nel modo seguente (si veda anche la Figura III.10), osservando che il vettore b/kbk ha la stessa direzione di b e ha norma uno (cioè è un vettore unitario, o versore), # » a·b b a·b CA′ = b. = kbk kbk kbk2
a γ C a·b b kbk2
Definiamo la proiezione di un vettore a su di un vettore b (o, equivalentemente, la proiezione di a sulla retta individuata da b) con la formula a·b (14) projb a = b. kbk2
Se il vettore b è unitario, allora la proiezione assume la forma più semplice projb a = (a · b)b. (III.20) Nota. Se i, j e k sono i tre vettori unitari del sistema di riferimento canonico di R3 , allora le proiezioni di un vettore x = (x1 , x2 , x3 ) sono
A′
b
F III.10
Fissato il vettore b ∈ Rn , b , 0, la proiezione projb associa quindi ad un vettore a ∈ Rn il vettore projb a definito dalla (14), che è sempre multiplo scalare di b. È quindi una funzione da Rn all’insieme dei multipli scalare di b (cioè alla retta in Rn che contiene b).
proji x = (x · i)i = x1 i
proj j x = (x · j) j = x2 j
projk x = (x · k)k = x3 k, cioè sono proprio le componenti di x rispetto ai tre assi. Come vedremo nel prossimo capitolo, questo è vero per tutti i sistemi di riferimento ortogonali.
§ 4. Area di un parallelogramma Consideriamo nel piano un parallelogramma di vertici A, B, C e D, come in Figura III.11. Per quanto abbiamo visto in (III.14), i lati paralleli danno luogo a vettori uguali, che possiamo chiamare #» # » #» #» a = AB = CD e b = AC = BD.
In
tutto questo paragrafo consideriamo solo vettori del piano bidimensionale. Ovviamente è possibile considerare anche parallelogrammi i cui lati siano vettori di tre o più dimensioni (si veda anche il § 6 sul prodotto vettoriale).
§ 4. Area di un parallelogramma
113
Ora che conosciamo il coseno dell’angolo compreso fra i due vettori, possiamo facilmente calcolare l’area del parallelogramma, riferendoci alla Figura III.11. Poiché l’altezza rispetto alla base AB è kbk| sin γ, abbiamo p Area = kakkbk| sin γ| = kak2 kbk2 − (a · b)2 . Siano i = (1, 0) e j = (0, 1). Allora a = a1 i + a2 j, b = b1 i + b2 j, e, per la Proposizione (III.17),
C
b
D
|b| sin γ γ a
A
H B
F III.11: un parallelogramma e la sua area.
(15) Area = |a1 b2 − a2 b1 | . Per una ragione che cercheremo di spiegare fra poco, conviene definire l’area con segno, indicandola con il simbolo A(a, b) come A(a, b) = kakkbk sin γ = a1 b2 − a2 b1 . Ora dimostriamo che questa definizione discende necessariamente da alcune relazioni fondamentali che intercorrono fra l’area (con segno) e le operazioni di base fra i vettori che definiscono il parallelogramma. Esse sono ➔ invarianza per traslazioni: l’area di un parallelogramma non cambia se si trasla la figura, e quindi dipende solo dai due vettori a e b; ➔ fattore di riscalamento: se moltiplichiamo b per uno scalare c, otteniamo un nuovo parallelogramma ABC′ D′ , in cui C′ = A + cb = #» #» A + cAC e D′ = B + cb = B + cBD, come in Figura III.12. Ne segue che anche l’area viene riscalata per il fattore c, e cioè che A(a, cb) = cA(a, b); lo stesso vale naturalmente se riscaliamo a; ➔ area di una somma: consideriamo la situazione rappresentata nella Figura III.13: l’area del parallelogramma ABDC è A(a, b). Se c è un vettore qualsiasi e si pone C′ = C + c, D′ = D + c, ne risulta che CDD′ C′ è un parallelogramma, la cui area è uguale a A(a, c), visto #» # » che a = AB = CD. Poiché i triangoli ACC′ e BDD′ sono congruenti, l’area del parallelogramma ABD′ C′ è uguale alla somma delle aree # » di ABDC e CDD′ C′ ; ma AC′ = C+c−A = b+c, e dunque A(a, b+c) = A(a, b) + A(a, c); ➔ area del segmento: se si scelgono due vettori uguali (a = b), cioè se il parallelogramma degenera in un segmento la sua area sarà zero, cioè A(a, a) = 0; ➔ area del quadrato: se invece si scelgono i due vettori a = (1, 0) e b = (0, 1) otteniamo un quadrato di lato unitario, che quindi ha area 1. Riassumiamo le quattro proprietà della funzione area che abbiamo dimostrato.
Abbiamo
già incontrato le aree con segno nel primo volume, quando abbiamo introdotto gli integrali di funzioni di una variabile. In quel frangente, il segno attribuito alle aree era positivo per le regioni del semipiano delle y positive e negativo altrimenti, Cioè in dipendenza dal segno del seno dell’angolo formato con la semiretta delle x positive. In modo simile, nella circostanza presente, assegnamo un segno concordemente con il seno dell’angolo formato con la semiretta determinata dal vettore a.
D′ C′ = A + cb D C a
B
A
F III.12: riscalando un lato di un parallelogramma, l’area viene riscalata dello stesso fattore.
114
Vettori e calcolo geometrico
D′
C′
D c C
b+c B
b a A
F III.13: area e somma di vettori.
(A1) A(ca, b) = cA(a, b) = A(a, cb); (A2) A(a, b + c) = A(a, b) + A(a, c); A(a + c, b) = A(a, b) + A(c, b); (A3) A(a, a) = 0; " # " #! 1 0 (A4) A , = 1. 0 1
Per
le considerazioni fatte sull’idea di area con segno, riteniamo valida questa proprietà anche per c < 0.
Procediamo nel ragionamento osservando che il segno di una funzione area con queste proprietà dipende dall’ordine dei vettori, dal momento che (16) (A2) + (A3)
=⇒
A(a, b) = −A(b, a).
Osserviamo inoltre che se per ogni a e b vale l’equazione (16), allora in particolare vale (A3): infatti, ponendo a = b si ottiene A(a, a) = −A(a, a) e quindi A(a, a) = 0. Possiamo quindi sostituire la Proprietà (A3) con la seguente: (A3’) A(a, b) = −A(b, a). (III.21) C’è una unica funzione A(a, b), con a e b in R2 , che soddisfa le Proprietà (A1), (A2), (A3) (equivalentemente (A3’)) e (A4).
Infatti, A(a, b) + A(b, a) = A(a, b) + A(a, a) + A(b, b) +A(b, a) | {z } | {z } =0
=0
= A(a, a + b) + A(b, b + a) = A(a, a + b) + A(b, a + b) = A(a + b, a + b) = 0.
§ 4. Area di un parallelogramma
115
Dimostrazione. Siano i = (1, 0) e j = (0, 1). Allora a = a1 i + a2 j, b = b1 i + b2 j, e per (A1) e (A2) possiamo scrivere A(a, b) = A(a1 i + a2 j, b) = a1 A(i, b) + a2 A(j, b) = a1 A(i, b1 i + b2 j) + a2 A(j, b1 i + b2 j) = a1 (b1 A(i, i) + b2 A(i, j)) + a2 (b1 A(j, i) + b2 A(j, j)) = a1 b2 A(i, j) + a2 b1 A(j, i) = (a1 b2 − a2 b1 )A(i, j) = a1 b2 − a2 b1 .
A(i, i) = A( j, j) = 0 A( j, i) = −A(i, j) = 0 A(i, j) = 1
Quindi non può esistere più di una funzione con queste proprietà. Per mostrare che almeno una esiste, basta mostrare che la funzione che abbiamo definito come area con segno A, e che d’ora in poi chiameremo determinante, cioè " # " #! a b (17) det 1 , 1 = a1 b2 − a2 b1 . a2 b2 in effetti verifica (A1), (A2), (A3’) (equivalentemente: (A3)) e (A4). Verifichiamo quindi che tutte le proprietà sono soddisfatte: (A1) det(ca, b) = ca1 b2 − ca2 b1 = c det(a, b) = det(a, cb).
(A2) det(a, b + c) = a1 (b2 + c2 ) − a2 (b1 + c1 ) = a1 b2 − a2 b1 + a1 c2 − a2 c1 = det(a, b) + det(a, c); analogamente det(a + c, b) = (a1 + c1 )b2 − (a2 + c2 )b1 = a1 b2 − a2 b1 + c1 b2 − c2 b1 = det(a, b) + det(c, b). (A3) det(a, a) = a1 a2 − a2 a1 = 0.
(A4) det(i, j) = i1 j2 − i2 j1 = 1 · 1 − 0 · 0 = 1.
(III.22) Definizione. La funzione det(a, b), la cui esistenza e unicità è stata dimostrata nella Proposizione (III.21), è detta funzione determinante. Risulta Area (ABCD) = |det(a, b)|, #» # » #» #» se ABCD è un parallelogramma con a = AB = CD e b = AC = BD. Vediamo una importante conseguenza delle proprietà del determinante. (III.23) Teorema. Siano a e b due vettori di R2 . Le seguenti affermazioni sono equivalenti: ① I vettori a e b sono linearmente indipendenti. ② det(a, b) , 0. ③ Per ogni c ∈ R2 , il sistema di due equazioni (18) ax + by = c ha una e una sola soluzione (x, y).
Questo è ancora l’equazione (7) a pagina 103.
116
Vettori e calcolo geometrico
Dimostrazione. Siano (a1 , a2 ) = a e (b1 , b2 ) = b. Per prima cosa dimostriamo che se i vettori a e b sono linearmente indipendenti, allora il determinante det(a, b) , 0. Se infatti per assurdo det(a, b) = 0, allora " # " # " # a b 0 a1 b2 − a2 b1 = 0 =⇒ b2 1 − a2 1 = . a2 0 b2 Ora, i casi sono due: se (a2 , b2 ) , 0 dall’ultima equazione segue che a e b sono linearmente dipendenti; se invece (a2 , b2 ) = 0, comunque a e b sono linearmente dipendenti perché b1 a = a1 b. Ora mostriamo che se il determinante det(a, b) , 0, allora per ogni c ∈ R2 esiste una e una unica soluzione (x, y) all’equazione (18). Infatti
Ricordate la proposizione “contro-
nominale”, nel capitolo ℵ del primo volume?
Sistema di equazioni, se vogliamo. G
det(a, c) = det(a, ax + by) = det(a, a)x + det(a, b)y
F
H E
= det(a, b)y det(b, c) = det(b, ax + by)
#
c = AE
= det(b, a)x + det(b, b)y = − det(a, b)x,
y
B
C
#
#
b = AC
e quindi, dato che det(a, b) , 0, det(c, b) , (19) x = det(a, b)
D
a = AB A
F III.14
det(a, c) = . det(a, b)
Finiamo con il mostrare che se per ogni c ∈ R2 l’equazione (18) ha una ed esattamente una soluzione, allora a e b sono linearmente indipendenti. Se non lo fossero, allora esisterebbe (x0 , y0 ) , (0, 0) tale che ax0 + by0 = 0. Quindi l’equazione ax + by = 0 avrebbe almeno le due soluzioni distinte (0, 0) e (x0 , y0 ), e non una sola soluzione.
È
facile verificare (applicando (17)) che quella ottenuta è effettivamente una soluzione.
Cioè l’equazione per c = 0 ∈ R2 .
§ 5. Volume di un parallelepipedo La discussione appena conclusa della nozione dell’area (con segno) di un parallelogramma e delle sue proprietà, ci servirà da guida per definire, in questo paragrafo, il volume (con segno) di un parallelepipedo. La Figura III.15 mostra un parallelepipedo nello spazio euclideo. Innanzitutto, #» #» #» osserviamo che i vettori a = AB, b = AC e c = AE identificano in modo univoco il parallelepipedo a meno di traslazioni. L’invarianza per traslazioni implica dunque che il volume sia una funzione dei tre vettori a, b e c. In analogia con il caso dell’area, cerchiamo di rendere esplicite le proprietà del volume (con segno) che indicheremo con V(a, b, c). La prima cosa da osservare è che se E′ indica il piede della perpendicolare alla base ABDC passante per E (come in Figura III.15), allora il volume è uguale all’area del parallelogramma di base ABDC per l’altezza h = EE′ . Ma h non cambia quando si moltiplicano a o b per degli scalari. Lo stesso naturalmente vale per le altre due facce. Abbiamo di nuovo il fattore di riscalamento: per ogni c reale V(ca, b, c) = hA(ca, b) = chA(a, b) = cV(a, b, c). Per quanto riguarda il volume della somma, ragionando di nuovo come
In tutto questo paragrafo consideriamo solo vettori tridimensionali.
G F
H E D B E′
C A
F III.15
§ 5. Volume di un parallelepipedo
117
G′
H′
G F
H E ′
D
C′
D B
C A
F III.16: additività del volume. Si provi, per esercizio, a dimostrare che il volume del parallelepipedo ABEC′ (non elenchiamo tutti i vertici: ne bastano 4 per identificarlo) è uguale alla somma dei volumi di ABEC e CDHC′ . Questo è un buon esempio di come l’approccio algebrico semplifichi di molto la trattazione.
nel caso del parallelogramma, avvalendosi della Figura III.16, l’analogo tridimensionale della Figura III.13, si mostra facilmente la proprietà di additività. Analoghe considerazioni ci spingono a definire zero il volume di un parallelepipedo degenere, in cui degli spigoli è nullo, e uno il volume del cubo di lato unitario. Ritroviamo dunque le seguenti proprietà: (V1) V(ca, b, c) = cV(a, b, c) = V(a, cb, c) = V(a, b, cc); (V2) V(a + d, b, c) = V(a, b, c) + V(d, b, c); V(a, b + d, c) = V(a, b, c) + V(b, d, c); V(a, b, c + d) = V(a, b, c) + V(a, b, d);
Valida anche per c < 0 (otterremo perciò un volume con segno).
(V3) (se due vettori coincidono, il volume è nullo) V(a, a, b) = 0 = V(a, b, b) = V(a, b, a); 1 0 0 (V4) V 0 , 1 , 0 = 1. 0 0 1 Come nel paragrafo precedente, osserviamo che la Proprietà (V3) è equivalente alla seguente: (V3’) V(a, b, c) = −V(b, a, c) = V(b, c, a) = −V(c, b, a) = V(c, a, b) = −V(a, c, b). Cioè ogni volta che si scambiano tra di loro due vettori, cambia il segno del volume V. Dimostreremo che una funzione V con queste proprietà esiste, ed è unica. Sorprendentemente, nonostante tale funzione si ottenga come risultato di considerazioni del tutto analoghe al caso del determinante di due vettori nel piano, la sua espressione è ora notevolmente più complicata.
Supposta
valida la (V2). Si provi a dimostrare questa affermazione — Esercizio 44 a pagina 161.
118
Vettori e calcolo geometrico
(III.24) C’è una unica funzione V(a, b, c), con a, b e c in R3 , che verifica le Proprietà (V1), (V2), (V3) (equivalentemente (V3’)) e (V4): a1 b1 c1 (20) V a2 , b2 , c2 = a1 b2 c3 − a1 b3 c2 − a2 b1 c3 + a2 b3 c1 + a3 b1 c2 − a3 b2 c1 . a3 b3 c3 (III.25) Definizione. La funzione la cui esistenza e unicità è stabilita nella Proposizione (III.24), (definita in (20)) è detta funzione determinante dei tre vettori. Risulta Volume (a, b, c) = |det (a, b, c)|. Procediamo di seguito alla dimostrazione, lungo la quale vedremo alcune proprietà fondamentali della funzione determinante. Prima però cerchiamo di trovare un legame con l’area, ricostruendo in un modo diverso la ben nota formula di “area di base” per “altezza”. (III.26) Lemma. Dalle Proprietà (V1), (V2) e (V3) segue che se si somma ad uno dei vettori un multiplo di un altro il volume V non cambia. Per esempio, per ogni c ∈ R V(a, b, c) = V(a, b + ca, c) = V(a, b, c + ca). Dimostrazione. Basta osservare che V(a, b + ca, c) = V(a, b, c) + V(a, ca, c) = V(a, b, c) + cV(a, a, c) = V(a, b, c).
Supponiamo che a = i = (1, 0, 0). Allora possiamo sommare −b1 i al vettore b e −c1 i al vettore c, ottenendo 1 0 0 1 b1 c1 (21) V 0 , b2 , c2 = V 0 , b2 , c2 . 0 b3 c3 0 b3 c3 Ora, i vettori ottenuti, (0, b2 , b3 ) e (0, c2, c3 ) sono ortogonali a i (che ha lunghezza 1) "e quindi # " #!ci si aspetta che il volume del parallelepipedo sia b2 c2 . Lo dimostriamo in generale utilizzando l’unicità , uguale a det b3 c3 della funzione determinante det per due vettori. (III.27) Lemma. Se esiste una funzione V che verifica (V1), (V2), (V3), (V4), allora " # " #! 1 b1 c1 c b V 0 , b2 , c2 = det 2 , 2 , b3 c3 0 b3 c3 " # " #! 0 b1 c1 c b V 1 , b2 , c2 = − det 1 , 1 , b3 c3 0 b3 c3
Infatti V(a, a, c) = 0.
§ 5. Volume di un parallelepipedo
119
" # " #! 0 b1 c1 b c V 0 , b2 , c2 = det 1 , 1 . b2 c2 1 b3 c3 Dimostrazione. Analogamente a come abbiamo dimostrato l’equazione (21), possiamo mostrare che 0 b1 c1 0 b1 c1 0 b1 c1 0 b1 c1 V 1 , b2 , c2 = V 1 , 0 , 0 e V 0 , b2 , c2 = V 0 , b2 , c2 . 1 b3 c3 0 b3 c3 1 0 b3 c3 0 0 Ora, consideriamo la funzione " # " #! 1 0 0 b2 c2 f , = V 0 , b2 , c2 . b3 c3 0 b3 c3 Per (V1), verifica la Proprietà (A1). Per (V2), verifica la Proprietà (A2). Per (V3), verifica la Proprietà (A3). Infine " # " #! 1 0 0 1 0 = V 0 , 1 , 0 , f 0 1 0 0 1 che è uguale a 1 per la (V4): visto che la funzione determinante è unica, si ha la tesi. Ora procediamo nello stesso modo per " # " #! 0 b1 c1 b1 c1 f , = V 1 , 0 , 0 . b3 c3 0 b3 c3 Ancora (A1), (A2) e (A3) seguono facilmente. E (A4)? " # " #! 0 1 0 1 0 = V 1 , 0 , 0 . , f 0 1 0 0 1 Con lo scambio del primo e del secondo vettore notiamo che 1 0 0 0 1 0 V 1 , 0 , 0 = −V 0 , 1 , 0 = −1, 0 0 1 0 0 1 applicando (V3’) e (V4). Quindi la funzione che è uguale al determinante non è f ma − f . Possiamo concludere con la terza, osservando che se poniamo " # " #! 0 b1 c1 b1 c1 f , = V 0 , b2 , c2 b2 c2 1 0 0 otteniamo una funzione f che verifica le Proprietà (A1), (A2), (A3) e tale che " # " #! 1 0 0 1 0 0 0 1 0 1 0 0 0 1 0 0 1 = V , , = −V , , = V 0 , 1 , 0 = 1. , f 0 1 0 0 1 0 1 0 1 0 0
A volte è bello ripetersi.
120
Vettori e calcolo geometrico
Dimostrazione della Proposizione (III.24). Cominciamo a mostrare che, ammesso che esista, non ne può esistere più di una (cioè l’unicità). Siano i, j e k i tre vettori (1, 0, 0), (0, 1, 0) e (0, 0, 1). Allora a = (a1 , a2 , a3 ) si scrive come a1 i + a2 j + a3 k e il volume V(a, b, c) si può scrivere come somma V a1 i + a2 j + a3 k, b, c = a1 V(i, b, c) + a2 V(j, b, c) + a3 V(k, b, c). Ma per il Lemma (III.27) " # " #! b c V(i, b, c) = det 2 , 2 , b3 c3
" # " #! b c V(j, b, c) = − det 1 , 1 , b3 c3
Dimostrare
l’unicità prima dell’esistenza sembra un po’ bizantino, ma vedremo che aiuta a rendere la dimostrazione più – si spera – comprensibile.
" # " #! b c V(k, b, c) = det 1 , 1 , b2 c2
e quindi " # " #! " # " #! " # " #! a1 b1 c1 b c b c b c (22) V a2 , b2 , c2 = a1 det 2 , 2 −a2 det 1 , 1 +a3 det 1 , 1 . b3 c3 b3 c3 b2 c2 a3 b3 c3 C’è quindi al massimo una funzione V che verifica tutte le Proprietà (V1), (V2), (V3) e (V4). La (22) ci permetterebbe di definire la funzione cercata, come abbiamo fatto per il determinante di due vettori: ci resterebbe da dimostrare solo che questa funzione V soddisfa le proprietà in questione. Invece procediamo in un altro modo (e il Lettore è incoraggiato a provare a fare altrimenti): lo facciamo definendo un’altra funzione con le Proprietà (V1), (V2), (V3) e (V4). Sappiamo che ce ne può essere una sola, e quindi non sarà altro che un’altra definizione della stessa funzione, che denoteremo ancora con il simbolo det " # " #! " # " #! " # " #! b c a c a b (23) det(a, b, c) = a1 det 2 , 2 − b1 det 2 , 2 + c1 det 2 , 2 . b3 c3 a3 c3 a3 b3 Se c è uno scalare, allora
" # " #! " # " #! " # " #! b2 c2 ca2 c2 ca2 b2 , − b1 det , + c1 det , b3 c3 ca3 c3 ca3 b3 " # " #! " # " #! " # " #! b c a c a b = ca1 det 2 , 2 − cb1 det 2 , 2 + cc1 det 2 , 2 b3 c3 a3 c3 a3 b3
det(ca, b, c) = ca1 det
= c det(a, b, c). Per b e c si può seguire lo stesso ragionamento. Se d è un altro vettore, allora " # " #! " # " #! b2 c2 a2 + d2 c2 det(a + d, b, c) = (a1 + d1 ) det , − b1 det , + b3 c3 a3 + d3 c3 " # " #! a + d2 b2 +c1 det 2 , a3 + d3 b3 " # " #! " " # " #! " # " #!# b c a c d c = (a1 + d1 ) det 2 , 2 − b1 det 2 , 2 + det 2 , 2 + b3 c3 a3 c3 d3 c3 " " # " #! " # " #!# a2 b2 d b +c1 det , + det 2 , 2 a3 b3 d3 b3 = det(a, b, c) + det(d, b, c). Se si somma d a b e c si può seguire lo stesso ragionamento. Inoltre, se a = b si ha " # " #! " # " #! " # " #! a c a c a a det(a, a, c) = a1 det 2 , 2 − a1 det 2 , 2 + c1 det 2 , 2 = 0. a3 c3 a3 c3 a3 a3
§ 5. Volume di un parallelepipedo
121
Analogamente det(a, c, c) = 0 e det(a, b, a) = 0. Non rimane che controllare che valga (V4), " # " #! " # " #! " # " #! 0 1 0 0 1 0 = 1, , + 0 det , − 0 det , det(i, j, k) = det 0 0 0 1 0 1 ed è fatta. Come volevasi dimostrare.
(III.28) Siano a, b e c tre vettori di R3 . Allora a1 a2 a3 a1 b1 c1 det b1 , b2 , b3 = det a2 , b2 , c2 . c1 c2 c3 a3 b3 c3 Dimostrazione. Ricordiamo a questo proposito che per l’equazione (23) " # " #! " # " #! " # " #! b2 c2 a2 c2 a b det(a, b, c) = a1 det , − b1 det , + c1 det 2 , 2 . b3 c3 a3 c3 a3 b3 Ma anche, per l’equazione (22), " # " #! " # " #! " # " #! b2 c2 b1 c1 b c det(a, b, c) = a1 det , − a2 det , + a3 det 1 , 1 . b3 c3 b3 c3 b2 c2 Dato che det
" a1 a2
b1 b2
#!
" = a1 b2 − a2 b1 = det
a1 b1
a2 b2
#! ,
sia ha che " #! a1 a2 a3 b2 b3 b b b det 1 , 2 , 3 = a1 det − a2 det c2 c3 c1 c2 c3 " #! b2 c2 = a1 det − a2 det b3 c3 a1 b1 c1 = det a2 , b2 , c2 , a3 b3 c3
" b1 c1 " b1 b3
#! b3 + a3 det c3 #! c1 + a3 det c3
cioè la tesi.
" "
b1 c1
b1 b2
#! b2 c2 #! c1 c2
Il prossimo teorema racchiude le proprietà essenziali del determinante, relative alla dipendenza lineare e ai sistemi di equazioni lineari. (III.29) Teorema. Siano a, b e c tre vettori di R3 . Le seguenti proposizioni sono equivalenti: ① I vettori a, b e c sono linearmente indipendenti. ② det(a, b, c) , 0. ③ Per ogni d ∈ R3 , il sistema di (tre) equazioni (24) ax + by + cz = d ha una e una sola soluzione in (x, y, z).
122
Vettori e calcolo geometrico
j Dimostrazione. Come per l’analogo Teorema (III.23), dimostriamo che ① =⇒ ② =⇒ ③ =⇒ ①. Cominciamo a mostrare not ② =⇒ not ①, cioè che se det(a, b, c) = 0, allora i tre vettori sono linearmente dipendenti. Ma a, b, c sono linearmente dipendenti se e solo se esiste una soluzione (x, y, z) , 0 del sistema a1 x + b1 y + c1 z = 0 a2 x + b2 y + c2 z = 0 (25) a3 x + b3 y + c3 z = 0. È un sistema che possiamo risolvere per eliminazione delle variabili (eliminazione di Gauss), permutando righe e sommando alle righe combinazioni lineari di altre righe. Ora, consideriamo i vettori dei coefficienti delle tre equazioni a1 a2 a3 b1 , b2 , b3 . c1 c2 c3 Per la Proposizione (III.28) il loro determinante è uguale al determinante a1 b1 c1 d = det a2 , b2 , c2 = det(a, b, c) = 0. a3 b3 c3 Ad ogni operazione elementare sul sistema (25) come cambia il determinante dei vettori dei coefficienti? Se si permutano due equazioni, allora si permutano i due vettori corrispondenti e quindi da d si passa a d′ = −d. Se si somma ad una equazione un’altra equazione, sappiamo che il determinante non cambia. Se si moltiplica un’equazione per una costante c , 0, allora si passa da d a d′ = cd. In ogni caso, si passa da un sistema con determinante zero a un sistema con determinante zero (e viceversa da uno con determinante diverso da zero a uno con determinante diverso da zero). Supponiamo quindi di poter eliminare la variabile x1 : alla fine della procedura di eliminazione il sistema ha la forma x + bˆ 1 y + cˆ1 z = 0 bˆ 2 y + cˆ2 z = 0 bˆ 3 y + cˆ3 z = 0, e il determinante dei coefficienti deve essere zero. Ma per il Lemma (III.27) si ha " # " #! 1 0 0 ˆ ˆ ˆ bˆ bˆ det b1 , b2 , b3 = det 2 , 3 ). cˆ2 cˆ3 cˆ1 cˆ2 cˆ3 Quindi il sistema ˆ b2 y + cˆ2 z = 0 bˆ 3 y + cˆ3 z = 0. ha determinante uguale a zero, e per il Teorema (III.23) ha una soluzione non nulla (y0 , z0 ) , (0, 0). Basta quindi porre x0 + bˆ 1 y0 + cˆ1 z0 = 0
Altrimenti
il ragionamento si applica ad una qualsiasi altra variabile: se non fosse possibile eliminare nessuna delle tre variabili, vorrebbe dire che a = b = c = 0, ed il sistema iniziale è risolto da ogni vettore.
§ 6. Il prodotto vettoriale
123
per trovare la soluzione cercata (x0 , y0 , z0 ) , (0, 0, 0). Per la parte ② =⇒ ③, ragioniamo come nella corrispondente parte della dimostrazione del Teorema (III.23): se det(a, b, c) , 0, allora la soluzione dell’equazione (24) si trova calcolando det(d, b, c), det(a, d, c) e det(a, b, d) come segue det(d, b, c) = x det(a, b, c) + y det(b, b, c) + z det(c, b, c) = x det(a, b, c)
Questo
metodo è detto metodo di Cramer, ovviamente in onore del matematico Gabriel Cramer (1704–1752).
det(a, d, c) = x det(a, a, c) + y det(a, b, c) + z det(a, c, c) = y det(a, b, c) det(a, b, d) = x det(a, b, a) + y det(a, b, b) + z det(a, b, c) = z det(a, b, c), da cui deduciamo che l’unica soluzione è data da (x, y, z) con (26) x =
det(d, b, c) , det(a, b, c)
y=
det(a, d, c) , det(a, b, c)
z=
det(a, b, d) . det(a, b, c)
Non rimane che dimostrare che ③ =⇒ ①: la dimostrazione però è praticamente la stessa di quella del Teorema (III.23), per cui la si lascia volentieri al Lettore per esercizio (si veda l’Esercizio 56 ).
a×b b
Possiamo concludere questa sezione tornando al problema delle terne destrorse. Diciamo che tre vettori a, b e c di R3 costituiscono una terna destrorsa (o che sono positivamente orientati) se
γ a
det(a, b, c) > 0. Sappiamo che
F III.17: prodotto vettoriale dei vettori a e b.
det(i, j, k) = 1 > 0, quindi i, j e k costituiscono una terna destrorsa anche in questo senso. È vero che possiamo sovrapporre pollice, indice e medio della mano destra a a, b e c come nella figura III.1 di pagina 106 se e solo se det(a, b, c) > 0? Ci ripenseremo.
§ 6. Il prodotto vettoriale Se a e b sono due vettori di dimensione 3, è possibile definire il prodotto vettoriale a × b di a e b come quel vettore che è perpendicolare sia a a che a b e che ha per lunghezza l’area del parallelogramma generato da a e b, come indicato in Figura III.17. Un momento. . . in questo modo non è ben definito! Se a e b sono linearmente indipendenti allora ci sono due vettori ortogonali al piano di a e b di lunghezza fissata; se invece a e b sono linearmente dipendenti (cioè uno è multiplo dell’altro), allora l’area è zero e quindi comunque non conta il fatto che di vettori ortogonali ad entrambi ce ne siano infiniti perché il prodotto viene zero. Nel caso con area diversa da zero scegliamo tra i due possibili vettori quello con la seguente proprietà:
È
anche detto prodotto esterno o all’inglese cross product. Una notazione equivalente è a ∧ b.
124
Vettori e calcolo geometrico
la terna a, b, a × b è una terna destrorsa. La definizione ha senso, dato che se a e b sono linearmente indipendenti e c · a = c · b = 0, c , 0 allora a, b, c sono linearmente indipendenti (si veda l’Esercizio 28 a pagina 160) e a meno di scambiare c con −c si ottiene una terna destrorsa. Osserviamo che se γ è l’angolo (compreso tra 0 e π) tra a e b, allora l’area del parallelogramma generato da a e b è uguale a kakkbk sin γ . Se quindi n indica il versore (vettore unitario) ortogonale a a e b tale che a, b, n è destrorsa, allora il prodotto vettoriale a × b si scrive come
Ci
si ricorda la Figura III.11 a pag. 113?
(27) a × b = (kakkbk sin γ)n. Stiamo definendo un vettore che è funzione di a e b e che, oltre a essere ortogonale ad a e b, dovrebbe avere le proprietà di una “funzione areai” A(a, b) = a × b in dimensione 3, analoghe a quelle del determinante (A1), (A2), (A3), (A3’) per la dimensione 2. Vorremmo quindi che valgano le seguenti proprietà. (v1) (ca) × b = c(a × b) = a × (cb); (v2) a × (b + c) = a × b + a × c; (a + c) × b = a × b + c × b; (v3) a × a = 0; (v3’) a × b = −b × a.
Esattamente
Le permutazioni dei vettori i, j e k che danno luogo a terne destrorse sono
come s’è fatto per la Proposizione (III.21) è possibile mostrare che (v1)+(v2)+(v3) sono equivalenti a (v1)+(v2)+(v3’).
(i, j, k), ( j, k, i), (k, i, j), e quindi l’analogo della Proprietà (A4) è la seguente. (v4) i × j = k ,
j×k=i ,
k × i = j,
cui seguono naturalmente le identità j×i = −i× j = −k, k× j = − j×k = −i, i × k = −k × i = − j. A questo punto siamo in grado di scriverne una espressione in coordinate: a × b = a × (b1 i + b2 j + b3 k) = b1 a × i + b2 a × j + b3 a × k
È chiaro che i × j, dovendo essere
un vettore ortogonale sia a i che a j di lunghezza uno, non può che essere k oppure −k. Ma visto che (i, j, k) è una terna destrorsa, allora i × j = k. Lo stesso ragionamento si applica agli altri due casi.
= b1 (a1 i + a2 j + a3 k) × i + b2 (a1 i + a2 j + a3 k) × j + b3 (a1 i + a2 j + a3 k) × k = b1 a2 j × i + b1 a3 k × i + b2 a1 i × j + b2 a3 k × j + b3 a1 i × k + b3 a2 j × k = (a2 b3 − a3 b2 ) j × k + (a3 b1 − a1 b3 )k × i + (a1 b2 − a2 b1 )i × j " # " #! " # " #! " # " #! a2 b2 a1 b1 a b = i det , − j det , + k det 1 , 1 . a3 b3 a3 b3 a2 b2
§ 6. Il prodotto vettoriale
125
Questa espressione potrebbe anche risultare familiare a chi ricorda le equazioni (22) e (23): le componenti del vettore a × b sono quindi (28) a × b = det(i, a, b), det( j, a, b), det(k, a, b) , dato che, come abbiamo visto in (III.27), " # " #! 1 a1 b1 b a 0 a b det(i, a, b) = det , 2 , 2 = det 2 , 2 a3 b3 0 a3 b3 " # " #! 0 a1 b1 a b 1 a b det( j, a, b) = det , 2 , 2 = − det 1 , 1 a3 b3 0 a3 b3 " # " #! 0 a1 b1 b a 0 a b det(k, a, b) = det , 2 , 2 = det 1 , 1 . a2 b2 1 a3 b3 Si vede subito quindi che le Proprietà (v1), (v2), (v3), (v3’) valgono per ogni componente del vettore a × b. Possiamo controllare che (v4) è verificata: dato che det(i, i, j) = 0, la prima componente di i × j è zero; dato che det( j, i, j) = 0, la seconda componente di i × j è zero; infine, det(k, i, j) = − det(i, k, j) = det(i, j, k) = 1, e quindi in effetti i × j = k. (III.30) Esempio. Se a = (1, 2, 3) e b = (1, −1, 0), allora a × b = (i + 2 j + 3k) × (i − j)
= i × (i − j) + 2 j × (i − j) + 3k × (i − j) = i × i − i × j + 2 j × i − 2 j × j + 3k × i − 3k × j = 0 − k − 2i × j − 0 + 3 j + 3 j × k = −k − 2k + 3 j + 3i = 3i + 3 j − 3k = (3, 3, −3).
Un ausilio mnemonico per ricordarsi la definizione di a × b è quello di calcolarlo come determinante formale di una matrice: j k i i a1 b1 a a a j a b a × b = det 1 2 3 2 2 = det . b1 b2 b3 k a3 b3 Per calcolare il prodotto vettoriale dei (III.30), si procede così: " j k i 2 1 2 3 a × b = det = i det −1 1 −1 0
due vettori a e b dell’Esempio # " 3 1 − j det 0 1
= 3i − (−3) j + (−3)k = (3, 3, −3).
# " # 3 1 2 + k det 0 1 −1
Niente
paura, come vedremo nel Capitolo IV, una matrice non è altro che una n-upla di vettori, in cui i vettori si scrivono come colonne di coefficienti.
126
Vettori e calcolo geometrico
(III.31) Siano a, b e c vettori qualsiasi di dimensione 3. ① (prodotto misto/triplo) (a × b) · c = det(a, b, c). ② (a × b) · c = (b × c) · a = (c × a) · b. ③ a × b è ortogonale a a e a b. ④ (identità di Lagrange) ka × bk2 = kak2 kbk2 − (a · b)2 . Dimostrazione. Per definizione di prodotto scalare e le proprietà algebriche (V1), (V2) , (V3’) si ha (a × b) · c = c1 det(i, a, b) + c2 det(j, a, b) + c3 det(k, a, b) = det(c1 i + c2 j + c3 k, a, b)
= det(c, a, b) = − det(a, c, b) = det(a, b, c). La seconda proposizione segue facilmente dalla prima e dal fatto che det(a, b, c) = det(b, c, a) = det(c, a, b). Per mostrare che a × b è ortogonale a a e a b basta calcolare il prodotto scalare, che è zero dato che il determinante si annulla se due vettori sono uguali (a × b) · a = det(a, b, a) = 0,
(a × b) · b = det(a, b, b) = 0.
Per mostrare l’identità di Lagrange, ricordiamo che per la (27) ka × bk = kakkbk sin γ, mentre il prodotto scalare verifica l’uguaglianza a · b = kakkbk cos γ. Dunque ka × bk2 + (a · b)2 = kak2 kbk2 cos2 γ + kak2 kbk2 sin2 γ
= kak2 kbk2 (cos2 γ + sin2 γ) = kak2 kbk2 ,
da cui segue immediatamente l’identità di Lagrange.
(III.32) Corollario. Due vettori a e b di R3 sono linearmente dipendenti se e solo se a × b = 0. Dimostrazione. Se a e b sono linearmente dipendenti, per esempio b = ca, allora a × b = a × ca = ca × a = c0 = 0. Viceversa, per l’identità di Lagrange se a × b = 0 si ha ka × bk2 = 0 = kak2 kbk2 − (a · b)2 , e quindi kak2 kbk2 = (a · b)2 . Ma per la disuguaglianza di Cauchy–Schwarz (Proposizione (III.19)), questo succede se e soltanto se a e b sono paralleli, cioè linearmente dipendenti.
§ 7. Rette e piani: sottospazi lineari
127
§ 7. Rette e piani: sottospazi lineari Il vezzo di iniziare alcune sezioni di questo volume plagiando opere storiche non è ancora passato, e iniziamo a descrivere gli oggetti della geometria euclidea classica citando, appunto, Euclide medesimo: Σημεῖόν ἐστιν, οὗ μέρος οὐθέν, “un punto è ciò che non ha parti”, Γραμμὴ δὲ μῆκος ἀπλατές, “una linea è una lunghezza senza larghezza”, Γραμμῆς δὲ πέρατα σημεῖα, e “gli estremi di una linea sono punti”. Ma cosa è una linea retta? Εὐθεῖα γραμμή ἐστιν, ἥτις ἐξ ἴσου τοῖς ἐφ΄ ἑαυτῆς σημείοις κεῖται, “una linea retta è una linea che giace ugualmente rispetto ai punti su di essa”. Questo è l’incipit degli Elementi, uno dei libri più importanti per la storia del pensiero degli homo sapiens, pubblicato per la prima volta intorno al III secolo BCE ad Alessandria. Rompendo con questa tradizione, definiamo retta e segmento di retta in un altro modo, forse più comprensibile, di sicuro più preciso: (III.33) Definizione. Se A è un punto di Rn e v , 0 un vettore di dimensione n, allora l’insieme di punti l = {A + tv : t ∈ R} = {P ∈ Rn : P = A + tv, per qualche t ∈ R}
F III.18: Euclide di Alessandria (∼320–∼260 BCE), autore degli Elementi.
È essenziale comprendere che se si
interpreta il vettore v come sposta#» mento v = OP a partire dall’origine O, allora i multipli tv del vettore v, con t ∈ R non sono altro che i punti della retta passante per O e P.
è detta retta passante per il punto A e con vettore direzione v (o, equivalentemente, parallela a v). L’equazione (vettoriale) (29) P = A + tv è detta l’equazione parametrica della retta l. In dimensione 2, se P = (x, y), A = (x0 , y0 ) e v = (a, b) i punti di una retta sono quindi quelli che soddisfano le equazioni parametriche " # " # " # ( x = x0 + at x x0 a = +t ⇐⇒ y b y0 y = y0 + bt Le equazioni parametriche di una retta dello spazio (cioè l’equazione (29)) nelle coordinate cartesiane x, y, z) saranno, analogamente, x = x0 + at x x0 a y y b y = y0 + bt ⇐⇒ = 0 + t z z0 c z = z0 + ct Il simbolo t è il parametro con cui vengono parametrizzati (descritti) i punti della retta: per ogni punto P della retta esiste uno e un solo valore di t per cui P = A + tv. 3
(III.34) Esempio. Siano A = (1, 1, 0) e B = (0, 1, 1) due punti di R . Una retta r passante per A ha equazione (parametrica vettoriale) x 1 a y 1 b = + t z 0 c
L’attento Lettore avrà forse nota-
to che una parametrizzazione di una retta non è altro che una funzione che associa al valore del parametro t il punto P = A+tv dello spazio Rn . È quindi una funzione a valori vettoriali, nel senso che ad ogni t si associa un unico punto (meglio, il vettore o la n-upla che lo rappresenta). Ritorneremo su questo argomento quando studieremo le curve nello spazio nel Capitolo V.
I coefficienti a, b e c sono anche detti i coefficienti direttori della retta, nel senso che ne determinano (a meno di riscalamento) la direzione.
128
Vettori e calcolo geometrico
per certi coefficienti a, b, c non tutti nulli. La retta r passa per B se e solo se esiste un tB ∈ R tale che 0 = 1 + atB atB = −1 0 1 a a −1 1 1 b b 0 1 = 1 + bt bt = 0 ⇐⇒ ⇐⇒ ⇐⇒ t = +tB = . B B B 1 0 c 1 = 0 + ctB ctB = 1 c 1 Quindi se a = −1, b = 0 e c = 1 si ottiene l’equazione della retta passante per A e B x=1−t x 1 −1 y = 1 + t 0 y=1 ⇐⇒ z 0 1 z=0+t (III.35) Osservazione. Se i coefficienti direttori sono tutti diversi da zero, è possibile eliminare il parametro t dalle equazioni parametriche e ottenere le equazioni simmetriche della retta: in dimensione due si ha y − y0 x − x0 = a b (cioè una equazione lineare in due incognite x, y); in dimensione tre y − y0 x − x0 z − z0 = = , a b c (cioè un sistema di due equazioni lineari nelle tre incognite x, y, z). Comunque per definizione non tutti i coefficienti direttori possono essere zero, e quindi è sempre possibile eliminare il parametro t, e trasformare le n equazioni parametriche in n − 1 equazioni (senza più parametro). Per esempio, se n = 3 e c , 0, dalle equazioni x = x0 + at y = y0 + bt z = z0 + ct eliminiamo il parametro t sostituendo t = (z − z0 )/c nelle prime due, per ottenere il sistema di due equazioni lineari a(z − z0 ) x = x0 + c b(z − z0 ) y = y0 + . c
possibile in effetti dimostrare che una retta di Rn è sempre l’insieme di soluzioni di n − 1 equazioni lineari in n incognite. Una retta di R2 sarà quindi l’insieme di soluzioni di una equazione lineare in due incognite nel piano; una retta dello spazio sarà l’insieme di soluzioni di due equazioni lineari in tre incognite (nello spazio, quindi).
(III.36) Per due punti distinti A, B passa una e una sola retta, di equazione #» (30) P = A + tAB.
È
La
retta è unica, ma l’equazione no: infatti possiamo sicuramente scriverla anche con l’equazione #» P = B + tBA!
§ 7. Rette e piani: sottospazi lineari
129
Dimostrazione. Per prima cosa osserviamo che l’equazione (vettoriale) (30) è #» proprio del tipo (29) (P = A + tv), ponendo v = AB. Dato che i due punti sono distinti, il vettore direzione è non nullo, e quindi in effetti si tratta di una retta, #» che chiameremo l. Se si pone t = 0, si ha P = A + tAB = A, mentre se si pone #» t = 1 si ha P = A + AB = B, e pertanto la retta in esame passa per i due punti A e B. Ora dobbiamo dimostrare che se l′ è un’altra retta per A e B, allora l′ = l. Sia quindi l′ una retta per A e B, cioè l′ = {C + sw : s ∈ R} per un punto C e un vettore direzione non nullo w. Dato che A, B ∈ l′ , devono esistere a, b ∈ R tali che A = C + aw
B = C + bw.
#» Visto che A , B, dovrà essere a , b. Quindi se P ∈ l (cioè P = A + tAB), risulta P = (C + aw) + t [(C + bw) − (C + aw)] = C + [a + t(b − a)]w = C + sw
=⇒
P ∈ l′ ,
dove s = a + t(b − a), e pertanto l ⊂ l′ . Viceversa, se P′ ∈ l′ , cioè se P′ = C + sw per un certo s ∈ R, basta osservare che ponendo t = (s − a)/(b − a) si ha s = a + t(b − a), #» e quindi P′ = A + tAB, cioè P′ ∈ l. Possiamo concludere che l = l′ .
(III.37) Corollario. Valgono le seguenti proprietà: ① Due rette l e l′ di equazioni P = A + tv e P = A + t′ v′ coincidono se e solo se i vettori v e v′ sono paralleli. ② Due rette l e l′ di equazioni P = A + tv e P = B + t′ v coincidono se e solo se A ∈ l′ (oppure B ∈ l). ③ Se due rette l e l′ di equazioni P = A + tv e P = B + t′ v′ coincidono, allora i vettori v e v′ sono paralleli. Dimostrazione. Per dimostrare la prima, osserviamo che se i vettori v e v′ sono paralleli (cioè se v′ = cv per una certa costante c , 0), allora l passa per i due punti A e B = A + v, ma anche l′ passa per A e B: basta porre t′ = 0 e 1 t′ = . Allora, per (III.36) deve essere l = l′ . Viceversa, supponiamo che l = l′ . Se c poniamo B′ = A + v′ , abbiamo che B′ ∈ l′ , e quindi B′ ∈ l, dunque deve esistere c tale che B′ = A + cv. Ma allora v′ = B′ − A = (A + cv) − A = cv, cioè v e v′ sono paralleli. Ora dimostriamo la seconda. È chiaro che se l = l′ allora A ∈ l′ e B ∈ l. Se viceversa A ∈ l′ , allora l′ passa per B e A. Se A = B, allora le due rette sono uguali perché hanno la stessa equazione. Altrimenti, se A , B, per dimostrare che sono uguali basta mostrare che anche l passa per A e B e fare uso della (III.36). Ma se A ∈ l′ , allora esiste c tale che A = B + cv, e quindi B = A − cv, cioè B ∈ l. La dimostrazione della ③ è un utile esercizio, che lasciamo al Lettore (Esercizio 8 a pagina 159).
Si ottengono ponendo t = 0 e t = 1.
130
Vettori e calcolo geometrico
(III.38) Definizione. Se A e B sono due punti distinti, il segmento di retta con estremi A e B, che si indica con [A, B], ha equazione #» P = A + tAB ,
0 ≤ t ≤ 1,
Nel linguaggio degli insiemi, il segmento di retta con estremi A e B è l’insieme n o #» [A, B] = A + tAB : t ∈ R, 0 ≤ t ≤ 1 .
o equivalentemente P = A + t(B − A) o anche P = (1 − t)A + tB. Nelle coordinate cartesiane nello spazio R3 , il segmento di retta che congiunge i punti P0 = (x0 , y0 , z0 ) e P1 = (x1 , y1 , z1 ) ha perciò equazione # » P = P(t) = P0 + tP0 P1 = P0 + t(P1 − P0 ) = tP1 + (1 − t)P0 tx1 + (1 − t)x0 ty + (1 − t)y = 1 0 t ∈ [0, 1] tz1 + (1 − t)z0 (III.39) Osservazione. È facile vedere che, analogamente, è possibile definire la semiretta uscente dal punto A con direzione v, dall’equazione P = A + tv, t ≥ 0.
(III.40) Definizione. Diciamo che due rette di equazioni P = A + tv e P = A′ + t′ v′ sono parallele se i vettori direzione v e v′ sono paralleli. (III.41) Dati una retta l e un punto B (di Rn ), esiste una ed una unica retta l′ passante per B e parallela a l. Dimostrazione. Se l ha equazione P = A + tv, la retta l′ può essere definita dall’equazione P = B + tv, e quindi almeno una retta per B parallela a l esiste. Se C = B + v, è l′ è l’unica retta per B e C. Ora, in generale una retta l′′ parallela a l, ha equazione P = D + tv′ , dove v′ e v sono paralleli (cioè v′ = cv). E se l′′ passa per B, allora deve esistere b ∈ R tale che B = D + bv′ , e quindi i punti P di l′′ sono quelli tali che esista t ∈ R per cui P = (B − bv′ ) + tv′ = B + (t − b)v′ = B + (t − b)cv. Ma per t = 1/c + b si ha (t − b)c = 1, e si ottiene il punto C = B + v, cioè l′′ passa anche per C. Dato che di rette per B e C c’è solo l′ , deve essere l′′ = l′ .
Due rette sono incidenti se hanno esattamente un punto in comune. Diciamo che due rette incidenti in Rn di equazioni P = A+tv e P = B+sw sono ortogonali se lo sono i rispettivi vettori direzione v e w. In generale, due rette o piani sono ortogonali se ogni vettore direzione dell’uno/a è ortogonale a ogni vettore direzione dell’altro/a. Due rette in R3 sono invece sghembe se non sono né incidenti né parallele. (III.42) Osservazione. Nel piano cartesiano R2 , l’insieme l dei punti di coordinate (x, y) che soddisfano l’equazione (31) ax + by = c,
La semiretta è quindi l’insieme dei punti {A + tv : t ∈ R, t ≥ 0}.
Riflettiamo qualche secondo sulla definizione (III.40). Due rette sono parallele se e solo se nelle loro equazioni i vettori direzione sono paralleli. Cioè, una relazione tra rette viene definita in termini di una relazione esplicita tra le rispettive equazioni. Ma se ad una equazione corrisponde una unica retta, non è vero il viceversa: una retta può essere scritta con molte (infinite) equazioni. Affinché la definizione (III.40) abbia senso (cioè non sia una definizione contraddittoria, e renda possibile stabilire per ogni coppia di rette se sono parallele o no, in modo assolutamente certo), occorre che la definizione non dipenda dalle particolari equazioni che si scelgono per le due rette. Ricordiamo però il ③ del Corollario (III.37): se la stessa retta ha due equazioni diverse P = A + tv e P = B + sw, allora v e w sono vettori paralleli. Se quindi le due rette in questione hanno equazioni P = A+tv e P = A′ + t′ v′ , ma anche equazioni P = B + sw e P = B′ + s′ w′ , risulterà che v e w sono paralleli, come v′ e w′ . Ma allora v e v′ sono paralleli se e soltanto se lo sono w e w′ . Abbiamo quindi dimostrato che la definizione è ben posta. In particolare, abbiamo così dimostrato anche che due rette coincidenti (ma con equazioni non necessariamente uguali) sono parallele.
§ 7. Rette e piani: sottospazi lineari
131
con (a, b) , (0, 0), costituisce una retta. Infatti, uno dei due coefficienti a e b non è zero, e senza perdere generalità possiamo supporre che sia b. Allora dividendo per b l’equazione si può scrivere in modo equivalente come y = −a′ x + c′ ,
con a′ = a/b e c′ = c/b. Ponendo quindi t = x, parametro libero, si ha " # " # ( " # x=t x 0 1 cioè = + t , y c′ −a′ y = −a′ t + c′ e dunque è una retta. D’altro canto se dalle equazioni parametriche ( x = x0 + αt y = y0 + βt. si elimina il parametro t (dato che (α, β) , (0, 0), questo è sempre possibile, anche se uno dei due coefficienti è zero), si ottiene l’equazione α(y − y0 ) = β(x − x0 )
⇐⇒
βx − αy = βx0 − αy0
che può essere riscritta come l’equazione (31) ponendo a = β, b = −α e c = βx0 − αy0 . L’equazione (31) è detta equazione cartesiana o equazione scalare della retta. Prendiamo ora un vettore n = (a, b) ortogonale alla retta l di equazione P = A + tv. L’insieme dei punti P = (x, y) tali che n · (P − A) = 0 è una retta: infatti se A = (xA , yA ), l’ultima equazione può essere scritta come " # " # a x − xA =0 · y − yA b a(x − xA ) + b(y − yA ) = 0 ax + by = axA + byA ,
che è la (31) con c = axA + byA . Possiamo concludere che i coefficienti (a, b) nell’equazione (31) sono i coefficienti di un vettore ortogonale alla retta. (III.43) Definizione. Se A è un punto di Rn e v, w sono due vettori linearmente indipendenti di dimensione n, allora l’insieme di punti p = {A + sv + tw : s, t ∈ R} è detto piano passante per il punto B e con vettori direzione v, w (o, equivalentemente, parallelo ai vettori v, w). L’equazione (vettoriale) (32) P = A + sv + tw è detta l’equazione parametrica del piano p.
132
Vettori e calcolo geometrico
#
A + tA
#
A AC
#
C
P
AB
A
+ # sA B F III.19: piano per tre punti.
Diciamo che tre punti sono allineati (o collineari) se stanno su una stessa retta. (III.44) Per tre punti A, B, C non allineati di Rn passa uno e un solo piano, di equazione #» #» (33) P = A + sAB + tAC. Dimostrazione. È ben chiaro che il luogo di punti di equazione (33) passa per A (quando (s, t) = (0, 0)), per B (quando (s, t) = (1, 0)) e per C (quando (s, t) = (0, 1)). Per mostrare che è un piano, che chiameremo p, secondo la definizione (III.43), #» #» non resta che mostrare che AB e AC sono linearmente indipendenti. Ma se non #» #» lo fossero, dovrebbe esistere c ∈ R tale che AC = cAB, e quindi #» #» C − A = cAB =⇒ C = A + cAB, #» cioè C è sulla retta per A e B. Per ipotesi questo non può accadere, e quindi AB e #» AC sono linearmente indipendenti. Ora, se p′ è un altro piano per A, B e C, di equazione P = Q + sv + tw, dovranno esistere opportuni valori di (s, t) per cui A = Q + sA v + tA w B = Q + sB v + tB w C = Q + sC v + tC w. #» #» Quindi i vettori AB e AC (che sappiamo essere indipendenti) si scriveranno come #» AB = B − A = Q + sB v + tB w − (Q + sA v + tA w) (34)
= (sB − sA )v + (tB − tA )w #» AC = C − A = Q + sC v + tC w − (Q + sA v + tA w) = (sC − sA )v + (tC − tA )w
Ne deduciamo immediatamente che p ⊂ p′ : infatti se P ∈ p #» #» P = A + sAB + tAC = Q + sA v + tA w + s [(sB − sA )v + (tB − tA )w] + t [(sC − sA )v + (tC − tA )w] = Q + (sA + s(sB − sA ) + t(sC − sA ))v + (tA + s(tB − tA ) + t(tC − tA ))w.
Come
per la retta per due punti, anche per il piano, benché unico, le equazioni possono essere diverse dalla (33): oltre alla (33), anche #» #» # » #» P = B+sBA+tBC o P = C+sCA+tCB.
§ 7. Rette e piani: sottospazi lineari
cioè P ∈ p′ . Prendiamo ora P ∈ p′ , cioè P = Q + s0 v + t0 w per certi valori s0 , t0 . Per le stesse equazioni appena scritte sopra, allora P ∈ p se esistono due valori s e t dei parametri tali che ( sA + s(sB − sA ) + t(sC − sA ) = s0
133
Ricordiamo
che v e w sono linearmente indipendenti!
tA + s(tB − tA ) + t(tC − tA ) = t0
Questo è un sistema di due equazioni nelle incognite s e t, che possiamo scrivere anche come " # s − sA sb + tc = 0 , t0 − tA con b=
" # sB − sA tB − tA
c=
" # sC − sA . tC − tA
Per il Teorema (III.23), il sistema ha certamente una soluzione (unica) quando b e c sono linearmente indipendenti. Supponiamo per assurdo che non siano indipendenti, cioè che esistano (x, y) , (0, 0) tali che " # " # " # sB − sA sC − sA 0 xb + yc = x . +y = tB − tA 0 tC − tA Ma allora per le equazioni (34) #» #» xAB + yAC = x [(sB − sA )v + (tB − tA )w] + y [(sC − sA )v + (tC − tA )w] = x(sB − sA ) + y(sC − sA ) v + x(tB − tA ) + y(tC − tA ) w = 0v + 0w = 0,
#» #» da cui seguirebbe che anche i due vettori AB e AC sono linearmente dipendenti, contraddicendo l’ipotesi. Quindi b e c sono indipendenti, la soluzione in (s, t) esiste, e P ∈ p. Possiamo concludere al di là di ogni dubbio che p = p′ .
(III.45) Definizione. Diciamo che due piani di equazioni P = A + sv + tw e P = A′ + s′ v′ + t′ w′ sono paralleli se i corrispondenti piani per l’origine di equazioni P = sv + tw e P = s′ v′ + t′ w′ coincidono. (III.46) Osservazione. L’insieme delle soluzioni in R3 della equazione lineare nelle tre variabili x, y, z (35) ax + by + cz = d (dove (a, b, c) , (0, 0, 0)) si può scrivere come {P = Q + sv + tw} , dove v e w sono linearmente indipendenti. Infatti, almeno uno di a, b e c è diverso da zero; senza perdere in generalità possiamo supporre sia c. Allora l’equazione si può scrivere equivalentemente come a′ x + b′ y + z = d′
⇐⇒
z = −a′ x − b′ y + d′
Si veda anche il Teorema (III.12) a pagina 105.
134
Vettori e calcolo geometrico
n
w P v
A F III.20: il piano normale al vettore n passante per A.
dove a′ = a/c, b′ = b/c e d′ = d′ /c. Quindi, se consideriamo i due parametri (non vincolati) s = x e t = y, l’insieme di tutte le soluzioni è parametrizzato da (s, t) nell’equazione x=s 0 1 x 0 y = 0 + s 0 + t 1 , y=t ⇐⇒ ′ ′ −b′ −a d z z = d′ − a′ s − b′ t che ha proprio la forma P = Q + sv + tw. In altre parole, le soluzioni di ax + by + cz = d, se (a, b, c) , 0, formano sempre un piano, secondo la definizione di piano (III.43) che abbiamo dato sopra. Nelle prossime proposizioni in un certo senso invertiamo il procedimento illustrato nella nota: cerchiamo di descrivere un piano come insieme di soluzioni di una singola equazione in R3 . (III.47) Sia p = {A + sv + tw} un piano di R3 . Se n , 0 è un vettore ortogonale sia a v che a w, allora p è uguale all’insieme dei punti P tali che (36) n · (P − A) = 0. In coordinate, se A = (x0 , y0 , z0 ), P = (x, y, z) e n = (a, b, c), allora l’equazione (36) si legge (37) a(x − x0 ) + b(y − y0 ) + c(z − z0 ) = 0. o anche ax + by + cz = d con d = ax0 + by0 + cz0 . Dimostrazione. Sia p′ l’insieme di tutti i punti di R3 tali che n · (P − A) = 0. Dato che p′ è anche l’insieme di punti le cui coordinate soddisfano l’equazione (37), per l’osservazione (III.46) si tratta di un piano di R3 . Consideriamo i tre punti A, B = A + v, C = A + w del piano p. Come abbiamo già visto sopra, dato che v e w sono linearmente indipendenti, i punti A, B e C non sono allineati. Per la Proposizione (III.44), esiste un solo piano che passa per A, B e C. Dunque è sufficiente dimostrare che A, B, e C sono punti anche di p′ . Ma (A − A) · n = 0, e dunque A, B, C ∈ p′ .
(B − A) · n
= v · n = 0,
(C − A) · n = w · n = 0,
Non è difficile mostrare che i due
vettori v = (1, 0, −a′ ) e w = (0, 1, −b′ ) sono linearmente indipendenti.
§ 7. Rette e piani: sottospazi lineari
135
(III.48) Osservazione. La Proposizione (III.47) ci consente di completare l’osservazione (III.46). Infatti, non solo per ogni n = (a, b, c) , 0 l’insieme di soluzioni di ax + by + cz = d è un piano di R3 , ma è vero anche il viceversa: ogni piano di R3 ha una equazione cartesiana, cioè è l’insieme di soluzioni dell’equazione ax + by + cz = d per certi valori di a, b, c, d. Infatti, se una equazione parametrica del piano p è P = A + sv + tw, basta definire n=v×w e osservare che è diverso da zero e ortogonale a v e w. Quindi è possibile scrivere l’equazione cartesiana (35) a partire dall’equazione (37). Le rette e i piani sono anche detti sottospazi affini o sottospazi lineari dello spazio Euclideo n-dimensionale Rn . Le rette hanno dimensione uno, i piani dimensione due. Ritorneremo a ragionare sulla dimensione nel Capitolo IV, per la Proposizione (IV.13) a pagina 168. In generale, per sottospazio lineare affine di Rn intendiamo un insieme di soluzioni di un sistema di equazioni lineari, che per il Teorema (III.12) può essere scritto come S = {A + t1 v1 + t2 v2 + . . . + td vd : t1 , t2 , . . . , td ∈ R}
per un punto A di Rn e d vettori linearmente indipendenti v1 , . . . , vd . I punti sono i sottospazi di dimensione zero. Possiamo così riprendere le definizioni con cui abbiamo iniziato questo paragrafo: un punto è un sottospazio (lineare affine) di dimensione zero, una linea retta è un sottospazio (lineare affine) di dimensione uno, un piano è un sottospazio (lineare affine) di dimensione due. Negli esercizi proveremo a calcolare distanze tra tali sottospazi, e per far questo ricordiamo che la distanza tra due insiemi di punti p e q (per esempio un punto e una retta) di Rn è il minimo delle lunghezze dei vettori #» PQ, dove P ∈ p e Q ∈ q, cioè distanza(p, q) = min |Q − P|. P∈p Q∈q
Forse
è il caso di ammettere che “lineare” crea un po’ di confusione con i sottospazi vettoriali di Rn . Dovrebbero essere chiamati sottospazi affini, ahimè, ed essere chiamati sottospazi lineari o sottospazi vettoriali solo quelli che passano per l’origine, come vedremo nel prossimo capitolo. A scanso di equivoci, cercheremo di usare il termine doppio “lineare affine”.
Più propriamente, a priori si trat-
ta dell’estremo inferiore di tutte le distanze. Va poi dimostrato che è un minimo.
Una proprietà importante della distanza è la seguente. (III.49) Il punto che realizza la distanza tra un punto Q < p e un sottospazio lineare affine p di Rn (cioè distanza(Q, p) = |Q′ − Q|) esiste sempre, ed # » è l’unico punto Q′ tale che il vettore QQ′ = Q′ − Q è ortogonale a p.
Dimostrazione. Per ogni P ∈ p si ha # » # » #» kQPk2 = kQQ′ + Q′ Pk2 # » # » # » # » = hQQ′ + Q′ P, QQ′ + Q′ Pi # » # » # » # » = kQQ′ k2 + kQ′ Pk2 + 2hQQ′ , Q′ Pi, come si vede nelle figure III.21 e III.22.
Q
Q′ P
F III.21: proiezione ortogonale e distanza minima.
136
Vettori e calcolo geometrico
Q
P
Q′
F III.22: proiezione ortogonale e distanza minima. # » # » # » Se QQ′ è ortogonale a p, allora per ogni P ∈ p il prodotto scalare hQQ′ , Q′ Pi = 0, e quindi # » # » # » #» kQPk2 = kQQ′ k2 + kQ′ Pk2 ≥ kQQ′ k2 , #» ed è chiaro che kQPk è minimo solo se P = Q′ . Quindi se esiste tale Q′ , esso è necessariamente il punto che realizza la distanza minima (e quindi è l’unico). Ora occorrerebbe dimostrare che tale Q′ esiste. Rimandiamo la dimostrazione alla fine del Capitolo IV, quando avremo alcuni strumenti in più. Per ora ci limiteremo a dimostrare alcuni casi particolari per rette e piani in R2 o R3 , nell’Esempio (III.51) e l’Esercizio (III.15) a pagina 152.
(III.50) Definizione. Il punto Q′ della Proposizione (III.49) è detto proiezione ortogonale di Q su p.
Negli esercizi a pagina 141 verran-
no svolti un certo numero di esercizi su questo argomento.
(III.51) Esempio. Calcoliamo la distanza tra un punto Q e un piano p di R3 . Sappiamo che i punti P di p sono quelli che soddisfano l’equazione n · (P − A) = 0, dove n è un vettore ortogonale al piano e A un punto di p. Sia l la retta per Q con vettore direzione n, cioè la retta l per Q ortogonale a p. Se Q′ è l’intersezione di l con p, allora per la Proposizione (III.49) la distanza di Q da p è uguale alla distanza di Q da Q′ . Ora, il punto Q′ ∈ l deve soddisfare, per qualche t, le due equazioni ( n · (Q′ − A) = 0 =⇒ n · (Q + tn − A) = 0, Q′ = Q + tn
Stiamo supponendo knk , 0.
da cui si deduce che n · (Q − A) + tknk2 = 0
=⇒
t=−
n · (Q − A) , knk2
e quindi kQQ′ k = kQ′ − Qk = ktnk =
|n · (Q − A)| . knk
§ 7. Rette e piani: sottospazi lineari
137
Il quinto postulato e le geometrie non euclidee I cinque celebri postulati degli Elementi di Euclide sono i seguenti: 1. Per ogni coppia di punti è possibile tracciare un segmento che ha i due punti per estremi. 2. Ogni segmento di retta si può prolungare dai due lati. 3. Dati un punto (centro) e un raggio arbitrari, è possibile tracciare la circonferenza con centro e raggio dati. 4. Tutti gli angoli retti sono uguali tra di loro. 5. Se una linea retta che incontra altre due linee rette ha angoli interni dallo stesso lato minori di due angoli retti, allora le due linee rette si incontreranno (prolungandole indefinitamente) dalla parte dei due angoli citati. Data l’importanza che queste cinque frasi hanno rivestito per il pensiero, nei secoli fino ad oggi, riportiamo gli assiomi nella loro lingua originale, il greco (per i pochi che possono permettersi di conoscerlo): AÊt mata
a'.
>Hit sjw
pä
pantä
shmeou
âpÈ
pn
Il quinto postulato (chiamato anche «postulato delle parallele», perché è necessario per dimostrare le proprietà delle rette tra loro parallele in un piano) chiaramente è di natura diversa dai precedenti, e per questo non fu mai accettato come evidente a priori. Per secoli si cercò senza successo di dedurlo dai primi quattro, cercando dimostrazioni per assurdo, fino a quando nel diciannovesimo secolo si riuscì a dimostrare che in effetti ne è indipendente, e che quindi esistono sistemi geometrici (le geometrie non euclidee) in cui l’assioma delle parallele non vale. Ai primi tentativi di matematici dilettanti, seguirono i lavori di Carl Friedrich Gauss (1777–1855), Nikolai Ivanovich Lobachevsky (1792–1856), János Bolyai (1802–1860), Georg Friedrich Bernhard Riemann (1826–1866), Eugenio Beltrami (1836–1900) e Henri Poincaré (1854–1912), che portarono alla creazione di modelli consistenti di geometrie non euclidee (il disco nella figura poco sotto è appunto uno di questi modelli). Questo fu la fine dei tentativi di far seguire il quinto postulato dai primi quattro, e l’inizio di un nuovo modo di percepire lo spazio in cui esistiamo, che portò, tra l’altro, alla celeberrima Teoria della relatività di Albert Einstein (1879–1955).
shmeØon
eÎjeØan grammn gageØn. b'.
KaÈ peperasmènhn eÎjeØan kat tä suneqà âp'
g'.
KaÈ
eÎjea âkbaleØn. pantÈ
kèntrú
kaÈ
diast mati
kÔklon
gr-
fesjai. d'.
KaÈ
psa
t
ærj
gwna
Òsa
ll lai eÚ-
nai. e'.
KaÈ ân eÊ ântä
kaÈ
dÔo eÎjea eÎjeØa
âpÈ
t
aÎt
mèrh
âmpptousa t
gwna
dÔo
ærjÀn
âlssona poi¬, âkballomèna t dÔo eÎjea âp^peiron
sumpptein,
dÔo ærjÀn âlssone .
âf'
mèrh
eÊsÈn
aÉ
tÀn
(4)
In coordinate cartesiane, se A = (x0 , y0 , y0 ), n = (a, b, c), Q = (xQ , yQ , zQ ), l’equazione del piano (37) è n · (P − A) = a(x − x0 ) + b(y − y0 ) + c(z − z0 ) = 0 e quindi la distanza è |(Q − A) · n| |a(xQ − x0 ) + b(yQ − y0 ) + c(zQ − z0 )| . = √ knk a2 + b2 + c2 Se scriviamo l’equazione del piano come ax + by + cz = d, dove d =
138
Vettori e calcolo geometrico
ax0 + by0 + cz0 , allora possiamo concludere che (38) distanza(Q, p) =
|axQ + byQ + czQ − d| . √ a2 + b2 + c2
§ 8. Coordinate non cartesiane Come abbiamo visto nel § 3, i punti del piano cartesiano sono parametrizzati dalle due coordinate cartesiane (x, y) e quelli dello spazio dalle tre coordinate (x, y, z). Non solo: rette e piani in generale possono essere descritti da uno o due parametri s, t, che hanno lo stesso ruolo delle coordinate. Gli insiemi di punti, ovviamente, non hanno necessariamente coordinate cartesiane. Per esempio, i punti della circonferenza unitaria di R2 con centro in (0, 0) (cioè le coppie (x, y) che soddisfano l’equazione x2 + y2 = 1) sono parametrizzati dall’angolo ϑ ponendo ( " # " # x = cos ϑ x cos ϑ ⇐⇒ = . y sin ϑ y = sin ϑ. I punti del piano cartesiano hanno coordinate polari (r, ϑ) (si veda la Figura III.23) definite da y arctan x se x > 0; π se x = 0, y > 0; 2 ( ϑ = y x = r cos ϑ arctan x + π se x < 0; (39) ⇐⇒ π y = r sin ϑ − se x = 0, y < 0. 2 q r = x2 + y2 . Possiamo facilmente definire nello spazio tridimensionale le coordinate cilindriche, come illustrato in Figura III.24: scriviamo le prime due coordinate (x, y) in coordinate polari e lasciamo la terza z invariata. Quindi i punti dello spazio potranno essere identificati dalla terna di coordinate (r, ϑ, z) tali che x = r cos ϑ y = r sin ϑ (40) z = z. Così come una parametrizzazione della circonferenza unitaria consente di scrivere coordinate polari e cilindriche, una parametrizzazione della sfera unitaria, cioè dell’insieme dei punti le cui coordinate (x, y, z) soddisfano l’equazione x2 + y2 + z2 = 1,
y
(x, y) r ϑ x
F III.23: coordinate polari.
La
corrispondenza tra le coppie (x, y) e (r, ϑ) non è biunivoca: ci sono infiniti punti con r = 0 e ϑ qualsiasi cui corrisponde un solo punto di R2 : l’origine. Quindi l’origine non è ben definita nelle coordinate polari. Gli angoli ϑ naturalmente vanno considerati a meno della somma con un angolo 2kπ, con k ∈ Z.
Come
per le coordinate polari, tutti i punti dell’asse z non hanno una unica terna (r, ϑ, z) ,dato che tutti i possibili valori di ϑ individuano un unico punto (0, ϑ, z).
La
sfera unitaria è l’insieme di tutti i punti dello spazio che distano 1 dall’origine. La distanza del punto di coordinate (x, y, z) dall’origine è uguale a p (x − 0)2 + (y − 0)2 + (z − 0)2 .
§ 8. Coordinate non cartesiane
139
F III.24: coordinate cilindriche dello spazio.
permette poi di descrivere coordinate “polari” per lo spazio, che vengono chiamate coordinate sferiche. Le coordinate sferiche più comuni sono quelle che vengono utilizzate per identificare le posizioni sulla superficie del nostro pianeta: latitudine e longitudine. Se si fissa un asse (l’asse delle z o l’asse di rotazione terrestre, o il Nord-Sud geografico), l’angolo tra #» # » il vettore OP e l’equatore (cioè il piano per O ortogonale al vettore ON, dove N è l’analogo del polo Nord, di coordinate (0, 0, 1)) è indicato con il simbolo ϕ. Esso sarà compreso tra −π/2 e π/2, ed è la latitudine. Il piano xz individua un meridiano sulla sfera, che passa per i due poli e il punto di coordinate (1, 0, 0). L’angolo ϑ tra i semipiani contenenti l’asse z e passanti per P o per (1, 0, 0) è la longitudine, che varia da 0 a 2π. Mostriamo ora che la relazione tra le coordinate cartesiane (x, y, z) di un punto sulla sfera unitaria e i due angoli (ϑ, ϕ) è x = cos ϕ cos ϑ y = cos ϕ sin ϑ (41) z = sin ϕ #» Se invece di considerare l’angolo ϕ tra il vettore OP e l’equatore pren#» diamo in considerazione invece l’angolo φ (compreso tra 0 e π) tra OP e # » l’asse del polo Nord ON, si ha φ + ϕ = π2 e quindi le coordinate sferiche si riscrivono come x = sin φ cos ϑ y = sin φ sin ϑ (42) z = cos φ
Nelle
coordinate geografiche, come forse tutti sanno, la latitudine varia tra 90◦ Sud e 90◦ Nord, mentre la longitudine (calcolata a partire dal meridiano convenzionale di Greenwich) varia da 180◦ Ovest a 180◦ Est. I meridiani sono le intersezioni con la sfera dei piani che contengono l’asse z; i paralleli sono le circonferenze determinate dalla condizione ϕ = costante.
Dato
che sin(π/2 − x) = cos x e cos(π/2 − x) = sin x per ogni x.
Questo,
con la variabile φ ugua#» # » le all’angolo tra OP e ON, è il modo più frequente in cui le coordinate sferiche compaiono nei testi di matematica e fisica.
140
Vettori e calcolo geometrico
F III.25: coordinate sferiche: latitudine ϕ e longitudine ϑ. Dimostrazione. Se P è un punto sulla sfera unitaria di coordinate (x, y, z), sia P′ # » la sua proiezione ortogonale sul piano xy, cioè P′ = (x, y, 0). Il vettore P′ P # » P′ P = P − P′ = (0, 0, z) # » è ortogonale al piano xy, quindi in particolare è ortogonale al vettore OP′ . Il ′ ′ triangolo OPP è perciò rettangolo in P : ne segue che z = sin ϕ. Il punto P′ , nel piano xy si scrive in coordinate polari, per un certo r′ > 0 come ( x = r′ cos ϑ y = r′ sin ϑ, dato che l’angolo tra OP′ e l’asse (orientato) x è proprio ϑ. Ma allora cos ϑ P′ = r′ sin ϑ , 0 da cui segue che P ha coordinate x = r′ cos ϑ y = r′ sin ϑ z = sin ϕ. #» Visto che kOPk2 = 1, deve essere
(r′ cos ϑ)2 + (r′ sin ϑ)2 + sin ϕ 2 = 1 (r′ )2 cos2 ϑ + sin2 ϑ + sin2 ϕ = 1 =⇒ r′ 2 = 1 − sin2 ϕ = cos2 ϕ,
e quindi r′ = cos ϕ (che è positivo quando −π/2 < ϕ < π/2). Sostituendo questo valore si ottengono le equazioni (41).
Esercizi
141
Osserviamo ora che per ogni punto P , O di R3 si ha #» # » OP = rOQ,
#» con r = kOPk,
per un certo punto (unico) Q della sfera unitaria con centro in O. Infatti, #» #» v se r = kOPk e v = OP, allora il vettore ha certamente norma uno, e kvk v il punto Q = O + dista dall’origine kvk
v
kQ − Ok = = 1. kvk Se ci fossero un altro scalare c positivo e un altro punto R sulla sfera tali #» # » #» # » #» che OP = cOR allora kOPk = ckORk = c, e quindi c = kOPk = r; inoltre # » # » # » # » OR = c−1 OP = r−1 OP = OQ. Ne segue che si può assegnare ad ogni punto P di coordinate cartesiane (x, y, z) la terna di coordinate sferiche (r, ϑ, ϕ), tali che x = r sin φ cos ϑ x sin φ cos ϑ y = r sin φ sin ϑ . y = r sin φ sin ϑ (43) ⇐⇒ z = r cos φ z cos φ
Si dovrebbe supporre sull’asse delle z. Perché?
P non
Esercizi (III.1) Risolvere il seguente sistema di equazioni: y + 3z = 1 3z + 4x = 2 y+x=3 Soluzione. Procediamo eliminando le variabili, come illustrato nel § 2 a pagina 99. Eliminiamo la variabile x ponendo (*)
x = 3 − y,
e sostituendo nel sistema ( y + 3z = 1 3z + 4(3 − y) = 2
( ⇐⇒
y + 3z = 1 3z − 4y = −10.
Procediamo nello stesso modo sul sistema di due equazioni nelle incognite y e z, eliminando y e sostituendo (**) y = 1 − 3z
F III.26: Nikolai Ivanovich Lobachevsky (Nikola Iva&noviq Lobaqe&vski(6) , 1792–1856) sviluppò la geometria non-euclidea.
142
Vettori e calcolo geometrico
nel sistema. Otteniamo una sola equazione 2 3z − 4(1 − 3z) = −10 ⇐⇒ 15z = −6 ⇐⇒ z = − . 5 Sappiamo quindi che il sistema dato ha una unica soluzione, che possiamo determinare sostituendo all’indietro i valori trovati: z = −2/5 =⇒ y = 1 − 3z = 11/5 Sostituiamo nella equazione (**). =⇒ x = 3 − y = 4/5 Sostitituiamo nella equazione (*).
E
L’unica soluzione è quindi (x, y, z) = (4/5, 11/5, −2/5) =
1 (4, 11, −2). 5
(III.2) Risolvere il seguente sistema di equazioni: y + 3z = 1 x − 3z = 2 y+x=3 Soluzione. Procediamo come nell’Esercizio (III.1), Eliminiamo la variabile x ponendo (*)
x = 3 − y,
e sostituendo nel sistema ( ( y + 3z = 1 y + 3z = 1 ⇐⇒ (3 − y) − 3z = 2 −y − 3z = −1. Nel sistema ottenuto le due equazioni sono equivalenti (una è multipla dell’altra), e quindi possiamo eliminarne una, e ottenere l’unica equazione y + 3z = 1. Possiamo poi eliminare la variabile y, come prima (**) y = 1 − 3z. Ora non abbiamo più equazioni, ma non abbiamo eliminato tutte le variabili: la variabile z rimane libera, cioè può assumere qualsiasi valore (deve soddisfare l’equazione 0z = 0). Poniamo quindi z = t (arbitrario) e sostituiamo all’indietro: z=t Sostituiamo nella equazione (**) =⇒ y = 1 − 3t =⇒ x = 3 − y = 3 − (1 − 3t) = 2 + 3t Sostitituiamo nella equazione (*).
il Lettore si premurerà di controllare che è in effetti una soluzione, sostituendo gli opportuni valori nel sistema originario.
Esercizi
143
Le soluzioni sono quindi tutte le 3-uple (terne) di numeri reali che si scrivono come x 2 + 3t 2 3 y 1 − 3t 1 −3 = = + t . z t 0 1
Riconosciamo
che la soluzione è una retta di R3 passante per (2, 1, 0) con direzione (3, −3, 1).
(III.3) Risolvere il seguente sistema di equazioni: x1 + x2 x 2 + x3 x3 + x4 x +x 4 1
=1 =2 =3 = 4.
Soluzione. Risolviamo in x4 con l’ultima equazione x4 = 4 − x1 ,
(*)
ed eliminiamo la variabile x4 dal sistema 4 × 4 x1 + x2 = 1 x2 + x3 = 2 x3 + (4 − x1 ) = 3 ⇐⇒ x3 − x1 = −1.
Per sistema n × m intendiamo
un sistema in n equazioni e m incognite.
Risolviamo in x3 nell’ultima (**) x3 = x1 − 1 ed eliminiamo la variabile x3 dal sistema 3 × 3, ottenendo il sistema 2 × 2 ( x1 + x2 = 1 x2 + (x1 − 1) = 2 ⇐⇒ x2 + x1 = 3. Ma questo sistema non può avere soluzioni: x1 + x2 non può essere allo stesso tempo uguale a 1 e 3. Quindi anche il sistema 4×4 non ha soluzioni. ✩ (III.4) Siano a, b e c tre vettori fissati. Supponiamo che l’equazione (*)
ax1 + bx2 = c
abbia soluzioni. Mostrare che allora le seguenti affermazioni sono equivalenti. ① L’equazione (*) ha più di una soluzione. ② L’equazione omogenea ax1 + bx2 = 0 associata a (*) ha almeno una soluzione (x1 , x2 ) , (0, 0).
Si
osservi che non stiamo specificando la dimensione dei vettori a, b e c. Come si vedrà nella soluzione, è del tutto irrilevante. Del tutto non irrilevante invece è il fatto che stiamo assumendo l’ipotesi che (*) abbia almeno una soluzione. Se questa ipotesi non è vera allora non è più vero che le due affermazioni sono equivalenti: potrebbe essere che l’equazione ax1 + bx2 = 0 ha soluzioni non nulle ma ax1 + bx2 = c non ha soluzioni. Basta considerare il caso a = b = 0 e c , 0: chiaramente 0x1 +0x2 = c non ha soluzioni mentre 0x1 + 0x2 = 0 ne ha infinite.
144
Vettori e calcolo geometrico
Soluzione. Per ipotesi sappiamo che c’è almeno una soluzione y = (y1 , y2 ) dell’equazione (*). Allora se esiste un’altra soluzione y′ = (y′1 , y′2 ) diversa da y, si può scrivere ay1 + by2 = c ay′1 + by′2 = c. Sottraendo la prima alla seconda si ha ay′1 + by′2 − ay1 − by2 = c − c
⇐⇒
a(y′1 − y1 ) + b(y′2 − y2 ) = 0,
e quindi la coppia y′ − y = (y′1 − y1 , y′2 − y2 ) soddisfa l’equazione ax1 + bx2 = 0. Dato che y , y′ , y′ − y , 0, esiste quindi una soluzione (x1 , x2 ) = y′ − y diversa da (0, 0). Viceversa, se esiste una soluzione z = (z1 , z2 ) , 0 dell’equazione ax1 + bx2 = 0 e una soluzione y dell’equazione (*), allora la coppia y′ = y + z è una seconda soluzione di (*): ay′1 + by′2 = a(y1 + z1 ) + b(y2 + z2 ) = ay1 + by2 + (az1 + bz2 ) = c + 0 = c. ✩ (III.5) Due rette distinte e contenute nello stesso piano sono parallele se e solo se non si incontrano (da cui segue che se l è una retta di un piano e P un punto non su di essa, esiste una unica retta l′ per P che non è incidente a l). Soluzione. Siano l e l′ due rette contenute nello stesso piano p, con l , l′ . Se l e l′ sono parallele, allora per definizione esse hanno equazioni P = A + tv e P = B + sw, dove v e w sono paralleli (cioè esiste c ∈ R tale che w = cv). Se per assurdo si incontrassero in un punto P0 , allora dovrebbero esistere due valori t0 e s0 tali che P0 = A + t0 v = B + s0 w, e quindi B − A = t0 v − s0 cv = (t0 − s0 c)v. Ma allora A + tv = B + A − B + tv = B + (s0 c − t0 + t)v, e quindi ogni punto di l è anche un punto di l′ : l ⊂ l′ . In modo analogo (ripetendo il ragionamento scambiando l con l′ ) possiamo mostrare che l′ ⊂ l, e quindi in conclusione l = l′ . Ma per ipotesi l , l′ , e quindi è
F III.27: William Rowan Hamilton (1805-1865) estese le operazioni algebriche ad un analogo dei numeri complessi in dimensione 4: i quaternioni.
È
la Definizione (III.40) a pagina 130.
Esercizi
145
assurda l’ipotesi che l e l′ si incontrino nel punto P0 . Abbiamo dimostrato che se sono parallele, allora non si incontrano. Viceversa, supponiamo che due rette distinte l e l′ , contenute in un piano p, non siano parallele, cioè nelle equazioni P = A + tv e P = B + sw i vettori direzione v e w siano linearmente indipendenti. Vogliamo dimostrare che si incontrano. Se l’equazione del piano è P = C + xe1 + ye2 , allora esisteranno certamente (xA , yA ) e (xv , yv ) per cui A = C+xA e1 +yA e2 e v = xv e1 + yv e2 . Analogamente per l′ esisteranno (xB , yB ) e (xw , yw ) tali che B = C + xB e1 + yB e2 e w = xw e1 + yw e2 . Dato che v e w sono linearmente indipendenti, anche i vettori (xv , yv ) e (xw , yw ) sono linearmente indipendenti. Si veda la dimostrazione del Teorema (III.23) e l’Esercizio 55 a pagina 162. Quindi la retta l può anche essere parametrizzata come P = (C + xA e1 + yA e2 ) + t(xv e1 + yv e2 ),
t∈R
e la retta l′ come P = (C + xB e1 + yB e2 ) + s(xw e1 + yw e2 ),
s ∈ R.
I punti di intersezione di l e l′ corrisponderanno quindi alle soluzioni dell’equazione (xA + txv )e1 + (yA + tyv )e2 = (xB + sxw )e1 + (yB + syw )e2 nei parametri t e s. I vettori e1 e e2 sono linearmente indipendenti, e quindi l’equazione è equivalente al sistema di due equazioni nelle due incognite t e s ( " # " # " # " # xA + txv = xB + sxw xv x x x ⇐⇒ t −s w = B − A . yv yw yB yA yA + tyv = yB + syw , Per il Teorema (III.23), questo sistema ha certamente una soluzione in t,s dato che i due vettori " # " # xv xw yv yw sono linearmente indipendenti. Quindi due rette non parallele contenute in un piano si incontrano sempre. (III.6) Mostrare che una traslazione (di Rn ) di vettore v manda ogni retta r in una retta r′ parallela a r, e coppie di rette tra loro parallele in coppie di rette tra loro parallele. Soluzione. Consideriamo la traslazione P 7→ P+v. La retta r di equazione P = A + tr viene mandata nella retta r′ di equazione P = A + tr + v = (A + v) + tr,
Infatti, se A′ = A+v, dovrà essere A′ ∈ p, e dunque
A′ = C + x′A e1 + y′A e2
per certi x′A , y′A . Ma allora v = A′ − A = (x′A −xA )e1 +(y′A − yA )e2 , e quindi xv = x′A − xA e yv = y′A − yA .
146
Vettori e calcolo geometrico
che per la definizione (III.40) è parallela alla precedente. Analogamente, se P = A + tr e P = B + tr′ sono le equazioni di due rette parallele, allora le rette traslate hanno equazioni parametriche P = (A + v) + tr,
P = (Q + v) + tr′ ,
che sono tra loro parallele se e solo se lo erano le prime. (III.7) Mostrare che se un piano di Rn contiene due punti distinti A e B, allora contiene tutti i punti della retta per A e B. Soluzione. Sia p il piano di equazione P = Q + sv + tw. Siccome A ∈ p, esistono (sA , tA ) tali che A = Q + sA v + tA w, e analogamente esistono (sB , tB) tali che B = Q + sB v + tB w. Un punto P è sulla retta l per A e B se e solo se esiste x ∈ R tale che #» P = A + xAB. Ma allora P = (Q + sA v + tA w) + x [(Q + sB v + tB w) − (Q + sA v + tA w)] = Q + [sA + x(sB − sA )]v + [tA + s(tB − tA )w], e quindi P ∈ p. (III.8) Nello spazio R3 sono dati i tre punti A = (1, −1, 0), B = (2, 2, 1) e C = (3, 1, −2). Trovare, se esistono: ① il piano passante per A, B, C; ② il piano che passa per A e è parallelo al piano x − y + 2z = 0; ③ il piano perpendicolare al piano x + y − z = 1 che contiene i punti B e C. Soluzione. Per determinare il piano passante per i tre punti possiamo ricorrere all’equazione (37) (a pagina 134) del generico piano passante (ad esempio) per A a(x − 1) + b(y + 1) + cz = 0 imporre il passaggio per B e C. Si perviene al sistema ( ( a + 3b + c = 0, a(2 − 1) + b(2 + 1) + c = 0, ⇐⇒ a + b − c = 0. a(3 − 1) + b(1 + 1) − 2c = 0,
Esercizi
147
Dalla seconda si ottiene c = a + b che sostituito nella prima porta a soluzioni a = −2b e dunque c = −b. Si trova in corrispondenza a questi valori (ad esempio ponendo b = 1) il piano di equazione −2x + y − z = −3. Un secondo modo consiste nel considerare l’equazione vettoriale (33) #» #» P = A + sAB + tAC. #» #» Nel nostro caso si ha AB = (1, 3, 1) e AC = (2, 2, −2), e dunque l’equazione vettoriale 2 1 x 1 3 y −1 = + s + t 2 . −2 1 0 z Secondo punto: il piano p assegnato, di equazione x−y+2z = 0 ha vettore normale n = (1, −1, 2). Secondo la formula (36), il piano parallelo a p passante per A avrà equazione
Per verificare che l’equazione vet-
toriale e quella cartesiana descrivono lo stesso piano basta sostituire x = 1+s+2t, y = −1+3s+2t, z = s−2t nella 2x − y + z − 3 = 0: si trova che l’uguaglianza è vera per ogni scelta di s e t.
n · (P − A) = 0. Il piano cercato è quindi 1 · (x − 1) − 1 · (y + 1) + 2 · (z − 0) = 0, ovvero x − y + 2z = 2. Terzo punto: il generico piano ortogonale al piano p assegnato, avrà vettore normale n = (a, b, c) ortogonale al vettore normale di p, che è n′ = (1, 1, −1). Questo significa n · n′ = 0 e dunque a + b − c = 0. n sarà di tipo (a, b, a + b) e il piano passante per B che ha n come vettore normale avrà equazione a(x − 2) + b(y − 2) + (a + b)(z − 1) = 0.
Grazie
all’Esercizio (III.7), se il piano contiene B e C allora contiene tutta la retta per B e C.
Resta da imporre il passaggio per C: a(3 − 2) + b(1 − 2) + (a + b)(−2 − 1) = 0. Si ha −2a − 4b = 0 da cui a = −2b e il piano cercato è −2(x − 2) + y − 2 − z + 1 = 0
⇐⇒
2x − y + z = 3.
(III.9) Dati i punti A = (1, −1, 0) e B = (2, 2, 1), trovare il piano che passa per A e è perpendicolare alla retta passante per l’origine e per B. Soluzione. La retta che contiene OB ha equazione x 2 y 2 = t . z 1
148
Vettori e calcolo geometrico
Per scrivere l’equazione del piano passante per A e ortogonale alla retta data, conviene sfruttare la formula (36). Il piano normale al vettore n = (2, 2, 1) passante per A = (1, −1, 0) è 2(x − 1) + 2(x + 1) + 1(z − 0) = 0. (III.10) Trovare l’equazione del piano parallelo alla retta 2x − 4y + z = 0 x + 2y = 1
Una
retta si dice parallela a un piano se il suo vettore direzione è parallelo ad una combinazione lineare dei vettori direzione del piano.
che passa per i punti A = (0, 1, 1) e B = (2, 0, 1). Soluzione. Troviamo innanzitutto l’equazione parametrica della retta: chiamando x = t dalla seconda equazione ricaviamo y = 21 − 2t . Sostituendo questi valori nella prima si ha z = 4y − 2x = 42 − 4t2 − 2t = 2 − 4t. In totale x 0 1 y = 1/2 + t −1/2 . z 2 −4 Per essere parallelo alla retta, il piano dovrà avere come normale una retta ortogonale alla retta data. Poiché il vettore direttore della retta è v = (1, −1/2, −4), il vettore n = (a, b, c) normale al piano sarà tale che v · n = 0, cioè a − b/2 − 4c = 0. Dunque n = (b/2 − 4c, b, c) e grazie a (36) il piano cercato, imponendo il passaggio per B, sarà di tipo (b/2 + 4c)(x − 2) + b(y − 0) + c(z − 1) = 0. Imponiamo ora il passaggio per il punto A: deve valere (b/2 + 4c)(0 − 2) + b(1 − 0) + c(1 − 1) = 0, da cui −b − 8c + b = 0, ovvero c = 0. Il piano cercato ha dunque equazione x + 2y = 2. (III.11) Data la retta dell’esercizio precedente, scrivere l’equazione del generico piano passante per r. Determinare poi il piano per r perpendicolare al piano xz. Soluzione. L’equazione 2x − 4y + z + k(x + 2y − 1) = 0 descrive, al variare di k ∈ R, tutti i piani passanti per r, con l’eccezione del piano x + 2y − 1 = 0. Per trovare tra questi il piano perpendicolare al piano xz, bisogna imporre che il suo vettore normale nk sia parallelo a xz, cioè di tipo (a, 0, b). I piani del fascio passano in particolare per il punto A = (1, 0, −2) della retta r: riscrivendo l’equazione del piano nella forma nk · (P − A)
⇔
(2 + k)(x − 1) + (2k − 4)y + z + 2 = 0
grazie a (36) sappiamo che nk = (2 + k, 2k − 4, 1): dunque con la scelta k = 2 abbiamo il piano 4(x − 1) + z + 2 = 0, ortogonale a xz.
L’insieme
dei piani passanti per una retta data r si chiama fascio di piani che ha per sostegno r.
Esercizi
149
(III.12) Si consideri il punto A = (1, 2, −1) e le rette r e s di equazioni x=2+t x − 2y = 1 r: s: y=2+t x + z = 1 z = −t ① calcolare la distanza di A da r; ② stabilire se r e s sono sghembe e determinarne la distanza; ③ scrivere l’equazione della proiezione ortogonale di r sul piano p dato da x + y + z = 0. Soluzione. Per calcolare la distanza di A da r basta trovare il piano p passante per A e ortogonale a r: detto Q il punto di intersezione tra r e p, la distanza cercata è kQ − Ak. Il modo più rapido per scrivere l’equazione del piano p è ricorrere alla (36) n · (P − A) = 0, dove n è un vettore direttore di r. Questo si trova facilmente ponendo x = t e ricavando l’equazione vettoriale di r nella forma x=t y = −1/2 + t/2 z = 1 − t. Si ha n = [1, 1/2, −1] e quindi l’equazione di p è 1 1 · (x − 1) + (y − 2) − 1 · (z + 1) = 0 2
⇔
2x + y − 2z = 6.
Intersechiamo ora p con r: sostituendo le equazioni parametriche della retta nel piano si trova 1 t 17 2t + (− + ) − 2(1 − t) = 6 ⇔ t= , 2 2 9 4 8 corrispondente al punto Q = 17 9 , 9 , − 9 . La distanza tra il punto e la retta è quindi p √ kQ − Ak = (1 − 17/9)2 + (2 − 4/9)2 + (−1 + 8/9)2 = 29/3. Secondo punto: le due rette r e s non si intersecano perché il sistema (2 + t) − 2(2 + t) = 1 (2 + t) + (−t) = 1
Verificare
usando la formula nell’Esercizio (III.15). Si veda a proposito anche l’Esercizio 32 .
150
Vettori e calcolo geometrico
non ha soluzione (la seconda equazione è impossibile). Non sono nemmeno parallele perché i rispettivi vettori direttori sono vr = (1, 1/2, −1) e vs = (1, 1, −1), che non sono proporzionali tra loro. Dunque le rette sono sghembe. La distanza tra r e s è realizzata per quei due punti P ∈ r e Q ∈ s tali che P − Q è ortogonale ai due vettori direzione vr e vs . Essendo 0 1 2 1 P − Q = −1/2 + s 1/2 − 2 − t 1 , 1 −1 0 −1 dobbiamo trovare due valori s e t tali che −2 + s − t 1 −2 + s − t 1 −5/2 + s/2 − t 1/2 −5/2 + s/2 − t 1 · = 0 = · . 1−s+t −1 1−s+t −1 Si tratta di risolvere il sistema 1 (−2 + s − t) + 2 (−5/2 + s/2 − t) − (1 − s + t) = 0, (−2 + s − t) + (−5/2 + s/2 − t) − (1 − s + t) = 0. Sottraendo la seconda equazione dalla prima si trova il sistema equivalente −5/2 + s/2 − t = 0 (−2 + s − t) − (1 − s + t) = 0. Otteniamo s = −2 e t = −7/2. Si trovano così i punti P = (−2, −3/2, 3) e Q = (3/2, 3/2, 7/2). La distanza cercata è p √ kP − Qk = (7/2)2 + 32 + (1/2)2 = 86/2. Ultimo punto: per trovare la proiezione della retta su p di equazione x + y + z = 0 basta intersecare p con il piano p′ passante per r e ortogonale a p. Per scrivere l’equazione di p′ osserviamo che il suo vettore normale n′ deve essere ortogonale a n = (1, 1, 1), dunque ha la forma n′ = (a, b, −a − b). Osserviamo poi che i punti B = (0, −1/2, 1) e C = (1, 0, 0) appartengono a r: rappresentiamo ora p′ con l’equazione n′ · (P − C) = 0
⇔
a(x − 1) + by − (a + b)z = 0,
e imponiamo il passaggio per B. Troviamo −a − b/2 − (a + b) = 0 da cui a = −3b/4, che corrisponde al piano −3(x − 1) + 4y − z = 0. Poiché il piano passa per B e C contiene tutta la retta passante per i due punti, cioè la retta r, grazie all’Esercizio (III.7).
si trova ad esempio scegliendo t = 1 nell’equazione vettoriale di r.
C
Esercizi
(III.13) Dimostrare che una retta e un piano di R3 non si intersecano se e solo se la retta è parallela al piano, e che una retta non parallela ad un piano di R3 lo interseca sempre in un unico punto. Soluzione. Se la retta è contenuta nel piano, allora è parallela al piano. Possiamo quindi sempre supporre che ci sia un punto Q della retta che non sta sul piano. L’equazione parametrica del piano è P = A + sv + tw, per due vettori v e w linearmente indipendenti e un punto A ∈ R3 . Se r è un vettore parallelo alla retta, l’equazione parametrica della retta sarà P = Q + ur. La retta e il piano si intersecano in un punto P se e soltanto se esistono (s, t, r) tali che P = A + sv + tw = Q + ur, cioè se e soltanto se sv + tw − ur = Q − A. Se il vettore r fosse una combinazione lineare di v e w, allora anche Q − A sarebbe una combinazione lineare di v e w, cioè Q starebbe sul piano. Ma dato che Q non è nel piano, allora il vettore r non è parallelo al piano: abbiamo mostrato che se si intersecano, non sono paralleli. Se invece il piano e la retta non sono paralleli, cioè r non è combinazione lineare di v e w, allora i tre vettori v, w, r sono linearmente indipendenti. Infatti, se esistessero x, y e z non tutti nulli tali che xv + yw + zr = 0, dovrebbe essere z , 0 (perché altrimenti risulterebbero v e w linearmente dipendenti). Ma allora, dividendo per z, otterremmo che r è una combinazione lineare di v e w, contro l’ipotesi. Dato che v, w, e r sono linearmente indipendenti, siamo nelle condizioni di usare il Teorema (III.29), che ci assicura che esiste una unica soluzione (s, t, u) del sistema sv + tw − ur = Q − A, cioè che se la retta non è parallela al piano esiste una unica intersezione della retta con il piano. ✩ (III.14) Mostriamo che la proiezione di un punto P su una retta per #» #» due punti A, B (cioè l’unico punto Q tale che PQ è ortogonale a AB) è anche l’unico punto Q che realizza la distanza minima tra P e la retta. #» #» Mostrare anche che se si pone v = AP e b = AB, allora # » v·b b. AQ = projb v = kbk2
151
152
Vettori e calcolo geometrico
Soluzione. Osserviamo la figura III.28. Un punto Q sulla retta corrisponde ad un valore del parametro t #» Q = A + tAB = A + tb. #» #» Il vettore PQ è ortogonale a b = AB se e soltanto se
⇐⇒ ⇐⇒
⇐⇒
P
#
v = AP
tkbk2 = hv, bi = v · b,
B
v·b b kbk2
(Q − P) · b = 0
(A + tb − P) · b = 0 (−v + tb) · b = 0
Q
A
b
F III.28: proiezione di un punto su una retta e prodotto scalare.
v·b v·b , da cui Q = A + b. Al variare di t, il quadrato della kbk2 kbk2 distanza tra A + tb e il punto P è uguale a
e quindi t =
kA + tb − Pk2 = ktb − vk2 = t2 kbk2 + kvk2 − 2tv · b. Questa funzione ha (unico) minimo per t=
2v · b , 2kbk2
funzione f (t) = at2 + bt + c, con a > 0, ha minimo dove si annulla la derivata, cioè f ′ (t) = 0 ⇐⇒ 2at + b = 0. Si tratta di t = −b 2a .
Una
che è il valore da noi trovato. (III.15) Determinare la distanza tra un punto P e una retta l di Rn , di equazione P = A + tb. Soluzione. Per l’esercizio precedente (III.14), si tratta di calcolare la distanza tra il punto P e il punto Q=A+
v·b b, kbk2
#» dove v = AP. Il valore della distanza al quadrato è, come abbiamo visto, kQ − Pk2 = t2 kbk2 + kvk2 − 2tv · b, e la distanza si realizza semplicemente sostituendo a t il valore t=
v·b , kbk2
Considerando
cioè (44) kQ − Pk2 = (
(v · b)2 v·b v·b 2 2 ) kbk + kvk2 − 2( )v · b = kvk2 − 2 2 kbk kbk kbk2
(III.16) Dimostrare che in R2 , per ogni punto P e retta r esiste una unica retta r′ ortogonale a r passante per P.
gli elementi nell’Esercizio (III.12), la formula si applica con b = (1, 1/2, −1), v = (1, 5/2, −2). Si ha quindi kbk2 = 9/4, kvk2 = 45/4 e v·b = 17/4 e la distanza al quadrato data dalla (44) è 29/9.
Esercizi
153
Soluzione. Se P non sta in r, allora sia Q la proiezione di P su r: la retta per P e Q è ortogonale a r e passa per P. Non ce ne possono essere altre, perché l’intersezione con r di una retta ortogonale a r e passante per P necessariamente deve passare per Q, e di rette per P e Q ce n’è una sola. Questo ragionamento non vale se P è in r, dato che se P = Q non vale più l’unicità. Procediamo in un altro modo. Sia A+tr l’equazione parametrica della retta r, con r , 0 vettore direzione. Tutte le rette per P si scrivono come P + sv per un certo v , 0, e due rette di questa famiglia sono uguali se e solo se i vettori direzione sono proporzionali (paralleli). Si deve quindi mostrare che esiste un vettore v , 0 ortogonale a r, e che se v e v′ sono due vettori ortogonali a r, allora v′ = cv per un certo scalare c ∈ R. Sia r = (a, b), con (a, b) , (0, 0). I vettori v = (α, β) ortogonali a r e non nulli sono le soluzioni dell’equazione (*)
Per
risolvere questo esercizio occorre ricordare i numeri complessi. Il numero complesso a+bi indica il vettore (a, b). Qual è un vettore ortogonale a (a, b)? Lo stesso vettore a + bi ruotato di π/2. La rotazione di angolo ϑ non è altro che la moltiplicazione per eiϑ , e quindi il nostro vettore va moltiplicato per i = eπ/2i . Allora il vettore ruotato è i(a + bi) = ia + i2 b = −b + ia, cioè (−b, a).
v · r = aα + bβ = 0,
che ha coefficienti a, b e incognite α, β. Esiste sempre una soluzione (α, β) = (−b, a) che è diversa da (0, 0) se e solo se (a, b) , (0, 0). Sia ora (α′ , β′ ) un’altra soluzione dell’equazione (*). b α α′ =− = . ′ β a β Se a , 0, b , 0, si ha − Allora
α′ = −cb,
β′ α′ = = c per una certa ultima quantità c ∈ R. b a
β′ = ca
=⇒ (α′ , β′ ) = c(−b, a),
cioè (α′ , β′ ) è un multiplo di (−b, a). Se invece a = 0, necessariamente β′ = 0 e chiaramente (α′ , 0) è un multiplo di (−b, 0). Lo stesso succede se b = 0: (0, β′ ) è un multiplo di (0, a). (III.17) Dimostrare che in R3 , per ogni punto A e retta r esiste un unico piano p ortogonale a r passante per A; e che per ogni punto A e piano p esiste una unica retta ortogonale a p passante per A.
Basta
osservare annulla αa, si deve b , 0 (altrimenti sarebbero nulli), e
che in (*) se si annullare βb, ma entrambi a e b quindi β è zero.
Soluzione. Sia P = B + tn l’equazione parametrica della retta r. Sia n = (a, b, c). L’insieme p di tutti i punti P che soddisfano l’equazione (P − A) · n = 0, come abbiamo visto, è un piano di R3 , che ha equazione ax + by + cz = d
Si
vedano la nota (III.46) a pagina 133 e la proposizione (III.47) a pagina 134.
154
Vettori e calcolo geometrico
per un certo coefficiente d, passa per A ed è ortogonale (per definizione) a r. Dobbiamo mostrare che è l’unico. Supponiamo che A + tv + sw sia l’equazione parametrica di un altro piano p′ per A ortogonale a r, cioè con v · n = w · n = 0. Il punto B di p′ definito da B = A + v appartiene anche a p, dato che B − A · n = v · n = 0.
Il punto C di p′ definito da C = A + w appartiene anche a p, dato che C − A · n = w · n = 0. I tre punti A, B e C non sono allineati , e per la Proposizione (III.44) per tre punti non allineati passa un unico piano. Dato che sia p che p′ passano per A, B e C, essi devono coincidere. Ora mostriamo la seconda parte. Sia p un piano e A un punto di R3 . Sia P = B + s1 v + s2 w una equazione (parametrica) del piano p. I due vettori v e w sono linearmente indipendenti, e quindi il prodotto vettoriale n = v × w è diverso da 0 = (0, 0, 0). Il vettore n è ortogonale a v e w, e quindi la retta
Altrimenti
v e w risulterebbero linearmente dipendenti
P = A + tn è ortogonale a p e passa per A. L’intersezione di questa retta con p è un punto Q, che è la proiezione ortogonale di A sul piano p. Per la Proposizione (III.49), se A < p, Q è l’unico punto di p tale che Q − A è ortogonale a v e w, quindi ogni altra retta ortogonale a p e passante per A deve passare per Q. Dato che di rette per due punti ce n’è una sola, abbiamo mostrato l’unicità. E se A = Q ∈ p? Supponiamo che la retta abbia equazione P = A + tn′ . Dato che v, w e n sono linearmente indipendenti, per il Teorema (III.29) esistono (unici) tre scalari x, y, z tali che n′ = xv + yw + zn. Ma se n′ è ortogonale a v e w, deve essere 0 = n′ · v = (xv + yw + zn) · v = xkvk2 + yw · v
0 = n′ · w = (xv + yw + zn) · w = xv · w + ykwk2 . Ma se osserviamo che " # " #! kvk2 v·w det , = kvk2 kwk2 − (v · w)2 > 0, v · w kwk2 e applichiamo la disuguaglianza di Cauchy–Schwarz, possiamo concludere che il sistema 2 xkvk + yw · v = 0 xv · w + ykwk2 = 0
Proposizione
(III.19) a pagina 111. Risulta che il determinante è sempre maggiore o uguale a zero, ed è zero solo se v e w sono paralleli.
Esercizi
155
ha solo la soluzione (x, y) = (0, 0). Ma allora deve essere n′ = 0v + 0w + zn, cioè n e n′ sono paralleli, e le due rette coincidono. (III.18) (Procedimento di ortogonalizzazione) Se p è un piano di equazione A + sv + tw, determinare due vettori e1 e e2 ortogonali e unitari, tali che il piano p abbia anche equazione A + t1 e1 + t2 e2 . v v Soluzione. Definiamo il primo vettore e1 = . Allora ke1 k = k k = kvk kvk kvk = 1. Ora, per procedere osserviamo la Figura III.29. Dato che v e kvk w sono linearmente indipendenti, anche e1 e w lo sono, cioè w non è multiplo di e1 . Se proje1 w è il vettore proiezione di w su e1 , si ha proje1 w =
w · e1 e1 = (w · e1 )e1 . ke1 k2
Cioè, di norma uno: ke1 k = ke2 k = 1.
u
w
u
A (w · e1 )e1 e1
F III.29: procedimento di ortogonalizzazione e proiezione.
Ma allora il vettore differenza u = w − (w · e1 )e1 risulta ortogonale a e1 . Se lo dividiamo per la sua norma, come abbiamo fatto sopra per v, otteniamo un vettore unitario e2 =
u kuk
ortogonale a e1 . Ora, e1 è un multiplo di v, mentre e2 è un multiplo di u, che è combinazione lineare di v e w. Quindi anche e2 è combinazione lineare di v e w: ma allora il piano p′ con equazione parametrica P = A + t 1 e1 + t 2 e2 coincide con p. Infatti, i tre punti A, B = A + e1 , C = A + e2 non sono allineati, e il piano p′ li contiene. Ma dato che e1 e e2 sono combinazioni lineari di v e w, i punti B e C appartengono a p, e quindi p passa per A, B e C. Dato che il piano per A, B e C è unico, deve essere p = p′ , e quindi A + t 1 e1 + t 2 e2 è una parametrizzazione del piano p. (III.19) Dedurre dall’Esercizio (III.18) che per ogni piano p per l’origine O di R3 esistono tre vettori ortogonali unitari e1 , e2 e e3 tali che O + e1 e O + e2 sono in p e e3 è ortogonale a p.
Se lo fossero, allora e1 e e2 risulterebbero paralleli, il che è assurdo perché sono ortogonali e quindi linearmente indipendenti.
156
Vettori e calcolo geometrico
Soluzione. Se O + sv + tw è una parametrizzazione del piano p, dall’Esercizio (III.18) segue che esistono due vettori e1 e e2 ortogonali unitari tali che e1 e e2 sono in p. Se poi poniamo e3 = e1 × e2 , otteniamo un terzo vettore non nullo ortogonale a e1 e e2 , e quindi ortogonale a p. La norma di e3 è uguale al prodotto delle norme di e1 e e2 (cioè 1) per il seno dell’angolo compreso (cioè sin π/2 = 1), e quindi e3 è unitario. (III.20) Dimostrare che tre vettori e1 , e2 , e3 ortogonali in R3 sono sempre linearmente indipendenti, e quindi che per ogni v ∈ R3 esistono unici tre scalari c1 , c2 , c3 tali che v = c 1 e1 + c 2 e2 + c 3 e3 . Mostrare poi che se gli ei hanno norma uno, allora gli scalari ci sono le componenti di v nel sistema di riferimento e1 , e2 , e3 . Soluzione. Supponiamo che c1 e1 + c2 e2 + c3 e3 = 0. Se moltiplichiamo scalarmente per e1 , otteniamo
Dato che ke1 k2 > 0.
c1 e1 · e1 + c2 e2 · e1 + c3 e3 · e1 = 0 =⇒ c1 ke1 k2 = 0 =⇒ c1 = 0 Analogamente, c2 = c3 = 0, e quindi i tre vettori sono linearmente indipendenti. Applichiamo il Teorema (III.29): per ogni v ∈ R3 il sistema di (tre) equazioni e1 x + e2 y + e3 z = v a una e una sola soluzione in (x, y, z), cioè esistono unici tre scalari c1 , c2 , c3 tali che v = c 1 e1 + c 2 e2 + c 3 e3 . Ora, ricordiamo che le componenti di v sui tre assi e1 , e2 e e3 sono i coefficienti delle proiezioni proje1 v = (v · e1 )e1 = c1 e1
proje2 v = (v · e2 )e2 = c2 e2
proje3 v = (v · e3 )e3 = c3 e3 , cioè c1 , c2 e c3 , come volevasi dimostrare.
Esercizi
157
Una omotetia (o anche dilatazione) di R3 è una trasformazione di f : R3 → R3 definita come segue: se c , 0 è una costante non nulla (detto fattore o ragione) e O un punto di R3 (detto il centro dell’omotetia), allora #» si manda il punto P nel punto O + cOP, #» f : P 7→ O + cOP. È facile vedere che una omotetia manda rette in rette e piani in piani, e che conserva gli angoli, i rapporti tra le lunghezze e la relazione di parallelismo. Assumiamo vera la seguente ipotesi: se X è una regione di R3 e f (X) la sua trasformata mediante una omotetia di ragione c, allora Volume( f (X)) = |c|3 Volume(X). Si può verificare facilmente nel caso del parallelepipedo, di cui conosciamo il volume. (III.21) Calcoliamo il volume di un tetraedro, dimostrando i seguenti fatti. 3
′
′
′
① Se A, B, C e D sono quattro punti di R e B , C e D i punti medi di AB, AC e AD rispettivamente, allora il tetraedro ABCD è omotetico al tetraedro AB′ C′ D′ con fattore 2. ② Se x indica il volume del tetraedro ABCD e V il volume del parallelepipedo con spigoli AB′ , AC′ e AD′ , allora il volume dell’intersezione tra il parallelepipedo e il tetraedro è uguale a V − x/8. #» #» # » det(AB, AC, AD) . ③ Il volume del tetraedro ABCD è uguale a 6 Soluzione. Rappresentiamo i punti come in Figura III.30. Si ha B′ =
A+B , 2
C′ =
A+C , 2
D′ =
A+D . 2
#» La omotetia di centro A e ragione 2 manda P in A + 2AP, e quindi A in A, B′ in A + 2(B′ − A) = A + B − A = B, C′ in C e D′ in D. Una omotetia manda rette in rette, piani in piani, e quindi manda il tetraedro AB′ C′ D′ in ABCD. Osserviamo poi che il parallelepipedo con spigoli AB′ , AC′ e AD′ ha gli altri vertici in # » # » A+C B+C A+B −A+ −A= A + AB′ + AC′ = A + 2 2 2 # »′ # »′ C + D A + AC + AD = 2 # »′ # »′ D + B A + AD + AB = 2 e in # » # » # » B−A C−A D−A B+C+D−A A + AB′ + AC′ + AD′ = A + + + = . 2 2 2 2
La composizione di due omotetie è ancora una omotetia?
Esercizio
60 a pagina 162.
Naturalmente sarebbe più sempli-
ce calcolarne il volume con il metodo di esaustione (o anche il principio di Cavalieri), cioè con un piccolo integrale. Lo si faccia per esercizio ( 49 a pagina 513). Nel 1836 Gauss, in una lettera a Gerling, si pose il problema se fosse possibile calcolare il volume di un tetraedro senza il calcolo infinitesimale, ma scomponendo due tetraedri con la stessa base e la stessa altezza in parti congruenti (come si fa per i triangoli, in cui si costruisce il triangolo rettangolo per dimostrare la formula dell’area). Questo problema fu proposto alla comunità dei matematici da Hilbert (è il cosiddetto terzo problema di Hilbert) nel 1900,(7) e fu risolto negativamente subito dopo da Max Dehn. La soluzione che proponiamo non è una decomposizione in tetraedri congruenti (che appunto non esiste), ma una decomposizione in tetraedri omotetici, sulle linee della Proposizione XII.5 degli elementi di Euclide (due tetraedri con altezza uguale hanno volumi proporzionali alle aree delle basi). È un buon esercizio decomporre il parallelepipedo in sei tetraedri non congruenti ma di ugual volume.
158
Vettori e calcolo geometrico
D
D′
B′
A C′
B
C
F III.30: decomposizione del tetraedro ABCD dell’Esercizio (III.21).
Il parallelepipedo in questione interseca ABCD in una regione Y, il cui complementare è il tetraedro indicato in grigio in Figura III.30, che è omotetico (a meno di traslazioni!) con il tetraedro AB′ C′ D′ con ragione −1. Dunque il volume di Y è V − x/8, dato che x = Volume(ABCD) è 23 Volume(AB′ C′ D′ ), per via dell’omotetia di ragione 2. Ora, possiamo concludere l’esercizio osservando che ABCD si decompone in quattro regioni disgiunte: la regione Y più i tre tetraedri con vertice in B, C e D e volume x/8 (sempre per le omotetie di ragione 2 e centri in B, C e D). Ma allora x x x x = Volume(ABCD) = 3 + Volume(Y) = 3 + V − 8 8 8
=⇒
4 x = V; 3
ma il volume V del parallelepipedo con lati AB′ , AC′ e AD′ non è altro che un ottavo del volume del parallelepipedo con lati AB, AC e AD, e quindi # » # » # » 1 x = det(AB, AC, AD) . 6 ✩ (III.22) Mostrare che la riflessione r rispetto a un piano π di R3 (si veda la Figura III.31) è una isometria, cioè che per ogni P, Q ∈ R3 kr(P) − r(Q)k = kP − Qk. Si mostri anche che r(P) = P se e solo se P ∈ π, e che il punto riflesso di r(P) è P medesimo. Soluzione. Siano P′ = r(P) e Q′ = r(Q) le immagini riflesse dei due punti P e Q. Come abbiamo visto poc’anzi, P′ e Q′ sono i punti definiti da P − projπ P = projπ P − P′ ,
Q − projπ Q = projπ Q − Q′ .
Per semplificare la notazione, poniamo P¯ = projπ P e Q¯ = projπ Q. Risulta quindi che P − P¯ e Q − Q¯ sono ortogonali a π, e (*)
P − P¯ = P¯ − P′
Q − Q¯
= Q¯ − Q′ .
P
A projπ P
P′
F III.31: se π ⊂ R3 è un piano dello spazio Euclideo, la riflessione rispetto a π è la trasformazione r : R3 → R3 che associa al punto P ∈ R3 l’unico punto P′ per cui P − projπ P = projπ P − P′ , dove projπ P è la proiezione ortogonale di P sul piano π.
Esercizi
159
#» Osserviamo che il vettore PQ si può scrivere come somma #» #» # » # » # » # » #¯ » ¯ + P¯ Q, ¯ PQ = PP¯ + P¯ Q¯ + QQ = (PP¯ + QQ) #» #» # » # ′ »′ ¯ è ortogonale a π e P¯ Q¯ è parallelo a π. Anche P dove PP¯ + QQ Q , per lo #» # ′ » # »′ # ′ »′ ¯ ) + P¯ Q. ¯ Quindi la norma stesso motivo, si scrive come P Q = (P P¯ + QQ #» al quadrato di PQ è uguale a #» 2 #» 2 #» # » 2 # »′ # ′ » 2 #» ¯ ¯ = kPP ¯ + kP¯ Qk ¯ ¯ + Q Qk kPQk2 = kPP¯ + QQk + kP¯ Qk #» 2 # » # »′ 2 # ′ »′ 2 ¯ k + kP¯ Qk ¯ = kP = kP′ P¯ + QQ Qk .
Per le identità (*).
Ora, P′ = r(P) = P se e soltanto se P − P¯ = P¯ − P, cioè se e soltanto ¯ = 0, cioè P = P. ¯ Ma P¯ = proj P può essere uguale a P se e se 2(P − P) π soltanto se P ∈ π. Sia P′′ = r(P′ ) = r(r(P)). Si ha che P − P¯ = P¯ − P′ , P′ − P¯ ′ = P¯ ′ − P′′ , e ′ ¯ Ma allora P¯ = P. P′′ = 2P¯ − P′ = 2P¯ − (2P¯ − P) = P.
✎ Diamoci da fare. . . (Soluzioni a pagina 586) 1 Siano a = (1, 2, 3), b = (2, 3, −4), c = (−1, −2, −3) tre vettori di R3 . Determinare le componenti dei seguenti vettori: (a) a + b; (c) a + 3b − 2c; (b) a − c;
(d) 2a − b + c.
2 Risolvere il seguente enigma: determinare i valori di x, y e z tali che x+ y+z = 1 2x − y − z = 2 −y + z = 3. 3 Risolvere i seguenti sistemi di equazioni. ( x+ y=k+1 a + b −c =0 x−y=h−1 (a) −a + b + c = 2 (d) ( a−b+c =4 k+h= x+1 k − h = y − 1. x − y = 2z y + z = x (b) x + z = 2z + x x+y=k x + 2y = h u + v = a + b + 1 (e) y+k =h u + a = v + b + 2 (c) u+b = a+v−1 x + h = 2k
4 Determinare, al variare del parametro k, il numero di soluzioni del seguente sistema di equazioni: x + 3y + (2 + k)z = 1 2x + y + 3z = k (3 − k)x + 2y + z = 3k 5 Siano a = (1, 2), b = (2, 1) ∈ R2 . Mostrare che per ogni q = (x, y) ∈ R2 esistono unici due coefficienti c, d tali che q = ca + db. 6 Siano a = (1, 2, 3), b = (2, 3, 1), c = (3, 1, 2) tre vettori di R3 . Per ogni q = (x, y, z) ∈ R3 si determinino, i coefficienti u, v, w tali che q = ua + vb + wc. 7 Mostrare che se a ∈ Rn è parallelo a b, e b è parallelo a c, allora a è parallelo a c. 8 Dimostrare che se P = A + tv e P = B + sw sono due equazioni della stessa retta, allora v e w sono paralleli. K 9 Dimostrare che due rette di R3 sono sghembe se e solo se non sono complanari (cioè se e solo se non esiste un piano che le contiene). 10 Siano r una retta e A un punto del piano euclideo(8) . Le seguenti affermazioni sono vere o false? ① esiste una unica retta parallela a r passante per A;
160
Vettori e calcolo geometrico
② esiste una unica retta ortogonale (e incidente) a r passante per A;
20 Se a = (1, 3, 5, 7) e b = (1, −1, 1, −1), determinare la proiezione di a su b.
③ se s è una retta che non interseca r, allora s è parallela a r.
21 Si determino in R3 (con i versori coordinati i, j, k), tutti i vettori unitari v i cui angoli α, β, γ con i, j, e k verifichino le uguaglianze cos α = 1/2, cos β = 1/3, cos γ = 1/4 (cioè i coseni direttori di v sono 1/2, 1/3 e 1/4).
Rispondere alle stesse domande quando l’ambiente è lo spazio tridimensionale(9) , invece che un piano. 11 Mostrare che le diagonali di un parallelogramma ABCD si incontrano in un punto M che è punto medio di entrambi i segmenti AC e BD. 12 Siano a = (−1, 2, 3, −4), b = (−2, −3, 4, 1), c = (1, −1, 1, −1), d = (1, 1, 1, 1) quattro vettori di R4 . Calcolare i seguenti prodotti scalari. (a) a · (b + c); (c) (a + b + c) · d; (b) a · b + c;
(d) (a + b) · (c + d).
13 Mostrare che se per ogni x ∈ Rn , a · x = b · x, allora a = b. È possibile che per certi a, b e x si abbia a·x = b·x ma a , b?
22 Determinare gli angoli del triangolo di vertici A = (2, −1, 1), B = (1, −3, −5) e C = (3, −4, −4). 23 Siano in Rn tre vettori non zero a, b e c. Mostrare che se l’angolo tra a e b è uguale all’angolo tra a e c, allora kbkc − kckb è ortogonale a a. 24 Sia γn l’angolo tra i due vettori di Rn 1 1 an = (1, 1, . . . , 1) e bn = (1, , . . . , ). 2 n Si calcoli il limite di γn per n → ∞.
14 Siano a = (1, 0, 1), b = (0, 1, 1) e c = (1, 1, −1) ∈ R3 . ✩ 25 Mostrare che in ogni rombo le diagonali sono perpendicolari. (Suggerimento: il termine rombo indica un Si trovino, se esistono, due scalari x e y tali che xa + yb quadrilatero con tutti i lati di lunghezze uguali.) è ortogonale a b e a c. √ √ √ √ √ 26 Siano a = (cos α, sin α) e b = (cos β, sin β) in R2 15 Siano a = (1, 2, 3), b = ( 3, 3, 3) e c = due vettori. Dall’espressione del prodotto scalare a · b (1, 1, −1). Si calcolino le norme dei seguenti vettori: dedurre il valore di cos(α − β). (a) a + b; (b) a − c; (c) a + b − c; 27 Se x, y sono due punti dello spazio Rn , si defini16 Si trovino tutti i vettori di R2 ortogonali a a = (1, 2). sca la loro distanza d(x, y) = kx − yk. Mostrare che la Mostrare che si tratta di una retta. funzione distanza soddisfa le seguenti proprietà: 17 Siano a = (1, 2), b = (3, 4) in R2 . Determinare due ① d(x, y) = d(y, x). vettori ortogonali x e y tali che a = x + y, e x è parallelo ② d(x, y) = 0 ⇐⇒ x = y. a b. ③ d(x, z) ≤ d(x, y) + d(y + z). 18 Mostrare che per ogni coppia di vettori a, b ∈ Rn risulta 28 Mostrare che se due vettori a e b sono linearmente indipendenti e c · a = c · b = 0, c , 0 allora a, b, c sono 2 2 ka + bk − ka − bk = 4a · b. linearmente indipendenti Dedurre che a e b sono ortogonali se e solo se ka + bk = 29 Si scrivano le equazioni parametriche e l’equazioka − bk. Mostrare poi che ne cartesiana della retta di R2 passante per i due punti ka + bk2 + ka − bk2 = 2kak2 + 2kbk2 .
(1, 1) e (2, −2).
Cosa si può dedurre delle diagonali di un parallelogramma?
30 Si scriva, se esiste, l’equazione cartesiana del piano di R3 che passa per i tre punti (1, 1, 0), (1, 0, 1) e (0, 0, 1).
19 Mostrare (con vettori) la seguente proprietà dei quadrilateri: se ABCD è un quadrilatero, allora la somma dei quadrati dei lati AB, BC, CD, DA meno la somma dei quadrati delle diagonali AC, BD è uguale a quattro volte il quadrato della lunghezza del segmento che ha per estremi i punti medi delle diagonali.
31 Per quali valori del parametro k le due rette 1 x 0 1 x 1 y = 0 + t k e y = 1 + s 1 k 0 z 1 0 z e si intersecano?
Esercizi
161
32 Determinare la proiezione ortogonale del punto A = (1, 0, −1) sul piano p di equazione x + y + z = 1, e dedurre la distanza di A da p. 33 Si determini, al variare di k, la distanza tra le due rette dell’Esercizio 31 .
44 Mostrare che la Proprietà (V3) a pagina 117 è equivalente alla Proprietà (V3’), supposta valida (V2). 45 Dimostrare che per ogni a, b, e c a × (b × c) = (a · c)b − (a · b)c.
34 L’insieme di punti dato dalle equazioni parametri(Suggerimento: cominciare a mostrare che se a = i, allora che i × (b × c) = c1 b − b1 c. ) 0 2 3 x 1 y 2 ✩ 46 Dimostrare le seguenti identità vettoriali (Suggeri = + t1 2 + t2 1 + t3 −1 mento: usare l’Esercizio 45 .). 7 3 1 3 z è un piano, una retta o tutto lo spazio R3 ? 35 Determinare un vettore di R3 unitario ortogonale ai vettori dati. (a) i + j, k; (c) i − k, j + k. (b) i + j + k, k;
(d) i+2j+3k, j+2k+3i.
36 Mostrare che tre vettori ortogonali di Rn sono sempre linearmente indipendenti. 3
37 Mostrare che se a e b ∈ R sono ortogonali, allora ka × bk = kakkbk. 38 Ricordiamo che se a e b sono due vettori ortogonali unitari di R3 , allora a × b è ortogonale a a e a b ed è unitario. Mostrare che (a × b) × a = b e (a × b) × b = −a. 39 Sia a un vettore diverso da zero in R3 . Mostrare che se x, y sono due vettori tali che a×x = a× y e a·x = a· y, allora x = y.
(a) (a × b) × (c × d) = (a × b · d)c − (a × b · c)d;
(b) a × (b × c) + b × (c × a) + c × (a × b) = 0;
(c) a × (b × c) = (a × b) × c se e solo se b × (c × a) = 0.
✩ 47 Mostrare che vale la seguente identità.
(*)
(a × b) · (c × d) = (b · d)(a · c) − (b · c)(a · d) # " a·c b·c = det a·d b·d
Confrontarla poi con l’identità di Lagrange della Proposizione (III.31). La (*) è chiamata identità di Lagrange, ed è un caso particolare di una identità più generale, detta identità di Binet–Cauchy. 48 Dimostrare che il tetraedro di vertici A, B, C, D ha #» #» # » volume uguale a |AB · AC × AD|/6.
40 Mostrare che tre punti A, B, P di R3 sono allineati ✩ 49 (Formula di Erone) Siano a, b e c le lunghezze dei #» #» lati di un triangolo. Indichiamo con s il semiperimese e solo se AP × AB = 0. a+b+c tro s = . Dimostrare che l’area del triangolo è 41 Si consideri il piano di equazione x − y + z + 4 = 0. 2p Determinare uguale a S = s(s − a)(s − b)(s − c). (a) un versore normale al piano;
(b) la distanza del piano dall’origine; (c) le intersezioni del piano con i piani coordinati; (d) le tre rette del punto precedente individuano un triangolo nel piano: se ne calcoli l’area. 42 Calcolare l’equazione cartesiana del piano per i punti A = (1, 1, −1), B = (3, 3, 2) e C = (−1, 3, −2) e la sua distanza dall’origine. Qual è l’angolo che forma con il piano z = 0? 43 Mostrare che la distanza tra il piano che passa per i tre punti A, B e C di R3 e il punto P è #» #» #» #» #» |det(AP, AB, AC)|/kAB × ACk.
50 Dimostrare che se l è una retta di Rn e P un punto P < l, allora esiste un unico piano che contiene P e l. 51 Dimostrare che tre punti A, B, C di Rn sono allineati se e solo se esistono a, b, c non tutti nulli tali che a + b + c = 0 e aA + bB + cC = 0. 52 Nello spazio R3 siano ABC tre punti non allineati e Q un punto che ha distanza 1 dal piano p che passa per A, B, C. Mostrare che la distanza di un punto P dal piano p è uguale a # » #» # » # » #» # » det(PA, PB, PC)/ det(QA, QB, QC), se P e Q stanno dalla stessa parte del piano, altrimenti è uguale all’opposto del quoziente dei determinanti.
162
Vettori e calcolo geometrico
53 Si mostri che due vettori a e b di Rn sono paralleli se e solo se per ogni i, j = 1, . . . , n, ai b j = a j bi .
60 Se A, B, C e D sono quattro punti di R3 e A′ , B′ , C′ e D′ le loro immagini mediante una omotetia di ragione c e centro Q, allora il volume del parallelepipedo P con # » # » # » spigoli A′ B′ , A′ C′ e A′ D′ è uguale al volume V di quello #» #» # » con spigoli AB, AC e AD moltiplicato per il fattore c3 .
54 Dimostrare che tre punti A = (a1 , a2 ), B(b1 , b2 ), C = (c1 , c2 ) di R2 sono allineati se e soltanto se il determinante 61 Mostrare che il volume V di una piramide è uguale a1 b1 c1 ad un terzo l’area della base A per l’altezza h. a b c det 2 , 2 , 2 ✩ 62 Se a, b, c sono tre vettori di R3 con det(a, b, c) = 1 1 1 0, determinare in modo costruttivo l’esistenza di tre è nullo. Mostrare anche che in generale il valore coefficienti (α, β, γ) , 0 tali che αa + βb + γc = 0. di questo determinante è uguale al doppio dell’area (con segno) del triangolo ABC.(Suggerimento: si guardi ✩ 63 Si considerino un dodecaedro regolare (Figura III.32) e un icosaedro regolare (Figura III.33) inscritti all’Esercizio 51 .) in una sfera di raggio 1. Quale dei due ha volume magK 55 Dimostrare che se e1 , e2 sono due vettori linearmengiore? (Suggerimento: trovare un cubo che ha per vertici te indipendenti di Rn e x1 , x2 , y1 , y2 sono numeri reali, certi vertici del dodecaedro; poi mostrare che i centri delle allora quando i due vettori di Rn facce di un dodecaedro sono vertici di un icosaedro.) x = x1 e1 + x2 e2
y = y1 e1 + y2 e2
sono linearmente i lo sono anche i due veth iindipendenti, h tori di R2 x1 x2 e y1 y2 . È vero anche il viceversa? (Suggerimento: guardare nella dimostrazione del Teorema (III.23).) 56 Dimostrare che se per ogni d ∈ R3 l’equazione ax + by + cz = d ha una ed esattamente una soluzione (x, y, z), allora a, b e c sono linearmente indipendenti. K 57 (Teorema di Menelao (Menelao di Alessandria (70– 140))) Siano A, B e C tre punti non allineati, e PAB , PBC e PCA tre punti sulle rette per AB, BC e CA rispettivamente. Dimostrare che i tre punti PAB , PBC e PCA sono allineati se e soltanto se APAB BPBC CPCA PAB B PBC C PCA A
Figura III.32: dodecaedro regolare. = −1.
K 58 (Teorema di Ceva (Giovanni Ceva (1647–1734))) Siano A, B e C tre punti non allineati, e PAB , PBC e PCA tre punti sulle rette per AB, BC e CA rispettivamente. Dimostrare che le rette APBC , BPCA e CPAB si incontrano in un punto se e soltanto se APAB BPBC CPCA PAB B PBC C PCA A
= 1.
(Osserviamo che come corollario le mediane si incontrano in un punto). (Suggerimento: dedurlo dal Teorema di Menelao 57 , con una opportuna scelta di punti.) 59 Siano dati due vettori a, b ∈ Rn r {0} linearmente indipendenti. Dimostrare che esiste sempre un vettore v , 0 ortogonale sia ad a che a b se e solo se n ≥ 3.
Figura III.33: icosaedro regolare.
ti trancio un tetrastico tetro, due distici è un torpido metro: così, un verso avanti, uno indietro, li incido con schegge di vetro: E DOARDO S ANGUINETI (1930–)
C APITOLO
IV Matrici e operatori lineari
Nel Capitolo III abbiamo studiato i vettori, e le costruzioni geometriche e algebriche che con essi si possono fare. Quello che faremo in questo capitolo è di considerare tutti i vettori nel loro insieme, cioè di considerare l’intero spazio vettoriale, formato dall’insieme di tutti i vettori. Questa visione “olistica” consente di introdurre le trasformazioni lineari e l’algebra delle matrici, ed alcuni attributi degli spazi vettoriali di notevole importanza: il prodotto scalare, le proiezioni e il determinante. Vedremo alcune applicazioni importanti, che consentiranno di dimostrare in modo generale alcune
A
affermazioni che avevamo anticipato nel Capitolo III. Concluderemo il capitolo con due argomenti (legati tra loro) di notevole rilievo per il seguito del libro, che possono però presentare qualche difficoltà tecnica. Si tratta dello studio delle forme quadratiche e degli autovalori. Stiamo affrontando un capitolo inizialmente semplice, ma che si farà via via sempre più impegnativo, e finirà con un arrivo in salita decisamente faticoso. Cerchiamo quindi di iniziare in discesa, con una poco sensata parafrasi/parodia di un famoso incipit.
lla prima lezione sulle matrici cui andai mi aspettavo di essere annoiato a morte o forse nauseato da quello che mi avevano detto sarebbe capitato ai presenti. Ogni cosa che avevo letto a proposito delle lezioni universitarie insisteva su quel punto: la maggior parte delle persone che ne scrivevano condannavano apertamente le dimostrazioni come un affare inutile, stupido e perfino brutale, ma anche coloro che parlavano bene delle matrici come esibizione di abilità e come strumento utile deploravano l’uso delle dimostrazioni e si mostravano apertamente spiacenti della loro presenza. Il continuo esibire dimostrazioni nelle aule universitarie era considerato deplorevole. Suppongo, da un punto di vista moderno, cioè, il punto di vista delle applicazioni immediate, che l’intera storia delle matrici, o anche tutta la matematica, non sia difendibile; c’è certamente molta crudeltà nel dimostrare l’esistenza e le proprietà del determinante, c’è sempre il pericolo, cercato o capitato, di perdere tempo in speculazioni inutili, e arriva quasi sempre
164
Matrici e operatori lineari
il momento in cui ci si trova a ragionare in astratto o per induzione. Ora cercherei non di difendere quest’impostazione, ma solo di spiegare onestamente quelle poche cose che ho imparato su questo argomento. Per far questo dovrò essere complessivamente chiaro, o almeno cercare di esserlo, e se coloro che leggono decidono con disgusto che questo testo è scritto da qualcuno che manca della loro, cioè dei Lettori, finezza di sentimenti e opinioni, posso solamente ammettere che in effetti potrebbe essere vero. Ma chiunque legga questo capitolo può esprimere un giudizio solo quando ha visto e capito le cose di cui si parla e sa davvero quale potrebbe essere la propria reazione ad esse. Ricordo che un giorno Gertrude Stein, a proposito di operatori lineari, parlò della sua ammirazione per Frobenius e mostrò alcune sue foto durante una lezione, con lei e Alice Toklas nella prima fila dei banchi di legno dell’aula di Valencia, con Frobenius e suo fratello Perron di sotto, e io ero appena tornato dal Medio Oriente, e ricordo di averle detto che non amavo le matrici per colpa delle dimostrazioni. In realtà la cosa più difficile, a parte sapere davvero cosa si prova e come ci si confronta con l’astratto, piuttosto che quello che ci si aspetta di provare o che ci è stato insegnato a giudicare vero, è mettere giu i fatti per come sono: che cosa è realmente uno spazio vettoriale, cosa è una matrice, a cosa serve, quali sono le proprietà alla radice dei risultati che si sperimentano veri.(10)
§ 1. Spazi vettoriali Nel Capitolo III abbiamo dato la definizione di vettore più semplice possibile: una n-upla di numeri su cui è possibile applicare due operazioni (prodotto per uno scalare e somma). Cerchiamo di formalizzare, cioè di rendere un poco più astratta, quella nozione. Prendiamo in considerazione solo le proprietà elencate nella Proposizione (III.4): se u, v, w sono tre vettori della stessa dimensione e c, d sono due scalari, allora
Vedi § 1 a pagina 98.
① (commutativa) u + v = v + u, cu = uc. ② (associativa) (u + v) + w = u + (v + w), (cd)u = c(du). ③ (distributiva) c(u + w) = cu + cw, (c + d)u = cu + du. ④ (vettore zero) Esiste un elemento 0 tale che u + 0 = u, u − u = 0. ⑤ (uno) 1u = u, 0u = 0. Definiremo ogni insieme di oggetti su cui si possano definire una somma e un prodotto per uno scalare con queste proprietà uno spazio vettoriale. Più precisamente: (IV.1) Definizione. Sia V un insieme, su cui sono definite due operazioni: una di somma e una di moltiplicazione per un numero reale. Se queste due operazioni soddisfano tutte le proprietà sopra elencate, allora V si dice spazio vettoriale (o, equivalentemente, spazio lineare).
Oltre che i numeri reali R, anche i numeri complessi C possono servire da coefficienti di uno spazio vettoriale. In questo caso si parla di spazio vettoriale complesso. Si veda il riquadro a pagina 211.
§ 1. Spazi vettoriali
165
(IV.2) Esempio. Per ogni n ≥ 1 l’insieme di tutte le n-uple di numeri reali (l’insieme Rn definito a pagina 99) con la somma e il prodotto per uno scalare definiti in (III.2) e (III.1) costituisce l’esempio canonico di spazio vettoriale di dimensione n. Lo indicheremo ancora con il simbolo Rn . (IV.3) Esempio. Ricordiamo che su Rn si può definire il prodotto scalare, come in (III.16). Consideriamo quindi l’insieme V di tutti i vettori v ∈ Rn ortogonali ad un vettore n dato, cioè quelli per cui v · n = 0. La somma e il prodotto per uno scalare saranno quelli di Rn , e rimane da controllare che in effetti se v ∈ V e w ∈ V sono due vettori di V e c è uno scalare, allora sia v + w che cv sono ancora elementi di V: ma v · n = w · n = 0 =⇒ (v + w) · n = v · n + w · n = 0, e (cv) · n = c(v · n) = 0, dunque V è uno spazio vettoriale.
Da non confondere con il prodotto per uno scalare.
(IV.4) Esempio. Sia V l’insieme di tutte le funzioni continue definite su un intervallo e a valori in R. La somma di due funzioni f, 1 ∈ V si definisce ponendo ( f + 1)(x) = f (x) + 1(x) per ogni x, e analogamente il prodotto per uno scalare è (c f )(x) = c f (x). Si può vedere che V è uno spazio vettoriale, in cui la funzione ovunque zero fa da 0.
Lo spazio vettoriale delle funzioni continue su [a, b] viene solitamente indicato con C([a, b]).
Il
Lettore dovrebbe provare a dimostrare questo fatto per esercizio.
(IV.5) Esempio. L’elenco di spazi vettoriali è praticamente senza fine. I seguenti sono alcuni tra gli spazi vettoriali più diffusi. ① Lo spazio Rn . ② Lo spazio di tutte le matrici n × m a coefficienti reali.
Che definiremo tra poco, nel § 2.
③ Lo spazio dei polinomi di grado al più n. ④ L’insieme di tutte le funzioni definite su un intervallo (a, b). ⑤ L’insieme di tutte le funzioni derivabili in (a, b), oppure integrabili in (a, b). ⑥ L’insieme di tutte le soluzioni di una equazione differenziale lineare omogenea del secondo ordine:
Si veda il § 4 a pagina 13.
y′′ (x) + a(x)y′ (x) + b(x)y(x) = 0. ⑦ I polinomi trigonometrici (di grado al più n). ⑧ Le funzioni periodiche, le funzioni pari, le funzioni dispari, le funzioni a media nulla.
Si
veda il § 4 a pagina 54, e la Definizione (II.23).
166
Matrici e operatori lineari
⑨ Le successioni di numeri reali convergenti. ⑩ I numeri complessi C, con il campo degli scalari R, il prodotto consueto di un numero reale per un numero complesso e la somma di numeri complessi. Ricordiamo la nozione di combinazione lineare di k vettori v1 , v2 , . . . , vk con coefficienti c1 , c2 , . . . , ck , che avevamo dato in (III.3): c1 v1 + c2 v2 + . . . + ck vk . Non c’è traccia esplicita delle componenti dei vettori v1 , v2 , . . . , vk , e quindi si può parlare di combinazione lineare di vettori in spazi vettoriali astratti. Intenderemo sempre che le combinazioni lineari sono combinazioni di un numero finito di vettori. Un’altra definizione che può tranquillamente essere utilizzata è quella di dipendenza o indipendenza lineare, che avevamo dato in (III.8): k vettori a1 , a2 , . . . , ak sono linearmente (in)dipendenti se l’equazione (1)
a1 x1 + a2 x2 + . . . + ak xk = 0
(non) ammette soluzioni non nulle (x1 , x2 , . . . , xk ) , 0. Possiamo dire che i vettori di un insieme (anche infinito) S sono dipendenti se per almeno un k esistono k vettori s1 , s2 , . . . , sk di S linearmente dipendenti. Naturalmente i vettori di un insieme (anche infinito) S sono indipendenti se non sono dipendenti. (IV.6) Definizione. Sia S un insieme di elementi di uno spazio vettoriale V. Allora si indica con Span(S) l’insieme di tutte le combinazioni lineari (finite) di elementi di S, e si chiama lo spazio lineare generato da S. Poniamo Span(∅) = {0}. Gli elementi di S si dicono generatori di Span(S). Se S ha un numero finito di elementi s1 , s2 , . . . , sk , allora si indica anche con Span(S) = Span(s1 , s2 , . . . , sk ). Lo span di un insieme di vettori di V è anch’esso uno spazio vettoriale (con le operazioni ereditate da V), e viene anche chiamato un sottospazio vettoriale di V. Lo si provi a dimostrare per esercizio (Esercizio 46 ). Possiamo riscrivere la proprietà di avere o non avere soluzioni per un sistema di equazioni lineari nel seguente modo. n
(IV.7) Siano a1 , a2 , . . . , ak e b vettori di R . Il sistema di equazioni a1 x1 + a2 x2 + . . . + ak xk = b ha soluzioni se e soltanto se b ∈ Span(a1 , a2 , . . . , ak ).
F IV.1: Hermann Günter Grassmann (1809–1877), che introdusse la nozione di spazio vettoriale astratto.
§ 1. Spazi vettoriali
167
(IV.8) Definizione. Sia V uno spazio vettoriale. Un insieme di elementi S ⊂ V tale che Span(S) = V è detto insieme di generatori di V. In altre parole, S è un insieme di generatori per V quando ogni elemento di V si può scrivere come combinazione lineare di elementi di S v = c 1 s1 + c 2 s2 + . . . + c k sk .
(IV.9) Definizione. Chiamiamo base dello spazio vettoriale V una nupla di vettori di V (e1 , e2 , . . . , en ) tale che gli ei sono indipendenti e Span (e1 , e2 , . . . , en ) = V, cioè
Più propriamente, questa sarebbe la definizione di base ordinata. In generale si intende per base l’insieme dei vettori e1 , e2 , . . . , en e non la n-upla (che è un insieme ordinato). Per quanto riguarda gli scopi di questo testo ci è sembrato più semplice dare questa definizione.
① i vettori che la compongono siano indipendenti e ② siano generatori per V. (IV.10) Esempio. I vettori e1 = i, e2 = j e e3 = k sono una base di R3 . In generale la cosiddetta base canonica di Rn è costituita dai vettori 1 0 e1 = 0 , .. . 0
0 1 e2 = 0 , .. . 0
...,
0 0 en = 0 . .. . 1
(IV.11) Esempio. I vettori s1 = (1, 0) e s2 = (1, 1) costituiscono una base per R2 : infatti sono linearmente indipendenti, e quindi per il Teorema (III.23) ogni vettore v ∈ R2 si può scrivere come combinazione lineare di (1, 0) e (1, 1). (IV.12) Esempio. Lo spazio vettoriale costituito da tutti i polinomi in x a coefficienti reali di grado al più n ha n + 1 generatori 1, x, x2, . . . , xn . Sono indipendenti, dato che una loro combinazione lineare a0 + a1 x + a2 x 2 + . . . + an x n è uguale al polinomio nullo se e solo se tutti i coefficienti ai sono zero. Consideriamo una base (b1 , b2 , . . . , bn ) di uno spazio vettoriale V. Allora, per ogni x ∈ V, l’equazione (2)
x1 b1 + x2 b2 + . . . + xn bn = x
Per
i Teoremi (III.23) e (III.29), ogni volta che si prendono due vettori in R2 o tre vettori in R3 , se sono linearmente indipendenti allora costituiscono una base, dato che generano tutto lo spazio vettoriale. Torneremo su questa proprietà nella Proposizione (IV.17) a pagina 169.
168
Matrici e operatori lineari
ha almeno una soluzione . Ma visto che i bi sono linearmente indipendenti, questa soluzione è unica. Se così non fosse, esisterebbero due n-uple (x1 , . . . , xn ) e (x′1 , . . . , x′n ) tali che
Dato
che Span(b1 , b2 , . . . , bn ) =
V.
x1 b1 + . . . + xn bn = x = x′1 b1 + . . . + x′n bn , da cui (x1 − x′1 )b1 + . . . + (xn − x′n )bn = 0. Ma visto che i vettori bi sono linearmente indipendenti, si avrebbe xi − x′i = 0 per ogni i, cioè gli xi non possono essere diversi dagli x′i . Se vale la (2), i numeri x1 , x2 , . . . , xn sono detti le componenti del vettore x nella base (b1 , . . . , bn ). Osserviamo una cosa importante: se c è un numero, allora cx è un elemento di V (risultato del prodotto scalare-vettore proprio di V), che a sua volta ha componenti nella base (b1 , . . . , bn ). Ma dato che cx1 b1 + cx2 b2 + . . . + cxn bn = cx e la soluzione è unica, le componenti di x in effetti si ottengono moltiplicando lo scalare c per il vettore (x1 , x2 , . . . , xn ). Lo stesso per la somma: se y è un altro vettore, con componenti y1 , y2 , . . . , yn , allora (x1 + y1 )b1 + (x2 + y2 )b2 + . . . + (xn + yn )bn = x + y, e quindi le componenti di x + y (la cui somma è la somma definita in V) si ottengono sommando i vettori delle componenti (x1 , x2 , . . . , xn ) + (y1 , y2 , . . . , yn ). La scelta di una base per V ci consente quindi di parametrizzare gli elementi di V con gli n parametri x1 , x2 , . . . , xn in modo tale che le operazioni su V corrispondono alle operazioni delle n-uple. Questa corrispondenza si scrive anche come V Rn . (IV.13) Se (e1 , e2 , . . . , en ) ed (e′1 , e′2 , . . . , e′m ) sono due basi per lo spazio vettoriale V, allora n = m. In altre parole, le basi di un dato spazio vettoriale hanno tutte lo stesso numero di elementi (posto che ne esista almeno una). Dimostrazione. Dato che (e1 , e2 , . . . , en ) è una base per V, possiamo scrivere i vettori delle componenti degli elementi e′1 , e′2 , . . . , e′m in questa base, e li denoteremo con i simboli a1 , a2 , . . . , am ; cioè per ogni i = 1 . . . m il vettore ai ∈ Rn è l’unico vettore di dimensione n che risolve l’equazione
Segue
da questa definizione che le componenti di un vettore di Rn rispetto alla base standard sono esattamente le sue componenti, quando considerato una semplice n-upla. Cioè, un vettore di Rn ha n componenti rispetto alla base standard (in quanto vettore), e n componenti (in quanto n-upla) che coincidono con le precedenti. Per esempio, (1, 2) = x = i + 2 j ∈ R2 ha componenti (1, 2) rispetto alla base canonica di R2 . Se però invece della base canonica usiamo quella vista nell’Esempio (IV.11), allora −s1 + 2s2 = −(1, 0) + 2(1, 1) = (1, 2) = x, laonde per cui x = −s1 + 2s2 ha componenti (−1, 2) rispetto alla nuova base.
In
linea di principio si potrebbe pensare che il numero n (la dimensione) dipenda dalla scelta fatta della base. Invece, vedremo subito sotto che ciò non accade. L’esistenza di una parametrizzazione è importante, e verrà sottolineata ancora nel Corollario (IV.16).
e′i = x1 e1 + x2 e2 + . . . + xn en nelle incognite x1 , . . . , xn . Abbiamo ancora il problema dei due indici, ma se concordiamo di scrivere, per ogni i, ai = (a1i , a2i , . . . , ani ), possiamo riscrivere anche e′i = a1i e1 + a2i e2 + . . . + ani en . Ora, supponiamo che m > n. Vogliamo mostrare che gli e′i sono linearmente dipendenti. Dimostreremo cioè il seguente lemma. (IV.14) Lemma. Se V ha una base con n vettori, allora m > n vettori di V sono linearmente dipendenti. Ma questo è equivalente a chiedere che gli m vettori delle componenti a1 , . . . , am siano linearmente dipendenti, cioè che esista una soluzione non nulla
Lo risolveremo tra non molto, introducendo finalmente il concetto di matrice.
§ 1. Spazi vettoriali
169
(x1 , x2 , . . . , xm ) dell’equazione x1 e′1 + x2 e′2 + . . . + xm e′m = 0, che può essere scritta come
Sostituendo e′i .
le espressioni per gli
x1 (a11 e1 + a21 e2 + . . .) + x2 (a12 e1 + a22 e2 + . . .) + . . . + xm (a1m e1 + a2m e2 + . . .) = 0. Raccogliendo (per le proprietà algebriche dei vettori), si ottiene l’equazione (x1 a11 + x2 a12 + . . . + xm a1m )e1 + (x1 a21 + x2 a22 + . . . + xm a2m )e2 + . . . + (x1 an1 + x2 an2 + . . . + xm anm )en = 0. Quest’ultima, dato che e1 , e2 , . . . , en sono linearmente indipendenti, è equivalente al sistema di equazioni x1 a11 + x2 a12 + . . . + xm a1m = 0 x1 a21 + x2 a22 + . . . + xm a2m = 0 ... x1 an1 + x2 an2 + . . . + xm anm = 0 cioè x1 a1 +x2 a2 +. . .+xm am = 0. Questo è un sistema di n equazioni in m incognite, che ha sempre la soluzione (x1 , x2 , . . . , xm ) = 0. Ora immaginiamo di procedere con l’eliminazione successiva delle variabili, Il procedimento di eliminazione si conclude quando non si possono più eliminare variabili: nel nostro caso con n equazioni possiamo eliminare n variabili al massimo. Le variabili non eliminate (le cosiddette variabili libere) saranno quindi almeno m − n ≥ 1; dato che almeno una soluzione c’è (quella nulla), non potrà accadere di terminare su un sistema senza soluzioni, e quindi si può concludere che se m > n i vettori e′1 , . . . e′m sono linearmente dipendenti. Abbiamo concluso la dimostrazione del Lemma (IV.14). Ma per ipotesi questi vettori costituiscono una base, quindi non può essere che m > n, ovvero deve essere m ≤ n. Adesso riprendiamo il ragionamento da capo, scambiando i ruoli di (e1 , . . . , en ) e (e′1 , . . . , e′m ), per dedurne che è vero anche che n ≤ m. Ma allora non può essere che n = m.
(IV.15) Definizione. Il numero di elementi di una qualsiasi base di uno spazio vettoriale V è la dimensione di V (indicata con dim V). Se V non ha una base finita, si dice che ha dimensione infinita. Nella dimostrazione di (IV.13) è di fatto dimostrato anche il seguente Corollario (cfr. la Definizione (IV.15)). (IV.16) Corollario. Ogni spazio vettoriale di dimensione n è parametrizzato con n parametri liberi: V Rn . (IV.17) Consideriamo n vettori e1 , e2 , . . . , en di uno spazio vettoriale V di dimensione n. Allora: ① (e1 , e2 , . . . , en ) è una base se e solo se i vettori ei sono linearmente indipendenti; ② (e1 , e2 , . . . , en ) è una base se e solo se Span(e1 , e2 , . . . , en ) = V.
Costituiscono una base!
Si veda il § 2 del Capitolo III a pa-
gina 99. Potremmo non riuscire ad eliminarle tutte perché qualche variabile potrebbe perdersi nel procedimento — si veda l’Esercizio (III.2) a pagina 142.
Non tutti gli spazi vettoriali hanno una base finita, cioè ci sono spazi vettoriali di dimensione infinita. Per esempio, possiamo estendere l’Esempio (IV.12) e considerare lo spazio vettoriale di tutti i polinomi, di ogni grado. Questo è generato da tutti gli infiniti monomi xn , con n ≥ 0, ma non può essere generato da un insieme finito di generatori. Molti altri spazi di dimensione infinita (spazi di funzioni continue, derivabili, con sviluppi in serie di Taylor, . . . ) sono di grande importanza (si vedano anche l’Esempio (IV.50) e il riquadro a pagina 187).
170
Matrici e operatori lineari
Dimostrazione. In entrambe, la parte “solo se” è ovvia. Per la ①, dobbiamo mostrare che se gli n vettori ei sono indipendenti, allora Span(e1 , e2 , . . . , en ) = V. Sia v ∈ V un vettore qualsiasi non nullo. Per il Lemma (IV.14), (v, e1 , . . . , en ) sono n + 1 > n vettori linearmente dipendenti (dato che V ha certamente una base con n vettori), cioè esistono n + 1 coefficienti ci tali che
Dato
che per definizione i vettori di una base devono essere linearmente indipendenti e generare V.
c0 v + c1 e1 + c2 e2 + . . . cn en = 0. Il primo coefficiente, c0 , non può essere zero , e quindi, dividendo per −c0 otteniamo
Dato
che gli ei sono linearmente indipendenti.
v = −(c1 e1 + c2 e2 + . . . cn en )/c0 ∈ Span(e1 , e2 , . . . , en ). Per la ②, dobbiamo mostrare che se Span(e1 , e2 , . . . , en ) = V allora gli ei sono linearmente indipendenti. Se per assurdo non lo fossero, sarebbe possibile scrivere uno di loro come combinazione lineare degli altri. Supponiamo (a meno di cambiare gli indici) che sia en = c1 e1 + c2 e2 + . . . + cn−1 en−1 . Ma allora V = Span(e1 , e2 , . . . , en ) = Span(e1 , e2 , . . . , en−1 ). Proseguiamo così fino a che non abbiamo k < n vettori linearmente indipendenti (a meno di permutazioni degli indici) e1 , e2 , . . . , ek che generano V. Ma allora V ha dimensione k < n: assurdo, perché per la Proposizione (IV.13) dovrebbe essere k = n.
(IV.18) La dimensione dello spazio V generato da m vettori v1 , v2 , . . . , vm (non necessariamente indipendenti) non può essere maggiore di m, ed è il massimo numero degli vi linearmente indipendenti. Dimostrazione. Come per la dimostrazione di ② nella Proposizione (IV.17), togliendo vettori uno per volta si arriva ad un insieme di k vettori linearmente indipendenti che generano V, con k ≤ m. Se se ne tolgono altri, e si arriva ad un insieme di k′ vettori con la stessa proprietà, per (IV.13) deve essere k = k′ . Inoltre, per (IV.14), se un sottoinsieme di k vettori linearmente indipendenti scelto tra i vi genera V, allora ogni insieme di k′ > k vettori non può essere linearmente indipendente (e quindi la dimensione k è il massimo numero di vettori vi linearmente indipendenti).
§ 2. Matrici e trasformazioni lineari Ci è capitato di incontrare più volte casi in cui si considerano m-uple di vettori di dimensione n (a1 , a2 , . . . , am ), in cui per ogni j = 1, . . . , m il vettore a j ha a sua volta n componenti (a1 j , a2 j , . . . , anj ). Il modo più sensato per disporre i coefficienti ai j è quello
Se en è combinazione lineare degli
altri, allora ogni combinazione lineare dei ei con i = 1, . . . , n può sempre scriversi come combinazione lineare dei e1 , . . . , en−1 , sostituendo a en la sua espressione lineare in funzione degli altri.
Tra
un po’ (a pagina 193) torneremo su questa proprietà, quando ci occuperemo del rango di una matrice.
§ 2. Matrici e trasformazioni lineari
della matrice n × m:
a11 a12 a a 21 22 A = (a1 , a2 , . . . , am ) = . , . , · · · .. .. an1 an2
171
a11 a1m a a21 , 2m = . · · · .. anm an1
a12 a22 .. . an2
a1m a2m .. . · · · anm ··· ··· .. .
in cui le m colonne (vettori di dimensione n) sono le componenti degli m vettori a1 , . . . , am , mentre le n righe sono vettori (chiamati vettori riga) di dimensione m, tutte le j-esime componenti degli m vettori. Si dice che la matrice A indicata sopra ha componenti o coefficienti ai j (che a volte, per maggior chiarezza, scriveremo anche come ai, j ) ed è una matrice di n righe per m colonne (in breve: n × m). A parte la rappresentazione “geometrica” bidimensionale, una matrice quindi può essere vista semplicemente come una funzione A : {1, . . . , n} × {1, . . . , m} → R, in cui si scrive A(i, j) = ai j , oppure come un vettore che ha vettori per componenti. Se n = m la matrice si dice quadrata. (IV.19) Esempio (Matrice nulla e identica). La matrice In (identica) e la matrice 0n (nulla), che vengono spesso indicate per semplicità con I e 0 con abuso di notazione, sono le seguenti matrici n × n 1 0 · · · 0 0 0 · · · 0 0 1 · · · 0 0 0 · · · 0 , 0n = . . . . In = . . . . . ... . . ... .. .. .. .. 0 0 ··· 1 0 0 ··· 0 Le due operazioni dei vettori (III.1) e (III.2) possono essere facilmente estese alle matrici, ponendo a11 a12 · · · a1m ca11 ca12 · · · ca1m a 21 a22 · · · a2m ca21 ca22 · · · ca2m c . = .. .. .. .. .. , .. .. .. . . . . . . . an1 an2 · · · anm can1 can2 · · · canm a11 a 21 . . . an1
a12 a22 .. . an2
a1m b11 a2m b21 .. + .. . . · · · anm bn1 ··· ··· .. .
b12 b22 .. . bn2
b1m a11 + b11 b2m a21 + b21 .. = .. . . · · · bnm an1 + bn1 ··· ··· .. .
a12 + b12 a22 + b22 .. . an2 + bn2
16 5 9 4
3 10 6 15
2 11 7 14
13 8 . 12 1
a1m + b1m a2m + b2m . .. . · · · anm + bnm ··· ··· .. .
Il fatto di avere due indici consente di definire un certo numero di altre operazioni tra matrici, oltre che queste due. La prima operazione, chiamata prodotto righe per colonne, è anche la più importante in assoluto per le matrici. Invece che definirlo subito, torniamo al concetto importante di combinazione lineare di m vettori di dimensione n, che abbiamo già visto: a1 x1 + a2 x2 + . . . + am xm .
F IV.2: la Melanconia di Albrecht Dürer (1471–1528), in cui in alto a destra (poco visibile) compare un quadrato magico, cioè la matrice 4 × 4 (con alcune proprietà magiche)
Come vedremo, queste operazioni portano ad una formidabile quantità di conseguenze.
172
Matrici e operatori lineari
Il mattone fondamentale per il prodotto righe per colonne è proprio la combinazione lineare: iniziamo con il definire il prodotto di una matrice per un solo vettore, che immaginiamo disposto come colonna. (IV.20) Definizione. Il prodotto righe per colonne di una matrice per un vettore colonna è definito come segue: a1m x1 a11 a1m a12 a a22 a2m x2 a21 2m .. .. = .. x1 + .. x2 + · · · + .. xm . . . . . anm an2 an1 an2 · · · anm xm a11 x1 + a12 x2 + . . . + a1m xm a x + a x + . . . + a x 22 2 2m m 21 1 = a1 x1 + a2 x2 + . . . + am xm = . . . an1 x1 + an2 x2 + . . . + anm xm a11 a 21 . . . an1
a12 a22 .. .
··· ··· .. .
La definizione di prodotto di una matrice di n righe e m colonne per un vettore (colonna) di dimensione m ci porta subito a poter definire il prodotto di una matrice di n righe e m colonne (n × m) per un’altra matrice di m righe e k colonne, semplicemente giustapponendo i prodotto della matrice per i vettori colonna, cioè se B = (b1 , b2 , . . . , bk ) è una seconda matrice formata da k vettori (colonna) di dimensione m, si ha (3)
F IV.3: Arthur Cayley (1821– 1895), il cui nome è legato alla teoria delle matrici.
AB = A(b1 , b2 , . . . , bn ) = (Ab1 , Ab2 , . . . , Abk ).
Il prodotto è definito solo quando il numero di colonne della matrice di sinistra A è uguale al numero di righe della matrice di destra B. (IV.21) Esempio. " #" 1 2 a b 3 4 d e
Si
# " # c a + 2d b + 2e c + 2 f = . f 3a + 4d 3b + 4e 3c + 4 f
È quasi facile dimostrare le seguenti proprietà del prodotto righe per colonne (tralasciamo di elencare le proprietà della somma e del prodotto per uno scalare, che sono identiche a quelle dei vettori). (IV.22) Se A, B sono matrici, x e y due vettori della stessa dimensione (che possono essere anche pensati come vettori colonna) e c uno scalare, allora (a patto che le operazioni siano ben definite, a seconda del numero di righe/colonne): ① A(x + y) = Ax + Ay, (A + B)x = Ax + Bx. ② A(cx) = c(Ax) = (cA)x. ③ (AB)x = A(Bx).
può vedere che il termine di posto (i, j) della matrice prodotto è uguale al prodotto scalare della iesima riga del primo fattore per la jesima colonna del secondo (nel senso delle m-uple di numeri): (AB)i j = (i-esima riga di A)· · ( j-esima colonna di B).
§ 2. Matrici e trasformazioni lineari
Seguono subito(11) , per la definizione di prodotto tra matrici, le proprietà seguenti: se A, B e C sono matrici e c uno scalare, allora ① A(B + C) = AB + AC, (A + B)C = AC + BC. ② A(cB) = c(AB) = (cA)B. ③ (AB)C = A(BC). Con questa nuova notazione possiamo riscrivere il sistema di equazioni x1 a11 + x2 a12 + . . . + xm a1m = b1 x1 a21 + x2 a22 + . . . + xm a2m = b2 ⇐⇒ a1 x1 +a2 x2 +. . .+am xm = b ... x a + x a +... + x a = b 1 n1 2 n2 m nm n
173
A differenza
del prodotto tra numeri, del prodotto scalare, e del prodotto scalare–vettore, il prodotto tra matrici in generale non è commutativo, cioè non è detto che valga AB = BA. Innanzitutto perché non sempre entrambi i prodotti sono ben definiti (affinché lo siano, se A è n × m, B deve essere m × n) ma anche se lo fossero potrebbe capitare che AB , BA. Per esempio " #" # " # 1 0 0 1 0 1 = , 0 0 0 0 0 0 mentre
" 0 0
#" 1 1 0 0
# " 0 0 = 0 0
# 0 . 0
Per questo motivo si deve sempre fare attenzione se si tratta di una moltiplicazione a destra o a sinistra (cfr. Esercizio 19 a pag. 222).
semplicemente come Ax = b, dove A è la matrice con coefficienti ai j , x = (x1 , x2 , . . . , xm )
e
b = (b1 , b2 , . . . , bn ).
Osserviamo che x ∈ Rm e b ∈ Rn , e che la matrice A consente di definire una funzione (equivalentemente, una applicazione, operatore o trasformazione) A : Rm → Rn , definita ponendo (4)
Rm ∋ x 7→ Ax ∈ Rn .
(IV.23) Esempio. Consideriamo il sistema ( x1 + x2 = y1 x1 = y2 ,
Usiamo lo stesso simbolo per de-
notare la funzione e la matrice che la rappresenta. Non è proprio corretto, come vedremo anche in seguito, perché ci potrebbe essere una funzione rappresentata da diverse matrici (al variare delle basi scelte).
che possiamo riscrivere come " #" # " # 1 1 x1 y = 1 . y2 1 0 x2 La matrice in questione rappresenta quindi anche una funzione R2 → R2 definita ponendo " # " #" # 1 1 x1 x1 7→ . 1 0 x2 x2 Se A è una matrice n × m, la funzione A : Rm → Rn definita come sopra da x 7→ Ax gode delle due proprietà importanti (5)
A(x + y) = Ax + Ay
(6)
A(cx) = c(Ax),
che sono state enunciate nella Proposizione (IV.22). Torniamo un momento nel contesto astratto degli spazi vettoriali, e diamo un nome a queste proprietà.
Forse non tutti
sanno che questa matrice si chiama Q–matrice di Fibonacci, e viene indicata con la lettera Q. Ricordiamo che i numeri di Fibonacci sono la successione definita per ricorrenza da F2 = F1 = 1, e Fn+1 = Fn + Fn−1 per ogni n ≥ 2. Chissà chi è in grado di dimostrare che # " F Fn , Qn = n+1 Fn Fn−1 dove Qn è la potenza n-esima di Q (cioè Q moltiplicata per sé stessa n volte).
174
Matrici e operatori lineari
(IV.24) Definizione. Se V e W sono due spazi vettoriali, una funzione L : V → W si dice lineare quando per ogni x, y ∈ V e per ogni numero c si ha L(x + y) = L(x) + L(y)
e
L(cx) = cL(x).
Se V = W, una funzione lineare f : V → V viene a volte detta operatore su V.
Altri quasi-sinonimi di «funzione» sono: trasformazione, applicazione, operatore, mappa. Hanno accezioni leggermente diverse a seconda del contesto. A volte si usa il termine «operatore» solo per funzioni lineari da V in sé. Quando
Con questa nozione possiamo rivedere molti dei concetti sotto una nuova luce, quella della linearità. Per prima cosa, la funzione A : Rm → Rn definita in (4) (moltiplicazione a sinistra con una matrice) è una funzione lineare. Vale anche il viceversa: se V e W sono spazi vettoriali di dimensione finita allora ogni applicazione lineare da V a W, una volta scelte delle basi per V e W, si può scrivere come prodotto per una matrice, come in (4).
una funzione L è lineare spesso si semplifica la scrittura L(x) in Lx. Infatti le proprietà formali sono proprio quelle di «moltiplicazione da sinistra» e proprietà distributiva.
(IV.25) (Matrice associata) Siano (b1 , b2 , . . . , bm ) una base per lo spazio vettoriale V, ed (e1 , e2 , . . . , en ) una base per lo spazio vettoriale W. Indichiamo con B : Rm → V e E : Rn → W le parametrizzazioni indotte dalle basi. Se f : V → W è una funzione lineare, allora esiste una matrice F con n righe e m colonne tale che, nelle coordinate delle basi sopra indicate, f è uguale alla funzione F : x 7→ Fx, come indicato nel seguente diagramma VOO
f
E
B Rm
// W OO
F
// Rn .
Dimostrazione. La funzione F è ben definita, dato che B : Rm → V è ben definita e E : Rn → W è biunivoca (e quindi invertibile). Prendiamo un vettore x ∈ Rm . Il corrispondente vettore di V è B(x), definito da B(x) = x1 b1 + x2 b2 + . . . + xm bm . La sua immagine in W è, per linearità f (B(x)) = x1 f (b1 ) + x2 f (b2 ) + . . . + xm f (bm ). Dato che E è biunivoca, esistono m vettori di Rn , che chiamiamo f1 , f2 , . . . , fm , tali che E( fi ) = f (bi ), e risulta f (B(x)) = x1 E( f1 ) + x2 E( f2 ) + . . . + xm E( fm ). Dato che E è lineare, anche E−1 (l’inversa di E) è lineare, e quindi F(x) = E−1 ( f (B(x))) = x1 f1 + x2 f2 + . . . + xm fm = Fx se F è la matrice con colonne gli fi .
I vettori della base standard di Rn sono in corrispondenza, attraverso E, con gli n vettori e1 , e2 , . . . , en di W.
§ 2. Matrici e trasformazioni lineari
175
(IV.26) Definizione. La matrice, la cui esistenza è provata nella Proposizione (IV.25), si dice matrice associata alla trasformazione lineare f . (IV.27) Esempio. Consideriamo la trasformazione del piano in sé data dalla rotazione di π/2, in senso antiorario, attorno all’origine. Non è difficile convincersi che è lineare e perciò, per il teorema precedente, deve essere rappresentata da una matrice. Il ruotato del vettore con componenti (x, y) è il vettore f (x, y) = (−y, x). Otteniamo dunque " #! " # " #" # " # x −y 0 −1 x x f = = =A . y x 1 0 y y
Infatti il ruotato di una somma di vettori è la somma dei vettori ruotati, mentre il ruotato di un multiplo di un vettore è il multiplo del ruotato.
Per
la rotazione di un generico angolo ϑ si veda l’Esercizio 21 a pagina 222.
(IV.28) Definizione. Se L è una funzione lineare L : V → W (con V e W spazi vettoriali), lo spazio di tutte le soluzioni x ∈ V dell’equazione Lx = 0 è detto il nucleo di L e indicato con Nucleo(L). Il nucleo di L è a sua volta uno spazio vettoriale, la cui dimensione è anche detta nullità di L. L’immagine di L è l’insieme di tutti i vettori del tipo Lx, con x ∈ V (è l’immagine della funzione L : V → W). Nella prossima proposizione dimostriamo il fatto importante che la composizione di due applicazioni lineari, scritta in coordinate, non è altro che il prodotto righe per colonne di due matrici, definito come in (3). (IV.29) (Prodotto righe per colonne) Consideriamo due trasformazioni lineari f: V→W
1 : W → Y.
e
Siano (b1 , b2 , . . . , bm ) una base per lo spazio vettoriale V, (e1 , e2 , . . . , en ) una base per lo spazio vettoriale W e (h1 , h2 , . . . , hl ) una base per lo spazio vettoriale Y. Indichiamo con B : Rm → V, E : Rn → W e H : Rl → Y le parametrizzazioni indotte dalle basi. Sia F la matrice con n righe e m colonne che rappresenta f , e G la matrice con m righe e l colonne che rappresenta 1 (nelle coordinate delle basi sopra indicate). Allora la matrice che rappresenta la composizione 1 ◦ f
f
// W
L’equazione Lx = 0 non è altro che un sistema di n equazioni in m incognite, se L è una matrice che rappresenta una trasformazione lineare L : Rn → Rm . Per quanto visto sopra, ogni funzione lineare può essere rappresentata in questo modo. In generale, perché la definizione di nullità, in (IV.28), sia ben posta occorre che il nucleo di un operatore lineare sia uno spazio vettoriale, in modo da poter usare la definizione (IV.15). È un simpatico esercizio, lasciato al Lettore (Esercizio 9 a pagina 221).
Possiamo rappresentare
la proposizione nel seguente diagramma, in modo molto sintetico: 1◦ f VOO
1◦ f V
Sinonimi di nucleo sono kernel (indicato con ker L), e nullspace.
1
è la matrice prodotto GF.
//&& Y
WOO
1
E
B Rm
//
f
F
//
Rn GF
))//
YOO
H G
//55 Rl
176
Matrici e operatori lineari
Dimostrazione. Vediamo dal diagramma a fianco che la matrice associata alla composizione 1 ◦ f non è altro che l’applicazione lineare ottenuta componendo G con F. Dobbiamo perciò dimostrare che la composizione delle due funzioni lineari G e F è il prodotto delle due matrici. Ma se x ∈ Rm , si ha F(x) = x1 f1 + x2 f2 + . . . + xm fm , e quindi per linearità G(F(x)) = x1 G( f1 ) + x2 G( f2 ) + . . . + xm G( fm ) = (G f1 , G f2 , . . . , G fm )x = (GF)x.
Un caso particolare si ha quando si rappresenta la funzione identica 1V : V → V (quella che manda v ∈ V in v ∈ V) in due basi diverse: VOO
1V
B Rn
prodotto di matrici corrisponde dunque alla composizione dei due operatori (funzioni lineari) corrisponenti. Il fatto, già visto, che in generale AB , BA corrisponde al fatto, molto più generale, che la composizione di funzioni non è una operazione commutativa: fermare la macchina e poi scendere non è sempre equivalente a scendere dalla macchina in corsa e dopo (cercare di) fermarla: basta fare una prova in autostrada per convincersene.
// V OO E
S
// Rn .
La matrice S è una matrice quadrata, detta matrice del cambio di base, o del cambio di coordinate. Se le due basi coincidono B = E, allora la matrice è quella identica. Le sue colonne sono i vettori E−1 (bi ), cioè sono le componenti dei vettori bi scritti nella base e j (quella della parametrizzazione E). Ovviamente potremmo pensare di scambiare il ruolo delle due basi, ottenendo di fatto la funzione inversa di S, a sua volta rappresentata da una matrice. (IV.30) Definizione. Una matrice quadrata A si dice invertibile se esiste una matrice A−1 (l’inversa di A) tale che (7)
Il
A−1 A = AA−1 = I.
Quella dell’Esempio (IV.19).
Non è difficile mostrare che se esiste una inversa per la matrice A allora è unica. Infatti, se B e C sono entrambe inverse di A, cioè BA = AB = I e CA = AC = I, allora B = BI = B(AC) = (BA)C = IC = C.
Ne segue che se S è la matrice di cambiamento di base da B ad E allora S−1 è quella del cambiamento da E a B, e S−1 S = SS−1 = I. (IV.31) Esempio. Sia x = (x1 , x2 ) un vettore di R2 . Siano (xˆ 1 , xˆ 2 ) le componenti di x rispetto alla base s1 = (1, 0), s2 = (1, 1) La relazione tra le coordinate è semplicemente la ( x1 = xˆ1 + xˆ2 x = xˆ1 s1 + xˆ 2 s2 ⇐⇒ ⇐⇒ x = Sx, ˆ x2 = xˆ2 . " # 1 1 dove S = (s1 , s2 ) = . Per calcolare la matrice inversa S−1 occorre 0 1 semplicemente esprimere le xˆ in funzione di x: ( ( xˆ 1 = x1 − x2 x1 = xˆ 1 + xˆ 2 ⇐⇒ xˆ = S−1 x ⇐⇒ xˆ 2 = x2 , x2 = xˆ 2 . " # 1 −1 −1 −1 e quindi la matrice inversa S è S = . 0, 1
Cfr.
anche l’Esempio (IV.11) a pag. 167.
Alternativamente, si può risolvere
il sistema di quattro equazioni nelle quattro incognite a, b, c, d " #" # " # " # a b 1 1 a a+b 1 0 = = , c d 0 1 c c+d 0 1
e ottenere a = 1, b = −1, c = 0, d = 1.
§ 2. Matrici e trasformazioni lineari
177
Vediamo ora come cambiano le matrici associate ad una trasformazione lineare, se si cambia la base di riferimento. (IV.32) Definizione. Si dice che due matrici quadrate n × n A e B sono simili se esiste una matrice invertibile S tale che S−1 AS = B. Due matrici sono simili se rappresentano il medesimo operatore in due basi diverse. Infatti, se A : Rn → Rn è l’operatore lineare dato dalla matrice A (rispetto ad una certa base), ed S : Rn → Rn è la parametrizzazione indotta da un’altra base, allora S−1 AS = B, come si evince dal seguente diagramma (si ricordi che la composizione di operatori corrisponde al prodotto di matrici): ROO n
A
Rn
B
coordinate: se x, y rappresentano le componenti di due vettori rispetto alla prima base e x, ˆ yˆ quelle rispetto alla seconda, allora x = Sx, ˆ
y = S y. ˆ
Quindi y = Ax ⇐⇒ S yˆ = ASxˆ
⇐⇒ yˆ = S−1 ASxˆ
// Rn OO
(nell’ultimo passaggio abbiamo moltiplicato a sinistra per S−1 ). Quindi la matrice che rappresenta la trasformazione lineare nelle seconde coordinate è B = S−1 AS.
S
S
In
// Rn .
(IV.33) Esempio. Consideriamo l’operatore Q : R2 → R2 dell’Esempio (IV.23), definito da " # " #" # y1 1 1 x1 (*) = . y2 1 0 x2
La
matrice " # associata alla base è 1 1 S = , con inversa S−1 = 0 1 " # 1 −1 (cfr. Esempio (IV.31) a 0, 1 pag. 176).
Rispetto alla base s1 = (1, 0), s2 = (1, 1) l’operatore Q si scrive " #" #" # " # 1 −1 1 1 1 1 0 1 −1 ˆ Q = S QS = = ... = . 0 1 1 0 0 1 1 1 Alternativamente, direttamente nelle coordinate, da ( ( yˆ 1 + yˆ 2 = y1 xˆ1 + xˆ2 = x1 e yˆ 2 = y2 , xˆ2 = x2 sostituendo nella (*) otteniamo " # " #" # ( ( yˆ 1 = xˆ 2 yˆ 1 + yˆ 2 = xˆ 1 + xˆ 2 + xˆ 2 yˆ 0 1 xˆ 1 ⇐⇒ 1 = . ⇐⇒ yˆ 2 1 1 xˆ 2 yˆ 2 = xˆ 1 + xˆ 2 yˆ 2 = xˆ 1 + xˆ 2 Com’era da aspettarsi, la forma di Qˆ è la stessa.
178
Matrici e operatori lineari
§ 3. Prodotto scalare e isometrie (IV.34) Definizione (Prodotto scalare). Un prodotto scalare definito su uno spazio vettoriale V è un prodotto che associa ad ogni coppia di vettori x, y ∈ V un numero reale, indicato con hx, yi (oppure, equivalentemente, con x · y) con le seguenti proprietà: se x, y e z sono tre vettori di V e c ∈ R è uno scalare,
Il prodotto scalare può essere definito anche per spazi vettoriali complessi, come vedremo nel riquadro a pagina 211
① (commutativo/simmetrico) hx, yi = hy, xi; ② (distributivo/lineare) hx, y + zi = hx, yi + hx, zi;
Questa è la linearità rispetto al secondo fattore. Dalla ① segue anche quella rispetto al primo.
③ (omogeneo) hcx, yi = hx, cyi = chx, yi; ④ (definito positivo) x , 0 =⇒ hx, xi > 0.
Mentre, per linearità, h0, 0i = 0.
La radice quadrata del prodotto positivo hx, xi è detta la norma del vettore x ∈ V, e viene indicata con il simbolo p kxk = hx, xi. (IV.35) Esempio. In Rn si può definire il prodotto scalare, ponendo hx, yi = x · y =
n X
Cfr.
la Definizione (III.16) a pagina 110
xi yi .
i=1
Viene chiamato prodotto scalare standard in Rn .
(IV.36) Esempio. Nello spazio vettoriale C[a, b] di tutte le funzioni continue sull’intervallo [a, b] il prodotto Z b h f, 1i = f (x)1(x) dx a
è un prodotto scalare.
Le prossime proprietà del prodotto scalare sono generalizzazioni delle corrispondenti (omonime) proprietà del prodotto scalare standard di Rn . (IV.37) (Disuguaglianza di Cauchy–Schwarz) Ogni prodotto scalare soddisfa la seguente disuguaglianza: per ogni x, y di V hx, yi ≤ kxkkyk, e vale l’uguaglianza se e solo se x e y sono paralleli (dipendenti). j Dimostrazione. Per la proprietà ④ del prodotto scalare (Definizione (IV.34)) si ha che hz, zi ≥ 0 per ogni z e se z , 0 si ha hz, zi > 0. Se y = 0, allora (hx, 0i)2 = 0 ≤ 0 = kxk2 k0k2 , quindi la disuguaglianza è vera. Se invece y , 0, si ha che per ogni t ∈ R deve essere 0 ≤ kx + tyk2 = hx + ty, x + tyi = kxk2 + t2 kyk2 + 2thx, yi.
Le abbiamo viste nella Proposizione (III.19) a pagina 111
§ 3. Prodotto scalare e isometrie
179
Ora, la funzione f (t) = kxk2 + t2 kyk2 + 2thx, yi ha per grafico una parabola con la concavità verso l’alto (dato che il coefficiente di t2 è positivo) ed è per definizione una funzione positiva; ha il minimo in quel t0 tale che f ′ (t0 ) = 0, cioè f ′ (t0 ) = 2t0 kyk2 + 2hx, yi = 0
⇐⇒
t0 = −
hx, yi . kyk2
Il valore di f (t0 ) è " #2 " # 2 hx, yi hx, yi hx, yi 2 2 f (t0 ) = kxk2 + − kyk − 2 hx, yi = kxk − . kyk2 kyk2 kyk2 Dato che deve essere f (t0 ) ≥ 0, si ha hx, yi kyk2
2
≤ kxk2 ,
da cui segue la tesi. Vale l’uguaglianza solo quando f (t0 ) = 0, cioè quando 0 = f (t0 ) = kx + t0 yk2
=⇒
x = −t0 y,
cioè x e y sono paralleli.
Le proprietà della norma seguono facilmente da quelle del prodotto scalare, come nella dimostrazione della seconda parte della Proposizione (III.19). (IV.38) (Proprietà della norma) Valgono le seguenti proprietà della norma: per ogni x, y, z in V e per ogni scalare c ∈ R, ① (positività) x , 0 =⇒ kxk > 0, kxk = 0 ⇐⇒ x = 0. ② (omogeneità) kcxk = |c| kxk. ③ (disuguaglianza triangolare) kx + yk ≤ kxk + kyk. Il termine norma in matematica ha un significato ben preciso, che puntualizziamo con la definizione seguente. (IV.39) Definizione. Una norma su uno spazio vettoriale V è una funzione da V a R tale che valgono le proprietà ①, ② e ③ della proposizione (IV.38). La Proposizione (IV.38) può quindi essere sintetizzata nell’affermazione √ “la funzione kvk = v · v è una norma”. Torniamo al prodotto scalare. Una volta che si è definito, è possibile parlare di ortogonalità. (IV.40) Definizione. Due vettori v e w sono ortogonali (rispetto al prodotto scalare in oggetto) quando hv, wi = 0.
Come
vedremo in seguito, non tutte le norme sono definite a partire da un prodotto scalare. Si veda in proposito anche il Capitolo VII, il riquadro a pagina 334.
Esattamente
come è stato fatto nella Proposizione (III.18) a pagina 110.
180
Matrici e operatori lineari
(IV.41) Se k vettori v1 , v2 , . . ., vk non nulli di V sono ortogonali, allora sono linearmente indipendenti. Dimostrazione. È analoga a quella illustrata nell’Esercizio (III.20) a pagina 156 per tre vettori. Lasciamo al Lettore i dettagli.
(IV.42) (Teorema di Pitagora) Se v e w sono due vettori ortogonali, allora kv + wk2 = kvk2 + kwk2 . Dimostrazione. Se hv, wi = 0, si ha kv + wk2 = hv + w, v + wi = hv, vi + hv, wi + hw, vi + hw, wi = kvk2 + kwk2 .
L’aggettivo “ortogonale” si usa anche rispetto alle basi e alle matrici. (IV.43) Definizione. Diciamo che una base è ortogonale se consiste di vettori tutti ortogonali tra di loro. Diciamo che è ortonormale se è ortogonale, e in più tutti i vettori sono unitari. Diciamo che una matrice è ortogonale se le sue colonne costituiscono una base ortogonale (cioè sono tutte ortogonali tra di loro) e sono vettori unitari. La Definizione (III.50) di proiezione ortogonale su una retta o un piano può essere data anche per sottospazi vettoriali. Diciamo che un vettore v è ortogonale ad un sottospazio W di V se per ogni w ∈ W i due vettori v e w sono ortogonali, cioè se
Cioè hanno norma uno (si dice anche che sono dei versori ). In altre parole, una matrice è ortogonale se e solo se i suoi i vettori colonna costituiscono una base ortonormale.
per ogni w ∈ W, hv, wi = 0. Osserviamo che se W è generato da k vettori e1 , e2 , . . . , ek , allora un vettore v è ortogonale a W se e solo se è ortogonale a tutti i k vettori ei . (IV.44) Definizione. Se W ⊂ V è un sottospazio vettoriale di V, allora la proiezione ortogonale di un vettore v ∈ V su W, indicata con projW v, è quell’unico vettore v¯ ∈ W tale che v − v¯ è ortogonale a W. Perché questa definizione sia ben posta, occorre però dimostrare che il vettore v¯ = projW v esiste ed è unico. Cominciamo a mostrare che se il sottospazio W ha una base ortogonale, allora il vettore v, ¯ proiezione di v su W, esiste davvero.
Infatti, se w ∈ W e hv, ei i = 0 per tutti gli i, si ha
w = c1 e1 + c2 e2 + . . . + ck ek hv, wi = hv, c1 e1 + c2 e2 + . . . + ck ek i
= c1 hv, e1 i+c2 hv, e2 i+. . .+ck hv, ek i = 0.
Ricordiamo
come con l’equazione (14) a pagina 112 abbiamo definito la proiezione di un vettore su un altro vettore (meglio: sulla retta da lui generata). Si veda l’Esercizio (III.14) a pagina 151.
§ 3. Prodotto scalare e isometrie
181
(IV.45) Teorema. Se e1 , e2 , . . . , ek sono k vettori ortogonali di uno spazio vettoriale V, e v ∈ V, allora esiste una unica proiezione di v sul sottospazio W = Span(e1 , e2 , . . . , ek ), che è uguale a (8)
projW (v) =
k X
c i ei =
i=1
k X hv, e i i
i=1
kei k2
ei .
La proiezione quindi è una funzione projW : V → W ⊂ V. Non è difficile mostrare che è una funzione lineare (si veda l’Esercizio 26 a pagina 222).
Il vettore v¯ = projW (v) è quello che minimizza la distanza tra v e W, cioè per ogni w ∈ W kv − wk ≥ kv − vk, ¯ e vale l’uguaglianza solo se w = v. ¯
Dimostrazione. Gli elementi di W sono le combinazioni lineari w = c1 e1 + c2 e2 + . . . + ck ek , con ci ∈ R per ogni i. Occorre determinare, se esistono, i valori della k-upla (c1 , c2 , . . . , ck ) per cui il corrispondente w soddisfi l’equazione hv − w, ei i = 0
⇐⇒
hv, ei i = hw, ei i
per ogni i = 1, . . . , k. Ma hw, ei i = hc1 e1 + c2 e2 + . . . + ck ek , ei i
= c1 he1 , ei i + c2 he2 , ei i + . . . + ck hek , ei i = ci hei , ei i = ci kei k2 ,
e quindi l’unica soluzione è quella per cui i coefficienti ci sono definiti da hv, ei i = ci kei k2
=⇒
ci =
hv, ei i . kei k2
Non resta che mostrare che il vettore v¯ = projW (v) realizza la distanza minima tra v e W, cioè che se w ¯ ∈ W è un vettore diverso da v¯ (e quindi con kv¯ − wk ¯ > 0), allora la distanza tra w ¯ e v è strettamente maggiore di quella tra v¯ e v. Ma v−w ¯ = (v − v) ¯ + (v¯ − w), ¯ dove v − v¯ è ortogonale a W (per definizione) e v¯ − w ¯ è un vettore di W (perché somma di due vettori in W). Ma allora per la Proposizione (IV.42) kv − wk ¯ = kv − vk ¯ 2 + kv¯ − wk ¯ 2 > kv − vk ¯ 2. Quod erat demonstrandum.
Cosa succede se si calcola la proiezione su un sottospazio W di un vettore v che già appartiene a W?
[Est difficillimum se ipsum vincere]
F IV.4: David Hilbert (1862– 1943), figura di spicco della matematica a cavallo tra l’Ottocento e il Novecento.
182
Matrici e operatori lineari
(IV.46) Corollario. Se, nelle ipotesi del Teorema (IV.45), il vettore v appartiene già a W = Span(e1 , e2 , . . . , ek ), allora projW (v) = v, e i coeffihv, ei i cienti ci = sono le componenti di v nella base e1 , e2 , . . . , ek di W. kei k2 Se inoltre kei k = 1 per ogni i (cioè se e1 , e2 , . . . , ek è una base ortonormale per W), allora v=
k X hv, ei iei i=1
e kvk2 =
k X i=1
c2i =
k X i=1
(hv, ei i)2 .
Dimostrazione. Se v ∈ W, allora se v¯ ∈ W è un vettore tale che v − v¯ è ortogonale a W (cioè ortogonale a tutti i vettori di W), allora v − v¯ dovrebbe essere ortogonale anche a sé stesso, cioè avere norma zero. Ma questo è possibile solo se v = v, ¯ cioè v ∈ W =⇒ projW (v) = v. Possiamo comunque applicare il Teorema (IV.45), ed ottenere projW (v) = v =
k X hv, ei i ei . kei k2 i=1
Se aggiungiamo l’ipotesi che e1 , e2 , . . . , ek è una base ortonormale per W, e poniamo ci = hv, ei i, si ha *X + X k k k k X X 2 kvk = ci ei , cjej = ci c j hei , e j i = c2i . i=1
j=1
i,j=1
i=1
Quando si scrive un vettore v in una base di vettori ortogonali, le componenti del vettore v in questa base sono quindi proprio le proiezioni di v sugli assi, così come si fa per determinare le coordinate cartesiane di un punto di Rn .
Ortogonalizzazione di Gram–Schmidt Supponiamo di avere un insieme v1 , v2 , . . . , vk di vettori linearmente indipendenti di uno spazio vettoriale V (su cui sia definito un prodotto scalare). Dato che i vi sono linearmente indipendenti, non sono nulli e quindi kvi k > 0 per ogni i. Definiamo per ricorsione una successione u1 , u2 , . . . , uk di vettori ortogonali tra di loro nel modo seguente. Per i = 1 si pone
I
due matematici cui si fa riferimento sono Jorgen Pedersen Gram (1850–1916) e Erhard Schmidt (1876–1959), anche se l’algoritmo di ortogonalizzazione è stato certamente usato da altri prima di loro (Cauchy, Laplace).
u1 = v1 . Successivamente, per i > 1 si definisce prima la proiezione di vi sul sottospazio Span(u1 , . . . , ui−1 ) ⊂ V, che come abbiamo visto sopra si scrive v¯ i =
i−1 X hvi , u j i j=1
ku j k2
u j,
Posto che gli ui
siano ortogonali, ma questo lo vedremo subito.
§ 3. Prodotto scalare e isometrie
183
da cui definiamo finalmente il vettore ui ui = vi − v¯ i = vi −
i−1 X hvi , u j i j=1
ku j k2
u j.
Per definizione di proiezione ortogonale, ui risulta ortogonale a u j per j = 1, . . . , i − 1, dato che è ortogonale a Span(u1 , . . . , ui−1 ). Segue che con questa costruzione tutti gli u j sono ortogonali tra di loro. Si ottiene quindi un sistema triangolare del tipo u1 = v1 hv2 , u1 i u1 ku1 k2 hv3 , u2 i hv3 , u1 i u1 − u2 u3 = v3 − 2 ku1 k ku2 k2 .. . hvk , u2 i hvk , uk−1 i hvk , u1 i u1 − u2 − . . . − uk−1 . uk = vk − ku1 k2 ku2 k2 kuk−1 k2
u2 = v2 −
Si può naturalmente scrivere anche come v1 = u1 hv2 , u1 i v2 = u1 + u2 ku1 k2 hv3 , u1 i hv3 , u2 i v3 = u1 + u2 + u3 ku1 k2 ku2 k2 .. . hvk , u2 i hvk , uk−1 i hvk , u1 i u1 + u2 + . . . + uk−1 + uk vk = ku1 k2 ku2 k2 kuk−1 k2
Supponiamo che V sia lo spazio Euclideo standard Rn . Nella notazione matriciale, se chiamiamo M la matrice che ha per colonne i vettori vi , si può scrivere 1 hv2 , u1 i hv3 , u1 i · · · hvk , u1 i ku1 k2 ku1 k2 ku1 k2 hvk , u2 i hv3 , u2 i 0 · · · 1 ku2 k2 ku2 k2 M = (u1 , u2 , . . . , uk ) .. .. .. .. .. . . . . . hv , u i k k−1 0 0 · · · 1 kuk−1 k2 0 0 ··· 0 1 cioè M = PR, dove P = (u1 , u2 , . . . , uk ) è una matrice di n righe e k colonne (ortogonali), e R è una matrice k × k triangolare superiore (con tutti 1 sulla diagonale).
È possibile modificare leggermente la successione dei vettori ui ponendo u qi = i kui k
per ogni i: in questo modo i vettori qi hanno norma uno e sono ortogonali. La corrispondente decomposizione della matrice M che si ottiene è nota come la decomposizione QR, in cui Q è una matrice ortogonale (cioè con colonne ortogonali e di norma 1) e R è triangolare superiore (si veda anche l’Esercizio 63 a pagina 226). Forse non tutti sanno che una matrice quadrata si dica triangolare quando ha tutti zeri sotto (superiore) o sopra (inferiore) la diagonale discendente.
184
Matrici e operatori lineari
Un corollario immediato del metodo di ortogonalizzazione è che ogni spazio vettoriale di dimensione finita ha almeno una base ortogonale . (IV.47) Se V è uno spazio vettoriale di dimensione finita n e con prodotto scalare, allora esiste una base ortonormale e1 , e2 , . . . , en di V. Dimostrazione. Se v1 , v2 , . . . , vn è una base per V, applicando il procedimento di ortogonalizzazione si ottiene una base ortogonale u1 , u2 , . . . , un tale che per ogni k = 1 . . . n Span(u1 , . . . , uk ) = Span(v1 , . . . , vk ). In particolare, per k = n si ottiene una base ortogonale per V. La base ortonormale cercata si ottiene normalizzando i vettori, cioè ponendo ei = ui /kui k in modo tale che gli ei non sono solo ortogonali tra di loro, ma anche unitari.
(IV.48) Corollario. Se W ⊂ V è un sottospazio vettoriale di dimensione finita di uno spazio vettoriale V con prodotto scalare, allora esiste la proiezione ortogonale di V su W, PW : V → W, definita come nell’equazione (8) a pagina 181. Dimostrazione. Il Teorema (IV.45) assicura che esiste la proiezione projW : V → W, a patto che W abbia una base ortogonale. Ma per la Proposizione (IV.47) ogni spazio di dimensione finita ha una base ortogonale.
Possiamo finalmente completare ed estendere la dimostrazione della Proposizione (III.49) a pagina 135. (IV.49) Corollario. Sia p un sottospazio lineare affine dello spazio euclideo cartesiano Rn (con il prodotto scalare standard) e Q un punto qualsiasi. Allora esiste unico il punto Q′ che realizza la distanza tra punto Q e p (cioè distanza(Q, p) = |Q′ − Q|), che chiamiamo ancora la proiezione ortogonale di Q su p. Dimostrazione. Il sottospazio p di Rn per definizione si scrive come p = {A + t1 v1 + t2 v2 + . . . + td vd : t1 , t2 , . . . , td ∈ R} , per un certo punto A e d vettori linearmente indipendenti. Se indichiamo con W = Span(v1 , . . . , vd ), notiamo che un punto P ∈ Rn appartiene a p se e solo se P − A ∈ W. Quindi un punto Q′ in p si scrive come Q′ = A + w′ per un certo w′ ∈ W, e il vettore Q′ − Q è ortogonale a W se e solo se A + w′ − Q è ortogonale a W, ma questo accade se e solo se projW (Q − A) = w′ . Quindi esiste la proiezione ortogonale di Q su p, che è definita da # » Q′ = A + projW (AQ).
E quindi, normalizzando, una base ortonormale.
§ 3. Prodotto scalare e isometrie
185
(IV.50) Esempio. Nello spazio vettoriale V = C(0, 2π) delle funzioni continue sull’intervallo (0, 2π), con il prodotto scalare dell’Esempio (IV.36) Z h f, 1i =
2π
f (x)1(x) dx, 0
le funzioni trigonometriche (*)
1, cos x, sin x, cos 2x, sin 2x, cos 3x, sin 3x, . . .
sono elementi (vettori) di V. Come abbiamo visto nella la Proposizione (II.27), se n , m Z hcos nx, cos mxi = hcos nx, sin mxi =
2π
cos nx cos mx dx = 0 Z
0 2π
cos nx sin mx dx = 0 Z
hsin nx, sin mxi =
Z
0
se p(x) è periodica di periodo 2π.
2π
sin nx sin mx dx = 0. 0
Z
2π 0
adesso risulta chiaro perché sono chiamate formule di ortogonalità, o relazioni di ortogonalità. Gli estremi di integrazione sono assolutamente ininfluenti, dato che Z 2π Z π p(x) dx p(x) dx = −π
0
Inoltre per ogni m ≥ 1 h1, cos mxi =
Forse
cos mx dx = 0 = h1, sin mxi =
2π
sin mx dx, 0
quindi possiamo dire che le funzioni (*) costituiscono un insieme ortogonale. Se ne calcoliamo le norme abbiamo Z
2π
2
k1k = h1, 1i =
dx = 2π. 0
Z
2π
2
kcos nxk = hcos nx, cos nxi = ksin nxk2 = hsin nx, sin nxi =
cos2 nx dx = π Z
0 2π
sin2 nx dx = π. 0
Quindi le funzioni (trigonometriche) normalizzate 1 cos nx sin nx √ , √ , √ , π π 2π
n = 1, 2, 3, . . .
sono vettori unitari di V, e costituiscono un insieme ortonormale di vet tori di V. (IV.51) Esempio (Serie di Fourier). Lo spazio delle funzioni continue C(0, 2π) dell’Esempio (IV.50) contiene i sottospazi di dimensione finita Sn = Span(1, cos x, sin x, . . . , cos nx, sin nx),
Quindi
questa norma è la stessa con cui avevamo introdotto lo scarto quadratico medio, approfondimento a pagina 63.
186
Matrici e operatori lineari
formati da tutte le combinazioni lineari delle funzioni 1, cos kx, sin kx con k ≤ n. La dimensione di Sn è 2n + 1, dato che i generatori sono linearmente indipendenti (sono ortogonali!). Per il Teorema (IV.45) esiste la proiezione di una funzione f ∈ V sul sottospazio W, cioè la proiezione projW : V → W. Risulta definita da 2n+1 X
projW ( f ) = i=1
Cioè
dai polinomi trigonometrici di grado n.
h f, ei i ei kei k2
h f, 1i h f, cos xi h f, sin xi h f, cos nxi h f, sin nxi = + cos x + sin x + . . . + cos nx + sin nx k1k2 kcos xk2 ksin xk2 kcos nxk2 ksin nxk2 a0 = + a1 cos x + b1 sin x + a2 cos 2x + b2 sin 2x + . . . + an cos nx + bn sin nx, 2
Consideriamo lo spazio V di tutti
dove si è posto ak =
h f (x), cos kxi 1 = π kcos kxk2
h f (x), sin kxi 1 bk = = 2 π ksin kxk
Z
i polinomi nella variabile reale x, con il prodotto scalare Z 1 h f, 1i = f (x)1(x) dx,
2π
f (x) cos kx dx, 0 Z 2π
−1
f (x) sin kx dx. 0
I coefficienti ci del Teorema (IV.45), che qui abbiamo chiamato ai e bi , sono quindi proprio i coefficienti di Fourier di f . Il polinomio trigonometrico f¯ di grado n sopra trovato è quindi la migliore approssimazione di f , nel senso che minimizza la distanza Z k f − f¯k =
2π
2
1, x, x2 , . . . , xn , . . . si ottiene una successione di polinomi f0 (x), f1 (x), . . . , fn (x), . . .
( f (x) − f¯(x)) dx. 2
0
come nell’Esempio (IV.36). Se si applica il procedimento di ortogonalizzazione di Gram–Schmidt alla successione di polinomi
chiamati i polinomi di Legendre (normalizzati).
§ 4. Il determinante Riconsideriamo ora le proprietà delle aree e volumi con segno (cioè della funzione determinante in dimensione 2 e dimensione 3), trattate nei § 4 e § 5 del Capitolo III. A ben vedere, tutto ruota attorno al concetto di linearità, insieme al fatto che det(a, a) = 0 (o, equivalentemente, come abbiamo visto, che det(a, b) = − det(b, a)). Infatti, possiamo riscrivere le Proprietà (A1) e (A2) nella seguente unica affermazione:
A pagina 114.
(L2) det(a, b) è lineare sia nella variabile a che nella variabile b (cioè è lineare in ogni sua variabile). Lo stesso per le Proprietà (V1) e (V2): possono essere scritte in modo più sintetico come (L3) det(a, b, c) è lineare nella variabile a, nella variabile b e nella variabile c (cioè è lineare in ogni sua variabile).
A pagina 117.
§ 4. Il determinante
187
Spazi di Hilbert Come abbiamo visto nella nota a margine della definizione (IV.15) o nell’Esempio (IV.50), gli spazi vettoriali non sempre hanno dimensione finita. Alcuni spazi infinito-dimensionali non solo hanno un prodotto scalare, ma in più godono anche di una proprietà molto importante: tutte le successioni di Cauchy ammettono un limite, cioè sono completi (si veda a pagina 343 e seguenti). Sono detti spazi di Hilbert. (IV.52) Esempio (l2 ). Sia l2 l’insieme di tutte le successioni x = {xk }∞ di numeri reali a quadrati k=1 sommabili, cioè ∞ X ∞ 2 2 . x = {xk }k=1 : xk ∈ R, xk < ∞ l = k=1
La somma e il prodotto per uno scalare sono definite per componenti, come per il caso delle n-uple. Le successioni non sono altro che n-uple con n = ∞. È possibile definire un prodotto scalare su l2 , ponendo ∞ ∞ X X hx, yi = xi yi =⇒ hx, xi = kxk2 = x2i . i,j=1
(IV.53) Esempio (L2 ). Se (a, b) ⊂ R è un intervallo, L2 (a, b) = f : (a, b) → R : h f, f i < ∞ , dove
Z b Z b h f, 1i = f (x)1(x) dx ⇒ h f, f i = k f k2 = f 2 (x) dx. a
i=1
Riscrivendo la funzione determinante come funzione non di una n-upla di vettori ma come una funzione della matrice corrispondente, si può dire " #! a b1 (L2’) La funzione det 1 è lineare nelle sue colonne. a2 b2 a1 (L3’) La funzione det a2 a3
b1 b2 b3
a
Si tratta di uno spazio di dimensione infinita, costituito da tutte le funzioni con quadrato sommabile, con prodotto scalare (e conseguente norma). In realtà questa definizione non è ben posta (una funzione non nulla può avere norma nulla), e per renderla consistente occorre prendere non funzioni, ma classi di equivalenza di funzioni, definite a meno di un insieme di misura di Lebesgue nulla. Si veda a tal proposito il riquadro a pagina 474. Le operazioni di proiezione ortogonale, distanza, e approssimazione che abbiamo visto per gli spazi euclidei Rn possono essere applicate con successo anche a questi spazi di funzioni. Entrambi gli spazi di Hilbert sopra descritti sono modelli di spazio euclideo infinito-dimensionale.
c1 c2 è lineare nelle sue colonne. c3
Le Proprietà (A3’) e (V3’) possono leggersi come (A) Se la matrice A′ è la matrice ottenuta scambiando due colonne della matrice A, allora det(A′ ) = − det(A). Cioè il determinante cambia di segno se si scambiano due colonne di A. Mostriamo che queste (che, come abbiamo visto, sono proprietà caratterizzanti per la funzione determinante) sono solo alcune delle proprietà. La forma più generale con cui consideriamo la funzione determinante è quella data dal seguente teorema.
188
Matrici e operatori lineari
(IV.54) Teorema. Per ogni n ≥ 1, esiste una unica funzione determinante det, che associa ad ogni matrice A (quadrata n × n) un numero det(A), con le proprietà: ① Il determinante det è lineare nelle colonne di A. ② Il determinante det cambia segno se si scambiano due colonne. ③ Il determinante della matrice identica è det(In ) = 1. Risulta poi che det è lineare anche nelle righe e che cambia di segno se si scambiano due righe tra loro. Prima di procedere con la dimostrazione, definiamo la trasposta di una matrice n × m. (IV.55) Definizione. Sia A una matrice n × m. La trasposta di A, indicata con tA, è la matrice m × n ottenuta scambiando le righe e le colonne di A, cioè la matrice che ha per colonne le righe di A a11 a21 A = . .. an1
a12 a22 .. . an2
a1m a11 a a2m 12 t .. =⇒ A = .. . . · · · anm a1m ··· ··· .. .
a21 a22 .. . a2m
an1 an2 .. . · · · anm
··· ··· .. .
Dimostrazione del Teorema (IV.54). Per n = 1 la proposizione è vera: dato h i h iche una matrice 1 × 1 ha soltanto un coefficiente reale a11 , basta porre det( a11 ) = a11 . Esiste una unica riga e una unica colonna (di dimensione 1), ed è semplice verificare che questa funzione è lineare. Per n = 2, sappiamo dalla Proposizione (III.21) di pagina 114 che esiste unica una funzione determinante che soddisfa le proprietà in questione: esiste una unica funzione lineare nelle colonne, che cambia di segno se si scambiano due colonne e che vale uno sulla matrice identica. Quindi, se intendiamo dimostrare che il teorema è vero per la dimensione 2, dobbiamo verificare che la funzione determinante della Proposizione (III.21) è anche lineare per righe e cambia di segno se si scambiano due righe. Ma questo è facile: per l’unicità, è necessario che sia " #! a1 b1 det = a1 b2 − a2 b1 , a2 b2 e le due proprietà che mancano sono vere, dato che " #! " #! a b1 a a2 det 1 = a1 b2 − a2 b1 = det 1 , a2 b2 b1 b2 ovvero le proprietà aggiuntive seguono da det(tA) = det(A). Bene, adesso passiamo al caso n = 3: la Proposizione (III.24) ci assicura che c’è già una funzione del genere, ed è proprio il determinante in dimensione 3,
È ovvio che se A è quadrata,
anche la trasposta tA è quadrata. La trasposta della matrice identica è ancora la matrice identica: tIn = In .
Queste mancano.
sono le proprietà che
§ 4. Il determinante
189
che abbiamo definito nell’equazione (23) in modo ricorsivo come # # " " " a1 b1 c1 b c2 a c2 a a b c2 = a1 det 2 (9) det 2 − b1 det 2 + c1 det 2 2 b3 c3 a3 c3 a3 a3 b3 c3
A pagina 120. # b2 . b3
Sappiamo però che è lineare nelle colonne e che cambia di segno se si scambiano le colonne: dobbiamo mostrare che entrambe le proprietà sono vere per le righe. Per far questo ritorniamo alla dimostrazione della Proposizione (III.24), in cui abbiamo mostrato che vale l’equazione (22), che riscriviamo con la notazione matriciale come " # " # " # a1 b1 c1 b2 c2 b1 c1 b1 c1 a b c2 = a1 det (10) det 2 − a2 det + a3 det . 2 b3 c3 b3 c3 b2 c2 a3 b3 c3 L’equazione (9) è uno sviluppo del determinante secondo la prima riga; l’equazione (10) è invece lo sviluppo del determinante secondo la prima colonna. Nella dimostrazione di (III.24) abbiamo usato lo sviluppo secondo la prima riga per definire il determinante e mostrare che ha le proprietà cercate per colonne, mentre abbiamo usato lo sviluppo secondo la prima colonna per mostrarne l’unicità. Ma lo sviluppo secondo la prima colonna di A non è altro che lo sviluppo secondo la prima riga della matrice trasposta tA, e viceversa lo sviluppo secondo la prima riga di A è lo sviluppo secondo la prima colonna della trasposta tA: dato che una funzione è lineare sulle colonne (risp. righe) di A se e solo se è lineare sulle righe (risp. colonne) della sua trasposta: possiamo ripetere il ragionamento sulla matrice tA e mostrare che det è lineare sulle righe e cambia di segno se si scambiano due righe qualsiasi. Per il caso n ≥ 4, si dovrà procedere per induzione, nello stesso modo con cui si è passati da 2 a 3. Lasceremo solo qualche indizio su come iniziare la dimostrazione, negli Esercizi 55 , 56 , tralasciando i dettagli che possono essere completati dal Lettore.
La seguente proposizione segue direttamente dal modo con cui abbiamo definito il determinante.
Abbiamo
segnalato alcuni testi di algebra lineare nei Riferimenti bibliografici in appendice.
(IV.56) (Formula di Laplace) Se A è una matrice quadrata n × n a1,1 a 2,1 A = . .. an,1
a1,2 a2,2 .. . an,2
a1,n a2,n .. , . · · · an,n ··· ··· .. .
allora il suo determinante si sviluppa nella prima colonna come a2,2 a 3,2 (11) det(A) = a1,1 det . .. an,2
a2,n a1,2 a a3,n 3,2 . − a det .. 2,1 . . . · · · an,n an,2
··· ··· .. .
a1,n a1,2 a a3,n 2,2 n+1 . + . . . + (−1) a det .. n,1 . . . · · · an,n an−1,2 ··· ··· .. .
··· ··· .. .
a1,n a2,n .. .
· · · an−1,n
.
190
Matrici e operatori lineari
Possiamo scrivere l’equazione (11) anche come segue (sostituendo al simbolo “det” due barre verticali che racchiudono i coefficienti della matrice: questa notazione è molto comoda, specie per gli esercizi; inoltre scriviamo esplicitamente i coefficienti che abbiamo ignorato nel prendere i minori): det(A) = a1,1
a11 a1,2 a21 a2,2 .. .. − a2,1 .. .. . . . . an,1 an,2 · · · an,n
a11 a1,2 · · · a1,n a21 a2,2 · · · a2,n .. .
.. .
an,1 an,2
a1,2 a11 . .. .. n−1 . + . . . + (−1) a n,1 . .. a a n−1,1 n−1,2 . .. an,1 an,2 · · · an,n · · · a1,n · · · a2,n
(IV.57) Corollario. Il determinante della trasposta di A è uguale al determinante di A: det(tA) = det(A). Dimostrazione. È una conseguenza diretta del Teorema (IV.54), nella parte dell’unicità: entrambe sono funzioni lineari nelle righe e colonne, cambiano di segno se si scambiano righe o colonne, e valgono 1 sulla matrice identica In . Dato che può esistere una unica funzione con queste proprietà, det(tA) e det(A) devono essere uguali.
Vediamo ora una semplice proprietà della trasposta di una matrice, che ci tornerà utile in seguito. (IV.58) La trasposta del prodotto di due matrici A e B è uguale al prodotto delle trasposte nell’ordine inverso t
(AB) = tBtA.
Dimostrazione. Se ai j indicano i coefficienti di A, b jk i coefficienti di B, e a¯ ji = ai j e b¯ kj = b jk i coefficienti delle trasposte di A e B, allora il coefficiente (i, k) del prodotto AB è m X
ai j b jk ,
j=1
che quindi è uguale al coefficiente (k, i) di t(AB). Ma questo è uguale al coefficiente (k, i) del prodotto tBtA, che è m X j=1
b¯ kj a¯ ji =
m X
b jk ai j .
j=1
Il Teorema che segue è la generalizzazione a dimensione arbitraria dei Teoremi (III.23) e (III.29) del Capitolo III.
a1,n .. .. . . . · · · an−1,n · · · an,n ···
§ 4. Il determinante
191
(IV.59) Teorema. Sia A una matrice quadrata n × n. Allora le seguenti affermazioni sono equivalenti: ① Le colonne di A sono linearmente indipendenti, cioè non esiste un vettore x , 0, x ∈ Rn tale che Ax = 0.
Le negazioni delle quattro affermazioni (che a loro volta saranno equivalenti) sono: ① Esiste x , 0 tale che Ax = 0 (cioè le colonne di A sono linearmente dipendenti). ② det(A) = 0.
② det(A) , 0 ③ Per ogni c ∈ Rn il sistema di n equazioni in n incognite
③ Esiste c ∈ Rn per cui il sistema di equazioni Ax = c ammette più di una soluzione oppure nessuna soluzione. ④ Le colonne di A sono linearmente dipendenti.
Ax = c ha una e una sola soluzione. ④ Le righe di A sono linearmente indipendenti. j Dimostrazione. Cominciamo a dimostrare per induzione, così come abbiamo dimostrato il Teorema (III.29) a partire dal Teorema (III.23), che ① ⇐⇒ ② ⇐⇒ ③. Supponiamo quindi che questa equivalenza valga per n − 1, e mostriamo che vale per n. Eliminando una variabile dal sistema di n equazioni in n incognite Ax = 0, otteniamo un sistema di n − 1 equazioni in n − 1 incognite con matrice che ha ancora determinante zero, se det A = 0, e che quindi ha soluzioni non nulle (① =⇒ ②). Per mostrare ② =⇒ ③, osserviamo che, se eliminiamo una variabile come sopra, il sistema di n − 1 equazioni in n − 1 incognite ha matrice dei coefficienti con determinante diverso da zero, e quindi ha sempre una e una sola soluzione (per induzione), da cui possiamo sostituire all’indietro e trovare la soluzione cercata. Per mostrare ③ =⇒ ①, basta osservare che se per ogni c ∈ Rn il sistema ha una e una sola soluzione, allora in particolare per x = 0 c’è una e una sola soluzione di Ax = 0. Dato che x = 0 è una soluzione, non possono essercene altre cioè le colonne di A sono linearmente indipendenti. Ora, la dimostrazione è completata semplicemente notando che det(tA) = det(A).
(IV.60) Corollario (Formula di Binet). Il determinante del prodotto di due matrici quadrate A e B è uguale al prodotto dei loro determinanti: det(AB) = det(A) det(B). Dimostrazione. Deduciamo questa proprietà dall’unicità della funzione determinante e dalla definizione di prodotto di matrici. Supponiamo per prima cosa det(A) , 0. Allora possiamo scrivere la funzione di B f (B) =
det(AB) , det(A)
o anche f (b1 , b2 , . . . , bn ) =
det(Ab1 , Ab2 , . . . , Abn ) , det(A)
Descriviamo la dimostrazione per sommi capi, lasciando al Lettore di riempire i dettagli mancanti.
Perciò det(AB) = det(BA) anche se AB , BA.
192
Matrici e operatori lineari
se vogliamo insistere sulla struttura in colonne di B. È facile vedere che f è lineare nelle sue variabili bi e che cambia di segno se ne scambiano due. Non resta che vedere quanto vale sulla matrice identica In : f (In ) =
det(AIn ) det(A) = = 1, det(A) det(A)
dato che AIn = A. Per l’unicità, deve quindi essere f (B) = det(B) =⇒
det(AB) = det(B) =⇒ det(AB) = det(A) det(B). det(A)
Se invece det(A) = 0, l’affermazione è vera se riusciamo a mostrare che det(AB) = 0. Ora, per il Teorema (IV.59), det(A) = 0 se e soltanto se le sue righe sono linearmente dipendenti, cioè se esiste x , 0 tale che t
Ax = 0.
Analogamente, det(AB) = 0 se e solo se le sue righe sono linearmente indipendenti, cioè se esiste y , 0 tale che t
(AB)y = 0.
Ma per (IV.58), t(AB) = tBtA, e dunque basta porre y = x per ottenere t
(AB)x = (tBtA)x = tB(tAx) = tB0 = 0.
Ricordiamo
Aggiungiamo una affermazione al Teorema (IV.59). (IV.61) (Inversa di una matrice) Esiste la matrice inversa A−1 della matrice A se e soltanto se det(A) , 0.
che l’inversa di una matrice A è una matrice A−1 che soddisfa l’equazione (7), cioè tale che A−1 A = AA−1 = I.
Dimostrazione. Supponiamo che esista l’inversa A−1 : allora AA−1 = I =⇒ det(AA−1 ) = det(A) det(A−1 ) = det(I) = 1, e quindi né det(A) né det(A−1 ) possono essere zero, da cui det(A) , 0. Viceversa, se det(A) , 0, per il Teorema (IV.59) per ogni c ∈ Rn l’equazione (*)
Ax = c
ha una e una sola soluzione. Siano e1 , e2 , . . . , en i vettori della base standard di Rn . Allora per ogni i = 1, . . . , n esiste una e una sola soluzione x dell’equazione (*) con c = ei , e quindi sono univocamente determinati n vettori b1 , b2 , . . . , bn tali che per ogni i, Abi = ei , da cui se B è la matrice con colonne bi si deduce AB = A(b1 , b2 , . . . , bn ) = (Ab1 , Ab2 , . . . , Abn ) = (e1 , e2 , . . . , en ) = I, cioè AB = I. Analogamente, det(tA) , 0 e quindi esiste una matrice B′ tale che AB′ = I =⇒ tB′ A = I. Moltiplicando da destra per B si ha
t
t ′
B A = I =⇒ B = IB = (tB′ A)B = tB′ (AB) = tB′ I = tB′ ,
cioè B = tB′ e non solo AB = I, ma anche BA = I, cioè B è l’inversa di A.
Ci sono molti metodi di calcolare
l’inversa di una matrice: risolvere il sistema (*) nei c = ei con eliminazione di Gauss, usare le formule di Laplace per determinare una formula ricorsiva per l’inversa, oppure usare una generalizzazione del metodo che abbiamo usato nella dimostrazione del Teorema (III.29), chiamato metodo di Cramer . Per dimostrare che l’inversa A−1 esiste non abbiamo però bisogno di costruirla esplicitamente. Si veda anche l’Esercizio (IV.3) a pagina 212.
§ 4. Il determinante
193
Terminiamo questa sezione con una significativa estensione del Teorema (IV.59). Occorre prima definire il rango di una matrice e le sottomatrici quadrate di una matrice. Cominciamo con le sottomatrici quadrate di una matrice: se A è una matrice n × m e si scelgono s indici i1 , i2 , . . . , is e s indici j1 , j2 , . . . , js con 1 ≤ i1 < i2 < . . . < is ≤ n,
1 ≤ j1 < j2 < . . . < js ≤ m.
Ricordate
le sottosuccessioni? È la stessa cosa! Se le matrici sono successioni doppie ai,j , una sottomatrice è una sottosuccessione di questa sottosuccessione doppia. . . (qui 0 < s ≤ min(n, m)).
La sottomatrice quadrata di A corrispondente a questa scelta è la matrice s×s ai1 , j1 ai1 , j2 · · · ai1 , js a i2 , j1 ai2 , j2 · · · ai2 , js . .. .. . .. . . . . . ais , j1 ais , j2 · · · ais , js (IV.62) Esempio. La sottomatrice corrispondente agli indici (i1 , i2 ) = (2, 3) e ( j1 , j2 ) = (1, 3) della matrice indicata nel diagramma è 12 __ 4 5 7 8 __
" 3 __ 4 6 =⇒ 7 9 __
# 6 . 9
(IV.63) Definizione. Sia A = (a1 , a2 , . . . , am ) una matrice n × m. Il rango (per colonne) di A è la dimensione dello spazio generato dalle sue colonne Rango(A) = dim Span(a1 , a2 , . . . , am ) , che come abbiamo visto nella Proposizione (IV.18) è il massimo numero di colonne ai linearmente indipendenti. (IV.64) Teorema. Sia A una matrice n × m. Allora le seguenti affermazioni sono equivalenti: ① (rango per colonne) Rango(A) = r. ② (rango per righe) Rango(tA) = r. ③ (sottomatrici orlate — Kronecker) Esiste almeno una sottomatrice r× r di A con determinante diverso da zero, ma tutte le sottomatrici quadrate di dimensione r + 1 che la estendono hanno determinante zero. ④ (nullità più rango) Il nucleo di A ha dimensione m − r, cioè dim(Nucleo(A)) + r = m.
Il rango è anche la dimensione dell’immagine della funzione lineare A : Rm → Rn associata alla matrice A.
Vedremo tra pochissimo che Rango(A) = Rango(tA), cioè che il rango per colonne è uguale al rango per righe.
194
Matrici e operatori lineari
j Dimostrazione. Cominciamo con l’osservazione, molto facile da dimostrare, che il rango di una matrice non cambia se si permutano le sue colonne né se si permutano le sue righe. Allora possiamo sempre permutare righe e colonne di A e metterla nella seguente forma, (12)
_ _ _ _ _ _ a1,1 a1,2 · · · a2,1 a2,2 · · · . .. .. . .. . ar,1 ar,2 · · · _ _ _ _ _ _
ar+1,1 ar+1,2 .. .
.. .
an,1
an,2
_ _
a1,c a1,c+1 a2,c a2,c+1 .. .. . . ar,c ar,c+1 _ _ · · · ar+1,c ar+1,c+1
··· ···
..
..
. ···
.. .
.. .
an,c
an,c+1
a1,m a2,m
.. . . · · · ar,m · · · ar+1,m ..
. ···
.. .
an,m
in cui le prime c colonne sono indipendenti mentre le successive m − c sono combinazioni lineari delle prime c, e le prime r righe sono indipendenti, mentre le successive n−r sono combinazioni lineari delle prime r. Ora, sia Aˆ la sottomatrice di A delimitata dal tratteggio nella (12). Allora le sue colonne
Dato
che lo Span non dipende dall’ordine con cui sono presi i vettori Inoltre permutare due componenti xi e x j dei vettori colonna corrisponde semplicemente ad una permutazione dei vettori della base canonica.
Quindi c è il rango per colonne, r è il rango per righe.
aˆ 1 , aˆ 2 , . . . , aˆ c (formate da vettori di dimensione r) non possono essere linearmente dipendenti: infatti, se esistessero x1 , x2 , . . . , xc non tutti nulli tali che a1,1 a1,2 a1,c a a a 2,1 2,2 2,c (13) x1 . + x2 . + . . . + xc . = 0, .. .. .. ar,1 ar,2 ar,c
Questo è un sistema di r equazioni in c incognite.
allora anche le prime c colonne ai di A soddisferebbero l’equazione a1,1 a1,2 a1,c a a a 2,1 2,2 2,c . . . . . . . . . (14) x1 ar,1 + x2 ar,2 + . . . + xc ar,c = 0 a a a r+1,1 r+1,2 r+1,c .. .. .. . . . an,1 an,2 an,c visto che le ultime n − r equazioni dipendono linearmente dalle prime r per ipotesi. Ma c vettori di Rr possono essere linearmente indipendenti solo quando c ≤ r. Ragionando allo stesso modo sulla trasposta della matrice A si può concludere che r ≤ c, e quindi in definitiva che r e c sono uguali. Ma c è per definizione il rango di A e r il rango della sua trasposta: abbiamo appena dimostrato l’equivalenza ① ⇐⇒ ②, cioè che Rango(A) = Rango(tA). Da questo segue un fatto che tra breve ci tornerà utile, di cui lasciamo la dimostrazione per esercizio:
Questo è un sistema di n equazioni in c incognite.
In altre parole, il sistema di equa-
zioni (14) è equivalente al sistema (13), dato che è ottenuto aggiungendo combinazioni lineari delle prime r equazioni.
§ 4. Il determinante
195
il rango di qualsiasi sottomatrice di A non può essere maggiore del rango di A. Torniamo alla matrice nella forma (12), in cui possiamo essere certi che c = r, cioè che la sottomatrice Aˆ è sempre quadrata. Non solo: dal momento che Aˆ ha ˆ , 0. Inoltre ogni volta che la colonne (righe) linearmente indipendenti, det(A) orliamo, cioè ogni volta che le aggiungiamo una riga e una colonna, e definiamo ˆ non possiamo far altro una sottomatrice quadrata di ordine r + 1 che contiene A, che ottenere matrici con determinante zero. Se così non fosse, esisterebbe una sottomatrice (r + 1) × (r + 1) di A con determinante diverso da zero, quindi con r + 1 righe e r + 1 colonne indipendenti, il cui rango sarebbe perciò r + 1. Ma il rango di qualsiasi sottomatrice di A, abbiamo detto poco fa, non può superare r. Abbiamo perciò concluso la dimostrazione dell’implicazione ① =⇒ ③. Ora, supponiamo invece vera ③, cioè di aver trovato una sottomatrice p × p, ˆ con determinante diverso da zero e tale che tutte sue le orlate che chiameremo B, di dimensione p + 1 in A abbiano determinante zero. È possibile che p non sia il rango? Il rango di Bˆ è p, visto che ha determinante diverso da zero, e quindi deve essere p ≤ r. A meno di permutare righe e colonne di A, la sottomatrice Bˆ è quella tratteggiata nel seguente diagramma. (15)
_ _ _ _ _ _ _ _ a1,1 a2,1
a1,2 a2,2
. . .
.. .
.. .
.. .
an,1
an,2
a1,p a2,p
··· ···
a1,p+1 a2,p+1
··· ···
a1,m a2,m
..
.. .
.. .. .. .. . . . . . ap,1 ap,2 · · · ap,p ap,p+1 · · · ap,m _ _ _ _ _ _ _ _ ap+1,1 ap+1,2 · · · ap+1,p ap+1,p+1 · · · ap+1,m ..
..
. ···
.. .
.. .
an,p
an,p+1
. ···
an,m
Dato che le p colonne di Bˆ sono linearmente indipendenti, anche le prime p colonne di A devono essere linearmente indipendenti. La condizione sui determinanti implica che la (p + 1)-esima colonna di A, punteggiata in figura, è dipendente dalle prime p: infatti, visto che le p colonne di Bˆ sono una base per Rp , esistono unici i p coefficienti x1 , x2 , . . . , xp tali che a1,p a1,p+1 a1,2 a1,1 a a a a 2,p 2,p+1 2,2 2,1 (16) x1 . + x2 . + . . . + xp . = . . .. .. .. .. ap,p+1 ap,p ap,2 ap,1 Ora consideriamo, per j ≥ p + 1, la matrice orlata con la j-esima riga e la (p + 1)-esima colonna, _ _ a1,1 a 2,1 . . . _ap,1_ a j,1
_ _ _ _ _
a1,2 · · · a1,p a2,2 · · · a2,p .. .
..
a1,p+1
.. .
a2,p+1 .. .
. ap,2 · · · ap,p ap,p+1 _ _ _ _ _ a j,2 · · · a j,p a j,p+1
Esercizio
47 a pagina 224.
Per l’osservazione fatta poco fa.
196
Matrici e operatori lineari
la cui ultima riga è combinazione lineare delle prime p per ipotesi. Ma allora la medesima combinazione lineare delle p equazioni del sistema (16), si scrive x1 a j,1 + x2 a j,2 + . . . + xp a j,p = a j,p+1 . Questo vale per tutti i j, quindi la (p + 1)-esima colonna è davvero combinazione lineare delle prime p. Se ripetiamo questo ragionamento per tutte le altre colonne, concludiamo che il rango di A non può superare p, e quindi che p = Rango(A), cioè ③ =⇒ ①. Per concludere la dimostrazione non ci resta che mostrare ② ⇐⇒ ④, cioè che il rango di A più la nullità di A è uguale al numero di colonne di A. Ricordiamo che per risolvere il sistema Ax = 0 di n equazioni in m incognite xi con il metodo di eliminazione delle variabili operiamo trasformazioni elementari del sistema . Quando eliminiamo una variabile, passiamo da un sistema di n equazioni in m incognite ad un sistema di n − 1 equazioni in m − 1 incognite, lasciando invariata la nullità, visto che l’insieme delle soluzioni, cioè il nucleo di A, non cambia. Dal punto di vista delle matrici, si passa dalla matrice n × m A ˆ Cosa succede del rango? È ad una matrice (n − 1) × (m − 1), che chiamiamo A. fondamentale capire che il suo rango diminuisce di uno. Infatti, supponiamo di voler eliminare x1 utilizzando la prima equazione. Allora sommando alle altre righe opportuni multipli della prima equazione, si elimina x1 da tutte le equazioni tranne la prima. Lo Span delle righe non cambia quando ad una riga si somma la combinazione di altre righe, e quindi il rango di A non cambia. Ci si trova ad un certo punto ad avere la matrice A della forma
1 0 .. . 0
a
_ 1,2_ a2,2 . .. an,2 _ _
· · · a1,m _ _ _ · · · a2,m .. , .. . . · · · an,m
_ _ _
mentre la matrice Aˆ del sistema dopo l’eliminazione di x1 è la sottomatrice tratteggiata. La prima riga è sempre linearmente indipendente dalle altre n − 1; tra queste n − 1, è facile vedere che il massimo numero di linearmente indipendenti ˆ e quindi è uguale al massimo numero di righe indipendenti della sottomatrice A, ˆ + 1 = Rango(A). Rango(A) Cioè ad ogni eliminazione si diminuisce di uno il numero di variabili e di uno il rango: la differenza m − Rango quindi rimane costante. Il procedimento termina quando non ci sono più variabili da eliminare, cioè quando si rimane con nessuna equazione nelle d variabili rimaste. È chiaro quindi che il numero d è proprio la dimensione del nucleo di A, che può essere parametrizzato con queste ultime d variabili. In questo caso (terminale) la differenza tra il numero di variabili (d) e rango della matrice (0, visto che non ci sono equazioni) è uguale a d. Ma nemmeno d cambia ad ogni passo dell’eliminazione, e quindi dim(Nucleo(A)) = m − Rango(A).
Le
trasformazioni elementari sono le seguenti: permutare le equazioni, sommare ad una equazione una opportuna combinazione lineare delle altre equazioni e quando capita cancelare le equazioni del tipo 0 = 0.
§ 5. Forme quadratiche
197
(IV.65) Corollario (Teorema di Rouché–Capelli). Il sistema di n equazioni in m incognite Ax = b ha soluzioni se e soltanto se il rango di A e il rango della matrice A|b ottenuta aggiungendo la colonna b ad A coincidono: Rango(A) = Rango(A|b).
La matrice A|b è detta anche matrice aumentata o matrice completa.
In questo caso, lo spazio di tutte le soluzioni ha dimensione uguale a quella del nucleo di A, che è uguale a m − Rango(A). Dimostrazione. Sappiamo che Ax = b ha soluzioni se e soltanto se b è combinazione lineare dei vettori colonna (a1 , a2 , . . . , am ) di A, cioè se e solo se b ∈ Span(a1 , a2 , . . . , am ). Ma b ∈ Span(a1 , a2 , . . . , am )
⇐⇒ Span(a1 , a2 , . . . , am ) = Span(a1 , a2 , . . . , am , b),
⇐⇒ dim Span(a1 , a2 , . . . , am ) = dim Span(a1 , a2 , . . . , am , b) ⇐⇒ Rango(A) = Rango(A|b).
Ora, se x¯ è una qualsiasi soluzione del sistema di equazioni Ax = b, allora con il cambio di variabili x = y + x¯ il sistema diventa A(y + x) ¯ =b
⇐⇒
Ay + Ax¯ = b
⇐⇒
Ay = 0.
L’insieme delle soluzioni di Ax = b è perciò parametrizzato dalle soluzioni y dell’equazione omogenea Ay = 0, che costituiscono uno spazio vettoriale di dimensione dim Nucleo(A) = m − Rango(A).
§ 5. Forme quadratiche (IV.66) Definizione. Una forma quadratica q(x) definita sui vettori x = (x1 , x2 , . . . , xn ) di Rn è un polinomio omogeneo di secondo grado nelle variabili xi . Osserviamo che se indichiamo con aii il coefficiente di x2i in q(x) e con ai j = a ji la metà del coefficiente di xi x j , si ha X (17) q(x) = ai j xi x j = txAx, i, j
dove A è la matrice degli ai j , x è il vettore colonna con componenti xi e A la matrice (simmetrica) con componenti ai j , che è detta matrice associata alla forma quadratica q. Infatti, nella somma (17) i termini x2i hanno coefficiente aii come voluto, mentre i termini xi x j compaiono sia come ai j xi x j che come a ji x j xi = ai j xi x j . Dunque se i , j il coefficiente di xi x j nella somma (17) è a ji + ai j = 2ai j .
È
curioso che questo teorema, o la sua prima parte, è attribuito a matematici diversi, nelle diverse parti del mondo. Pare un esercizio di analisi combinatoria. In Italia è noto come il Teorema di Rouché–Capelli. Nei paesi di lingua spagnola, è il Teorema di Rouché–Frobenius. Per alcuni paesi dell’Est europa è il Teorema di Kronecker–Capelli. In alcuni testi di lingua frances è il Teorema di Rouché–Fontené. Naturalmente poi ci sono tutte le varianti e combinazioni: Rouché– Frobenius–Kronecker–Capelli, Kronecker–Rouché–Capelli, . . .
Il termine forma è molto usato in matematica (nei primi capitoli è stato usato 41 volte, e verrà usato 86 volte in questo capitolo). In tutto il volume compare 215 volte. Ma cosa è in generale una forma? Cosa significa? Forma lineare, forma bilineare, forma quadratica, forma differenziale sono solo alcuni dei molti modi di incontrare il termine. Termini derivati e composti sono: «formaggio» (principale sostentamento di molti matematici, insieme al pane), «formola» (anche nella versione un po’ sciapa moderna di «formula», sostentamento intellettuale del matematico, insieme al formaggio), «formosa», «uniforme», «trasformare», «conforme», . . . Purtroppo le origini di questo uso, così come le origini del formaggio e delle formole, sono a noi del tutto ignote.
198
Matrici e operatori lineari
(IV.67) Esempio. Se n = 1, la generica forma quadratica sarà del tipo q(x1 ) = ax21 , con a ∈ R. Per n = 2, ci saranno tre coefficienti a, b e c tali che " # i a b/2 x1 h 2 2 x x q(x) = q(x1 , x2 ) = ax1 + bx2 + cx1 x2 = 1 2 x2 . b/2c
Utilizzando
Per n = 3, il generico polinomio omogeneo di grado due è somma di 6 monomi, e può essere scritto come
Cioè
q(x) = q(x1 , x2 , x3 ) = ax21 + bx22 + cx23 + dx1 x2 + ex1 x3 + f x2 x3 .
④ q4 = x2 + 2y2 − 2xy + z2 .
Ricordiamo però che è sempre possibile scegliere in Rn altri sistemi di coordinate (si veda a pagina 176): basta scegliere una matrice S invertibile e definire le coordinate x = Sxˆ ⇐⇒ xˆ = S−1 x . Una qualsiasi forma quadratica q nelle variabili xi cambierà corrispondentemente in un’altra forma qˆ nelle nuove n variabili xˆ i , definita semplicemente ponendo ˆ x) q( ˆ = q(x). (IV.69) Esempio. Osserviamo come si trasformano le forme quadratiche dell’Esempio (IV.68) mediante la trasformazione xˆ 1 1 0 x yˆ 0 1 0 y = zˆ 0 0 1 z cioè xˆ = x + y ˆ=y y zˆ = z.
⇐⇒
x = xˆ − yˆ y = yˆ z = zˆ.
Nelle nuove coordinate, le forme quadratiche qi , i = 1, 2, 3, 4 si scrivono quindi come ˆ 2 + yˆ 2 + zˆ2 = xˆ2 + 2 yˆ 2 − 2xˆ yˆ + zˆ2 ; ① qˆ1 = (xˆ − y) ˆ 2 − zˆ2 = xˆ 2 + yˆ 2 − 2xˆ yˆ − zˆ2 ; ② qˆ1 = (xˆ − y)
q(x) = txAx = (Ax) · x = Ax · x.
q(x) =
(IV.68) Esempio. Le seguenti sono forme quadratiche di R3 , nelle coordinate (x, y, z). ① q1 = x2 + y2 + z2 ; ③ q3 = xy; ② q2 = x2 − z2 ;
il prodotto scalare standard, a volte scriveremo anche
h
x1 x2
a d/2 e/2 x1 i x3 d/2 b f /2 x2 . e/2 f /2 c x3
In generale, si può mostrare che ci sono n(n +1)/2 monomi di grado due in n variabili (Esercizio 49 a pagina 224), che sono anche i parametri liberi che descrivono le matrici simmetriche.
Se pensiamo
la forma quadratica scritta in forma matriciale q(x) = txAx,
con A matrice simmetrica associata ˆ x) a q, allora se x = Sxˆ la forma q( ˆ si scriverà come ˆ x) q( ˆ = t(Sx)A(S ˆ x) ˆ = txˆtSASx, ˆ con matrice associata Aˆ = tSAS. In questo caso si dirà che Aˆ è congruente a A. Si deve fare attenzione: sembra che la Aˆ sia simile a A, ma non lo è in generale. Perché Aˆ sia simile a A è necessario che Aˆ = S−1 AS, e tSAS = S−1 AS se e soltanto se S−1 = tS, cioè se e soltanto se S è una matrice ortogonale (si ricordi la Definizione (IV.43)). Infatti, i coefficienti della matrice tAA non sono altro che i prodotti scalari hai , a j i, con i, j = 1, . . . , n. La matrice è ortogonale se e soltanto se 1 se i = j hai , a j i = 0 se i , j, cioè se tAA ha 0 fuori dalla diagonale e 1 sulla diagonale, ovverosia se è la matrice identica I. Due matrici M1 e M2 possono essere simili o congruenti, e queste due relazioni sono indipendenti: M1 e M2 possono essere simili ma non congruenti, congruenti ma non simili, sia congruenti che simili o né congruenti né simili.
§ 5. Forme quadratiche
199
ˆ yˆ = xˆ yˆ − yˆ 2 ; ③ qˆ3 = (xˆ − y) ˆ 2 + 2 yˆ 2 − 2(xˆ − y) ˆ yˆ + zˆ2 = xˆ2 + 5 yˆ 2 − 4xˆ yˆ + zˆ2 . ④ qˆ4 = (xˆ − y)
Con il prossimo teorema vediamo che tutte le forme quadratiche possono essere scritte senza termini misti, in una forma che è detta diagonale. I cambi di variabili che useremo saranno scelti fra i tre seguenti (in una opportuna successione):
Vedremo
poco sotto il motivo di questo termine.
➔ Permutazione delle variabili xi (per esempio x1 = y2 , x2 = y1 , x3 = y3 ). x1 = y1 + by2 x = y2 2 ➔ Sostituire a x1 la somma y1 + by2 per un certo b: .. .. . . xn = yn x1 = x2 = x3 = ➔ Sostituire a x1 , x2 i termini y1 + y2 , y1 − y2 : . .. xn =
y1 + y2 y1 − y2 y3 .. . yn
(IV.70) Teorema (Completamento dei quadrati di Lagrange). Se q è una forma quadratica q(x) su Rn , allora con una successione di cambi di variabili dei tre tipi elencati sopra è possibile renderla diagonale , cioè trovare variabili y = (y1 , y2 , . . . , yn ) tali che (18) qˆ = c1 y21 + c2 y22 + . . . + cn y2n per certi coefficienti c1 , c2 , . . . , cn . j Dimostrazione. Procediamo ricorsivamente: mostriamo che con siffatti cambi di variabili si può scrivere ogni forma quadratica in n variabili q(x) nella forma c1 y21 + q2 (y2 , . . . , yn ), dove q2 è una forma quadratica nelle n − 1 variabili y2 , . . . , yn . Applicando n − 1 volte questa procedura otteniamo la diagonalizzazione cercata. Iniziamo considerando tutti i termini di q(x) che contengono la variabile x1 , cioè (19) q1 = a1,1 x21 + 2a1,2 x1 x2 + . . . + 2a1,n x1 xn Se operiamo il cambio di variabili ( x1 = y1 + by2 xi = yi per i ≥ 2,
Si dice anche diagonalizzare
q.
200
Matrici e operatori lineari
l’espressione (19) cambia in q1 = a1,1 (y1 + by2 )2 + 2a1,2 (y1 + by2 )y2 + . . . + 2a1,n (y1 + by2 )yn = a1,1 y21 + 2ba1,1 y1 y2 + b2 a1,1 y22 + 2a1,2 y1 y2 + 2ba1,2 y22 + . . . + 2a1,n y1 yn + 2ba1,n y2 yn i h = a1,1 y21 + 2(ba1,1 + a1,2 )y1 y2 + . . . + 2a1,n y1 yn + (b2 a1,1 + 2ba1,2 )y22 + . . . + 2ba1,n y2 yn . Se a1,1 , 0, allora ponendo b = −
a1,2 si ottiene ba1,1 +a1,2 = 0, ovvero il coefficiente a1,1
di y1 y2 si annulla e quindi h i q1 = a1,1 y21 + 2a1,3 y1 y3 + . . . + 2a1,n y1 yn + ba1,2 y22 + . . . + 2ba1,n y2 yn . .
a1,2 , alóra il coefficiente a1,1 2 di y2 diventa
Se b = −
Operando in questo modo n − 1 volte è possibile quindi far scomparire tutti i termini misti x1 xi di q(x), con i ≥ 2, e cioè trovare nuove variabili xˆ per cui
b2 a1,1 + 2ba1,2 = ba1,2 .
ˆ xˆ1 , xˆ2 , . . . , xˆn ) = a1,1 xˆ21 + q2 (xˆ2 , . . . , xˆn ), q(x) = q( dove q2 è una forma quadratica nelle rimanenti n − 1 variabili xˆ2 , xˆ3 , . . . , xˆn . Naturalmente questo a patto che a1,1 , 0. Se invece a1,1 = 0, questo cambio di variabili non funziona. Con una permutazione delle variabili possiamo però cercare un ai,i , 0, scambiare xi con x1 e procedere come sopra. Se invece per ogni i = 1, . . . , n si ha che ai,i = 0, occorre procedere in altro modo. Se a1,j = 0 per ogni j = 2 . . . n, allora x1 non compare in q(x) e quindi l’asserto è vero con c1 = 0: q = 0x21 + q2 (y2 , y3 , . . . , yn ). Se almeno uno degli a1,j è diverso da zero, allora con uno scambio tra due variabili x1 e x j possiamo supporre che sia a1,2 , 0. Poniamo x1 = y1 + y2 , x2 = y1 − y2 , e xi = yi per i ≥ 3, e la forma quadratica che nelle xi è q = 0x21 + 2a1,2 x1 x2 + 2a1,3 x1 x3 + . . . + 2a1,n−1 x1 xn−1 + 0x22 + 2a2,3 x2 x3 + . . . + 2a2,n−1 x2 xn−1 + . . . + 2a3,n−1 x3 xn−1 + 0x23 ... + 0x2n−1
2a1,n x1 xn 2a2,n x2 xn 2a3,n x3 xn ... + 2an−1,n xn−1 xn + 0x2n
+ + +
+ + + +
nelle nuove variabili yi diventa qˆ = 0 + 2a1,2 (y1 + y2 )(y1 − y2 ) + 2(y1 + y2 )(a1,3 y3 + . . . + a1,n−1 yn−1 + a1,n yn )+
+ 2(y1 − y2 )(a2,3 y3 + . . . + a2,n−1 yn−1 + a2,n xn ) + . . . + 2a3,n−1 y3 yn−1 + 2a3,n y3 yn + . . . + 2an−1,n yn−1 yn .
Con la forma quadratica in questa forma, notiamo che y21 compare con coefficiente 2a1,2 , 0, e quindi possiamo riprendere a eliminare i prodotti y1 y j esattamente come abbiamo fatto per il caso a1,1 , 0: nuovamente possiamo trovare alla fine di tutto un sistema di coordinate xˆi in cui qˆ = c1 xˆ21 + q2 (xˆ2 , . . . , xˆn ), dove q2 dipende dalle n − 1 variabili xˆ2 , . . . , xˆn .
§ 5. Forme quadratiche
201
Osserviamo che è possibile cambiare ulteriormente le coordinate e rendere l’identità (18) ancora più semplice. Permutando le variabili, possiamo sempre supporre che per certi interi p e r (con 0 ≤ p ≤ r ≤ n) si abbia ci > 0 se i = 1, . . . , p c < 0 se i = p + 1, . . . , r i ci = 0 se i = r + 1, . . . , n. Supponiamo di scrivere la forma quadratica (18) diagonale q = c1 x21 + c2 x22 + . . . + cn x2n . Se si cambiano le variabili nel modo seguente: √ ci x i se i = 1, . . . , p √ yi = −ci xi se i = p + 1, . . . , r xi sei = r + 1, . . . , n, la q diventa qˆ = y21 + y22 + . . . + y2p − y2p+1 − . . . − y2r . Nel prossimo teorema dimostreremo che questa forma è canonica, cioè che è unicamente determinata da q e che lo rappresenta fedelmente. (IV.71) Teorema (Legge di inerzia di Sylvester). Se q è una forma quadratica su Rn , allora esistono due interi p e r, con 0 ≤ p ≤ r ≤ n, ed esiste un cambio di variabili y = Bx di Rn tale che nelle nuove coordinate (20) qˆ = y21 + y22 + . . . + y2p − y2p+1 − . . . − y2r . L’intero p è detto indice di positività, r − p è detto indice di negatività e r è il rango della forma quadratica. L’indice di positività e il rango della forma quadratica q non dipendono dal sistema di riferimento di Rn . Dimostrazione. Abbiamo visto sopra che ogni forma quadratica si può scrivere come nell’equazione (20). Mostriamo quindi che se la forma quadratica è diagonalizzata in due sistemi di riferimento y e z, l’indice di positività e il rango coincidono. In altre parole, vogliamo convincerci che se z = By per una matrice B invertibile, e (21) y21 + y22 + . . . + y2p − y2p+1 − . . . − y2r = z21 + z22 + . . . + z2p′ − z2p′ +1 − . . . − z2r′ , allora p = p′ e r = r′ . Supponiamo invece che sia p > p′ . Cerchiamo un vettore di Rn le cui coordinate nelle variabili y soddisfino le n − p uguaglianze yp+1 = yp+2 = . . . = yr = . . . = yn = 0, mentre le sue coordinate nelle variabili z soddisfino z1 = z2 = . . . = zp′ = 0. Esiste? Dato che le zi sono funzioni lineari delle y j , si tratta di un sistema di (n − p) + p′ equazioni nelle n incognite yi . Ma se p′ < p
Per forma canonica si intende,
in matematica, una forma che assume un oggetto matematico, dopo opportune trasformazioni, che è univocamente determinata dall’oggetto e che rappresenta fedelmente le proprietà dell’oggetto in questione. In un certo senso una “rappresentazione standard” dell’oggetto.
Dato che entrambi non dipendono dalla base, è molto semplice vedere che il rango di una forma quadratica qui definito è uguale al rango della matrice che lo rappresenta, Definizione (IV.63), rispetto a qualunque base.
202
Matrici e operatori lineari
allora n − p + p′ < n e il sistema ha certamente almeno una soluzione y¯ , 0. Sia z¯ il vettore corrispondente z¯ = B y. ¯ Dato che y¯ p+1 = y¯ p+2 = . . . = y¯ r = . . . = y¯ n = 0, ( y¯ 1 , y¯ 2 , . . . , y¯ p ) , 0
=⇒
y¯ 21 + y¯ 22 + . . . + y¯ 2p > 0.
Inoltre per costruzione z¯21 + z¯22 + . . . + z¯2p′ = 0, e quindi per l’equazione (21) si ha 0 < y¯ 21 + y¯ 22 + . . . + y¯ 2p = y¯ 21 + y¯ 22 + . . . + y¯ 2p − y¯ 2p+1 − . . . − y¯ 2r
= z¯21 + z¯22 + . . . + z¯2p′ − z¯2p′ +1 − . . . − z¯2r′ = −¯z2p′ +1 − . . . − z¯2r′ ≤ 0.
Questo è assurdo, e quindi non può essere p′ < p. Il ragionamento può essere ripetuto paro paro scambiando i ruoli di y e z, da cui si deduce che p = p′ . Per concludere la dimostrazione, osserviamo che se q(x) è diagonale, allora q(x) e −q(x) hanno stesso rango r, mentre l’indice di positività di −q(x) è uguale all’indice di negatività r − p di q(x). Se q1 e q2 sono due diagonalizzazioni della forma q, allora −q1 e −q2 sono due diagonalizzazioni della forma −q e quindi hanno lo stesso indice di positività. Ma allora q1 e q2 hanno gli stessi indici di positività e di negatività, e di conseguenza anche lo stesso rango.
(IV.72) Definizione. Si dice che una forma quadratica q(x) è definita positiva se per ogni x , 0 si ha q(x) > 0. È definita negativa se per ogni x , 0 si ha q(x) < 0. Se invece della disuguaglianza stretta si pone q(x) ≥ 0 (risp. q(x) ≤ 0), allora q è semidefinita positiva (risp. semidefinita negativa). Altrimenti si dice indefinita. (IV.73) Nota. Se q(x) è definita positiva, allora i termini sulla diagonale sono tutti strettamente positivi (cioè aii > 0), e quindi mai nulli. Nel procedimento di diagonalizzazione usato nella dimostrazione del Teorema (IV.70) quindi bastano le permutazioni e le sostituzioni del tipo xi = yi + by j . Analogamente se q è definita negativa aii < 0 per ogni i, e se è semidefinita valgono le disuguaglianze larghe. Data una matrice A, le sue sottomatrici quadrate che non contengono le ultime righe e colonne si dicono sottomatrici principali. Esse sono # " a11 a12 a13 a11 a12 a A3 = 21 a22 a23 . . . A1 = (a11 ) A2 = a21 a22 a31 a32 a33 I loro determinanti sono detti minori principali: " # a11 a11 a12 d1 = a11 d2 = det d3 = det a21 a21 a22 a31
a12 a22 a32
a13 a23 a33
...
Un criterio per stabilire la positività di una forma, data la matrice associata, è il seguente.
Infatti, basta valutare q nel punto
(1, 0, . . . , 0) per ottenere a11 , che deve essere positivo. Lo stesso per tutti gli altri termini sulla diagonale.
Non
vale però il viceversa! Non è possibile stabilire queste proprietà conoscendo solo i termini sulla diagonale.
A
volte le sottomatrici principali sono anche dette sottomatrici nordovest.
§ 6. Autovalori e autovettori
203
(IV.74) Proposizione (Criterio di Sylvester). Una forma quadratica q su Rn è definita positiva se e soltanto se tutti i minori principali d1 , d2 , . . . , dn della matrice associata a q (cioè i determinanti delle sue sottomatrici principali) sono positivi d1 > 0, d2 > 0, d3 > 0, . . . È invece definita negativa se d1 < 0, d2 > 0, d3 < 0, . . . Dimostrazione. La dimostrazione non è particolarmente difficile, ma un po’ laboriosa. Verrà svolta dal volonteroso (e laborioso) Lettore negli Esercizi 53 e 54 a pagina 225.
j § 6. Autovalori e autovettori Nel paragrafo precedente abbiamo trovato una forma canonica per ogni forma quadratica. Il Teorema (IV.70) infatti, garantisce l’esistenza di una opportuna base di Rn nella quale la matrice corrispondente alla forma quadratica sia diagonale, cioè abbia tutti i coefficienti nulli al di fuori della diagonale principale. Allo stesso modo possiamo porci il problema di diagonalizzare una matrice; come abbiamo visto nella Definizione (IV.32), quando esiste una matrice invertibile B tale che M2 = B−1 M1 B, le due matrici M1 e M2 si dicono simili. (IV.75) Definizione. Una matrice M si dice diagonalizzabile se è simile ad una matrice diagonale, cioè se esiste una matrice invertibile B (detta diagonalizzante) per cui D = B−1 MB è una matrice diagonale. Vediamo ora cosa significa diagonalizzare una funzione lineare f da Rn a Rn , vale a dire una funzione che si può scrivere come f : x 7→ Mx per una opportuna matrice n × n. In modo equivalente, consideriamo uno spazio vettoriale V di dimensione n e f : V → V un operatore lineare. Cercheremo una base (b1 , b2 , . . . , bn ) per V (con la corrispondente parametrizzazione B : Rn → V) tale che la matrice associata a f sia una matrice diagonale D. VOO
f
B Rn
// V OO B
D
// Rn .
Come
nella Proposizione (IV.25) di pagina 174.
204
Matrici e operatori lineari
Quando V = Rn , anche B può essere rappresentato come matrice, e quindi diagonalizzare f significa trovare una matrice invertibile B (le cui colonne sono gli n vettori b1 , b2 , . . . , bn ) per cui le funzioni lineari associate alle matrici sono rappresentabili come nel seguente diagramma ROO n
M
B Rn
// Rn OO B
D
// Rn ,
cioè trovare una matrice invertibile B tale che D = B−1 MB è una matrice diagonale. Se è possibile diagonalizzare un operatore f con la scelta di una base (b1 , b2 , . . . , bn ), esso sarà detto diagonalizzabile e la base verrà detta base diagonalizzante (o, se V = Rn , che f è diagonalizzato dalla matrice B che ha per colonne i vettori della base bi ). (IV.76) Esempio. Riprendiamo l’operatore Q : R2 → R2 degli Esempi (IV.23) e (IV.33): " # " #" # x1 1 1 x1 (*) 7→ . 1 0 x2 x2 Come possiamo diagonalizzarlo? Occorre trovare una matrice invertibile S = (b1 , b2 ) tale che # " d1 0 −1 S QS = 0 d2 per certi coefficienti d1 e d2 , o equivalentemente trovare una base (b1 , b2 ) di R2 per cui l’operatore è rappresentato da una matrice diagonale D. Ma S−1 QS = D se e solo se QS = SD, cioè se e solo se (Qb1 , Qb2 ) = (Sd1 e1 , Sd2 e2 ), dove e1 = (1, 0) e e2 = (0, 1). Dato che Se1 = b1 e Se2 = b2 , dobbiamo trovare perciò due vettori indipendenti b1 e b2 che soddisfino l’equazione Qbi = di bi per i = 1, 2. Prima di proseguire con questo esempio, introduciamo un po’ di nozioni e notazioni. (IV.77) Definizione. Sia V uno spazio vettoriale e L : V → V un operatore lineare. Un vettore v ∈ V, v , 0 è detto autovettore di L se esiste uno scalare λ ∈ R per cui L(v) = λv. Lo scalare λ si dice autovalore di L relativo a v. L’insieme {λ1 , λ2 , . . .} di tutti gli autovalori di f è lo spettro di f . Nell’Esempio (IV.76), ci basta quindi trovare due autovettori linearmente indipendenti di Q. Più in generale, consideriamo una matrice
Un autovalore di L è quindi uno scalare per cui esista un autovettore di cui è l’autovalore, cioè uno scalare λ per cui esista v , 0 tale che L(v) = λv. Non è difficile dimostrare che per ogni autovettore esiste un unico autovalore: si veda l’Esercizio 32 .
§ 6. Autovalori e autovettori
diagonale n × n d11 0 D = . .. 0
0 d22 .. . 0
··· ··· .. .
0 0 .. .
· · · dnn
205
Allora tutti i vettori della base standard e1 , e2 , . . . , en sono autovettori con autovalori d11 , d22 , . . . , dnn : 0 0 d11 . d 0 . 22 De1 = . = d11 e1 , De2 = . = d22 e2 , . . . Den = . = dnn en . 0 .. .. dnn 0 0 La seguente proposizione illustra il passo chiave per comprendere il legame tra il problema della diagonalizzazione e quello degli autovettori/autovalori. (IV.78) Proposizione. Un operatore lineare L : V → V è diagonalizzabile se e soltanto se esiste in V una base b1 , b2 , . . . , bn di autovettori per L. In tal caso, gli autovalori di L sono proprio i coefficienti della matrice diagonale, che si scrive come λ1 0 . . . 0
0 λ2 .. . 0
0 0 .. . · · · λn ··· ··· .. .
Dimostrazione. Basta mostrare che una base è diagonalizzante se e solo se è formata da autovettori. Ma se l’operatore L nella base b1 , b2 , . . . , bn è diagonalizzato, allora Lbi = dii bi (cioè i bi sono autovettori rispetto agli autovalori λi = dii , i termini sulla diagonale della matrice associata), e quindi la sua matrice associata è la matrice con gli autovalori λi sulla diagonale e zero altrove. Viceversa, se gli autovettori bi costituiscono una base, questa è chiaramente diagonalizzante.
Ora riprendiamo l’Esempio (IV.76), e cerchiamo gli autovettori, cioè le soluzioni dell’equazione " ( #" # " # x1 + x2 = λx1 1 1 x1 x1 =λ ⇐⇒ 1 0 x2 x2 x1 = λx2 . Eliminiamo x1 con la seconda, e sostituendo nella prima otteniamo λx2 + x2 = λ2 x2 ⇐⇒ (λ + 1)x2 = λ2 x2 ⇐⇒ (1 + λ − λ2 )x2 = 0. Se 1 + λ − λ2 , 0 , allora l’unica soluzione è x2 = 0, da cui segue x1 = 0: niente autovettori. Se invece 1 + λ − λ2 = 0, allora si può porre x2 = 1,
Come si può vedere ad esempio nell’Esercizio (IV.5) a pagina 214, gli operatori lineari (a differenza delle forme quadratiche) non sono tutte diagonalizzabili.
206
Matrici e operatori lineari
e x1 = λ per risolvere le equazioni. Abbiamo due valori λ1 e λ2 che annullano il polinomio 1 + λ − λ2 : √ √ λ1 = (1 + 5)/2, λ2 = (1 − 5)/2. Seguono i due corrispondenti autovettori √ √ b1 = ((1 + 5)/2, 1), b2 = ((1 − 5)/2, 1). In effetti si tratta di una base diagonalizzante per Q, cioè se S = (b1 , b2 ) si ha # " λ1 0 −1 . S QS = 0 λ2 Procediamo nel generalizzare questa procedura e dimostrare alcune proposizioni. (IV.79) Se v1 , v2 , . . . , vk sono k autovettori di un operatore L corrispondenti a k autovalori distinti, allora v1 , v2 , . . . , vk sono linearmente indipendenti. Dimostrazione. Per induzione: se k = 1, un vettore è linearmente indipendente se è diverso da zero, e questo è vero dato che gli autovettori sono per definizione diversi da zero. Supponiamo quindi che k − 1 autovettori di L corrispondenti a k − 1 autovalori distinti siano sempre linearmente indipendenti. Allora se (22) c1 v1 + c2 v2 + . . . + ck vk = 0, visto che L è lineare, 0 = L(c1 v1 + c2 v2 + . . . + ck vk ) = c1 L(v1 ) + c2 L(v2 ) + . . . + ck L(vk ) = c1 λ1 v1 + c2 λ2 v2 + . . . + ck λk vk , dove λ1 , . . . , λk sono i k autovalori distinti. Moltiplicando la (22) per λk e sottraendola a quest’ultime, si ottiene c1 (λ1 − λk )v1 + c2 (λ2 − λk )v2 + . . . + ck (λk − λk )vk = 0, cioè, ponendo c′i = (λi − λk )ci , c′1 v1 + c′2 v2 + . . . + c′k−1 vk−1 = 0. Per l’ipotesi di induzione, gli autovettori v1 , v2 , . . . ,vk−1 sono linearmente indipendenti, e quindi per i = 1, . . . , k − 1 si ha c′i = 0. Ma i λi sono distinti, e quindi λi − λk , 0 per i ≤ k − 1, e quindi ci = c′i /(λi − λk ) = 0. Se tutti i ci sono zero fino a k − 1, anche ck è zero, visto che vk , 0.
(IV.80) Corollario. Un operatore lineare su Rn non può avere più di n autovalori distinti. Dimostrazione. Non ci possono essere più di n vettori linearmente indipendenti in uno spazio vettoriale di dimensione n, come è stato provato nel Lemma (IV.14).
Il
Lettore è invitato di svolgere i calcoli e verificare quanto scritto. In premio potrebbe trovare alcune interessanti relazioni con i numeri di Fibonacci e le potenze di Q, se prima riesce a dimostrare per induzione che per ogni n ≥ 1 S−1 Qn S = (S−1 QS)n .
§ 6. Autovalori e autovettori
207
(IV.81) Corollario. Se un operatore lineare su Rn ha n autovalori distinti, allora è diagonalizzabile. Dimostrazione. Se ha n autovalori distinti, allora ha n autovettori linearmente indipendenti in Rn , che costituiscono una base e quindi è diagonalizzabile.
Il prossimo teorema è alla base del metodo per determinare gli autovalori per matrici abbastanza piccole.
(IV.82) Teorema (Polinomio caratteristico). Sia L : V → V un operatore, e M la matrice associata a L rispetto ad una certa base. Allora la funzione a11 − λ a 21 pM (λ) = det(M − λI) = det . .. an1
a12 a22 − λ .. . an2
· · · ann − λ
··· ··· .. .
a1n a2n .. .
è un polinomio di n-esimo grado, detto polinomio caratteristico di M. Gli autovalori di L sono tutte e sole le radici del polinomio caratteristico pM (λ). Matrici simili hanno il medesimo polinomio caratteristico, e quindi il polinomio caratteristico dipende solo da L e non dalla base scelta. j Dimostrazione. Una parte della dimostrazione è piuttosto semplice:
Se la matrice M è triangolare (in-
feriore, superiore o addirittura diagonale) allora segue da (IV.82) che i suoi autovalori sono tutti e soli i termini mii sulla diagonale. Infatti se M è triangolare anche M−λI lo è e quindi il suo determinante è il prodotto dei binomi (mii −λ). Inoltre è possibile dimostrare (ragionando con la dovuta cautela, almeno nel caso in cui il polinomio caratteristico abbia radici complesse non reali) che il prodotto degli autovalori di M è uguale al suo determinate, mentre la loro somma è uguale alla somma degli elementi sulla diagonale (la cosiddetta traccia di M — cfr. 38 a pagina 223). Si vedano in particolare gli Esercizi 35 (pagina 223) e 37 (pagina 223).
λ è un autovalore ⇐⇒ Mv = λIv ha soluzioni non nulle
⇐⇒ (M − λI)v = 0 ha soluzioni non nulle ⇐⇒ det(M − λI) = 0
(abbiamo usato l’equivalenza ① ⇐⇒ ② nel Teorema (IV.59)). La parte difficile è lasciata per esercizio.
Diagonalizzazione mediante trasformazioni ortogonali
Una dimostrazione assistita com-
pleta di questo teorema si trova negli Esercizi 35 e 37 a pagina 223.
Alcune volte si riesce a diagonalizzare una matrice con un cambio di coordinate che non solo è invertibile, ma è anche una trasformazione ortogonale. Quando? Il Teorema che risponde a questa domanda è il seguente. (IV.83) Teorema (Spettrale). Una matrice M è diagonalizzabile mediante trasformazioni ortogonali se e soltanto se è simmetrica. In altre parole, esiste almeno una matrice ortogonale B tale che D = B−1 MB è diagonale se e solo se M è simmetrica.
Ricordiamo che stiamo sempre considerando coefficienti reali e non complessi.
208
Matrici e operatori lineari
j Dimostrazione. Cominciamo a dimostrare la parte “soltanto se”: se B−1 MB è diagonale e B è una matrice ortogonale, cioè B−1 = tB, allora t t t M = BDB−1 = BDtB = BtDtB = BDB−1 = M, e quindi M è simmetrica. Per la parte “se”, procediamo per induzione. Se n = 1, ogni matrice è diagonale, quindi non c’è nulla da provare. Supponiamo che M = (mi j ) sia simmetrica n × n, e allo stesso tempo che ogni matrice k × k con k < n e simmetrica sia diagonalizzabile con una matrice ortogonale k × k. Supponiamo per il momento che esista un autovettore b1 di M con kb1 k2 = 1 e autovalore λ1 ; dovremmo da qui costruire una matrice ortogonale B che abbia b1 come prima colonna (cioè tale che Be1 = b1 ), come abbiamo visto sopra con il procedimento di Gram–Schmidt. Allora B−1 MB ha per prima colonna λ1 e1 = (λ1 , 0, . . . , 0), dato che B−1 MBe1 = B−1 Mb1 = B−1 λ1 b1 = λ1 e1 . Non solo, dato che B−1 = tB (B è ortogonale) e M è simmetrica, anche B−1 MB è simmetrica e quindi anche la prima riga di B−1 MB è composta da λ1 te1 , cioè B−1 MB è del tipo _ _ _λ1_ _ 0_ _0 _ · ·_· _0 _ 0 a22 a23 · · · a2n 0 a32 a33 · · · a3n . . .. . . .. .. .. . . . a a · · · a 0 _ n2_ _n3 _ _ _ nn_ Ma allora per ipotesi di induzione esiste una matrice P = (pi j ) ortogonale (n − 1) × (n − 1) tale che λ2 0 · · · 0 a22 a23 · · · a1n a 0 λ3 · · · 0 32 a33 · · · a2n −1 P . .. .. .. P = .. .. .. .. .. . . . . . . . 0 0 · · · λn an2 an3 · · · ann La matrice ottenuta da P nel modo seguente __ ··· 0_ _ 1 _ 0_ _ _0 _ _ __ _ _ p1,2 · · · a2,n−1 p # 0 1,1 " t p p22 · · · p2,n−1 1 0 = 0 2,1 Pˆ = 0 P . . . . . . .. .. .. . .. p p p · · · 0 _n−1,1 _ _ n−1,2 _ _ _ _ _n−1,n−1 _ _ ha la proprietà cercata di diagonalizzare la matrice B−1 MB Pˆ −1 B−1 MBPˆ = diagonale. ˆ che è ancora La trasformazione ortogonale cercata è la composizione di B e P, ortogonale in quanto prodotto di trasformazioni ortogonali. Non rimane che mostrare che esiste un autovettore b1 : questa è una conseguenza del prossimo Lemma (IV.84). Infatti, il Teorema Fondamentale dell’Algebra ci assicura che ogni
§ 6. Autovalori e autovettori
209
polinomio, e quindi in particolare il polinomio caratteristico pM (λ), ha almeno una radice λ1 in C. Ora, se questa è in R ⊂ C, allora si tratta di λ1 , autovalore di M, cui deve corrispondere un autovettore x1 .
(IV.84) Lemma. Il polinomio caratteristico di una matrice simmetrica M ha tutte le radici reali. j Dimostrazione. La matrice M ha coefficienti reali, ma può essere utilizzata per definire un operatore Cn → Cn . Se λ è una radice in C del polinomio caratteristico della matrice simmetrica M = tM, cioè det(M − λI) = 0, allora esiste un autovettore x ∈ Cn tale che Mx = λx. Ora, questo vuol dire che le componenti di Mx sono uguali alle componenti di λx, cioè per ogni i = 1, . . . , n λxi =
n X
Si veda il riquadro
a pagina 211. per qualche breve dettaglio in più.
mi j x j .
j=1
Moltiplichiamo per il coniugato di xi e sommiamo su i: λ
n X i=1
n n X X X mi j (x j x¯i + x¯ j xi ) ∈ R. mi j x j x¯i = mii kxi k2 + kxi k2 = | {z } 1≤i<j≤n | |{z} i,j=1 {z } i=1 ∈R
Segue pertanto che λ ∈ R.
∈R
Se z = x j x¯i ∈ C, allora z + z¯ ∈ R.
∈R
(IV.85) Corollario. Se q(x) è una forma quadratica su Rn , allora q(x) può essere diagonalizzata con una trasformazione ortogonale, e i coefficienti sulla diagonale sono gli autovalori della matrice associata a q. Dimostrazione. Sa A la matrice (simmetrica) associata a q, così che q(x) = txAx. Se S è una matrice ortogonale tale che S−1 AS è diagonale, allora S−1 = tS e quindi tSAS è diagonale, cioè nelle coordinate xˆ tali che x = Sxˆ la forma quadratica ˆ x) q(x) è diagonale: q( ˆ = d1 xˆ21 + . . . + dn xˆ2n . Gli autovalori di A sono per definizione i termini della matrice diagonale S−1 AS, e quindi i coefficienti d1 , . . . , dn sono proprio gli autovalori di A.
(IV.86) Corollario. Una forma quadratica q(x) è definita positiva (risp. negativa) se e soltanto se i suoi autovalori sono tutti positivi (risp. negativi). È semidefinita positiva (risp. negativa) se e soltanto se i suoi autovalori sono tutti positivi (risp. negativi) o nulli. È indefinita se ci sono autovalori sia positivi che negativi. Dimostrazione. Sa A la matrice (simmetrica) associata a q. Per il corollario precedente, in una opportuna base ortogonale la forma q(x) si diagonalizza come ˆ x) q( ˆ = d1 xˆ21 + . . . + dn xˆ2n , dove i d1 , . . . , dn sono gli autovalori di A. Allora se sono tutti positivi (risp. negativi), q è definita positiva (risp. negativa). Se sono positivi (risp. negativi) o nulli, q è semidefinita positiva (risp. negativa). Se ce ne sono sia positivi che negativi, allora è indefinita.
S è ortogonale, allora StS = SS = I =⇒ S−1 = tS.
Se t
Naturalmente qui si intende che gli autovalori di una forma quadratica sono gli autovalori della matrice simmetrica associata.
210
Matrici e operatori lineari
(IV.87) Osservazione. Il fatto fondamentale che consente di dimostrare i Corollari (IV.85) e (IV.86) è che ogni forma quadratica ha una matrice simmetrica A associata, ed A è sempre diagonalizzabile mediante una trasformazione ortogonale (che è la matrice le cui colonne sono appunti gli autovettori di A). Allora ogni forma quadratica ha associata non solo una matrice A, ma in effetti un sistema completo di autovalori ed autovettori, e se q(x) è in forma diagonale q(x) = d1 x21 + d2 x22 + . . . + dn x2n i suoi coefficienti di sono anche i suoi autovalori.
Concludiamo questo paragrafo con una definizione: un operatore L definito da V in sé si dice auto-aggiunto (o simmetrico) rispetto ad un prodotto scalare h·, ·i su V se per ogni x, y ∈ V si ha hLx, yi = hx, Lyi.
Per Rn la seguente proposizione è una conseguenza diretta del Teorema Spettrale. Ne diamo invece una dimostrazione diretta, che vale anche in spazi di dimensione infinita (si veda l’Esempio (IV.89). (IV.88) Se λ1 , λ2 sono due autovalori distinti di un operatore autoaggiunto (simmetrico) L : V → V, allora i corrispondenti autovettori x1 e x2 sono ortogonali. Dimostrazione. Si ha λ1 (x1 · x2 ) = (λ1 x1 ) · x2 = (Lx1 ) · x2 = x1 · (Lx2 ) = x1 · (λ2 x2 ) = λ2 (x1 · x2 ), e dunque (λ1 − λ2 )(x1 · x2 ) = 0 =⇒ x1 · x2 = 0, visto che λ1 , λ2 .
(IV.89) Esempio. Sia C(0, π) lo spazio delle funzioni continue sull’intervallo [0, π], con prodotto scalare Z π h f, 1i = f (x)1(x) dx. 0
Sia V il sottospazio di tutte le funzioni C2 su [0, π] e tali che f (0) = f (π) = 0. Consideriamo l’operatore L : V → C(0, π) di derivazione seconda: L : f ∈ V 7→ L( f ) = f ′′ .
È un operatore lineare auto-aggiunto. Infatti Z π Z π π ′′ ′ h f, L1i = f (x)1 (x) dx = f (x)1 (x) 0 − f ′ (x)1′ (x) dx 0 0 Z π =− f ′ (x)1′ (x) dx 0 Z π Z π ′ π ′ ′ = f (x)1(x) 0 − f (x)1 (x) dx = f ′′ (x)1(x) dx 0
= hL f, 1i.
0
Non è difficile vedere che un ope-
ratore Rn → Rn è auto-aggiunto se e soltanto se è rappresentato da una matrice simmetrica: si veda anche la nota a pagina 220.
Esercizi
211
Spazi vettoriali complessi Uno spazio vettoriale complesso è uno spazio vettoriale in cui il campo degli scalari, invece che R, è il campo dei numeri complessi C. In altre parole, è un insieme di vettori di cui è possibile calcolare la somma e il prodotto per uno scalare complesso, in modo tale che le proprietà di pagina 164 (la Definizione (IV.1)) siano verificate. Lo spazio di tutte le n-uple di numeri complessi Cn è uno spazio vettoriale complesso. Praticamente tutto quello che è stato detto per operatori lineari, matrici, dipendenza lineare, sistemi di equazioni, autovalori, autovettori, determinante, . . . può essere ripetuto parola per parola nel campo complesso. C’è una differenza invece a proposito di prodotto scalare e norma. In uno spazio vettoriale complesso, il prodotto scalare deve verificare le seguenti proprietà, invece che quelle per gli spazi con coefficienti reali, della Definizione (IV.34) (le parti contrassegnate con un asterisco sono quelle diverse): il prodotto scalare
hx, yi di due vettori di uno spazio vettoriale complesso è un numero complesso, tale che * ① (simmetria Hermitiana) hx, yi = hy, xi;
② (distributivo/lineare) hx, x + zi = hx, yi + hx, zi;
* ③ (omogeneo) hcx, yi = hx, cyi = chx, yi;
④ (definito positivo) x , 0 =⇒ hx, xi > 0.
Si può ancora definire la norma kxk2 = hx, xi, che è reale dato che per la simmetria Hermitiana deve essere hx, xi = hx, xi. Un prodotto di questo tipo si dice prodotto scalare hermitiano, e lo spazio V su cui è definito si dice spazio hermitiano o unitario. Il prodotto scalare standard di Cn è x · y = hx, yi = x1 y¯ 1 + x2 y¯ 2 + . . . + xn y¯ n .
Gli operatori lineari su spazi vettoriali complessi sono molto importanti per la meccanica quantistica e le svariate applicazioni. Vedremo alcuni esempi negli esercizi a pagina 225.
Quali sono gli autovalori/autovettori di L? Le soluzioni dell’equazione y′′ (x) = λy(x) con la condizione al bordo y(0) = y(π) = 0, cioè le funzioni yn (x) = sin nx,
per n ∈ Z r {0}.
L’autovalore corrispondente a yn (x) = sin nx è λn = −n2 . Ora, se n2 , m2 , i due autovalori λn e λm sono distinti, per cui la Proposizione (IV.88) ci permette di concludere yn (x) e ym (x) sono ortogonali, cioè che Z π 0 = hsin nx, sin mxi = sin nx sin mx dx. 0
Esercizi (IV.1) Mostrare che se b1 , b2 , . . . , bn sono numeri reali distinti, allora le funzioni f1 (x) = eb1 x ,
f2 (x) = eb2 x ,
. . . , fn (x) = ebn x ,
sono indipendenti (nello spazio vettoriale di tutte le funzioni reali). Soluzione. A meno di permutare gli indici, possiamo supporre che b1 ≤ b2 ≤ . . . ≤ bn . Supponiamo quindi per assurdo che ci siano n coefficienti
Queste sono alcune delle relazioni
di ortogonalità dell’Esempio (IV.50) e della Proposizione (II.27).
212
Matrici e operatori lineari
non tutti nulli a1 , a2 , . . . , an tali che a1 eb1 x + a2 eb2 x + . . . + an ebn x = 0. Ma allora, se dividiamo per ebn x e consideriamo il limite per x → +∞, si ha che i h lim a1 e(b1 −bn )x + a2 e(b2 −bn )x + . . . + an = 0, x→+∞
cioè an = 0, visto che tutti i termini precedenti tendono a zero. Ripetendo (in modo ricorsivo) il ragionamento sugli n − 1 coefficienti a1 , . . . , an−1 , si arriva a mostrare che devono essere tutti nulli. (IV.2) Sia V = C(0, 1) lo spazio delle funzioni continue sull’intervallo [0, 1]. Definiamo il prodotto scalare Z h f, 1i =
1
f (x)1(x)x dx 0
Calcolare k f k, dove f (x) = ax + b è un polinomio di primo grado. Determinare poi un polinomio di primo grado ortogonale alla funzione 1 (costante). Soluzione. La norma al quadrato di f è Z k f k2 = h f, f i =
1
f (x) 2 dx =
0
Z
1
(ax + b)2 dx 0
i 1 1 h = (a + b)3 − b3 = a2 + ab + b2 , 3a 3
r
1 2 a + ab + b2 . I polinomi di primo grado ortogonali alla 3 funzione 1 sono quelli per cui e quindi k f k =
Z 0 = h f (x), 1i =
1
(ax + b) dx = 0
a + b, 2
cioè f (x) = ax − a/2 = a(x − 1/2), che sono i multipli di x − 1/2. (IV.3) Determinare per quali valori dei parametri a, b e c esiste l’inversa della matrice a b c 0 1 1 A = , 1 1 0 e quando esiste calcolarla.
F IV.5: Vladimir Andreevich mir Andre&eviq Steklov (Vladi& Steklo&v, 1864–1926), i cui contributi scientifici principali sono legati a insiemi ortogonali di funzioni
Esercizi
213
Soluzione. Per la Proposizione (IV.61), l’inversa esiste se e soltanto se det(A) , 0, cioè se e soltanto se a b c 1 1 0 1 0 1 − b + c = −a + b − c. 0 , 0 1 1 = a 1 0 1 0 1 1 1 1 0 Supponiamo quindi che a − b + c , 0, e vediamo di costruire l’inversa, che sappiamo esistere. Possiamo fare uso dell’ultima parte della dimostrazione del Teorema (III.29), in cui viene usato il metodo di Cramer per risolvere il sistema Ax = b, osservando che se B è l’inversa di A, allora AB = I e quindi le sue colonne b1 , b2 , b3 verificano le equazioni Abi = ei per i = 1, 2, 3. Se a1 , a2 e a3 sono le colonne di A, si ha det(ei , a2 , a3 ) x= det A det(a1 , ei , a3 ) xa1 + ya2 + za3 = ei ⇐⇒ y= det A det(a 1 , a2 , ei ) z= , det A per i = 1, 2, 3. Si avrà quindi che le componenti della prima colonna di B sono 1 b c 1 b c 0 1 1 0 1 1 0 1 0 0 1 0 1 0 = (−1) =− b11 = det(A) det A det(A) c a 1 a 1 c 0 0 1 0 0 1 1 0 0 1 0 0 1 1 b21 = = (−1) = det A det A det A a 1 b a b 1 0 1 0 0 1 0 1 1 0 1 1 0 1 = (−1)2 =− b31 = det A det A det A Le componenti della seconda e della terza colonna si calcolano in modo analogo. Si trova infine c b − c −1 1 1 −1 −c −a B=A = −a + b − c −1 b − a a
Dove gli ei sono i vettori della base standard di R3 . Stiamo dicendo in generale che invertire una matrice n×n A significa risolvere gli n sistemi lineari Ax = ei , per i = 1, . . . , n.
Il pattern che speriamo sia riusci-
to ad osservare è il seguente: il coefficiente bi j dell’inversa è uguale al determinante della matrice che si ottiene cancellando la j-esima riga e la i-esima colonna, moltiplicato per (−1)i+j e diviso per il determinante det A. Si può ricavare facilmente una formula per l’inversa di una matrice. Ci sono molti altri modi per calcolare A−1 , e si invita il Lettore interessato a cercarne qualcun altro.
214
Matrici e operatori lineari
✩ (IV.4) Mostrare che se P è una matrice ortogonale n × n e M una matrice quadrata n × n, allora la somma dei quadrati dei coefficienti di M è uguale alla somma dei quadrati dei coefficienti di PM o MP: X kMk2 = m2i j =⇒ kMk2 = kPMk2 = kMPk2 . i, j
Soluzione. Osserviamo che kMk2 è la somma delle norme al quadrato delle colonne di M. Se quindi m1 , m2 , . . . , mn sono le colonne di M, si ha kMk2 = km1 k2 + km2 k2 + . . . + kmn k2 . Se P è una matrice ortogonale, allora le sue colonne costituiscono una base ortonormale per Rn , cioè tPP = PtP = I. Quindi per ogni mi si ha kmi k2 = mi · mi = tmi mi
kPmi k2 = (Pmi ) · (Pmi ) = t(Pmi )(Pmi )
= tmi tPPmi = tmi mi ,
cioè kmi k2 = kPmi k2 . Ma allora kPMk2 = kPm1 k2 + kPm2 k2 + . . . + kPmn k2
= km1 k2 + km2 k2 + . . . + kmn k2 = kMk2 ,
come volevasi dimostrare. Ora, per quanto riguarda MP, basta osservare che kMPk2 = kt(MP)k2 = ktPtMk2 = ktMk2 = kMk2 , dato che tP è anch’essa ortogonale. (IV.5) Determinare gli autovalori e gli autovettori dell’operatore L : R3 → R3 definito dalla seguente matrice: 1 0 2 2 3 −2 A = , 2 2 1 e dedurre se è diagonalizzabile. Soluzione. Il polinomio caratteristico è 2 2 0 2 1 − λ 0 1 − λ 0 1 − λ 3−λ −2 = (1 − λ) 2 3 − λ −2 + 2 2 3 − λ −2 pA (λ) = 2 2 2 1 − λ 2 2 1−λ 2 2 1−λ = (1 − λ)((3 − λ)(1 − λ) + 4) + 2(4 − 2(3 − λ)) = (1 − λ)(3 − 4λ + λ2 + 4) − 4 + 4λ = (1 − λ)(λ2 − 4λ + 7) − 4(1 − λ)
= (1 − λ)(λ2 − 4λ + 3) = (1 − λ)(λ − 3)(λ − 1).
Esercizi
215
Le sue radici sono λ1 = 1 (con molteplicità algebrica due, cioè compare due volte nella fattorizzazione di pA (λ)) e λ3 = 3. Gli autovettori corrispondenti a λ1 sono le soluzioni del sistema 2z = 0 0 2 x 0 1 − 1 2 2x + 2y − 2z = 0 3 − 1 −2 y = 0 ⇐⇒ 0 2 2 1−1 z 2x + 2y = 0.
Non
abbiamo tre autovalori distinti, per cui non siamo in grado di applicare la Proposizione (IV.81): non sappiamo ancora se è diagonalizzabile.
Eliminiamo subito z = 0, e otteniamo il sistema ( 2x + 2y = 0 2x + 2y = 0, che ha per soluzione tutti i multipli (x, y, z) = c(1, −1, 0). Gli autovettori corrispondenti a λ3 si trovano in modo analogo: −2x + 2z = 0 0 2 x 0 1 − 3 2 3 − 3 −2 y = 0 2x − 2z = 0 ⇐⇒ 2 2 1−3 z 2x + 2y − 2z = 0. 0 Eliminiamo z = x (dalla prima e dalla seconda, che sono uguali), e rimane la relazione 2y = 0. Dunque gli autovettori sono i multipli di (1, 0, 1). In conclusione non ci sono più di due autovettori linearmente indipendenti, e la matrice non è quindi diagonalizzabile. (IV.6) Sia V lo spazio delle funzioni continue su [−1, 1], e h f, 1i il prodotto scalare Z h f, 1i =
1
f (x)1(x) dx. −1
Determinare l’area del triangolo formato dalle tre funzioni 1, x e x2 . Soluzione. Usiamo la formula di Erone, vista nell’Esercizio 49 a pagina 161: p Area = s(s − a)(s − b)(s − c), dove s è il semiperimetro e a, b e c le lunghezze dei lati. Allora risulta Z 2
1
2 2
a = kx − x k = b2 = k1 − x2 k2 =
Z
Z
c2 = k1 − xk2 =
−1 1 −1 1
−1
(x − x2 )2 dx =
16 15
(1 − x2 )2 dx =
16 15
(1 − x)2 dx =
8 . 3
Il Lettore può provare a completa-
re i due vettori con un terzo vettore linearmente indipendente, ed ottenere una base in cui scrivere l’operatore L. Per esempio, nella base 1 1 1 −1 0 b1 = , b2 = , b3 = −1 1 0 1
l’operatore L ha matrice 3 0 −1 S AS = 0 1 0 0
associata 0 2 , 1
che non è diagonale ma quasi.
216
Matrici e operatori lineari
Quindi √ √ √ 6 2 6 4 15 , c= , s−a = s−b = a=b= 15 3 3 1 1 s = (2a + c), s − c = (2a − c). 2 2 da cui segue che √ p 61√ 2 Area = (s − a) s(s − c) = 4a − c2 3 2 √ r √ √ r 6 6 8 2 15 16 8 = . 4 − = = 6 15 3 6 5 15 (IV.7) Sia V lo spazio vettoriale di tutte le matrici quadrate n × n (rispetto al prodotto per uno scalare e alla somma di matrici). Definiamo la norma di una matrice A con coefficienti ai j : kAk =
v u tX n
a2i j .
i, j=1
Si
veda la Definizione (IV.39) a pagina 179. Si veda anche l’Esercizio 40 .
Mostrare che in effetti è una norma e che verifica le ulteriori proprietà: ① se v ∈ Rn , allora kAvk ≤ kAkkvk; ② se A e B sono matrici, kABk ≤ kAk kBk. (Questa norma è detta norma di Frobenius, ed è anche indicata con kAk2 .) 2
Soluzione. Lo spazio delle matrici n × n può essere identificato con Rn (parametrizzato con gli n2 coefficienti delle matrici), e quindi la norma di una matrice non è altro che la norma standard del corrispondente 2 vettore di Rn . Osserviamo che se a1 , a2 , . . . , an sono i vettori colonna di una matrice A, allora kAk2 = ka1 k2 + ka2 k2 + . . . + kan k2 . Lo stesso per i vettori riga (si vede facilmente che kAk = ktAk). Per dimostrare la ①, ricordiamo che per la disuguaglianza di Cauchy–Schwartz se a e b sono due vettori di Rn allora (a · b)2 ≤ kak2 kbk2 . Ora, se r1 , r2 , . . . , rn indicano i vettori riga di una matrice A (n × n) e v ∈ Rn è un vettore di dimensione n, allora le componenti del vettore prodotto Av sono i prodotti scalari dei vettori riga per v (r1 · v, r2 · v, . . . , rn · v), e quindi kAvk2 = (r1 · v)2 + (r2 · v)2 + . . . + (rn · v)2
≤ kr1 k2 kvk2 + kr2 k2 kvk2 + . . . + krn k2 kvk2 = kr1 k2 + kr2 k2 + . . . + krn k2 kvk2 = kAk2 kvk2 .
Si
veda la Proposizione (IV.38), e disuguaglianza triangolare della Proposizione (III.19) (pagina 111).
Esercizi
217
Possiamo ora dedurre la ②, dato che (se bi sono i vettori colonna di B) kABk2 = k(Ab1 , Ab2 , . . . , Abn )k2
= kAb1 k2 + kAb2 k2 + . . . + kAbn k2
≤ kAk2 kb1 k2 + kAk2 kb2 k2 + . . . + kAk2 kbn k2 = kAk2 kb1 k2 + kb2 k2 + . . . + kbn k2 = kAk2 kBk2 .
✩ (IV.8) (Diagonalizzazione di Jacobi) Sia M una matrice simmetrica e q(x) la forma quadratica associata. Si cerchi un procedimento di diagonalizzazione di M (equivalentemente, di q) mediante permutazioni delle variabili e rotazioni tra le variabili x1 e x2 , del tipo x1 = cy1 − sy2 x2 = sy1 + cy2 xi = yi per i ≥ 3, con c = cos ϑ e s = sin ϑ per un opportuno angolo ϑ. Soluzione. Sia q(x) = txMx =
n X
mi j xi x j
i, j=1
la forma quadratica associata a M. Cercheremo di diagonalizzare M con un procedimento analogo a quello usato nella dimostrazione del Teorema (IV.70), annullando uno a uno i termini al di fuori della diagonale. La forma quadratica q(x) può essere scritta in modo più sintetico come q = m1,1 x21 + 2m1,2 x1 x2 + m2,2 x22 + + x1 l1 (x3 , . . . , xn ) + x2 l2 (x3 , . . . , xn ) + q3 (x3 , . . . , xn ), dove l1 , l2 sono espressioni lineari delle sole variabili x3 , . . . , xn e q3 una forma quadratica nelle x3 , . . . , xn . Dopo il cambio di variabili indicato, q si trasforma nella seguente espressione (23)
q = m1,1 (cy1 − sy2 )2 + 2m1,2 (cy1 − sy2 )(sy1 + cy2 ) + m2,2 (sy1 + cy2 )2 +
+(cy1 − sy2 )l1 (y3 , . . . , yn ) + (sy1 + cy2 )l2 (y3 , . . . , yn ) + q3 (y3 , . . . , yn ),
con le stesse l1 , l2 e q3 . Il coefficiente di y1 y2 è ˆ 1,2 = −2m1,1cs + 2m1,2 (c2 − s2 ) + 2m2,2 cs, 2m che si può annullare se (24)
m1,1 − m2,2 c2 − s2 . = cs m1,2
218
Matrici e operatori lineari
2
2
2 cos 2ϑ ϑ−sin ϑ Ma cos sin ϑ cos ϑ = sin 2ϑ = 2/ tan 2ϑ, e quindi per ogni m ∈ R esiste uno ed un solo valore ϑm ∈ (−π/4, π/4] per cui 2/tan 2ϑm = m. A questo valore ϑm corrispondono due valori c = cos ϑm e s = sin ϑm che risolvono l’equazione (24), che quindi annullano il coefficiente di y1 y2 nella (23) m −m se m = 1,1m1,2 2,2 . I coefficienti dei termini y21 e y22 possono essere facilmente calcolati e risultano s ˆ 1,1 = c2 m1,1 + 2m1,2 cs + m2,2 s2 = m1,1 + m1,2 m c (25) s ˆ 2,2 = m1,1 s2 − 2m1,2 cs + m2,2 c2 = m2,2 − m1,2 . m c
Quelli dei termini y1 yi con i ≥ 3 compaiono nell’espressione y1 (cl1 (y3 , . . . , yn ) + sl2 (y3 , . . . , yn )), quelli dei termini y2 yi con i ≥ 3 nell’espressione y2 (−sl1 (y3 , . . . , yn ) + cl2 (y3 , . . . , yn )). Il problema è che iterando questa procedura per cancellare tutti i coefficienti degli x1 x j , a ogni passo i coefficienti che si erano annullati prima possono tornare ad essere diversi da zero! Però accade che la somma dei quadrati degli elementi della matrice mi, j non cambia (perché si moltiplica per matrici ortogonali, si veda l’Esercizio (IV.4)), e quindi se si indica ˆ la matrice con coefficienti m ˆ i j ottenuta con il cambio di coordinate, con M si ha X X ˆ 2 = kMk2 = ˆ 2i j = kMk m2i j . m i, j
i, j
Indichiamo con S e Sˆ le somme dei quadrati dei termini al di fuori della diagonale: X X X X X X ˆ 2− ˆ 2i j = 2 ˆ 2i j = kMk ˆ 2ii . S= m2i j = 2 m2i j = kMk2 − m2ii , Sˆ = m m m i, j
i< j
i
i, j
i< j
i
Dato che i termini sulla diagonale che vengono modificati sono solo m11 e m22 , si ha (sostituendo i valori di (25)) s s ˆ 211 − m211 + m ˆ 222 − m222 = (m11 + m12 )2 − m211 + (m22 − m12 )2 − m222 S − Sˆ = m c c s2 s2 s2 s s s = 2m12 m11 + m212 2 − 2m12 m22 + m212 2 = 2m12 (m11 − m22 ) + 2m212 2 c c c c c c # " 2 2 2 c −s s s + = 2m212 . = 2m212 cs c c2 Ora immaginiamo di applicare questa procedura nel modo seguente: ad ogni passo selezioniamo gli indici i < j in modo tale che il coefficiente
Sostituiamo 2
s )/(cs).
m11 − m22 = m12 (c2 −
Esercizi
219
della matrice al posto i, j sia il massimo tra quelli fuori dalla diagonale, e trasformiamo la matrice M con il cambio di coordinate appena visto se questo non è zero. Si otterrà una successione di matrici M = M0 , M1 , M2 , . . . , Mk , . . . in cui la somma Sk dei quadrati dei termini al di fuori della diagonale della matrice k-esima soddisfa l’uguaglianza (26) Sk+1 = Sk − 2m2k , dove m2k è appunto il massimo tra i quadrati dei termini al di fuori della diagonale della matrice Mk . Il procedimento termina quando Mk è in forma diagonale. Altrimenti {Sk } è una successione di numeri positivi monotona decrescente, che deve convergere a un limite positivo o nullo S∞ = lim Sk . k→+∞
Osserviamo che da (26) segue che Sk = Sk−1 − 2m2k−1 = Sk−2 − 2m2k−2 − 2m2k−1 = . . . = S0 − 2
k−1 X
m2j ,
j=0
e quindi se la successione Sk converge, allora la successione m j deve convergere a zero per j → ∞, e dato che (27) 0 ≤ 2m2k ≤ Sk ≤ n(n − 1)m2k (visto che m2k è il massimo degli n(n − 1) termini di Sk ) anche Sk deve convergere a zero. Dalla disuguaglianza (27) possiamo anche dedurre anche che 2 2 Sk ≤ 2m2k ≤ Sk =⇒ Sk+1 = Sk − 2m2k ≤ Sk − Sk = αSk n(n − 1) n(n − 1) per α = 1 −
2 n(n−1)
< 1, da cui
Sk ≤ αk S0 =⇒ mk ≤ βk
√
S0 2
√ α ∈ [0, 1). Possiamo dedurre che anche i coefficienti delper β = la diagonale di Mk abbiano un limite? Ad ogni passo del tipo (25) si sin ϑk aggiungono alla diagonale termini del tipo ±mk cos ϑk per un certo angolo ϑk ∈ (−π/4, π/4], in cui mk tende a zero al massimo come βk e P 2 sin ϑk tan ϑk = cos k mk , ma anche ϑk ∈ [−1, 1]. Ma allora non solo la serie P |m | converge, e quindi i termini sulla diagonale in effetti convergono. k k La successione di matrici Mk pertanto converge ad una matrice diagonale D. Non rimane che mostrare che i termini sulla diagonale di D sono
220
Matrici e operatori lineari
proprio gli autovalori di M (o di ogni Mk , visto che le Mk sono simili a M e quindi hanno gli stessi autovalori), e che M è simile a D mediante una trasformazione ortogonale. Per far questo abbiamo bisogno di un po’ di strumenti che per ora ci mancano, per cui lasciamo al Lettore per esercizio i dettagli di quest’ultima parte, tra qualche capitolo (Esercizio 41 a pagina 386). ✩ (IV.9) Sullo spazio euclideo V = Rn con prodotto scalare standard sia L : V → V un operatore lineare auto-aggiunto, cioè tale che hLx, yi = hx, Lyi. Sia definita la funzione q : V r {0} → R, ponendo q(x) =
hLx, xi . hx, xi
Mostrare che se z è un vettore tale che q(x) ≥ q(z) per ogni x ∈ V, allora z è un autovettore per L, q(z) è il corrispondente autovalore, e questo è il minimo tra tutti gli autovalori di L. Soluzione. Per il Teorema Spettrale (IV.83) la matrice L è diagonalizzabile mediante una matrice ortogonale Q, cioè esiste una matrice ortogonale Q tale che D = Q−1 LQ è diagonale. Gli elementi sulla diagonale di D sono gli autovalori λ1 , λ2 , . . . , λn di L, e possiamo supporre (a meno di cambiare le coordinate) che λ1 ≤ λ2 ≤ . . . ≤ λn . I corrispondenti autovettori di L (le colonne di Q) formano un sistema di riferimento ortonormale. Chiamiamo con y le coordinate di Rn relative a questo sistema di riferimento, cioè x = Qy. Dato che Q−1 = tQ, si ha hLx, xi = txLx = t(Qy)L(Qy) = tytQLQy = tyDy hx, xi = txx = tytQQy = tyy
=⇒ q(x) =
hLx, xi tyDy = t . hx, xi yy
Ora, sia q1 = q(z). Si ha che q(x) ≥ q1 per ogni x , 0 se e soltanto se per ogni y , 0 t
yDy ≥ q1 tyy ⇐⇒ λ1 y21 + λ2 y22 + . . . + λn y2n ≥ q1 (y21 + y22 + . . . + y2n )
(*)
⇐⇒ (λ1 − q1 )y21 + (λ2 − q1 )y22 + . . . + (λn − q1 )y2n ≥ 0,
cioè se e solo se la forma quadratica scritta è semi-definita positiva, e dunque deve essere q1 ≤ λ1 ≤ λ2 . . . ≤ λn . ma per il vettore z si ha (**) (λ1 − q1 )z21 + (λ2 − q1 )z22 + . . . + (λn − q1 )z2n = 0.
È chiaro che abbiamo già occupato abbastanza spazio con questa diagonalizzazione di Jacobi, e in questo margine non vi è abbastanza spazio per procedere oltre.(12) La matrice associata a L è simmetrica: se hLx, yi = hx, Lyi, cioè t (Lx)y = txLy, si ha txtLy = txLy. Ora se si prendono x = ei e y = e j si ha che le componenti di tL devono essere uguali a quelle di L, cioè che L è simmetrica. La
funzione q(x) è il quoziente di due forme quadratiche, e viene chiamata il quoziente di Rayleigh.
Esercizi
221
da cui segue che nella (**) si deve avere λi = q1 per qualche i. L’unico i possibile è i = 1 (o un i successivo tale che λ1 = λ2 = . . . = λi ). Quindi q1 = q(x) = λ1 , che è il più piccolo tra gli autovalori. Per la (**) le componenti di z corrispondenti ad autovalori diversi da q1 devono essere zero, e quindi z è autovettore per λ1 .
✎ Diamoci da fare. . . (Soluzioni a pagina 598) 1 Se i e j sono due vettori linearmente indipendenti di uno spazio vettoriale, si determinino due coefficienti x e y tali che x(2i + j) + y(i + j) = i − j 2 Siano a = (2, −1, 1), b = (1, 2, −1) e c = (2, −11, 7). Sono linearmente dipendenti? Se sì, scriverne uno come combinazione lineare degli altri due.
10 Quali delle seguenti funzioni R2 → R2 sono lineari? Di quelle lineari si calcolino la dimensione del nucleo e dell’immagine. (a) f (x, y) = (y, x); (b) f (x, y) = (x + y, x − y); (c) f (x, y) = (x, 2x);
3 Determinare tutti i valori del parametro t per cui i vettori (t, t2 ) e (1, t) sono paralleli, e quelli per cui sono ortogonali.
(d) f (x, y) = (x2 , y2 − x);
4 Siano a, b e c tre vettori di Rn . Mostrare che a, a + b e a + b + c sono linearmente indipendenti se e solo se lo sono a, b e c. Cosa si può dire dell’indipendenza dei tre vettori a + b, b + c, c + a?
11 Delle seguenti trasformazioni R2 → R2 , si calcoli il nucleo e l’immagine, se sono lineari.
5 Si considerino in Rn (con base standard e1 , e2 , . . . , en ) i vettori b1 = e1 , b2 = e1 + e2 , b3 = e1 + e2 + e3 , . . . , bn = e1 + e2 + . . . + en . Si mostri che costituiscono una base. Si scrivano le coordinate di x = (x1 , x2 , . . . , xn ) in questa base. 6 Determinare tutti i valori del parametro t per cui i tre vettori (1, t, 0), (t, 0, 1) e (0, 1, t) sono linearmente dipendenti. 7 Siano S1 e S2 due sottoinsiemi di vettori di uno spazio vettoriale. Mostrare che (a) Se S1 ⊆ S2 , allora Span(S1 ) ⊆ Span(S2 ).
(e) f (x, y) = (x + y, 2x + 2y).
(a) Rotazione attorno all’origine di angolo ϑ; (b) Riflessione rispetto alla retta di equazione y = x. (c) Riflessione rispetto alla retta di equazione y = x + 1. (d) Omotetia di ragione 2 con centro in (1, 0). (e) Traslazione di vettore (1, 1). 12 Si calcolino il rango e la nullità delle seguenti trasformazioni R3 → R3 , quando sono lineari. (a) f (x, y, z) = (2x, 3y, 3z);
(b) f (x, y, z) = (x + y, y + z, z + x); (c) f (x, y, z) = (1 + x, 1 + y, 1 + z);
(b) Span(S1 ∩ S2 ) ⊆ Span(S1 ) ∩ Span(S2 ).
(d) f (x, y, z) = (x, y, 1);
(c) Può essere Span(S1 ∩ S2 ) , Span(S1 ) ∩ Span(S2 )?
(e) f (x, y, z) = (x, y2 , z3 ).
8 Sia V lo spazio lineare di tutte le funzioni da R in R. Calcolare le dimensioni dei seguenti Span:
13 Si dica quali delle seguenti trasformazioni V → V sono lineari, dove V è lo spazio di tutti i polinomi di grado al più n, e di quelle lineari si calcoli il nucleo.
(a) Span(1, eax , ebx ); (b) Span(sin x, cos x, sin2 x, cos2 x); (c) Span(1, eax , xeax , x2 eax );
(a) Se p ∈ V, T(p) è il polinomio q(x) definito da q(x) = p(x + 1).
(d) Span(1, cos 2x, sin2 x).
(b) Se p ∈ V, T(p)(x) = (x − 1)p′ (x).
9 Si dimostri che il nucleo di una funzione lineare L : V → W è sempre uno spazio vettoriale (rispetto alle operazioni definite su V).
(d) Se p ∈ V, T(p)(x) = p′′ (x) + 2p′ (x) + p(x).
(c) Se p ∈ V, T(p)(x) = p′ (x).
(e) Se p ∈ V, T(p)(x) = x2 p′′ (x) − 2xp′ (x) + p(x).
222
Matrici e operatori lineari
14 Sia V lo spazio vettoriale di tutte le successioni reali {xn } convergenti (con somma {xn } + {yn } = {xn + yn } e prodotto per uno scalare c{xn } = {cxn }). Sia T : V → V definita come segue T({xn }) = {xn − lim xn }. n→∞
È un operatore lineare? Quale è il suo nucleo?
# 1 . Calcolare, per ogni n ∈ Z, An . 1
"
1 20 Sia A = 0
21 Verificare che la matrice associata alla rotazione del piano di un angolo ϑ in senso antiorario attorno # " cos ϑ − sin ϑ . all’origine è Rϑ = sin ϑ cos ϑ # cos ϑ − sin ϑ . Mostrare 22 Sia Rϑ la matrice Rϑ = sin ϑ cos ϑ n che Rϑ Rϑ′ = Rϑ+ϑ′ , e calcolare (Rϑ ) per ogni n. "
15 Sia V lo spazio di tutti i polinomi, D : V → V l’operatore di derivazione D : p(x) 7→ pR′ (x) e I : V → V x l’operatore di integrazione I : p(x) 7→ 0 p(t) dt. Mostrare che DI(p) = p per ogni p ∈ V, ma che ID(p) può non o 23 Una matrice di Hadamard è una matrice n × n con le seguenti proprietà: essere uguale a p. 16 Determinare le matrici associate alle seguenti funzioni lineari. (a) f : R3 → R3 , f (x) = 2x.
(b) f : R3 → R3 , f (x) = a × x per un certo a ∈ R3 fissato. (c) f : R3 → R, f (x) = a·x per un certo a ∈ R3 fissato.
(d) f : R3 → R3 tale che f (i + j) = k, f (j + k) = i, e f (k + i) = j. 17 Per ogni V indicato, determinare la matrice associata all’operatore D : V → V di derivazione. (a) V = Span(cos x, sin x); x
(c) V = Span(e cos x, e sin x); (d) V = Span(1, x, x2 , x3 ). 3 4 1 2 1 2 3 5 6 3 4 , B = 18 Siano A = . , C = −1 −2 −3 1 2 5 6 Si calcolino B + C, AB, AC, BA, CA, A(B + C). # # " " 1 −1 −1 0 . ,B= 19 Si calcoli AB − BA, dove A = 1 1 0 1 In generale, mostrare che una matrice Z 2 × 2 ha la proprietà che BZ = ZB per ogni matrice 2 × 2 B (cioè commuta con B) se e soltanto se commuta con ognuna delle seguenti matrici: # # " " 0 1 1 0 , , E12 = E11 = 0 0 0 0 # # " " 0 0 0 0 . , E22 = E21 = 0 1 1 0 "
② Il prodotto scalare di due colonne distinte è zero.
Determinare tutte le matrici di Hadamard 2×2 (sono otto). Mostrare che possono esserci matrici di Hadamard con n > 2 solo se n è un multiplo di 4. (Suggerimento: mostrare che (x + y) · (x + z) = kxk2 = n se x, y e z sono tre colonne ortogonali. Dal fatto che (xi + yi )(xi + zi ) è 0 o 4 per ogni i, dedurre che n è divisibile per 4.) 24 Sia Pn lo spazio vettoriale di tutti i polinomi reali di grado ≤ n. Poniamo h f, 1i =
(b) V = Span(1, ex , xex ); x
① Gli elementi della matrice sono tutti 1 o −1.
#
Come sono fatte questa matrici?
n X i=0
i i f ( )1( ). n n
(a) Mostrare che è un prodotto scalare. (b) Calcolare h1, xi. 25 Nello spazio vettoriale di tutti i polinomi, definiamo Z ∞ h f, 1i = e−x f (x)1(x) dx. 0
(a) Mostrare che è ben definito (l’integrale esiste) ed è un prodotto scalare. (b) I vettori xn , al variare di n, sono ortogonali? Calcolare i prodotti scalari hxn , xm i. (c) Determinare quali polinomi di primo grado sono ortogonali a 1 + x. 26 Si mostri che se W ⊂ V è un sottospazio di dimensione finita di uno spazio vettoriale V con prodotto scalare, allora la proiezione ortogonale PW : V → W di V su W è una trasformazione lineare.
Esercizi
223
✩ 27 Sia l2 l’insieme di tutte le successioni x = {xn }∞ tali n=1 P 2 che la serie ∞ x n=1 n è convergente. Mostrare che è uno spazio vettoriale, e che il prodotto hx, yi =
∞ X
a(x) = x3 ; xn yn
n=1
è un prodotto scalare. Calcolare l’angolo e la distanza tra le successioni xn = 1/n e yn = 1/(n + 1). o 28 Calcolare il determinante delle seguenti matrici. 1 1 1 x 1 0 0 a 1 x 1 0 b c ; (a) ; 2 (c) 0 1 x 1 a b2 c2 0 0 1 x 1 2 3 4 1 1 1 1 a b c d 0 1 2 3 (d) (b) 2 . ; 0 0 1 2 a b2 c2 d2 3 3 3 3 0 0 0 1 a b c d 29 Mostrare che se M è una matrice del tipo " # A 0k×k M = k×k , Bk×k Ck×k in cui i blocchi indicati sono matrici k × k, come per esempio a11 a M = 21 b11 b21
spazio vettoriale di tutte le funzioni derivabili due volte) allora det(W(a, b; x)) ≡ 0 (risp. det(W(a, b, c; x)) ≡ 0). Considerare le seguenti funzioni
a12 a22 b12 b22
0 0 c11 c21
0 0 , c12 c22
allora det(M) = det(A) det(C). 30 Calcolare matrici. # l’inversa delle seguenti " 1 1 0 1 0 ; (a) (c) 1 0 0. −1 1 # " 0 0 1 1 2 ; (b) 3 4
b(x) = |x|3 ,
per verificare se è vero il viceversa, cioè se W(a, b; x) ≡ 0 implica o no che a(x), b(x) sono dipendenti. 32 Dimostrare che ogni autovettore corrisponde ad uno e un solo autovalore. ✩ 33 Si determinino gli autovalori e gli autovettori delle matrici 1 −1 1 6 −3 3 4 3 , B = 2 1 −2 . A = 1 2 −1 0 −1 1 2 34 Sia V = C∞ (R) lo spazio vettoriale di tutte le funzioni derivabili infinite volte in R. Si considerino gli operatori lineari D : V → V e T : V → V definiti da D( f (x)) = f ′ (x) e T( f (x)) = x f ′ (x). Determinare gli autovalori e autovettori (autofunzioni) di T e D. 35 Mostrare che la funzione pM (λ) = det(M − λI) è un polinomio di grado n in λ, se M è una matrice n × n (il polinomio caratteristico). (Suggerimento: mostrare prima per induzione che il determinante è un polinomio omogeneo di grado n nei coefficienti della matrice M che contiene il termine m11 m22 . . . mnn .) 36 Mostrare che il polinomio caratteristico di una matrice A coincide con quello della sua trasposta tA. ✩ 37 Mostrare che gli autovalori di una matrice M sono tutte e sole le radici del polinomio caratteristico pM (λ), e che i polinomi caratteristici pM1 (λ) e pM2 (λ) di due matrici simili coincidono. Prima di proseguire P con gli esercizi, diamo una definizione: la somma ni=1 aii dei termini sulla diagonale di una matrice A si chiama traccia di A, e si indica con tr.
31 Fissate tre funzioni a(x), b(x), c(x), si considerino le ✩ 38 Mostrare che i coefficienti del polinomio caratterimatrici stico # " a(x) b(x) pA (λ) = c0 + c1 λ + c2 λ2 + . . . + cn−1 λn−1 + cn λn , W(a, b; x) = ′ a (x) b′ (x) di una matrice quadrata A soddisfano le uguaglianze a(x) b(x) c(x) c0 = det(A), cn−1 = (−1)n−1 tr A, cn = (−1)n . W(a, b, c; x) = a′ (x) b′ (x) c′ (x) ′′ a (x) b′′ (x) c′′ (x) Dedurre che se B e A sono matrici simili, allora tr A = tr B, e che (matrice wronskiana, in onore di Josef-Maria Hoëné de Wronski (1778–1853)).(13) Mostrare che se le funzioni a(x), b(x) (e c(x)) sono linearmente dipendenti (nello
① la traccia di una Pmatrice è la somma dei suoi autovalori: tr A = ni=1 λi .
224
Matrici e operatori lineari
② il determinante di una matrice è il prodotto dei Q suoi autovalori: det A = ni=1 λi .
6
5
39 Dimostrare le seguenti proprietà della traccia: ① tr(A + B) = tr(A) + tr(B);
4
1
② tr(cA) = c tr(A); ③ tr(tA) = tr(A). 2
④ tr(AB) = tr(BA); 40 Sia V lo spazio vettoriale di dimensione nm delle matrici n × m. Mostrare che la funzione t
hA, Bi = tr ( AB) è un prodotto scalare su V (secondo la Definizione (IV.34) a pagina 178). 41 Quali tra le seguenti matrici hanno gli stessi autovalori? Quali sono simili? # # " # " " 1 0 1 0 1 1 . , C= , B= A= 1 1 0 1 0 1
42 Determinare quali delle seguenti matrici sono diagonalizzabili. 0 A = 0 1
0 1 0
" 1 1 0 , B = 1 0
#
"
2 0 ,C = 0 3
#
"
1 1 ,D = −2 2
#
2 . 1
43 Sia V uno spazio vettoriale con prodotto scalare h−, −i. Diciamo che un operatore lineare L∗ : V → V è un operatore aggiunto di un operatore L : V → V se per ogni x, y in V hL∗ x, yi = hx, Lyi. Diciamo che un operatore lineare L : V auto-aggiunto se
→
V è
hLx, yi = hx, Lyi per ogni x, y in V. Mostrare che se V Rn con il prodotto scalare standard e L è una matrice, allora esiste un unico aggiunto L∗ = tL, e gli operatori auto-aggiunti sono esattamente le matrici simmetriche. o 44 Si associ al grafo (un grafo è un insieme di vertici e di segmenti che li collegano) della Figura IV.6
3
Figura IV.6: Grafo la matrice A, detta matrice di adiacenza, definita come segue: ai j = 1 se e solo se il vertice i e il vertice j sono collegati da un segmento, altrimenti ai j = 0. Si scriva la matrice A, e si mostri per induzione che per ogni n ≥ 1 la potenza An è una matrice che ha nella (i, j)-esima posizione il numero di percorsi diversi che vanno in n passi dall’i-esimo vertice al j-esimo vertice. 45 Siano a e b due vettori di R3 . Allora possono essere pensati come matrici A = (a) e B = (b) con una sola colonna e tre righe. Mostrare che il determinante della matrice 3x3 AtB è sempre zero. Si rappresentino geometricamente i suoi tre vettori colonna. 46 Dimostrare che lo span di un insieme qualsiasi di vettori S ⊂ V di uno spazio vettoriale V è uno spazio vettoriale rispetto alle operazioni di somma e prodotto per uno scalare ereditate da V. 47 Si mostri che il rango di una sottomatrice Aˆ di una ˆ ≤ matrice A non può superare il rango di A: Rango(A) Rango(A). 48 Estendere l’Esercizio 54 a pagina 162 a quattro punti: dimostrare che quattro punti A = (a1 , a2 , a3 ), B(b1 , b2 , b3 ), C = (c1 , c2 , c3 ) e D = (d1 , d2 , d3 ) di R3 sono complanari se e soltanto se la matrice a1 a 2 a3 1
b1 b2 b3 1
c1 c2 c3 1
d1 d2 d3 1
ha determinante nullo. 49 Dimostrare che ci sono n(n + 1)/2 distinti monomi di grado due in n variabili.
Esercizi
Diciamo che una matrice Q è triangolare superiore se ha tutti termini nulli sotto la diagonale q11 q12 q13 · · · q1n 0 q22 q23 · · · q2n 0 q33 · · · q3n . U = 0 . .. .. .. .. .. . . . . 0 0 · · · · · · qnn
225
Dimostrare analogamente che se G è un’altra funzione, con le stesse proprietà per le righe invece che per le colonne, allora a11 a 21 G . .. an1
0 a22 .. . an2
··· ··· .. . ···
0 a22 a2n . .. = a11 det .. . an2 ann
a2n .. . ann .
··· .. . ···
Diciamo che una matrice Q è unitriangolare superiore se è triangolare superiore e se i termini sulla diagonale sono 1, cioè se ha tutti 1 sulla diagonale e tutti 0 sotto la ✩ 56 Mostrare che se F(A) è una funzione lineare nelle diagonale colonne di A (matrice n × n), che cambia di segno se si scambiano due colonne di A e tale che F(In ) = 1, allora 1 q12 q13 · · · q1n 0 1 q23 · · · q2n se A ha una colonna in cui tutti i coefficienti sono zero 0 0 1 · · · q tranne uno, che è uguale a 1, 3n Q = . .. .. .. .. .. __ . . . . . a12 · · · a1,j−1 0 a1,j+1 · · · a1n a11 0 0 ··· ··· 1 a21 a22 · · · a2,j−1 0 a2,j+1 · · · a2n 50 Siano U, V due matrici triangolari superiori (cioè . . .. .. .. .. . . . . . . . tali che ui j = 0 se i > j). Mostrare che allora anche U+V, . . . . . . . −1 UV e (quando esiste) U sono triangolari superiori. ai−1,1 ai−1,2 · · · ai−1,j−1 0 ai−1,j+1 · · · ai−1,n A = ai,j−1 1 ai,j+1 · · · ain ai1 51 Mostrare che l’inversa di una matrice unitriangolaa · · · i2 a re superiore esiste sempre ed è unitriangolare. i+1,1 ai+1,2 · · · ai+1,j−1 0 ai+1,j+1 · · · ai+1,n ✩ 52 Mostrare che se A e Q sono matrici n × n e Q è uni . . .. .. .. . .. . .. .. . . . . .. .. triangolare superiore allora i minori principali di A, AQ, a t an2 · · · an,j−1 0 an,j+1 · · · ann QA, tQAQ coincidono. n1
K 53 Mostrare che se una forma quadratica q su Rn è definita positiva, allora tutti i minori principali d1 , d2 , . . . , dn della matrice associata a q (cioè i determinanti delle sue sottomatrici principali) sono positivi.
✩ 54 Dedurre dall’Esercizio 52 l’inversa dell’Esercizio 53 : si mostri per induzione che se tutti i minori principali d1 , d2 , . . . , dn della matrice associata ad una forma quadratica q sono positivi, allora q è definita positiva. (Suggerimento: si considerino i cambi di coordinate usati nella dimostrazione del Teorema (IV.70), e si noti che deve essere a11 > 0.) ✩ 55 Si supponga di aver definito il determinante solo per matrici (n − 1) × (n − 1), con le proprietà del Teorema (IV.54). Dimostrare che se F(A) è una funzione lineare nelle colonne di A (matrice n × n), che cambia di segno se si scambiano due colonne, e infine che vale 1 su In , allora a11 a12 · · · a1n a22 · · · a2n 0 a · · · a2n . 22 .. = a det . .. F . . . 11 . . . . .. .. .. .. an2 · · · ann . 0 an2 · · · ann
__
allora si ha che (−1)i+j F(A) è uguale alla funzione a11 a 21 .. . a det i−1,1 ai+1,1 . .. an1
a12 a22 .. . ai−1,2 ai+1,2 .. . an2
··· ··· .. . ··· ··· .. . ···
a1,j−1 a2,j−1 .. . ai−1,j−1 ai+1,j−1 .. . an,j−1
a1,j+1 a2,j+1 .. . ai−1,j+1 ai+1,j+1 .. . an,j+1
··· ··· .. . ··· ··· .. . ···
a1n a2n .. . ai−1,n . ai+1,n .. . ann
Spazi vettoriali complessi 57 Siano a = (1, i), b = (−i, i) e c = (2i, −1) tre vettori di C2 . Si calcolino i seguenti prodotti scalari (con il prodotto scalare hermitiano standard di Cn ). (a) a · b; (c) a · (ib) + (ia) · (b + c); (b) b · a;
(d) (a + ib) · (a − ib).
226
Matrici e operatori lineari
58 Mostrare che per ogni a, b di uno spazio vettoriale complesso con prodotto scalare hermitiano si ha ① ka + bk2 = kak2 + kbk2 + a · b + a · b; ② ka + bk2 − ka − bk2 = 2(a · b + a · b); ③ ka + bk2 + ka − bk2 = 2kak2 + 2kbk2 . ④ a · b + b · a ∈ R ⊂ C.
59 Mostrare che è possibile definire un unico angolo γ ∈ [0, π] tra due vettori a e b di Cn ponendo cos γ =
a·b+b·a . 2kakkbk
60 Le matrici # " 0 1 , P1 = 1 0
" 0 P2 = i
# −i , 0
" 1 P3 = 0
# 0 , −1
hanno un ruolo nella meccanica quantistica e sono dette le matrici di Pauli. Determinarne gli autovalori e gli autovettori.
Ï Laboratorio. . . Nei prossimi esercizi si chiede di dimostrare (in genere per induzione/ricorsione) alcune proposizioni, e di implementare la dimostrazione con un algoritmo al calcolatore. Si tratta di esercizi in genere impegnativi ma non troppo. 61 Si calcoli, a partire da ogni permutazione sugli n elementi 1, 2, . . . , n una matrice che permuta i vettori della base nello stesso modo. Una matrice di questo tipo si dice matrice di permutazione. 62 (LU decomposition, row echelon form) Implementare l’algoritmo di eliminazione di Gauss per ridurre una matrice A alla sua forma di echelon U (cioè in ogni riga di U la successione di zeri iniziali è più lunga di quella della riga precedente): se A è una matrice n × m, allora esistono una matrice di permutazione P (n × n), una matrice unitriangolare inferiore L (n × n) e una matrice triangolare superiore U (n × m) tali che PA = LU.
63 (QR decomposition) Mostrare che se A è una matrice n × m di rango massimo, con m ≤ n, il procedimento di ortogonalizzazione di Gram–Schmidt permette di scrivere A = QR dove Q è una matrice ortogonale e R è una matrice triangolare superiore. 64 (Diagonalizzazione di una forma quadratica) Implementare la dimostrazione del Teorema (IV.70) a pagina 199 (si veda la nota (IV.73), e anche gli Esercizi 53 e 54 a pagina 225) nel caso in cui A è una matrice simmetrica definita positiva n × n: costruire una matrice unitriangolare superiore U tale che tUAU è diagonale. 65 (Cholesky decomposition) Mostrare che se A è una matrice simmetrica definita positiva n × n, allora esiste una matrice triangolare inferiore L con elementi sulla diagonale > 0 tale che A = LtL (equivalentemente, esiste una matrice triangolare superiore U con elementi sulla diagonale > 0 tale che A = tUU. Con la matrice U è possibile scrivere B = QR per una matrice non singolare B, dove Q è ortogonale e R è triangolare superiore: infatti, se B non è singolare allora la matrice simmetrica tBB è definita positiva, e quindi si può scrivere tBB = tUU con U triangolare superiore. Se quindi si pone Q = BU−1 e R = U si ha B = QR con R triangolare superiore e tQQ = tU−1 tBBU−1 = tU−1 (tUU)U−1 = I, cioè Q ortogonale). (Suggerimento: si usi l’Esercizio 64 .) 66 (Least squares solution) A volte invece che risolvere il sistema Ax = b (che potrebbe anche non essere risolvibile, per esempio se A ha più righe che colonne), si cerca una soluzione ai minimi quadrati, cioè una soluzione che minimizza la norma kAx − bk2 , dove A è una matrice n × m. È chiaro che una soluzione vera è anche una soluzione ai minimi quadrati, ma in genere non è vero il viceversa. Osservare che al variare di x ∈ Rm i punti Ax − b ∈ Rn possono scriversi come combinazioni delle colonne di A −b + x1 a1 + x2 a2 + . . . + xn an , e determinare la soluzione x ortogonalizzando i vettori a1 , a2 , . . . , an con l’ortogonalizzazione di Gram–Schmidt (supponendo che i ai siano linearmente indipendenti).
❊❊❊
When a function habitually predominates, a typical attitude is produced. According to the nature of the differentiated function, there will be constellations of contents that create a corresponding attitude.(14) Psychological Types C.G. J UNG (1875–1961)
C APITOLO
V Curve, grafici e superfici nello spazio
Questo capitolo tratta di due classi di funzioni a valori nello spazio tridimensionale, di rilievo sia dal punto di vista geometrico che da quello fisico: quelle che parametrizzano le curve e quelle che definiscono le superfici nello spazio. Le curve verranno esaminate dapprima dal punto di vista cinematico, cioè nella loro interpretazione di traiettorie di corpi in movimento, con particolare
riferimento alle nozioni di velocità, retta tangente, accelerazione. Successivamente ci dedicheremo ad alcuni aspetti più geometrici, indipendenti dalla parametrizzazione, quali le nozioni legate alla lunghezza, alla curvatura ed alla torsione di una curva. Introdurremo inoltre alcuni concetti di base relativi alle superfici nello spazio ed ai grafici delle funzioni di due variabili.
U
na funzione, come sappiamo, è una relazione che ad ogni elemento del suo dominio D associa uno ed un solo elemento del codominio C. Quando il codominio è un sottoinsieme dello spazio euclideo tridimensionale, cioè C ⊂ R3 , le funzioni si prestano ad interessanti interpretazioni, sia geometriche che fisiche: se il dominio D ⊂ Rn , con n = 1, 2, esse possono essere viste rispettivamente come parametrizzazioni di curve e superfici nello spazio. In questo capitolo fissiamo l’attenzione proprio su queste due categorie di funzioni.
§ 1. Curve parametriche Abbiamo visto nel Capitolo III, § 7, l’utilità delle rappresentazioni parametriche per descrivere le rette ed i segmenti in R3 . Ad esempio il segmento di estremi O = (0, 0, 0) e A = (xA , yA , zA ) può essere espresso mediante la parametrizzazione # » r(t) = tOA = txA i + tyA j + tzA k,
t ∈ [0, 1],
Al solito, scriveremo f:D→C.
228
Curve, grafici e superfici nello spazio
F V.1: la linea più sottile corrisponde al grafico della funzione, da R ad R2 , (x, y) = (cos t, sin t). Tale funzione può essere vista anche come parametrizzazione della curva γ, r(t) = cos t i+sin t j, contenuta nel piano xy, il cui sostegno è rappresentato nello stesso piano xy dalla circonferenza disegnata con tratto più spesso.
dove i, j e k costituiscono la terna destrorsa fondamentale di R3 . Ci proponiamo adesso di estendere quest’idea al caso di curve in R3 , nel senso di sottoinsiemi non necessariamente rettilinei che corrispondano ad una idea intuitiva di essere “di dimensione 1”. L’oggetto di studio saranno quindi le funzioni r : [a, b] → R3 , che solitamente indicheremo con la scrittura x(t) r(t) = y(t) = x(t) i + y(t) j + z(t) k, t ∈ [a, b]. z(t)
Vale
la pena di sottolineare che in questo contesto anche i segmenti rettilinei vengono chiamati “curve”.
Più
in generale possiamo considerare curve in Rn (si veda l’Esercizio 8 a pagina 271).
La variabile t è il parametro della curva, mentre l’immagine γ = r([a, b]) ⊂ R3 è detta sostegno della curva o semplicemente curva. (V.1) Definizione. Una curva è definita da una funzione continua r : [a, b] → R3 , la sua parametrizzazione, e dal suo sostegno γ = r([a, b]). La parametrizzazione r contiene le informazioni sul modo in cui la curva viene percorsa: come vedremo, queste informazioni possono avere una interpretazione cinematica (velocità, accelerazione, ecc..), nel caso in cui si legga la parametrizzazione come legge oraria di un punto in movimento (e in questo caso il parametro t rappresenta il tempo). Le funzioni x(t), y(t) e z(t) che intervengono nella parametrizzazione sono le coordinate, o componenti scalari, della curva ed i punti r(a) e r(b) sono gli estremi della curva. La curva viene detta continua se tali sono le sue componenti. Se la curva è contenuta in un piano allora parleremo di curva piana. Un caso tipico è quello delle funzioni r : [a, b] → R2 viste come parametrizzazioni di curve contenute nel piano xy. Tale caso si può ricondurre al precedente semplicemente ponendo z(t) ≡ 0.
È importante distinguere il sostegno della curva dal grafico di r: il sostegno è un sottoinsieme di R3 (dove vivono x, y e z), mentre il grafico è un sottoinsieme di R4 (con coordinate x, y, z e t), che in generale non sappiamo rappresentare graficamente. La curva è quindi una proiezione del grafico. Questa idea è illustrata per una curva piana (caso facile da visualizzare) in Figura V.1.
Se vogliamo che la situazione de-
scritta si avvicini all’idea intuitiva di curva sarà necessario assumere la continuità della curva, cosa che faremo lungo tutto il capitolo.
§ 1. Curve parametriche
229
(V.2) Esempio (Grafici di funzioni). Il modo più semplice per definire una curva piana è quello di considerare il grafico di una funzione di una variabile f : [a, b] → R. Allora lungo la curva vale la relazione y = f (x), perciò per scriverne una parametrizzazione possiamo scegliere x = t come parametro ed ottenere immediatamente y = f (t). La parametrizzazione naturale sarà quindi data da r(t) = t i + f (t) j,
t ∈ [a, b].
è parametrizzato da t ∈ [0, 1].
curve vengono a volte dette curve cartesiane. Volendo potremmo semplicemente scrivere r(x) = x i + f (x) j,
Ad esempio l’arco della parabola di equazione y = 1 − x2 contenuto nel primo quadrante, cioè la curva n o γ = (x, y) ∈ R2 : y = 1 − x2 , x ≥ 0, y ≥ 0 ,
r(t) = t i + (1 − t2 ) j,
Queste
x ∈ [a, b].
Dato però il vasto numero di lettere a nostra disposizione, per non generare inutili confusioni, preferiamo riservare alla lettera x il ruolo di coordinata e non quello di parametro.
(V.3) Definizione. Quando r(a) = r(b), cioè quando gli estremi di γ coincidono, la curva si dice chiusa. Se r è iniettiva su [a, b), vale a dire se la curva non presenta autointersezioni, allora si dice semplice. (V.4) Esempio. Consideriamo la parametrizzazione r(t) = 2 cos t i + 2 sin t j,
t ∈ [a, b].
Se [a, b] = [0, 2π] è facile convincersi che r parametrizza la circonferenza γ di raggio 2 centrata nell’origine del piano xy. Si tratta perciò di una curva chiusa e piana, la cui parametrizzazione risulta semplice (ogni punto di γ eccetto (2, 0) = r(0) = r(2π) corrisponde ad esattamente un valore del parametro). Se invece [a, b] = [0, 3π] otteniamo ancora una parametrizzazione di γ, che questa volta viene “percorsa” una volta e mezza. Perciò la parametrizzazione non è semplice, né chiusa. Infine consideriamo la r(t) = 2 sin t i + 2 cos t j,
F V.2: la curva rappresentata è chiusa e si autointerseca nei punti A e B, quindi non è semplice.
t ∈ [0, 2π].
Di nuovo si tratta di una parametrizzazione di γ, stavolta percorsa in senso orario. Risulta chiaro dall’esempio precedente che una stessa curva può essere parametrizzata in infiniti modi diversi. (V.5) Definizione. Data una curva γ, di parametrizzazione r(t) : [a, b] → R3 , consideriamo una qualunque funzione biunivoca e continua f : [c, d] → [a, b]. Posto t = f (τ) abbiamo che r˜(τ) = r( f (τ)) : [c, d] → R3 è di nuovo una parametrizzazione di γ. r e r˜ si dicono allora parametrizzazioni equivalenti.
Quindi f è sempre crescente oppure sempre decrescente.
230
Le curve sono unidimensionali? L’idea che una curva, così come l’abbiamo definita all’inizio del capitolo, sia un oggetto “di dimensione uno” è perlomeno discutibile. Come prima cosa, è necessario interrogarci su che cosa sia la dimensione di un insieme. Sappiamo infatti definire la dimensione di uno spazio vettoriale, e conseguentemente la dimensione della retta, del piano e dello spazio. Quando l’oggetto non ha la struttura di uno spazio vettoriale, invece, la nozione di dimensione rimane, al momento, nella sfera delle idee intuitive. Innanzitutto, ci possiamo porre ingenuamente la domanda se spazi di dimensione diversa abbiano o meno ugual numero di punti, cioè se possano essere messi in corrispondenza biunivoca. A questa domanda risponde un famoso esempio di Georg Cantor del 1878, che mette in corrispondenza biunivoca un segmento ed un quadrato (il Lettore interessato può farsene facilmente una ragione da solo). È naturale allora porsi il problema se tale corrispondenza possa essere anche continua, o, in altri termini, se esiste una curva continua il cui sostegno sia l’intero quadrato. Fu il matematico torinese Giuseppe Peano, nel 1890, a produrre una curva che riempie il quadrato.
La costruzione gli piacque così tanto che la fece affrescare sul muro della terrazza della sua villa. La curva di Peano è ottenuta come limite di un processo di approssimazione, il cui più semplice esempio fu dato da Hilbert nel 1891, e di cui presentiamo qui una variante particolarmente decorativa. Partiamo dalla prima figura in alto a sinistra e, dopo averla rimpicciolita di un quarto, replichiamola in
Curve, grafici e superfici nello spazio
quattro quadrati adiacenti, in modo che, insieme, essi formino un quadrato delle dimensione del primo. Per connettere le quattro figure, rimuoviamo i quattro segmenti obliqui prossimi al centro del quadrato e connettiamo i lati monchi con quattro segmentini a due a due paralleli agli assi. È questo il secondo passo dell’iterazione che produce la figura in basso a sinistra. Ripetendo questo procedimento otteniamo la figura in alto a destra, e così via. La curva si otterrà come limite delle approssimanti, al tendere all’infinito del numero di iterazioni. Le curve di Peano e di Hilbert hanno lunghezza infinita, non sono derivabili in alcun punto, e non racchiudono un’area. Una curva di lunghezza infinita e non derivabile in alcun punto, ma racchiudente un’area finita, fu trovata da Helge von Koch nel 1904, con un procedimento simile a quello di Peano. In questo caso si parte da un triangolo equilatero, si divide ciascuno dei 3 lati in tre, e sul terzo centrale si costruisce un triangolo equilatero; si ripete poi il procedimento su ciascuno dei 12 segmenti della poligonale ottenuta, e così via, come raffigurato nel disegno. Detta L la lunghezza del primo segmento, dopo il primo passo la lunghezza diviene 4L/3, e, ad ogni passo, la lunghezza totale si moltiplica per 4/3. Al passo k la lunghezza è 4k L/3k e tende al’infinito con k. La curva di von Koch ha la proprietà di autosimilarità, che, molto grossolanamente, significa che ingrandendone una sua qualunque parte, si ritrova la curva di partenza, a meno di rotazioni o riflessioni. Gli studi sulla nozione di dimensione, a partire dalle scoperte di Cantor e Peano, portarono nel 1918 alla definizione di dimensione frazionaria da parte di Felix Hausdorff, e alla conseguente nozione di curva frattale a dimensione diversa da 1, di cui la curva di Peano fornisce il primo esempio storico. In pratica, anche se non si tratta di una definizione rigorosa(15) , consideriamo il minimo numero N(δ) di dischi diametro minore o uguale δ necessarie per ricoprire E. La dimensione di Hausdorff è allora il limite ln(N(δ)) dimH (E) = − lim . δ→0 ln(δ) Poiché per ricoprire la curva di von Koch ci vogliono 4 dischi di diametro L/3, 16 dischi di diametro L/9, e 4k dischi di diametro L/3k , ecc., si verifica facilmente che essa ha dimensione di Hausdorff ln 4/ ln 3 = 1.261 . . . .
§ 2. Derivazione per componenti
231
Con un piccolo abuso di linguaggio, questo ci permette di trasferire le proprietà delle parametrizzazioni a quelle delle curve. Ad esempio, diremo che una curva è semplice se ammette una parametrizzazione semplice. Possiamo suddividere le infinite parametrizzazioni (semplici) di una curva in due grandi classi, distinte dal verso di “percorrenza”, o orientazione, della curva stessa al crescere di t. In particolare, se la funzione f nella Definizione (V.5) è crescente, allora f (c) = a, f (d) = b ed il cambiamento di parametro conserva l’orientazione della curva. Se invece f è decrescente l’orientazione viene invertita. In particolare, se desideriamo invertire l’orientazione della curva basta scegliere f (τ) = −τ, ottenendo la parametrizzazione r˜(τ) = x(−τ) i + y(−τ) j + z(−τ) k, τ ∈ [−b, −a]. Segnaliamo che uno dei problemi tipici in questo contesto consiste nel dover determinare una parametrizzazione di una curva definita in altro modo, ad esempio come intersezione di due superfici. Dato però che il Lettore puntiglioso potrebbe pretendere di non sapere ancora cosa sia una superficie, rimandiamo questa discussione dopo il § 9, nell’Esercizio (V.2) a pagina 259. Per concludere questa raccolta di proprietà elementari delle curve, menzioniamo una utile operazione tra curve, la giustapposizione. Consideriamo due curve γ1 e γ2 , parametrizzate rispettivamente da r1 (t), t ∈ [a, b] e r2 (t), t ∈ [c, d]. Se il secondo estremo di γ1 coincide con il primo di γ2 , cioè se r1 (b) = r2 (c), allora possiamo considerare l’unione di γ1 e γ2 come una unica curva, detta appunto la loro giustapposizione.
§ 2. Derivazione per componenti Una interpretazione alternativa, ma altrettanto utile, di una funzione r : [a, b] → R3 è quella cinematica: possiamo pensare che r(t) descriva la posizione all’istante t di una particella che si muove in R3 . In questo senso la curva γ risulta essere semplicemente la traiettoria della particella. Le molte parametrizzazioni della stessa curva rappresentano, da questo punto di vista, gli infiniti modi diversi (con velocità diverse) di percorrere tale traiettoria. Nello spirito dell’interpretazione cinematica siamo interessati a definire la velocità (e l’accelerazione) della particella. (V.6) Definizione. Diciamo che r è derivabile se tali sono le sue componenti scalari. In questo caso, la sua velocità (o derivata) è data da v(t) = r′ (t) = x′ (t) i + y′ (t) j + z′ (t) k,
t ∈ [a, b],
mentre la velocità scalare è il modulo di tale vettore, v(t) = kr′ (t)k. Se r′ è a sua volta continua allora si dice che r è di classe C1 , mentre se è derivabile l’accelerazione è a(t) = r′′ (t) (se t = a tutte le derivate vanno intese come derivate destre, se t = b come derivate sinistre).
D’ora in poi, quando non specifi-
cato diversamente, sottintenderemo sempre che le curve con cui abbiamo a che fare sono semplici.
Si veda
anche l’Esercizio (V.1) a pagina 258.
Manipolando
opportunamente le espressioni di r1 e r2 è possibile costruire una unica parametrizzazione per la curva ottenuta, anche se questo si rivela spesso superfluo dal punto di vista delle applicazioni. Si veda a tal proposito l’Esercizio (V.1) a pagina 258.
In
analogia con quanto noto per le funzioni reali di variabile reale, definizioni equivalenti di derivata sono r(t + h) − r(t) , r′ (t) = lim h h→0 nel senso che
r(t + h) − r(t)
lim
− r′ (t)
= 0 , h h→0 o anche r(t + h) = r(t) + r′ (t)h + R(h) , dove il resto è “o piccolo” dell’incremento, cioè kR(h)k = 0. lim h h→0
232
Curve, grafici e superfici nello spazio
Le leggi della meccanica La meccanica newtoniana ha per oggetto lo studio del moto di un sistema di corpi materiali (cioè dotati di massa) nello spazio euclideo tridimensionale. Nel Philosophiae Naturalis Principia Mathematica (1687), Isaac Newton, dopo aver introdotto un sistema di definizioni, ipotesi ed assiomi riguardanti la massa di un corpo, le nozioni di velocità e quella di accelerazione e di forza, così enunciò le leggi che sono a fondamento della meccanica (per Newton il moto è la quantità di moto, cioè la massa per la velocità e la sua variazione è dunque la massa per l’accelerazione): L EX I. Corpus omne perseverare in statu suo quiescendi vel movendi uniformiter in directum, nisi quatenus a viribus impressis cogitur statum illum mutare. L EX II. Mutationem motus proportionalem esse vi motrici impressæ & fieri secundum lineam rectam qua vis illa imprimitur. L EX III. Actioni contrariam semper & æqualem reactionem : sive corporum duorum actiones in se mutuo semper esse æquales & in partes contrarias dirigi. Oggi alla prima legge, che si può far discendere dalla seconda, si fa corrispondere il principio galileiano di inerzia, una ipotesi fondamentale sulla geometria del nostro spazio-tempo fisico. Esso postula l’esistenza di sistemi di coordinate (che sono infatti dette inerzia-
li) che godono delle due seguenti proprietà: I ) le leggi della meccanica sono le stesse in tutti i riferimenti inerziali; II ) un riferimento che si muova di moto rettilineo uniforme rispetto ad un sistema di riferimento inerziale è a sua volta inerziale. Tali postulati rendono possibile la descrizione dei moti e delle leggi che li regolano attraverso delle funzioni ri : R → R3 , che rappresentano le posizioni dei corpi materiali di masse mi in un dato sistema inerziale. Utilizzeremo la notazione r(t) = (r1 (t), . . . , rn (t)) : R → R3n . La seconda legge asserisce l’esistenza di una funzione (il vettore delle forze) F = (F1 , . . . , Fn ) : R × R3n × R3n → R3n
alle cui componenti Fi sono proporzionali le accelerazioni (cioè derivate seconde delle posizioni): mi ri′′ = Fi (t, r, r′ ),
i = 1, . . . , n.
Questa relazione è detta equazione di Newton ed è un’equazione differenziale. In virtù del Teorema di esistenza e unicità (VIII.9) (che vedremo a pagina 394), ne consegue il principio di determinismo (o di causalità) di Newton, secondo cui il movimento tutto intero del sistema è univocamente determinato dall’insieme delle posizioni e delle velocità iniziali. Della terza legge avremo modo di parlare più avanti, nell’Esempio (V.15).
(V.7) Esempio. Consideriamo una particella che si muove secondo la legge oraria r(t) = 3 cos ωt i + 4 cos ωt j + 5 sin ωt k,
ω > 0.
Si vede subito che il moto è periodico, infatti r(t + 2π/ω) = r(t) per ogni t. La velocità vettoriale è data da v(t) = −3ω sin ωt i − 4ω sin ωt j + 5ω cos ωt k, e quindi quella scalare vale p v(t) = kv(t)k = 9ω2 sin2 ωt + 16ω2 sin2 ωt + 25ω2 cos2 ωt = 5ω. L’accelerazione è invece a(t) = −3ω2 cos ωt i − 4ω2 cos ωt j − 5ω2 sin ωt k. Osserviamo che, indicando con x, y e z le componenti di r abbiamo subito che 4x = 3y. Inoltre, elevando al quadrato e sommando otteniamo x2 + y2 + z2 = 25; quindi la traiettoria γ è contenuta nell’insieme 4x − 3y = 0 x2 + y2 + z2 = 25
In
realtà è facile vedere che ricopre tutto l’insieme.
§ 2. Derivazione per componenti
233
F V.3: raffigurazione dei vettori 1 (r(t0 + h) − r(t0 )) paralleli alle rette h secanti e del loro limite per h → 0.
che è una circonferenza di raggio 5. Visto che la velocità scalare è costante, si tratta di un moto circolare uniforme. Dalla fisica sappiamo che l’accelerazione risulta centripeta, cioè, come è facile verificare, v(t) · a(t) = 0,
per ogni t.
Infatti è intersezione
di una sfera di raggio 5 con un piano che passa per il suo centro.
Come visto, l’idea di curva generalizza in qualche modo quella di grafico di una funzione di una variabile. È quindi naturale cercare di definire la nozione di retta tangente ad una curva γ in un suo punto. Se γ è parametrizzata da r, consideriamo la retta secante la curva, passante per i due punti r(t0 ) e r(t0 + h) (che supponiamo diversi fra loro, si veda la Figura V.3). Come abbiamo imparato nel Capitolo III, § 7, una parametrizzazione di questa retta è x(t +h)−x(t ) x(t0 ) + t 0 h 0 r(t0 + h) − r(t0 ) 0) = y(t0 ) + t y(t0 +h)−y(t r(t0 ) + t h h z(t0 +h)−z(t0 ) z(t0 ) + t h e al tendere di h a zero troviamo l’espressione p(t) = r(t0 ) + tr′ (t0 ). Ad una prima analisi sembra quindi che, in presenza di una parametrizzazione derivabile, sia sufficiente derivarla per ottenere la direzione della retta tangente: in effetti, in cinematica il vettore velocità sembra essere sempre “tangenziale” (cioè diretto lungo la tangente) alla traiettoria. In realtà ciò non è sempre vero, come mostra l’esempio seguente. (V.8) Esempio. Consideriamo la curva piana γ parametrizzata da r(t) = t3 i + t2 j,
t ∈ [−2, 2].
È chiaro che r è di classe C1 (le sue componenti sono √3 dei polinomi). Da √3 3 2 x = t otteniamo subito t = x, e quindi y = t = x2 . Ne segue che√γ è 3 una curva cartesiana e corrisponde al grafico della funzione f (x) = x2 , −8 ≤ x ≤ 8, che per t = x = 0 presenta una cuspide, perciò non ammette retta tangente (si veda la Figura V.4). Osserviamo che r′ (t) = 3t2 i + 2t j, perciò r′ (0) = 0. F V.4
234
Curve, grafici e superfici nello spazio
Emerge chiaramente dall’esempio che i problemi nascono dall’annullarsi della derivata: se la velocità è nulla, cioè se la particella si ferma, nulla le impedisce di ripartire in direzione diversa creando, nella sua traiettoria, punti angolosi o cuspidi. Questo ragionamento motiva la seguente definizione. (V.9) Definizione. Una curva γ si dice regolare (o liscia) se ammette una parametrizzazione r tale che ➔ r è di classe C1 e
Se γ è chiusa, cioè r(a) = r(b), è necessario richiedere anche che r′ (a) = r′ (b).
➔ kr′ (t)k , 0 per ogni t. Si dice invece regolare a tratti se le condizioni precedenti valgono eccetto un numero finito di valori di t. Si definisce retta tangente ad una curva regolare γ in un suo generico punto r(t0 ) la retta parametrizzata da ′
p(t) = r(t0 ) + tr (t0 ) = (x(t0 ) + x′ (t0 )t) i + (y(t0 ) + y′ (t0 )t) j + (z(t0 ) + z′ (t0 )t) k,
t ∈ R,
Una curva regolare a tratti può essere vista come giustapposizione di un numero finito di curve lisce. Sono curve regolari a tratti tutti i poligoni. Vale la pena di osservare che per r′ (t0 ) = 0 la formula si riduce a p(t) ≡ r(t0 ), che non parametrizza una retta, ma un punto!
ed il versore tangente a γ in r(t0 ) è quello orientato lungo tale retta, T(t0 ) =
r′ (t0 ) . kr′ (t0 )k
(V.10) Esempio. Riprendendo l’Esempio (V.8) abbiamo che, come già osservato, r è di classe C1 e " 2# " # 3t 0 r′ (t) = = se e solo se t = 0, 0 2t perciò γ risulta regolare a tratti. La sua retta tangente nel punto che corrisponde a t = 1 è parametrizzata da p(t) = (1 + 3t) i + (1 + 2t) j,
t ∈ R.
Eliminando il parametro dalla precedente equazione vettoriale si ottiene che la retta in questione ha equazione cartesiana y = (2x + 1)/3. Il Lettore può facilmente verificare che saremmo giunti allo stesso risultato √3 2 cercando l’equazione della retta tangente al grafico di y = x in x0 = 1. Quindi, almeno in questo esempio, le diverse definizioni di retta tangente coincidono (si veda anche l’Esercizio 6 a pagina 270). Concludiamo questo paragrafo con una lista di regole di derivazione per funzioni a valori vettoriali, che possono essere facilmente dedotte da quelle note dal calcolo differenziale per funzioni di una variabile. La loro dimostrazione è lasciata al Lettore.
Ovviamente se r′ (t) , 0.
kr′ (t)k , 0 se e solo
§ 3. Integrazione per componenti
Le leggi di Keplero 1. L E ORBITE DEI
PIANETI SONO ELLISSI , DI CUI IL SOLE
OCCUPA UNA DEI DUE FUOCHI .
2. I
235
mini che oggi conosciamo. La legge della aree viene dedotta dalle osservazioni sul moto di Marte nell’Astronomia Nova,(16) nel brano riprodotto nella fotografia.
PIANETI DESCRIVONO CURVE PIANE E I RAGGI VET-
TORI , PARTENDO DAL CENTRO DEL SOLE , DESCRIVONO AREE PROPORZIONALI AL TEMPO.
3. I
QUADRATI DEI PERIODI DI RIVOLUZIONE DEI PIANE -
TI ATTORNO AL SOLE SONO PROPORZIONALI AI CUBI DEI SEMIASSI MAGGIORI DELLE ELLISSI . Le prime due leggi apparvero nell’Astronomia nova del 1609 e furono dedotte dalle precise osservazioni delle posizioni di alcuni pianeti, Marte, Terra e Luna dell’astronomo danese Tycho Brahe; queste osservazioni erano in contraddizione non tanto con la teoria tolemaica quanto con quella copernicana; come scopriremo nel Capitolo VIII, esse permettono di ricavare la legge oraria dei pianeti da quelle di Newton (pagina 232). La terza legge apparve ufficialmente molto più tardi nell’Harmonice Mundi del 1619, ma la sua ricerca impegnò Keplero per decenni, visto che già nel suo primo libro, il Mysterium Cosmographicum del 1596, si era posto il problema di trovare una relazione fra il tempo di rivoluzione di un pianeta e il raggio della sua orbita. Keplero non espresse affatto le sue leggi nei ter-
Nello stesso libro viene formulata la seconda legge: Ergo ellipsis est planeta iter. [Astronomia Nova, Cap. 55, p. 285] Ed infine l’ultima legge: Res est certissima exactissimaque, quod proportio quæ est inter binorum quorumqumque Planetorum tempora periodica, sit præcise sesquialtera proportionibus mediarum distantiarum, id est Orbium ipsorum. [Harmonice Mundi, Cap. 3, Libro 5, p. 189]
(V.11) Regola. Siano u, v ∈ C1 (R; R3 ) e λ ∈ C1 (R; R). Allora d (λ(t)u(t)) = λ′ (t)u(t) + λ(t)u′ (t) ➔ dt ➔
d (u(t) · v(t)) = u′ (t) · v(t) + u(t) · v′ (t) dt
➔
d (u(t) × v(t)) = u′ (t) × v(t) + u(t) × v′ (t) dt
➔
d (u(λ(t))) = λ′ (t)u′ (λ(t)) dt
§ 3. Integrazione per componenti Così come una funzione vettoriale può essere derivata termine a termine, allo stesso modo essa può essere integrata termine a termine, costruendo un vettore primitiva del vettore di partenza. Consideriamo una parametrizzazione r : [a, b] → R3 . In analogia con quanto abbiamo visto nel
Ovviamente vale anche la d (u(t) + v(t)) = u′ (t) + v′ (t), dt ma volevamo evitare di offendere il Lettore scrivendola troppo evidentemente. Inoltre ciascuna funzione può anche essere definita su dei sottoinsiemi del corrispondente dominio, a patto che le operazioni scritte sotto siano ben definite. ➔
236
Curve, grafici e superfici nello spazio
primo volume per le funzioni di una variabile possiamo fissare una partizione a = t0 < t1 < t2 < · · · < tn < tn+1 = b dell’intervallo [a, b] e dei punti base ξ∗ ∈ [ti , ti+1 ]. Le somme di Riemann corrispondenti sono date da n X i=0
(ti+1 − ti )r(ξ∗i ) n X
= i i=0
(ti+1 − ti )x(ξ∗i ) + j
n X i=0
(ti+1 − ti )y(ξ∗i ) + k
n X (ti+1 − ti )z(ξ∗i ). i=0
Riconosciamo nell’ultimo membro le somme di Riemann delle tre funzioni scalari x, y e z. Se queste sono continue sappiamo che convergono ai rispettivi integrali definiti. Otteniamo la seguente definizione. (V.12) Definizione. L’integrale definito della funzione continua r : [a, b] → R è dato dal vettore Z
Z
b
a
Z
b
x(t) dt + j
r(t) dt = i a
Z
b
b
y(t) dt + k a
z(t) dt. a
Dalle proprietà degli integrali di funzioni scalari possiamo dedurne di analoghe per quelli di funzioni vettoriali. In particolare si può estendere il Teorema Fondamentale del Calcolo. (V.13) Proprietà. Sia r : [a, b] → R continua. Allora: Rt ➔ la funzione R(t) = a r(τ) dτ è di classe C1 e vale R′ (t) = r(t)
per ogni t ∈ [a, b]; Z
b
1
➔ se r è di classe C si ha
a
r′ (t) dt = r(b) − r(a);
➔ vale la disuguaglianza triangolare
Z b
Z b
kr(t)k dt. r(t) dt
≤
a a
(V.14) Esempio. Supponiamo che un proiettile venga sparato con una velocità di modulo v, contenuta nel piano xz ed inclinata di un angolo α rispetto al piano xy, e che successivamente su di esso agisca solo l’accelerazione di gravità a = −1 k. Se indichiamo con r(t) la sua posizione all’istante t e fissiamo il sistema di riferimento in modo che il proiettile parta dall’origine otteniamo r(0) = 0, r′ (0) = v cos α i + v sin α k e r′′ (t) = −1 k. Perciò Z
′
t
′
r (t)−r (0) = 0
r′′ (τ) dτ = −1t k,
da cui r′ (t) = v cos α i+(v sin α−1t) k
Sia
f : [a, b] → R e a = t0 < t1 < t2 < · · · < tn < tn+1 = b una partizione dell’intervallo [a, b]. Nel primo volume (Capitolo XI) abbiamo definito la somma inferiore corrispondente come n X (ti+1 − ti ) inf f i=0
[ti ,ti+1 ]
e la somma di Riemann come n X (ti+1 − ti ) f (ξ∗i ), i=0
dove gli arbitrari punti ξ∗ ∈ [ti , ti+1 ] sono i punti base della partizione. Abbiamo visto che se la funzione f è continua allora esiste il limite delle somme di Riemann quando l’ampiezza della partizione tende a 0. Abbiamo definito tale valore come l’integrale secondo Riemann di f su [a, b]: Z b f (t) dt. a
Tale valore coincide inoltre con l’estremo superiore fra tutte le somme inferiori (e con l’estremo inferiore delle somme superiori!).
Le due prime proprietà discendono direttamente dalla teoria degli integrali per funzioni scalari; la terza si ottiene dalla formulazione con le somme di Riemann come facile conseguenza della disuguaglianza triangolare in R3 (Esercizio 9 a pagina 271).
§ 3. Integrazione per componenti
Keplero fra scienza, mistica e fantascienza L’opera scientifica di Keplero riflette tutte le contraddizioni della transizione dalla scienza medievale a quella moderna. Da un lato, infatti, egli è uno scienziato moderno, capace di distaccarsi dalle teorie aristotelico–tolemaiche sulla base della loro discrepanza rispetto ai dati sperimentali e di abbandonare la concezione animistica a favore di quella meccanicista. Dall’altra parte, tuttavia, Keplero era profondamente legato ad una concezione mistico–pitagorica del cosmo. Nel Mysterium Cosmographicum (1595) sviluppa una strampalata teoria che collegava le misure delle orbite dei pianeti (allora ne erano noti sei) alle proprietà dei poliedri regolari (cinque). Nella sfera di Saturno iscrive un esaedro, in esso la sfera di Giove, in cui è iscritto un tetraedro contenente la sfera di Marte, e poi il dodecaedro, l’icosaedro e l’ottaedro che iscrivono rispettivamente le sfere della Terra, di Venere a di Mercurio. Nel De Harmonice Mundi (1619) Keplero ritornava, come dice il suo titolo, alla teoria pitagorica dell’armonia del mondo esposta da Platone nel Timeo
237
con una innovazione fondamentale: mentre per i Greci la musica delle sfere era monofonica, e consisteva di scale alle quali ciascun pianeta contribuiva con una nota, per Keplero essa diventa polifonica e consiste di accordi che risultano dalle scale simultaneamente suonate dai vari pianeti. Studiando i rapporti fra le lunghezze degli archi di orbita percorsi da un pianeta in un giorno, alla massima e minima distanza dal Sole, egli vede una perfetta corrispondenza con intervalli musicali e parti vocali. Nel gran coro planetario, Mercurio canta da soprano, Marte da tenore, Saturno e Giove da bassi e la Terra e Venere da alti. Keplero può anche essere considerato il primo scrittore di fantascienza. Nel Somnium (pubblicato postumo nel 1634), egli descrive un fantastico viaggio sulla Luna avvenuto scivolando sul cono d’ombra di un’eclisse di Luna, all’andata, e su quello di un’eclisse di Sole al ritorno.
e quindi la legge oraria del moto è data da Z t 1 r(t) = r′ (τ) dτ = vt cos α i + vt sin α − 1t2 k, 2 0 con tutte le note conseguenze. Ad esempio, il proiettile ritocca terra per z(t) = vt sin α − (1t2 )/2 = 0, cioè quando t = t¯ = (2v sin α)/1, perciò la gittata è data x(t¯) = (v2 /1) sin 2α, ed è massima per α = π/4. (V.15) Esempio (Conservazione della quantità di moto). In un sistema meccanico di n punti materiali (si veda l’approfondimento a pagina 232), le quantità pi = mi vi = mi ri′ prendono il nome di momenti dei corpi. Il momento totale o quantità di moto del sistema è definito come la somma dei momenti di tutti i corpi del sistema n X p= pi .
Questo
principio si può verificare empiricamente in molte situazioni dove ci sia un sistema di corpi interagenti, in assenza di forze esterne. Per esempio il principio spiega il trasferimento del moto dopo l’urto fra due palle in un biliardo.
i=1
Le Regole (V.11), insieme alla seconda legge di Newton, implicano che la derivata del momento totale sia data dalla somma di tutte le forze interne al sistema. Secondo la terza legge di Newton, in un sistema meccanico
In formule, p′ =
n X i=1
p′i =
n X
n X
m i ai = i=1
i=1
Fi .
238
Curve, grafici e superfici nello spazio
privo di forze esterne, la forza FiP agente sull’i-esimo corpo si decompone nella somma dei contributi Fi = j,i Fi j delle forze di interazione esercitate su di esso dagli altri corpi del sistema. La terza legge postula inoltre un principio di simmetria: la forza di interazione esercitata dall’i-esimo corpo sul j-esimo è uguale e contraria a quella esercitata dal j-esimo corpo sull’i-esimo, cioè Fi j = −F ji . Di conseguenza, la somma totale delle forze del sistema è necessariamente zero. Perciò avremo: ′
n X X
p (t) =
Fi j = 0 ,
per ogni t.
Per non violare il principio di iner-
zia, le forze di interazione possono dipendere solamente dalle differenze delle posizioni ri − r j e delle velocità ri′ − r′j .
i=1 j,i
Una prima conseguenza di fondamentale importanza è la conservazione della quantità di moto, che si ottiene con una semplice integrazione: p(t) = p(t0 ) = costante, per ogni t.
Conservazione
1 Pn mr M i=1 i i P 1 = b(t0 ) + p(t0 )(t − t0 ), M = ni=1 mi . M
Con una ulteriore integrazione, possiamo asserire che il baricentro del sistema si muove di moto rettilineo uniforme.
(V.16) Esempio (Conservazione del momento angolare). Consideriamo il moto di un punto in un campo di forze centrale, cioè diretto lungo la direzione della congiungente con l’origine (il centro della forza):
Per
F(ρ) = F(ρ)ρ ,
della quantità di
moto.
b=
esempio la forza gravitazionale generata da una massa puntiforme.
F : R3 → R , ρ = (x, y, z) ∈ R .
Per la seconda legge di Newton, indicando con r(t) la traiettoria del corpo, abbiamo mr′′ = F(r)r. Osserviamo che, se la forza è in ogni punto parallela al vettore r, il suo prodotto esterno con r è sempre nullo e dunque avremo: mr′′ × r = F(r)r × r = 0 ,
per ogni t .
La
quantità F(ρ) × ρ si chiama il momento della forza rispetto all’origine. Se la forza è centrale il suo momento rispetto al centro è nullo.
Consideriamo adesso il vettore momento angolare: R = p × r = mr′ × r . Derivando ed usando le Regole (V.11) otteniamo R′ = mr′′ × r + mr′ × r′ = mr′′ × r .
Infatti r′ × r′ = 0.
In definitiva abbiamo R′ (t) = 0 , per ogni t =⇒ R(t) = R(t0 ) = costante , per ogni t . La prima importante conseguenza della conservazione del momento angolare è la planarità il moto. Esso si svolge interamente nel piano ortogonale al vettore R. La seconda fondamentale conseguenza è la seguente: se fissiamo la direzione dell’asse z lungo R, nel piano in cui si svolge il moto possiamo scrivere r(t) = x(t) i + y(t) j e p(t) = mx′ (t) i + my′ (t) j,
Conservazione
del momento an-
golare.
Si ha infatti
r(t) × R = 0, in conseguenza delle Proprietà (III.31) a pagina 126.
§ 4. Lunghezza di una curva
239
in modo che R = m[x(t)y′(t) − x′ (t)y(t)]k. Poiché il momento angolare è costante, il suo modulo non dipende dal tempo, e dunque Z x(t)y′ (t) − x′ (t)y(t) = c =⇒
Legge delle aree.
b a
[x(t)y′(t) − x′ (t)y(t)] dt = c(b − a).
È possibile dimostrare che questo integrale è il doppio dell’area spazzata dal raggio vettore fra la posizione r(b) e r(a): pertanto possiamo asserire che il raggio spazza aree uguali in tempi uguali.
Si veda a tale proposito la discus-
sione a pagina 262 e seguenti. Spesso questa legge viene espressa in coordinate polari come r2 ϑ′ = costante (Esercizio (V.8)).
§ 4. Lunghezza di una curva Abbiamo già affrontato il problema di definire la lunghezza di una curva nel Capitolo XI del primo volume, almeno nel caso di curve cartesiane. In questo paragrafo ci proponiamo di ripetere i medesimi ragionamenti nel caso di parametrizzazioni generali. Sia perciò γ ⊂ R3 una curva di estremi A e B. Una poligonale inscritta in γ è semplicemente una spezzata σ costruita nel seguente modo: dopo aver fissato un numero intero n, si scelgono n punti consecutivi Pi = (xi , yi , zi ) (con i = 1, . . . , n) su γ, si definiscono P0 = A e Pn+1 = B, e si congiunge ciascun punto con il successivo mediante un segmento di linea retta, come illustra la Figura V.5. La lunghezza di σ risulta allora essere n q X
Lunghezza(σ) = i=0
(xi+1 − xi )2 + (yi+1 − yi )2 + (zi+1 − zi )2
F V.5: poligonale inscritta nella curva piana γ.
n X = kPi+1 − Pi k. i=0
(V.17) Definizione. La lunghezza di una curva è l’estremo superiore delle lunghezze delle poligonali inscritte. Il nostro obiettivo è ora quello di passare dalla definizione della lunghezza come estremo superiore ad una formulazione sotto forma di integrale, in analogia con quanto abbiamo fatto nel primo volume per l’area. Indichiamo con r : [a, b] → R3 una parametrizzazione di γ: i punti Pi della poligonale corrispondono a dei valori ti del parametro. Possiamo dunque scrivere n n n X X X
r(ti+1 ) − r(ti )
· (ti+1 − ti ). kPi+1 − Pi k = kr(ti+1 ) − r(ti )k = ti+1 − ti i=0
i=0
i=0
Nell’ultima sommatoria riconosciamo le norme dei rapporti incrementali di r(t) = x(t) i + y(t) j + z(t) k. Se supponiamo che r sia di classe C1 (cioè che ciascuna sua componente lo sia) possiamo ricondurci, con un
La lunghezza di γ può quindi essere finita o infinita. Se la lunghezza è finita diremo che la curva è rettificabile.
240
Curve, grafici e superfici nello spazio
po’ di fatica, ad una somma di Riemann della funzione kr′ (t)k. Applicando la teoria dell’integrale di Riemann otteniamo perciò il seguente utile risultato. (V.18) Teorema (Lunghezza di una curva). Se la parametrizzazione r : [a, b] → R3 della curva γ è di classe C1 ([a, b]), allora γ è rettificabile e Z
Z
b
b
′
Lunghezza(γ) = a
q (x′ (t))2 + (y′ (t))2 + (z′ (t))2 dt.
kr (t)k dt =
a
(V.19) Esempio. Consideriamo la curva cartesiana γ, grafico della funzione y = f (x), a ≤ x ≤ b (che supponiamo di classe C1 ). La sua naturale parametrizzazione è r(t) = t i + f (t) j, t ∈ [a, b], perciò r′ (t) = i + f ′ (t) j e Z bq 1 + [ f ′ (t)]2 dt. Lunghezza(γ) =
La
dimostrazione di questo teorema usa una nozione che non abbiamo ancora studiato, la continuità uniforme, ed è perciò posticipata al Capitolo VII, nell’approfondimento a pagina 383.
La lunghezza così ottenuta non dipende dalla parametrizzazione scelta (si veda l’Esercizio 10 a pagina 271).
In accordo con la formula trovata nel primo volume (Capitolo XI).
a
Supponiamo
che a e b non siano entrambi nulli, altrimenti la curva si riduce ad un punto.
(V.20) Esempio. Consideriamo l’elica circolare di raggio a e passo b t ∈ [0, 2π].
r(t) = a cos t i + a sin t j + bt k,
Ci proponiamo di calcolarne la lunghezza. Evidentemente r è di classe C1 . Abbiamo√r′ (t) = −a sin t i + a cos t j + b k, perciò la velocità sca√ lare kr′ (t)k = a2 sin2 t + a2 cos2 t + b2 = a2 + b2 risulta costante. La lunghezza dell’elica è quindi data da Z 2π √ kr′ (t)k dt = 2π a2 + b2 . 0
Nel Teorema (V.18) abbiamo supposto che la parametrizzazione r fosse di classe C1 , di modo che l’integrando kr′ k fosse continuo. In realtà, utilizzando la proprietà di additività rispetto al dominio dell’integrale definito, possiamo ammettere che kr′ k presenti un numero finito di discontinuità (cioè che la curva ammetta un numero finito di “angoli”) e definire la lunghezza della curva come la somma delle lunghezze dei suoi tratti regolari. (V.21) Esempio. Consideriamo la curva piana γ parametrizzata da r(t) = (t − |t|) i + (t + 2|t|) j, −1 ≤ t ≤ 0 0≤t≤1 0
Lunghezza(γ) = −1
√
veda anche l’Esercizio 10 a pagina 271.
e
2 i − j −1 ≤ t < 0 r′ (t) = 3 j 0
dunque Z
Si
t ∈ [−1, 1].
Abbiamo
2t i − t j r(t) = 3t j
F V.6: elica circolare di raggio a e passo b.
Z
1
5 dt +
3 dt = 0
√
La 5 + 3.
curva γ è in realtà la giustapposizione di due segmenti, per cui il Lettore accorto ne poteva calcolare la lunghezza semplicemente utilizzando la geometria elementare!
§ 4. Lunghezza di una curva
241
Come abbiamo visto, una stessa curva possiede infinite parametrizzazioni (è possibile percorrere la stessa traiettoria assumendo infinite diverse velocità). Ora che siamo in possesso della nozione di lunghezza, viene naturale introdurre quella particolare parametrizzazione che corrisponde ad una particella che percorra la traiettoria con velocità scalare costantemente uguale ad 1. Secondo tale parametrizzazione la lunghezza percorsa è uguale al tempo trascorso. (V.22) Esempio. Consideriamo √ l’elica circolare dell’Esempio (V.20). Ab′ biamo visto che kr (t)k ≡ a2 + b2 quindi la lunghezza s del tratto di curva corrispondente all’intervallo [0, t] del parametro è data da Z t √ s = s(t) = kr′ (τ)k dτ = t a2 + b2 . 0
√ Poiché t varia tra 0 e 2π otteniamo che s varia tra 0 e 2π a2 + b2 , la lunghezza dell’elica. Dalla precedente relazione possiamo ricavare t in funzione di s s t = t(s) = √ 2 a + b2 e di conseguenza scrivere una nuova parametrizzazione dell’elica usando s come parametro: ! ! s s bs r¯(s) = r(t(s)) = a cos √ k, i + a sin √ j+ √ 2 2 2 2 2 a +b a +b a + b2 √ con s ∈ [0, 2π a2 + b2 ]. Con questa nuova parametrizzazione otteniamo ! ! ! s s 1 −a sin √ i + a cos √ j + bk , r¯′ (s) = √ a2 + b2 a2 + b2 a2 + b2 perciò s 1
′
k¯r (s)k = √ a2 + b2
a2
2
sin
s
!
+ √ a2 + b2
a2
cos2
s
!
+ b2 = 1. √ 2 2 a +b
Consideriamo ora il caso generale di una curva γ regolare parametrizzata da r : [a, b] → R3 . La lunghezza dell’arco di curva percorso al tempo t è Z t kr′ (τ)k dτ , 0 ≤ s ≤ L = Lunghezza(γ) s(t) =
Vale
la pena di osservare che la corrispondenza tra t ed s è biunivoca, quindi r(t) e r¯(s) parametrizzano la medesima curva.
Usando
questo parametro otteniamo che l’arco di elica corrispondente all’intervallo [s1 , s2 ] del parametro ha lunghezza Z s2 Z s2 ds = s2 − s1 . k¯r′ (s)k ds = s1
s1
Perciò r ∈ C1
e r′ (t) , 0 in [a, b].
a
(si veda la Figura V.7). Poiché r è di classe C1 , allora kr′ k è una funzione (scalare) continua e quindi il Teorema Fondamentale del Calcolo implica che s = s(t) è derivabile in [a, b] e s′ (t) = kr′ (t)k > 0.
F V.7
242
Curve, grafici e superfici nello spazio
Quindi s è monotona crescente, e quindi invertibile: possiamo cioè ricavare t in funzione di s, ottenendo dt 1 = . ds kr′ (t(s))k
e
t = t(s)
Possiamo quindi sostituire in r ottenendo una nuova parametrizzazione di γ rispetto al parametro s: r¯(s) = r(t(s)),
perciò effettivamente la velocità scalare rispetto all’ascissa curvilinea è costantemente 1. Applicando la formula per la lunghezza di una curva (Teorema (V.18)) alla nuova parametrizzazione abbiamo (ovviamente) L
L= 0
formula di derivazione della funzione inversa afferma che due funzioni una inversa dell’altra, non appena una delle due ha derivata non nulla, hanno derivate reciproche (primo volume, Capitolo VII).
0 ≤ s ≤ L.
Quest’ultima viene detta parametrizzazione rispetto all’ascissa curvilinea s. Usando le Regole (V.11) possiamo scrivere
dr¯(s) dt 1
dr¯(s)
′ ′ = r (t(s)) = r (t(s)) ′ =⇒
ds ≡ 1, ds ds kr (t(s))k
Z
La
Z L
dr¯(s)
ds.
ds ds = 0
Osserviamo
che mentre le parametrizzazioni di una curva sono infinite, ne esistono solo due rispetto all’ascissa curvilinea, distinte dall’orientazione della curva.
Confrontando questa formula con
quella generale della lunghezza di una curva si è tentati di scrivere
(1)
§ 5. Curvatura, torsione, terna intrinseca In questo paragrafo introduciamo due funzioni associate ad una curva, la curvatura e la torsione, che misurano rispettivamente quanto la curva si discosta, in ognuno dei suoi punti, dall’essere ➔ una retta,
ds = kr′ (t)k dt,
scrittura solo formale ma molto espressiva che ritroveremo alla base della definizione degli integrali curvilinei (Capitolo X).
oppure
➔ una curva piana. A tali funzioni scalari faremo corrispondere dei vettori, il vettore normale principale ed il vettore binormale, che, insieme al vettore tangente, permettono di definire in ogni punto della curva una terna di versori ortogonali naturalmente associata alla curva. Durante tutto il paragrafo r¯ = r¯(s), con 0 ≤ s ≤ L, rappresenterà la parametrizzazione secondo l’ascissa curvilinea di una curva regolare γ. Sappiamo che la direzione tangente (nel punto r¯(s)) ad una curva regolare è individuata dal vettore r¯′ (s). D’altra parte, avendo scelto come parametro l’ascissa curvilinea, tale vettore ha norma unitaria ed è quindi
In
tutto il paragrafo assumeremo tacitamente che r¯ sia di classe C3 , cioè che le sue componenti siano funzioni derivabili 3 volte, con derivate continue.
Si dr¯(s) T(s) = , ds
ricordi la Definizione (V.9) a pagina 234.
il versore tangente.
§ 5. Curvatura, torsione, terna intrinseca
243
Se γ è un segmento allora T(s) risulta essere costante, cioè T ′ (s) ≡ 0. Nel caso generale, il vettore T ′ (s) misurerà quanto velocemente varia la direzione della retta tangente, cioè quanto γ si discosta dall’essere rettilinea. Iniziamo considerando il modulo di tale vettore e definiamo
dT(s)
k(s) = , ds
la curvatura.
La curvatura è quindi uno scalare, cioè una funzione k : [0, L] → R. Il suo inverso, cioè ρ(s) = 1/k(s), è il raggio di curvatura:
ρ(s) =
1 , k(s)
il raggio di curvatura.
Se k(s) = 0 si dice, in modo un po’ improprio, che il raggio di curvatura corrispondente è infinito.
(V.23) Esempio. Consideriamo la circonferenza γ in R2 di equazione x2 + y2 = R2 . Una sua possibile parametrizzazione è data da r(t) = R cos t i + R sin t j,
t ∈ [0, 2π].
Per applicare quanto visto dobbiamo riparametrizzare γ secondo l’ascissa curvilinea. Otteniamo kr′ (t)k = R, s = Rt e quindi s s r¯(s) = R cos i + R sin j, s ∈ [0, 2πR]. R R Di conseguenza r 1 1 s 1 2 s 2 + = . cos sin k(s) = R R R R2 R2
Infatti
s s i+cos j, R R s s 1 1 T ′ (s) = − cos i− sin j. R R R R
T(s) = r¯′ (s) = − sin
Perciò la curvatura di una circonferenza è costante e il suo raggio di curvatura coincide con il raggio della circonferenza stessa. Il vettore T ′ viene detto vettore curvatura; dopo aver considerato il suo modulo prendiamo ora in considerazione la sua direzione. Osserviamo che T è di norma costante; utilizzando il risultato dell’Esercizio (V.4) a pagina 261, deduciamo che T e T ′ sono perpendicolari tra loro. Il versore parallelo a T ′ è perciò uno di quelli normali a γ. Per ottenerlo dobbiamo dividere T ′ per il suo modulo, cioè per k, ottenendo
N(s) =
1 dT(s) , k(s) ds
il versore normale principale.
Come detto, N è perpendicolare a T e punta nella direzione in cui ruota T al crescere di s. Il fatto che tra gli infiniti versori perpendicolari a T, N abbia un ruolo privilegiato è dovuto alla sua interpretazione
Infatti T
è un versore.
Dato che la direzione di γ è individuata da T, esistono infinite direzioni perpendicolari a γ, tutte quelle del piano ortogonale a T. Il versore normale principale è per-
ciò ben definito solo se la curvatura k non si annulla. Se ad esempio γ è un segmento rettilineo, non c’è nessun motivo per preferire una direzione normale alle infinite altre.
244
Curve, grafici e superfici nello spazio
cinematica. Infatti l’accelerazione di un corpo che si muove lungo γ si scompone come somma di due componenti perpendicolari tra loro, vale a dire l’accelerazione tangenziale (parallela alla retta tangente alla traiettoria) e quella centripeta (ortogonale alla tangenziale). È possibile dimostrare che l’accelerazione centripeta è parallela ad N in ogni istante (si veda il commento a pagina 265). Nel generico punto r¯(s) di γ siamo ora dotati dei due versori perpendicolari T(s) ed N(s). Definiamo piano osculatore il piano (passante per r¯(s)) che li contiene entrambi. Ne risulta che tale piano è quello in cui istantaneamente si svolge il moto, nel senso che, passando per il punto r¯(s), è parallelo sia alla velocità che all’accelerazione. In particolare se la curva è piana allora il piano osculatore è proprio il piano che contiene la curva, come viene dimostrato nell’Esercizio 13 a pagina 271. Ricordando la nozione di raggio di curvatura è anche possibile definire il cerchio che meglio approssima γ in r¯(s). Se la curvatura k(s) non è nulla, il centro di curvatura è il punto che si trova partendo da r¯(s) e muovendosi in direzione di N(s) per una distanza pari al raggio di curvatura, ovvero
Indipendentemente
dalla parametrizzazione scelta, cioè dagli aspetti cinematici.
c(s) = r¯(s) + ρ(s)N(s). Il cerchio contenuto nel piano osculatore, avente come centro il centro di curvatura e come raggio il raggio di curvatura è detto cerchio osculatore, ed è, almeno euristicamente, quello che meglio descrive il comportamento della curva, tra tutti i cerchi passanti per r¯(s). (V.24) Esempio. Consideriamo l’arco γ di parabola di equazione y = x2 /2 con x ∈ [−1, 1] contenuto nel piano xy, che risulta quindi anche essere il suo piano osculatore. Ci proponiamo di trovare il cerchio osculatore a γ in 0 = (0, 0). La parametrizzazione naturale di γ è 1 r(t) = t i + t2 j, 2
t ∈ [−1, 1].
Abbiamo r′ (t) = i + t j e quindi l’ascissa curvilinea è data da Z t √ 1 + τ2 dτ. s= −1
Piuttosto che calcolare esplicitamente s ci limitiamo ad annotare che √ 1 . s′ (t) = 1 + t2 e quindi t′ (s) = p 1 + t2 (s) Se poniamo r¯(s) = r(t(s)) possiamo scrivere t(s) 1 i+ p j. T(s) = r¯′ (s) = r′ (t(s))t′(s) = p 1 + t2 (s) 1 + t2 (s) Con qualche calcolo otteniamo dT(s) t(s) 1 i+ j, =− 2 2 ds (1 + t (s)) (1 + t2 (s))2
Abbiamo
imparato a calcolare questo integrale nel primo volume, Capitolo X, mediante l’utilizzo delle funzioni iperboliche. In realtà il calcolo esplicito ci porterebbe a delle formule estremamente più calcolose di quelle che vengono affrontate in questa soluzione un po’ “obliqua”.
Infatti, ad esempio, −2t(s) d 1 = p t′ (s) p ds 1 + t2 (s) 2 (1 + t2 (s))3 −t(s) . = (1 + t2 (s))2
§ 5. Curvatura, torsione, terna intrinseca
245
da cui k(t) =
1 1 + t2
e
N(t) = −
t 1 i+ j. 2 1+t 1 + t2
In particolare quando t = 0 otteniamo k(0) = 1 e N(0) = j. Ne segue che il raggio di curvatura vale 1, il centro di curvatura è in (0, 1) e l’equazione del cerchio osculatore si scrive come x2 + (y − 1)2 = 1, cioè (si veda la Figura V.8) x2 + y2 − 2y = 0. Per concludere osserviamo che i cerchi di equazione x2 + y2 − 2ay = 0, al variare di a sono tutti tangenti alla parabola nell’origine, infatti mettendo a sistema le due curve si ottiene l’equazione
Ragionando come abbiamo appe-
na fatto è possibile ottenere delle formule generali per curvatura e normale principale senza passare dalla parametrizzazione in ascissa curvilinea (Esercizio (V.9) a pagina 264).
Ricordiamo
che tale cerchio ha centro in (0, a) e passa per l’origine.
x2 (x2 + 4(1 − a)) = 0 che ha una radice doppia in x = 0. Tra tutti questi cerchi, però, quello osculatore (corrispondente ad a = 1) è l’unico “più che tangente” alla parabola infatti le radici coincidenti in x = 0 diventano 4! Almeno in questo caso quindi il cerchio osculatore è quello che meglio approssima la curva γ. Torniamo ora a trattare il caso di una generica curva. Al momento, nel punto r¯(s) abbiamo individuato due notevoli versori perpendicolari, T(s) ed N(s). Vogliamo individuarne un terzo che costituisca assieme ai primi due una terna destrorsa di versori ortogonali. Come sappiamo tale versore è semplicemente il loro prodotto vettoriale B(s) = T(s) × N(s),
F V.8: il grafico della parabola y = x2 /2 e del suo cerchio osculatore in (0, 0).
il versore binormale.
(V.25) Definizione. La terna di versori ortogonali T(s), N(s) e B(s) è detta terna intrinseca o sistema di riferimento di Frénet di γ (nel punto considerato). Per quanto detto, il versore B(s) è perpendicolare al piano osculatore. In particolare, se la curva è piana, il piano osculatore risulta fissato e quindi B(s) è costante. Viceversa, se la curva non è piana possiamo pensare che B′ (s) misuri quanto la curva si discosta dall’essere piana. Ancora una volta, dal fatto che kB(s)k è costante segue che
F V.9: terna intrinseca.
Esercizio (V.4) a pagina 261.
dB(s) ⊥ B(s). ds Inoltre usando le Regole (V.11) possiamo scrivere dB(s) dT(s) dN(s) d (T(s) × N(s)) = = × N(s) + T(s) × ds ds ds ds dN(s) dN(s) = T(s) × = k(s)N(s) × N(s) + T(s) × ds ds
Infatti N × N = 0.
246
Curve, grafici e superfici nello spazio
perciò dB(s) ⊥ T(s). ds Abbiamo dimostrato che B′ è perpendicolare sia a T che a B, e quindi deve essere parallelo ad N. Esiste perciò uno scalare τ(s) tale che dB(s) = −τ(s)N(s), ds
La
torsione non è quindi definita quando k(s) = 0 (in tal caso neppure N(s) lo è) e, a meno del segno, è uguale a kB′ (s)k.
τ(s) è detta torsione.
Come già detto, la torsione misura quanto γ, nel punto in questione, è lontana dall’essere una curva piana. Se la torsione è identicamente nulla, γ è una curva piana.
Questo fatto è dimostrato nell’Esercizio 13 a pagina 271.
(V.26) Esempio. Consideriamo nuovamente l’elica circolare γ degli Esempi (V.20) e (V.22) e supponiamo per comodità che a e b non sia√ no negativi. Scrivendo c = a2 + b2 la sua parametrizzazione secondo l’ascissa curvilinea è data da bs s s i + a sin j + k, con s ∈ [0, 2πc]. r¯(s) = a cos c c c Se applichiamo quanto visto otteniamo il versore tangente a b s s a i + cos j + k. T(s) = r¯′ (s) = − sin c c c c c Derivando ulteriormente abbiamo a a s s i − 2 sin j, T ′ (s) = − 2 cos c c c c da cui possiamo ricavare la curvatura e la normale principale r a2 a s a2 2 s 2 + = 2, k(s) = kT ′ (s)k = cos sin c c c4 c4 c s s 1 ′ i − sin j. T (s) = − cos N(s) = k(s) c c
supposto a ≥ 0 per il calcolo di k e a > 0 per quello di N.
Si ricordi la formula dopo l’Esem-
Il versore binormale è perciò dato da i j a a s − sin s cos B(s) = T(s) × N(s) = det c c c c s s − sin − cos c c b b a s s = sin i − cos j + k. c c c c c
Abbiamo
k b c 0
pio (III.30) a pagina 125.
§ 6. Funzioni di due variabili
247
Infine, per calcolare la torsione dobbiamo prima derivare il versore binormale: b b s s i + 2 sin j. B′ (s) = 2 cos c c c c In effetti B′ è parallelo ad N, in quanto b b N(s), da cui τ(s) = 2 . c2 c √ Ricordando che c = a2 + b2 possiamo perciò scrivere B′ (s) = −
k(s) =
a a2 + b2
e
τ(s) =
b . a2 + b2
Osserviamo che quando il passo b tende a 0 la torsione a sua volta tende a 0, infatti la curva si avvicina alla circonferenza piana di curvatura 1/a. Quando invece il raggio a tende a 0, la curva tende ad essere un segmento e la curvatura tende effettivamente a 0.
§ 6. Funzioni di due variabili In questo e nei prossimi paragrafi gettiamo le basi per uno studio sistematico delle funzioni di due variabili e dei loro grafici, che, come vedremo, sono delle superfici dello spazio tridimensionale. Per iniziare, rammentiamo che, quando il dominio di una funzione è un sottoinsieme D del piano cartesiano, ad ogni punto P = (x, y) ∈ D corrisponde uno ed un solo valore f (x, y) del codominio. Parliamo allora di una funzione di due variabili. L’insieme D è detto dominio, o campo di esistenza, o insieme di definizione; in generale se la funzione f è assegnata attraverso un’espressione algebrico-analitica, e il suo dominio non è specificato, D è per convenzione l’insieme di tutte le coppie (x, y) per cui l’espressione può essere calcolata. Il valore z = f (x, y) viene detto immagine del punto P = (x, y), o anche, sottolineando la dipendenza funzionale dal punto P, variabile dipendente. L’insieme di tutti i valori assunti viene detta immagine della funzione . (V.27) Esempio. Se f (x, y) = x + y − 1, allora f è definita per ogni scelta di x reale e di y reale, quindi il suo dominio è R2 . Se invece vogliamo determinare il domino di f (x, y) =
ln(x + y) , x−2
dobbiamo fare sì che l’argomento del logaritmo sia strettamente positivo, cioè che x + y > 0. Inoltre, perché l’espressione che di f abbia senso, il denominatore deve essere diverso da 0, cioè x , 2. Il dominio di f risulta dunque essere D = {(x, y) : x + y > 0, x , 2}.
Al solito, scriveremo f:
D ⊂ R2 (x, y)
→ 7→
R, z = f (x, y).
Analogamente,
una funzione di tre variabili è una relazione che assegna a ogni tripla ordinata (x, y, z) in un dominio D ⊂ R3 un unico elemento indicato con f (x, y, z).
Per
determinare il dominio delle funzioni di due variabili è fondamentale saper risolvere disequazioni in due variabili di tipo f (x, y) > 0. È altrettanto fondamentale saper discutere sistemi di disequazioni del tipo f1 (x, y) > 0 f (x, y) > 0. 2 A questo proposito rimandiamo all’Esercizi (V.10) svolto a pagina 265 e seguenti.
248
Curve, grafici e superfici nello spazio
F V.12: sezioni trasversali e grafico della funzione f (x, y) = x2 − y. Come si vede nella figura a sinistra, sezionando con x = k troviamo nel piano yz le rette z = k2 − y, parallele a z = −y. Al centro troviamo le sezioni con y = k: si tratta, nel piano xz, delle parabole z = x2 − k. Combinando le sezioni trasversali si ottiene che il grafico di f è quello di un foglio piegato secondo la forma di una parabola (figura a destra).
Possiamo facilmente disegnare la regione piana D; per questo osserviamo che l’insieme descritto da x + y = 0 è la retta y = −x, bisettrice del secondo/quarto quadrante. La disequazione x + y > 0, ovvero y > −x descrive allora il semipiano formato dai punti che si trovano al di sopra della retta (ma non su di essa). La relazione x , 2 significa che dal dominio vanno esclusi i punti della retta verticale x = 2; in totale si ottiene la regione disegnata in Figura V.10. F V.10
(V.28) Definizione. Il grafico della funzione f : D → R è definito come il luogo dei punti (x, y, z) dello spazio euclideo R3 per i quali (x, y) è un elemento di D e z = f (x, y): Grafico( f ) = {(x, y, z) ∈ R3 : (x, y) ∈ D , z = f (x, y)} . In generale, il grafico di una funzione di due variabili è una superficie nello spazio che si proietta verticalmente sul dominio D. Poiché ad ogni elemento di D corrisponde una unica immagine, possiamo visualizzare in prospettiva il grafico di f sopra il suo dominio D come nella Figura V.11. Nel raffigurare il grafico di una funzione di due variabili, è utile disegnarne le sezioni trasversali, cioè le sue intersezioni con i piani x = k, y = k oppure z = k, paralleli ai piani coordinati. In questo modo consideriamo il grafico come un unione di una famiglia di curve nello spazio, ottenute “affettando” la superficie con il piano corrispondente. Le funzioni di una unica variabile corrispondenti alle curve z = f (x, k) e z = f (k, y) sono chiamate tracce. Nella Figura V.12 sono rappresentate alcune tracce ed il grafico della funzione f (x, y) = x2 − y. Quando sezioniamo il grafico della funzione con un piano orizzontale otteniamo una “linea” che unisce i punti alla stessa quota che viene detta
F V.11: il grafico di una funzione f definita su D ⊂ R2 è un sottoinsieme S ⊂ R3 .
A
volte, con abuso di linguaggio, vengono chiamate tracce sia le funzioni appena definite che i loro grafici.
§ 6. Funzioni di due variabili
249
F V.13: data una mappa degli insiemi di livello, ottenuta disegnando sullo stesso foglio gli insiemi di livello corrispondenti a diversi valori di quota z = k, si può idealmente risalire al grafico tridimensionale della funzione, sollevando ciascun insieme Ek fino a raggiungere la sua quota k.
insieme di livello della funzione: Ek = {(x, y) ∈ D : f (x, y) = k}. Le mappe degli insiemi di livello si prestano a interpretazioni in diverse applicazioni interessanti. Se f (x, y) rappresenta la quota sul livello del mare del punto che ha latitudine x e longitudine y otterremo in questo modo una carta topografica dei rilievi. Quando invece f descrive la temperatura o la pressione al variare delle coordinate di una località avremo le mappe delle isoterme o isobare mostrate dai bollettini meteorologici. La lettura di queste mappe fornisce molte indicazioni utili sul comportamento della funzione (Figura V.13).
Altro abuso (il Lettore
non ce ne voglia): invece che «insieme» a volte si parla di «curva» di livello. A priori non è detto che un insieme di livello sia una curva, anche se spesso è così (giustificheremo questa affermazione nel Capitolo VI, § 10).
(V.29) Esempio. I punti (x, y) dell’insieme di livello k = 1 della funzione f (x, y) = x2 + y2 soddisfano la relazione 1 = f (x, y) = x2 + y2 , in cui riconosciamo l’equazione della circonferenza centrata nell’origine e raggio unitario. Se ora fissiamo un generico k ∈ R e studiamo l’equazione x2 + y2 = k, osserviamo immediatamente che non ci sono soluzioni per k < 0, ovvero l’insieme di Ek per k < 0 è vuoto: l’immagine di f è quindi contenuta nella semiretta positiva. Per k = 0, l’insieme di livello si riduce al solo punto (0, √ 0) mentre se k > 0 Ek è la circonferenza centrata nell’origine e raggio k, sempre più grande al crescere di k. Una mappa di livello di f si trova in Figura V.14.
F V.14
250
Curve, grafici e superfici nello spazio
§ 7. Insiemi del piano Abbiamo avuto modo di constatare quanto sia importante, nell’analisi delle funzioni di una variabile, lo studio del comportamento della funzione vicino ad un punto fissato. Alla nozione di vicinanza si riconducono, infatti, le definizioni di limite, di derivata e, conseguentemente, di retta tangente. In questo e nei prossimi paragrafi cercheremo di estendere queste idee al contesto delle funzioni di due variabili. La proprietà di essere vicini, nei pressi di un punto viene espressa utilizzando il concetto di distanza e di intorno. A tale scopo indichiamo con Br (x0 , y0 ) il disco aperto, o palla aperta, o intorno circolare, di raggio r e centro P0 = (x0 , y0 ), privato della circonferenza: n o Br (x0 , y0 ) = (x, y) ∈ R2 : (x − x0 )2 + (y − y0 )2 < r2 .
Ricordiamo, ancora una volta, che
la distanza fra il punto P = (x, y) e il punto P0 = (x0 , y0 ) è q # » kPP0 k = (x − x0 )2 + (y − y0 )2 .
Equivalentemente n o # » Br (P0 ) = P ∈ R2 : kPP0 k < r .
Il disco unito alla circonferenza, indicato con Br (x0 , y0 ), verrà detto disco chiuso, di raggio r e centro P0 = (x0 , y0 ): n o # » Br (x0 , y0 ) = P ∈ R2 : kPP0 k ≤ r . Chiamiamo intorno di un punto P0 un sottoinsieme U ⊂ R2 che contenga un disco aperto contenente P0 : P0 ∈ Br (P0 ) ⊂ U, con r > 0. Osserviamo che, secondo questa definizione, se è vero che un punto P = (x, y) può appartenere ad un intorno di P0 pur essendo ad una distanza molto grande da esso, vi sono sempre, tuttavia, punti dello stesso intorno a distanza arbitrariamente piccola da P0 . Il concetto di intorno permette di esprimere la possibilità di avvicinarsi indefinitamente, con elementi di un dato insieme D, ad un punto P0 senza mai toccarlo. (V.30) Definizione. Diremo che P0 = (x0 , y0 ) è un punto di accumulazione di D se ogni disco aperto con centro in P0 contiene almeno un elemento di D diverso da P0 . Questa nozione è strettamente legata a quella di limite di una successione, che ora riformuliamo per le successioni di punti nel piano. (V.31) Definizione. La successione Pn = (xn , yn ) converge al limite P0 = (x0 , y0 ) se q # » lim kPn P0 k = lim (xn − x0 )2 + (yn − y0 )2 = 0. n→∞
n→∞
Ricordando la definizione di limite per una successione di numeri reali, possiamo riformulare la definizione nel modo seguente: per ogni ε > 0 esiste in indice N tale che, per ogni n > N, la distanza fra Pn e P0 è inferiore a ε. Un altro modo di esprimere lo stesso concetto è: ogni disco aperto centrato in P0 contiene tutti i punti della successione eccetto al più
Il
Lettore può constatare che in realtà i concetti esposti sono validi anche in R3 o più in generale in Rn perché esprimono delle proprietà relative alla distanza fra i punti, indifferentemente dalla dimensione. Questi concetti verranno infatti estesi agli spazi metrici nel Capitolo VII.
§ 7. Insiemi del piano
un numero finito. Non è quindi difficile dimostrare che un punto P0 è di accumulazione per D se e soltanto se esso è il limite di una successione di elementi di D, tutti diversi da P0 . (V.32) Poiché, per ogni indice n, tanto |xn −x0 | quanto |yn −y0 | sono inferiori # » alla distanza kPn P0 k, la convergenza della successione Pn a P0 implica la convergenza delle successioni delle componenti. Viceversa, la convergenza di entrambe le successioni p xn e yn ai limiti x0 e y0 implica la convergenza a zero delle quantità (xn − x0 )2 + (yn − y0 )2 , e dunque della successione di punti Pn = (xn , yn ) al limite P0 = (x0 , y0 ). Sappiamo che un punto della retta può avere la proprietà di essere punto interno, esterno o di estremo di un intervallo dato. Conseguentemente, gli intervalli di R possono essere aperti (come (0, 1) e (0, +∞)), o chiusi (come [0, 1] e [0, +∞)) o nessuno dei due (ad esempio (0, 1] e [0, 1)), a seconda che contengano o meno i propri estremi. Estendiamo ora questi concetti al caso dei sottoinsiemi del piano.
251
Cioè, eventualmente, i primi N.
Come si verifica immediatamente
utilizzando le note regole di calcolo dei limiti per successioni di numeri reali.
(V.33) Definizione. Dato un sottoinsieme D ⊂ R2 , classifichiamo i punti di R2 relativamente a D nel modo seguente: ➔ i punti interni di D sono quelli che non solo appartengono a D ma sono il centro di (almeno) un disco aperto Br (x0 , y0 ) interamente contenuto in D ➔ i punti esterni ad D sono quelli che non solo non appartengono ad D ma sono il centro di (almeno) un disco aperto Br (x0 , y0 ) completamente disgiunto da D; ➔ i punti di frontiera di D hanno la proprietà che ogni loro intorno contiene sia punti di D che punti che non appartengono a D. ◦
Indichiamo con D l’insieme dei punti interni, con ∂D l’insieme di quelli di frontiera e con D = D ∪ ∂D la chiusura di D. # » (V.34) Esempio. Sia D = Br (P0 ) e prendiamo un punto P per cui kPP0 k < # » r: allora tutti i punti Q che hanno distanza da P inferiore a δ = r − kPP0 k hanno anch’essi distanza da P0 inferiore ad r: infatti # » #» # » # » # » kQP0 k ≤ kQPk + kPP0 k < r − kPP0 k + kPP0 k = r. Abbiamo quindi trovato un disco aperto di centro P interamente contenuto in D: ogni punto del disco aperto è un punto interno. I punti per # » cui kPP0 k > r sono invece esterni a D: infatti tutti i punti Q che hanno # » distanza da P inferiore a δ = kPP0 k − r hanno anch’essi distanza da P0 maggiore di r: # » #» # » # » # » kQP0 k ≥ kPP0 k − kQPk > kPP0 k − (kPP0 k − r) > r. # » I punti della circonferenza kPP0 k = r sono invece i punti di frontiera di D.
Il raggio di tali dischi dipende in generale dal punto (x0 , y0 ).
252
Curve, grafici e superfici nello spazio
(V.35) Definizione. Un sottoinsieme A ⊂ R2 si dice aperto se ogni suo punto è interno. Un sottoinsieme C ⊂ R2 si dice chiuso se contiene tutti i suoi punti di frontiera, ovvero se ∂C ⊂ C. (V.36) Esempio. Ogni disco aperto e ogni n è un aperto, o disco chiuso, cioè # » 2 ogni insieme del tipo Br (P0 ) = P ∈ R : kPP0 k ≤ r , è un chiuso, come segue facilmente dalla discussione condotta nell’esempio precedente. Nel seguito utilizzeremo spesso l’osservazione che tutti i punti di un aperto sono punti di accumulazione. Inoltre, non è difficile convincersi che un insieme A è aperto se e soltanto se non contiene alcun punto della sua frontiera, ovvero se ∂A ∩ A = ∅. Come abbiamo già osservato, molti insiemi non sono né aperti né chiusi. Viceversa gli unici sottoinsiemi di R2 che sono contemporaneamente aperti e chiusi sono R2 stesso e l’insieme vuoto.
F V.15
§ 8. Limiti e continuità Il concetto di limite per funzioni di due variabili non differisce, nella sostanza, da quello per le funzioni di una variabile. Con la scrittura lim
(x,y)→(x0 ,y0 )
f (x, y) = L
intendiamo affermare che quando il punto (x, y) si avvicina, senza mai toccarlo, a (x0 , y0 ), il corrispondente valore della funzione f (x, y) si avvicina al numero L. Ciò che cambia, nel passaggio alle funzioni di due variabili, è la geometria del dominio e, in particolare, il concetto di distanza fra due punti del piano. Innanzitutto dobbiamo assicurare la possibilità di avvicinarsi arbitrariamente al punto P0 , restando nel dominio della funzione. Imponiamo pertanto che P0 sia un punto di accumulazione del dominio D di f . (V.37) Definizione. Si dice f tende (o converge) al limite L per P = (x, y) che tende a P0 = (x0 , y0 ) se, per quanto piccolo si scelga ε > 0, è possibile trovare un raggio δ > 0 per cui tutti i punti P = (x, y) del dominio che distano da P0 meno di δ hanno un valore f (x, y) che approssima L con un errore minore di ε: lim
(x,y)→(x0 ,y0 )
f (x, y) = L
⇐⇒
# » P = (x, y) ∈ D, 0 < kPP0 k < δ =⇒ | f (x, y) − L| < ε.
Possiamo riformulare la definizione utilizzando il linguaggio degli intorni. Per cominciare, definiamo la controimmagine di un sottoinsieme V del codominio di f come l’insieme f −1 (V) degli elementi del dominio D che hanno immagine in V, ovvero, f −1 (V) = {(x, y) ∈ D : f (x, y) ∈ V}. La definizione di limite diventa: la funzione f converge al limite L se, per ogni intorno V di L, f −1 (V)∪{P0 } è un intorno di P0 .
§ 8. Limiti e continuità
253
Per via della stretta analogia fra i due concetti, la gran parte delle proprietà dei limiti delle funzioni di una variabile può essere estesa ai limiti per le funzioni di due (o più) variabili, con una dimostrazione del tutto simile. Per esempio, è facile verificare che il limite, quando esiste, è unico e che i limiti di somme e prodotti di funzioni sono uguali alle somme e prodotti dei limiti, il limite di un quoziente è il quoziente dei limiti (ammesso che il limite del denominatore sia non nullo). Queste proprietà permettono di calcolare i limiti di molte funzioni di due variabili a partire da pochi esempi. Vediamone subito uno, particolarmente semplice.
Raccomandiamo
al Lettore di verificare queste proprietà.
(V.38) Esempio. Ci proponiamo di calcolare lim
(x,y)→(0,0)
x
e
lim
(x,y)→(0,0)
y.
Osserviamo innanzitutto che avvicinandosi all’origine lungo le direzioni degli assi il valore delle due funzioni tende a zero; perciò il limite, se esiste, non potrà che essere nullo. Per verificare che questo è il caso, dobbiamo dimostrare che, nel caso della prima funzione, e analogamente nel caso della seconda, per ε arbitrariamente fissato e δ opportuno, si ha q 0 < x2 + y2 < δ =⇒ |x| < ε .
Questa
discussione serve a determinare il più probabile candidato limite L.
Abbiamo già osservato che i valori assoluti dellepsingole componenti p sono 2 2 inferiori alla norma del vettore, ovvero |x| ≤ x + y e |y| ≤ x2 + y2 . Dunque, q x2 + y2 < δ =⇒ |x| < δ e y < δ . Basterà quindi scegliere δ = ε per concludere, secondo la definizione di limite (V.37), che entrambi i limiti esistono e valgono 0. Come già nel caso di una variabile, la definizione non fornisce direttamente un metodo per determinare il limite L ma permette di stabilire se un valore assegnato L è il limite o meno. Per trovare un buon candidato limite, nell’esempio precedente abbiamo provato a restringere la funzione ad insiemi monodimensionali (in quel caso gli assi cartesiani) passanti per il punto in questione, riconducendoci in questo modo al calcolo di limiti di funzioni di una sola variabile. Abbiamo quindi determinato il limite di una delle tracce (se sono definite) lim f (x, y0 ) ,
x→x0
oppure
Questo
esempio si può facilmente generalizzare alle funzioni continue di una sola variabile, si veda a questo proposito l’Esercizio 29 .
Ricordiamo che data una funzione
f : D ⊂ R2 → R ed un sottoinsieme E di D, la restrizione di f ad E è quella funzione il cui dominio è E e che assume gli stessi valori di f , per ogni x ∈ E.
lim f (x0 , y) .
y→y0
Osserviamo che, mentre in una dimensione disponiamo un unico percorso di avvicinamento ad un punto dato (eventualmente da destra o da sinistra), nel piano disponiamo di molte più possibilità (Figura V.16.) Per questa ragione lo studio dei limiti per funzioni di due variabili presenta una ricchezza di situazioni assai superiore. Una osservazione importante è che, se lim(x,y)→(x0 ,y0 ) f (x, y) = L, questo valore si deve ottenere avvicinandosi a P0 lungo un qualsiasi percorso.
F V.16
254
Curve, grafici e superfici nello spazio
(V.39) Proposizione. Se
lim
(x,y)→(x0 ,y0 )
f (x, y)
=
L allora per ogni
sottoinsieme C del dominio di f si deve avere lim
(x,y)→(x0 ,y0 ) (x,y)∈C
f (x, y) = L.
Sottintendiamo che P0 sia un punto di accumulazione anche per il sottoinsieme C.
Questo risultato è di grande utilità nella pratica sia per individuare il candidato valore limite L che per dimostrare che tale limite non esiste: basta per questo esibire due diversi percorsi per raggiungere il punto (x0 , y0 ) lungo i quali i limiti di f siano diversi, o non esistano. Vediamo alcuni esempi. (V.40) Esempio. Mostriamo che non esiste il limite lim
(x,y)→(0,0)
x2
xy . + y2
Cominciamo restringendo l’osservazione ai valori assunti dalla funzione lungo l’asse x: questo significa restringere f all’insieme C = {(x, y) ∈ R2 : y = 0, x , 0}. In questo modo si ha, per x , 0, f (x, 0) = 0/x2 = 0. Perciò
Il
dominio D di questa funzione è R2 privato dell’origine, dove si annulla il denominatore. Chiaramente esistono infiniti punti di D arbitrariamente vicini a (0, 0), perciò ha senso calcolare il limite in questione.
Cioè
sostituire y = 0 nell’espressione che definisce f .
lim f (x, y) = 0
(x,y)→(0,0) y=0
e dunque il candidato limite è L = 0. Lo stesso valore si ottiene avvicinandosi all’origine lungo l’asse delle y, perché sostituendo x = 0 si ottiene ancora una volta f (0, y) = 0/y2 = 0. Vediamo ora cosa succede avvicinandoci all’origine lungo la retta y = x. x2 1 lim f (x, y) = lim f (x, x) = lim 2 = . (x,y)→(0,0) x→0 x→0 x + x2 2 x=y
Qui scegliamo C = {(x, y) ∈ R2 r {(0, 0)} : y = x}.
Abbiamo ottenuto limiti diversi lungo percorsi differenti (gli assi e la retta y = x), dunque, per la (V.39), il limite dato non esiste. (V.41) Esempio. Studiamo ora il limite nell’origine della funzione 2
f (x, y) =
xy . x2 + y4
Restringendo la funzione agli assi come nell’esempio precedente si trova subito che f (x, 0) ≡ f (0, y) ≡ 0, dunque il candidato limite è L = 0. Proviamo ora a scegliere una qualunque retta passante per l’origine, definendo C = {(x, y) : y = mx, x , 0} con m ∈ R fissato. Si ha lim f (x, y) = lim f (x, mx) = lim
(x,y)→(0,0) y=mx
x→0
x→0
m2 x3 m2 x = lim = 0. x2 + m4 x4 x→0 1 + m4 x2
Di nuovo la funzione è definita su R2 r {(0, 0)}.
§ 8. Limiti e continuità
255
Perciò f ha limite 0 lungo tutte le rette passanti per l’origine, indipendentemente dalla direzione. D’altro canto, se scegliamo di avvicinarci all’origine lungo la parabola x = y2 , troviamo lim f (x, y) = lim
(x,y)→(0,0) x=y2
y→0
y4 1 = . 4 4 2 y +y
Abbiamo ottenuto limiti diversi lungo due percorsi diversi, dunque il limite non esiste.
ATTENZIONE! Il fatto che la nostra funzione abbia lo stesso limite lungo ogni retta passante per l’origine non permette di asserire che il limite esiste. Infatti, in questo caso il limite non esiste, come si vede scegliendo di avvicinarsi non più lungo una retta ma lungo una parabola.
⊚
Una volta in possesso del concetto di limite possiamo estendere alle funzioni di più variabili anche la nozione di continuità. Consideriamo perciò una funzione f : D → R ed un punto di accumulazione del dominio P0 . (V.42) Definizione. Si dice che f è continua in P0 = (x0 , y0 ) se lim
(x,y)→(x0 ,y0 )
f (x, y) = f (x0 , y0 ).
La funzione f si dice continua in D se lo è in ogni suo punto. L’insieme delle funzioni continue in D viene indicato con il simbolo C(D).
Possiamo esprimere la continuità di f in un punto P0 = (x0 , y0 ) del dominio utilizzando il linguaggio degli intorni: dire f è continua in P0 equivale a dire che la controimmagine un qualunque intorno V di f (P0 ) è un intorno di P0 .
Come per le funzioni di una variabile, la proprietà di continuità è di fondamentale importanza sia nella teoria che nelle applicazioni; infatti essa esprime l’idea della causalità della relazione funzionale: a piccole variazioni delle cause (le variabili indipendenti) corrispondono piccole variazioni degli effetti (la variabile dipendente f (x, y)). È perciò superfluo sottolineare l’utilità di saper riconoscere le funzioni continue. (V.43) Esempio. Le funzioni dell’Esempio (V.38) f1 (x, y) = x
e
f2 (x, y) = y
sono continue in tutto R2 . Facciamo la verifica solo per f1 , quella per f2 è analoga. Dalla definizione di limite, fissato un qualsiasi punto (x0 , y0 ) e scelto ε arbitrariamente piccolo dobbiamo trovare δ in modo che q (x − x0 )2 + (y − y0 )2 < δ =⇒ |x − x0 | < ε. Ma, come già osservato, |x − x0 | = quindi possiamo scegliere δ = ε.
p p (x − x0 )2 ≤ (x − x0 )2 + (y − y0 )2 ,
Vista l’analogia tra la definizione di continuità per le funzioni di più variabili e quella per le funzioni di una sola variabile, i teoremi generali che riguardano la continuità delle funzioni nel caso monodimensionale si estendono in maniera naturale (e con essenzialmente le stesse dimostrazioni) a quello multidimensionale. Riassumiamo i principali risultati nel seguente teorema.
Possiamo C(R2 ).
perciò scrivere f1 , f2 ∈
256
Curve, grafici e superfici nello spazio
F V.17: una superficie parametrica.
(V.44) Teorema. Se le funzioni f e 1 sono continue allora ➔ f + 1, f − 1, f · 1 sono continue; ➔ se 1 , 0 allora f /1 è continua;
Ovviamente nei primi tre casi f e 1 sono definite (e continue) nello stesso punto (x0 , y0 ) o sul medesimo insieme A; nell’ultimo f ◦ 1 deve essere ben definita.
➔ se f > 0 allora f 1 è continua; ➔ la funzione composta f ◦ 1 è continua. Nell’ultimo esempio abbiamo visto che le funzioni (x, y) 7→ x, e (x, y) 7→ y sono continue. Inoltre è immediato verificare che anche (x, y) 7→ a, a costante, lo è. Applicando il teorema appena visto deduciamo che sono continui i polinomi in due variabili, le funzioni razionali, laddove il denominatore è non nullo, e più in generale tutte le funzioni elementari, ciascuna all’interno del proprio dominio.
§ 9. Superfici parametriche Nei primi paragrafi di questo capitolo abbiamo interpretato le funzioni di una variabile a valori in R3 come parametrizzazioni di curve. In questo paragrafo ci proponiamo di studiare le funzioni di due variabili a valori in R3 con lo scopo di interpretarle come parametrizzazioni di superfici. Consideriamo dunque una funzione r : D → R3 , dove D è un sottoinsieme del piano uv (si veda la Figura V.17), che indicheremo con la scrittura x(u, v) r(u, v) = y(u, v) = x(u, v) i + y(u, v) j + z(u, v) k, (u, v) ∈ D. z(u, v) Al solito, u e v sono detti parametri della superficie e le funzioni x, y, z, componenti scalari della parametrizzazione (tali funzioni verranno sempre supposte continue). La coppia costituita dall’immagine Σ = r(D) ⊂ R3
Ovvero i quozienti di polinomi. Si intendono le funzioni che
si ottengono da composizioni di somme, prodotti, esponenziali, funzioni goniometriche e rispettive funzioni inverse.
Se
non poniamo condizioni su D, questa nozione di superficie non sempre coincide con quella intuitiva: ad esempio se D si riduce ad un segmento Σ è soltanto una curva. Se D è aperto allora Σ è una “superficie” in senso intuitivo. Per motivi che saranno chiari in seguito, sceglieremo sempre come D la chiusura di un sottoinsieme aperto del piano (cioè l’unione dell’aperto e della sua frontiera), la cui frontiera sia costituita da un numero finito di curve chiuse e regolari a tratti (come ad esempio un rettangolo, un semicerchio, una corona circolare . . . ).
§ 9. Superfici parametriche
257
F V.18: curve sulla superficie ottenute fissando uno dei due parametri.
insieme alla parametrizzazione r è la superficie. Informalmente parleremo di superficie riferendoci alla sola Σ. Abbiamo già incontrato una vasta classe di superfici nel Capitolo III e nei paragrafi precedenti: i piani nello spazio ed i grafici delle funzioni di due variabili. (V.45) Esempio. La funzione r(u, v) = u i + v j + (u2 + v2 ) k,
u2 + v2 ≤ 1
è una parametrizzazione della parte del grafico di z = x2 + y2 che giace sopra il cerchio (del piano xy) x2 + y2 ≤ 1. Più in generale il grafico di una funzione continua f : D → R è una superficie parametrica, detta superficie cartesiana, con parametrizzazione naturale data da r(u, v) = u i + v j + f (u, v) k,
(u, v) ∈ D.
2
(V.46) Esempio. Un sottoinsieme D ⊂ R è una superficie piana (la più semplice delle superfici cartesiane) e si può parametrizzare come r(u, v) = u i + v j,
(u, v) ∈ D.
Osserviamo che se fissiamo uno dei due parametri, ad esempio u = u0 , e lasciamo variare v otteniamo la parametrizzazione di una curva: r˜(v) = r(u0 , v) = x(u0 , v) i + y(u0 , v) j + z(u0 , v) k,
Come
nel caso delle curve, una superficie possiede infinite diverse parametrizzazioni. Ad esempio, una superficie cartesiana può essere parametrizzata anche da r(u, v) = u3 i + v5 j + f (u3 , v5 ) k, con (u3 , v5 ) ∈ D.
Cioè prendiamo in considerazione le tracce delle funzioni x, y e z.
(u0 , v) ∈ D.
Al variare di u0 otteniamo così una famiglia di curve che ricopre la superficie di partenza. Le due famiglie di curve così ottenute, individuate rispettivamente dai valori costanti di u e di v, formano una griglia su Σ (si veda la Figura V.18). (V.47) Esempio (coordinate cilindriche). Consideriamo la superficie laterale del cilindro di equazione x2 + y2 = 1 contenuto tra i piani z = 0 e z = 1, vale a dire n o Σ = (x, y, z) ∈ R3 : x2 + y2 = 1, 0 ≤ z ≤ 1 . Le coordinate x e y sono legate tra loro e quindi possono essere descritte mediante un unico parametro, mentre la z è indipendente. Questa superficie può dunque essere parametrizzata come r(u, v) = cos u i + sin u j + v k,
(u, v) ∈ [0, 2π] × [0, 1].
Si veda il Capitolo III, § 8. Come
le curve, anche le superfici spesso vengono definite tramite un insieme di uguaglianze e disuguaglianze. La parte più difficile dell’esercizio tipicamente consiste nel determinarne una parametrizzazione.
258
Curve, grafici e superfici nello spazio
Osserviamo che, fissato u = u0 , la curva corrispondente è r˜(v) = cos u0 i + sin u0 j + v k,
v ∈ [0, 1],
il segmento verticale lungo la retta x = cos u0 , y = sin u0 ; viceversa se fissiamo v = v0 otteniamo r˜(u) = cos u i + sin u j + v0 k,
u ∈ [0, 2π],
la circonferenza di raggio 1 sul piano z = v0 .
(V.48) Esempio (coordinate sferiche). Vogliamo individuare la superficie Σ parametrizzata da
F V.19
Si veda il Capitolo III, § 8.
r(u, v) = cos u sin v i + sin u sin v j + cos v k (u, v) ∈ [0, 2π] × [0, π/2]. Iniziamo studiando le curve della griglia. Quando v è costante vediamo che z è fissata e, al variare di u ∈ [0, 2π], la parametrizzazione descrive l’intera circonferenza di raggio sin v contenuta nel piano z = cos v. Viceversa, se fissiamo u, ad un primo sguardo superficiale non riconosciamo nessuna curva nota. Ad ogni modo, osserviamo che, poste x, y e z le componenti di r, abbiamo F V.20
x2 + y2 + z2 = 1, quindi Σ è contenuta nella superficie sferica di centro l’origine e raggio 1. Σ non è però tutta la sfera, infatti, essendo 0 ≤ v ≤ π/2, abbiamo che la coordinata z assume tutti e soli i valori compresi tra 0 ed 1. Da quanto detto deduciamo che Σ coincide con l’emisfero superiore. Come per le curve, se r è biunivoca nell’interno di D, allora Σ non si autointerseca mai e si dice che è semplice. Tutte le superfici degli esempi precedenti sono semplici e, dove non specificato diversamente, d’ora in poi sottintenderemo sempre che le superfici con cui abbiamo a che fare siano semplici. Una delle idee più significative nella teoria delle curve è la definizione di curva regolare: le curve regolari posseggono una retta tangente. L’estensione di questa nozione alle superfici è tutt’altro che immediata. Nel prossimo capitolo svilupperemo i concetti del calcolo differenziale in più variabili che sono necessari alla definizione di superficie regolare ed a quella di piano tangente.
Esercizi (V.1) Scrivere una parametrizzazione della curva piana chiusa γ, data dalla frontiera ∂Q del quadrato Q = [0, 1] × [0, 1]. Soluzione. La frontiera di Q è costituita dalla giustapposizione di quattro segmenti (si veda la Figura V.21). Tali segmenti possono essere parametrizzati facilmente mediante rOA (t) = t i,
rCB (t) = t i+ j,
rOC (t) = t j,
rAB (t) = i+t j,
t ∈ [0, 1].
Invitiamo
il Lettore ad osservare che, mentre abbiamo definito gli estremi di una curva (e di conseguenza le curve chiuse) non abbiamo invece definito la frontiera di una superficie Σ. Se ingenuamente provassimo a definirla come abbiamo fatto per i sottoinsiemi di R3 , otterremmo che tutti i punti di Σ appartengono alla sua frontiera: infatti, ogni palla di R3 centrata in un punto di Σ contiene punti esterni alla superficie, visto che Σ è un oggetto bidimensionale! D’altra parte, da un punto di vista intuitivo, vorremmo una definizione per cui la frontiera di un emisfero sia data dall’equatore, quella di una superficie laterale cilindrica dalle due circonferenze delle basi, o ancora quella di una sfera sia vuota. Certamente non è corretto definire la frontiera di Σ come r(∂D) (perché?). Torneremo su questo spinoso problema nel Capitolo X.
Esercizi
259
Per costruire però una unica parametrizzazione di ∂Q dobbiamo lavorare un po’ di “taglio e cucito” sulle precedenti. Innanzitutto dovremo scegliere una orientazione coerente, diciamo quella antioraria; in secondo luogo, dovremo fare in modo che il parametro t assuma valori diversi (e consecutivi) sui vari segmenti. Tenendo buona la parametrizzazione di OA (che è effettivamente percorso da sinistra verso destra), per t = 1 siamo nel punto A, quindi la parametrizzazione di AB deve iniziare da tale valore; con una traslazione otteniamo facilmente r˜AB (t) = i + (t − 1) j, t ∈ [1, 2]. A questo punto siamo in B con t = 2, e vogliamo passare a BC. La parametrizzazione che ne abbiamo già dato, però, lo percorre con l’orientazione sbagliata: dovremo quindi prima cambiare t in −t, e poi traslare, ottenendo r˜BC (t) = (3 − t) i + j, t ∈ [2, 3]; ragionando allo stesso modo con CO otteniamo infine r˜CO (t) = (4 − t) j, t ∈ [3, 4]. In definitiva, ∂Q è parametrizzato da t 0≤t≤1 0 0≤t≤1 1 1 ≤ t ≤ 2 t − 1 1 ≤t≤2 r(t) = x(t) i+y(t) j, con x(t) = y(t) = 3−t 2≤t≤3 1 2≤t≤3 0 3 ≤ t ≤ 4, 4 − t 3 ≤ t ≤ 4.
F V.21
Osserviamo che tipicamente
questo procedimento non è essenziale in molte delle applicazioni: se ad esempio volessimo calcolare la lunghezza di una giustapposizione di curve, basta calcolare la lunghezza di ciascun tratto e sommare i contributi ottenuti.
(V.2) Trovare una parametrizzazione della curva γ intersezione del paraboloide di equazione z = x2 + y2 e del cilindro a sezione ellittica di equazione x2 + 4y2 = 4 (Figura V.22), n o γ = (x, y, z) ∈ R3 : z = x2 + y2 , x2 + 4y2 = 4 . Soluzione. Osserviamo che nella seconda delle equazioni sono presenti solo x ed y, però ricavarne una in funzione dell’altra risulta poco agevole per la presenza dei quadrati. Per questo motivo cerchiamo una parametrizzazione del tipo x = a cos t,
y = b sin t,
con l’idea di sfruttare l’identità fondamentale cos2 t + sin2 t = 1. Sostituendo nell’equazione del cilindro otteniamo a2 cos2 t + 4b2 sin2 t = 4 che è immediatamente verificata, per ogni t, a patto di porre a2 = 4b2 = 4, cioè (ad esempio) a = 2, b = 1. Abbiamo perciò che, per x = 2 cos t e y = sin t, l’equazione del cilindro è automaticamente verificata. Per quanto riguarda z, basta sostituire nell’equazione del paraboloide: F V.22
z = 4 cos2 t + sin2 t. La parametrizzazione richiesta è perciò r(t) = 2 cos t i + sin t j + (4 cos2 t + sin2 t) k,
ATTENZIONE! Una parametrizzazione non è completa senza gli estremi di variabilità del parametro!
⊚ t ∈ [0, 2π].
260
Curve, grafici e superfici nello spazio
(V.3) È data la cardioide γ di equazione polare r = 1+sin ϑ, 0 ≤ ϑ ≤ 2π. ① Determinare una parametrizzazione di γ. ② Trovare i punti di γ aventi tangente orizzontale o verticale.
Per
equazione polare si intende l’equazione della curva nelle coordinate polari (r, ϑ). A tal proposito si vedano anche gli Esercizi 2 e 3 a pagina 270.
③ Disegnare un grafico qualitativo di γ. Soluzione. In coordinate polari abbiamo x = r cos ϑ, y = r sin ϑ. Possiamo perciò usare t = ϑ come parametro, ottenendo r = 1 + sin t e quindi la parametrizzazione (di classe C1 ) r(t) = (1 + sin t) cos t i + (1 + sin t) sin t j, ′
t ∈ [0, 2π].
2
Derivando otteniamo r (t) = (1 − sin t − 2 sin t) i + (1 + 2 sin t) cos t j. La | {z } | {z } x′ (t)
y′ (t)
retta tangente risulta non definita se kr′ (t)k = 0, cioè se x′ (t) = y′ (t) = 0; risulta orizzontale se r′ (t) è parallelo al vettore (1, 0), cioè se y′ (t) = 0, x′ (t) , 0; infine risulta verticale se r′ (t) è parallelo a (0, 1), cioè se x′ (t) = 0, y′ (t) , 0. Dato che vogliamo tracciare il grafico di γ, studiamo non solo gli zeri ma anche il segno delle funzioni x′ , y′ . Abbiamo 3π x′ (t) = 0 se t = π6 , 5π 6 , 2 ′ π 5π x (t) > 0 se 0 ≤ t < 6 , 6 < t ≤ 2π, t , 3π 2 ′ x (t) < 0 se π < t < 5π . 6 6 Analogamente y′ (t) = 0 ′ y (t) > 0 ′ y (t) < 0
sin t = −1/2 se e solo se t = 7π/6, oppure t = 11π/6.
3π 11π se t = π2 , 7π 6 , 2 , 6 se 0 ≤ t < π2 , 11π 6 < t ≤ 2π, 3π 11π , se π2 < t < 7π 6 2 < t< 6 .
y′ (t) (1 + 2 sin t) cos t , = x′ (t) 1 − sin t − 2 sin2 t
Dato che lim
m(t) = −
t→(3π/2)
1 − u − 2u2 ≥ 0 se e solo se −1 ≤ u ≤ 1/2, e, per 0 ≤ t ≤ 2π, sin t = 1/2 se e solo se t = π/6 oppure t = 5π/6.
Infatti
Infatti
Ne deduciamo che i punti a tangente orizzontale corrispondono a t = π/2, t = 7π/6, t = 11π/6, e quelli a tangente verticale a t = π/6, t = 5π/6. Per t = 3π/2 (che corrisponde a r(t) = (0, 0)) la parametrizzazione non è regolare, perciò non è definita, a priori, la retta tangente. Osserviamo però che, in prossimità di tale punto, la retta tangente ha coefficiente angolare m(t) =
F V.23
lim
t→(3π/2)−
t,
3π . 2
− sin t + 2 cos2 t − 2 sin2 t = +∞ − cos t − 4 sin t cos t
e, analogamente, limt→(3π/2)+ m(t) = −∞, deduciamo che l’origine è un punto di cuspide a tangente verticale (si veda la Figura V.23).
Infatti,
se a , 0, la retta parallela al vettore a i + b j ha coefficiente angolare m = b/a.
Stiamo
applicando la Regola di De l’Hôpital.
Esercizi
261
(V.4) Sia r : [a, b] → R3 di classe C1 . Verificare che se
kr(t)k = costante, ∀t ∈ [a, b] allora r′ (t) ⊥ r(t), ∀t ∈ [a, b].
Dedurne che se una particella si muove con velocità scalare costante allora la sua accelerazione è sempre perpendicolare alla traiettoria (accelerazione puramente centripeta). Soluzione. Due vettori sono perpendicolari quando il loro prodotto scalare è nullo, perciò è sufficiente verificare che r′ (t) · r(t) = 0 per ogni t ∈ [a, b]. Per ipotesi r(t) · r(t) = kr(t)k2 = (costante)2
da cui, derivando rispetto a t ambedue i membri, si ottiene 2r(t) · r′ (t) = 0.
Stiamo
utilizzando le Regole di derivazione (V.11) a pagina 235.
Per quanto riguarda la seconda parte dell’esercizio, è sufficiente applicare il risultato ottenuto al vettore velocità v(t). Dato che la velocità scalare kv(t)k è costante otteniamo che la sua derivata v′ (t) = a(t) è perpendicolare a v(t), che invece individua la direzione della traiettoria. (V.5) Data la curva piana γ di equazione polare r = f (ϑ), a ≤ ϑ ≤ b, con f di classe C1 , verificare che Z
b
Lunghezza(γ) =
q
2 2 f (ϑ) + f ′ (ϑ) dϑ.
a
Calcolare la lunghezza della spirale esponenziale di equazione r = eϑ con −∞ < ϑ ≤ 0. Soluzione. Come abbiamo visto nell’Esercizio (V.3), è possibile parametrizzare γ come r(t) = f (t) cos t i + f (t) sin t j, con ϑ ∈ [a, b] (la parametrizzazione è di classe C1 per ipotesi). Otteniamo r′ (t) = f ′ (t) cos t − f (t) sin t i + f ′ (t) sin t + f (t) cos t j. Quindi
q
kr′ (t)k =
q
= q =
f ′ (t) cos t − f (t) sin t 2 + f ′ (t) sin t + f (t) cos t 2
2 2 2 2 f ′ (t) cos2 t + f (t) sin2 t + f ′ (t) sin2 t + f (t) cos2 t 2
f (t) +
2 f ′ (t)
da cui la formula richiesta. Per quanto riguarda la spirale esponenziale, utilizzando quanto appena visto abbiamo f (t) = f ′ (t) = et , da cui Z 0 Z 0 √ √ √ 2t 2t e + e dt = 2 et dt = 2. Lunghezza( spirale ) = −∞
−∞
F V.24: il grafico della curva di equazione polare r = (3/2)ϑ , ϑ ≤ 0 (in quello di r = eϑ tutte le volute dopo la prima risultano indistinguibili). La curva ruota infinite volte attorno all’origine, senza mai raggiungerla.
I doppi prodotti si elidono.
262
Curve, grafici e superfici nello spazio
Area racchiusa da una curva piana chiusa Consideriamo una curva γ, piana, semplice, regolare a tratti e chiusa, parametrizzata da t ∈ [a, b].
r(t) = x(t) i + y(t) j,
È possibile dimostrare che una curva simile divide il piano in due regioni, una limitata (la regione racchiusa dalla curva, che indicheremo con D) ed una illimitata. Come abbiamo visto, le parametrizzazioni di γ si suddividono in due grandi famiglie, distinte dall’orientazione: nel seguito supporremo che γ sia percorsa da r “in senso antiorario”, cioè in modo che, al crescere di t, la regione D si trovi sempre a sinistra di γ (sotto questa ipotesi si dice che γ è orientata positivamente). Siamo interessati ad una formula che ci permetta di calcolare l’area di D in termini di una parametrizzazione r di γ. A tale scopo ricordiamo che nel primo volume abbiamo imparato a calcolare l’area delle regioni semplici rispetto ad uno degli assi. Supponiamo perciò che D sia l’unione di un numero finito di regioni semplici, che abbiano in comune solo tratti di frontiera. Torneremo più dettagliatamente sulla questione nel Capitolo IX, § 4, per il momento ci limitiamo ad osservare che l’ipotesi è piuttosto generale, e quasi sempre verificata nelle applicazioni (si veda la Figura V.25). Sotto queste ipotesi è possibile verificare che Z (2)
Z
b
b
′
Area(D) = a
x(t)y (t) dt = −
(3)
Z
b a
γ ammette retta tangente in ogni punto eccetto un numero finito di ”angoli“, e r(a) = r(b).
Questa affermazione, sorprenden-
temente difficile da dimostrare in termini rigorosi, è la tesi del Teorema della curva chiusa di Jordan.
Ricordiamo che una regione D1 si dice semplice rispetto all’asse y, o y– semplice se è del tipo n D1 = (x, y) ∈ R2 : a ≤ x ≤ b, o 11 (x) ≤ y ≤ 12 (x) , (con 11 ≤ 12 entrambe continue), cioè se le sue intersezioni con le rette parallele all’asse y sono segmenti. In questo caso Z b Area(D1 ) = 12 (x) − 11 (x) dx. a
Analogamente D2 è x–semplice se n D2 = (x, y) ∈ R2 : c ≤ y ≤ d,
o h1 (y) ≤ x ≤ h2 (y) ,
x′ (t)y(t) dt. a
Viceversa, se la parametrizzazione non orienta la curva positivamente ma negativamente allora gli integrali precedenti sono uguali all’area di D cambiata di segno. La dimostrazione di questo risultato nel caso in cui D sia semplice rispetto ad uno degli assi è svolta nel prossimo esercizio. La validità generale della formula seguirà come conseguenza del Teorema di Gauss-Green (si veda il Capitolo X, § 4). Osserviamo che, sommando membro a membro le due formule in (2) e dividendo per due, otteniamo una terza espressione per l’area di D 1 Area(D) = 2
Perciò
e
Z Area(D2 ) = c
d
h2 (y) − h1 (y) dy.
x(t)y′ (t) − x′ (t)y(t) dt,
particolarmente utile in alcune applicazioni. (V.6) Verificare la validità della formula (2) nel caso in cui γ = ∂D1 dove D1 è la regione n o D1 = (x, y) ∈ R2 : a ≤ x ≤ b, 11 (x) ≤ y ≤ 12 (x) . Soluzione. Il primo passo consiste nel verificare che gli integrali nella formula (2) non dipendono dalla parametrizzazione e sono uguali tra
F V.25: D è l’unione dei domini semplici Di (tutte le frontiere sono orientate positivamente).
Visto che richiediamo che γ sia regolare a tratti, è necessario che 11 e 12 siano funzioni di classe C1 , almeno a tratti.
Esercizi
263
loro. Questo fatto, di dimostrazione relativamente semplice, è contenuto nell’Esercizio 19 a pagina 271. Per dimostrare la formula possiamo perciò fissare una parametrizzazione (che induca l’orientazione positiva sulla curva) e verificare che il secondo dei due integrali è uguale all’area di D1 , che conosciamo dal primo volume (si veda il commento a fianco della formula (2)). Invece di scrivere una parametrizzazione dell’intera curva γ, cosa piuttosto artificiosa (si veda l’Esercizio (V.1)), possiamo utilizzare la solita proprietà di additività degli integrali rispetto al dominio di integrazione e scomporre γ nella giustapposizione dei quattro tratti
La
verifica che l’area di una regione D2 x–semplice è uguale al primo degli integrali in (2) è del tutto analoga.
γ1 = {(x, y) ∈ R2 : a ≤ x ≤ b, y = 11 (x)},
γ2 = {(x, y) ∈ R2 : x = b, 11 (b) ≤ y ≤ 12 (b)}, γ3 = {(x, y) ∈ R2 : a ≤ x ≤ b, y = 12 (x)},
γ4 = {(x, y) ∈ R2 : x = a, 11 (a) ≤ y ≤ 12 (a)},
per poi sommare i contributi dei quattro integrali (si veda la Figura V.26). Si vede subito che gli integrali relativi a γ2 e γ4 sono nulli: infatti se ad esempio parametrizziamo γ2 come r2 (t) = b i + t j, t ∈ [11 (b), 12 (b)], otteniamo x′ (t) = 0 e quindi Z 12 (b) − x′ (t)y(t) dt = 0. 11 (b)
Il tratto γ1 può essere parametrizzato come r1 (t) = t i + 11 (t) j, t ∈ [a, b]. Abbiamo Z b Z b ′ − x (t)y(t) dt = − 11 (t) dt. a
a
Il tratto γ3 si parametrizza invece come r3 (t) = −t i + 12 (−t) j, t ∈ [−b, −a], da cui Z b Z −a Z b − x′ (t)y(t) dt = − (−1) · 12 (−t) dt = 12 (t) dt. a
F V.26
−b
Infatti,
per mantenere l’orientazione positiva, γ4 va percorsa da destra verso sinistra.
a
Sommando i due integrali otteniamo la formula desiderata. (V.7) Calcolare l’area della regione D racchiusa dall’ellisse γ di semiassi a e b. Soluzione. Se fissiamo l’origine nel centro di γ e gli assi coordinati lungo i suoi semiassi, otteniamo che γ è parametrizzata da r(t) = a cos t i + b sin t j,
t ∈ [0, 2π],
e D è semplice rispetto ad entrambi gli assi. Applicando la (2) otteniamo la nota formula Z 2π Z 2π 1 + cos 2t dt = πab. Area(D) = a cos t · b cos t dt = ab 2 0 0
Come
è noto, tale ellisse ha equazione cartesiana (implicita)
y2 x2 + 2 = 1, 2 a b e, usando le tecniche apprese nel primo volume, sappiamo che l’area da essa racchiusa è uguale all’integrale Z a r x2 2b 1 − 2 dx, a −a
un po’ meno agevole da calcolare.
264
Curve, grafici e superfici nello spazio
(V.8) Data la curva piana di equazione polare r = f (ϑ), con 0 ≤ a ≤ ϑ ≤ b ≤ 2π e f di classe C1 , consideriamo la regione D racchiusa da γ e dai due raggi ϑ = a, ϑ = b (si veda la Figura V.27). Verificare che 1 Area(D) = 2
Z
b
2 f (ϑ) dϑ.
a
Calcolare l’area racchiusa dalla cardioide di equazione polare r = 1 + sin ϑ, 0 ≤ ϑ ≤ 2π. Soluzione. Per dimostrare la formula richiesta useremo la versione (3) della formula per l’area . La frontiera di D è la giustapposizione di tre Quindi la formula trovata sarà vacurve, perciò calcoliamo separatamente i tre integrali. Il raggio ϑ = a lida solo se D soddisfa le corrispondenti ipotesi, ovvero se D è unione di (percorso dall’origine) è parametrizzato da r1 (t) = t cos a i + t sin a j, t ∈ un numero finito di insiemi semplici [0, f (a)], perciò, su questo tratto rispetto ad uno degli assi che hanno in comune solo un tratto di frontiera. Z b Z f (a) 1 1 ′ ′ [t cos a · sin a − cos a · t sin a] dt = 0. x(t)y (t) − x (t)y(t) dt = 2 a 2 0 Analogamente anche il raggio ϑ = b (percorso verso l’origine) dà contributo nullo, e l’area di D è data dall’integrale sul grafico della curva di equazione r = f (ϑ). Come abbiamo visto nell’Esercizio (V.3) questa è parametrizzata da r(t) = f (t) cos t i + f (t) sin t j, con t ∈ [a, b], perciò otteniamo Z 1 b Area(D) = f (t) cos t · f (t) cos t − (− f (t) sin t) · f (t) sin t dt, 2 a da cui la formula richiesta. Abbiamo studiato la curva di equazione polare r = 1+sin ϑ nell’Esercizio (V.3), da cui risulta anche che la regione da essa racchiusa è l’unione di due regioni semplici rispetto ad entrambi gli assi (quelle nel semipiano destro e sinistro, rispettivamente). Applicando la formula appena trovata otteniamo Z Z 2 1 b 1 2π (1 + sin ϑ)2 dϑ Area = f (ϑ) dϑ = 2 a 2 0 Z 1 − cos 2ϑ 1 2π dϑ 1 + 2 sin ϑ + = 2 0 2 2π 1 3π 1 3 ϑ − 2 cos ϑ − sin 2ϑ = . = 2 2 4 2 0 ✩ (V.9) È data r(t) : [a, b] → R3 , parametrizzazione regolare di classe C2 della curva γ. Verificare che la curvatura k(t) di γ nel punto r(t) vale k(t) =
kr′ (t) × r′′ (t)k . kr′ (t)k3
Determinare quindi i versori del triedro fondamentale.
Si
elidono i termini contenenti
f ′ (t).
F V.27
Esercizi
265
Soluzione. Le relazioni fondamentali da tener presente in tutto lo svolgimento sono quelle che legano l’ascissa curvilinea s al generico parametro t. In tutto l’esercizio l’apice denoterà la derivazione rispetto alla variabile t. Tenendo conto delle formule viste nel § 5 otteniamo
dt(s)
kT ′ (t(s))k kT ′ (t)k
dT(t(s))
′
= ′ T (t(s)) · = , cioè k(t) = ′ . k(t(s)) =
ds ds kr (t(s))k kr (t)k Dobbiamo dunque calcolare kT ′ (t)k. Invece di procedere con il calcolo diretto, procedimento un po’ insidioso, ragioniamo come segue: sappiamo che il versore tangente è dato da T(t) =
r′ (t) r′ (t) = , kr′ (t)k s′ (t)
r′′ (t) = s′′ (t)T(t) + s′ (t)T ′ (t).
Dato che la parametrizzazione è regolare, possiamo moltiplicare vettorialmente (a sinistra) entrambi i membri per r′ (t) = s′ (t)T(t). Ricordando che T × T = 0 otteniamo r′ (t) × r′′ (t) = (s′ (t)T) × (s′ (t)T ′ ) = (s′ (t))2 (T × T ′ ) = kr′ (t)k2 (T × T ′ ). Ora, dato che T ha norma costante (è un versore), esso è sempre perpendicolare a T ′ . Dalle proprietà del prodotto vettoriale abbiamo kT × T ′ k = kTk kT ′ k = kT ′ k e quindi kr′ (t) × r′′ (t)k = kr′ (t)k2 kT ′ (t)k. Ricavando kT ′ k e sostituendo nell’equazione iniziale si ottiene la formula per la curvatura. Infine, ragionando come nell’equazione iniziale, si ottiene subito (∗∗) N(t) =
T ′ (t) , kT ′ (t)k
dt(s) ds(t) 1 = kr′ (t)k e = ′ . dt ds kr (t(s))k
Con un piccolo abuso di notazio-
ne continuiamo ad indicare con T e k il versore tangente e la curvatura rispetto al parametro t.
Si
veda la Definizione (V.9) a pagina 234.
cioè r′ (t) = s′ (t)T(t).
Derivando l’ultima equazione possiamo scrivere (∗)
Ovvero
da cui B(t) = T(t) × N(t).
(V.10) Determinare il dominio delle seguenti funzioni s q 1 f (x, y) = + x − y2 , 2x − x2 − y2 1(x, y) = arcsin(y2 − x2 + 1),
h(x, y) = ln[(x2 − 1 − y)(x2 − 1 + y)] + ln(4 − x2 ).
Soluzione. L’espressione di f ha senso solo se gli argomenti delle radici non sono negativi; inoltre il denominatore deve essere sempre diverso
⊚
ATTENZIONE! Da (∗∗) segue
che
T ′ (t) = kT ′ (t)kN(t) = k(t)kr′ (t)kN(t).
Tenendo conto di questo fatto, l’equazione (∗) ha un notevole significato dal punto di vista meccanico. Infatti, utilizzando l’accelerazione a(t) = r′′ (t) e la velocità scalare v(t) = kr′ (t)k = s′ (t), essa si riscrive come a(t) = v′ (t)T(t) + v(t)T ′ (t) = v′ (t) T(t) + k(t)v2 (t) N(t). | {z } |{z} aT (t)
aC (t)
Di conseguenza, l’accelerazione è sempre nulla nella direzione binormale al moto, e può essere decomposta nelle sue componenti accelerazione tangenziale (la derivata della velocità scalare) e accelerazione centripeta (il quadrato della velocità scalare diviso per il raggio di curvatura del moto). Per risolvere una disequazione del tipo f (x, y) > 0 si procede solitamente per via grafica, cercando la parte di piano i cui punti hanno coordinate che la verificano. Si comincia disegnando i punti che soddisfano f (x, y) = 0, in genere una o più “curve”. Queste curve dividono il piano in due o più regioni (limitate o illimitate) in ognuna delle quali f , se è continua, mantiene lo stesso segno, che può quindi essere determinato valutando f in punto qualunque di tale regione.
266
Curve, grafici e superfici nello spazio
da zero. Questo equivale a richiedere che sia soddisfatto il sistema di disequazioni 2x − x2 − y2 > 0 x − y2 ≥ 0. L’equazione 2x − x2 − y2 = 0 corrisponde alla circonferenza di raggio unitario e centro (0, 1). Otteniamo 0 > x2 + y2 − 2x = (x − 1)2 + y2 − 1
⇐⇒
(x − 1)2 + y2 < 1.
Si tratta quindi dell’insieme dei punti che hanno distanza da (1, 0) inferiore ad uno, cioè del disco in Figura V.28. Per quanto riguarda le soluzioni della seconda disequazione x − y2 ≥ 0, osserviamo che x = y2 + 1 è la parabola con asse y = 0 e vertice nell’origine. Inoltre il punto (1, 0) verifica la disequazione: questo significa che l’insieme delle soluzioni è formato dai punti a destra della parabola e da quelli appartenenti alla parabola stessa. Il dominio D è dato dai punti che verificano entrambe le disequazioni, ovvero dai punti di intersezione tra le due regioni trovate: D quindi è l’insieme disegnato in Figura V.29. La funzione 1 quando l’argomento della funzione arcsin è compreso tra −1 e 1, cioè per −1 ≤ y2 − x2 + 1 ≤ 1. Devono quindi valere le disequazioni y2 − x2 ≤ 0 y2 − x2 ≥ −2. Si tratta della regione individuata dalle rette y = x, y = −x e dall’iperbole equilatera y2 − x2 = −2, come in Figura V.30. Per determinare il dominio di h dobbiamo imporre la positività degli argomenti dei logaritmi; dobbiamo chiedere pertanto che 4 − x2 > 0 e (x2 − 1 − y)(x2 − 1 + y) > 0. Questo significa considerare l’unione delle soluzioni dei due sistemi x2 < 4 x2 < 4 2 2 e x −1−y<0 x −1−y>0 2 2 x − 1 + y < 0. x − 1 + y > 0.
F V.28
F V.29
F V.30
Il due sistemi hanno per soluzioni i punti della striscia −2 < x < 2 compresi tra i grafici delle parabole y = x2 − 1, y = −x2 + 1. L’insieme finale è disegnato in Figura V.31. (V.11) Sia D = {(x, y) ∈ R2 : x ≥ 0, y ≥ 0, 3x + 2y ≤ 6}; disegnare il grafico della funzione f (x, y) = 6 − 3x − 2y avente dominio D. Soluzione. Osserviamo che, sul piano xy il dominio è il triangolo di vertici (0, 0), (2, 0) e (0, 3). Il grafico della funzione è quindi la parte del piano 3x + 2y + z = 6 che si proietta su tale triangolo (Figura V.32).
F V.31
Esercizi
267
(V.12) Calcolare, utilizzando la Definizione (V.37),
lim
(x,y)→(0,0)
xy.
Soluzione. Per trovare il candidato limite ci avviciniamo all’origine lungo le direzioni degli assi. Poiché si ha f (x, 0) ≡ f (0, y) ≡ 0, ne deduciamo che, se esiste, il limite dovrà essere nullo. Per verificare che questo è il caso, dobbiamo verificare che, per ε > 0 fissato e δ > 0 opportuno, q 0 < x2 + y2 < δ =⇒ xy < ε. x2 + y2 (infatti (x ± y)2 ≥ 0), dunque, 2 q δ2 x2 + y2 < δ =⇒ xy < . 2 √ e basterà scegliere δ = 2ε per concludere che il limite è nullo.
Osserviamo che |xy| ≤
F V.32
Calcolo di limiti in coordinate polari (V.13) Calcolare
lim
(x,y)→(0,0)
xy . p x2 + y2
Soluzione. Al solito, per trovare il candidato limite osserviamo che avvicinandosi all’origine lungo le direzioni degli assi il valore della funzione è costantemente uguale a zero perciò, se esiste, il limite è sicuramente nullo. Per verificare che questo è il caso, dobbiamo verificare che, per ε fissato e δ opportuno, q xy 2 2 < ε. 0 < x + y < δ =⇒ p x2 + y2 o n p A questo punto osserviamo che l’insieme (x, y) : 0 < x2 + y2 < δ si scrive in modo semplice, utilizzando le coordinate polari centrate nell’origine, come {(r, ϑ) : 0 < r < δ, ϑ ∈ [0, 2π]}. Dato che f (r cos ϑ, r sin ϑ) =
r2 cos ϑ sin ϑ r = r cos ϑ sin ϑ = sin(2ϑ) r 2
si tratta di verificare
r 0 < r < δ =⇒ sin(2ϑ) < ε, 2
∀ϑ ∈ [0, 2π].
Osserviamo che la parte dipendente dall’angolo cos ϑ sin ϑ è limitata in modulo: | sin 2ϑ| ≤ 1,
∀ϑ ∈ [0, 2π].
Perciò |r/2 sin(2ϑ)| ≤ r/2 e basta scegliere δ = 2ε per concludere che il limite è nullo.
Cioè x = r cos ϑ e y = r sin ϑ.
268
Curve, grafici e superfici nello spazio
Per il calcolo dei limiti di funzioni di due variabili è effettivamente utile ricorrere alle coordinate polari x = x0 + r cos ϑ,
Quando il limite viene calcolato in
y = y0 + r sin ϑ.
(x0 , y0 ).
Allora la funzione f ha limite L per (x, y) che tende a (x0 , y0 ) se e solo se ∀ε > 0 ∃ δ > 0 tale che (4)
0 < r < δ ⇒ | f (x0 + r cos ϑ, y0 + r cos ϑ) − L| < ε, ∀ϑ ∈ [0, 2π].
Posto s(r) = sup f (x0 + r cos ϑ, y0 + r sin ϑ) − L ϑ∈[0,2π]
ci siamo ricondotti a dimostrare che lim s(r) = 0. r→0
Vediamo nel prossimo esercizio come si procede in concreto. (V.14) Calcolare
x2 y . (x,y)→(0,0) x2 + y2 lim
Soluzione. Per iniziare, la funzione è definita in prossimità di (0, 0), perciò ha senso calcolare il limite richiesto. Passando alle coordinate polari x = r cos ϑ, y = r sin ϑ risulta x2 y (r cos ϑ)2 (r sin ϑ) = lim = lim r cos2 ϑ sin ϑ. lim 2 2 r→0 (r cos ϑ)2 + (r sin ϑ)2 r→0 (x,y)→(0,0) x + y Dunque per ϑ fissato l’ultimo limite è zero. Per concludere che il limite di partenza è 0 consideriamo s(r) = sup f (x0 + r cos ϑ, y0 + r sin ϑ) − L = sup r cos2 ϑ| sin ϑ| ϑ∈[0,2π]
ϑ∈[0,2π]
e osserviamo che, essendo cos2 ϑ| sin ϑ| ≤ 1 si ha s(r) = r max cos ϑ| sin ϑ| ≤ r. ϑ∈[0,2π]
Quindi r→0
=⇒
r→0
come si utilizzano le coordinate polari nel calcolo dei limiti: ➔ comporre la funzione ponendo x = x0 + r cos ϑ, y = y0 + r sin ϑ; ➔ valutare il limite per r → 0 della funzione composta tenendo ϑ fisso (cioè si valuta il limite della funzione lungo una retta passante per il punto (x0 , y0 )). Se il limite trovato ha un valore che dipende da ϑ, si conclude che il limite di partenza non esiste;
➔ se invece il limite è un valore L indipendente da ϑ occorre stimare, per r fissato, il massimo scarto della funzione composta rispetto al limite al variare di ϑ ∈ [0, 2π]: s(r) = sup f (x0 + r cos ϑ, y0 + r sin ϑ) − L
2
0 ≤ lim s(r) ≤ lim r = 0
Riassumiamo
lim s(r) = 0
ϑ∈[0,2π]
r→0
➔ dimostrare che
e il limite di partenza è nullo.
lim s(r) = 0. r→0
3
(V.15) Calcolare, se esiste, il limite
lim
(x,y)→(0,0)
x log(1 + x ) . y(x2 + y2 )
Esercizi
269
Soluzione. Se passiamo a coordinate polari il limite richiesto è lim r cos ϑ r→0
ln(1 + r3 cos3 ϑ) . r sin ϑ · r2
Sfruttando la relazione ln(1 + x) ∼ x per x → 0, ci si riconduce al limite lim r→0
r cos4 ϑ r4 cos4 ϑ . = lim r→0 sin ϑ r3 sin ϑ
Per calcolarlo osserviamo che il limite è di tipo lim rM(ϑ) r→0
dove M(ϑ) = cos4 ϑ/sin ϑ. Per ogni valore di ϑ , ±π fissato il limite è nullo. Dobbiamo pertanto valutare s(r) = sup f (x0 + r cos ϑ, y0 + r sin ϑ) − L = sup r|M(ϑ)| . A differenza dell’esercizio precedente, ora la funzione M non è limitata, poiché (ad esempio) per ϑ = π presenta un asintoto verticale. Questa osservazione ci suggerisce che il limite probabilmente non esista e che i problemi nascano nell’avvicinarsi all’origine lungo curve tangenti all’asse x (cioè con retta tangente che forma un angolo di ϑ = π con l’asse delle x). Consideriamo ad esempio la restrizione di f alla curva C di equazione y = x2 : x log(1 + x3 ) log(1 + x3 ) = 3 x (1 + x2 ) x2 (x2 + x4 )
y , 0, altrimenti la funzione di cui vogliamo calcolare il limite non è definita.
ϑ∈[0,2π]
ϑ∈[0,2π]
f (x, x2 ) =
Ovviamente lavoriamo con
e
lim x→0
Infatti limϑ→π± M(ϑ) = ±∞.
log(1 + x3 ) x3 = lim = 1. x→0 x3 x3 (1 + x2 )
Abbiamo così dimostrato che il limite non esiste: infatti f tende a 0 se viene ristretta ad esempio alla retta y = x, mentre ristretta a y = x2 tende a 1.
Stiamo
usando la Proposizio-
ne (V.39).
(V.16) Al variare del parametro a > 0, studiare l’esistenza del limite lim
(x2 − 2x + 1)y . − 2x + 1 + y2 )a
(x,y)→(1,0) (x2
Soluzione. Poniamo x = 1 + r cos ϑ e y = r sin ϑ e valutiamo lim r→0
r3 cos2 ϑ sin ϑ = lim r3−2a cos2 ϑ sin ϑ. r→0 r2a
Dato che | cos2 ϑ sin ϑ| ≤ 1, se 3 − 2a > 0 abbiamo 0 ≤ |r3−2a cos2 ϑ sin ϑ| ≤ r3−2a → 0
per r → 0,
perciò il limite proposto vale 0. Se invece 3 − 2a = 0 il limite precedente dipende da ϑ, risultando pari a cos2 ϑ sin ϑ: concludiamo che il limite dato non esiste. Allo stesso modo non esiste il limite della funzione data se 3 − 2a < 0, poiché il limite vale +∞ o −∞ al variare di ϑ.
La quantità rb tende a 0, per r → 0, solo se b > 0.
⊚ ATTENZIONE!
270
Curve, grafici e superfici nello spazio
(V.17) Scrivere una parametrizzazione della superficie Σ che si ottiene facendo ruotare attorno all’asse z la circonferenza contenuta nel piano xz, di centro (b, 0, 0) e raggio a < b (tale superficie, detta toro, è illustrata in Figura V.33). Soluzione. Osserviamo in Figura V.33 che ogni punto (x, 0, z) della circonferenza di partenza descrive a sua volta una circonferenza, avente raggio x ed appartenente al piano orizzontale con z costante. Questo ci suggerisce di usare come primo parametro u = ϑ l’angolo che individua la rotazione attorno all’asse z. Così facendo, il punto (x, 0, z) genera la circonferenza di parametrizzazione (x cos u, x sin u, z). Per ottenere Σ dobbiamo far variare (x, 0, z) sulla circonferenza di partenza. Questa ha centro in (b, 0, 0) e raggio a: usando come parametro v = α l’angolo in figura, otteniamo che (x, 0, z) = ((b + a cos v), 0, a sin v). Ambedue gli angoli variano tra 0 e 2π, quindi Σ è parametrizzata da
F V.33
r(u, v) = (b + a cos v) cos u i + (b + a cos v) sin u j + a sin v k, con (u, v) ∈ [0, 2π] × [0, 2π].
✎ Diamoci da fare. . . (Soluzioni a pagina 612) o 1 Parametrizzare la curva data. (a) (x, y) ∈ R2 : y = x2 − 2x, y ≤ 0 ; (b) (x, y) ∈ R2 : x = ey − y, 0 ≤ y ≤ 1 ; (c) (x, y) ∈ R2 : x2 + y2 = 5, y ≥ x ; (d) (x, y) ∈ R2 : 9x2 + 4y2 = 1, x ≤ 0 ; (e) (x, y) ∈ R2 : x2 + 4y2 − 4x = 0 ; (f) (x, y) ∈ R2 : x2 + 4y2 − 4x = 0, y ≤ 0 ; (g) (x, y) ∈ R2 : x2 − y2 = −1, 1 ≤ y ≤ 2 .
4 Scrivere l’equazione cartesiana della curva di equazione polare r=
1 1 − ε sin ϑ
e classificarla al variare di ε ≥ 0.
o 5 Parametrizzare la curva data. (a) (x, y, z) ∈ R3 : x = 1 − y2 , z = x, x ≥ 0 ; (b) (x, y, z) ∈ R3 : x2 + y2 = 1, 2x − z = 0 ; (c) (x, y, z) ∈ R3 : z = x2 + y2 , 2x − z = 0 ; (d) (x, y, z) ∈ R3 : x2 + y2 + z2 = 1, x + y = 0, x ≥ 0 ; b 2 Scrivere l’equazione polare, con polo nell’origine, della curva assegnata mediante l’equazione cartesiana (e) (x, y, z) ∈ R3 : x2 + y2 + z2 = 4, x2 + y2 − 2x = 0, (facendo particolare attenzioni alle limitazioni per ϑ). z ≥ 0}; (a) y = 2x; (d) x2 + y2 − 2x = 0; (f) (x, y, z) ∈ R3 : x2 + y2 = 1, x2 + z2 = 1 ; (b) y = x2 ; (e) x2 + y2 − 2y = 0; (g) (x, y, z) ∈ R3 : x2 + y2 = 1, x2 + z2 = 1, z ≥ 0 . (c) y = x + 5; (f) x2 + y2 − 2x − 2y = 0. 6 Scrivere l’equazione della retta tangente al grafico di y = f (x), a ≤ x ≤ b nel punto x0 . Scrivere poi l’equazioo 3 Scrivere l’equazione cartesiana della curva assegnata ne della retta tangente alla curva di parametrizzazione mediante l’equazione polare. r(t) = t i + f (t) j, a ≤ t ≤ b, per t = t0 e verificare che le (a) r = 2a cos ϑ; due rette coincidono. (b) r = cos 2ϑ; b 7 Dopo aver verificato che la parametrizzazione data è regolare in t0 scrivere l’equazione della retta tangente (c) r = 1 + sin ϑ. corrispondente.
Esercizi
271
(a) r(t) = et i + t j + sin t k, t0 = 0; (b) r(t) = 4 arctan t i + (1 + 2t2 ) j + ln t k, t0 = 1; √ (c) r(t) = 5 + t i + 3t j + cos2 (t + 1) k, t0 = −1;
(d) r(t) = cos t i + sin t j + 2t k, t0 = π/2.
o 8 È data la curva in R4 parametrizzata da cos t sin t , r(t) = t ∈ [0, 2π]. cos 2t sin 2t Dopo aver verificato che non è una curva tridimensionale (nel senso che non è contenuta in alcun sottospazio vettoriale di dimensione 3 di R4 ) calcolarne la lunghezza. K 9 Dimostrare la disuguaglianza triangolare
Z b
Z b
kr(t)k dt. r(t) dt
≤
a a Dedurne che qualunque curva (regolare) che congiunge due punti ha sempre lunghezza maggiore o uguale a quella del segmento che li congiunge. K 10 Dimostrare che (a) la curva ottenuta come giustapposizione di due curve ha come lunghezza la somma delle lunghezze;
(d) r(t) = et i + e−t j +
√ 2t k;
13 Sia r¯(s), 0 ≤ s ≤ L, la parametrizzazione (regolare) secondo l’ascissa curvilinea della curva piana γ ⊂ R3 . Verificare che, se è sempre definito, il versore binormale B(s) è costante. Dedurne che, per ogni s, il piano osculatore coincide con quello che contiene la curva, e che la torsione è nulla. ✩ 14 Verificare che se F(t) = f (t)/k f (t)k allora " # f (t) · f ′ (t) 1 dF = f ′ (t) − f (t) . 2 dt k f (t)k k f (t)k Sfruttare il risultato per mostrare che la torsione di una curva di parametrizzazione regolare r(t) è data dalla formula τ(t) =
(r′ (t) × r′′ (t)) · r′′′ (t) . kr′ (t) × r′′ (t)k2
15 Calcolare il triedro fondamentale, la curvatura e la torsione nel punto assegnato. (a) r(t) = 2t i + t2 j + ln t k per t ∈ [1, 4], t0 = 2;
(b) y = x3 in (1, 1).
16 Trovare le equazioni del piano normale e del piano osculatore della curva nel punto assegnato (a) r(t) = sin t i + cos t j + sin t k in t0 = π;
(b) r(t) = t3 i + 3t j + t4 k in t0 = 1. (b) la formula per la lunghezza di una curva (Teorema (V.18) a pagina 240) è indipendente dalla K 17 Dimostrare che le componenti tangenziale e cenparametrizzazione scelta. tripeta dell’accelerazione di una particella che si muove seguendo la traiettoria r(t) sono date dalle formule b 11 Calcolare la lunghezza delle seguenti curve. √ r′ (t) · r′′ (t) kr′ (t) × r′′ (t)k (a) r(t) = et i + e−t j + 2t k per t ∈ [0, 1]; aT (t) = , a (t) = . C kr′ (t)k kr′ (t)k (b) r(t) = t i + ln t j + (3 + t) k per t ∈ [1, 2]; √1 2 −x
(c) r(t) =
(d) y = e
sin t i +
√1 2
sin t j + cos t k per t ∈ [0, 8π];
per x ∈ [0, 1];
(e) r = ϑ2 , ϑ ∈ [0, 2]; (f) r = eϑ , ϑ ∈ [0, 2];
K 18 Una particella si muove lungo la traiettoria r(t) = t2 i + t3 j + t k. Trovare le componenti tangenziale e centripeta dell’accelerazione.
K 19 (a) Dimostrare che, per una curva piana, chiusa e regolare a tratti, vale Z b Z b b 12 Riparametrizzare la curva assegnata secondo ′ l’ascissa curvilinea. x(t)y (t) dt = − x′ (t)y(t) dt √ a a (a) r(t) = 5t i + 2 cos t j + 2 sin t k; √ e che tale quantità non dipende dalla parametriz(b) r(t) = (1 + t) i + (3 − 4t) j + 8t k; zazione della curva (purché di classe C1 ) ma solo √ √ 2 t 2 t t dalla sua orientazione. (c) r(t) = e cos t i + 2 e sin t j + 2 e sin t k; (g) r = sin ϑ, ϑ ∈ [π, 4π].
272
Curve, grafici e superfici nello spazio
(b) Verificare che gli integrali precedenti sono uguali alle quantità Z 1 b [x(t) + y′ (t)]2 − [x(t) − y′ (t)]2 dt 4 a Z 1 b =− [y(t) + x′ (t)]2 − [y(t) − x′ (t)]2 dt. 4 a 20 Dati due vettori del piano u e v, si consideri la curva r(t) = u cos t + v sin t, t ∈ [−π, π]. Dopo averla disegnata, calcolarne l’area racchiusa. ✩ 21 Sia γ una curva chiusa piana (sufficientemente regolare) e r(t) = (x(t), y(t)) una sua parametrizzazione semplice con t ∈ [−π, π]. Poiché γ è chiusa, le componenti di r sono funzioni periodiche che si possono sviluppare in serie di Fourier: x(t) = a0 + y(t) = c0 +
∞ X n=1 ∞ X
(an cos nt + bn sin nt) (cn cos nt + dn sin nt) .
24 Determinare il dominio della funzione x+ f (x, y) = p
p
cos2 y − 1
y − x2 + 2π
.
b 25 Dopo aver determinato e rappresentato il campo d’esistenza D delle seguenti funzioni, dire se e quando tali insiemi sono aperti o chiusi. p 1 1 (a) z = 1 − x2 − y2 ; + ; (f) z = x−1 y (b) z = ln(x + y); p √ (g) z = sin(x2 + y2 ); 1 − x2 + (c) p z = (h) z = y − ln xy; 1 − y2 ; p (i) z = 5 − 2x2 − y; (d) z = y sin x; 1 x−y (j) z = q . (e) z = arctan ; √ 1 + x2 y2 y− x 26 Verificare che gli insiemi di livello di
n=1
Dimostrare che l’area A racchiusa dalla curva vale ∞ X A = π n [an dn − bn cn ] . n=1
z = 1 + x − y e z = x2 − y2 corrispondono ai grafici in figura.
(Suggerimento: dopo aver derivato termine a termine le serie, utilizzare l’Esercizio 19 insieme all’uguaglianza di Parseval (approfondimento a pagina 63) per le serie di Fourier.) ✩ 22 Come nell’esercizio precedente, dimostrare che, se la curva è percorsa con velocità di modulo costante, la lunghezza della curva soddisfa la relazione: Z π ∞ X b 27 L2 = ((x′ )2 +(y′ )2 ) dt = π n2 a2n + b2n + c2n + d2n . (a) 2π −π n=1 (b) (Suggerimento: utilizzare l’uguaglianza di Parseval (c) (approfondimento a pagina 63).) (d) ✩ 23 (Disuguaglianza isoperimetrica) Dimostrare che la relazione tra l’area, A, racchiusa da una curva piana e la (e) sua lunghezza, L, è 4πA ≤ L2 . Dimostrare inoltre che l’uguaglianza si ha soltanto nel caso di una circonferenza. (Suggerimento: si utilizzi una parametrizzazione della curva di velocità costante in modulo, e, dopo averla sviluppata in serie di Fourier, le espressioni dell’area e della lunghezza travate negli Esercizi 21 e 22 .)
Disegnare gli insiemi di livello delle funzioni date z = x + 2y; (f) z = ln(x + y2 ); √ z = xy; (g) z = ex/y ; z = (1 + x + y)2 ; (h) z = y − ln x; y z = 2; x (i) z = x2 + 9y2 ; 2x z= 2 ; (j) z = ln(x2 + y2 ). x + y2
28 Stabilire la corrispondenza tra le funzioni indicate, i loro grafici e le mappe di livello mostrati nella figura a pagina 273. p (a) z = sin x2 + y2 ; (d) z = x3 − 3xy2 ; 1 (e) z = sin2 x + 41 y2 ; (b) z = 2 ; x + 4y2 2 2 (c) z = sin x sin y; (f) z = x2 y2 e−x −y .
Esercizi
273
K 29 Dimostrare che, se h = h(x) e 1 = 1(y) sono funzioni continue di una variabile reale, allora, per le funzioni di due variabili f (x, y) = h(x) e f (x, y) = h(x)1(y) valgono i limiti lim
(x,y)→(x0 ,y0 )
h(x) = h(x0 )
lim
(x,y)→(x0 ,y0 )
h(x)1(y) = h(x0 )1(y0 ).
K 30 (Teorema della permanenza del segno) Dimostrare che se f è una funzione continua e lim
(x,y)→(x0 ,y0 )
f (x, y) = L > 0
allora esiste un raggio r > 0 per cui nella palla aperta Br (x0 , y0 ) ∪ D la funzione f è positiva. (Suggerimento: si applichi la definizione di limite con ε = L/2.) o b 31 Trovare il limite se esiste o dimostrare che non esiste. x3 (a) lim ; 2 (x,y)→(0,0) x + y2 xy − 2y ; (b) lim (x,y)→(2,0) x2 + y2 − 4x + 4 sin(x − 1)y ; (c) lim (x,y)→(1,2) x2 − 2x + 1 x2 + y2 ; (d) lim p 2 (x,y)→(0,0) x + y2 + 1 − 1 2x2 + 3xy + y2 (e) lim ; (x,y)→(0,0) x2 + 5y2 (x + y)2 (f) lim ; (x,y)→(0,0) x2 + y2 (g) (h) (i)
lim
(x,y)→(0,0)
lim
(x,y)→(0,0)
lim
(x,y)→(0,0)
x2 sin2 y ; x2 + 3y2 sin x2 − sin y2 ; x2 + y2 arctan(x + y)2 . x2
32 Determinare il dominio e delle funzioni date. xy + 1 (d) ; (a) z = 2 x −y 1 (b) z = ; (e) 1 − x2 − y2 1 (c) z = ; (f) (x − y)2
studiare la continuità cos
1 ; xy2
z = ln
p
x2 + y2 − 1;
x2 −xy3
z=e
sin(x +
√
y);
x−y ; 1 + x2 + y2 2 x − y2 2 (h) f (x, y) = x + y2 0 (g) z =
(x, y) , (0, 0)
;
(x, y) = (0, 0)
x2 y3 (x, y) , (0, 0) (i) f (x, y) = ; 2x2 + y2 0 (x, y) = (0, 0) sin(x2 + y2 ) (x, y) , (0, 0) . (j) f (x, y) = x2 + y2 0 (x, y) = (0, 0) 33 Verificare che la funzione xy2 2 x + y4 f1 (x, y) = 0
se x ≥ 0, y , 0 (x, y) = (0, 0),
è discontinua nell’origine, mentre la sua restrizione alla porzione di piano {(x, y) : 0 ≤ |y| ≤ x}, xy2 2 x + y4 f2 (x, y) = 0
se 0 < |y| ≤ x altrimenti,
è continua in (0, 0). 34 Parametrizzare la superficie data. (a) (x, y, z) ∈ R3 : x2 + y2 + z2 − 4x + 4z = 8 ; (b) (x, y, z) ∈ R3 : x2 + y2 − z2 = 4 ; (c) (x, y, z) ∈ R3 : x2 + y2 + z2 = 16, −2 ≤ z ≤ 2 ; (d) (x, y, z) ∈ R3 : 9x2 + 4y2 + z2 = 1, x > 0 ; (e) (x, y, z) ∈ R3 : x3 + 3xy + z2 = 2, z ≥ 0 ; (f) la parte di piano z = 2x+4 che si proietta nel piano z = 0 sul triangolo di vertici (0, 0), (1, 0) e (0, 1); (g) la parte del cilindro x2 +z2 = 1 compresa tra i piani y = −2 e y = 4; (h) la parte di piano y = 3 dentro al paraboloide x2 + z2 = y.
274
Curve, grafici e superfici nello spazio
Frustra fit per plura quod potest fieri per pauciora.(17) G UILLELMUS
C APITOLO
DE
Summa Logicae I.12 O CKHAM (∼1285 – ∼1350)
VI Calcolo differenziale per funzioni di più variabili
Questo capitolo contiene un’introduzione al calcolo differenziale in più variabili ad uso dei lettori più interessati alle applicazioni che allo sviluppo della teoria. Un approccio più formale e sistematico, necessario sia quando si vogliano approfondire alcuni aspetti teorici, sia quando si vogliano estendere i concetti al caso generale di funzioni fra spazi euclidei, verrà invece adottato nel prossimo capitolo. In questo capitolo tratteremo le funzioni di due variabili, con qualche accenno al caso di tre. Affronteremo la nozione di derivabilità, intro-
ducendo i concetti di derivata parziale e direzionale. Approfondiremo poi il concetto chiave della differenziabilità e chiariremo le differenze fra queste nozioni. Una gran parte del capitolo è dedicata all’applicazione della differenziazione al problema della ricerca dei massimi e minimi liberi e vincolati di funzioni di due variabili. Per comprendere il contenuto di questo capitolo è necessario aver familiarizzato con le curve e le superfici nello spazio, che sono state trattate nel Capitolo V.
C
ome per le funzioni di una variabile, il calcolo differenziale in più variabili permette di formulare e risolvere, in modo unitario, molti problemi diversi. Uno di questi è stato posto alla fine dello scorso capitolo e riguarda la definizione di piano tangente ad una superficie. Nel risolvere questo problema scopriremo, con un po’ di sorpresa, una differenza sostanziale rispetto all’analogo problema della retta tangente che abbiamo trattato nel primo volume e ripreso nel capitolo precedente.
§ 1. Derivate parziali Come abbiamo imparato nel primo volume, la derivata di una funzione di una variabile misura il suo tasso di variazione istantaneo, definito come
276
Calcolo differenziale per funzioni di più variabili
limite del rapporto incrementale lim h→0
Quando si passa a funzioni di più variabili la situazione si complica, in quanto ci si può spostare da un punto in molte direzioni diverse ed è intuitivamente chiaro che la variazione di f dipenderà non solo dalla distanza tra il punto finale e quello iniziale, ma anche dalla direzione. Scegliere la direzione di uno degli assi coordinati porta al concetto di derivata parziale.
f (x0 + h) − f (x0 ) . h
Le possibili derivate parziali di una funzione sono tante quante sono le sue variabili e misurano i tassi di variazione della funzione relativi alla variazione di ciascuna di esse. (VI.1) Esempio (Funzioni lineari). Consideriamo una funzione lineare f (x, y) = ax + by + c: il suo tasso di crescita rispetto alla variabile x è costantemente a, mentre il suo tasso di crescita rispetto alla variabile y è costantemente b. Anche la funzione f (x, y) = xy è lineare, separatamente in ciascuna delle sue variabili. Il suo tasso di crescita rispetto alla variabile x dipende ora dal punto (x0 , y0 ) in considerazione. Esso vale infatti y0 , mentre quello di variazione rispetto ad y sarà x0 . Data una funzione f : A ⊂ R2 → R, con A aperto, e un punto (x0 , y0 ) ∈ A, diamo la seguente definizione. (VI.2) Definizione. Le derivate parziali di f nel punto P0 = (x0 , y0 ) ∈ A sono
Per essere precisi
f è una funzione lineare affine (si veda il commento a pagina 135). La parola «affine» è però un po’ in disuso, e ci uniformiamo volentieri, qui e nel seguito, alla condizione contemporanea di povertà nel linguaggio scritto, cercando di usarla il meno possibile. Evitiamo così di scrivere termini che potrebbero essere scomodi per i non pochi che faticano a tenere a mente nello stesso mese più di un migliaio di vocaboli diversi.
f (x0 + h, y0 ) − f (x0 , y0 ) e h h→0 f (x0 , y0 + h) − f (x0 , y0 ) f y (x0 , y0 ) = lim , h→0 h
fx (x0 , y0 ) = lim
purché i limiti esistano finiti. Ci sono molte notazioni per indicare le derivate parziali di f , ad esempio fx (x0 , y0 ),
∂x f (x0 , y0 ),
∂f (x0 , y0 ), ∂x
∂ f (x0 , y0 ), ∂x
Dx f (x0 , y0 )
sono simboli fra loro equivalenti per la derivata parziale di f rispetto a x nel punto (x0 , y0 ). Osserviamo che le derivate parziali di f non sono altro che le derivate (rispetto alle variabili x e y rispettivamente) delle due tracce di f con y = y0 e x = x0 . Infatti, la traccia sul piano y = y0 è una funzione della sola variabile x 11 (x) = f (x, y0 ) e se 11 è derivabile in x = x0 , cioè, se esiste finito il limite del rapporto incrementale troviamo 1′1 (x0 ) = lim h→0
11 (x0 + h) − 11 (x0 ) = fx (x0 , y0 ). h
Se f è una funzione delle tre variabili x, y, z in un punto (x0 , y0 , z0 ) si possono definire tre derivate parziali: fx , fy , fz . Ad esempio la prima è definita come fx (x0 , y0 , z0 ) = lim
h→0
f (x0 + h, y0 , z0 ) − f (x0 , y0 , z0 ) . h
§ 1. Derivate parziali
277
In modo del tutto simmetrico avremo f y (x0 , y0 ) = 1′2 (y0 ), avendo definito la traccia 12 (y) = f (x0 , y). Pertanto, per calcolare le derivate parziali possiamo ricorrere alle usuali regole di derivazione per le funzioni di una variabile reale. (VI.3) Esempio. Calcoliamo le derivate parziali in (2, 1) della funzione f (x, y) = x sin(xy2 ) + x4 y3 + 2y. Definiamo 11 (x) = f (x, 1) = x sin x+x4 +2,
12 (y) = f (2, y) = 2 sin(2y2 )+16y3 +2y.
Si tratta di due funzioni derivabili e 1′1 (x) = sin x + x cos x + 4x3 ,
1′2 (y) = 8y cos(2y2 ) + 48y2 + 2,
Ovviamente deriviamo 11 rispetto ad x e 12 rispetto ad y.
dunque 1′1 (2) = sin 2 + 2 cos 2 + 32, 1′2 (1) = 8 cos 2 + 50, e in definitiva otteniamo fx (2, 1) = sin 2 + 2 cos 2 + 32,
f y (2, 1) = 8 cos 2 + 50.
Proseguiamo calcolando le derivate parziali nel generico punto di coordinate (x, y). Mantenendo y costante e derivando rispetto a x si ottiene 2
2
2
3 3
fx (x, y) = 1 · sin(xy ) + x cos(xy ) · y + 4x y , mentre, tenendo x costante e derivando rispetto a y, si ottiene f y (x, y) = x cos(xy2 ) · 2xy + 3y2 x4 + 2. Ovviamente, sostituendo x = 2 e y = 1 otteniamo le derivate parziali calcolate poco sopra. (VI.4) Esempio. Calcolare, se esistono, le derivate parziali nell’origine della funzione dell’Esempio (V.41) xy2 (x, y) , (0, 0) 2 f (x, y) = x + y4 0 (x, y) = (0, 0). Osserviamo che le tracce 11 (x) = f (x, 0) e 12 (y) = f (0, y) sono identicamente nulle. Si tratta dunque di funzioni derivabili, le cui derivate sono nulle a loro volta. Applicando la Definizione (VI.2) risulta così fx (0, 0) = 0 ,
Nella
derivazione rispetto a x trattiamo y come un parametro.
Nella derivazione rispetto a y, x è un parametro.
ATTENZIONE! Nell’ultimo passggio, per calcolare le derivate parziali in un punto abbiamo calcolato dapprima l’espressione delle derivate parziali nel generico punto (x, y) e poi sostituito i valori x = x0 ,y = y0 . Questo procedimento, utilizzabile in molte circostanze, ha lo svantaggio di presupporre l’esistenza delle derivate parziali in tutti i punti vicini e pertanto non è sempre è applicabile. Invitiamo il Lettore a provare a seguire questa strada per la funzione del prossimo esempio, per scoprire che non funziona.
⊚
f y (0, 0) = 0 .
Osserviamo infine che la funzione f non è continua nell’origine. Infatti (Esempio (V.41) a pagina 254) il lim(x,y)→(0,0) f (x, y) non esiste. (VI.5) Definizione. Se in un punto (x, y) esistono entrambe le derivate parziali si dice che f è derivabile in (x, y). Inoltre, se f è derivabile in ogni punto (x, y) ∈ A, si dice che f è derivabile in A. Il vettore le cui componenti sono le derivate parziali di f in un punto (x, y) si chiama gradiente di f : ∂f ∂f (x, y)i + (x, y) j. ∇ f (x, y) = fx (x, y), f y (x, y) = ∂x ∂y
Tuttavia
essa ammette entrambe le derivate parziali! Quindi per funzioni di più variabili derivabile 6 =⇒ continua.
Analogamente per funzioni di tre variabili si ha ∂f ∂f ∂f ∇ f = fx , fy , fz = i+ j+ k. ∂x ∂y ∂z
278
Calcolo differenziale per funzioni di più variabili
Significato geometrico delle derivate parziali. Com’è noto per le funzioni di una unica variabile, la derivata è la pendenza (o coefficiente angolare) della retta tangente al grafico della funzione nel punto assegnato. Le derivate parziali di una funzione di due variabili sono anch’esse legate alle pendenze di rette tangenti al grafico, ma di queste rette, ora, ce n’è più d’una. Per dare una interpretazione geometrica alle derivate parziali, seguiamo la costruzione indicata in Figura VI.1. Il grafico della funzione z = f (x, y) è una superficie S in R3 , ed il punto P di coordinate (x0 , y0 , z0 ) con z0 = f (x0 , y0 ) si trova su di essa. Fissare y = y0 significa restringere l’attenzione alla curva C1 data dall’intersezione di S col piano verticale di equazione y = y0 (la traccia di S nel piano y = y0 ): questa curva è in effetti il grafico della funzione di una variabile z = 11 (x) = f (x, y0 ), visualizzato in un piano verticale. La curva C1 passa per il punto P e la sua retta tangente in P ha coefficiente angolare pari a 1′1 (x0 ) = lim h→0
f (x0 + h, y0 ) − f (x0 , y0 ) ; h
F VI.1
ricordando la Definizione (VI.2), questo è proprio fx (x0 , y0 ). La derivata parziale di f rispetto a x in (x0 , y0 ) è dunque il coefficiente angolare della retta T1 tangente in P alla traccia di S nel piano verticale y = y0 . Analogamente f y (x0 , y0 ) è il coefficiente angolare della retta T2 tangente in P alla curva C2 , traccia di S nel piano verticale x = x0 . La curva C1 può essere parametrizzata come (x, y0 , f (x, y0 )), al variare di x; pertanto essa ha, in P, vettore tangente u = (1, 0, fx(x0 , y0 )). Analogamente, C2 può essere parametrizzata come (x0 , y, f (x0 , y)) con parametro y e il suo vettore tangente in P è v = (0, 1, f y(x0 , y0 )). Osserviamo che le due rette T1 e T2 hanno il punto P in comune e dunque esiste un unico piano (passante per P) che le contiene (Figura VI.2). Il vettore N = u × v = (− fx (x0 , y0 ), − f y (x0 , y0 ), 1) è normale a tale piano, che ha pertanto equazione (1)
z = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + f y (x0 , y0 )(y − y0 ).
(VI.6) Esempio. Consideriamo il paraboloide di equazione z = x2 + y2 . Le sue derivate parziali in un generico punto (x, y) sono fx (x, y) = 2x e f y (x, y) = 2y. In particolare se scegliamo (x0 , y0 ) = (0, 0), otteniamo fx (0, 0) = 0 e f y (0, 0) = 0 l’equazione del piano (1) diventa z = 0. Se vogliamo invece calcolarlo nel punto (1, 2, f (1, 2)) abbiamo f (1, 2) = 5,
fx (1, 2) = 2,
e risulta z = 5 + 2(x − 1) + 4(y − 2).
f y (1, 2) = 4
Quando una funzione è derivabile, potremmo sentirci tentati di definire tangente il piano di equazione (1), giacché contiene le due rette tangenti alle sezioni trasversali. Tuttavia, alla luce dell’Esempio (VI.4) che
F VI.2: piano passante per P e contenente le rette tangenti alle tracce di S, T1 e T2 .
§ 2. Derivate direzionali
279
mostra una funzione discontinua ma derivabile, siamo invitati a riflettere più approfonditamente se tale piano corrisponda veramente all’idea intuitiva di piano tangente. (VI.7) Esempio. La funzione xy se (x, y) , (0, 0) 2 x + y2 f (x, y) = 0 se (x, y) = (0, 0) non è continua in (0, 0): infatti abbiamo visto nell’Esempio (V.40) che lim(x,y)→(0,0) f (x, y) non esiste. Però f (0 + h, 0) − f (0, 0) f (0 + h, 0) − f (0, 0) 1 h · 0 = = 0, = 0 =⇒ lim h h h2 + 02 h h→0 quindi la derivata parziale rispetto a x in (0, 0) esiste e vale 0. Analogamente si dimostra che f y (0, 0) = 0. In particolare il piano di equazione (1) passante per l’origine è z = 0: la Figura VI.3 mostra bene che tale piano è ben lontano dall’essere tangente al grafico di f . Per le funzioni di una sola variabile, l’esistenza della derivata implica sia la continuità che l’esistenza della retta tangente al grafico, nel senso del limite delle rette secanti. Alla luce degli esempi appena dati, comprendiamo che la derivabilità parziale non è la naturale estensione alle funzioni di più variabili della nozione di derivabilità in una variabile sola e non permette di definire un piano tangente. Come vedremo nel § 3 questo problema può essere superato introducendo la più forte condizione di differenziabilità.
F VI.3: il piano che contiene le rette T1 e T2 passante per l’origine è z = 0, ma la funzione assume tutti i valori compresi tra − 12 e 12 in punti arbitrariamente vicino all’origine: questo piano non assomiglia affatto al grafico della funzione.
§ 2. Derivate direzionali Supponiamo di voler calcolare la velocità di crescita della funzione f (x, y) nel punto (x0 , y0 ) quando ci si muova nella direzione del vettore unitario v = (a, b). I punti di coordinate (x0 + ha, y0 + hb) descrivono, al variare di h in R, la retta nel piano xy passante per (x0 , y0 ) e parallela a v. (VI.8) Definizione. La derivata direzionale di f in (x0 , y0 ) nella direzione individuata dal versore v = (a, b) si indica con Dv f (x0 , y0 ) e vale Dv f (x0 , y0 ) = lim h→0
se il limite esiste.
f (x0 + ha, y0 + hb) − f (x0 , y0 ) h
Una
direzione nel piano è determinata da un vettore non nullo v = (a, b). Possiamo normalizzare v in modo che a2 +b2 = 1, (ricordiamo che i vettori di norma unitaria si chiamano versori). Si può individuare il versore attraverso l’angolo ϑ che forma con l’asse x: v = (cos ϑ, sin ϑ).
In particolare le derivate parziali si ottengono da questa definizione scegliendo v = i = (1, 0) per fx e v = j = (0, 1) per fy .
280
Calcolo differenziale per funzioni di più variabili
F VI.4: il grafico della funzione z = f (x, y) rappresenta una superficie S in R3 , e il punto P di coordinate (x0 , y0 , z0 ), con z0 = f (x0 , y0 ) si trova su S. Fissato v, consideriamo il piano verticale che passa per P nella direzione di v: la sua intersezione con S è una curva C, grafico della funzione di una variabile z = 1(h) = f (x0 + ah, y0 + bh), visualizzato in un piano verticale. La curva C passa per il punto P e la sua retta tangente in P ha coefficiente angolare pari a 1′ (0), ovvero Dv f (x0 , y0 ).
In altre parole, si considera la funzione di una variabile ottenuta componendo f con la retta parametrizzata P(h) = (x0 + ha, y0 + hb): 1(h) = f (x0 + ha, y0 + hb).
La derivata direzionale di
f (x, y, z) in P0 = (x0 , y0 , z0 ) nella direzione del versore v = (a, b, c) è
f (x0 + ha, y0 + hb, z0 + hc) − f (x0 , y0 , z0 ) , h se il limite esiste. In notazione vettoriale si ottiene una scrittura più compatta, adatta sia al caso n = 2 che al caso n = 3: f (P0 + hv) − f (P0 ) Dv f (P0 ) = lim , h h→0 dove P0 = (x0 , y0 , z0 ) per n = 3, mentre P0 = (x0 , y0 ) se n = 2. lim
Se 1 è derivabile in h = 0, si ottiene subito Dv f (x0 , y0 ) = 1′ (0). Il significato geometrico di Dv f (x0 , y0 ) è rappresentato in Figura VI.4. (VI.9) Esempio. Calcoliamo la derivata della funzione f (x, y) = sin x + xexy nell’origine, lungo la direzione formante √un angolo ϑ = π/6 con l’asse x. Abbiamo v = (cos(π/6), sin(π/6)) = 3/2, 1/2 . La retta paral√ lela a v passante per (0, 0) è descritta dai punti (h 3/2, h/2), con h ∈ R. Abbiamo √ ! √ # " √ ! # " √ 3h h 1 3h 3 h2 √3/4 1 lim = 3, , he f − f (0, 0) = lim sin + h→0 h 2 2 2 2 h→0 h √ da cui Dv f (0, 0) = 3.
h→0
§ 3. Differenziabilità e approssimazioni lineari. Per una funzione f della sola variabile x la derivabilità nel punto x0 può venire espressa, oltre che dalla convergenza del rapporto incrementale, anche mediante la decomposizione in un’approssimazione lineare più un resto, infinitesimo di ordine superiore al primo: f (x) = f (x0 ) + f ′ (x0 )(x − x0 ) + R(x) ,
con lim
x→x0
R(x) = 0. x − x0 ′
Questa scrittura significa che la funzione lineare y = f (x0 ) + f (x0 )(x − x0), che condivide con la funzione data tanto il valore nel punto quanto la
Infatti
possiamo scrivere la seguente catena di equivalenze: f (x) = f (x0 ) + f ′ (x0 )(x − x0 ) + R(x)
f (x) − f (x0 ) R(x) = f ′ (x0 ) + x − x0 x − x0 f (x) − f (x0 ) = f ′ (x0 ). ⇐⇒ lim x→x0 x − x0 ⇐⇒
§ 3. Differenziabilità e approssimazioni lineari.
281
derivata f ′ (x0 ), approssima la funzione f con un errore che tende a zero più rapidamente di quanto x si avvicini a x0 . È questa la formulazione del concetto di derivabilità che meglio si presta ad essere estesa alle funzioni di più variabili e che conduce alla nozione di approssimazione lineare e di piano tangente. Proviamo a capirla sull’Esempio (VI.6), dove abbiamo calcolato, nel caso del paraboloide f (x, y) = x2 + y2 , l’equazione del piano di equazione (1) passante per P = (1, 2, 5) e contenente le rette tangenti alle tracce. Tale piano ha equazione z = 5 + 2(x − 1) + 4(y − 2) . Consideriamo quindi la funzione lineare L(x, y) = 5 + 2(x − 1) + 4(y − 2) , che condivide con la nostra funzione sia il valore nel punto che le derivate parziali. Per capire se L è o meno una buona approssimazione di f , valutiamo l’errore che commettiamo quando sostituiamo ad f (x, y) il valore L(x, y). A tale fine, è conveniente porre x = 1 + h evidenziando l’incremento h nella prima variabile e y = 2 + k dove k è l’incremento nella seconda variabile (Figura VI.5). L’errore, in funzione dell’incremento totale (h, k), è f (x, y) − L(x, y) = f (1 + h, 2 + k) − L(1 + h, 2 + k)
F VI.5
= (1 + h)2 + (2 + k)2 − [5 + 2h + 4k] = h2 + k2 .
Osserviamo che, scegliendo incrementi sempre più piccoli, cioè per (h, k) → (0, 0), non solo l’errore è infinitesimo ma tende a zero più rapidamente del modulo dell’incremento, cioè della distanza tra (x, y) e (1, 2): in altre parole l’errore R(h, k) = f (1 + h, 2 + k) − (5 + 2h + 4k) soddisfa la proprietà lim
(h,k)→(0,0)
(VI.10) Definizione. Supponiamo che la funzione f sia derivabile nel punto (x0 , y0 ). Diciamo che f è differenziabile in (x0 , y0 ) se, ponendo f (x0 + h, y0 + k) = f (x0 , y0 ) + fx (x0 , y0 )h + f y (x0 , y0 )k + R(h, k),
l’errore R(h, k) soddisfa (3)
lim
è esattamente il modulo dell’incremento al quadrato: h2 + k2 . Si dice in questo caso che R è un infinitesimo di ordine superiore all’incremento √ (h, k), ossia che è un “ o piccolo” di h2 + k2 per (h, k) → (0, 0), e si scrive √ R(h, k) = o h2 + k2 .
R(h, k) = 0. √ h 2 + k2
Abbiamo dunque decomposto la funzione nella somma di una parte lineare ed un infinitesimo di ordine superiore al modulo dell’incremento. Tale decomposizione è alla base della definizione di differenziabilità.
(2)
Infatti
(h,k)→(0,0)
R(h, k) = 0. √ h 2 + k2
Dal
punto di vista grafico, questa proprietà si traduce nel fatto che, riducendo il fattore di scala in ugual modo sui tre assi, i grafici delle funzioni f ed L diventano via via indistinguibili, come illustrato dalla Figura VI.6.
282
Calcolo differenziale per funzioni di più variabili
F VI.6: tre ingrandimenti del grafico della funzione z = x2 + y2 e del suo piano tangente z = 5 + 2(x − 1) + 4(y − 2) intorno al punto (1, 2, 5). All’aumentare del fattori di ingrandimento, poiché l’errore R tende a zero più rapidamente dell’incremento, essi diventano indistinguibili.
Per denotare la proprietà (3) utilizzeremo il simbolo di o piccolo, il cui significato è stato ricordato nel commento poco sopra, riformulando la definizione come √ (4) f (x0 + h, y0 + k) = f (x0 , y0 ) + fx (x0 , y0 )h + f y (x0 , y0 )k + o( h2 + k2 ). Tornando alle variabili x = x0 + h e y = y0 + k, l’equazione precedente diventa f (x, y) = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + f y (x0 , y0 )(y − y0 ) q +o (x − x0 )2 + (y − y0 )2 . Per le funzioni differenziabili, dunque, il piano di l’equazione z = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + f y (x0 , y0 )(y − y0 ) dista dal grafico di f per una quantità che va a zero più rapidamente di quanto ci si avvicini al punto. È quindi ragionevole attribuire al piano di equazione (1) il nome di piano tangente al grafico della funzione f . (VI.11) Definizione. Se f è differenziabile in (x0 , y0 ) allora il piano di equazione z = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + f y (x0 , y0 )(y − y0 )
È
il piano già definito nell’equazione (1) a pagina 278.
La
funzione lineare L(x, y) il cui grafico è il piano tangente si chiama linearizzazione di f in (x0 , y0 ) e l’approssimazione di f mediante tale piano viene detta approssimazione lineare di f in (x0 , y0 ).
si chiama piano tangente al grafico di f nel punto P = x0 , y0 , f (x0 , y0 ) . Il vettore N = (− fx (x0 , y0 ), − f y (x0 , y0 ), 1) risulta essere ortogonale al piano tangente. Per questa ragione N viene chiamato vettore normale al grafico di f in P.
Basta ricordare la Proposizione (III.47) a pagina 134). Ovviamente anche il vettore −N di componenti ( fx (x0 , y0 ), fy (x0 , y0 ), −1) è ortogonale al piano tangente.
§ 3. Differenziabilità e approssimazioni lineari.
283
(VI.12) Esempio. Mostriamo che la funzione f (x, y) = xy − 2x + 3y è differenziabile nell’origine. f è derivabile e risulta fx (x, y) = y − 2, f y (x, y) = x + 3 da cui fx (0, 0) = −2 e f y (0, 0) = 3. Impostiamo ora il limite nella formula (3): il resto in questo caso è R(h, k) = hk − 2h + 3k −[ 0 + (−2) h + (3) k] = hk. | {z } |{z} |{z} |{z} f (0+h,0+k)
f (0,0)
fx (0,0)
f y (0,0)
Dobbiamo quindi mostrare che lim
(h,k)→(0,0)
hk = 0, √ h 2 + k2
cosa che abbiamo già fatto nell’Esempio (V.40) a pagina 254, dunque la funzione data è differenziabile in (0, 0). L’equazione del piano tangente al grafico di f nell’origine quindi è z = −2x + 3y, con vettore normale (2, −3, 1).
La
funzione è differenziabile in ogni punto di R2 , invitiamo il Lettore a verificarlo.
I concetti di differenziabilità, piano tangente e approssimazione lineare si definiscono analogamente per funzioni di tre, o più, variabili. Per dire che una funzione è differenziabile in (x0 , y0 , z0 ) si definisce un limite analogo a quello in (3), dove la linearizzazione è L(x, y, z) = f (x0 , y0 , z0 ) + fx (x0 , y0 , z0 )(x − x0 ) + f y (x0 , y0 , z0 )(y − y0 ) + fz (x0 , y0 , z0 )(z − z0 ). Se per le funzioni di una variabile abbiamo usato indifferentemente gli aggettivi “derivabile” e “differenziabile”, avremo cura, d’ora in poi, di distinguere accuratamente i due termini, riservando al primo il significato di “derivabile parzialmente”. Il fatto notevole è che per funzioni di una variabile la differenziabilità è equivalente alla derivabilità, mentre tale equivalenza è falsa per funzioni di più variabili: la funzione dell’Esempio (VI.7) ha derivate parziali (nulle) nell’origine ma non è differenziabile come vedremo nel prossimo esempio. Addirittura, vi sono funzioni che posseggono tutte le derivate direzionali ma non sono differenziabili.
Si
veda pagina 311.
l’Esercizio
(VI.1)
a
(VI.13) Esempio. La funzione dell’Esempio (VI.7) è derivabile con derivate parziali nulle nell’origine, tuttavia non è differenziabile. Infatti il resto della formula (3) è R(h, k) = f (0 + h, 0 + k) − f (0, 0) − fx (0, 0)h − f y (0, 0)k =
h2
hk . + k2
Perché la funzione sia differenziabile dev’essere lim
(h,k)→(0,0)
hk (h2
+ k2 )3/2
= 0,
mentre il limite non esiste.
Lungo
è infinito!
la bisettrice h = k il limite
284
Calcolo differenziale per funzioni di più variabili
In generale, quindi, l’esistenza delle derivate parziali di f in (x0 , y0 ) non implica la sua differenziabilità. D’altra parte, vale un importante teorema, che stiamo per enunciare, secondo cui se le derivate parziali esistono anche in tutti i punti vicini a (x0 , y0 ), e sono delle funzioni continue allora f è differenziabile in (x0 , y0 ). Questo importante fatto giustifica l’introduzione di una notazione dedicata alle funzioni con derivate parziali continue. (VI.14) Definizione. Data f : A ⊂ R2 → R, con A aperto, supponiamo che ➔ f sia derivabile in A; ➔ fx (x, y), f y (x, y) siano continue in A. Allora diciamo che f è di classe C1 in A, e scriviamo n o C1 (A) = f : A → R : fx , f y sono continue in A .
(VI.15) Teorema. Se f ∈ C1 (A) allora f è differenziabile in ogni punto di A. (VI.16) Esempio. Applicando il risultato precedente si deduce immediatamente che la funzione f (x, y) = sin(xy2 ) è differenziabile in ogni punto del piano. Si tratta infatti di una funzione elementare (ottenuta componendo il polinomio di due variabili (x, y) → xy2 con la funzione sin), dunque in particolare è continua e derivabile. Le derivate di f hanno un aspetto simile a quello di f fx (x, y) = y2 cos(xy2 ),
f y (x, y) = 2xy cos(xy2 ),
e sono a loro volta funzioni continue. Dunque f è di classe C1 e il Teorema (VI.15) garantisce la differenziabilità di f in ogni punto di R2 .
Conseguenze della differenziabilità Abbiamo già osservato nell’Esempio (VI.7) che una funzione può essere derivabile in un punto senza essere necessariamente continua. Se invece la funzione è differenziabile in (x, y), allora è continua. (VI.17) Teorema. Se f è differenziabile in (x, y) allora f è continua in (x, y).
La dimostrazione di questo risultato è rimandata al prossimo capitolo, Teorema (VII.43).
§ 3. Differenziabilità e approssimazioni lineari.
285
La migliore approssimazione lineare
e y = y0 porta f (x0 + h, y0 ) − f (x0 , y0 ) − bh =0 h f (x0 + h, y0 ) − f (x0 , y0 ) ⇔ b = lim h→0 h ⇔ b = fx (x0 , y0 ).
lim
Abbiamo visto che se f : A ⊂ R2 → R è differenziabile in (x0 , y0 ) ∈ A allora la funzione lineare il cui grafico è il piano tangente:
h→0
z = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ),
è una “buona” approssimazione del grafico di f vicino a (x0 , y0 ). Non solo, è il piano che meglio approssima f vicino a (x0 , y0 ), nel senso seguente. Se prendiamo un generico polinomio di primo grado in x e y p1 (x, y) = a + b(x − x0 ) + c(y − y0 )
e valutiamo il limite del modulo della differenza | f (x, y) − p1 (x, y)| per (x, y) che tende a (x0 , y0 ), otterremo il valore minimo (cioè zero) soltanto quando a = f (x0 , y0 ). Ora proviamo a vedere quale scelta di (b, c) porta al valore minimo il limite del quoziente f (x, y) − f (x0 , y0 ) − b(x − x0 ) − c(y − y0 ) , lim p (x,y)→(x0 ,y0 ) (x − x0 )2 + (y − y0 )2
di nuovo il valore minimo (cioè zero) si ottiene per b = fx (x0 , y0 ) e c = f y (x0 , y0 ), come si evince dalla definizione di differenziabilità. Infatti, la scelta x = x0 + h
Analogamente la scelta x = x0 e y = y0 + k porta di conseguenza c = fy (x0 , y0 ): dunque tra tutti i polinomi di primo grado in x e y, quello che meglio approssima, relativamente al modulo dell’incremento, la funzione vicino a (x0 , y0 ) è proprio quello che ha come grafico il piano tangente. Possiamo generalizzare queste considerazioni a polinomi di grado superiore, e cercare tra tutti i polinomi di secondo grado della forma p2 (x, y) = p1 (x, y)+d(x−x0 )2 +e(y−y0 )(x−x0 )+1(y−y0 )2 con d, e, 1 ∈ R, quello che meglio approssima f vicino a (x0 , y0 ), relativamente al quadrato del modulo dell’incremento. Come vedremo nell’approfondimento a pagine 295 la migliore approssimazione con polinomi di secondo grado coinvolge le derivate seconde della funzione e porta alla formula di Taylor di secondo grado.
Dimostrazione. Basta passare al limite nella relazione (2): la linearità del limite permette di scrivere lim
(h,k)→(0,0)
f (x+h, y+k) = f (x, y)+ fx (x, y)
lim
(h,k)→(0,0)
h+ fy (x, y)
lim
(h,k)→(0,0)
k+ lim
(h,k)→(0,0)
R(h, k).
Dalla definizione di differenziabilità si ha lim(h,k)→(0,0) R(h, k) = 0, inoltre h e k tendono a 0, quindi lim
(h,k)→(0,0)
f (x + h, y + k) = f (x, y)
ovvero f è continua in (x, y).
(VI.18) Teorema. Se f è differenziabile in (x, y) allora f ammette derivate direzionali in (x, y) in ogni direzione. Inoltre, per ogni versore v = (a, b) si ha
Questo Teorema afferma, in particolare, che il piano tangente contiene tutte le rette tangenti al grafico della funzione, come si vede nella Figura VI.4 a pagina 280.
(5) Dv f (x, y) = ∇ f (x, y)·v = fx (x, y)a+ f y(x, y)b
(formula del gradiente).
Dimostrazione. Scriviamo la formula di differenziabilità (2) per h = a∆t e k = b∆t, osservando che h2 + k2 = (∆t)2 (a2 + b2 ) = (∆t)2 : f (x + a∆t, y + b∆t) = f (x, y) + fx (x, y)a∆t + f y (x, y)b∆t + o(|∆t|).
Questo
risultato può essere usato anche al contrario: considerando la funzione f dell’Esercizio (VI.1), vedremo che fx (0, 0) = fy (0, 0) = 0, mentre Dv f (0, 0) = a2 b, laddove v = (a, b). Di conseguenza f non può essere differenziabile nell’origine.
286
Calcolo differenziale per funzioni di più variabili
F VI.8: la figura è stata ottenuta sovrapponendo a una mappa di livello di f (x, y) = x2 − y2 , il grafico dei vettori gradiente calcolati in un reticolo di punti del piano: si vede bene che i gradienti puntano in salita. Lungo una linea di livello non vi è variazione della funzione; dunque il gradiente di f in un punto risulta ortogonale alla curva di livello a cui il punto appartiene. Questa affermazione verrà giustificata nell’Esempio (VI.26) a pagina 291. Nella direzione opposta al gradiente si realizza la minima pendenza possibile, cioè la massima discesa, mentre la direzione di pendenza nulla (corrispondente a nessuna variazione di quota) si realizza quando cos ϑ = 0, cioè ϑ = ±π/2 che corrisponde a muoversi in direzione ortogonale a ∇ f (x, y). Dividendo per ∆t , 0 e passando al limite per ∆t → 0 si ottiene la tesi.
La formula del gradiente (5) permette di individuare le direzioni di massima crescita e di minima crescita (o di massima discesa) di una funzione differenziabile. Infatti si ha Dv f (x, y) = ∇ f (x, y) · v = k∇ f (x, y)k cos ϑ,
Assumiamo ∇ f (x, y) , 0, altrimenti tutte le derivate direzionali sono nulle.
dove ϑ è l’angolo formato dai vettori v e ∇ f (x, y). Si ricava allora che la derivata direzionale è massima quando cos ϑ = 1, cioè ϑ = 0: questo significa che v è la direzione del gradiente stesso, ovvero il vettore di norma unitaria nella direzione del gradiente vmax =
∇ f (x, y) . k∇ f (x, y)k
Abbiamo così dimostrato la seguente proprietà: (VI.19) Proprietà. Se non è nullo, il gradiente di una funzione differenziabile in un punto indica la direzione e il verso di massima pendenza del grafico della funzione nel punto. Valutando la derivata direzionale nella direzione del gradiente si trova il valore della massima pendenza, pari a ∇ f (x, y) · vmax = k∇ f (x, y)k.
F VI.7: mappa topografica. In essa sono disegnate alcune linee di livello ed una curva di massima crescita.
§ 4. Piano tangente ad una superficie parametrica
Il differenziale primo
287
f1 (x, y) = x e f2 (x, y) = y, rispettivamente; cioè
Secondo la definizione, una funzione f è differenziabile in un punto (x, y) se differisce dalla sua linearizzazione per un infinitesimo di ordine superiore all’incremento (h, k) = (∆x, ∆y): √ f (x+h, y+k)− f (x, y) = fx (x, y)h+ f y (x, y)k+o( h2 + k2 ),
dx : (h, k) → h,
dy : (h, k) → k.
Quindi il differenziale d f di una funzione può essere scritto come d f = fx (x, y) dx + f y (x, y) dy.
per (h, k) → (0, 0). Vale a dire che, se f è differenziabile nel punto (x, y), il suo incremento ∆ f = f (x + h, y + k) − f (x, y)
si può scrivere come somma di due addendi, una parte lineare negli incrementi h e k, e un infinitesimo di ordine superiore. La parte lineare dell’incremento si chiama differenziale di f e si indica con d f : d f : (h, k) → fx (x, y)h + f y (x, y)k.
Il differenziale rappresenta quindi la variazione della quota sul piano tangente al variare del punto secondo l’incremento (h, k). In particolare i differenziali dx e dy sono definiti come i differenziali delle funzioni
(VI.20) Esempio. Cerchiamo la direzione di massima crescita di f (x, y) = xe y nel punto P = (2, 0). Dalla discussione precedente sappiamo che la direzione giusta è quella parallela al gradiente di f in P; calcoliamo fx (x, y) = e y ,
f y (x, y) = xe y
f y (2, 0) = 2 √ e il gradiente è ∇ f (2, 0) = (1, 2). Osserviamo che k∇ f (2, 0)k = 5. Il vettore di norma unitaria nella direzione del gradiente è dunque ! (1, 2) 1 2 v= √ = √ , √ . 5 5 5 =⇒
fx (2, 0) = 1,
Verifichiamo che la derivata direzionale in questa direzione ha il valore massimo possibile, pari alla norma del gradiente: dalla formula (5) si ha ! √ 2 4 1 1 Dv f (2, 0) = ∇ f (2, 0) · v = (1, 2) · √ , √ = √ + √ = 5. 5 5 5 5
F VI.9: alcune curve di livello di f ed il vettore ∇ f (2, 0).
§ 4. Piano tangente ad una superficie parametrica Ora che disponiamo del concetto di differenziabilità per le funzioni di due variabili possiamo procedere a definire correttamente il piano tangente ad una superficie parametrizzata, analogo a quello di retta tangente ad una curva parametrizzata, da cui prendiamo spunto. Ricordiamo
Abbiamo
introdotto le superfici parametriche nel Capitolo V, § 9.
288
Calcolo differenziale per funzioni di più variabili
F VI.10: le derivate parziali della parametrizzazione della superficie sono i vettori tangenti delle curve della griglia.
che uno dei punti salienti della teoria delle curve è la definizione di curva regolare; solo per tali curve, infatti, abbiamo definito la retta tangente in un punto. La ragione consiste nel fatto che, per individuare la direzione della retta tangente, non è sufficiente che la parametrizzazione r sia differenziabile: il vettore tangente corrispondente potrebbe essere nullo. Almeno nel caso delle superfici cartesiane, abbiamo già imparato a riconoscere le superfici che ammettono un piano tangente. Tentiamo di ripercorrere quei ragionamenti (si veda la discussione a pagina 278). Sia dunque Σ una superficie di parametrizzazione r : D ⊂ R2 → R3 . Come prima misura precauzionale, supponiamo che la parametrizzazione r(u, v) sia di classe C1 nei punti interni di D. Fissiamo un punto P0 = r(u0 , v0 ) della superficie; come abbiamo già osservato, se manteniamo u = u0 e facciamo variare v, l’espressione r˜(v) = r(u0 , v) = x(u0 , v) i + y(u0 , v) j + z(u0 , v) k parametrizza una curva γ1 contenuta in Σ e passante per P0 . Il vettore tangente a tale curva in P0 è dato da
Ricordiamo
che abbiamo definito la differenziabilità per funzioni di più variabili solo su domini aperti (Definizione (VI.14) a pagina 284). Se vogliamo mantenere questa semplificazione, al momento non riusciremo a definire un piano tangente negli eventuali punti della superficie corrispondenti ad r(∂D).
r˜′ (v0 ) = xv (u0 , v0 ) i + yv (u0 , v0 ) j + zv (u0 , v0 ) k = rv (u0 , v0 ). Analogamente, il vettore ru (u0 , v0 ) = xu (u0 , v0 ) i + yu (u0 , v0 ) j + zu (u0 , v0 ) k è tangente alla curva γ2 che otteniamo fissando v = v0 e facendo variare u (si veda la Figura VI.10). È chiaro che il piano tangente a Σ in P0 , qualunque definizione sensata se ne voglia dare, dovrà contenere le rette tangenti alle curve della griglia, perciò viene naturale definire come piano tangente quello generato dai vettori ru e rv . Affinché i due vettori in questione generino un piano, però, essi non soltanto non devono essere nulli, ma occorre che siano linearmente indipendenti. Delle varie condizioni equivalenti per la lineare indipendenza, la più espressiva, per la sua interpretazione geometrica, è quella di dire che il loro prodotto vettoriale deve essere non nullo (si veda il Corollario (III.32) a pagina 126). Infatti se ru e rv generano il piano tangente allora ru × rv , 0 è perpendicolare a tale piano, cioè è un vettore normale a Σ. Formalizziamo la precedente discussione nella seguente definizione.
Per la Definizione (IV.63) a pagi-
na 193, una condizione equivalente alla lineare indipendenza di ru e rv è che la matrice che ha per righe ru e rv abbia rango 2. Come vedremo nell’Esercizio 40 a pagina 386, questo implica che, localmente, è possibile esprimere u e v in funzione di due variabili tra x, y e z. Se ad esempio possiamo esplicitare u = u(x, y) e v = v(x, y), allora sostituendo in z abbiamo z = z(u(x, y), v(x, y)) = f (x, y). Quindi localmente una superficie regolare è sempre una superficie cartesiana.
§ 4. Piano tangente ad una superficie parametrica
289
(VI.21) Definizione. Una superficie Σ si dice regolare (o liscia) se ammette una parametrizzazione r tale che ➔ r è di classe C1 e ➔ kru (u, v) × rv (u, v)k , 0 per ogni (u, v). Il piano tangente a Σ in un suo generico punto r(u0 , v0 ) è quello passante per tale punto e perpendicolare a ru (u0 , v0 ) × rv (u0 , v0 ): x − x(u0 , v0 ) y − y(u0 , v0 ) · ru (u0 , v0 ) × rv (u0 , v0 ) = 0. z − z(u0 , v0 ) Il versore N(u0 , v0 ) =
ru (u0 , v0 ) × rv (u0 , v0 ) kru (u0 , v0 ) × rv (u0 , v0 )k
Quindi il piano tangente può essere scritto mediante la formula del prodotto triplo vista nella Proposizione (III.31), pagina 126. Ovviamente anche −N(u0 , v0 )
è il versore normale a Σ (indotto da r) nel punto in questione. (VI.22) Esempio. Consideriamo la superficie cartesiana grafico della funzione z = f (x, y), e supponiamo f di classe C1 . Scelta la parametrizzazione r(u, v) = u i + v j + f (u, v) k otteniamo ru (u, v) = i + fu (u, v) k,
Ricordiamo che tali condizioni per noi non hanno significato su ∂D (stiamo comunque supponendo che r sia continua su tutto D), perciò il punto (u0 , v0 ) è un punto interno di D (prenderemo in considerazione i punti di ∂D nel Capitolo X, § 5).
è un versore normale a Σ, quindi una differente parametrizzazione potrebbe indurre il versore normale opposto.
rv (u, v) = j + fv (u, v) k
e quindi un vettore normale al piano tangente è dato da k − fu (u, v) i j det 1 0 fu (u, v) = − fv (u, v) . 0 1 fv (u, v) 1 Ne segue che una superficie cartesiana è sempre regolare. Il piano tangente nel punto (x0 , y0 , f (x0 , y0 )), corrispondente ai valori dei parametri (u0 , v0 ), è quindi x − x0 − fu (u0 , v0 ) − f (u , v ) y − y · v 0 0 = 0 0 z − f (x0 , y0 ) 1 ovvero − fx (x0 , y0 )(x − x0 ) − f y (x0 , y0 )(y − y0 ) + (z − f (x0 , y0 )) = 0, in perfetto accordo con quanto visto nel § 3. Infine, il versore normale indotto dalla parametrizzazione scelta è dato da
(6)
− fx (x0 , y0 ) i − f y (x0 , y0 ) j + k N(x0 , y0 ) = q 1 + fx2 (x0 , y0 ) + f y2 (x0 , y0 ) =
− fx (x0 , y0 ) i − f y (x0 , y0 ) j + k . p 1 + k∇ f (x0 , y0 )k2
Visto che la terza componente del vettore calcolato vale 1, esso non può mai annullarsi.
290
Calcolo differenziale per funzioni di più variabili
§ 5. Funzioni composte Se f è una funzione definita in un aperto A ⊂ R2 e r : [a, b] → A una curva parametrizzata di componenti x = x(t),
y = y(t),
t ∈ [a, b],
Facciamo attenzione che r(t) ∈ A per ogni t ∈ [a, b].
è definita la funzione composta F(t) = ( f ◦ r)(t) = f (x(t), y(t)),
t ∈ [a, b].
Ci poniamo ora il problema di derivare la funzione F così ottenuta, supponendo che siano differenziabili tanto la curva quanto la funzione. Se le componenti x e y di r sono derivabili abbiamo, per t fissato e ∆t → 0, x(t + ∆t) = x(t) + x′ (t)∆t + o(∆t) ≈ x(t) + x′ (t)∆t, ′
e
′
y(t + ∆t) = y(t) + y (t)∆t + o(∆t) ≈ y(t) + y (t)∆t.
Con questa approssimazione, possiamo ragionare come nella dimostrazione del Teorema (VI.18),
Se immaginiamo che la superficie
di equazione z = f (x, y) rappresenti il profilo delle montagne di una regione, e (x(t), y(t)) descrivano la posizione (in termini di latitudine e longitudine) di un alpinista al tempo t, allora il punto (x(t), y(t), F(t)) descrive, al variare di t, il sentiero percorso dall’alpinista e F(t) rappresenta la quota raggiunta al tempo t.
f (x(t + ∆t), y(t + ∆t)) ≈ f (x(t) + x′ (t)∆t, y(t) + y′ (t)∆t), | {z } | {z } =h
=k
e utilizzando la differenziabilità di f otteniamo f (x(t + ∆t), y(t + ∆t)) − f (x(t), y(t)) ≈ √ fx (x(t), y(t))h + f y (x(t), y(t))k + o( h2 + k2 ) = fx (x(t), y(t)) · x′ (t)∆t + f y (x(t), y(t)) · y′ (t)∆t + o(∆t). Infatti o
q (x′ (t)∆t)2 + (y′ (t)∆t)2 = o(∆t).
Dividendo per ∆t e passando al limite troviamo f (x(t + ∆t), y(t + ∆t)) − f (x(t), y(t)) ∆t ′ = fx (x(t), y(t)) · x (t) + f y (x(t), y(t)) · y′ (t).
F′ (t) = lim
∆t→0
(VI.23) Esempio. Se f (x, y) = xe y e x(t) = cos t, y(t) = sin 2t la funzione composta è F(t) = cos t esin 2t ,
da cui F′ (t) = − sin t esin 2t + cos t · (2 cos 2t)esin 2t .
D’altra parte abbiamo fx (x, y) = e y e f y (x, y) = xe y . Quindi fx (x(t), y(t))x′(t) + f y(x(t), y(t))y′(t) = esin 2t (− sin t) + cos t esin 2t (2 cos t). A conferma del risultato, le due espressioni sono uguali.
Questo ragionamento può essere reso rigoroso e porta a dimostrare la formula di derivazione della funzione composta.
§ 5. Funzioni composte
291
(VI.24) Teorema. Se r : (a, b) → A è derivabile ed f : A ⊂ R2 → R è differenziabile allora la funzione composta F(t) = f (r(t)) è derivabile in (a, b) e risulta F′ (t) = fx (x(t), y(t))x′(t) + f y (x(t), y(t))y′(t) = ∇ f (r(t)) · r′ (t) per ogni t ∈ (a, b). (VI.25) Esempio (Derivazione implicita). Consideriamo una funzione f definita in un aperto A ⊂ R2 , e supponiamo che in A sia contenuto il grafico di una funzione y = y(x). Possiamo definire la funzione composta F(x) = f (x, y(x)).
La dimostrazione di questo risultato verrà esposta nel prossimo capitolo, in un contesto più generale di composizione di funzione di più variabili che comprende anche il Teorema (VI.27) (si veda il Teorema (VII.45) a pagina 353). Con notazione più espressiva, ∂ f dx ∂ f dy dF = + . dt ∂x dt ∂y dt
Rispetto alla notazione del Teore-
ma (VI.24) si tratta del caso in cui x = t e y = y(t).
Se valgono le ipotesi del Teorema (VI.24), la sua derivata è F′ (x) = fx (x, y(x)) + f y (x, y(x))y′(x) = ∇ f (x, y(x)) · (1, y′ (x)). Osserviamo che il vettore (1, y′ (x)) è tangente al grafico della funzione y = y(x) nel punto (x, y(x)). (VI.26) Esempio (Il gradiente è ortogonale alle curve di livello). Supponiamo ora che C sia l’insieme di livello k della funzione f (x, y) e che esso sia il sostegno di una curva r regolare. La funzione composta F(t) = f ◦ r(t) è allora costantemente uguale a k e la sua derivata è nulla per ogni t, e dunque
Si osservi che questa formula per-
mette di ricavare la derivata y′ (x), in funzione di y(x) non appena fy (x, y(x)) è non nullo: y′ (x) =
F′ (x) − fx (x, y(x)) . fy (x, y(x))
F′ (t) = ∇ f (r(t)) · r′ (t) = 0. In altre parole, il gradiente di f è in ogni punto perpendicolare al vettore tangente all’insieme di livello f (x, y) = k, quando questo è il sostegno di una curva regolare. Una ulteriore situazione può capitare quando x e y siano a loro volta funzioni di due variabili, diciamo r e s x = x(r, s),
(r, s) ∈ B.
y = y(r, s),
Se (x(r, s), y(r, s)) appartiene ad A, l’insieme di definizione di f , per ogni (r, s) in B, è possibile definire la funzione composta di due variabili (r, s) ∈ B.
F(r, s) = f (x(r, s), y(r, s)),
F VI.11
Il teorema seguente insegna a calcolare le derivate parziali di F note le derivate delle funzioni f (x, y), x(r, s) e y(r, s). (VI.27) Teorema. Se x(r, s), y(r, s) e f (x, y) sono differenziabili, allora la funzione composta F(r, s) = f (x(r, s), y(r, s)) è differenziabile e ∂F ∂ f ∂x ∂ f ∂y = + ∂r ∂x ∂r ∂y ∂r
e
∂F ∂ f ∂x ∂ f ∂y = + . ∂s ∂x ∂s ∂y ∂s
Le funzioni x e y sono differenziabili in B; f in A. Le derivate di x e y sono calcolate nel punto (r, s) e le derivate di f si intendono calcolate in (x(r, s), y(r, s)).
292
Calcolo differenziale per funzioni di più variabili
Queste formule di derivazione sono note come regola della catena e si ricordano facilmente usando il diagramma ad albero in Figura VI.12. Da z (si intende z = f (x, y)) partono due rami, uno in corrispondenza della variabile x e uno in corrispondenza di y. Da x partono due rami, corrispondenti a s e t, e allo stesso modo due rami partono da y. Il significato di un ramo è quello di indicare la derivazione del nodo superiore rispetto alla variabile inferiore: per calcolare ad esempio la derivata della funzione composta rispetto a r, si seguono tutti i cammini che partono da z e arrivano a r, si eseguono le derivate parziali indicate su ogni ramo, si moltiplicano tra loro e il risultato si somma a quello ottenuto lungo ogni altro cammino.
Chain
rule: facili da generalizzare nel caso di composizioni con funzioni di più variabili, grazie a diagrammi ad albero come quello in Figura VI.12.
F VI.12
(VI.28) Esempio. Le formule di derivazione appena viste sono molto utili nel caso di cambiamento di variabili. Sappiamo ad esempio che le espressioni x = r cos ϑ,
y = r sin ϑ
determinano il passaggio dalle coordinate cartesiane x, y alle coordinate polari r, ϑ. Se z = f (x, y) = f (r cos ϑ, r sin ϑ), si ha ∂f ∂z ∂ f = cos ϑ + sin ϑ ∂r ∂x ∂y
∂f ∂f ∂z = − r sin ϑ + r cos ϑ ∂ϑ ∂x ∂y
§ 6. Derivate successive. Il Teorema di Schwarz Se f (x, y) è una funzione derivabile in un aperto A ⊂ R2 , le sue derivate parziali fx (x, y) e f y (x, y) sono funzioni di due variabili e possono essere a loro volta derivabili. Ad esempio, se fx (x, y) è derivabile, è possibile calcolarne le derivate parziali rispetto ad x e ad y, che verranno indicate rispettivamente con i simboli equivalenti fxx (x, y), fxy (x, y),
∂2 f (x, y), ∂x2 ∂2 f (x, y), ∂y∂x
∂ ∂f (x, y) ∂x ∂x ∂ ∂f (x, y). ∂y ∂x
Tali derivate sono dette derivate parziali seconde di f rispetto alle variabili corrispondenti. Le 4 derivate seconde di f vengono disposte, per motivi che esporremo fra poco, sotto forma di matrice 2 × 2 nel modo seguente fxx (x, y) fxy (x, y) H f (x, y) = f yx (x, y) f yy (x, y) Questa matrice è detta matrice hessiana di f in (x, y).
Analogamente
se fy (x, y) è derivabile possiamo calcolare le derivate seconde ∂2 f ∂ ∂f (x, y), (x, y) fyx (x, y), ∂x∂y ∂x ∂y fyy (x, y),
∂2 f ∂ ∂f (x, y). (x, y), ∂y ∂y ∂y2
Ad esempio per calcolare le derivate seconde di f (x, y) = ex sin y abbiamo bisogno delle sue derivate parziali fx (x, y) = ex sin y e fy (x, y) = ex cos y. Otteniamo quindi ∂ x (e sin y) = ex sin y, ∂x ∂ x (e sin y) = ex cos y, fxy (x, y) = ∂y fxx (x, y) =
∂ x (e cos y) = ex cos y, ∂x ∂ x (e cos y) = −ex sin y. fyy (x, y) = ∂y fyx (x, y) =
§ 6. Derivate successive. Il Teorema di Schwarz
Equazioni differenziali alle derivate parziali. Le equazioni differenziali a derivate parziali servono a descrivere numerosissime leggi fisiche, dalle equazioni del campo elettromagnetico alle equazioni della termodinamica a quelle dell’idrodinamica. Per esempio l’equazione delle onde unidimensionali utt = c2 uxx descrive il moto di un’onda elettromagnetica, di un’onda sonora, o di un’onda viaggiante in una corda vibrante (u = u(x, t) dipende dal tempo t e dalla posizione x). Di tale equazione possiamo calcolare in modo abbastanza semplice le soluzioni definite su R2 , utilizzando il metodo di d’Alembert, esposto nell’Esercizio 24 . Svolgendo l’Esercizio scopriamo che c ha un significato fisico ben preciso: è la velocità con cui si propagano le onde. Un’altra celebre equazione è la seguente: uxx + u yy + uzz = 0, con u = u(x, y, z), soddisfatta dal potenziale del campo elettrico in una regione priva di cariche (si veda il riquadro di approfondimento a pagina 549). Tale equazione è detta equazione di Laplace e le sue soluzioni, che prendono il nome di funzioni armoniche, entrano in gioco anche nei problemi della propagazione del calore e delle onde. Esse rivestono una importanza tale da aver dato il nome all’operatore di Laplace, o
293
laplaciano, che associa ad una funzione la somma delle sue derivate parziali seconde rispetto alle diverse variabili: ∆u = uxx + u yy + uzz . Fra le soluzioni troviamo alcune fra le funzioni di Bessel, già incontrate nel Capitolo II. L’equazione del calore, o della diffusione, ut = κ∆u, dove u = u(x, y, z, t), si può studiare utilizzando il metodo della separazione delle variabili (che, nonostante il nome, non è parente stretto di quello visto per le equazioni ordinarie nel Capitolo I). Imponiamo che u(x, y, z, t) = ϕ(t)v(x, y, z) risolva l’equazione: e dividiamo l’equazione per u. Otteniamo ϕ′ ∆v =κ = −λ ∈ R. ϕ v Questa decomposizione è di grande utilità se siamo in grado di risolvere l’equazione agli autovalori −∆v = λv. Infatti −∆v = λv ⇔ u = e−λt v(x, y, z).
Nella risoluzione dell’equazione agli autovalori, ancora una volta, giocano un ruolo fondamentale le funzioni di Bessel, come si vede nell’Esercizio 30 . Analoghi artifici sono di utilità nel trattare l’equazione delle onde piane e quella delle onde tridimensionali: utt = c2 (uxx + u yy + uzz ) .
(VI.29) Definizione. Se esistono le quattro derivate seconde di f nel punto (x, y) si dice che f è derivabile due volte in (x, y). Se tali derivate esistono in ogni punto di un aperto A ⊂ R2 , si dice che f è derivabile due volte in A. Se tutte le derivate parziali seconde sono funzioni continue in A diremo che f è di classe C2 e useremo la notazione f ∈ C2 (A). (VI.30) Esempio. Se f (x, y, z) = cos(xy2 − 3z) possiamo calcolare fzx derivando f prima rispetto a z e poi rispetto a x ∂ (3 sin(xy2 −3z)) = 3y2 cos(xy2 −3z). fz = − sin(xy2 − 3z) ·(−3), fzx = ∂x Calcoliamo per curiosità anche fxz : fxz =
∂ ∂ fx = (−y2 sin(xy2 − 3z)) = 3y2 cos(xy2 − 3z). ∂z ∂z
Ovviamente si deve presupporre la derivabilità parziale di f in tutto un disco aperto intorno a (x, y).
Si osservi che,
poiché f ha 3 variabili, in totale si hanno 9 possibili derivate seconde: fxx , fxy , fxz , fyx , fyy , fyz , fzx , fzy , fzz . Il Lettore può facilmente dimostrare che le derivate k-esime di una funzione di n variabili sono nk .
294
Calcolo differenziale per funzioni di più variabili
Osserviamo che, negli esempi precedenti, le derivate seconde miste, cioè effettuate rispetto a due variabili diverse, non dipendono dall’ordine in cui si eseguono le derivazioni. Questo è un fatto generale ammesso che tali derivate miste di f siano continue, come recita il seguente Teorema di Schwarz. (VI.31) Teorema di Schwarz. Se f ∈ C2 (A) allora si ha fxy (x, y) = f yx (x, y)
∀(x, y) ∈ A
e quindi la matrice hessiana è simmetrica: tH f (x, y) = H f (x, y).
Se le derivate miste non sono con-
tinue questo fatto non è sempre vero, si veda ad esempio l’Esercizio 17 a pagina 327.
La dimostrazione è rimandata al prossimo capitolo, a pagina 359. Il Teorema di Schwarz vale anche per funzioni di tre o più variabili; garantisce l’uguaglianza delle 6 derivate miste a due a due, cioè fxy = fyx , fxz = fzx e fyz = fzy .
Analogamente si possono definire anche le derivate di ordine più alto: se f è derivabile due volte e le funzioni fxx , fxy , f yx e f yy sono a loro volta derivabili, si ottengono 8 derivate terze: fxxx , fxxy , fxyx , fxyy , f yxx , f yxy , f yyx , f yyy . Se queste funzioni sono derivabili si ottengono 16 derivate quarte e così via. Fortunatamente, applicando iterativamente il Teorema di Schwarz si scopre che, quando sono continue, le derivate diverse tra loro sono in numero inferiore (si veda l’Esercizio 15 a pagina 327): il teorema garantisce infatti che l’ordine in cui si effettua le derivazione non conta. In generale possiamo enunciare il seguente risultato, la cui semplice dimostrazione è lasciata all’Esercizio 14 .
Se f è derivabile 3 volte con derivate terze continue, avremo così che
fxxy = fxyx = fyxx , dove si deriva 2 volte rispetto a x e una rispetto a y; analogamente derivando 2 volte rispetto a y e una sola volta rispetto a x si avrà la stessa funzione fxyy = fyxy = fyyx .
(VI.32) Corollario. Se f e di classe Ck allora l’ordine di derivazione non conta nelle derivate parziali di ogni ordine fino a k.
Ovvero
se f è derivabile k volte con derivate tutte continue fino all’ordine k.
§ 7. Valori di massimo e di minimo L’ottimizzazione, cioè la ricerca del valore massimo (o minimo) di una funzione di più variabili, è un problema centrale delle applicazioni del calcolo differenziale in diversi ambiti: dai campi più teorici, la geometria e la fisica, a quelli più strettamente applicativi come l’economia, la finanza, i sistemi industriali, e così via. (VI.33) Esempio. Consideriamo il problema di determinare il punto del piano z = x + y − 1 che ha minima distanza dal punto Q = (2, 1, −1). Come abbiamo imparato nel Capitolo III, tale distanza minima è quella di Q dal piano e, in base alla formula (38) a pagina 138, vale distanza(Q, p) =
|axQ + byQ + czQ − d| √ = 3; √ a2 + b2 + c2
inoltre il minimo è realizzato dal punto P0 = (1, 0, 0), per cui il vettore #» PQ è ortogonale al piano. Vogliamo ora capire quali sono le conseguenze [In dubio abstine]
Nel
Capitolo III abbiamo visto che, dati un punto dello spazio Q = (x, y, z) ed un piano p di equazione ax + by + cz = d, la proiezione del punto Q sul piano p rende minima, fra tutti i punti del piano, la distanza da Q.
§ 7. Valori di massimo e di minimo
295
Formula di Taylor 2
Per una funzione f di classe C in un aperto A e (x0 , y0 ) ∈ A vale la formula di Taylor di ordine 2 con resto di Peano f (x0 + h, y0 + k) = f (x0 , y0 ) + fx (x0 , y0 )h + fy (x0 , y0 )k i 1h + fxx (x0 , y0 )h2 + 2 fxy (x0 , y0 )hk + f yy (x0 , y0 )k2 2 + o(h2 + k2 ). La dimostrazione di questo risultato verrà svolta nell’Esercizio 20 a pagina 327. Segue immediatamente da questa formula la risposta alla domanda formulata nel riquadro a pagina 285: il polinomio di ordine 2 che meglio approssima f vicino a (x0 , y0 ) è p2 (x, y) = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) 1h + fxx (x0 , y0 )(x − x0 )2 + 2 fxy (x0 , y0 )(x − x0 )(y − y0 ) 2 i + fyy (x0 , y0 )(y − y0 )2 , nel senso che p2 è l’unico polinomio di grado due per cui la differenza f (x, y) − p2 (x, y) tende a zero più rapidamente della distanza tra (x, y) e (x0 , y0 ) al quadrato.
Esso prende il nome di polinomio di Taylor di ordine 2 di f centrato in (x0 , y0 ). È possibile scrivere la formula di Taylor col resto di Peano in modo più compatto ed elegante utilizzando le notazioni vettoriali e la matrice hessiana di f . Se x = (x0 , y0 ) e h = (h, k) (o anche x = (x0 , y0 , z0 ) e h = (h, k, l)) la formula di Taylor diviene 1 f (x + h) = f (x) + ∇ f (x) · h + H f (x)h · h + o(khk2 ). 2 La notazione vettoriale verrà usata in modo sistematico nel prossimo capitolo, per funzioni di un qualunque numero di variabili. Se f è una funzione differenziabile due volte in (x, y), si chiama differenziale secondo di f in (x0 , y0 ) la forma bilineare d2 f : (h, k) 7→ fxx (x0 , y0 )h2 +2 fxy (x0 , y0 )hk+ f yy (x0 , y0 )k2
ovvero
d2 f h = H f (x0 , y0 )h · h,
h = (h, k).
Si tratta di una forma quadratica (si veda il Capitolo IV a pagina 197) in h e k che ha per coefficienti le derivate seconde di f nel punto (x0 , y0 ).
della proprietà di minimalità di tale punto in relazione alle derivate della funzione che viene minimizzata. Se P = (x, y, z) e Q = (2, 1, −1), allora q distanza(P, Q) = (x − 2)2 + (y − 1)2 + (z + 1)2 . Vogliamo minimizzare tale distanza al variare di P nel piano assegnato. Ciò significa che P avrà coordinate (x, y, x + y − 1), con (x, y) ∈ R2 . Osserviamo che, per trovare la distanza minima, possiamo cercare il minimo della distanza al quadrato, cioè cercare il punto di minimo della funzione di due variabili:
In
questo esempio sappiamo già che il minimo esiste ed è unico. Di fronte ad un problema di minimizzazione è bene porsi la domanda se il minimo abbia ragione di esistere: com’è noto non tutte le funzioni ne posseggono uno.
Infatti l’elevamento al quadrato è una operazione monotona crescente.
f (x, y) = (x − 2)2 + (y − 1)2 + (x + y)2 , al variare di (x, y) in tutto il piano xy. Supponiamo che il minimo sia raggiunto nel punto (x0 , y0 ): possiamo asserire che x0 è punto di minimo anche per la traccia 11 (x) = f (x, y0 ), la cui derivata dovrà perciò annullarsi in x0 , in base al Teorema di Fermat. Analogamente, la derivata (rispetto ad y) della traccia 12 (y) = f (x0 , y) dovrà annullarsi in y0 . Otteniamo dunque non più una, come nel caso delle funzioni di una variabile, ma due condizioni di estremalità: fx (x0 , y0 ) = 2(x0 −2)+2(x0 + y0 ) = 0,
Osserviamo
che le tracce sono funzioni derivabili.
f y (x0 , y0 ) = 2(y0 −1)+2(x0 + y0 ) = 0.
Poiché l’unica soluzione è (x0 , y0 ) = (1, 0), possiamo dire con certezza che il minimo è assunto nel punto (1, 0). Possiamo quindi concludere che
Tale soluzione si trova (ad esem-
pio) ricavando y0 = 2 − 2x0 dalla prima equazione e sostituendo nella seconda.
296
Calcolo differenziale per funzioni di più variabili
F VI.13: estremi locali e globali di una funzione di due variabili.
il valore minimo di f è f (1, √ 0) = 3. Abbiamo riottenuto quindi che la distanza tra Q e il piano è 3, realizzata dal punto (1, 0, 0): tuttavia, il metodo seguito ha una grande generalità e può essere utilizzato per trovare i massimi e minimi per una vasta classe di problemi. Osserviamo che, tolti gli aspetti notazionali, le nozioni di massimo e minimo (locale e assoluto) di una funzione non risentono del numero di variabili. (VI.34) Definizione. P0 = (x0 , y0 ) ∈ D è un punto di massimo locale per f se il suo valore f (P0 ) è massimo fra tutti quelli assunti in un disco aperto centrato in P0 . P0 è invece un punto di minimo locale per f se il suo valore f (P0 ) è minimo fra tutti quelli assunti in un disco aperto centrato in P0 . Il corrispondente valore f (P0 ) è detto rispettivamente massimo o minimo (locale).
Ovvero se esiste un raggio δ > 0 per cui f (x0 , y0 ) ≥ f (x, y) per ogni (x, y) ∈ D ∩ Bδ (x0 , y0 ) . Se invece vale f (x0 , y0 ) ≤ f (x, y) per ogni (x, y) ∈ D ∩ Bδ (x0 , y0 ) il punto è un minimo locale.
I punti di massimo e minimo locale si dicono punti di estremo locale, o estremali, e analogamente le loro immagini si dicono valori estremi. Il termine locale (a volte sostituito da relativo) è contrapposto a globale (o assoluto), che si riferisce ad estremi che sono tali su tutto il dominio. Gli estremi, locali o globali, sono stretti nel caso in cui valgano le disuguaglianze strette (ovviamente per (x, y) , (x0 , y0 )). Come abbiamo visto nell’Esempio (VI.33), le condizioni di estremalità per le funzioni di due variabili consistono nell’annullarsi delle due derivate parziali. Questo risultato estende al caso multidimensionale il noto Teorema di Fermat per le funzioni di una variabile. (VI.35) Teorema. Sia f : A ⊂ R2 con A aperto. Se (x0 , y0 ) ∈ A è di massimo o di minimo locale per f e se f è derivabile in (x0 , y0 ), allora fx (x0 , y0 ) = f y (x0 , y0 ) = 0,
ossia ∇ f (x0 , y0 ) = (0, 0).
Dimostrazione. Sia 11 (x) = f (x, y0 ). Poiché (x0 , y0 ) ∈ A e A è aperto esiste un disco centrato in (x0 , y0 ) e di raggio δ > 0 completamente contenuto in D: la funzione 11 risulta così definita nell’intervallo (x0 − δ, x0 + δ) ed è derivabile in x0 . Poiché f ha un punto di massimo in (x0 , y0 ) anche 11 ha un massimo in x0 , dunque in base al Teorema di Fermat 1′1 (x0 ) = 0. Ma, per definizione, 1′1 (x0 ) = fx (x0 , y0 ) e dunque fx (x0 , y0 ) = 0. Analogamente, definendo 12 (y) = f (x0 , y), si mostra che 1′2 (y0 ) = fy (x0 , y0 ) = 0.
Analogamente, nelle stesse condizioni, la condizione di estremalità per le funzioni di tre o più variabili consiste nell’annullarsi del gradiente nel punto di massimo o minimo.
§ 7. Valori di massimo e di minimo
(VI.36) Definizione. Un punto in cui entrambe le derivate parziali di f si annullano si dice punto critico (o punto stazionario) di f . (VI.37) Esempio. La funzione f (x, y) = 2x2 − 2xy + y2 ha l’origine come unico punto critico. Difatti ∇ f (x, y) = (4x−2y, −2x+2y) e l’unica soluzione del sistema ( 4x − 2y = 0 −2x + 2y = 0 è (0, 0). Per capire se è un massimo o un minimo, osserviamo che la funzione si può decomporre nella somma di due quadrati: f (x, y) = x2 + (x + y)2 . Perciò f (x, y) > f (0, 0) = 0 per ogni (x, y) , (0, 0) e l’origine è un punto di minimo globale stretto. La funzione f (x, y) = x2 − y2 ha anch’essa l’origine come unico punto critico, come si vede immediatamente dal calcolo del gradiente ∇ f (x, y) = (2x, −2y). Tuttavia, non è né massimo né minimo locale: infatti f (0, 0) = 0 e vi sono punti a quota positiva (per esempio (x, 0)) e negativa ((0, y)) arbitrariamente vicini all’origine. (VI.38) Esempio. Estendiamo ora le considerazioni svolte nell’Esempio precedente al caso generale di una forma quadratica, cioè un polinomio omogeneo di grado due nelle variabili x e y: q(x, y) = ax2 + bxy + cy2 . Osserviamo che, se D = 4ac − b2 , 0, q ha la sola origine come punto critico. Dimostriamo che
297
Per la definizione data, i punti critici sono punti in cui la funzione è derivabile. Nel caso in cui sia anche differenziabile (come nella gran parte dei casi che studieremo) in tali punti il piano tangente è orizzontale. Osserviamo inoltre che gli estremi di una funzione possono trovarsi in punti in cui la funzione non è derivabile: tali punti vanno analizzati separatamente; a tal proposito rimandiamo all’Esercizio (VI.11), svolto alla fine del capitolo.
Il sistema
2ax + by bx + 2cy
=0 =0
ha la sola soluzione nulla se e solo se " # 2a b det =D,0 b 2c (Teorema (III.23) a pagina 115).
① se D > 0 e a > 0 allora (0, 0) è un punto di minimo stretto;
Per esempio q(x, y) = x2 + y2 .
② se D > 0 e a < 0 allora (0, 0) è un punto di massimo stretto;
Per esempio q(x, y) = −x2 − y2 .
③ se D < 0 allora (0, 0) non è di massimo né di minimo.
Per esempio q(x, y) = x2 − y2 .
Osserviamo preliminarmente che, se 4ac − b2 > 0, il trinomio q(x, y) = ax2 + bxy + cy2 si annulla mai, a meno che (x, y) = (0, 0). Avremo quindi q(x, y) > 0 se a > 0 e (x, y) , (0, 0) e l’origine è un punto di minimo assoluto stretto, mentre avremo q(x, y) < 0 se a < 0 e (x, y) , (0, 0) e l’origine è un punto di massimo assoluto stretto. Se invece 4ac − b2 < 0 il trinomio cambia segno: esistono pertanto due valori distinti (x− , y− ) e (x+ , y+ ) per cui q(x− , y− ) < 0 < q(x+ , y+ ). Avremo dunque, per ogni t > 0,
Si tratta in effetti di un caso par-
ticolare del Criterio di Sylvester, a pagina 203.
q(tx− , ty−) = t2 q(x− , y− ) < 0 = q(0, 0) < t2 q(x+ , y+ ) = q(tx+ , ty+ ) , e dunque, in ogni disco aperto centrato nell’origine si trovano, per t abbastanza piccolo, sia punti a quota positiva cha punti a quota negativa. L’origine non è né minimo né massimo relativo. (VI.39) Definizione. Un punto critico che non è di massimo né di minimo è detto punto di sella.
F VI.14: il grafico della funzione f (x, y) = x2 − y2 ha la forma di una sella vicino all’origine.
298
Calcolo differenziale per funzioni di più variabili
Il grafico della funzione vicino ad un punto di sella può differire assai da quello raffigurato in Figura VI.14 come mostrato nella Figura VI.15): il fatto caratteristico è che, diversamente dai punti di estremo, il grafico di f attraversa, se esiste, il piano tangente in (x0 , y0 ), analogamente ai punti di flesso per le funzioni in una sola variabile.
Classificazione dei punti critici: il test dell’hessiana Dato un punto critico, ci poniamo il problema di stabilirne la natura locale, cioè se sia un massimo, un minimo, oppure un punto di sella. Sappiamo che, per le funzioni di una variabile, è il segno della derivata seconda a determinare la natura locale del punto critico: se essa è positiva siamo in presenza di un minimo locale mentre se è negativa si tratta di un massimo locale. Ci aspettiamo che valga un criterio analogo anche per le funzioni di due variabili. Per cercare di risalire alla natura del punto critico, a partire dalla conoscenza delle derivate parziali prime (che sappiamo essere nulle) e di quelle seconde nel punto critico, prendiamo ispirazione dall’Esempio (VI.38). In quel caso abbiamo studiato il segno del determinante della matrice " # 2a b det = 4ac − b2 b 2c
F VI.15: i punti (0, y, 0) sono dei punti di sella per la funzione f (x, y) = x3 .
Nel caso di funzioni di due variabili di classe C2 , di derivate seconde non ce n’è più una sola, bensì tre e questo permette ben otto diverse combinazioni possibili dei segni, mentre vi sono solo tre tipi di punti critici, massimo, minimo e punto di sella.
e quello del coefficiente a. Teniamo ora presente che, per la funzione f (x, y) = ax2 + bxy + cy2 valgono delle precise relazioni fra i coefficienti a, b e c e le derivate seconde della funzione: infatti si ha 2a = fxx (0, 0), b = fxy (0, 0) e 2c = f yy (0, 0). Possiamo quindi aspettarci un criterio che tenga conto del segno del determinante della matrice hessiana della funzione e del suo primo elemento. Vale infatti il seguente (VI.40) Test dell’hessiana. Sia f : A ⊂ R2 → R con A aperto, e f di classe C2 (A). Sia (x0 , y0 ) ∈ A un punto critico di f in cui il determinante della matrice hessiana è non nullo, cioè fxx (x0 , y0 ) fxy (x0 , y0 ) D(x0 , y0 ) = det , 0. f yx (x0 , y0 ) f yy (x0 , y0 ) Allora ① D(x0 , y0 ) > 0 e fxx (x0 , y0 ) > 0 =⇒ (x0 , y0 ) di minimo locale; ② D(x0 , y0 ) > 0 e fxx (x0 , y0 ) < 0 =⇒ (x0 , y0 ) di massimo locale; ③ D(x0 , y0 ) < 0 =⇒ (x0 , y0 ) è un punto di sella. ⊚ ATTENZIONE! Se D = 0 il test non fornisce informazioni: f potrebbe avere un minimo, come ad esempio f (x, y) = x4 + y4 in (0, 0), un massimo, come succede a f (x, y) = −x4 − y4 in (0, 0), o nessuno dei due come per la
La dimostrazione di questo risultato è basata sull’approssimazione al second’ordine data dalla formula di Taylor (riquadro a pagina 295) e sullo studio del segno delle forma quadratica associata alla matrice hessiana (si veda il Capitolo IV a pagina 197). Il lettore può provare a risolvere l’Esercizio 21 . Come vedremo nel prossimo capitolo (quando prenderemo in considerazione anche funzioni di 3 o più variabili), si tratta di un caso particolare del più generale Teorema (VII.62). Potrebbe accadere che D(x0 , y0 ) > 0 e fxx (x0 , y0 ) = 0?
§ 7. Valori di massimo e di minimo
299
F VI.16: da sinistra a destra sono rappresentate le funzioni y4 + x4 , −y4 − x4 , −y4 + x4 : il determinante dell’hessiana nell’origine è nullo e la natura del punto varia da funzione a funzione.
funzione f (x, y) = x4 − y4 in (0, 0): si confrontino i grafici di queste funzioni in Figura VI.16. Per stabilire la natura del punto occorre procedere a un esame diretto della funzione per studiare il segno dell’incremento vicino al punto, come vedremo nell’Esempio (VI.42). (VI.41) Esempio. Classifichiamo i punti critici della funzione f (x, y) = 2x3 − 6xy + 3y2 . Dobbiamo risolvere il sistema ( fx (x, y) = 6x2 − 6y = 0 f y (x, y) = −6x + 6y = 0 Dalla seconda equazione si ricava y = x: sostituendo questa nella prima si ha 6x2 − 6x = 0 da cui i valori x = 0 e x = 1. I punti critici sono quindi due: (0, 0) e (1, 1). Calcoliamo ora le derivate seconde di f fxx (x, y) = 12x,
fxy (x, y) = f yx (x, y) = −6,
f yy (x, y) = 6.
Per poter applicare il Test dell’hessiana nel punto (0, 0) dobbiamo controllare che risulti diverso da 0 il determinante di 0 −6 H f (0, 0) = −6 6 Essendo D(0, 0) = −36 < 0 grazie al Test concludiamo che il punto (0, 0) è una sella. Nel punto (1, 1) si ha 12 −6 H f (1, 1) = −6 6 e D(1, 1) = 36 > 0: essendo poi fxx (1, 1) > 0, il Test assicura che (1, 1) è un minimo locale.
300
Calcolo differenziale per funzioni di più variabili
Funzioni convesse Una funzione di due variabili si dice strettamente convessa se, per ogni coppia di punti distinti P1 = (x1 , y1 ), P2 = (x2 , y2 ) e ogni λ ∈ (0, 1) si ha f (λx1 + (1 − λ)x2 , λy1 + (1 − λ)y2 )
< λ f (x1 , y1 ) + (1 − λ) f (x2 , y2 ) .
Questa richiesta equivale ad imporre che la restrizione della funzione ad ogni retta sia strettamente convessa come funzione di una sola variabile. Se supponiamo che la funzione f sia di classe C2 e prendiamo la retta passante per P1 e P2 : posto h = x2 − x1 , k = x2 − x1 e xt = x1 + th yt = y1 + tk, definiamo 1(t) = f (x1 + th, y1 + tk) . La derivata seconda di 1 (si veda anche l’Esercizio 18 ) dovrà dunque essere sempre positiva:
Si tratta di una forma quadratica, cioè di un polinomio omogeneo di secondo grado del tipo q(h, k) = ah2 + bhk + ck2 , da noi già incontrate nel Capitolo IV. Come visto, una forma quadratica si dice definita positiva se q(h, k) > 0 se (h, k) , 0. Discutendo il segno del trinomio, come abbiamo già fatto nell’Esempio (VI.38), ci si convince facilmente del fatto che la forma sia definita positiva quando a > 0 e b2 − 4ac < 0. Arriviamo dunque alle condizioni: fxx (xt , yt ) > 0 fxx (xt , yt ) fyy (xt , yt ) − ( fxy (xt , yt ))2 > 0 .
Tali disuguaglianze devono essere verificate in ogni punto. Si può facilmente dimostrare che una funzione strettamente convessa su R2 ha al più un punto critico, di minimo assoluto.
1′′ (t) = t2 ( fxx (xt , yt )h2 +2 fxy (xt , yt )hk+ f yy (xt , yt )k2 > 0 .
(VI.42) Esempio. Consideriamo ora il caso della funzione f (x, y) = x3 + (x − y)2 . I punti critici si trovano risolvendo il sistema fx (x, y) = 3x2 + 2(x − y) = 0 f y (x, y) = −2(x − y) = 0. La seconda equazione è risolta per y = x; sostituendo nella prima si trova l’unica soluzione x = 0, dunque l’unico punto critico è l’origine. Abbiamo fxx (x, y) = 6x + 2, fxy (x, y) = −2, f yy (x, y) = 2, da cui il determinante della matrice hessiana D(x, y) = fxx (x, y) f yy (x, y) − ( fxy (x, y))2 = 2(6x + 2) − 4. Valutato in (0, 0) si ha D(0, 0) = 0: il Test dell’hessiana non permette di concludere nulla sulla natura del punto critico. Occorre a questo punto procedere a un esame diretto della funzione, per valutare il segno dell’incremento ∆ f (x, y) = f (x, y) − f (0, 0) vicino all’origine. Poiché si ha ∆ f (x, y) = x3 + (x − y)2 − 0
è facile escludere che la funzione abbia nell’origine un punto di massimo o di minimo: infatti, valutando l’incremento lungo la retta y = x risulta ∆ f (x, x) = x3 che ha segno positivo nei punti con ascissa positiva, mentre è negativo se x < 0. L’origine è quindi un punto di sella.
§ 8. Massimi e minimi su domini chiusi
301
§ 8. Massimi e minimi su domini chiusi I risultati principali della teoria dell’ottimizzazione che abbiamo studiano nel paragrafo precedente, il Teorema (VI.35) di Fermat in due variabili e il Test dell’hessiana, si applicano esclusivamente ai punti estremi di una funzione definita su un dominio aperto . Essi valgono anche quando il dominio non è un aperto, ma il punto in questione è comunque un punto interno al dominio, in quanto si possono applicare alla restrizione della
Si
vedano le definizioni a pagina 252.
◦
funzione all’insieme A = D dei soli punti interni al dominio. In molte applicazioni interessanti, invece, siamo condotti alla ricerca di valori estremi di una funzione definita su un insieme chiuso, come negli esempi seguenti: ➔ Quale è il punto del√disco x2 + y2 ≤ 1 che si trova a minima distanza dalla retta y = 4 − 3x? ➔ Quale è il rettangolo di area massima tra quelli che hanno perimetro assegnato p? ➔ Avendo a disposizione 12 m2 di cartone, quale è il volume massimo di una scatola rettangolare (priva di coperchio) che si può costruire? Rispetto a quella sui domini aperti, l’ottimizzazione sui domini chiusi presenta qualche difficoltà supplementare: occorre infatti una trattazione separata dei punti interni e di quelli di frontiera. Dall’altra parte vi è un indubbio vantaggio: è molto più probabile che il minimo (o massimo) esista. Il primo passo, nel processo di ottimizzazione, infatti, deve consistere nel provare che il valore estremo è assunto. A questo fine possiamo contare, per le funzioni di più variabili, su un risultato del tutto analogo a quello già visto per le funzioni continue su un intervallo chiuso e limitato. (VI.43) Teorema di Weierstrass. Ogni funzione continua su un dominio D ⊂ R2 chiuso e limitato è limitata ed assume i valori massimo e minimo, ovvero esistono (xm , ym ) ∈ D e (xM , yM ) ∈ D tali che f (xm , ym ) ≤ f (x, y) ≤ f (xM , yM ) ,
∀(x, y) ∈ D.
La dimostrazione di questo Teorema richiede l’approfondimento di una proprietà fondamentale degli spazi euclidei Rn , la completezza, e verrà rimandata al prossimo capitolo, mentre il resto di questo capitolo sarà dedicato all’esposizione di diverse metodologie finalizzate alla ricerca dei punti estremi ed alla discussione di applicazioni significative. Per determinare i valori di massimo e di minimo assoluti di una funzione continua f su un insieme chiuso e limitato D ⊂ R2 è necessario considerare separatamente l’insieme aperto composto dai punti interni ◦
a D, A = D, e la frontiera di D, ∂D. Non solo, per poter applicare il
Finora abbiamo sempre evitato di affrontare il problema dell’esistenza di punti di estremo e di punti critici.
è noto, un insieme di R2 è chiuso se contiene tutti i punti di frontiera, si veda a pagina 252. Un insieme si dice limitato se è contenuto in un disco di raggio finito.
Come
302
Calcolo differenziale per funzioni di più variabili
Teorema (VI.35) è necessario che f sia derivabile. Supponiamo quindi che (x0 , y0 ) sia un estremo locale per f . Allora se (x0 , y0 ) ∈ A e se f è derivabile in (x0 , y0 ) certamente esso è un punto critico, grazie al Teorema (VI.35). Se invece (x0 , y0 ) ∈ ∂D oppure se f non è derivabile in (x0 , y0 ), il Teorema (VI.35) non fornisce informazioni e si deve ragionare in altro modo, come vedremo nel prossimo esempio. (VI.44) Esempio. Risolviamo il problema posto all’inizio del paragrafo: 2 2 quale è il punto √ del disco x + y ≤ 1 che si trova a minima distanza dalla retta y = 4 − 3x? Ricordando la formula per la distanza punto–retta (Esercizio (III.15) a pagina 152) siamo ricondotti a trovare il minimo assoluto della funzione 1 √ f (x, y) = 3x + y − 4 2 sul dominio D = {(x, y) : x2 + y2 ≤ 1}. Osserviamo che, essendo l’argomento del modulo sempre negativo su D, si può scrivere che √ 1 f (x, y) = 4 − 3x − y . 2 Si tratta di una funzione ovunque differenziabile, priva di punti critici √ (infatti è una funzione lineare e ∇ f (x, y) = −( 3, 1)), quindi il minimo di f è da cercare sulla frontiera di D, come si poteva facilmente immaginare interpretando geometricamente il problema. Per studiare la funzione f su ∂D ci avvaliamo di una parametrizzazione della circonferenza: x = cos t,
y = sin t,
F VI.17: il punto P della circonferenza che ha la minima distanza dalla retta si trova sul√ la retta ortogonale y = 33 x passante per l’origine.
t ∈ [0, 2π].
Studiare f ristretta a D significa quindi studiare la funzione della sola variabile t definita da √ 1 4 − 3 cos t − sin t , 1(t) = f (cos t, sin t) = t ∈ [0, 2π]. 2 Abbiamo quindi un problema di ottimizzazione di una funzione di una sola variabile, derivabile ovunque, sull’intervallo [0, 2π]. Come prima cosa cerchiamo i punti interni a (0, 2π) che annullano la derivata di 1: π 1 √ 3 sin t − cos t = sin t − . 1′ (t) = 2 6 Si ha 1′ (t) = 0 in corrispondenza a t = π/6 e t = 7π/6. Per trovare il minimo assoluto di 1 su [0, 2π] dobbiamo confrontare il suo valore agli estremi dell’intervallo [0, 2π] con quello in π/6 e 7π/6. Abbiamo √ 7π π 4− 3 = 1, 1 = 3. , 1 1(0) = 1(2π) = 2 6 6 Si trova così che il minimo valore di 1 è 1(π/6) = 1. In conclusione il punto P√del disco unitario x2 + y2 ≤ √1 di minima distanza dalla retta y = 4 − 3x è il punto di coordinate ( 3/2, 1/2).
Per
mezzo di questa parametrizzazione, la restrizione di f alla frontiera ∂D è una funzione della sola variabile t.
Per
il Teorema (VI.24) di derivazione della funzione composta abbiamo 1′ (t) = ∇ f (x(t), y(t))·(− sin t, cos t).
L’annullarsi di tale derivata corrisponde alla condizione di perpendicolarità fra il gradiente ∇ f (x(t), y(t)) ed il vettore (− sin t, cos t) tangente alla circonferenza. Ne deduciamo che, nel punto di minimo, il gradiente di f è ortogonale a ∂D. È questo un fatto generale, che approfondiremo nel prossimo paragrafo.
§ 8. Massimi e minimi su domini chiusi
303
Impareremo nel prossimo paragrafo un metodo generale per cercare gli estremi di f sulla frontiera di un insieme D valido anche quando non si riesce ad eliminare da f una variabile, come nell’esempio precedente: il metodo dei moltiplicatori di Lagrange. Prima però osserviamo che a volte, nelle applicazioni, si incontra la necessità di trovare il minimo di una funzione su tutto lo spazio. In questi casi possiamo contare sulla seguente variante del Teorema di Weierstrass. (VI.45) Una funzione continua f : R2 → R e tale che lim
(x,y)→+∞
f (x, y) = +∞,
assume il suo minimo. Analogamente, se il limite è −∞ allora la funzione assume il suo massimo. Dimostrazione. Fissiamo un raggio R sufficientemente grande perché si abbia q x2 + y2 > R =⇒ f (x, y) > f (0, 0). e minimizziamo la funzione nel disco chiuso centrato nell’origine e di raggio R. Il Teorema di Weierstrass assicura l’esistenza di un punto di minimo (xm , ym ): si avrà quindi f (xm , ym ) ≤ f (x, y) per tutti i punti del disco e quindi, in particolare, nel centro dello stesso: f (xm , ym ) ≤ f (0, 0). D’altra parte, al di fuori del disco di raggio R abbiamo f (x, y) > f (0, 0) ≥ f (xm , ym ). Concludiamo che il valore minimo di f su tutto R2 è f (xm , ym ).
Con la scrittura lim
(x,y)→+∞
f (x, y) = +∞,
si intende che corrispondentemente ad un qualunque M ∈ R esiste un raggio R > 0 tale che q x2 + y2 > R =⇒ f (x, y) > M. Una notazione equivalente, più precisa (ma più tediosa) è la √ lim
f (x, y) = +∞.
x2 +y2 →+∞
Tali risultati si estendono senza difficoltà al caso di tre o più variabili. (VI.46) Esempio (Punti estremi del potenziale di una forza conservativa). Alcuni campi di forze di fondamentale importanza in Fisica, come la forza di attrazione elastica e quella gravitazionale, hanno la proprietà di essere, in ogni punto dello spazio, il gradiente di una funzione (detta potenziale della forza). Per esempio, la forza di attrazione elastica esercitata da una molla di costante k1 > 0 su di un corpo nella posizione # » P = (x, y, z) è, com’è noto, proporzionale e opposta al vettore PP1 , dove P1 = (x1 , y1 , z1 ) è la posizione di equilibrio della molla: # » F1 (x, y, z) = −k1 (x − x1 , y − y1 , z − z1 ) = −k1 PP1 . Il potenziale della forza è la funzione U1 (x, y, z) = −
k1 # » k1 (x − x1 )2 + (y − y1 )2 + (z − z1 )2 = − kPP1 k2 , 2 2
infatti abbiamo −−→ ∇U1 (x, y, z, ) = F1 (x, y, z) = −k1 PP1 . Su un corpo soggetto alla somma di due forze elastiche si avrà una forza complessiva # » # » F(x, y, z) = −k1 (x−x1, y−y1, z−z1 )−k2(x−x2, y−y2, z−z2) = −k1 PP1 −k2 PP2 ,
Si tratta della legge di Hooke, che
il Lettore fidelizzato associerà immediatamente al grazioso ritratto di una pulce.
304
Calcolo differenziale per funzioni di più variabili
corrispondente ad un potenziale k1 # » 2 k2 # » 2 kPP1 k − kPP2 k . 2 2 La funzione potenziale non ha minimi: essa tende infatti a −∞ al tendere all’infinito della norma di (x, y, z). In base alla Proposizione (VI.45), U assume il suo valore massimo in R3 : per trovarlo andiamo a determinare gli eventuali punti critici del potenziale, che corrispondono ai punti in cui la forza totale si annulla. Imponendo la condizione ∇U(x, y, z) = (0, 0, 0) troviamo, utilizzando la notazione vettoriale, −−→ −−→ 0 = ∇U(x, y, z) = −k1 PP1 − k2 PP2 . U(x, y, z) = −
C’è un unico punto con questa proprietà che si trova sul segmento congiungente P1 a P2 . Abbiamo così che il punto di equilibrio (in cui le due forze si compensano) ha la proprietà di rendere massimo, fra tutti i punti dello spazio, il potenziale U. Queste considerazioni si estendono a casi assai più complicati di reticoli di oscillatori, o a sistemi di forze anche non lineari. Abbiamo così scoperto che, per una vasta classe di potenziali, il massimo è assunto e nei punti di massimo del potenziale, la corrispondente forza conservativa è nulla. Scopriremo più avanti, nell’Esempio (VIII.76) del Capitolo VIII, che l’essere punto di massimo del potenziale ha delle ripercussioni significative sulla stabilità del punto di equilibrio.
Tale punto, P, verifica −−→ kPP2 k k1 −−→ = − k . 2 kPP1 k
§ 9. Il metodo dei moltiplicatori di Lagrange Come abbiamo visto, capita spesso di voler determinare gli estremi di una funzione f (x, y) quando il punto (x, y) verifica una condizione aggiuntiva, della forma 1(x, y) = k. Si parla allora di massimi e minimi vincolati, e l’insieme di livello 1(x, y) = k prende il nome di vincolo. Ad esempio in Figura VI.18 cerchiamo il massimo di f (x, y) = xy quando (x, y) si muove in Z = {(x, y) ∈ R2 : x2 + y2 = 1, x ≥ 0, y ≥ 0}. Disegniamo il vincolo e qualche insieme di livello di f , cioè
In
questo paragrafo supporremo sempre che f e 1 siano di classe C1 (A) con A aperto.
Ec = {(x, y) ∈ R2 : f (x, y) = c} per diversi valori di c: massimizzare f con il vincolo Z significa trovare il più grande valore di c tale che l’insieme Ec interseca Z. Come è evidente dalla Figura VI.18, quando questo avviene in un punto (x0 , y0 ), Ec e Z hanno la stessa retta tangente in (x0 , y0 ). Nel caso raffigurato, la√curva√ di livello f (x, y) = 1/2 è tangente al vincolo nel punto P = ( 2/2, 2/2). Ricordiamo che il gradiente di f in (x0 , y0 ) è ortogonale a Ec e che ∇1(x0 , y0 ) è ortogonale all’insieme 1(x, y) = k: questo significa che i vettori gradiente ∇ f (x0 , y0 ) e ∇1(x0 , y0 ) sono paralleli, cioè ∇ f (x0 , y0 ) = λ∇1(x0 , y0 )
per qualche λ ∈ R.
Questo argomento intuitivo può essere reso rigoroso e porta a dimostrare il seguente teorema.
F VI.18
Come visto nell’Esempio (VI.26).
§ 9. Il metodo dei moltiplicatori di Lagrange
(VI.47) Teorema dei moltiplicatori di Lagrange. Se (x0 , y0 ) è un punto di estremo per f nell’insieme
305
La dimostrazione pagina 311.
si
trova
a
Z = {(x, y) : 1(x, y) = k} e ∇1(x0 , y0 ) , 0, allora esiste λ0 ∈ R tale che ∇ f (x0 , y0 ) = λ0 ∇1(x0 , y0 ).
Nell’Esercizio
57 si dà un esempio in cui il metodo non è applicabile perché ∇1(x0 , y0 ) = 0.
Se scriviamo l’equazione vettoriale ∇ f = λ0 ∇1 in termini delle sue componenti e insieme l’equazione 1 = k di appartenenza al vincolo, troviamo il sistema fx (x0 , y0 ) − λ0 1x (x0 , y0 ) = 0 (7) 1 y (x0 , y0 ) − λ0 1 y (x0 , y0 ) = 0 1(x0, y0 ) = k. In altre parole, i punti di massimo (e di minimo) della funzione f (x, y) con il vincolo 1(x, y) = k, sono punti critici per la funzione di tre variabili
Infatti ∂x L = ∂x f − λ∂x 1
L(x, y, λ) = f (x, y) − λ[1(x, y) − k].
∂ y L = ∂ y f − λ∂ y 1
La variabile λ prende il nome di moltiplicatore di Lagrange, così come si chiama metodo dei moltiplicatori di Lagrange la ricerca degli estremi di f con il vincolo 1 = k attraverso la risoluzione del sistema (7).
∂λ L = −(1 − k).
Questa è una utile notazione per memorizzare il metodo dei moltiplicatori.
(VI.48) Esempio. Applichiamo il metodo dei moltiplicatori per cercare gli estremi della funzione f (x, y) = xy con il vincolo Z = {(x, y) ∈ R2 : x2 + y2 = 1}. Il vincolo è di tipo 1(x, y) = 0 con 1(x, y) = x2 + y2 − 1: osserviamo che f e 1 sono di classe C1 e che la condizione ∇1(x, y) , 0 è verificata in tutti i punti del vincolo. Infatti ∇1(x, y) = (2x, 2y) = (0, 0)
⇔
(x, y) = (0, 0) < Z.
Il sistema (7) diventa y − 2λx = 0 x − 2λy = 0 x2 + y2 = 1. Per risolverlo possiamo ricavare λ = y/(2x) dalla prima equazione e sostituire nella seconda ottenendo x2 − y2 = 0, cioè La seconda equazione si riduce a 0 = x2 − y2 = (x − y)(x + y) da cui si ricava y = x oppure y = −x. Sostituendo nell’ultima otteniamo in entrambi i casi 2x2 = 1; si ottengono così due (sotto)sistemi ognuno con due soluzioni √ √ ! √ ! √ ( 2 2 2 2 y=x ⇒ A= , ,− , B= − . 2x2 = 1 2 2 2 2
Osserviamo
che, dalle prime due equazioni, x = 0 se e solo se y = 0, e allora la terza non è soddisfatta. Quindi possiamo supporre entrambe diverse da 0, e moltiplicare o dividere a nostro piacimento.
306
Calcolo differenziale per funzioni di più variabili
Il valore del moltiplicatore di Lagrange Consideriamo il problema di massimizzare la funzione f (x, y) con il vincolo 1(x, y) = k, con k ∈ R . Supponiamo di risolvere il problema per ogni k ∈ R e chiamiamo (x(k), y(k)) il massimo. Facciamo le ipotesi che le funzioni f e 1 siano differenziabili e che il vincolo sia regolare, cioè ∇1(x, y) , 0 su Ek , di modo che, per ogni valore di k valgano le ipotesi del Teorema (VI.47). Il gradiente di f avrà dunque, rispetto a quello di 1, un moltiplicatore di Lagrange che denotiamo con λ(k). Facciamo inoltre l’ipotesi che le funzioni x(k), y(k), e λ(k) siano derivabili. Calcoliamo la derivata, rispetto a k del valore f (x(k), y(k)): d f (x(k), y(k)) = fx (x(k), y(k))x′ (k)+ f y (x(k), y(k))y′ (k) dk
(
y = −x 2x2 = 1
⇒
C=
√
√ ! 2 2 ,− , 2 2
= λ(k)[1x (x(k), y(k))x′ (k) + 1y (x(k), y(k))y′ (k)] per il parallelismo fra i gradienti di f e di 1. D’altra parte, dal fatto che 1(x(k), y(k)) = k per ogni k, ricaviamo, ancora applicando il teorema di derivazione della funzione composta 1x (x(k), y(k))x′ (k)+1y (x(k), y(k))y′ (k) = 1 per ogni k. Perciò d f (x(k), y(k)) = λ(k). dk Cioè, il valore del moltiplicatore di Lagrange nella soluzione del problema di massimo è pari al tasso di variazione del massimo valore della funzione f al variare del vincolo.
√ √ ! 2 2 , D= − . 2 2
Abbiamo trovato quattro candidati possibili: quali tra questi sono punti di massimo vincolato per f ? Per scoprirlo basta calcolare i valori di f in tali punti e selezionare quello (o quelli) che si trovano alla quota più alta. Si ha 1 , 2
1 2 √ √ √ √ dunque i punti ( 2/2, 2/2) e (− 2/2, − 2/2) rappresentano punti di massimo vincolato mentre C e D sono punti di minimo di f vincolata a x2 + y2 = 1. Si osservi la Figura VI.19: la curva di livello f (A) = f (B) =
f (C) = f (D) = −
Applicando lo stesso ragionamen-
to a q(x, y) = ax2 + bxy + cy2 (se a = c = 0 e b = 1 allora q(x, y) = f (x, y)) si perviene a 2ax + by − 2λx = 0 bx + 2cy − 2λy = 0 x2 + y2 = 1. Quindi i punti di estremo della forma quadratica q vincolata sulla circonferenza unitaria sono gli autovettori della matrice associata " # a b/2 . b/2 c
1 E1/2 = (x, y) ∈ R2 : f (x, y) = 2 costituita dall’iperbole di equazione xy = 1/2 è tangente all’insieme x2 + y2 = 1 nei punti A e B. Analogamente E−1/2 = {(x, y) ∈ R2 : f (x, y) = −1/2} è tangente al vincolo in C e D. L’esempio appena visto mette in luce il significato geometrico del metodo dei moltiplicatori di Lagrange: I valori estremi di f con il vincolo 1 = k corrispondono a curve di livello di f che sono tangenti al vincolo. (VI.49) Esempio (Riflessione della luce). Consideriamo uno specchio curvo nel piano descritto dall’equazione 1(x, y) = 0 e due punti fissati P1 = (x1 , y1 ) e P2 = (x2 , y2 ) non appartenenti ad esso. Un raggio di luce
F VI.19
Abbiamo già incontrato nel primo
volume il principio del tempo minimo di Fermat. In questo esempio mostriamo la sua naturale interpretazione geometrica attraverso il metodo dei moltiplicatori di Lagrange.
§ 10. Funzioni implicite
307
percorre il tragitto dal punto P1 al punto P2 , riflettendosi sullo specchio nel punto P0 . Scegliamo opportunamente le nostre unità di misura in modo da rendere unitaria la velocità della luce nel mezzo considerato. Il principio di Fermat può essere tradotto nel seguente modo: il tempo # » # » kP0 P1 k + kP0 P2 k in cui il raggio luminoso percorre il tragitto in questione è # » # » minore del tempo kPP1 k + kPP2 k che impiegherebbe a percorrere il tragitto passante per il generico punto P sul vincolo 1(x, y) = 0. Consideriamo la funzione: q q # » # » T(x, y) = kPP1 k+kPP2 k = (x − x1 )2 + (y − y1 )2 + (x − x2 )2 + (y − y2 )2 . Si verifica facilmente che # » # » PP1 PP2 ∇T(x, y) = p +p = # » + # » . kPP1 k kPP2 k (x − x1 )2 + (y − y1 )2 (x − x2 )2 + (y − y2 )2 (x − x1 , y − y1 )
(x − x2 , y − y2 )
Sappiamo che P0 è punto di estremo della funzione tempo con il vincolo 1(x, y) = 0 (che supponiamo verifichi l’ipotesi del Teorema (VI.47)). La condizione di parallelismo dei gradienti si scrive come # » # » P0 P2 P0 P1 # » + # » = λ0 ∇1(x0 , y0 ). kP 0 P 1 k kP 0 P 2 k # » # » # » # » Quindi i vettori normalizzati P0 P1 /kP0 P1 k e P0 P2 /kP0 P2 k sono simmetrici per riflessione rispetto al vettore ∇1(x0 , y0 ), che sappiamo essere ortogonale alla curva. Detti ϑi l’angolo tra P0 P1 e la retta tangente al vincolo in P0 e ϑr l’angolo tra P0 P2 e la stessa retta (rispettivamente l’angolo di incidenza e l’angolo di riflessione) la precedente relazione diviene sin ϑi = sin ϑr , cioè l’angolo di incidenza è uguale all’angolo di riflessione.
j § 10. Funzioni implicite In questo paragrafo ci poniamo il problema di stabilire quando l’insieme di livello di una funzione sia una curva parametrizzata regolare. Più precisamente ci domandiamo, data un’equazione del tipo (8)
1(x, y) = 0,
se il luogo dei punti che la soddisfano, o almeno una sua parte, sia un arco di curva cartesiana, cioè il grafico di una funzione y = ϕ(x). Se ciò avviene, in un dato intervallo, diremo allora che l’equazione è risolubile rispetto alla variabile y, e diremo che la funzione ϕ è definita implicitamente dall’equazione (8). È questo il caso, per esempio, che si verifica quando risolviamo l’equazione sin x + e y − 2 = 0 rispetto ad y, definendo la funzione y = ϕ(x) = ln(2 − sin x).
F VI.20
L’analoga
condizione per la legge della rifrazione si trova nell’Esercizio 51 .
308
Calcolo differenziale per funzioni di più variabili
È importante osservare che l’equazione 1(x, y) = 0 definisce sempre una relazione fra x e y , ma non sempre una funzione: infatti per qualche valore di x l’equazione 1(x, y) = 0 potrebbe non avere alcuna soluzione, oppure averne più d’una; in tal caso non è possibile associare ad ogni x uno ed un sol valore di y (possiamo prendere ad esempio l’equazione x2 + y2 = −1, oppure x2 − y2 = 0). Il Teorema di Dini ci permette di stabilire in quali circostanze l’equazione 1(x, y) = 0 definisca implicitamente una funzione vicino ad un punto assegnato (x0 , y0 ). (VI.50) Teorema di Dini. Sia 1 una funzione di classe C1 (A) (con A aperto) e sia dato un punto (x0 , y0 ) ∈ A tale che ① 1(x0 , y0 ) = 0
se e soltanto se 1(x, y) = 0.
Ovviamente è possibile scambiare il ruolo delle variabili. Precisamente, con la seconda ipotesi sostituta da ② 1x (x0 , y0 ) , 0
② 1 y (x0 , y0 ) , 0 allora esistono due intervalli centrati in x0 e y0 rispettivamente, I = (x0 − δ, x0 + δ) e J = (y0 − σ, y0 + σ),(con δ, σ > 0) e una funzione ϕ : I → J, tali che ➔ y0 = ϕ(x0 );
1
➔ ϕ è a sua volta di classe C (I, J) e la sua derivata vale 1x (x, ϕ(x)) 1 y (x, ϕ(x))
la tesi del Teorema di Dini diventa: ∃ δ, σ > 0 e una (unica) funzione x = ψ(y) definita in J = (y0 − σ, y0 + σ) a valori in I = (x0 − δ, x0 + δ) tale che ψ(y0 ) = x0 e 1(x, y) = 0 in I×J ⇔ x = ψ(y) se y ∈ J. Inoltre ψ ∈ C1 (J) e
➔ 1(x, ϕ(x)) = 0, ∀x ∈ I;
ϕ′ (x) = −
Per la quale x è in relazione con y
∀x ∈ I;
ψ′ (y) = −
1 y (ψ(y), y) 1x (ψ(y), y)
∀y ∈ J.
In questa versione il Teorema di Dini permette di esprimere x in funzione di y, e descrive le soluzioni di 1(x, y) = 0 come grafico di una funzione della variabile y.
➔ tale funzione è unica, nel senso che 1(x, y) = 0 in I × J
=⇒
y = ϕ(x).
(VI.51) Esempio. Consideriamo l’equazione xe y + yex = 0. Osserviamo che le ipotesi del Teorema di Dini sono verificate scegliendo (x0 , y0 ) = (0, 0). Posto infatti 1(x, y) = xe y + yex , 1 è certamente una funzione di classe C1 . Inoltre 1(0, 0) = 0 e 1 y (0, 0) = 1. In base al Teorema di Dini, pertanto, l’equazione data definisce implicitamente una funzione y = ϕ(x) in un intervallo contenente x = 0, ed il suo grafico contiene tutte le soluzioni dell’equazione xe y + yex = 0 nei pressi dell’origine. Della funzione implicita sappiamo inoltre che ϕ(0) = 0 e ϕ′ (0) = −1x (0, 0)/1 y(0, 0) = −1 (si veda l’Esercizio (VI.15)). (VI.52) Esempio. L’equazione x2 − y2 = 0 non definisce univocamente una funzione implicita vicino all’origine, infatti l’insieme delle soluzioni
F VI.21: Ulisse Dini (1845– 1918).
§ 10. Funzioni implicite
Dimostrazione del Teorema di Dini Per procedere nella dimostrazione è opportuno che il Lettore svolga l’Esercizio 30 , in cui è enunciato il Teorema della permanenza del segno per le funzioni di due variabili. Supponiamo che sia 1y (x0 , y0 ) > 0. La funzione 1y è continua per ipotesi e dunque, per il Teorema di permanenza del segno, si mantiene positiva per ogni punto (x, y) vicino a (x0 , y0 ): possiamo selezionare un rettangolo R0 = [x0 − δ0 , x0 + δ0 ] × [y0 − σ, y0 + σ]
tale che (x, y) ∈ R0 =⇒ 1y (x, y) > 0.Consideriamo la traccia 1(x0 , y): poiché la sua derivata è positiva, è una funzione (strettamente) crescente. Ricordando che 1(x0 , y0 ) = 0, ne segue che 1(x0 , y0 − σ) < 0 e 1(x0 , y0 + σ) > 0. Poniamo ora attenzione alle tracce x → 1(x, y0 − σ) e x → 1(x, y0 + σ): ancora per il Teorema della permanenza del segno, esiste 0 < δ ≤ δ0 tale che, chiamando I = (x0 − δ, x0 + δ) si ha x ∈ I ⇒ 1(x, y0 − σ) < 0 e 1(x, y0 + σ) > 0
In definitiva, per ogni x fissato in I la funzione y → 1(x, y)
è strettamente crescente su I e assume valori di segno opposto agli estremi dell’intervallo. Allora, grazie al Teorema degli zeri per funzioni di una variabile, per ogni x fissato in I esiste y ∈ (y0 − σ, y0 + σ) tale che 1(x, y) = 0: un tale y è unico per la monotonia della funzione, e lo indichiamo con ϕ(x). Abbiamo così mostrato che in I × J, J = (y0 − σ, y0 + σ), vale 1(x, y) = 0 se e solo se y = ϕ(x).
309
Mostriamo ora che ϕ così definita su I è derivabile. Per questo dobbiamo valutare il rapporto incrementale ϕ(x + h) − ϕ(x) h dove 0 < |h| < δ e x ∈ I sono fissati. Poniamo γ(t) = 1(x+th, ϕ(x)+t[ϕ(x+h)−ϕ(x)]),
0 = γ′ (t∗ ) = 1x (a, b)h + 1y (a, b)[ϕ(x + h) − ϕ(x)].
Quest’ultima formula permette di scrivere il rapporto incrementale di ϕ nel punto fissato x come ϕ(x + h) − ϕ(x) 1x (a, b) =− . h 1y (a, b) (ricordiamo che per ipotesi 1y (a, b) > 0). Se ora passiamo al limite per h → 0, osserviamo che, al tendere di h a zero, il segmento su cui si trova (a, b) si comprime nel punto (x, ϕ(x)); per la continuità di 1x e 1y si ha allora che 1x (a, b) → 1x (x, ϕ(x)) e 1y (a, b) → 1y (x, ϕ(x)). Pertanto il limite del rapporto incrementale esiste e 1x (x, ϕ(x)) ϕ′ (x) = − , ∀x ∈ I. 1y (x, ϕ(x)) In particolare ϕ è continua su I e dalla formula precedente si ricava anche la continuità di ϕ′ , essendo 1x (x, ϕ(x)) e 1y (x, ϕ(x)) continue (per composizione di funzioni continue).
di tale equazione è costituito dalle due rette y = x e y = −x. Effettivamente si ha 1x (0, 0) = 1 y (0, 0) = 0 e il Teorema di Dini non si può applicare. Tuttavia, tale risultato è applicabile vicino a un punto della forma (x0 , x0 ) (oppure (x0 , −x0 )), purché x0 , 0. Nei pressi di tali punti le soluzioni dell’equazione x2 − y2 = 0 formano effettivamente il grafico di una funzione della variabile x, ovvero di y = x. Occorre però rimanere in un quadrato (x0 − δ, x0 + δ) × (x0 − δ, x0 + δ) con 0 < δ < |x0 |. Questo esempio illustra la natura locale del Teorema di Dini. (VI.53) Esempio. Consideriamo ora l’equazione 1(x, y) = x4 + y4 + x2 − y2 = 0. Per cercare qualche soluzione, poniamo dapprima x = 0: 1(0, y) = y4 − y2 = y2 (y2 − 1) = 0
t ∈ [0, 1].
Per composizione γ è derivabile, ed è immediato vedere che γ(0) = γ(1) = 0. Per il Teorema di Rolle esiste t∗ ∈ (0, 1) tale che γ′ (t∗ ) = 0. Chiamando a = x + t∗ h e b = ϕ(x) + t∗ [ϕ(x + h) − ϕ(x)] si ha, dal Teorema di derivazione della funzione composta (VI.24),
Potrebbe
però capitare che 1x (x0 , y0 ) = 1 y (x0 , y0 ) = 0 (e quindi il teorema non è applicabile) ma comunque 1(x, y) = 0 definisce una funzione implicita (si pensi ad esempio alla 1(x, y) = (x − y)2 ).
310
Calcolo differenziale per funzioni di più variabili
da cui ricaviamo tre valori di y: −1, 0 e 1. Questo significa che le tre coppie (0, −1), (0, 0), (0, 1) sono soluzioni dell’equazione 1(x, y) = 0. Per applicare il Teorema di Dini, calcoliamo le derivate parziali di 1: 1x (x, y) = 4x3 + 2x,
1 y (x, y) = 4y3 − 2y.
Nel punto (0, −1) abbiamo 1x (0, −1) = 0 ma 1 y (0, −1) = −2. In base al teorema di Dini l’equazione definisce implicitamente una funzione y = ϕ(x) vicino al punto (0, −1). Della funzione implicita sappiamo inoltre che ϕ(0) = −1 e che ϕ′ (0) = 0. In altre parole l’insieme delle soluzioni di 1(x, y) = 0 vicino al punto (0, −1) è il grafico di una funzione di tipo y = ϕ(x), la cui derivata in x = 0 si annulla, come si vede dalla Figura VI.22. Osserviamo che 1x (0, 0) = 0 = 1 y (0, 0): dunque il Teorema di Dini non si può applicare. La stessa figura evidenzia che vicino a (0, 0) l’insieme delle soluzioni dell’equazione non è grafico di una funzione, né della variabile x né della variabile y.
La funzione 1 è un polinomio delle variabili x e y, dunque è certamente di classe C1 .
La stessa situazione si ha vicino al punto (0, 1).
Regolarità degli insiemi di livello e dimostrazione del Teorema dei moltiplicatori di Lagrange Il Teorema di Dini permette di stabilire se l’insieme di livello di una funzione di due variabili Ek = {(x, y) ∈ A : 1(x, y) = k} è una curva dotata di retta tangente. (VI.54) Corollario. Supponiamo 1 ∈ C1 (A) e sia P0 = (x0 , y0 ) ∈ Ek un punto tale che ∇1(x0 , y0 ) , 0. Allora, vicino a P0 l’insieme Ek è il sostegno di una curva regolare di classe C1 , parametrizzata da r : [t0 − δ, t0 + δ] → R2 , per δ > 0, il cui versore tangente in P0 è perpendicolare a ∇1(x0 , y0 ), di modo che la retta tangente abbia equazione (9)
F VI.22
1 y (x0 , y0 )(y − y0 ) + 1x (x0 , y0 )(x − x0 ) = 0
Dimostrazione. Possiamo certamente applicare il Teorema di Dini in una della sue due versioni, infatti essendo ∇1(x0 , y0 ) , 0, almeno una delle sue componenti è non nulla. Ad esempio se è la derivata parziale di 1 rispetto a y a non annullarsi in (x0 , y0 ), l’insieme Ek vicino a (x0 , y0 ) è il grafico di una funzione y = ϕ(x), con ϕ : [x0 − δ, x0 + δ] → R, di classe C1 passante per (x0 , y0 ). Inoltre, la retta tangente al grafico di ϕ in x0 ha equazione y = y0 + ϕ′ (x0 )(x − x0 ) = y0 −
1x (x0 , y0 ) (x − x0 ), 1y (x0 , y0 )
come volevamo dimostrare. Come già osservato, il vettore ∇1(x0 , y0 ) risulta ortogonale al vettore tangente alla curva di livello Ek nel punto, (x0 , y0 ).
Un punto (x0 , y0 ) dell’insieme di livello Ek in cui ∇1(x0 , y0 ) , 0 si dice punto regolare, si dice invece punto singolare se il gradiente è il vettore nullo. Dal Corollario (VI.54) segue che, vicino a ogni punto regolare di
Allo stesso risultato si arriva supponendo che 1x (x0 , y0 ) , 0. Questa facile verifica è lasciata al Lettore.
Esercizi
311
F VI.23: da sinistra a destra sono rappresentate le soluzioni delle equazioni y2 − x3 + x4 = 0, y2 − x2 − x3 = 0, (x2 + y2 )3 − (x2 − y2 )2 = 0. In tutti e tre i casi l’origine è un punto singolare dell’insieme di livello.
1, l’insieme di livello cui il punto appartiene è il sostegno di un arco di curva regolare e ha una retta tangente descritta da (9). Se invece (x0 , y0 ) è un punto singolare per 1, allora l’aspetto dell’insieme di livello contenente (x0 , y0 ) può essere molto vario, come si vede in Figura VI.23: l’origine è un punto singolare per ciascuna delle funzioni 1 considerate. Dimostrazione del Teorema (VI.47). Grazie al Corollario (VI.54), vicino a P0 l’insieme Z è il sostegno di un arco di curva regolare parametrizzata da r(t). Poiché P0 = r(t0 ) è un estremo per f vincolato a Z, il punto t0 risulta essere un estremo per la funzione composta t 7→ f (r(t)). Osservato che si tratta di una funzione derivabile in t0 e che t0 è interno al dominio della parametrizzazione, siamo certi, in base al Teorema di Fermat, che la sua derivata in t0 si annulla. Dunque, per il Teorema (VI.24) di derivazione delle funzioni composte, abbiamo ∇ f (r(t0 )) · r′ (t0 ) = 0. Poiché la curva è regolare, il suo vettore tangente r′ (t0 ) non è nullo e, sempre per il Corollario (VI.54), è perpendicolare al gradiente di ∇1(x0 , y0 ). Dunque r′ (t0 ) è ortogonale ai due gradienti ∇ f (x0 , y0 ) e ∇1(x0 , y0 ). Poiché quest’ultimo non è nullo, questo significa che esiste λ0 ∈ R tale che ∇ f (x0 , y0 ) = λ0 ∇1(x0 , y0 ).
Esercizi (VI.1) Consideriamo la funzione f che vale 0 in (0, 0) ed è definita come f (x, y) =
x2 y + y2
x2
per ogni (x, y) , (0, 0) diverso dall’origine. Stabilire se f è continua, derivabile e differenziabile nell’origine.
In
questo modo copriamo anche il caso in cui il gradiente ∇ f (x0 , y0 ) si annulla, con la scelta λ0 = 0. Il caso opposto, in cui ∇ f (x0 , y0 ) , 0 e ∇1(x0 , y0 ) = 0 non può avverarsi per la regolarità del vincolo.
312
Calcolo differenziale per funzioni di più variabili
Soluzione. La continuità in (0, 0) è già stata stabilita nell’Esercizio (V.14). La funzione risulta derivabile in (0, 0), come segue facilmente dalla definizione; si ha infatti, per h , 0 f (0 + h, 0) − f (0, 0) 0 = = 0, h h
f (0, 0 + h) − f (0, 0) 0 = = 0, h h
Riflettiamo un momento sulla definizione di differenziabilità. Dal punto di vista operativo, per stabilire se f è differenziabile in (x0 , y0 ), occorre:
➔ calcolare le derivate parziali di f in (x0 , y0 ); ➔ impostare il limite
e dunque entrambe le derivate parziali in (0, 0) esistono e sono nulle. Se ora proviamo a stimare la quantità R(h, k) troviamo R(h, k) = f (h, k) − f (0, 0) − fx (0, 0)h − f y (0, 0)k = f (h, k) =
h2 k 2 h + k2
ma il limite lim
(h,k)→(0,0)
h→0 (h2
R(h, k) h2 k = lim p 2 2 3/2 (h2 + k2 ) (h,k)→(0,0) (h + k )
h2 · mh m = , 2 2 3/2 +m h ) (1 + m2 )3/2
e poiché il valore del limite monodimensionale è diverso per ogni scelta di m, si conclude che l’intero limite non esiste. In conclusione, f non è differenziabile nell’origine, pur essendo derivabile. (VI.2) Proviamo che la funzione f (x, y) = |xy| è differenziabile in (0, 0) ma non lo è in (1, 0). Soluzione. Cominciamo calcolando le derivate parziali: data la presenza del modulo, ricorriamo alla definizione: lim h→0
f (h, 0) − f (0, 0) |h · 0| − 0 = lim =0 h h→0 h
=⇒
fx (0, 0);
e analogamente si trova che f y (0, 0) = 0. Dobbiamo ora calcolare lim
(h,k)→(0,0)
f (h, k) − f (0, 0) + fx (0, 0)h + f y (0, 0)k |hk| = lim √ √ 2 2 (h,k)→(0,0) h +k h 2 + k2
e verificare che risulta uguale a 0. Questo risultato è già stato provato nell’Esempio (V.13), e ci permette di concludere che f è differenziabile in (0, 0). Se ora passiamo al punto (1, 0) abbiamo lim h→0
R(h, k) , √ h2 + k2
dove R(h, k) = f (x0 + h, y0 + k) − f (x0 , y0 ) − fx (x0 , y0 )h − f (x0 , y0 )k;
➔ calcolare tale limite e verificare che sia 0 (tipicamente passando in coordinate polari).
non esiste. Infatti, se restringiamo il quoziente a rette passanti per l’origine di tipo k = mh troviamo lim
lim
(h,k)→(0,0)
f (1, h) − f (1, 0) |1 · h| − 0 |h| = lim = lim . h h→0 h h→0 h
Quest’ultimo limite non esiste, poiché per h → 0+ vale 1 mentre per h → 0− vale −1: si conclude che f y (1, 0) non esiste, e dunque f non può essere differenziabile in (1, 0).
Per altro,
f non è solo derivabile, ma ammette derivata direzionale in (0, 0) lungo ogni direzione v = (a, b). Infatti f (ha, hb) − f (0, 0) = · · · = a2 b, lim h h→0 da cui Dv f (0, 0) = a2 b. Quindi neppure la derivabilità lungo ogni direzione è sufficiente per assicurare la differenziabilità.
Questo
esempio mostra come la condizione di esistenza e continuità delle derivate parziali dell’enunciato del Teorema (VI.15) non sia affatto necessaria per la differenziabilità. Una funzione può essere differenziabile in un punto pur non avendo le derivate parziali continue in tutti i punti vicini.
Esercizi
313
(VI.3) Data la funzione f (x, y) = y3 sin(x2 + y2 ) + x √ √ calcolare il piano tangente al grafico di f nel punto (0,√ π, f (0, π)). Quale è la direzione di massima crescita di f in (0, π)? Per quale direzione invece la crescita è nulla? √ Soluzione. Osserviamo innanzitutto che f è differenziabile in (0, π): infatti si ottiene da una composizione di funzioni elementari derivabili e per questo è in particolare di classe C1 (R2 ). Il Teorema (VI.15) a pagina 284 garantisce allora la differenziabilità di f in ogni punto di R2 . Si ha fx (x, y) = 2xy3 cos(x2 + y2 ) + 1 e f y (x, y) = 3y2 sin(x2 + y2 ) + 2y4 cos(x2 + y2 ), √ √ √ da cui fx (0, π) = 1 e f y (0, π) = −2π2 ; inoltre f (0, π) = 0. Il piano √ tangente al grafico di f nel punto (0, π, 0), grazie alla formula (VI.11), è √ z = x − 2π2 (y − π). √ Poiché f è differenziabile in (0, π), sappiamo dalla discussione a pagina 286 che il gradiente indica la direzione e il verso di massima pendenza in un punto: (1, −2π2) vmax = √ . 1 + 4π4 La direzione in cui la derivata è nulla è ortogonale al gradiente: ci sono due versori (opposti) che indicano questa direzione, vale a dire (2π2 , 1) v0 = √ 1 + 4π4
e
(−2π2 , −1) − v0 = √ . 1 + 4π4
(VI.4) Data la funzione q 3 f (x, y) = y x(y2 − 1) studiarne la differenziabilità in (0, 1), quindi calcolarne, se esistono, le derivate direzionali in (0, 1). Soluzione. Si ha f (0, 1) = 0; inoltre sia 11 (x) = f (x, 1) che 12 (y) = f (0, y) sono costanti (valgono entrambe 0), perciò abbiamo subito che fx (0, 1) = f y (0, 1) = 0. Per studiare la differenziabilità nel punto occorre calcolare f (h, 1 + k) − f (0, 1) − fx (0, 1)h − f y (0, 1)k √ h 2 + k2 p p 3 3 (1 + k) h((1 + k)2 − 1) h(k2 + 2k) = lim . = lim √ √ (h,k)→(0,0) (h,k)→(0,0) h 2 + k2 h 2 + k2 lim
(h,k)→(0,0)
314
Calcolo differenziale per funzioni di più variabili
Passando in coordinate polari dobbiamo calcolare, per ϑ fissato, q 3 r cos ϑ(r2 sin2 ϑ + 2r sin ϑ) lim r→0 r q √3 −1/3 3 cos ϑ(r sin2 ϑ + 2 sin ϑ) = lim r−2/3 2 cos ϑ sin ϑ. = lim r r→0
r→0
Il limite precedente non è zero, se cos ϑ sin ϑ , 0: si deduce che la funzione non è differenziabile in (0, 1). Per calcolare le derivate direzionali nel punto non si può ricorrere alla Formula del gradiente di pagina 285, non essendo f differenziabile. Procediamo così: data una direzione v = (a, b) con a2 + b2 = 1, chiamiamo √3 p √3 3 1(t) = f (0 + at, 1 + bt) = (1 + bt) at((1 + bt)2 − 1) = abt2 (1 + bt) bt + 2. L’esistenza della derivata Dv f (0, 1) equivale a quella di 1′ (0): ma se a , 0 e b , 0, allora 1 non è derivabile in t = 0, dunque non esiste Dv f (0, 1). (VI.5) Sia f ∈ C1 (R2 ) e F(x) = f (x, x2 ); trovare l’equazione della retta tangente al grafico di F in x = −1 sapendo che il piano tangente al grafico di f in (−1, 1, f (−1, 1)) ha equazione z = 3x + 4y + 1. Soluzione. La derivata di F si ottiene dalla formula di derivazione delle funzioni composte vista nel Teorema (VI.24). Rinominando F come F(t) = f (x(t), y(t)), dove x(t) = t e y(t) = t2 , la formula dice che, per ogni t: F′ (t) = fx (x(t), y(t))x′(t) + f y (x(t), y(t))y′(t). Nel nostro caso x′ (t) = 1, y′ (t) = 2t per ogni t; inoltre per t = −1 risulta (x(−1), y(−1)) = (−1, 1) e dunque F′ (−1) = fx (−1, 1) + f y (−1, 1) · (−2). Per trovare il valore numerico di F′ (−1) è dunque necessario ricavare le derivate parziali di f in (−1, 1). Questa informazione si può leggere nell’equazione del piano tangente al grafico di f nel punto (−1, 1, f (−1, 1)). Infatti l’equazione del piano tangente è z − f (−1, 1) = fx (−1, 1)(x + 1) + f y (−1, 1)(y − 1) confrontando col piano dato si ricava immediatamente che fx (−1, 1) = 3, f y (−1, 1) = 4. Inoltre si legge che fx (−1, 1)− f y(−1, 1)+ f (−1, 1) = 1, ovvero che 2 = f (−1, 1) = F(−1). Abbiamo ora tutte le informazioni per ricavare il valore della derivata di F in −1: F′ (−1) = 3 · 1 + 4 · (−2) = −5. Infine, la retta tangente al grafico di F in t = −1 è y = F(−1) + F′ (−1)(x + 1) ⇒ y = 2 − 5(x + 1).
Esercizi
315
(VI.6) (Campo gradiente e conservazione dell’energia) Data f : R3 → R il campo gradiente associato ad f è ∇ f (x, y, z) = fx (x, y, z) i + f y (x, y, z) j + fz (x, y, z) k. Si consideri la legge oraria del moto r(t) di un corpo di massa m soggetto al campo di forze F = ∇ f : mr′′ (t) = ∇ f (r(t)). Le quantità mkv(t)k2/2 e − f (r(t)) prendono il nome di energia cinetica ed energia potenziale rispettivamente e variano, in generale, al variare del tempo. Dimostrare la legge della conservazione dell’energia, cioè che l’energia totale h=
m kv(t)k2 − f (r(t)) 2
Al solito, v(t) = r′ (t). ⊚ ATTENZIONE! Mettiamo
in guardia il Lettore sull’insidiosa, per quanto diffusa, terminologia: il potenziale e l’energia potenziale sono due quantità distinte, uguali in modulo ma di segno opposto.
Per
questo motivo un campo gradiente si dice anche conservativo.
è costante lungo la traiettoria. Soluzione. Infatti si ha d m d h= kv(t)k2 − f (r(t)) = mv(t) · v′ (t) − ∇ f (r(t)) · r′ (t) . dt dt 2 Ricordando che r′ = v, r′′ = v′ e mr′′ (t) = ∇ f (r(t)), otteniamo d h = mr′′ (t) − ∇ f (r(t)) · r′ (t) = 0 , dt
La funzione f viene detta potenziale di F ed è definita a meno di una costante additiva.
per ogni t.
Utilizziamo
due volte il Teorema (VI.24) di derivazione della funzione composta: la prima per la funzione 1(v) = kvk2 e la seconda per f (r). Osserviamo che ∇1(v) = 2v, come si verifica facilmente scrivendo in componenti v = (vx , vy , vz ) la funzione 1(vx , vy , vz ) = vx +2 v2y + v2z .
(VI.7) Sia F(t) = f (x(t), y(t)) con F(x, y) = 2x3 y − y2x + x + 2y. Calcolare F′′ (0) in funzione di x(t), y(t) e delle loro derivate. Soluzione. Dal Teorema (VI.24) sappiamo che F′ (t) = fx (x(t), y(t))x′(t) + f y (x(t), y(t))y′(t). Derivando questa espressione rispetto a t, come funzione della sola variabile t, troviamo la derivata seconda di F: d fx (x(t), y(t)) + fx (x(t), y(t)) · x′′ (t) dt d + y′ (t) · f y (x(t), y(t)) + f y (x(t), y(t)) · y′′ (t) dt
F′′ (t) =x′ (t) ·
d dt fx (x(t), y(t)) ci serviamo ancora una volta del Teorema (VI.24); si tratta infatti della composizione si x(t) e y(t) con la funzione fx (x, y).
Per calcolare
dove d fx (x(t), y(t)) = fxx (x(t), y(t))x′(t) + fxy (x(t), y(t))y′(t), dt d f y (x(t), y(t)) = f yx (x(t), y(t))x′(t) + f yy (x(t), y(t))y′(t). dt
316
Calcolo differenziale per funzioni di più variabili
In totale si ha F′′ (t) = fxx (x(t), y(t))[x′(t)]2 + 2 fxy (x(t), y(t))x′(t)y′ (t) + f yy (x(t), y(t))[y′(t)]2 + fx (x(t), y(t))x′′(t) + f y (x(t), y(t))y′′(t). Possiamo scrivere esplicitamente le derivate di f : fx = 6x2 y − y2 + 1, f y = 2x3 − 2xy + 2, fxx = 12xy, fxy = 6x2 − 2y, f yy = −2x. Otteniamo così F′′ (t) = 12x(t)y(t)[x′(t)]2 + 2(6x(t)2 − 2y(t))x′(t)y′ (t) − 2x(t)[y′(t)]2 + (6x(t)2 y(t) − y(t)2 + 1)x′′ (t) + (2x(t)3 − 2x(t)y(t) + 2)y′′ (t).
(VI.8) Trovare e classificare i punti critici di f (x, y) = x2 − cos y. Soluzione. Dobbiamo risolvere il sistema dato da fx (x, y) = 2x = 0,
f y (x, y) = sin y = 0,
che ha le infinite soluzioni Pk = (0, kπ), k ∈ Z. Per stabilire la natura di questi punti calcoliamo le derivate seconde: fxx (x, y) = 2, fxy (x, y) = 0, f yy (x, y) = cos y, da cui il determinante della matrice hessiana D(x, y) = fxx (x, y) f yy (x, y) − ( fxy (x, y))2 = 2 cos y. Ricordando che cos(kπ) = (−1)k , deduciamo che sono punti di sella tutti i punti Pk corrispondenti a k dispari. Se invece k è pari, si ha D(0, kπ) > 0 e fxx (0, kπ) > 0: il Test dell’hessiana in questo caso garantisce che i punti sono di minimo locale. (VI.9) È dato un sistema di n punti del piano Pi = (xi , yi ) di masse mi . Il momento di inerzia rispetto a un punto P = (x, y) è definito come I(x, y) =
n X i=1
X h i −−→ mi kPPi k2 = mi (x − xi )2 + (y − yi )2 . n
i=1
Dimostrare che il baricentro del sistema è il punto del piano rispetto al quale il momento di inerzia è minimo. Soluzione. Detta M = può scrivere come
P i
mi la massa totale del sistema, la funzione I si
I(x, y) = M[x2 + y2 ] − 2
n X i=1
i X h 2 mi xxi + yyi + mi xi + y2i . n
i=1
Esercizi
317
Osserviamo che il lim(x,y)→+∞ I(x, y) = +∞ e dunque il minimo è assunto in base all’osservazione (VI.45) al Teorema di Weierstrass. Trattandosi di una funzione di classe C1 possiamo cercare il minimo fra i punti critici: n X
Ix (x, y) = 2Mx + 2
n X
mi xi = 0 e
I y (x, y) = 2My + 2
i=1
mi yi = 0. i=1
Ne deduciamo che la funzione ha un solo punto critico, cioè il baricentro di coordinate: 1 X mi xi M n
x=
1 X mi yi . M n
e
y=
i=1
i=1
(VI.10) Determinare il massimo e il minimo assoluti della funzione f (x, y) = x2 + y2 − x − y nell’insieme D = {(x, y) : |x| ≤ 1, |y| ≤ 1}. Soluzione. La regione in cui ottimizzare la funzione è il quadrato chiuso di lato 2 che ha due vertici nei punti (1, 1), (−1, −1): si tratta di un insieme chiuso e limitato, la funzione f è continua e dunque il Teorema di Weierstrass assicura l’esistenza in D di un punto di massimo e di un punto di minimo. Vediamo due diversi modi per trovarli. Primo modo. Costruiamo l’insieme dei valori candidati ad essere massimi o minimi, seguendo la proceduta enunciata qui accanto. Cominciamo col cercare eventuali punti critici di f che non cadono sulla frontiera ∂D: in tali punti il gradiente di f si annulla. Il sistema fx (x, y) = 2x − 1 = 0 f y (x, y) = 2y − 1 = 0 ha come unica soluzione il punto (1/2, 1/2), interno a D. in cui f vale −1/2. Cerchiamo ora altri candidati sulla frontiera dell’insieme. La frontiera è formato dai quattro segmenti S1 = {(x, y) : x = 1, |y| ≤ 1}
S3 = {(x, y) : x = −1, |y| ≤ 1}
S2 = {(x, y) : y = 1, |x| ≤ 1}
S4 = {(x, y) : y = −1, |x| ≤ 1}.
Ristretta a S1 la funzione f diventa 11 (y) = f (1, y) = y2 − y e dobbiamo cercare i suoi estremi nel segmento [−1, 1]. A questo scopo basta cercare eventuali punti in cui 1′1 (y) = 0 per y ∈ (−1, 1) e confrontare i valori di 11 in questi punti coi valori assunti agli estremi dell’intervallo. Essendo 1′1 (y) = 2y − 1 si ha 1′1 (y) = 0 soltanto per y = 1/2 e 11 (1/2) = −1/4. Si ha poi 11 (−1) = 2 e 11 (1) = 0: dunque il valore massimo di 11 è 2 e il suo valore minimo è −1/4. Ripetiamo l’analisi per f ristretta a S2 ; si ha 12 (x) = x2 − x da studiare per x ∈ [−1, 1] e dunque si può sfruttare
Per
determinare gli estremi assoluti di una funzione continua su D (chiuso e limitato): ➔ calcoliamo i valori di f nei suoi punti critici nell’insieme aperto D r ∂D; ➔ calcoliamo i valori estremi di f su ∂D; ➔ calcoliamo i valori estremi di f fra gli eventuali punti di non derivabilità; ➔ il maggiore dei valori ottenuti con questa procedura è il massimo assoluto, il minore il minimo assoluto.
Si
può stabilire la natura locale di P col Test dell’hessiana: il determinante della matrice hessiana vale 4, fxx = 2 e dunque P è punto di minimo locale interno a D.
318
Calcolo differenziale per funzioni di più variabili
l’analisi precedente (rinominando x con y) per trovare altri due punti candidati a essere estremi assoluti di f in D: il punto (1/2, 1) in cui f vale −1/4 e il punto (−1, 1) a quota 2. Proseguiamo l’analisi su S3 , dove si ha 13 (y) = f (−1, y) = 2 + y2 − y da studiare in [−1, 1]. Si ha 1′3 (y) = 2y − 1 = 0 per y = 1/2, con 13 (1/2) = 7/4; agli estremi dell’intervallo invece 13 (−1) = 4 e 13 (1) = 2. Su S3 dobbiamo quindi considerare i punti (−1, −1) e (−1, 1/2) in cui f vale rispettivamente 4 e 7/4. Infine su S4 si ha 14 (x) = f (x, −1) = 2 + x2 − x: sfruttando il caso precedente si trova che il massimo di 14 è in x = −1 a quota 4 e il suo minimo vale 7/4, assunto in x = 1/2. Riassumiamo tutti i valori candidati trovati: 1 1 1 =− , f (1, −1) = f (−1, 1) = 2, f , 2 2 2 1 1 1 1 1 7 f 1, = f , 1 = − , f −1, = f , −1 = , 2 2 4 2 2 4 f (−1, −1) = 4. Dal confronto di questi valori il massimo di f in D è 4, assunto in (−1, −1), il minimo è −1/2 assunto in (1/2, 1/2). Secondo modo. Gli insiemi di livello della funzione da ottimizzare sono facili da disegnare; si ha infatti 1 2 1 1 1 1 2 1 + y− − , f (x, y) = x2 − x + + y2 − y + − = x − 4 4 2 2 2 2 dunque l’insieme di livello Ec è semplicemente la circonferenza centrata √ in (1/2, 1/2) e raggio c + 1/2. Ma allora il problema può essere risolto graficamente mediante il metodo degli insiemi di livello: il minimo valore di f in D si avrà in corrispondenza al più piccolo c per cui Ec interseca l’insieme D, mentre il massimo di f si avrà per il più grande c per cui Ec ∩ D , ∅. Il grafico in Figura VI.25 aiuta a rispondere alla domanda: −1/2 è il valore minimo, con E−1/2 ridotto al solo punto (1/2, 1/2); il valore massimo è 4, essendo E4 la circonferenza centrata in (1/2, 1/2) e passante per il punto (−1, −1).
F VI.24
Questo secondo metodo può sem-
brare più veloce, però presuppone di saper disegnare tutti gli insiemi di livello della funzione data.
Infatti c =
f (x, y) se e solo se 2 1 1 2 1 x− + y− =c+ . 2 2 2
(VI.11) Trovare, se esistono, massimo e minimo della funzione f (x, y) = |y|(x2 − y) nell’insieme D = {(x, y) : x2 + y2 ≤ 1, x > 0}. Soluzione. La funzione in esame è continua e D l’insieme è limitato ma non è chiuso. Il Teorema di Weierstrass assicura l’esistenza dei valori estremi di f sulla chiusura di D, cioè l’unione di D con la sua frontiera: D = {(x, y) : x2 + y2 ≤ 1, x ≥ 0}. Questi valori forniscono l’estremo superiore e inferiore di f in D: nel caso uno di essi, ad esempio il minimo m , sia assunto in un punto appartenente a D, sarà allora il valore di minimo anche per f in D (e non
F VI.25
Questo argomento si usa ogni volta che il dominio è limitato ma non chiuso.
Esercizi
319
solo l’estremo inferiore). Se invece m è assunto sul segmento (0, y) con y ∈ [−1, 1], allora si concluderà che f non assume valore minimo in D (lo stesso dicasi per il massimo). Cominciamo quindi studiando il problema di ottimizzare f in D, seguendo la procedura già utilizzata nell’esercizio precedente. Innanzitutto osserviamo che f non è derivabile nei punti interni a D con y = 0. Si ha f (x, 0) = 0, e dallo studio del segno di f mostrato in Figura VI.26 si scopre facilmente che i punti (x, 0), x ∈ (0, 1] sono tutti punti di minimo locale di f interni a D. Cerchiamo ora eventuali punti critici interni a D; imponendo y , 0 si ha fx (x, y) = 2x|y|, che si annulla solo per x = 0, dunque non ci sono punti critici interni a D. Cerchiamo quindi gli estremi di f sulla frontiera di D: questa è composta di due parti, un segmento e un semicerchio
Ovvero sulla porzione del bordo di D che non appartiene a D.
Questo per la presenza del modulo. f è derivabile in (0, 0)?
S1 = {(x, y) : x = 0 , −1 ≤ y ≤ 1} S2 = {(x, y) : x > 0, x2 + y2 = 1}. Su S1 si ha 11 (y) = f (0, y) = −y|y|: questa funzione ha un flesso con tangente orizzontale in y = 0 e non presenta punti di estremo in (−1, 1). I suoi valori estremi sono quindi assunti in −1 e in 1 dove si ha 11 (−1) = 1 e 11 (1) = −1. I punti (0, ±1) sono quindi candidati p per essere estremi di f ¯ Su S2 la funzione è 12 (y) = f ( 1 − y2 , y) = |y|(1 − y2 − y), sull’insieme D. da studiare in (−1, 1); abbiamo 2 3y + 2y − 1 se y ∈ (−1, 0) ′ 12 (y) = −3y2 − 2y + 1 se y ∈ (0, 1) quindi 1′2 (y) si annulla in y = 1/3 e 12 (1/3) = 5/27. Tale valore è da confrontare con 12 (0) = 0, 12 (1) = −1 e 12 (−1) = 1; gli estremi di 12 su S2 sono dunque assunti agli estremi (12 (1) = −1 e 12 (−1) = 1). Possiamo concludere che f in D ha valore massimo pari a 1, assunto sulla frontiera in (0, −1), e minimo pari a -1, assunto in (0, 1). Poiché nessuno di questi punti appartiene a D, concludiamo che inf f = −1, D
sup f = 1
F VI.26: f è negativa nei punti che si trovano sopra la parabola di equazione y = x2 , positiva in quelli sotto. al Lettore. Quali sono gli estremi di f nel sottoinsieme di D costituito dai punti del piano che verificano
Domanda
{(x, y) : x2 + y2 ≤ 1, 0 ≤ y ≤ x2 }?
D
ma né il minimo né il massimo sono assunti. (VI.12) Determinare il rettangolo di area massima tra quelli che hanno perimetro assegnato p. Soluzione. Il problema ha senso se p > 0 e può essere formulato nel modo seguente: chiamate x e y rispettivamente la base e l’altezza di un generico rettangolo, il perimetro è la funzione 2x + 2y mentre l’area è rappresentata da f (x, y) = xy. Per la natura geometrica del problema dobbiamo considerare x, y ≥ 0 e si tratta di trovare il massimo di f (x, y) col vincolo 1(x, y) = 2x + 2y − p = 0. Gli insiemi di livello di f sono iperboli equilatere e il vincolo è il segmento AB che si trova sulla retta di equazione y = −x + p/2 con x ∈ [0, p/2]. È importante osservare che queste iperboli
Questo
esercizio risponde al secondo quesito posto all’inizio del § 8.
320
Calcolo differenziale per funzioni di più variabili
si schiacciano verso gli assi al diminuire del livello di f corrispondente: la Figura VI.27 evidenzia che l’area massima si ha quando l’iperbole tocca per la prima volta il segmento AB (cioè nel punto P in cui una iperbole è tangente al segmento); poi le iperboli intersecano sempre AB e il valore dell’area diminuisce fino a 0, assumendo tale valore in corrispondenza dei punti A e B, dove una delle dimensioni del rettangolo è nulla. I punti A e B sono dei “punti di frontiera del vincolo”, corrispondenti a x = 0 e x = p/2 sul vincolo y = −x+p/2. Essi vanno trattati a parte. Le coordinate del punto di tangenza P si ottengono risolvendo il sistema y − 2λ = 0 x − 2λ = 0 2x + 2y = p Dalle prime due si ricava che y = x e sostituendo nell’ultima deve essere 4x = p, da cui x = p/4. Gli estremi della funzione f possono quindi trovarsi nei punti A, B o P. Valutandola in questi punti otteniamo f (A) = f (B) = 0, mentre f (P) = f (p/4, p/4) = p2 /16. Perciò f ristretta al segmento AB è massima in P e l’area del rettangolo è massimizzata dal quadrato di lato p/4. Il Metodo dei moltiplicatori di Lagrange si estende facilmente alle funzioni di tre (o più) variabili.
Per
trovare gli estremi di f con il vincolo 1(x, y) = c con il metodo dei moltiplicatori (assumendo che massimo e minimo assoluti esistano) occorre: ➔ trovare i valori di x, y e λ tali che ∇ f (x, y) = λ∇1(x, y) 1(x, y) = c ;
➔ trovare i punti del vincolo 1(x, y) = c in cui f o 1 non sono derivabili, oppure il gradiente di 1 è nullo; ➔ calcolare il valore della funzione f in tutti i punti trovati. Il più grande di questi valori è il massimo di f , il più piccolo è il valore minimo di f . Ovviamente, se è possibile esplicitare il vincolo, non è necessario usare questo metodo. In questo caso potevamo ricavare y = p/2 − x, 0 ≤ x ≤ p/2 ed ottimizzare la funzione (di una variabile) 1(x) = f (x, p/2 − x).
(VI.55) Teorema dei moltiplicatori di Lagrange in tre variabili. Supponiamo che f e 1 siano di classe C1 (A), A ⊂ R3 . Se (x0 , y0 , z0 ) è un punto di estremo per f nell’insieme Z = {(x, y, z) : 1(x, y, z) = 0} e ∇1(x0 , y0 , z0 ) , 0, allora esiste λ0 ∈ R tale che ∇ f (x0 , y0 , z0 ) = λ0 ∇1(x0 , y0 , z0 ).
F VI.27
Vediamone un’applicazione. (VI.13) Determinare la scatola rettangolare, senza coperchio, di volume massimo ricavabile da 12 m2 di cartone. Soluzione. Dette x, y e z, le dimensioni della scatola, si tratta di determinare il massimo della funzione f (x, y, z) = xyz con il vincolo 1(x, y) = 2xz n + 2yz + xy − 12 = 0o con x, y, z ≥ 0. Osserviamo che l’insieme D = (x, y, z) ∈ R3 : x, y, z ≥ 0 non è aperto, quindi, per utilizzare il Teoren o ma (VI.47), consideriamo A = (x, y, z) ∈ R3 : x, y, z > 0 .
L’esercizio risponde
al terzo quesito posto all’inizio del § 8. Per un problema simile si veda l’Esercizio 44 .
Esercizi
321
Le funzioni f e 1 sono di classe C1 (A) e ∇1 , 0 in tutto A. Usando il metodo dei moltiplicatori, cerchiamo le soluzioni del sistema yz = λ(2z + y) xz = λ(2z + x) xy = λ(2x + 2y) 2xz + 2yz + xy = 12,
Osserviamo inoltre che
f ≥ 0 su D e che se (x, y, z) ∈ ∂D allora, per poter soddisfare il vincolo, una componente è certamente nulla e su ∂D abbiamo f ≡ 0: quindi abbiamo trovato i punti di minimo assoluto! Possiamo quindi limitarci a cercare i massimi vincolati di f nell’insieme aperto A.
Essendo x, y, z non nulle (e quindi necessariamente anche λ), per risolverlo moltiplichiamo la prima equazione per x, la seconda per y e la terza per z. Confrontando le prime tre equazioni ricaviamo la catena di uguaglianze 2zx + yx = 2zy + xy = 2xz + 2yz. Dai primi due termini ricaviamo zx = zy, ovvero x = y, dal primo e dal terzo invece 2yz = xy da cui x = 2z. Se ora poniamo x = y = 2z nell’equazione del vincolo troviamo 4z2 + 4z2 + 4z2 = 12, da cui z = 1 e conseguentemente x = y = 2. Il sistema ha dunque una unica soluzione con tutte le componenti non nulle, (2, 2, 1, 1/2). Il valore di f in (2, 2, 1) è 4, possiamo quindi concludere che questo è il massimo assoluto di f su D. ✩ (VI.14) (Curvature sezionali) Sia data una superficie cartesiana regolare ed un punto (x0 , y0 , z0 ) in cui il piano tangente sia orizzontale. Definiamo curvature sezionali le curvature, nel punto, delle curve ottenute intersecando la superficie con un piano verticale fissato (le sezioni verticali della superficie). Determinare utilizzando la formula dell’Esercizio (V.9) a pagina 264, la curvature sezionali, al variare di tale piano verticale, e, in particolare, caratterizzare quella massima e quella minima (dette curvature principali). Soluzione. Sia z = f (x, y) la funzione il cui grafico è la nostra superficie: poiché il piano tangente è orizzontale, abbiamo ∇ f (x0 , y0 , z0 ) = 0. Un piano verticale, contiene la direzione dell’asse z, e si proietta sul piano xy su una retta parallela ad un versore v = (h, k) del piano xy (pensiamo quindi che h2 + k2 = 1). Fissato (h, k), la sezione è parametrizzata da r(t) = (x0 + ht, y0 + kt, f (x0 + ht, y0 + kt)). Calcoliamo le derivate prime e seconde di r: r′ (t) = (h, k, ∇ f (x0 + ht, y0 + kt) ·v),
r′′ (t) = (0, 0, H f (x0 + ht, y0 + kt)v·v);
Volendo,
da una delle prime tre equazioni possiamo trovare il valore, per altro ininfluente, λ = 1/2.
322
Calcolo differenziale per funzioni di più variabili
in particolare kr′ (0)k = 1, r′ (0) = (h, k, 0), r′′ (t) = (0, 0, H f (x0 , y0 )v · v), e r′ (0) × r′′ (0) = H f (x0 , y0 )v · v (k, −h, 0). Otteniamo quindi k(0) =
kr′ (0) × r′′ (0)k . = H (x , y )v · v 0 0 f kr′ (0)k3
Infatti h2 + k2 = 1.
Conviene a questo punto modificare leggermente la definizione di curvatura, permettendole di assumere segno positivo o negativo : in tale caso la curvatura sezionale con segno, in funzione della direzione v è
A
seconda che la sezione stia nel semispazio delle z positive o negative.
κ(v) = H f (x0 , y0 )v · v , che osserviamo essere una forma quadratica nella direzione v. Abbiamo imparato nell commento all’Esempio (VI.48) a pagina 305 che il massimo e minimo di una forma quadratica sulla circonferenza non sono altro che i due autovalori della matrice associata alla forma quadratica. Dunque, per una superficie cartesiana z = f (x, y), in un punto in cui il gradiente sia nullo , gli autovalori della matrice hessiana di f corrispondono ai valori estremi delle curvature sezionali. (VI.15) Sia y = ϕ(x) la funzione definita implicitamente da 1(x, y) = xe y + yex = 0 nei pressi di (0, 0). Dopo aver verificato che ϕ è di classe C2 scriverne lo sviluppo di Taylor del secondo ordine, con resto di Peano, centrato in x = 0. Soluzione. Come abbiamo visto nell’esempio citato, 1(x, y) = xe y + yex = 0 definisce implicitamente una funzione y = ϕ(x) in un intervallo I che contiene x = 0, con ϕ(0) = 0 e ϕ ∈ C1 (I). Dal Teorema di Dini otteniamo inoltre ϕ′ (x) = −
eϕ(x) + ϕ(x)ex 1x (x, ϕ(x)) =− , 1 y (x, ϕ(x)) xeϕ(x) + ex
per ogni x ∈ I.
Dato che ϕ è di classe C1 , anche il secondo membro della precedente relazione lo è (è composizione di funzioni C1 ); ne segue che ϕ′ è di classe C1 , cioè che ϕ è di classe C2 . Ne segue che possiamo scriverne lo sviluppo richiesto come 1 ϕ(x) = ϕ(0) + ϕ′ (0)x + ϕ′′ (0)x2 + o(x2 ), 2
per x → 0.
Sappiamo già che ϕ(0) = 0 e ϕ′ (0) = −1 . Per calcolare ϕ′′ , è possibile derivare l’espressione di ϕ′ (x), o più semplicemente derivare l’equazione che la definisce implicitamente. Dato che 1(x, ϕ(x)) = xeϕ(x) + ϕ(x)ex = 0, derivando otteniamo ϕ(x)
e
ϕ(x)
+ xe
′
′
x
x
ϕ (x) + ϕ (x)e + ϕ(x)e = 0
Il
caso del gradiente diverso da zero è trattato nell’Esercizio 64 .
Abbiamo
già incontrato questa funzione nell’Esempio (VI.51) a pagina 308.
Abbiamo
calcolato le derivate parziali 1x (x, y) = e y + yex e 1 y (x, y) = xe y + ex , quindi sostituito y = ϕ(x) nell’espressione di ϕ′ (x).
Ragionando
in modo analogo è possibile vedere (per induzione) che in realtà ϕ è di classe Ck , per ogni k intero. Si veda a tal proposito anche l’Esercizio 54 a pagina 329.
Abbiamo sostituito x = 0 e ϕ(0) = −1 nell’espressione di ϕ′ (t). Il Lettore
smemorato, che avesse dimenticato la formula per ϕ′ , può facilmente riottenerla da questa.
Esercizi
323
e derivando di nuovo (possiamo farlo perché ϕ è di classe C2 )
h i eϕ(x) ϕ′ (x) + eϕ(x) ϕ′ (x) + xeϕ(x) ϕ′ (x) 2 + xeϕ(x) ϕ′′ (x) + + ϕ′′ (x)ex + ϕ′ (x)ex + ϕ′ (x)ex + ϕ(x)ex = 0
per ogni x ∈ I. Da questa formula è possibile ricavare il valore numerico di ϕ′′ in x = 0 semplicemente sostituendo ϕ(0) = 0 e ϕ′ (0) = −1. Abbiamo −1 + [−1 + 0 + 0] + [ϕ′′ (0) − 1] + [−1 + 0] = 0,
La
derivazione fatta in questo esempio per ricavare ϕ′′ (x) può essere fatta in generale (si veda l’Esercizio 55 a pagina 329), anche per calcolare derivate di ordine superiore.
da cui ϕ′′ (0) = 4. La funzione ϕ ha dunque concavità verso l’alto, e possiamo tracciarne un grafico qualitativo come in Figura VI.28, disegnando prima la retta tangente y = −x. Lo sviluppo di Taylor corrispondente è ϕ(x) = −x − 2x2 + o(x2 ). ✩ (VI.16) Disegnare l’insieme piano n o (x, y) ∈ R2 : x + y − ln x − ln y = 3 . Soluzione. Si tratta di studiare l’insieme di livello 3 della funzione 1(x, y) = F VI.28 x + y − ln x − ln y. Iniziamo con l’osservare che 1 è definita solo se sia x che y sono (strettamente) positivi, ed è di classe C2 . Inoltre, se x o y tendono Invitiamo il Lettore a verificare, a 0+ o a +∞ allora 1 tende a +∞. Infine gradiente e matrice hessiana di sfruttando la definizione di limite, che questo implica che, per ogni N, 1 sono dati da esiste un quadrato Q = [ε, M]×[ε, M] ! " 2 # tale che 1 > N fuori da Q; questo 1 1 1/x 0 implica che 1 assume il suo minimo e H1 (x, y) = . ∇1(x, y) = 1 − , 1 − assoluto. 0 1/y2 x y Ne segue che l’unico punto critico di 1 risulta essere (1, 1), che è minimo assoluto per 1. Dato che 1(1, 1) = 2, essendo 3 ≥ 2 ne deduciamo che l’insieme di livello in questione non è vuoto, e quanto detto suggerisce che sia una curva chiusa. Vediamo di dimostrarlo rigorosamente. A tale scopo osserviamo che l’equazione ausiliaria nessuna soluzione se k < 1 t − ln t = k ha l’unica soluzione 1 se k = 1 due soluzioni α < 1 < β se k > 1.
Infatti
possiamo applicare facilmente il test dell’hessiana (VI.40) (si veda anche l’approfondimento a pagina 300).
Infatti, posto h(t) = t − ln t, si ha lim h(t) = lim h(t) = +∞
t→0+
t→+∞
h′ (t) = 1 − 1/t > 0 se t > 1 e h′′ (t) = 1/t2 per ogni t. Il grafico di h è illustrato in Figura VI.29. Sia ora x0 > 0 fissato. L’equazione 1(x0 , y) = 3 si scrive come (10) y − ln y = 3 − x0 + ln x0 ,
F VI.29
324
Calcolo differenziale per funzioni di più variabili
che, per quanto detto (con t = y e k = 3 − x0 + ln x0 ), non ha soluzioni per 3 − x0 + ln x0 < 1, cioè per x0 − ln x0 > 2; ma questo, di nuovo per l’equazione ausiliaria, avviene quando 0 < x < α e x > β, dove α − ln α = β − ln β = 2 e α < 1 < β. Ragionando in modo analogo otteniamo che se x0 = α, β allora (10) è risolta da y = 1, mentre se α < x0 < β allora (10) è risolta da due diversi valori ϕ1 (x0 ) e ϕ2 (x0 ), dipendenti da x0 . Quindi sono ben definite le funzioni ϕ1 , ϕ2 : (α, β) → R tali che 1(x, ϕ1(x)) = 1(x, ϕ2(x)) = 3 e ϕ1 (x) < 1 < ϕ2 (x). Inoltre non è difficile vedere che lim ϕ1 (x) = lim+ ϕ2 (x) = lim− ϕ1 (x) = lim− ϕ2 (x) = 1.
x→α+
x→α
x→β
x→β
Per il Teorema di Dini entrambe le funzioni sono di classe C1 su (α, β), e vale (per entrambe) ϕ′ (x) = −
1 − 1/x > 0 ⇐⇒ x < 1, ϕ(x) > 1 o x > 1, ϕ(x) < 1. 1 − 1/ϕ(x)
Quindi ϕ1 è decrescente su (α, 1) e crescente su (1, β), mentre ϕ2 presenta il comportamento contrario. Ne segue quindi che l’insieme di livello richiesto è una curva chiusa (si veda la Figura VI.30).
Infatti se α < x < β sia y = ϕ1 (x) che y = ϕ2 (x) sono diverse da 1, perciò 1 y (x, y) = 1 − 1/y , 0, e possiamo applicare il Teorema di Dini in (x, ϕ(x)). Grazie all’Esercizio 54 è anche possibile vedere che ϕ′′ >0e 1 ϕ′′ < 0. 2
(VI.56) Teorema di Dini in tre variabili. Sia 1 una funzione di classe C1 (A) (con A aperto) e sia dato un punto (x0 , y0 , z0 ) ∈ A tale che ① 1(x0 , y0 , z0 ) = 0 ② 1z (x0 , y0 , z0 ) , 0 allora esistono un disco aperto B di centro (x0 , y0 ) e raggio δ > 0, un intervallo J = (z0 − σ, z0 + σ), e una funzione ϕ : B → J, tale che ➔ z0 = ϕ(x0 , y0 );
F VI.30
➔ 1(x, y, z) = 0 in B × J =⇒ z = ϕ(x, y). ➔ ϕ è a sua volta di classe C1 (B; J) e le sua derivate valgono 1x (x, y, ϕ(x, y)) ∂ϕ (x, y) = − , ∂x 1z (x, y, ϕ(x, y))
1 y (x, y, ϕ(x, y)) ∂ϕ (x, y) = − . ∂y 1z (x, y, ϕ(x, y))
(VI.17) Data la funzione di tre variabili 1(x, y, z) = x2 + 4y2 + 2y4 + z2 + sin z dimostrare che l’equazione 1(x, y, z) = 0 definisce implicitamente una funzione z = z(x, y) vicino a (0, 0, 0). Dimostrare che il punto (0, 0) è critico per z = z(x, y) e stabilirne la natura.
Ovviamente è possibile scambiare il ruolo delle variabili. La condizione fondamentale perché nell’equazione 1(x, y, z) = 0 sia possibile esplicitare una variabile in un intorno di un punto è che la derivata parziale di 1 rispetto a quella variabile, nel punto in questione, non si annulli. Vedremo nel capitolo successivo ulteriori generalizzazioni del Teorema di Dini al caso di funzioni implicitamente definite da sistemi di equazioni.
Esercizi
325
Soluzione. Osserviamo innanzitutto che 1 è una funzione di classe C∞ in tutto lo spazio. Calcoliamo ora le derivate parziali di 1: risulta 1x = 2x, 1 y = 8y + 8y3 , 1z = 2z + cos z da cui in particolare 1z (0, 0, 0) = 1, 1x (0, 0, 0) = 0, 1 y (0, 0, 0) = 0. Poiché 1z (0, 0, 0) , 0 possiamo concludere grazie al Teorema di Dini (VI.56) che l’equazione 1(x, y, z) = 0 definisce implicitamente una funzione z = ϕ(x, y) in un intorno di (0, 0) tale che ϕ(0, 0) = 0. Inoltre le derivate di z si possono calcolare con le formule del teorema; in particolare, per (x, y) = (0, 0) si ha 1 y (0, 0, 0) ∂ϕ (0, 0) = − = 0. ∂y 1z (0, 0, 0)
1x (0, 0, 0) ∂ϕ (0, 0) = − = 0, ∂x 1z (0, 0, 0)
Questo prova che (0, 0) è un punto critico per z = ϕ(x, y); la sua natura segue dal calcolo delle derivate seconde attraverso il test dell’hessiana. Per le derivate seconde, prendiamo le derivate di ϕ date dalle Teorema di Dini e deriviamo: 1x (x, y, ϕ(x, y)) −2x = 1z (x, y, ϕ(x, y)) 2ϕ(x, y) + cos(ϕ(x, y)) ϕx (x, y) 2 − sin(ϕ(x, y)) 1 + 2x ϕxx (x, y) = − 2 2ϕ(x, y) + cos(ϕ(x, y)) [2ϕ(x, y) + cos(ϕ(x, y))]2 ϕx (x, y) = −
da cui, sostituendo i valori in (0, 0), ovvero ϕ(0, 0) = 0, ϕx (0, 0) = 0 si ha ϕxx (0, 0) = −2. Calcoliamo anche ϕxy , derivando la ϕx rispetto a y ϕxy (x, y) = 2x
2ϕ y(x, y) − sin(ϕ(x, y))ϕ y(x, y) [2ϕ(x, y) + cos(ϕ(x, y))]2
Per ϕ yy ci serviamo dell’espressione di ϕ y : ϕ y (x, y) = − ϕ yy (x, y) =
1 y (x, y, ϕ(x, y)) 1z (x, y, ϕ(x, y))
= −8
y + y3 2ϕ(x, y) + cos(ϕ(x, y))
8(y + y3 )ϕ y (x, y)[2 − sin(ϕ(x, y))] −8(1 + 3y2 ) + 2ϕ(x, y) + cos(ϕ(x, y)) [2ϕ(x, y) + cos(ϕ(x, y))]2
Sostituendo i valori in (0, 0) troviamo ϕxy (0, 0) = 0, ϕ yy (0, 0) = −8. Il determinante della matrice hessiana di ϕ nell’origine è ϕxx (0, 0)ϕ yy(0, 0) − ϕ2xy (0, 0) = 16 > 0, e ϕxx (0, 0) < 0: si può allora concludere che (0, 0) è un punto di massimo locale per la funzione z = ϕ(x, y).
326
Calcolo differenziale per funzioni di più variabili
✎ Diamoci da fare. . . (Soluzioni a pagina 617) 1 Calcolare le derivate parziali della funzione f (x, y) =
2xy x2 + y2
o 8 Data la funzione f (x, y) =
( √ 3
xe−x
2 /y4
0
y,0 y=0
nel punto (1, 0) e nel generico punto (x, y). 2 Calcolare, se esistono, le derivate parziali nell’origine della funzione: 2 x − 3y2 y,x x−y f (x, y) = 0 y = x.
verificare che in (0, 0) (a) f è continua; (b) f ammette tutte le derivate direzionali; (c) vale la formula del gradiente (d) f non è differenziabile.
b 3 Calcolare le derivate parziali della funzione data o 9 Data la funzione (dove essa è derivabile) √ x (sin xy)2 (a) 3xy + x5 + y3 − 2x2 y; (g) arctan ; x > 0, y > 0 y x−y f (x, y) = y (b) ; x+y x altrove (h) sin(x2 + 3y); (c) xexy ; 2 2 si chiede di (i) xe−x −y ; (d) x ln y; p (a) stabilire se f è continua in R2 ; (e) ln(x + x2 + y2 ); x+y (j) ; p 3 2 (f) xy ; (b) provare che f è differenziabile in (0, 0). x + y2 4 Determinare, utilizzando la Definizione (VI.8), le ✩ 10 Data la funzione derivate direzionali di x ln(1 + y) f (x, y) = 3x − 2y x > 0, y > 0 √ f (x, y) = x+y in un generico punto. y2 altrove 5 Determinare le derivate direzionali nell’origine della si chiede di determinare i punti in cui f è continua quinfunzione definita nell’Esempio (VI.7). di di studiare la differenziabilità di f in (1, 0), (0, 1) e o 6 Per ciascuna delle funzioni (0, 0). y 2 x,0 11 Per calcolare la derivata direzionale di f in un punf (x, y) = x 0 x=0 to (x0 , y0 ) si restringe l’attenzione di f alla retta passante per (x0 , y0 ) e con la direzione data. Se la direzione non è y sin x (x, y) , (0, 0) p 2 l’asse y, questa retta avrà equazione y = y0 + m(x − x0 ), 2 1(x, y) = x +y corrispondente alla direzione 0 (x, y) = (0, 0) si stabilisca in quali punti di R2 è continua, derivabile, differenziabile. 7 Determinare il piano tangente al grafico della funzione q 2 f (x, y) = ex−y + 1 + x2 + y4 nel punto (1, 0, f (1, 0)). Calcolare poi Dv f (1, 0) dove v è il versore che indica la direzione della retta y = −x.
! 1 m v= √ , √ . 1 + m2 1 + m2 Definiamo ora la funzione 1(x) = f (x, y0 + m(x − x0 )). Dimostrare che 1 Dv f (x0 , y0 ) = √ 1′ (x0 ). 1 + m2
Esercizi
327
b 12 Calcolare tutte le derivate seconde delle funzioni p 3x2 + 5y2 ; (d) (a) x4 − 3x2 y3 ; (e) ln(x2 + y); p (f) arcsin (x − y);
(b) ex sin y;
y
(c) arctan x ;
b 13 Usare le regola di derivazione delle funzioni composte viste nei Teoremi (VI.24) e (VI.27) per calcolare le derivate di F(t, s) = f (x(t, s), y(t, s)). (a) f (x, y) = sin x cos y, x = πt, y = ln t; (b) f (x, y) = ex sin y, x = sin t, y = t2 + t; (c) f (x, y) = arctan y/x, x = st, y = 3s + 2t; √ p (d) f (x, y) = yx2 + (x − y), x = s/t, y = s2 + t2 .
K 19 Sia f : A ⊂ R2 → R una funzione di classe C2 (A) e sia (x0 , y0 ) ∈ A fissato. Consideriamo un incremento (h, k) tale che il segmento che congiunge il punto (x0 , y0 ) con (x0 + h, y0 + k) sia contenuto in A. Dimostrare la Formula di Taylor con il resto di Lagrange per f , ovvero che esiste ξ ∈ (0, 1) tale che f (x0 + h, y0 + k) = f (x0 , y0 ) + fx (x0 , y0 )h + fy (x0 , y0 )k 1h + fxx (x0 + ξh, y0 + ξk)h2 2 i +2 fxy (x0 + ξh, y0 + ξk)hk + f yy (x0 + ξh, y0 + ξk)k2 . (Suggerimento: si applichi la Formula di Taylor col resto di Lagrange alla funzione F definita nell’Esercizio 18 .)
K 20 Utilizzando la formula di Taylor col resto di Lagrange dimostrata nell’esercizio precedente, dimostrare K 14 (Corollario del Teorema di Schwarz) Dimostrare che la formula di Taylor col resto di Peano del riquadro di se f è derivabile k volte con derivate tutte continue fipagina 295. no all’ordine k, l’ordine di derivazione non conta nelle K 21 Utilizzando la formula di Taylor col resto di Laderivate parziali di ogni ordine fino a k. grange nell’Esercizio 19 dimostrare il Test dell’hessiana (VI.40) a pagina 298. (Suggerimento: utilizzare il n K 15 Dimostrare che se f è di classe C sull’insieme A, ragionamento visto nell’Esempio (VI.38) a pagina 297.) allora le sue derivate di ordine n fatte k volte rispetto ad una variabile e n − k rispetto all’altra sono esattamente n . k
22 Mostrare che ogni funzione della forma
16 Calcolare le derivate quarte della funzione
con f e 1 funzioni C2 (R), è soluzione dell’equazione delle onde
f (x, y) = x + xy + y3 + x2 y3 + x5 + y5 . ✩ 17 Mostrare che per la funzione x2 − y2 xy 2 f (x, y) = x + y2 0
(x, y) , (0, 0) (x, y) = (0, 0)
risulta fxy (0, 0) = −1,
f yx (0, 0) = 1.
Il risultato è in contraddizione col Teorema di Schwarz a pagina 294? 18 Supponiamo che f sia di classe C2 in A e definiamo la funzione composta F(t) = f (x0 + th, y0 + tk),
t ∈ [0, 1]
che descrive la restrizione di f al segmento che congiunge i punti (x0 , y0 ) con (x0 + h, y0 + k), che supponiamo incluso in A. Calcolare le derivate prima e seconda di F.
z(x, t) = f (x + ct) + 1(x − ct)
∂2 z ∂2 z = c2 2 2 ∂t ∂x K 23 Sia w ∈ C1 (R2 ). Dimostrare che se wy = 0 allora w(x, y) = f (x), dove f è una arbitraria funzione di classe C1 (R). (Suggerimento: utilizzare il Teorema di Lagrange per le funzioni di una variabile.) 24 Sia data una funzione w(y, s) di classe C2 (R2 ). Poniamo y = x − ct, s = x + ct, z(x, t) = w(x − ct, x + ct); dimostrare, utilizzando l’esercizio precedente, che ztt = c2 zxx ⇔ wys = 0. Dedurne che ogni soluzione dell’equazione delle onde unidimensionale ha la forma z(x, t) = f (x + ct) + 1(x − ct).
25 Verificare che la funzione u(x, y) = ex cos y risolve l’equazione di Laplace in R2 . 26 Verificare che la funzione 1 2 u(x, y) = √ e−(x−a) /4t . t risolve l’equazione del calore ut = uxx .
328
Calcolo differenziale per funzioni di più variabili
27 Verificare che la funzione u(x, y, z) = p
34 Verificato che l’origine è un punto di critico di ! x2 2 f (x, y) = y − x y − 2
1 x2
+ y2 + z2
risolve l’equazione di Laplace in R3 . Si tratta di un multiplo del potenziale Coulombiano generato da una carica puntiforme posta nell’origine. 28 Data z(r, ϑ) = f (r cos ϑ, r sin ϑ) calcolare zr , zϑ e zrϑ . 29 Calcolare l’operatore di Laplace in coordinate polari, ovvero se z = f (x, y) e x = r cos ϑ, y = r sin ϑ, mostrare che ∂2 z ∂2 z ∂2 z 1 ∂2 z 1 ∂z + 2 = 2 + 2 2 + . 2 ∂x ∂y ∂r r ∂ϑ r ∂r
quindi considerare le restrizioni di f lungo le rette y = mx, 1m (x) = f (x, mx) e, dopo aver osservato che x = 0 è un minimo per tutte le funzioni 1m , mostrare che l’origine è un punto di sella per f . o 35 Determinare gli estremi vincolati delle funzioni di due variabili con il metodo grafico delle curve di livello. (a) f (x, y) = x + y − 1 per xy = 1;
(b) f (x, y) = xy per x + y = 1;
(c) f (x, y) = x − 2y per x2 + y2 = 5;
(d) f (x, y) = x2 + y2 per 2x + 3y = 1.
✩ 30 Sia Jν la funzione di Bessel, soluzione dell’Equazione di Bessel (11) a pagina 52. Utilizzando il risultato dell’Esercizio 29 dimostrare che la funzione u(x, y) = p Jν ( x2 + y2 ) risolve l’equazione agli autovalori
36 Trovare i valori di massimo e di minimo assoluti della funzione f (x, y) = x2 − xy + y nell’insieme
−∆u = λu. Dimostrare che la funzione u(r cos ϑ, r sin ϑ) Jν (r) cos(nϑ) risolve l’equazione di Laplace.
=
31 Utilizzando il risultato dell’Esercizio 29 , verificare che le sole soluzioni dell’equazione di Laplace in R2 che dipendono esclusivamente da r (e non da ϑ) hanno la forma u(r) = a log(r) + b. 32 Data
D = {(x, y) ∈ R2 : x ≥ 0, y ≥ 0, x + y ≤ 4}. 37 Calcolare, se esistono, gli estremi della funzione f (x, y) = x2 + y2 + 2 sotto la condizione x2 − 2xy + y2 = 0. 38 Calcolare gli estremi della funzione
4
4
f (x, y) = x + y − 2(x − y)
2
determinare i punti critici di f e precisarne la natura. b 33 Studiare i massimi e i minimi locali della funzioni di due variabili. (b) f (x, y) = x2 + xy + y2 − 2x − y; (c) f (x, y) = x3 y2 (6 − x − y);
(d) f (x, y) = x4 + y4 − 2x2 + 4xy − 2y2 ; 2 +y2 )
;
(f) f (x, y) = ex−y (x2 − 2y2 ); p (g) f (x, y) = xy 1 − x2 − y2 ;
8 x (h) f (x, y) = + + y. x y
2 −y2
sul bordo del quadrato Q = {(x, y) ∈ R2 : |x| ≤ 1, |y| ≤ 1}. 39 Calcolare gli estremi della funzione f (x, y) = (x − y) ln(4 + x − y)
(a) f (x, y) = (x − 1)2 + 2y2 ;
(e) f (x, y) = (x2 + y2 )e−(x
f (x, y) = ex
sotto la condizione x2 + y2 = 1. Cosa cambia aggiungendo la condizione x ≤ 0, y ≥ 0? ✩ 40 Mostrare che la funzione f (x, y) = x2 − y2 − xy è dotata di minimo assoluto nella striscia E = {(x, y) : 0 ≤ y ≤ 3} ma non di massimo assoluto.
Esercizi
329
✩ 41 Calcolare l’estremo inferiore e l’estremo superiore ✩ 51 I punti P1 e P2 si trovano in due ambienti ottici difdi ferenti separati l’uno dall’altro dall’insieme (regolare) di equazione 1(x, y) = 0. f (x, y) = x2 y + y2 x nel dominio E = {(x, y) : xy > 1, 0 ≤ x < 1, 0 ≤ y < 3}. La funzione assume valore massimo? E valore minimo? o 42 Determinare il massimo e il minimo assoluti della funzione f nel dominio D. (a) f (x, y) = 1 + x + 2y in D = {(x, y) ∈ R2 : x ≥ 0, y ≤ 0, x − y ≤ 1};
(b) f (x, y) = x2 y in D = {(x, y) ∈ R2 : x2 + y2 ≤ 1};
(c) f (x, y) = sin x + sin y + sin(x + y) in D = {(x, y) ∈ R2 : 0 ≤ x ≤ π2 , 0 ≤ y ≤ π2 };
(d) f (x, y) = x3 + y3 − 3xy in D = {(x, y) ∈ R2 : 0 ≤ x ≤ 2, −1 ≤ y ≤ 2}.
43 Scrivere il numero positivo S > 0 come somma di tre numeri positivi in modo che il loro prodotto sia massimo. Dedurre la disuguaglianza x+y+z √ 3 . xyz ≤ 3 44 Tra i parallelepipedi di volume dato V determinare quello che ha la superficie totale minima. Esiste un parallelepipedo di superficie massima? 45 Tra tutti i triangoli di perimetro 2p dato, mostrare che quello di area massima è equilatero.
Le velocità di diffusione della luce nel primo e nel secondo ambiente sono rispettivamente v1 e v2 . Il principio di Fermat afferma che un raggio luminoso percorre la spezzata P1 P0 P2 che richiede il tempo minimo. Sfruttando questo principio determinare la legge di rifrazione del raggio luminoso. 52 I letti di due corsi d’acqua rappresentano (approssimativamente) una parabola di tipo y = x2 e la retta x − y − 2 = 0. Si deve costruire un canale rettilineo di lunghezza minima che permetta di riunire i due corsi d’acqua. Per quali punti bisogna farlo passare? 53 (Metodo dei minimi quadrati) Dati n punti nel piano di coordinate (x1 , y1 ), (x2 , y2 ),...,(xn , yn ) trovare la retta di equazione y = mx + q che minimizzi la somma dei quadrati degli scarti verticali tra retta e punto. K 54 Con riferimento al Teorema di Dini a pagina 308, dimostrare che la funzione ϕ definita implicitamente dall’equazione 1(x, y) = 0 sull’intervallo I risulta di classe Ck se 1 è di classe Ck , per ogni k intero.
46 Tra tutti i triangoli inscritti nella circonferenza unitaria, mostrare che quello di area massima è K 55 Con riferimento al Teorema di Dini a pagina 308, dimostrare che se 1 ∈ C2 allora la funzione ϕ definita equilatero. implicitamente dall’equazione 1(x, y) = 0 sull’intervallo 47 Trovare un punto (x, y) in modo tale che la somI, ha una derivata seconda pari a ma dei quadrati delle distanze dalle rette x = 0, y = 0, 1xx (1y )2 − 21xy 1x 1y + 1yy (1x )2 x − y + 1 = 0 sia minima. ϕ′′ (x) = − , (1y )3 48 Trovare la distanza minima del punto (2, 1, −1) dal piano x + y − z = 1. dove le derivate parziali sono calcolate in (x, ϕ(x)) per ogni x ∈ I. 2 49 Trovare i punti della superficie z = xy + 1 che sono più vicini all’origine. 56 Risolvere il problema proposto nell’Esercizio (VI.44) a pagina 302 col metodo dei moltiplicatori 50 Trovare il massimo volume di un parallelepipedi Lagrange. Ricordiamo che il problema consiste nel do con le facce parallele ai piani coordinati e inscritto trovare il minimo assoluto della funzione nell’ellissoide √ 1 f (x, y) = (4 − 3x − y) 9x2 + 36y2 + 4z2 = 36. 2 con il vincolo D = {(x, y) : x2 + y2 = 1}.
330
Calcolo differenziale per funzioni di più variabili
57 Trovare il punto della parabola semicubica di equazione y2 − x3 = 0 che ha minima distanza dal punto (−1, 0). Dedurre che il Teorema dei moltiplicatori di Lagrange non è valido in assenza dell’ipotesi ∇1 , 0.
K 58 Con riferimento al Teorema (VI.56), data per provata l’esistenza di una ϕ di classe C1 , tale che 1(x, y, ϕ(x, y)) = 0
(x, y) ∈ B,
ricavare le formula di pagina 324 per il calcolo delle derivate parziali di ϕ. (Suggerimento: applicare il Teorema (VI.27).) 59 Verificare che l’equazione sin y − xy + π = 0 definisce la y come funzione di x in un intorno del punto (1, π). Calcolare lo sviluppo di Taylor al secondo ordine di y = y(x) in x = 1 e tracciare un grafico locale di h. 60 Si verifichi che l’equazione x2 + ln(1 + xy) + ye2y = 0
61 Verificare che l’equazione 1(x, y) = yx2 + x + sin xy + 3(ey − 1) = 0 definisce implicitamente una funzione x = ψ(y) nei pressi di (0, 0). Calcolare quindi il limite ψ(y) + 3y . lim y→0 y 62 L’equazione F(x, y) = y3 − x2 = 0 definisce in un in√ 3 torno di (0, 0) una unica funzione y = f (x) = x2 anche se F y (0, 0) = 0. Ciò è in contrasto col Teorema di Dini? ✩ 63 Si dimostri che l’equazione 1(x, y) = y5 + y − xex = 0 definisce una sola funzione y = ϕ(x) su tutto l’asse reale. Tracciare un grafico qualitativo di ϕ.
definisce implicitamente in un intorno dell’origine una ✩ 64 In riferimento all’Esercizio (VI.14) a pagina 330, sola funzione y = f (x). Verificare che x = 0 è un punto determinare la curvatura sezionale nel caso il piano di estremo per la funzione f e stabilirne la natura. tangente non sia orizzontale.
❊❊❊
La pintura abstracta, en realidad, no existe. Siempre se debe empezar por algo. Después se le puede quitar a ese “algo” el parecido que pueda tener con la realidad. Cuando se consigue esto, ya no existe peligro alguno, puesto que el objeto ha dejado en el artista una huella imborrable.(18)
C APITOLO
PABLO P ICASSO (1881–1973)
VII
Funzioni differenziabili tra spazi vettoriali
Per dare un fondamento teorico a molti risultati enunciati, ma non dimostrati, nel capitolo precedente, e in vista delle applicazioni all’ottimizzazione con più vincoli ed alle equazioni differenziali, è necessario approfondire lo studio delle funzioni fra gli spazi euclidei. Adotteremo ora un punto di vista un po’ più astratto, rivolgendo la nostra attenzione non soltanto alle singole funzioni ma agli insiemi di funzioni, in cui verranno definite diversi tipi di strutture. L’Analisi Funzionale è proprio la disciplina matematica che studia gli insiemi di funzioni in cui siano definite opportune strutture algebriche e metriche. Questo passaggio ideale ci porterà per prima cosa ad estendere ad un più vasto contesto degli spazi metrici le usuali nozioni di limite e continuità, e in tale contesto lavoreremo nei § 1, § 2 e § 5; in quest’ultimo introdurremo uno strumento fondamentale, il Teorema delle contrazioni, che permette di dimostrare
A
l’esistenza di soluzioni di moltissimi problemi, fra cui il teorema generale della funzione implicita, il metodo di Newton e soprattutto il Teorema di esistenza ed unicità per le soluzioni delle equazioni differenziali. Nel frattempo, dal § 3 al § 8 (§ 5 escluso), e poi nel § 12, estenderemo la teoria delle approssimazioni lineari alle funzioni da Rn a valori in Rm . Infine, dal § 9 al § 13 (§ 12 escluso) tratteremo la teoria dell’ottimizzazione libera e vincolata per funzioni da Rn a valori in R. La comprensione degli argomenti contenuti in questo Capitolo richiede una buona conoscenza degli aspetti algebrici e geometrici legati alla struttura degli spazi euclidei. In un corso di Analisi avanzato si può partire da questo capitolo per lo svolgimento della teoria mentre dai due capitoli precedenti si può trarre materiale esemplificativo ed esercizi.
bbiamo incontrato più volte e in diversi contesti la nozione di limite (di successioni di numeri reali, complessi, di somme integrali, di funzioni). È ora di introdurre il concetto astratto di limite in spazi metrici, che include tutte le definizioni che già conosciamo. A questo scopo sviluppiamo il concetto di distanza in uno spazio metrico, di intorno sferico, e le nozioni di base connesse.
332
Funzioni differenziabili tra spazi vettoriali
§ 1. Spazi metrici (VII.1) Definizione. Sia X un insieme; chiamiamo distanza una funzione d : X × X → R che soddisfa, per ogni x, y, z ∈ X, le relazioni seguenti ① d(x, y) ≥ 0
e
d(x, y) = 0 ⇔ x = y
(positività);
② d(x, y) = d(y, x)
(simmetria);
③ d(x, y) ≤ d(x, z) + d(z, y)
(disuguaglianza triangolare).
Allora X si dice spazio metrico con distanza (o metrica) d e viene indicato con (X, d). Uno spazio metrico è dunque un qualunque insieme (di numeri, di funzioni, etc.) in cui è possibile valutare la distanza tra due elementi. Vediamo alcuni esempi. (VII.2) Esempio (Distanza euclidea). ➔ In R: q ➔ In R2 : d(x, y) = (x1 − y1 )2 + (x2 − y2 )2 . ➔ In Rn :
v t n X
d(x, y) = i=1
d(x, y) = |x − y|.
(xi − yi )2 .
In R la disuguaglianza triangolare
per la distanza euclidea non è altro che la disuguaglianza triangolare del valore assoluto. In Rn invece discende dalla disuguaglianza di CauchySchwarz, incontrata nel Capitolo IV a pagina 178.
(VII.3) Esempio. Grazie alla corrispondenza tra R2 e C possiamo anche definire una distanza tra due numeri complessi z e w: p d(z, w) = (z1 − w1 )2 + (z2 − w2 )2 = |z − w|, dove z1 e w1 sono le parti reali di z e w, z2 e w2 quelle immaginarie.
(VII.4) Esempio. Si possono definire distanze su Rn diverse da quella euclidea, ad esempio (rimandiamo la verifica all’Esercizio 1 ) d1 (x, y) =
n X n=1
|xi − yi | oppure d∞ (x, y) = max |xi − yi | .
i=1,...,n
Per questa ragione lo spazio metrico viene definito dalla coppia (X, d) e non dal solo insieme X. (VII.5) Esempio. Consideriamo ora l’insieme X = C(I) delle funzioni a valori in R, continue su I ⊂ R e limitate. X è uno spazio metrico con la distanza, detta distanza dell’estremo superiore d∞ ( f, 1) = sup| f (x) − 1(x)|. x∈I
Tutte queste distanze sono diver-
se: ad esempio se scegliamo p = √ (1, 1) ∈ R2 abbiamo d(0, p) = 2, d1 (0, p) = 2, d∞ (0, p) = 1. In ogni caso, quando non specificato diversamente, in Rn consideriamo sempre la distanza euclidea.
§ 2. Successioni, limiti e continuità in (X, d).
333
Le proprietà della distanza discendono direttamente da quelle della distanza euclidea in R, per cui lasciamo la loro verifica al Lettore. Se I è un intervallo chiuso e limitato, le funzioni in C(I) sono certamente limitate e, grazie al Teorema di Weierstrass, d∞ ( f, 1) = max| f (x) − 1(x)|.
x∈I
(VII.6) Esempio. In C([a, b]) possiamo definire anche un’altra struttura di spazio metrico. Definiamo la metrica integrale Z b | f (x) − 1(x)| dx. d1 ( f, 1) =
La
verifica che si tratta di una distanza è lasciata al Lettore.
a
La distanza d1 misura lo scarto medio tra due funzioni. Due funzioni possono essere vicine nella metrica integrale pur essendo lontane rispetto a quella dell’estremo superiore, purché l’area racchiu sa fra i due grafici sia piccola.
La
verifica che si tratta di una distanza è lasciata al Lettore.
(VII.7) Esempio. In C([a, b]) possiamo definire la distanza integrale !1/2 Z b 2 | f (x) − 1(x)| dx d2 ( f, 1) = a
che misura lo scarto quadratico medio tra due funzioni. Come abbiamo visto nell’Esempio (IV.36) a pagina 178, in questo caso la distanza tra due funzioni è uguale alla norma definita tramite il prodotto scalare della loro differenza. Un approfondimento sulle relazioni fra i concetti di distanza, norma e prodotto scalare si trova a pagina 334.
F VII.1: le funzioni rappresentate sono “vicine” rispetto alla distanza integrale d1 , ma non rispetto a quella dell’estremo superiore.
§ 2. Successioni, limiti e continuità in (X, d). Fissato un elemento x0 di uno spazio metrico (X, d) ed un numero r > 0, consideriamo i punti di X che si trovano ad una distanza minore di r da x0 . (VII.8) Definizione. L’insieme Br (x0 ) = {x ∈ X : d(x, x0) < r} (con r > 0) si chiama palla aperta, o disco aperto o intorno sferico, o semplicemente intorno del punto x0 . In generale, un sottoinsieme U di (X, d) è un intorno del punto x0 se esiste una palla aperta Br (x0 ) interamente contenuta in U. (VII.9) Esempio. In X = R3 munito della distanza euclidea gli intorni sferici sono effettivamente delle sfere. In X = R, l’intorno sferico Br (x0 ) non è altro che il segmento (x0 −r, x0 +r), mentre, nel caso bidimensionale X = R2 , Br (x0 , y0 ) è il disco aperto di raggio r centrato in (x0 , y0 ).
Le
palle aperte in spazi metrici possono aver le forme più svariate, come si osserva dagli Esercizi 1 e 4. Introdotto a pagina 250.
334
Funzioni differenziabili tra spazi vettoriali
Distanze, norme e prodotti scalari Come è stato già messo in luce nel Capitolo III, vi è uno stretto legame tra le definizioni di distanza euclidea in Rn e quella di norma di un vettore di Rn . In Rn , infatti, disponiamo, oltre alla struttura di spazio metrico, di quella di spazio vettoriale. Parleremo di spazio normato tutte le volte che in un dato spazio vettoriale è definita una norma. Come abbiamo visto nella Definizione (IV.39), una norma è una funzione k·k : X → [0, +∞) che verifica le proprietà: ① kxk = 0 ⇐⇒ x = 0; ② k(λx)k = |λ|kxk, ∀ λ ∈ R, x ∈ X; ③ kx + yk ≤ kxk + kyk, ∀ x, y ∈ X. È elementare verificare che data una norma k·k in uno spazio vettoriale X, allora è possibile definire la distanza indotta dalla norma, dove la distanza tra due elementi è la norma della loro differenza: dX (x, y) = kx − ykX ,
come si vede nell’Esercizio 2 . Se invece abbiamo uno spazio metrico (X, dX ) dotato anche di una struttura di spazio vettoriale tale che la sua distanza dX soddisfi le ulteriori proprietà ➔ dX (x + z, y + z) = dX (x, y), (invarianza per traslazioni) ➔ dX (λx, λy) = |λ|dX (x, y), ∀x, y ∈ X, (omogeneità per dilatazioni).
per ogni x, y, z ∈ X e λ ∈ R, allora possiamo definire su X una norma, kxkX , come kxkX = dX (x, 0).
Rimandiamo all’Esercizio 3 per la verifica di questo fatto. Ad esempio, nello spazio vettoriale C([a, b]), sia la distanza dell’estremo superiore che le metrica integrale d1 permettono di definire due diverse norme per una funzione continua Z b k f k∞ = max| f (x)| e k f k1 = | f (x)| dx. x∈[a,b]
a
Talvolta in uno spazio vettoriale è possibile definire un prodotto scalare, come già visto nel Capitolo IV, § 3; ad esso è associata naturalmente una norma definita come p kxk = hx, xi .
Un tipico esempio di prodotto scalare che non sia quello standard in Rn è, in C[a, b], il prodotto Z b f (x)1(x) dx , h f, 1i = a
cui è associata la norma !1/2 Z b f (x)1(x) dx . k f k2 = a
A tal proposito si veda anche l’Esempio (VII.7).
(VII.10) Esempio. Consideriamo X = C([a, b]) munito della distanza dell’estremo superiore (Esempio (VII.5)) e fissiamo f ∈ X; l’intorno sferico di raggio r di f è n o Br ( f ) = 1 ∈ C([a, b]) : sup[a,b] | f (x) − 1(x)| < r cioè in Br ( f ) si trovano quelle funzioni continue su [a, b] il cui grafico è contenuto nella porzione di piano delimitata dalle curve f (x) − r ed f (x) + r, al variare di x in [a, b]. Stabilita la nozione di intorno sferico, possiamo agevolmente definire, come già fatto per il caso del piano cartesiano, quella di punto interno, esterno, di frontiera e di accumulazione di un sottoinsieme dato e, di conseguenza, di insiemi aperti e chiusi. Ricordiamo infine la nozione di insieme limitato. (VII.11) Definizione. Un sottoinsieme D di uno spazio metrico X è limitato se esiste una palla aperta in cui D è interamente contenuto: ∃r > 0, x0 ∈ X : D ⊂ Br (x0 ).
Si
vedano le definizioni a pagina 252.
§ 2. Successioni, limiti e continuità in (X, d).
335
F VII.2: a sinistra e al centro sono rappresentati gli intorni sferici dei punti (x0 , y0 ) e (x0 , y0 , z0 ) di raggio r in R2 e R3 rispettivamente. Il caso tridimensionale giustifica la locuzione «intorno sferico». A destra invece, l’intorno di raggio r della funzione f rispetto alla distanza dell’estremo superiore: le funzioni 1 ∈ Br ( f ) hanno il grafico contenuto nella striscia ( f (x) − r, f (x) + r), x ∈ [a, b].
Grazie alla nozione di distanza possiamo parlare di convergenza di una successione di elementi di uno spazio metrico (X, d). (VII.12) Definizione. Diciamo che la successione xn nello spazio metrico (X, d) converge al limite x¯ ∈ X se ¯ = 0, lim d(xn , x)
n→+∞
Come già osservato, (R, d) è uno spazio metrico quando d(x, y) = |x − y|. Ricordiamo che, per una successione xn di numeri reali, si ha conver¯ = genza al limite x¯ se limn→+∞ |xn − x| 0. In altre parole, xn converge ad x¯ se la distanza tra xn e x¯ tende a 0.
o, equivalentemente, ¯ < ε). ∀ε > 0 ∃N : (n > N =⇒ d(xn , x) ¯ Si scrive allora xn → x. Si verifica facilmente (si veda l’ Esercizio 8 ) che se c’è un limite, questo è unico. (VII.13) Esempio. Consideriamo ora una successione di funzioni continue e limitate fn ∈ C(I), con I ⊂ R limitato, e vediamo cosa significa che fn converge a f ∈ C(I), quando dotiamo C(I) della metrica dell’estremo superiore vista nell’Esempio (VII.5). Otteniamo che lim d( fn , f ) = 0 ⇐⇒
n→+∞
lim sup| fn (x) − f (x)| = 0
n→+∞ x∈I
e questa non è altro che la convergenza uniforme di fn a f vista nella Definizione (II.36) a pagina 65! Per questo motivo la metrica dell’estremo superiore viene anche chiamata metrica della convergenza uniforme. (VII.14) Esempio. Muniamo C(−π, π) della metrica integrale d2 ovvero consideriamo come distanza tra due funzioni il loro scarto quadratico medio. Nell’approfondimento a pagina 63 abbiamo discusso il fatto che la successione Fn delle somme parziali n-esime della serie di Fourier associata ad f ∈ C(−π, π) converge in media quadratica ad f , ovvero Z π lim | f (x) − Fn (x)|2 dx = 0. n→+∞
−π
Il concetto di limite di una succes-
sione in uno spazio metrico è strettamente legato a quelli di intorno e di punto di accumulazione. Un pun¯ infatti, è di accumulazione per to x, un insieme se esiste una successione di elementi di questo, xn , tutti diversi da x¯ stesso, convergente a x¯ (si vedano gli Esercizi 9 e 10 a pagina 384).
336
Funzioni differenziabili tra spazi vettoriali
Nello spazio metrico C(−π, π) con metrica d2 questo significa esattamente lim d2 ( f, Fn ) = 0.
n→+∞
Oltre al concetto di limite di successione negli spazi metrici è possibile definire quello di limite di una funzione. Siano (X, dX ) ed (Y, dY ) due spazi metrici, D ⊂ X ed f : D → Y. (VII.15) Definizione. Dato un punto di accumulazione x¯ per il dominio D, diciamo che f (x) converge (o tende) al limite L, per x che tende ¯ se a x, ¯ < δ =⇒ dY f (x), L < ε . ∀ε > 0, ∃ δ > 0 : x ∈ D, 0 < dX (x, x) (VII.16) Esempio (Limiti di funzioni fra spazi euclidei). Riscriviamo la definizione precedente nei casi più significativi per questo volume, vale a dire X = Rn ed Y = R, oppure X = Rn ed Y = Rm . Nel primo caso, esplicitando le distanze euclidee otteniamo che lim f (x) = L ∈ R x→x¯
se per ogni ε > 0 esiste δ tale che
Il passaggio chiave nella definizione ε − δ di limite consiste nel calcolare f in punti arbitrariamente vicini ¯ ma diversi da x¯ stesso. Con ad x, la terminologia introdotta è chiaro che si tratta esattamente dei punti di accumulazione di D.
E
ricordando che la distanza euclidea tra due elementi di Rn non è altro che la norma del vettore differenza (si veda la Definizione (III.15) a pagina 108).
x ∈ D, 0 < kx − xk ¯ < δ =⇒ | f (x) − L| < ε, in perfetto accordo con quanto visto nel Capitolo V per il caso n = 2. Consideriamo ora il caso più generale di una funzione avente n variabili indipendenti ed m dipendenti, del tipo f : D ⊂ Rn → Rm .
Se scriviamo gli elementi di Rn ed Rm in coordinate la scrittura vettoriale y = f (x) diventa y1 f1 (x) f1 (x1 , . . . , xn ) . . .. , . = . = . . . fm (x1 , . . . , xn ) fm (x) ym quindi f può essere interpretata come un vettore di m funzioni scalari (cioè a valori reali), f1 , . . . , fm , le sue componenti. Ne segue che lim f (x) = L ∈ Rm ⇐⇒ ∀ε > 0 ∃δ tale che x→x¯
x ∈ D, 0 < kx − xk ¯ < δ =⇒ k f (x) − Lk < ε, o, in coordinate, p 0 < (x1 − x¯1 )2 + · · · + (xn − x¯ n )2 < δ q ( f1 (x) − L1 )2 + · · · + ( fm (x) − Lm )2 < ε. =⇒
Quando
lo spazio di arrivo è R è possibile applicare le usuali operazioni tra numeri reali ai limiti. È facile vedere che tutti i teoremi relativi alle operazioni fra limiti continuano a valere, ad esempio la somma dei limiti è uguale al limite della somma e così via.
Se
non specificato diversamente, il dominio D della funzione f può essere determinato a partire dalla sua espressione analitica. Tale insieme risulta essere l’intersezione dei domini delle componenti di f , f1 , . . . , fm , a tal proposito si veda l’Esercizio 11 .
§ 2. Successioni, limiti e continuità in (X, d).
337
In realtà per calcolare i limiti per funzioni a valori vettoriali non è veramente necessario considerare le m componenti di f nel loro complesso, grazie al prossimo utile risultato. (VII.17) I limiti di funzioni a valori vettoriali possono essere calcolati componente per componente. In formule lim f (x) = L x→x¯
⇐⇒
lim fi (x) = Li , x→x¯
Si
veda ad esempio l’Esercizio (VII.2) a pagina 371.
i = 1, . . . , m.
Dimostrazione. Iniziamo supponendo che limx→x¯ f (x) = L, cioè che per ogni ε > 0 esista δ tale che 0 < kx − xk ¯ < δ =⇒ k f (x) − Lk < ε. Ma allora, poiché si ha, per ogni componente, q | fi (x) − Li | ≤ ( f1 (x) − L1 )2 + · · · + ( fm (x) − Lm )2 = k f (x) − Lk, per lo stesso δ abbiamo 0 < kx − xk ¯ < δ =⇒ | fi (x) − Li | < ε, i = 1, . . . , m. Per la seconda parte, supponendo che per ogni i valga limx→x¯ fi (x) = Li , fissato ε > 0 scegliamo δi tale che ε 0 < kx − xk ¯ < δi =⇒ | fi (x) − Li | < √ . m Otteniamo che per δ = min{δ1 , . . . , δm } e 0 < kx − xk ¯ < δ si ha r q ε2 ε2 k f (x) − Lk = ( f1 (x) − L1 )2 + · · · + ( fm (x) − Lm )2 < +··· + = ε, m m che implica la tesi.
È naturale, ora che abbiamo a disposizione il concetto di limite, definire la nozione di funzione continua in un punto e in un insieme. (VII.18) Definizione. Dati due spazi metrici (X, dX ), (Y, dY ), e D ⊂ X, f : D → Y si dice continua in x¯ ∈ D se ¯ lim f (x) = f (x). x→x¯
Se f è continua in tutti i punti di D, allora si dice continua in D, e si scrive f ∈ C(D).
Equivalentemente, f è continua in D se ∀x¯ ∈ D e ∀ε > 0, ∃δ > 0 : ∀x ∈ D dX (x, x) ¯ < δ ⇒ dY ( f (x), f (x)) ¯ < ε.
dove δ può dipendere sia da ε che ¯ dal punto x.
Si può facilmente dimostrare una caratterizzazione equivalente della continuità basata sulla convergenza delle successioni.
Si veda l’Esercizio
(VII.19) f è una funzione continua in x¯ se e soltanto se per ogni successione convergente ad x¯ si ha
Per
¯ . lim f (xn ) = f (x)
n→+∞
12 .
distinguere le due definizioni (per quanto equivalenti) si usa dire che le funzioni continue sono continue per successioni, o sequenzialmente continue, e viceversa.
338
Funzioni differenziabili tra spazi vettoriali
(VII.20) Esempio. Una funzione T : D ⊂ X → Y si dice contrazione se esiste una costante positiva α < 1 tale che per ogni x1 , x2 ∈ D vale
dY (T(x1 ), T(x2)) ≤ αdX (x1 , x2 ).
Vogliamo dimostrare che una contrazione è necessariamente continua sul suo dominio. A tale scopo dobbiamo verificare che per ogni x¯ ∈ D vale
La
scelta del nome dovrebbe risultare chiara: applicando T le distanze vengono riscalate di un fattore α strettamente minore di 1, cioè vengono contratte.
¯ lim T(x) = T(x), x→x¯
cioè che per ogni ε > 0 esiste δ tale che ¯ <δ dX (x, x)
=⇒
¯ < ε. dY (T(x), T(x))
Risulta chiaro che basta scegliere δ = ε/α.
(VII.21) Osservazione. Dalla proprietà (VII.17) segue che una funzione f : D ⊂ Rn → Rm è continua se e solo se lo sono tutte le sue componenti. Di conseguenza quelle funzioni vettoriali scritte in termini di funzioni elementari sono continue in ogni punto interno al loro dominio. Per concludere questo paragrafo, osserviamo che, ad una più attenta analisi, le nozioni di limite e di continuità non sono veramente basate su quella di distanza, ma su quella di intorno. Nel linguaggio degli intorni si può dare la seguente definizione equivalente di continuità: una funzione f : D ⊂ X → Y è continua in un punto x¯ di D se la controimmagine di ¯ è un intorno di x¯ (si veda a questo propoun qualunque intorno di f (x) sito l’Esercizio (VII.3)). Quindi per definire i concetti di continuità e di limite non è veramente necessario lavorare in spazi metrici (cioè avere a disposizione la nozione di distanza): è sufficiente lavorare in insiemi in cui siano definite famiglie di intorni di ogni punto. Insiemi con strutture di questo tipo sono detti spazi topologici e il ramo della matematica che li studia è la topologia. Per questo motivo si dice che le nozioni di limite e di continuità sono topologiche e non metriche.
Ricordiamo
che per funzioni elementari intendiamo tutte quelle che si ottengono da combinazioni di somme, prodotti, elevamenti a potenza e funzioni trigonometriche, e loro inverse.
Ricordiamo che in uno spazio me-
trico un intorno del punto x¯ è un insieme che contiene una palla aperta ¯ Br (x).
La controimmagine di un sottoin-
sieme V del codominio di f è definita come f −1 (V) = {x ∈ D : f (x) ∈ V}.
§ 3. Insiemi chiusi e limitati in Rn . Nei prossimi paragrafi prendiamo in esame alcune proprietà fondamentali delle funzioni continue definite su sottoinsiemi chiusi e limitati di Rn , e a valori in Rm ; conviene pertanto iniziare questo paragrafo dimostrando alcune proprietà caratteristiche di tali insiemi. Ci interessiamo in particolare alle successioni contenute in insiemi limitati. (VII.22) Definizione. Diciamo che la successione yk è una sottosuccessione o un’estratta di una successione xn se esiste una successione crescente di interi nk per cui yk = xnk , per ogni k ∈ N.
Una sottosuccessione quindi è una successione che contiene solo una partedegli elementi di xn .
§ 3. Insiemi chiusi e limitati in Rn .
(VII.23) Teorema di Bolzano–Weierstrass. Ogni successione limitata di Rn ammette una sottosuccessione convergente. Il prossimo esempio mostra che, in un generico spazio metrico che non sia Rn , vi possono essere successioni limitate che non posseggono alcuna sottosuccessione convergente. (VII.24) Esempio. Consideriamo la successione {sin nx}n dello spazio X = C([0, 2π]) munito della distanza integrale dell’Esempio (VII.7) !1/2 Z b 2 . d2 ( f, 1) = | f (x) − 1(x)| dx
339
Si tratta di un teorema di fondamentale importanza che, come vedremo nei prossimi paragrafi, sta alla base di una proprietà di cui abbiamo già fatto ampio uso nel capitolo precedente: l’esistenza di massimi e minimi di funzioni continue su insiemi chiusi e limitati enunciata nel Teorema di Weierstrass.
a
Si tratta di una successione limitata: infatti, per ogni n, !1/2 Z 2π √ = π sin2 nx dx d2 (sin nx, 0) = 0
e tuttavia non può avere una sottosuccessione convergente. Per chiarirne il motivo, ragioniamo per assurdo. Se la successione ammettesse una sottosuccessione convergente ad una certa funzione f ∈ X, allora, scelto r = √ π/2, dovremmo trovare un elemento della (sotto)successione, diciamo f1 , diverso da f a distanza da f inferiore ad r. Inoltre, poiché d2 ( f, f1 ) > 0, dovrebbe esistere un secondo elemento f2 della (sotto)successione a distanza da f inferiore a d2 ( f, f1 ). Avremmo perciò d2 ( f1 , f2 ) ≤ d2 ( f1 , f ) + √ d2 ( f, f2 ) < 2r = 2π. Ma f1 e f2 sono elementi della successione, quindi f1 = sin nx e f2 = sin mx per opportuni n ed m, mentre abbiamo, per le formule di ortogonalità viste a pagina 58, !1/2 Z 2π √ 2 d2 (sin nx, sin mx) = (sin nx − sin mx) dx = 2π , se n , m.
Il Lettore attento coglierà, in que-
sto ragionamento, l’importanza del fatto che vi siano infinite funzioni mutuamente ortogonali che formano quindi una base di dimensione infinita, come già osservato nell’ Esempio (IV.89) a pagina 210.
0
Il Teorema di Bolzano–Weierstrass caratterizza completamente i sottoinsiemi chiusi e limitati di Rn : infatti da una parte ogni successione in un insieme chiuso e limitato ammette una sottosuccessione convergente ed il limite appartiene a tale insieme. D’altra parte se un insieme non è limitato, oppure non è chiuso, possiamo facilmente costruire una successione di suoi elementi che non possiede alcuna sottosuccessione convergente (si veda l’Esercizio 18 ).
Infatti un insieme chiuso contiene
tutti i limiti delle successioni in esso contenute.
(VII.25) Teorema di Heine–Borel. Un sottoinsieme K di Rn è chiuso e limitato se e soltanto se ogni sua successione ammette una sottosuccessione convergente ad un limite in K.
È inoltre rilevante, il fatto che uno Uno spazio metrico per cui ogni successione ammette una sottosuccessione convergente viene detto compatto per successioni, o anche sequenzialmente compatto. Il Teorema di Heine–Borel asserisce quindi che gli insiemi compatti di Rn sono tutti e soli i suoi sottoinsiemi chiusi e limitati.
spazio vettoriale normato in cui gli insiemi compatti siano tutti e soli i sottoinsiemi chiusi e limitati ha necessariamente dimensione finita. Per la dimostrazione di questo risultato rimandiamo a [De Marco(1992)].
340
Funzioni differenziabili tra spazi vettoriali
Dimostrazione del Teorema di Bolzano–Weierstrass La dimostrazione di questo risultato si basa su un procedimento di bisezione. Per maggior chiarezza, iniziamo a considerare il caso monodimensionale e osserviamo che una successione limitata di R è certamente contenuta in un intervallo I0 = [−a, a], pur di scegliere a > 0 sufficientemente grande. Consideriamo ora i sottointervalli [−a, 0] e [0, a], chiamiamo I1 uno tra questi contenga infiniti elementi della successione di partenza e chiamiamo i suoi estremi a1 e b1 . L’ampiezza di I1 è quindi a. Iteriamo questo procedimento e dopo N passi otteniamo un intervallo IN = [aN , bN ], contenente infiniti elementi della successione. Per come le abbiamo costruite, aN è una successione crescente, bN è invece decrescente, infatti −a = a0 ≤ a1 ≤ . . . ≤ aN < bN ≤ . . . ≤ b1 ≤ b0 = a;
inoltre l’estremo superiore della successione aN e l’estremo inferiore di bN coincidono, infatti la loro distanza tende a 0, poiché a bN − aN = N−1 . 2 Se chiamiamo x¯ questo elemento allora x¯ ∈ IN , ∀N, ed esiste una sottosuccessione della successione di par¯ Infatti, fissato k ∈ N, se scegliatenza convergente a x. ¯ mo N sufficientemente grande tale che IN ⊂ B1/k (x), allora esistono addirittura infiniti elementi della suc¯ in particolare seleziocessione di partenza in B1/k (x), niamo uno di questi elementi, xnk . La sottosuccessione
¯ xnk risulta quindi essere convergente a x. Consideriamo ora una successione limitata di Rn ; la dimostrazione ricalca perfettamente quella del caso monodimensionale. Anche in questo caso infatti tale successione è contenuta in un cubo n-dimensionale del tipo Q0 = [−a, a] × [−a, a] × . . . × [−a, a], purché a sia sufficientemente grande. Dividiamo ora ognuno degli n intervalli nei due sottointervalli [−a, 0] e [0, a]: Q0 risulta essere l’unione di 2n cubi n-dimensionali ottenuti come prodotto di segmenti del tipo [−a, 0] oppure [0, a]. Almeno uno tra questi n-cubi contiene infiniti elementi della successione di partenza; chiamiamo Q1 tale n-cubo e rinominiamo i suoi lati [a11 , b11 ], . . . , [an1 , bn1 ]. Iteriamo questo procedimento: al passo N abbiamo l’n-cubo a QN = [a1N , b1N ] × . . . × [anN , bnN ] con biN − aiN = N−1 , 2 per ogni i = 1, . . . , n. Le successioni a1N , . . . , anN sono monotone crescenti, b1N , . . . , bnN sono invece monotone decrescenti; inoltre, per ogni i = 1, . . . , n, l’estremo superiore della successione aiN e l’estremo inferiore di biN coincidono. Chiamiamo x¯i questi elementi e consideriamo x¯ = (x¯1 , . . . , x¯n ). Osserviamo che x¯ ∈ QN , ∀N, ed è possibile costruire una sottosuccessione della successione ¯ infatti, fissato un qualdi partenza convergente a x; siasi k ∈ N, se N è sufficientemente grande, allora ¯ ed esistono addirittura infiniti elemenIN ⊂ B1/k (x) ¯ Come prima, possiamo ti della successione in B1/k (x). ¯ selezionare una sottosuccessione convergente a x.
§ 4. Proprietà delle funzioni continue (VII.26) Teorema. Sia f : K ⊂ Rn → Rm una funzione continua. Se K è chiuso e limitato allora anche l’immagine f (K) è chiusa e limitata. Dimostrazione. Secondo il Teorema di Heine–Borel un sottoinsieme di Rm è chiuso e limitato se (e soltanto se) da ogni sua successione si può estrarre una sottosuccessione convergente. Consideriamo dunque una successione yn ∈ f (K) e denotiamo xn una successione di elementi di K tali che f (xn ) = yn . Poiché K è chiuso e limitato, sempre in base al Teorema di Heine–Borel, xn ammette una sottosuccessione convergente xnk → x0 e, grazie alla continuità di f , abbiamo f (xnk ) → f (x0 ), con x0 ∈ K. Nell’ultimo passaggio abbiamo utilizzato la caratterizzazione della continuità enunciata nella Proposizione (VII.19). Detto y0 = f (x0 ) abbiamo trovato una sottosuccessione ynk → y0 .
Ovvero l’immagine attraverso una funzione continua di un insieme compatto è ancora compatta.
Ricordiamo che, per definizione, f (K) = {y ∈ Rm : ∃x ∈ K, y = f (x)}.
§ 4. Proprietà delle funzioni continue
341
Una conseguenza di questo teorema è il ben noto Teorema di Weierstrass dei massimi e minimi.
Da noi più volte invocato per giu-
(VII.27) Teorema di Weierstrass. Ogni funzione reale continua su un insieme chiuso e limitato di Rn è limitata e assume il suo massimo e il suo minimo.
Ovvero esistono −∞ < m ≤ M < +∞ e xm , xM ∈ K tali che, per ogni x ∈ K,
Dimostrazione. Già sappiamo dal teorema precedente che f (K) è un sottoinsieme chiuso e limitato di Rm . Siano m = inf f (K) e M = sup f (K). È elementare il fatto che m ed M siano dei punti di frontiera per f (K) e quindi, essendo questo chiuso, degli elementi di f (K) stesso, cioè il minimo ed il massimo valore.
stificare l’esistenza del minimo o del massimo, ma mai dimostrato finora.
m = f (xm ) ≤ f (x) ≤ f (xM ) = M.
Ma
il Lettore può consultare lo svolgimento dell’Esercizio 6 .
Una funzione continua ha la proprietà che, fissati un punto x¯ ed un ε > 0, si possa trovare un δ > 0 tale che dX (x, x) ¯ < δ =⇒ dY ( f (x), f (x)) ¯ <ε. La corrispondenza ε 7→ δ contiene una informazione preziosa di ordine quantitativo: esso indica infatti quanto dev’essere vicino x a x¯ per essere certi che l’immagine f (x) disti da f (x) ¯ meno di ε. In generale, δ dipende effettivamente da ε, ma anche dal punto x. ¯ Se questo non avviene, diremo che la funzione è uniformemente continua. (VII.28) Definizione. Siano (X, dX ) e (Y, dY ) due spazi metrici. Una funzione f : X → Y è detta uniformemente continua se ∀ε > 0, ∃δ > 0 : dX (x1 , x2 ) < δ =⇒ dY ( f (x1 ), f (x2 )) < ε . (VII.29) Esempio. La funzione 1(x) = x2 è uniformemente continua su (0, 1], mentre non è uniformemente continua su tutto R. Invece la funzione f : (0, +∞) → R, f (x) = 1/x è continua su (0, 1]; tale funzione però non è uniformemente continua su (0, 1]. La verifica di queste affermazioni è lasciata come esercizio (Esercizio (VII.4)). È un fatto di notevole importanza, di cui incontreremo molte applicazioni in questo volume, che le funzioni continue sui sottoinsiemi chiusi e limitati di Rn siano nei fatti uniformemente continue.
Per meglio comprendere questa definizione, proviamo a definire l’oscillazione di f come segue: φ(δ) = sup{dY ( f (x1 ), f (x2 )) : dX (x1 , x2 ) < δ}. Tale funzione ci dice infatti quanto oscilla al massimo il valore della funzione f in una qualunque palla di raggio δ > 0, indipendentemente dal centro della palla stessa. Si tratta di una funzione crescente di δ. La condizione di continuità uniforme equivale a lim φ(δ) = 0 .
δ→0
(VII.30) Teorema di Heine–Cantor. Sia f : K ⊂ Rn → Rm una funzione continua. Se K è chiuso e limitato allora f è uniformemente continua su K. Dimostrazione. Procediamo per assurdo. Supponiamo che K ⊂ Rn sia chiuso e limitato e che f : K → Rm sia continua, ma non uniformemente continua. Allora esiste ε > 0 tale che ∀n ∈ N r {0}, ∃xn , yn ∈ D : kxn − yn k <
1 e k f (xn ) − f (yn )k ≥ ε. n
In
realtà per ogni δ esistono due elementi xδ , yδ ∈ D tali che kxδ − yδ k < δ e k f (xn ) − f (yn )k ≥ ε; in particolare possiamo scegliere δ = 1/n.
342
Funzioni differenziabili tra spazi vettoriali
Compattezza in spazi metrici La proprietà saliente per dimostrare i Teoremi di Weierstrass e di Heine–Cantor è che ogni successione nel dominio ammetta una sottosuccessione convergente. Tale proprietà prende il nome di compattezza per successioni, o anche compattezza sequenziale. È però spesso utilizzato un modo diverso di definire la compattezza, del tutto equivalente, negli spazi metrici, alla compattezza sequenziale. Per cominciare, dobbiamo definire un ricoprimento aperto dello spazio X: si tratta di una famiglia (finita o infinita) di sottoinsiemiSaperti Ai di X, la cui unione sia tutto X, cioè X = i Ai . Un sottoricoprimento finito è un sottoinsieme finito Ai1 , . . . , AiN della famiglia che ancora ricopre X: X = Ai1 ∪ · · · ∪ AiN . Definizione. Uno spazio metrico (X, d) si dice compatto se ogni ricoprimento aperto ammette un sottoricoprimento finito. Il vantaggio di tale definizione è di essere più adatta ad essere estesa al contesto degli spazi topologici, così come quella di continuità (si veda l’osservazione
conclusiva del § 2, a pagina 338). Il teorema seguente assicura l’equivalenza delle due definizioni di compattezza negli spazi metrici. Per la sua dimostrazione rimandiamo a [De Marco(1992)]. Teorema. Uno spazio metrico (X, d) è compatto se e soltanto se è sequenzialmente compatto. Il Teorema (VII.26) e il Teorema di Heine–Cantor si estendono direttamente alle funzioni continue definite su uno spazio metrico compatto. Teorema. Sia f : X → Y una funzione continua fra gli spazi metrici (X, dX ) e (Y, dY ). Se X è compatto allora f (X) ⊂ Y è compatto. Teorema di Heine–Cantor. Sia f : X → Y una funzione continua fra gli spazi metrici (X, dX ) e (Y, dY ). Se X è compatto allora f è uniformemente continua. La dimostrazione di questi teoremi con l’utilizzo della nozione di compattezza (e non di compattezza sequenziale) è posticipata agli Esercizi 19 e 20 . Rimandiamo il Lettore desideroso di ulteriori approfondimenti all’Esercizio 22 per il legame tra le nozioni di completezza (si veda il § 5 di questo capitolo) e quella di compattezza in uno spazio metrico.
La successione xn , contenuta in K, ammette un’estratta convergente xnk → x¯ (grazie al Teorema di Bolzano–Weierstrass). Osserviamo ora che anche la corri¯ infatti spondente estratta ynk della successione yn converge a x, ¯ ≤ kxnk − xk ¯ + kxnk − ynk k kynk − xk e entrambe le quantità a destra sono infinitesime al crescere di nk . Per la conti¯ e f (ynk ) → f (x), ¯ ovvero k f (xnk ) − f (ynk )k → 0 nuità di f abbiamo f (xnk ) → f (x) e quindi k f (xnk ) − f (ynk )k < ε se nk è sufficientemente grande, in contraddizione con quanto assunto.
§ 5. Spazi metrici completi e Teorema delle contrazioni Una tipica strategia per la risoluzione di problemi matematici consiste nel costruire delle approssimazioni via via migliori della soluzione del problema studiato; in altre parole, si ricerca una successione di approssimazioni che converga alla soluzione. In una simile situazione si conoscono gli elementi della successione ma non il suo limite, ed è necessario poter stabilire a priori se la successione converge o meno. Nel campo dei numeri reali R si osserva che gli elementi di una successione xn convergente ad un numero x sono sempre più vicini tra loro: infatti in conseguenza della disuguaglianza triangolare si ha |xn − xm | ≤ |xn − x| + |xm − x| < ε
§ 5. Spazi metrici completi e Teorema delle contrazioni
Connessione Uno spazio metrico (X, d) si dice sconnesso se esistono due sottoinsiemi aperti non vuoti e disgiunti X1 e X2 la cui unione sia X stesso. In questo modo stiamo formalizzando l’idea intuitiva che X è costituito da (almeno) due parti distinte e non comunicanti. Diremo che (X, d) è connesso se non è sconnesso. Questa definizione differisce lievemente da un’altra nozione che esprime ugualmente l’integrità dello spazio metrico (X, d): uno spazio metrico si dice connesso per archi se, dati comunque due punti x0 e x1 in X, esiste una funzione continua γ : [0, 1] → X tale che γ(0) = x0 e γ(1) = x1 . Tale funzione definisce una curva che connette i due punti. In Rn , un insieme connesso per archi è anche connesso, mentre è possibile costruire insiemi connessi esotici che non sono connessi per archi. Si può tuttavia dimostrare, anche se non lo faremo in questo volume, che un insieme aperto è connesso se e soltanto se è connesso per archi. Fa parte della nostra intuizione che una funzione continua trasformi senza produrre strappi i punti del dominio in quelli del codominio. È dunque naturale che essa preservi la connessione. Questo fatto si può formalizzare nel teorema seguente. Teorema. Sia f : X → Y una funzione continua fra gli spazi metrici (X, dX ) e (Y, dY ). Se X è connesso (o connesso per archi) allora f (X) ⊂ Y è connesso (risp. connesso per archi).
Dimostrazione. Notiamo che f è continua a valori nel-
343
lo spazio metrico ( f (X), dY ). Supponiamo per assurdo che f (X) non sia connesso. Allora esistono due insiemi O1 e O2 aperti, non vuoti e disgiunti, la cui unione sia f (X). Per quanto dimostrato nell’Esercizio (VII.3) a pagina 372, X1 = f −1 (O1 ) e X2 = f −1 (O2 ) sono non vuoti, aperti e disgiunti. Quindi X è sconnesso. Se X è connesso per archi, prendiamo due elementi y1 = f (x1 ) e y2 = f (x2 ) in f (X) e congiungiamo x0 e x1 con una funzione continua γ : [0, 1] → X. Notiamo che la funzione composta f ◦ γ è anch’essa una funzione continua (si veda l’Esercizio 15 ) e che f ◦ γ(0) = x0 e f ◦ γ(1) = x1 . Dunque anche f (X) è connesso per archi. Un sottoinsieme X ⊂ R è uno spazio metrico se munito della distanza del valore assoluto. Allora (X, d) è connesso (o connesso per archi) se e soltanto se è un intervallo (aperto, chiuso o semiaperto, limitato o illimitato). In effetti è facile dimostrare che se uno spazio connesso X contiene due numeri reali a e b, allora contiene tutto il segmento [a, b]. Se così non fosse, infatti, potremmo trovare un punto c ∈ (a, b) che non è elemento di X: presi allora gli insiemi X1 = (−∞, c) ∩ X e X2 = (c, +∞) ∩ X, si vede subito che sono aperti, non vuoti e disgiunti. Quindi X sarebbe sconnesso. La connessione per archi si dimostra in modo analogo, osservando che, per il teorema dei valori intermedi, se una funzione continua γ : [0, 1] → R assume i valori a e b allora assume tutti i valori intermedi. Il teorema precedente, dunque, si può considerare a ragione un’estensione del Teorema dei valori intermedi per le funzioni continue.
non appena n e m superano il valore N per cui risulta |xn − x| < ε/2, per ogni n ≥ N. Le successioni che godono di questa proprietà di vicinanza degli elementi si chiamano successioni di Cauchy. La definizione di successione di Cauchy si estende in maniera naturale al caso di successioni in uno spazio metrico qualunque. (VII.31) Definizione. Una successione xn in uno spazio metrico (X, d) si dice di Cauchy, o anche fondamentale, se per ogni ε > 0 esiste N > 0 tale che n, m > N =⇒ d(xn , xm ) < ε. Come abbiamo appena visto nel caso dei numeri reali, è una immediata conseguenza della disuguaglianza triangolare il fatto che, in un qualsiasi
344
Funzioni differenziabili tra spazi vettoriali
spazio metrico, ogni successione convergente è una successione di Cauchy. Dimostreremo a breve che in Rn tutte le successioni di Cauchy convergono. È questo un fatto notevolissimo e, come vedremo, dalle molte conseguenze. Sottolineiamo che, in diversi spazi metrici, ciò non avviene. Consideriamo, ad esempio, nello spazio metrico Q dotato della distanza euclidea d(x, y) = |x − y|, una successione qn ∈ Q che converge ad un numero irrazionale. Essa è di Cauchy, per l’osservazione fatta poco sopra (non vi è alcuna differenza fra l’essere di Cauchy in Q o in R). D’altra parte la successione non ha limite in Q. (VII.32) In Rn tutte le successioni di Cauchy sono convergenti.
Dunque,
Dimostrazione. Osserviamo preliminarmente che ogni successione di Cauchy è limitata: per convincersene è sufficiente prendere ε = 1, nella Definizione (VII.31); in corrispondenza di tale scelta esiste N per cui tutti gli elementi della successione successivi ad N + 1 appartengono alla palla unitaria centrata in xN+1 . Detto
poiché le successioni di Cauchy sono convergenti, la proprietà di essere di Cauchy equivale alla convergenza.
R = max{1, d(x1 , xN+1 ), d(x2 , xN+1 ), . . . , d(xN , xN+1 )}, siamo certi che tutti i termini della successione siano contenuti nella palla di centro xN+1 e raggio R. Pertanto, il Teorema di Bolzano–Weierstrass garantisce ¯ Secondo la definil’esistenza di una sottosuccessione xnk convergente al limite x. zione di limite di una successione, quindi, in corrispondenza di ε > 0 esisterà K ¯ < ε/2. D’altra parte, per la Definiziotale che, per ogni k > K si abbia kxnk − xk ne (VII.31), se n, nk > N0 si avrà kxnk −xn k < ε/2. Dalla disuguaglianza triangolare si ha, se n, nk > N0 e k > K: ¯ ≤ kxn − xnk k + kxnk − xk ¯ < ε/2 + ε/2 = ε. kxn − xk ¯ Tutta la successione converge dunque al limite x.
Consideriamo ora lo spazio metrico C([a, b]) munito della distanza dell’estremo superiore (massimo in questo caso, grazie al Teorema di Weierstrass) e una sua successione di funzioni fn . Analogamente a quanto avviene per i numeri reali, vale il seguente risultato. (VII.33) In C([a, b]) ogni successione di Cauchy rispetto alla metrica della convergenza uniforme è convergente rispetto a tale metrica. Dimostrazione. Dalla definizione sappiamo che ! (1)
∀ ε > 0, ∃ N : n, m > N =⇒ max| fn (x) − fm (x)| < ε x∈[a,b]
Fissiamo x ∈ [a, b] e consideriamo la successione numerica an = fn (x): an risulta essere di Cauchy e grazie alla (VII.32) converge; chiamiamo f (x) il suo limite. In questo modo al variare di x ∈ [a, b] otteniamo una funzione f che è il limite puntuale di fn . Dimostriamo che in realtà la convergenza di fn a f è uniforme. Per questo basta considerare l’equazione (1) a n fissato (maggiore di N) e passare al limite per m → +∞, sapendo che fm (x) → f (x) per ogni x ∈ [a, b]. Si ottiene così ! ∀ ε > 0, ∃ N : n > N =⇒ max| fn (x) − f (x)| < ε , x∈[a,b]
che è proprio la convergenza uniforme di fn a f . La funzione f risulta ora continua grazie al Teorema (II.38) sulla continuità del limite uniforme, pagina 66.
Per
la definizione di sottosuccessione nk → +∞ per k → +∞, quindi nk > N0 per k sufficientemente grande.
§ 5. Spazi metrici completi e Teorema delle contrazioni
345
La proprietà di uno spazio metrico per cui tutte le successioni di Cauchy sono convergenti risulta essere di così grande importanza da meritare una definizione apposita. (VII.34) Definizione. Uno spazio metrico (X, d) per cui ogni sua successione di Cauchy è convergente è detto spazio metrico completo (o di Banach). (VII.35) Osservazione. Come visto nelle proposizioni precedenti, gli spazi euclidei Rn sono completi, così come è completo lo spazio C([a, b]) munito della distanza dell’estremo superiore. Sottolineiamo che la completezza è una proprietà dell’intero spazio metrico (X, d) e non del solo insieme X. Per esempio, lo stesso spazio C([a, b]) non è completo se viene munito di una delle due distanze integrali d1 , oppure d2 . Si vedano gli Esercizi 23 e 24 a pagina 384. L’importanza della completezza di uno spazio metrico emerge nitidamente nella Teoria dei punti fissi. Molti problemi matematici, anche profondamente diversi tra loro, possono essere ricondotti alla ricerca di punti fissi di opportune funzioni fra spazi metrici. Un problema di punto fisso può essere formulato come segue. Consideriamo un insieme X e una funzione T da X in se stesso. Possiamo interpretare l’immagine T(x) come una trasformazione del punto x ∈ X. Si vogliono determinare i punti fissi di T, cioè quei punti che la funzione T trasforma in sé stessi, o, in altre parole, le soluzioni dell’equazione
F VII.3: Stefan Banach (1892-1945). Matematico polacco sostanzialmente autodidatta, attivo nella Scuola matematica di Lwow (Polonia) tra le due guerre. Il suo genio venne casualmente scoperto da Hugo Steinhaus.
T(x) = x. Molti problemi di esistenza di soluzioni di equazioni funzionali, differenziali e integrali si possono formulare come problemi di questo tipo. Per questa ragione risulta di grade utilità poter disporre di un principio di punto fisso, cioè di un teorema che, sotto ipotesi abbastanza generali su T ed X, garantisca l’esistenza, ed eventualmente anche l’unicità, delle soluzioni dell’equazione precedente. Il più celebre di questi teoremi è senz’altro il Teorema delle Contrazioni, o Teorema di Banach, valido per una classe di funzioni, le contrazioni, in spazi metrici completi. La sua popolarità è dovuta sia alla semplicità del principio di esistenza e unicità del punto fisso, sia al metodo costruttivo per determinarlo. Il teorema prende il nome da Stefan Banach, ed è chiamato in Italia anche teorema di Banach–Caccioppoli, in onore di Renato Caccioppoli. (VII.36) Teorema della contrazioni. Sia (X, d) uno spazio metrico completo e T : X → X una contrazione, ovvero ∃ α ∈ (0, 1) : d (T(x1 ), T(x2 )) ≤ αd(x1 , x2 ),
∀x1 , x2 ∈ X.
Allora T ammette un unico punto fisso x¯ ∈ X, vale a dire ¯ esiste un unico elemento x¯ ∈ X tale che Tx¯ = x.
Si
vedano ad esempio lo studio dell’esistenza di una funzione definita implicitamente nel § 12 di questo capitolo o i risultati di esistenza ed unicità per sistemi di equazioni differenziali del Capitolo VIII.
Infatti
la dimostrazione del teorema è basata sulla costruzione di una successione di approssimazioni del punto fisso. La dimostrazione è stata pubblicata per la prima volta da Banach nel 1922 [Banach(1922)]. Caccioppoli dimostrò in modo autonomo questo risultato nel 1930 [Caccioppoli(1930)].
Sono possibili diverse varianti di questo enunciato, che è il più semplice; portiamo ad esempio l’Esercizio (VII.5), a pagina 373.
346
Funzioni differenziabili tra spazi vettoriali
Dimostrazione. Suddividiamo la dimostrazione in tre passi. Passo 1. Costruzione di una successione convergente in X. Scegliamo arbitrariamente un elemento x0 ∈ X e consideriamone l’immagine x1 = T(x0 ), l’immagine dell’immagine x2 = T(x1 ) e, iterando, costruiamo la successione di elementi di X per ogni n ≥ 1.
xn = T(xn−1 ),
Dimostriamo ora che la successione xn è convergente, indipendentemente dalle scelta di x0 . Poiché X è completo, è sufficiente dimostrare che la successione xn è di Cauchy, ovvero che per ogni ε > 0 esiste N tale che d(xn , xm ) < ε per ogni m > n > N. Osserviamo che, poiché T è una contrazione, d(xn , xm ) = d(T(xn−1 ), T(xm−1 )) ≤ αd(xn−1 , xm−1 ) e iterando questa maggiorazione otteniamo d(xn , xm ) ≤ α2 d(xn−2 , xm−2 ) ≤ · · · ≤ αn d(x0 , xm−n ).
Che dice che d(x0 , xm−n ) è minore
Grazie alla disuguaglianza triangolare abbiamo
dell’espressione tra parentesi quadre.
n
d(xn , xm ) ≤ α [d(x0 , x1 ) + d(x1 , x2 ) + · · · + d(xm−n−1 , xm−n )] h i ≤ αn 1 + α + α2 + · · · + αm−n−1 d(x0 , x1 ) = αn
1 − αm−n d(x0 , x1 ). 1−α
A questo punto sfruttiamo il fatto che α ∈ (0, 1) e quindi 1 − αm−n ∈ (0, 1) per ottenere la maggiorazione n
(2)
d(xn , xm ) ≤
α d(x0 , x1 ). 1−α
Concludiamo quindi che, fissato ε > 0, è sufficiente scegliere ! ε(1 − α) m > n > N = logα d(x0 , x1 ) per ottenere d(xn , xm ) < ε. La successione xn è dunque di Cauchy e, grazie alla completezza di X, convergente. Poniamo
Questo
passaggio è cruciale, infatti permette di eliminare la dipendenza da m nella stima!
Infatti αn d(x0 , x1 ) < ε 1−α ε(1 − α) ⇐⇒ αn < d(x0 , x1 ) ⇐⇒ n > logα
ε(1 − α) d(x0 , x1 )
! ,
essendo α < 1, e quindi la funzione logα x decrescente.
x¯ = lim xn . n→+∞
Passo 2. Esistenza di un punto fisso per T. Dimostriamo ora che il limite x¯ individuato nel passo precedente è un punto fisso per T. Per farlo è sufficiente considerare la seguente catena di uguaglianze x¯ = lim xn = lim xn+1 = lim T(xn ) n→+∞
n→+∞
n→+∞
¯ e, grazie alla continuità di T, concludiamo che x¯ = T lim xn = T(x). n→+∞
ˆ Passo 3. Unicità del punto fisso. Supponiamo che T ammetta due punti fissi, x¯ e x. Allora si avrebbe ¯ x) ˆ = d(T(x), ¯ T(x)) ˆ ≤ αd(x, ¯ x) ˆ d(x, ¯ x) ˆ ≤ 0. Poiché 0 < α < 1, ne segue che d(x, ¯ x) ˆ ≤ 0 e dunque da cui (1 − α)d(x, ¯ x) ˆ = 0, ovvero x¯ = x. ˆ d(x,
Dimostrata nell’Esempio (VII.20).
§ 5. Spazi metrici completi e Teorema delle contrazioni
Renato Caccioppoli Renato Caccioppoli, (Napoli 1904-1959), è sicuramente uno dei matematici italiani più importanti della prima metà del Novecento e ha lasciato una ottantina di pubblicazioni scientifiche di grande importanza, profondità e originalità. Contribuì allo sviluppo dell’Analisi funzionale (il teorema di punto fisso di Banach-Caccioppoli), della teoria geometrica della misura (proponendo una nuova definizione di area di una superficie), della teoria delle equazioni differenziali e integrali. Per tutto il ventennio fascista, Renato Caccioppoli fu un antifascista, deciso oppositore dell’imperialismo e della guerra di Etiopia ma ancora più deciso avversario delle banalità, delle volgarità e del provincialismo eletto dal regime a costume nazionale. Nel ’38, durante la visita di Hitler a Napoli, Caccioppoli convinse l’orchestra di un locale a suonare la Marsigliese, inneggiando alla libertà. Per questo reato, rischiava il tribunale speciale: se la cavò, per l’intervento della famiglia, con la reclusione nel manicomio giudiziario. Caccioppoli fu uomo di cultura, non solo matematica. Era un ottimo pianista e nutriva una profonda passione per il cinema: partecipò anche all’organizzazione del Circolo del Cinema, uno dei primi cineforum del dopoguerra italiano. Non di meno, si impegnò a fondo in politica, spesso tenendo comizi e intervenendo con autorevolezza a convegni e manifestazioni indetti dal Partito Comunista. Fu tra i principali animatori dei Partigiani per la Pace, una organiz-
zazione unitaria di democratici, socialisti, comunisti, ma anche cattolici, che si batteva per il disarmo e contro l’appiattimento della politica dell’Europa occidentale nella logica del Patto Atlantico. Agli ultimi giorni precedenti al suicidio di Caccioppoli, è dedicato il film di Mario Martone Morte di un matematico napoletano. «Caccioppoli deve la sua popolarità (che lo accompagnava anche in vita) al personaggio, a quel misto di genio e sregolatezza che ne ha fatto il protagonista di libri, di interviste che rievocano lui e la Napoli a cavallo della guerra, e persino di un bel film di Mario Martone. Così viene tramandata la leggenda del “vestivamo alla Caccioppoli” del logoro trench bianco, sporco, portato in giro per le strade di Napoli con sempre maggior sciatteria, del matematico geniale e insuperabile che si perde nell’alcool, dell’intellettuale colto e raffinato, intransigente e spietato avversario dell’ignoranza e delle banalità, che affida le sue lunghe notti a compagnie non sempre raccomandabili, del borghese illuminato, comunista da sempre che si vede abbandonato dalla moglie che gli preferisce l’importante dirigente del partito.» [A. Guerraggio, La matematica italiana tra le due guerre mondiali Marcos y Marcos, 1998].]
(VII.37) Osservazione. Per determinare il punto fisso di T, possiamo quindi partire da un qualunque elemento x0 dello spazio e considerare la successione delle immagini di x0 attraverso le iterate di T. Per mezzo della disuguaglianza (2) possiamo inoltre stimare l’errore che si commette approssimando il punto fisso x¯ con l’n-esimo elemento della successione, xn ; infatti, utilizzando la continuità della funzione distanza nella sua seconda componente e scrivendo m = n + p con p > 0, p ∈ N, otteniamo n
¯ = lim d(xn , xn+p ) ≤ d(xn , x) p→∞
α d(x0 , x1 ). 1−α
Tale errore risulta dunque dipendere dal punto di partenza x0 , dal valore di α e dall’indice di iterazione n. In particolare, se prendiamo n = 0, possiamo stimare la distanza di un punto x0 dal punto fisso con quella dalla sua immagine T(x0 ): (3)
¯ ≤ d(x0 , x)
1 d(x0 , T(x0)). 1−α
347
Abbiamo costruito
la successione xn = T n (x0 ), dove T n = T ◦ · · · ◦ T, n volte.
Dimostrata nell’Esercizio
14 .
348
Funzioni differenziabili tra spazi vettoriali
§ 6. Linearizzazione Secondo la definizione già data nel capitolo precedente, un funzione è differenziabile in un punto quando è possibile decomporla nella somma di una parte lineare affine nell’incremento ed un termine di errore, che tende comunque a zero più velocemente dell’incremento stesso. Questa nozione trova la sua naturale estensione al caso delle funzioni fra gli spazi euclidei Rn ed Rm . (VII.38) Definizione. Una funzione f : D ⊂ Rn → Rm si dice differen◦
ziabile in x ∈ A = D se esiste un’applicazione lineare L : Rn → Rm tale che
(4)
f (x + h) − f (x) = L(h) + o(khk),
per h → 0.
Tale applicazione lineare prende il nome di differenziale di f in x e si indica con d fx .
Utilizziamo qui entrambe le strut-
ture a noi note su Rn : quella di spazio vettoriale, nel parlare di applicazioni lineari, e quella di spazio metrico, indotta da quella di spazio normato, nel calcolo delle norme e dei limiti.
◦
Ricordiamo che D in dica la parte
interna di D, cioè l’insieme dei suoi punti interni (di modo che, se l’incremento h ∈ Rn è sufficientemente piccolo, si ha x + h ∈ A.
Alla base della definizione vi è dunque la possibilità di approssimare localmente la nostra funzione con un’applicazione lineare. Tale approssimazione deve essere ottimale, fra tutte le possibili approssimazioni lineari, nel senso che l’errore dev’essere infinitesimo di ordine superiore all’incremento stesso (mentre le applicazioni lineari tendono a zero, se non sono identicamente nulle, come l’incremento stesso). (VII.39) Esempio. Sono sempre differenziabili: le funzioni costanti f : Rn → Rm , f (x) = c, per ogni x, il differenziale è in questo caso l’applicazione lineare nulla; le applicazioni lineari L : Rn → Rm , il differenziale coincide, in questo caso, con la funzione stessa (il resto o(h) è ovviamente nullo); le forme quadratiche q : Rn → R, cioè i polinomi omogenei di secondo grado definiti come q(x) = Lx · x =
n X n X
Si veda il Capitolo IV § 5.
ℓi j xi x j ,
i=1 j=1
quando L : Rn → Rn è un operatore lineare autoaggiunto, associato alla matrice di coefficienti ℓi j . In questo caso il differenziale si scrive dqx (h) = 2Lx · h: infatti abbiamo q(x + h) − q(x) = L(x + h) · (x + h) − Lx · x = Lx · x + Lh · x + Lx · h + Lh · h − Lx · x = 2Lx · h + Lh · h = 2Lx · h + q(h) .
Abbiamo quindi scritto l’incremento della funzione come la somma di una parte lineare ed una parte quadratica in h. Ci aspettiamo, ragionevolmente, che la parte quadratica sia infinitesima di ordine superiore al
Cioè
tale che Lx · h = Lh · x, per ogni x e h. Ricordiamo che la matrice associata a tale operatore è simmetrica, si veda a pagina 210.
§ 6. Linearizzazione
349
primo nell’incremento. Per verificare che lim
khk→0
|q(h)| =0, khk
Dimostrata nel Capitolo IV a pagina 178.
ci avvaliamo della disuguaglianza di Cauchy–Schwarz 1/2 1/2 n X n n X n n X n X X X h2i h2j = ℓkhk2 , ℓi j hi h j ≤ ℓi2j i=1 j=1
i=1 j=1
i=1 j=1
avendo posto ℓ = mente
P P n n i=1
2 j=1 ℓi j
1/2
. Da questa disuguaglianza segue facil-
i=1 j=1
|q(h)| 0 ≤ lim ≤ ℓ lim khk = 0 . khk→0 khk khk→0
(VII.40) f è differenziabile in x se e solo se lo è ogni sua componente fi . Inoltre, il differenziale di fi , d fi , non è altro che la i-esima componente di d f , ovvero khk→0
fi (x + h) − fi (x) − Li h =0. khk
Poiché ogni Li è un’applicazione lineare fra Rn ed R avremo una sua rappresentazione, nella base prescelta di Rn , della forma Li (h) = mi1 h1 + · · · + min hn . Dunque possiamo riformulare la definizione di differenziabilità di f in x attraverso l’esistenza di mi1 , . . . , min tali che (5)
lim
khk→0
fi (x + h) − fi (x) − (mi1 h1 + · · · + min hn ) =0, khk
i = 1, . . . , m ,
ovvero fi (x + h) − fi (x) = mi1 h1 + · · · + min hn + o(khk). Ci siamo dunque ricondotti a calcolare i differenziali delle componenti fi , che non sono altro che funzioni di n variabili a valori in R. È dunque opportuno estendere a tale ambito le principali nozioni del calcolo differenziale per le funzioni a valori reali 1 : A ⊂ Rn → R, y = 1(x) = 1(x1 , . . . , xn ), che abbiamo già incontrato nel capitolo precedente, nel caso particolare di due variabili. In modo del tutto naturale possiamo definire la derivata parziale in x, ∂x j 1(x), come limite (per h → 0) del rapporto incrementale ∂x j 1(x) = lim h→0
i=1
j=1
Abbiamo imparato nel Capitolo IV, § 2 come associare ad un’applicazione lineare L da Rn in Rm , fissate due basi in Rn ed Rm , una matrice M con m righe ed n colonne (si veda a pagina 174). Ci proponiamo ora di individuare gli elementi della matrice associata al differenziale L = d fx presente nella definizione di differenziabilità appena vista. Possiamo avvalerci della proprietà (VII.17) che permette di calcolare i limiti componente per componente. Chiamiamo, come al solito, fi le componenti di f , e Li le componenti di L. Stiamo quindi affermando il seguente fatto:
lim
Nella doppia somma abbiamo raccolto i termini e sommato successivamente sui due indici i e j, nel modo seguente: n X n n n X X X h2i h2j = h2i h2j = khk4 .
1(x1 , . . . , x j−1 , x j + h, x j+1 . . . , xn ) − 1(x1 , . . . , xn ) h
,
Questo
impone la scelta di una base in Rm . Quando non specificato, sceglieremo convenzionalmente come base quella canonica (introdotta nell’Esempio (IV.10) a pagina 167).
Osserviamo
infatti che tale limite non è altro che quello della Definizione (VII.38) quando m = 1.
Questi
n numeri saranno esattamente gli elementi della i-esima riga della matrice M.
Vengono spesso usate le notazioni equivalenti ∂ j 1(x),
∂1 (x), ∂x j
1x j (x),
Dx j 1(x).
350
Funzioni differenziabili tra spazi vettoriali
ammesso che esista. Ancora, il gradiente di 1 è il vettore ∇1(x) = ∂x1 1(x), . . . , ∂xn 1(x) , sempre che tutte le derivate parziali esistano, nel qual caso 1 si dice derivabile in x. Se 1 : A ⊂ Rn → R, A aperto, è derivabile e le sue derivate parziali sono continue in A, allora 1 si dice di classe C1 in A e si indica 1 ∈ C1 (A). Chiaramente si può generalizzare anche la definizione di derivata direzionale: se v ∈ Rn è un versore allora Dv 1(x) = lim h→0
Equivalentemente,
otteniamo la derivata parziale derivando la traccia j-esima di 1, cioè la funzione della sola variabile x j che si ottiene fissando tutte le altre variabili.
1(x + hv) − 1(x) . h
A questo punto non è difficile capire chi sono gli elementi della iesima riga di M. Scegliendo infatti nella (5) hk = 0 per ogni k , j prima di eseguire il limite si vede subito che mi j = ∂x j fi (x). (VII.41) Definizione. La funzione f : A ⊂ Rn → Rm , con A aperto, si dice derivabile in x ∈ A se sono derivabili tutte le sue componenti, ovvero se esistono ∂xi f j (x), per ogni i = 1, . . . , n e j = 1, . . . , m. In questo caso si definisce la matrice, con m righe ed n colonne, la cui i-esima riga è il vettore gradiente di fi in x ∂x1 f1 (x) . . . ∂xn f1 (x) ∂ f (x) . . . ∂ f (x) xn 2 x1 2 J f (x) = . . .. .. ∂x1 fm (x) . . . ∂xn fm (x) detta matrice jacobiana di f in x. Se le derivate parziali ∂xi f j (x) sono tutte continue in ogni punto di A, allora f si dice di classe C1 e si indica f ∈ C1 (A). Possiamo quindi concludere che, se f è differenziabile in x, la matrice m × n associata all’applicazione lineare L della Definizione (VII.38) è la matrice jacobiana di f in x e quindi (6)
f (x + h) − f (x) = J f (x)h + o(khk),
per h → 0.
(VII.42) Esempio. Nel Capitolo V abbiamo introdotto le curve parametrizzate, cioè le funzioni r definite su un intervallo a valori in R3 : x(t) r : (a, b) → R3 , r(t) = y(t) . z(t) Se le componenti scalari x, y e z sono derivabili in un punto t ∈ (a, b) possiamo definire la matrice jacobiana di r. Tale matrice ha una unica
Analogamente f è derivabile lungo la direzione v se lo sono tutte le sue componenti. La derivata direzionale di f è quindi un vettore di m componenti Dv f (x) = (Dv f1 (x), . . . , Dv fm (x)).
La matrice jacobiana di f in x viene a volte indicata con la scrittura equivalente c. Quindi f ∈ C1 (A) se e solo se fi ∈ C1 (A) per ogni i = 1, . . . , n.
§ 6. Linearizzazione
351
Ritroviamo quindi la derivata del-
colonna e tre righe e viene tipicamente indicata con la notazione ′ x (t) r′ (t) = Jr (t) = y′ (t) . ′ z (t)
la funzione vettoriale r a suo tempo introdotta nel Capitolo V.
Se invece consideriamo una funzione f definita su un sottoinsieme di Rn a valori in R f : D ⊂ Rn → R,
(x1 , . . . , xn ) 7→ f (x1 , . . . , xn ),
la sua matrice jacobiana si riduce ad una sola riga contenente le derivate parziali di f rispetto alle sue n variabili. Fissato x¯ ∈ D, gli elementi di ¯ (ammesso che esistano) corrispondono a quelli del vettore ∇ f (x), ¯ J f (x) infatti h i ¯ · · · ∂xn f (x) ¯ . ¯ = ∂x1 f (x) J f (x) ◦
Inoltre, se f è differenziabile in x¯ ∈ D allora l’applicazione lineare (il differenziale) L : Rn → R della Definizione (VII.38) è definita da ¯ · h. L(h) = ∇ f (x)
Ci occupiamo ora dei teoremi fondamentali del calcolo differenziale per funzioni f : A ⊂ Rn → Rm , con A aperto. Questi risultati sono l’estensione n-dimensionale dei Teoremi (VI.15), (VI.17) e (VI.18) enunciati (ma solo in parte dimostrati) nel capitolo precedente. Il primo teorema è una condizione sufficiente per la differenziabilità, il secondo invece fornisce tre condizioni necessarie. (VII.43) Teorema. Se f ∈ C1 (A) allora f è differenziabile in ogni x ∈ A. Dimostrazione. Sappiamo che f ∈ C1 (A) se e solo se ogni fi ∈ C1 (A) e, ugualmente, f è differenziabile se e solo se lo sono tutte le sue componenti. Sarà dunque sufficiente dimostrare il teorema nel caso di una funzione f : A ⊂ Rn → R. Dobbiamo perciò dimostrare che lim h→0
f (x + h) − f (x) − ∇ f (x) · h = 0. khk
Fissato h = (h1 , . . . , hn ), definiamo i vettori h1 = (h1 , 0, . . . , 0),
h2 = (h1 , h2 , 0 . . . , 0),
...
hn = h
e riscriviamo il numeratore del limite come f (x + h) − f (x) − ∇ f (x) · h = f (x + hn ) − f (x + hn−1 ) − ∂n f (x)hn =
n X i=2
+.... + f (x + h1 ) − f (x) − ∂1 f (x)
f (x + hi ) − f (x + hi−1 ) − ∂i f (x)hi + f (x + h1 ) − f (x) − ∂1 f (x)
Abbiamo aggiunto e tolto gli n −1 termini
f (x+hn−1 ), f (x+hn−2 ), . . . , f (x+h1 ) e scritto per componenti il prodotto scalare ∇ f (x) · h.
352
Funzioni differenziabili tra spazi vettoriali
Funzioni da C in C. Consideriamo una funzione f definita su un sottoinsieme aperto del piano complesso, Ω, a valori in C f : Ω ⊂ C → C,
z 7→ f (z).
Grazie all’identificazione di un numero complesso con una coppia di numeri reali è possibile associare ad f la funzione F : D ⊂ R2 → C,
(x, y) 7→ F(x, y) = f (z)
con D = {(x, y) ∈ R2 : x + iy ∈ Ω}. Possiamo inoltre introdurre le funzioni u, v : D ⊂ R2 → R (rispettivamente parte reale e parte immaginaria di f ) tali che (7)
finito il limite f (z0 + ξ) − f (z0 ) . lim ξ→0 ξ In tal caso il limite è il numero complesso f ′ (z0 ), la derivata di f in z0 , e si ha f (z0 + ξ) = f (z0 ) + f ′ (z0 )ξ + o(|ξ|), per ξ → 0.
Se chiamiamo a, b le parti reale ed immaginaria di f ′ (z0 ), h, k quelle di ξ e x0 , y0 quelle di z0 , l’ultima formula diventa √ F(x0 +h, y0 +k) = F(x0 , y0 )+(a+ib)h+i(a+ib)k+o( h2 + k2 ). Quindi F risulta essere differenziabile in (x0 , y0 ) e si ha ∂F (x0 , y0 ) = a+ib ∂x
∂F ∂F (x0 , y0 ) = i (x0 , y0 ). ∂y ∂x
e
Sfruttando la notazione (7) otteniamo così
F(x, y) = u(x, y) + iv(x, y).
Il concetto di continuità per funzioni da C in sé si estende in modo del tutto naturale attraverso quello di limite (la distanza tra due numeri complessi è la distanza tra i corrispondenti elementi di R2 ) ovvero f è continua in z0 ∈ Ω se lim f (z) = f (z0 ).
z→z0
Passiamo quindi alla differenziabilità. Essendo ben definita la divisione tra numeri complessi, possiamo dare la definizione tramite il rapporto incrementale e dire che f è C-differenziabile o olomorfa in z0 ∈ Ω se esiste
u y (x0 , y0 ) + ivy (x0 , y0 ) = iux (x0 , y0 ) − vx (x0 , y0 )
e poiché un numero complesso e nullo se e solo se lo sono sia la sua parte reale che quella immaginaria abbiamo (8) ux (x0 , y0 ) = vy (x0 , y0 )
e u y (x0 , y0 ) = −vx (x0 , y0 ).
Le equazioni (8) prendono il nome di equazioni di Cauchy–Riemann. I ragionamenti fatti possono essere percorsi all’inverso per ottenere il seguente risultato: f è olomorfa in z0 se e solo se F è differenziabile in (x0 , y0 ) e valgono le equazioni (8).
Poiché f è di classe C1 , sono di classe C1 , in opportuni intorni di 0, anche le n − 1 funzioni 1i (t) = f (x1 + h1 , . . . , xi−1 + hi−1 , xi + t, xi+1 , . . . , xn ) − ∂i f (x)t per i = 2, . . . , n, per mezzo delle quali possiamo scrivere f (x + hi ) − f (x + hi−1 ) − ∂i f (x)hi = 1i (hi ) − 1i (0), per ogni i. Il Teorema del Valor Medio applicato ad ogni 1i garantisce l’esistenza di ξi ∈ (0, hi ), i = 2, . . . , n tali che f (x + h) − f (x) − ∇ f (x) · h =
n X i=1
1′i (ξi )hi + f (x + h1 ) − f (x) − ∂1 f (x).
Abbiamo quindi la stima k f (x + h1 ) − f (x) − ∂1 f (x)k k f (x + h) − f (x) − ∇ f (x) · hk X ′ ≤ k1i (ξi )k + . khk khk i=1 n
Osserviamo ora che 1′i (t) = ∂i f (x1 + h1 , . . . , xi−1 + hi−1 , xi + t, xi+1 , . . . , xn ) − ∂i f (x)
Infatti 2, . . . , n.
|hi |/khk ≤ 1, per ogni i =
§ 7. Funzioni composte
353
e quindi 1′i (0) = 0 per ogni i. Grazie alla continuità di 1′i e all’esistenza della derivata parziale ∂1 f (x) otteniamo che se khk → 0 tutti i termini dell’ultima espressione tendono a zero e quindi il limite di partenza è nullo.
Omettiamo la dimostrazione del prossimo risultato che lasciamo al Lettore come esercizio. (VII.44) Teorema. Se f è differenziabile in x allora ➔ f è continua in x;
Infatti non è necessario che ∂1 f (x)
sia continua! Il Teorema rimane valido se n−1 derivate sono continue. Il Lettore può trarre spunto dalle dimostrazioni esposte nel precedente capitolo per il caso di funzioni di due variabili, si vedano i Teoremi (VI.17) e (VI.18), rispettivamente a pagina 284 e 285.
➔ f ammette derivate direzionali in x in ogni direzione; ➔ per ogni versore v e ogni componente f j di f si ha Dv f j (x) = ∇ f j (x) · v
(formula del gradiente).
§ 7. Funzioni composte In questo paragrafo ci proponiamo di estendere (e dimostrare) i teoremi visti nel § 5 del Capitolo VI. Consideriamo quindi due funzioni 1 : A ⊂ Rp → Rn
e
vate parziali non implica quella di ogni derivata direzionale; questo fatto è vero quando la funzione è differenziabile (a tal proposito si veda ad esempio l’Esercizio (VI.4) svolto a pagina 313).
f : B ⊂ Rn → Rm
tali che risulti ben definita la funzione composta F : A ⊂ Rp → Rm ,
∇ f j (x) = ∂x1 f j (x), . . . , ∂xn f j (x) . In generale l’esistenza delle deri-
F(x) = f (1(x)).
Nel Capitolo VI abbiamo considerato i casi particolari in cui n = 2, m = 1 e p = 1 oppure p = 2, ci proponiamo ora di considerare p, n, m interi positivi qualsiasi. Confrontando i casi già visti ci aspettiamo che la differenziabilità di f e 1 assicuri quella della funzione composta e che gli elementi della matrice jacobiana di F siano degli opportuni prodotti tra gli elementi delle matrici jacobiane di f e di 1. Precisamente vale il seguente risultato. (VII.45) Teorema. Se 1 e f sono differenziabili (rispettivamente in x e in 1(x)) allora la funzione composta F è differenziabile in x e la matrice jacobiana di F in x è uguale al prodotto JF (x) = J f (1(x)) · J1 (x) Dimostrazione. Ci proponiamo di dimostrare che F(x + h) − F(x) = J f (1(x))J1 (x)h + o(khk),
per khk → 0,
Questo significa che
f deve essere definita almeno sull’immagine di 1. La funzione composta si indica F = f ◦ 1.
Si osservi che JF (x) è una matrice m × p, J f (1(x)) e J1 (x) sono rispettivamente m × n e n × p. Grazie alla proposizione (IV.29) vista nel Capitolo IV a pagina 175, l’applicazione lineare associata alla matrice jacobiana di F, LF , non è altro che la composizione LF = L f ◦ L1 , dove L f e L1 sono rispettivamente le applicazioni lineari associate alle matrici jacobiane J f (1(x)) e J1 (x).
354
Funzioni differenziabili tra spazi vettoriali
per ogni h ∈ Rp tale che x + h sia nel dominio di 1. Riscriviamo l’incremento della funzione F sfruttando prima la differenziabilità di 1 quindi quella di f F(x + h) − F(x) = f 1(x + h) − f 1(x) = f 1(x) + J1 (x)h + o(khk) − f 1(x) = f 1(x) + k − f 1(x) = J f (1(x))k + o(kkk) = J f (1(x))J1 (x)h + J f (1(x))o(khk) + o(kkk).
Concludiamo mostrando che J f (1(x))o(khk)+o(kkk) = o(khk) per khk → 0. In effetti abbiamo lim
J f (1(x))o(khk) = J f (1(x)) · lim J f (1(x)) = 0 khk→0 khk
lim
o(kkk) o(kkk) kkk o(kkk) kJ1 (x)h + o(khk)k = lim = lim . khk→0 kkk khk khk→0 kkk khk khk
khk→0
e khk→0
un’applicazione lineare è certamente continua.
(VII.46) Esempio. Consideriamo una coppia di funzioni differenziabili e
che kkk → 0 non appena khk → 0.
Infatti
Anche quest’ultimo limite è nullo, infatti il secondo fattore rimane limitato mentre il primo tende a 0, poiché si ha kkk → 0 quando khk → 0.
f : Rn → R
Posto k = J1 (x)h+o(khk), abbiamo
r : R → Rn .
Le loro matrici jacobiane, rispettivamente in x ∈ Rn e in t ∈ R, sono di ordine 1 × n e n × 1, ovvero J f (x) è composto da una sola riga, mentre Jr (t) da una sola colonna. A partire da f ed r possiamo definire due funzioni composte: la prima è la funzione F : Rn → Rn , F(x) = r f (x)
Il
secondo fattore è maggiorato dalla quantità
h
o(khk)
J1 (x) khk
+ khk
in cui il primo addendo è limitato (immagine dell’insieme chiuso e limitato {v ∈ Rp : kvk = 1} attraverso un’applicazione lineare) mentre il secondo tende a 0.
Ossia
F = r ◦ f e 1 = f ◦ r. Poiché f ed r sono differenziabili, grazie al Teorema (VII.45), anche F e 1 lo sono.
la cui matrice jacobiana (quadrata di ordine n) è JF (x) = Jr ( f (x)) · J f (x). La seconda invece è la funzione reale di variabile reale 1 : R → R, 1(t) = f (r(t)) la cui derivata è 1′ (t) = J1 (t) = J f (r(t)) · Jr (t). Ricordando la definizione di gradiente e la notazione introdotta nell’Esempio (VII.42) otteniamo quindi 1′ (t) = ∇ f (r(t)) · r′ (t).
Concludiamo questa discussione con l’osservazione che, grazie al Teorema di differenziabilità della funzione composta, altri classici teoremi per il calcolo differenziale di funzioni di una variabile si possono estendere al caso di più variabili. Ad esempio, applicando il Teorema di Lagrange a 1(t) = f (r(t)) e r(t) = ta + (1 − t)b sull’intervallo [0, 1] otteniamo subito il seguente risultato.
⊚ ATTENZIONE! Mentre nel re-
sto dell’esempio il simbolo “ ·” è usato per il prodotto tra matrici, in quest’ultima espressione indica il prodotto scalare tra due vettori.
§ 8. Campi vettoriali
(VII.47) Corollario (Teorema di Lagrange multidimensionale). Se f : A ⊂ Rn → R è di classe C1 e se a e b sono gli estremi di un segmento tutto contenuto in A, allora esiste ξ appartenente a tale segmento in modo che f (b) − f (a) = ∇ f (ξ) · (b − a). Il Lettore è invitato a riflettere sul fatto che il Teorema del valor medio è peculiare per le funzioni scalari. Infatti, quando si considerano funzioni a valori vettoriali il teorema rimane valido per ogni singola componente, ma non è possibile stimare l’incremento della funzione con il valore della sua matrice jacobiana in un punto (si veda ad esempio l’Esercizio 34 a pagina 385). Rimandiamo all’Esercizio 35 per una versione “debole” del teorema valida anche per funzioni vettoriali. Dal corollario discende immediatamente che una funzione il cui gradiente sia sempre nullo è localmente costante, cioè ogni punto ammette un intorno sferico in cui la funzione è costante. Questo non vuol dire esattamente che la funzione è costante, ma quasi: f assume ugual valore su ogni coppia di intorni sferici che abbiano almeno un punto in comune.
355
Spesso indicheremo con [a, b] il segmento di estremi a e b, ovvero [a, b] = {ta + (1 − t)b, t ∈ [0, 1]}.
Dire che esiste ξ appartenente a tale segmento significa dire che esiste t ∈ (0, 1) tale che ξ = ta + (1 − t)b.
Potrebbe
tuttavia assumere valori diversi su palle disgiunte. In effetti la funzione è costante se il dominio è connesso (la definizione di spazio connesso è data nel riquadro di approfondimento a pagina 343).
§ 8. Campi vettoriali Per quanto astratta possa sembrare, la teoria di approssimazione lineare che abbiamo sviluppato per le funzioni da Rn ad Rm ha pesanti ricadute sulle applicazioni. Ne abbiamo già sperimentato qualche primizia nei capitoli precedenti, nei casi n = 1, m = 3 (le curve parametriche) ed n = 2, m = 3 (le superfici parametriche). In questo paragrafo diamo una interpretazione delle funzioni da R3 in se stesso. Tali funzioni prendono spesso il nome di campi vettoriali. (VII.48) Esempio. In fisica sono i grande importanza di campi di forze. Un celebre esempio è costituito dal campo elettrico E, che associa ad ogni punto p di una regione A ⊂ R3 la forza elettrica E(p) che agisce su una ipotetica particella di carica unitaria posta in p. Poiché anche la forza è un vettore di R3 abbiamo E : A ⊂ R3 → R3 . Allo stesso modo, se consideriamo un fluido in moto (ad esempio un gas in una tubatura) possiamo associare ad ogni punto del fluido la velocità che il fluido ha in quel punto in un determinato istante; in questo caso si parla di campo di velocità. Con lo stesso spirito del precedente esempio interpretiamo una funzione di tre variabili a valori in R3 come una relazione che ad ogni punto di un sottoinsieme di R3 associa un vettore tridimensionale (si veda la Figura VII.4).
F VII.4: il campo vettoriale F associa al punto (x, y, z) il vettore F(x, y, z).
Visto che la velocità di una parti-
cella o la forza che agisce su di essa non hanno ragione di essere costanti nel tempo, nelle applicazioni è tipico considerare dei campi variabili nel tempo; in tale caso il campo è funzione di quattro variabili, le tre spaziali ed il tempo stesso.
Questa
interpretazione è in realtà un po’ ambigua, almeno quanto l’identificazione punto–vettore. . .
356
Funzioni differenziabili tra spazi vettoriali
(VII.49) Definizione. Una funzione F : A ⊂ R3 → R3 , F1 (x, y, z) F(x, y, z) = F2 (x, y, z) = F1 (x, y, z) i + F2 (x, y, z) j + F3 (x, y, z) k, F3 (x, y, z)
Tipicamente A sarà un insieme aperto.
con (x, y, z) ∈ A, è detta campo vettoriale. In questo contesto, una funzione f : A ⊂ R3 → R è detta campo scalare, e una funzione F : A ⊂ R2 → R2 campo vettoriale piano. (VII.50) Esempio. Consideriamo un corpo di massa M, posto nell’origine di R3 . Come è noto, tale corpo attrae un secondo ipotetico corpo di massa m, posto in ρ = (x, y, z) , 0, con una forza data dalla legge di gravitazione universale F(ρ) = −
GMmρ . kρk3
Il campo gravitazionale G generato da M è definito da G(ρ) =
GMρ F(ρ) =− , m kρk3
Un campo vettoriale piano sarà quindi una funzione del tipo F(x, y) = F1 (x, y) i + F2 (x, y) j. Chiaramente un campo vettoriale piano può essere visto come un campo vettoriale, costante rispetto a z e con F3 ≡ 0. Infatti, se indichiamo con G la costante di gravitazione universale, abbiamo GMm , kFk = kρk2 e F è orientata nella direzione di ρ, ed in verso opposto.
e le sue componenti sono G1 (x, y, z) = − G2 (x, y, z) = − G3 (x, y, z) = −
GMx x2
+ y 2 + z2 GMy
x 2 + y 2 + z2 GMz x 2 + y 2 + z2
3/2 , 3/2 , 3/2 .
Ad un campo vettoriale F si possono associare due diverse nozioni di “derivata”, costruite combinando opportunamente alcune delle derivate parziali delle componenti, particolarmente significative in questo contesto: una di queste è uno scalare, l’altra un vettore.
Spesso
più significative della matrice jacobiana in quanto tale.
(VII.51) Definizione. Se F = (F1 , F2 , F3 ) è di classe C1 , la sua divergenza è lo scalar div F = ∂x F1 + ∂ y F2 + ∂z F3 , mentre il suo rotore è il vettore che si ottiene dal calcolo del determinante formale j k i ∂ ∂ ∂ rot F = det x y z F1 F2 F3 = ∂ y F3 − ∂z F2 i + (∂z F1 − ∂x F3 ) j + ∂x F2 − ∂ y F1 k.
Se F è un campo vettoriale piano allora le definizioni si semplificano, poiché tanto F3 quanto ∂z F1 e ∂z F2 sono tutte identicamente nulle. Si ha quindi div F = ∂x F1 + ∂ y F2 e
rot F = ∂x F2 − ∂ y F1 k
(in particolare il rotore di un campo piano è perpendicolare al piano che lo contiene).
§ 8. Campi vettoriali
357
(VII.52) Esempio. Applichiamo la definizione appena vista al campo gravitazionale dell’Esempio (VII.50). Per quanto riguarda la divergenza abbiamo, per ρ , 0, ∂x G1 (x, y, z) =
GM(2x2 − y2 − z2 ) 5/2 , x 2 + y 2 + z2
∂ y G2 (x, y, z) =
GM(−x2 + 2y2 − z2 ) 5/2 , x 2 + y 2 + z2
∂z G3 (x, y, z) =
GM(−x2 − y2 + 2z2 ) 5/2 , x 2 + y 2 + z2
e quindi div G = 0. Per quanto riguarda invece il rotore, dobbiamo ancora calcolare ∂ y G1 (x, y, z) = ∂x G2 (x, y, z) = ∂x G3 (x, y, z) =
3GMxy x2
y2
+ + 3GMxy
x 2 + y 2 + z2 3GMxz x 2 + y 2 + z2
e quindi rot G = 0 per ρ , 0.
,
∂z G1 (x, y, z) =
5/2 ,
∂z G2 (x, y, z) =
5/2 ,
∂ y G3 (x, y, z) =
5/2 z2
3GMxz x2
+ y 2 + z2 3GMyz
x 2 + y 2 + z2 3GMyz
5/2 , 5/2 ,
x 2 + y 2 + z2
5/2 ,
Mettiamo in guardia il Lettore: tipicamente divergenza e rotore non sono sempre nulli!
(VII.53) Esempio (Rotazione di un corpo rigido). Sia C un corpo rigido in rotazione attorno all’asse z, con una velocità angolare costante ω. Il punto inizialmente in posizione r = (x, y, z) ha traiettoria r(t) = p (R cos ωt, R sin ωt, z), dove R = x2 + y2 . Perciò la velocità del punto di posizione r = (x, y, z) è v(x, y, z) = (−ωR sin ωt, ωR cos ωt, 0) = −ωyi + ωx j. Detto ω = ωk il vettore rotazione, possiamo scrivere il campo di velocità come v = ω × r. Abbiamo dunque un campo di velocità definito nei punti del corpo C: si verifica immediatamente che rot v = 2ω . In questo semplice caso, dunque, il rotore del campo di velocità è uguale al doppio della rotazione ω. Osserviamo che, nella matrice formale che definisce il rotore, la prima riga contiene i versori fondamentali, cioè dei vettori, la terza riga contiene le componenti del campo, cioè delle funzioni, mentre la seconda degli operatori di derivazione. Volendo portare all’estremo la formalizzazione possiamo introdurre il vettore (formale) ∂x ∇ = ∂ y . ∂z
F VII.5
358
Funzioni differenziabili tra spazi vettoriali
In questo modo otteniamo le seguenti notazioni div F = ∇ · F
e
rot F = ∇ × F,
molto in voga presso i fisici e gli ingegneri (ma tutto sommato anche presso i matematici) per la loro particolare espressività. Per concludere elenchiamo una serie di regole di calcolo che coinvolgono gli operatori di derivazione finora introdotti. La loro dimostrazione è lasciata al Lettore volonteroso, come diretta applicazione delle regole di derivazione per funzioni di più variabili (si veda l’Esercizio 37 a pagina 386). (VII.54) Regola. Dati due campi vettoriali, F = (F1 , F2 , F3 ) e G = (G1 , G2 , G3 ), e due campi scalari, φ e ψ, tutti di classe C1 , valgono le seguenti identità: ➔ div(φF) = (∇φ) · F + φ(div F) ➔ rot(φF) = (∇φ) × F + φ(rot F) ➔ div(F × G) = (rot F) · G − F · (rot G)
Le ultime tre identità valgono se gli argomenti sono almeno di classe C2 . Al Lettore puntiglioso, che potrebbe osservare che non abbiamo ancora parlato di derivate seconde per funzioni a valori vettoriali, basterà sbirciare qui sotto per trovare soddisfazione.
➔ rot(∇φ) = 0 ➔ div(rot F) = 0 ➔ div(∇φ) = ∆φ.
L’operatore di Laplace (o laplaciano) ∆φ è definito come ∆φ = φxx + φyy + φzz
§ 9. Derivate successive Nell’ultima parte di questo capitolo tratteremo i temi dell’ottimizzazione, che riguardano specificamente le funzioni a valori reali. Per questo motivo d’ora in poi restringeremo la nostra attenzione alla generica funzione f : A ⊂ Rn → R. Resta inteso che molti dei risultati che otterremo possono essere estesi alle funzioni a valori vettoriali ragionando componente per componente. Definire le derivate parziali di ordine superiore al primo non pone particolari difficoltà. Se la derivata parziale ∂xi f è una funzione di classe C1 (A), la derivata (parziale) seconda di f rispetto a xi e x j è semplicemente ! ∂2 f ∂ ∂f . = ∂x j ∂xi ∂x j ∂xi Se poi anche quest’ultima è una funzione derivabile, potremo definire le derivate terze ed eventualmente di ordine superiore. Come conseguenza una funzione di n variabili sufficientemente regolare avrà n derivate parziali prime, n2 derivate seconde, n3 derivate terze e così via.
(si veda l’approfondimento a pagina 293).
§ 9. Derivate successive
359
(VII.55) Definizione. Se tutte le derivate parziali fino all’ordine k di f esistono e sono continue in A, si dice che f è di classe Ck e si scrive f ∈ Ck (A). Se f ∈ Ck (A) per ogni intero k allora si dice che f è di classe C∞ (A). Come abbiamo già asserito nel Capitolo VI, § 6, l’apparente ambiguità notazionale per le derivate seconde miste (riguardante l’ordine delle variabili rispetto a cui si esegue la derivazione) viene a cadere non appena tali derivate sono continue, nel qual caso la derivata non dipende dall’ordine di derivazione. (VII.56) Teorema di Schwarz. Sia f ∈ C1 (A). Se esistono in A le derivate parziali miste ∂xi (∂x j f ) e ∂x j (∂xi f ) ed esse sono continue allora sono uguali ∂xi (∂x j f ) = ∂x j (∂xi f ). Dimostrazione. Iniziamo con l’osservare che nella derivazione parziale rispetto ad xi e x j , tutte le altre variabili sono fissate e non giocano alcun ruolo; possiamo dunque ricondurci al caso di una funzione di due sole variabili 1(xi , x j ) = f (x1 , . . . , xn ). Per comodità di notazione scriviamo x = xi e y = x j e quindi siamo condotti dimostrare che ∂x (∂y 1) = ∂y (∂x 1). Fissiamo dunque (x, y) nel dominio di 1 in cui le derivate miste siano continue, e consideriamo un incremento (h, k) ∈ R2 in modo che tutto il rettangolo di vertici (x, y), (x + h, y), (x, y + k) e (x + h, y + k), stia a sua volta nel dominio di 1. Con queste notazioni fissiamo k e definiamo la funzione di una variabile
Senza l’ipotesi di continuità l’uguaglianza non è necessariamente vera, come si può osservare svolgendo l’Esercizio 17 a pagina 327. Se invece f e di classe Ck allora l’ordine di derivazione non conta nelle derivate parziali di ogni ordine fino a k.
φ(h) = 1(x + h, y + k) − 1(x + h, y). Applicando il Teorema di Lagrange a φ sull’intervallo di estremi 0 e h otteniamo φ(h) − φ(0) = φ′ (h1 )h = h ∂x 1(x + h1 , y + k) − ∂x 1(x + h1 , y) per un opportuno h1 . Se ora interpretiamo l’ultima espressione come funzione di k, possiamo nuovamente applicare il Teorema di Lagrange e scrivere (per k1 opportuno) φ(h) − φ(0) = hk∂y (∂x 1(x + h1 , y + k1 )). Applichiamo ora il medesimo ragionamento alla funzione ψ(k) = 1(x + h, y + k) − 1(x, y+k) e successivamente alla sua derivata, vista come funzione di h otteniamo, per h2 , k2 opportuni ψ(k) − ψ(0) = hk∂x (∂y 1(x + h2 , y + k2 )). Osservando che φ(h) − φ(0) = ψ(k) − ψ(0) e scegliendo h, k entrambi non nulli si ha ∂y (∂x 1(x + h1 , y + k1 )) = ∂x (∂y 1(x + h2 , y + k2 )). Passando al limite per h e k che tendono a 0, grazie alla continuità delle due derivate seconde otteniamo la tesi.
Alla luce di questa dimostrazione,
notiamo che le ipotesi del teorema possono essere indebolite: basta richiedere la continuità delle derivate miste in un punto per garantire la loro uguaglianza in quel punto.
360
Funzioni differenziabili tra spazi vettoriali
Come le n derivate parziali prime vengono riunite nel vettore gradiente, così le n2 derivate seconde formano gli elementi della matrice hessiana, quadrata di ordine n 2 2 2 ∂x1 x1 f (x) ∂x1 x2 f (x) . . . ∂x1 xn f (x) ∂2x2 x1 f (x) ... . . . ∂2x2 xn f (x) . H f (x) = .. . .. . 2 2 ... . . . ∂xn xn f (x) ∂xn x1 f (x)
Come
conseguenza del Teorema di Schwarz, abbiamo che se f è di classe C2 allora H f è una matrice simmetrica.
(VII.57) Osservazione. Tenendo presente che la funzione gradiente di una funzione di classe C2 , ∇ f : A ⊂ Rn → Rn è di classe C1 , è un facile esercizio verificare che la matrice hessiana non è altro che la jacobiana del gradiente: J∇ f (x) = H f (x).
§ 10. Formula di Taylor In questo paragrafo estendiamo alle funzioni di più variabili la Formula di Taylor del second’ordine. A questo scopo consideriamo una funzione f : A ⊂ Rn → R di classe C2 , un punto x ∈ A, un incremento h sufficientemente piccolo di modo che il segmento [x, x + h] sia interamente contenuto in A, e la funzione di una variabile 1(t) = f (x + th) ,
Ciò è possibile perché A è aperto.
t ∈ [0, 1].
Utilizzando il Teorema (VII.45) e quanto visto nell’Esempio (VII.46) (con r(t) = x + th) possiamo scrivere la derivata di 1: 1′ (t) = ∇ f (x + th) · h =
n X
∂xi f (x + th)hi .
i=1
Allo stesso modo, applicando di nuovo il Teorema (VII.45) e tenendo presente l’Osservazione (VII.57), otteniamo 1′′ (t) = H f (x + th)h · h =
n X n X
∂2xi x j f (x + th)hi h j .
i=1 j=1
Ora, tenuto conto del fatto che 1 è una funzione di classe C2 su [0, 1], possiamo usufruire della formula di Taylor al second’ordine per le funzioni di una variabile, con il resto di Lagrange: esiste dunque ξ ∈ (0, 1) tale che (9)
1(1) = 1(0) + 1′ (0) +
1′′ (ξ) ; 2
inserendo le espressioni che abbiamo precedentemente ricavato per le derivate di 1, e posto ξ = x + ξh, otteniamo il seguente risultato.
In questo
passaggio utilizziamo il fatto che, dati un vettore costante h ∈ Rn e una funzione v : (a, b) → Rn , allora d (v(t) · h) = v′ (t) · h . dt
§ 10. Formula di Taylor
Le onde elettromagnetiche Indichiamo con E = E(x, y, z, t) e B = B(x, y, z, t) rispettivamente il campo elettrico ed il campo magnetico in un punto di coordinate (x, y, z), misurati nell’istante t. Come è noto, E e B soddisfano le equazioni di Maxwell (utilizzando i teoremi del calcolo vettoriale è possibile mettere in relazione tali equazioni con le leggi “classiche” dell’elettromagnetismo; lo faremo nell’approfondimento a pagina 549). Se ci poniamo in una zona dello spazio vuota, e che non contenga in particolare cariche e correnti, le equazioni di Maxwell si scrivono come div E = 0 rot E = −
∂B ∂t
div B = 0 ∂E , ∂t dove ε0 e µ0 sono due costanti, rispettivamente la costante dielettrica e la permeabilità magnetica del vuoto. Tali costanti provengono dalle leggi di Gauss e di Ampère, e possono essere determinate sperimentalmente. Supponendo che i campi siano di classe C2 possiamo “disaccoppiare” il precedente sistema, cioè ottenere due equazioni ciascuna contenente un solo campo. Ad esempio, derivando l’ultima rispetto a t e sostituendo rot B = ε0 µ0
361
nella seconda otteniamo ε0 µ0 Ett = rot Bt = − rot rot E
(data la regolarità dei campi possiamo usare il Teorema di Schwarz per scambiare l’ordine di derivazione nelle derivate miste). Utilizzando la formula ricavata nell’Esercizio (VII.7) a pagina 375 possiamo scrivere rot rot E = ∇(div E) − ∆E = −∆E
(infatti dalla prima equazione di Maxwell div E = 0). In definitiva E verifica l’equazione Ett − c2 ∆E = 0,
dove abbiamo posto c2 = 1/ε0 µ0 . Con calcoli analoghi si trova che la medesima equazione vale anche per il campo magnetico: Btt − c2 ∆B = 0.
Questa è la versione vettoriale dell’equazione delle onde che abbiamo incontrato nell’approfondimento a pagina 293. Ne deduciamo la possibile esistenza di onde elettromagnetiche, cioè di campi elettrici e magnetici variabili nel tempo, che si propagano nel vuoto √ a velocità c = 1/ ε0 µ0 . Maxwell osservò che, dai rilevamenti sperimentali di ε0 e µ0 , il valore di c è sorprendentemente vicino a quello della velocità della luce nel vuoto. Questo lo spinse a postulare che la luce fosse un particolare tipo di onda elettromagnetica.
(VII.58) Formula di Taylor (con il resto di Lagrange). Sia f : A ⊂ Rn → R una funzione di classe C2 (A). Per ogni coppia di punti x, x + h tali che tutto il segmento [x, x + h] sia contenuto in A, esiste un punto ξ appartenente a tale segmento per cui 1 f (x + h) = f (x) + ∇ f (x) · h + H f (ξ)h · h . 2 Se ora facciamo tendere l’incremento h a zero otteniamo la formula analoga con il resto di Peano. (VII.59) Formula di Taylor (con il resto di Peano). Se f : A ⊂ Rn → R è di classe C2 (A), allora, per ogni x ∈ A, si ha 1 f (x + h) = f (x) + ∇ f (x) · h + H f (x)h · h + o(khk2 ), 2
per khk → 0.
362
Funzioni differenziabili tra spazi vettoriali
Formula di Taylor Per enunciare in modo semplice la formula di Taylor all’ordine k di una funzione di classe Ck (A), è bene introdurre una notazione speciale per le derivate successive: poniamo, dati, al solito, un punto x ed un incremento h, di modo che [x, x + h] ⊂ A, n n X X j j dx f (h) = ··· ∂i ···i f (x)hi1 · · · hi j . 1
i1 =1
j
i j =1
Tali funzioni dell’incremento h prendono il nome di differenziali successivi. Osserviamo che la definizione è compatibile con il caso j = 1, dove il differenziale primo è P in effetti l’applicazione lineare definita da dx f (h) = ni=1 ∂i f (x)hi . Come si verifica facilmente, queste quantità sono le derivate di ordine j in t = 0 della funzione 1(t) = f (x + th). Pertanto, applicando a 1 la formula di Taylor all’ordine k con il resto di Lagrange nell’intervallo [0, 1], otteniamo immediatamente la Formula di Taylor all’ordine k con il resto di Lagrange: f (x + h) =
k j k−1 X dx f (h) dξ f (h) + , j! k! j=1
per un opportuno punto ξ ∈ [x, x+h]. Facendo poi tendere h a zero, il Lettore accorto potrà verificare senza troppe difficoltà che f (x + h) =
j k X dx f (h) + o(khkk ) , j! j=1
per khk → 0 ,
che, al solito, prende il nome di Formula di Taylor con il resto di Peano. Osserviamo che essa, al prim’ordine non è altro che la definizione di differenziabilità: f (x + h) = f (x) + d f (x)(h) + o(khk),
per khk → 0.
Facciamo ancora una ultima osservazione sul significato dei differenziali successivi. Fissato x, ¯ consideriamo un incremento h = x − x: ¯ la funzione j k X dx¯ f (x − x) ¯ Pk (x) = j! j=1 è allora il polinomio di grado k che condivide con f tutte le derivate parziali in x¯ fino all’ordine k. Esso viene detto polinomio di Taylor, e rappresenta la miglior approssimazione polinomiale della funzione nell’intorno del punto x. ¯
Dimostrazione. Utilizzando la formula di Taylor con il resto di Lagrange siamo ricondotti a dimostrare che h i H f (x) − H f (ξ) h · h = o(khk2 ), per khk → 0. Possiamo utilizzare la disuguaglianza di Cauchy–Schwarz, in modo simile a come già fatto a pagina 349 per il calcolo del differenziale di una forma quadratica: h i H f (x) − H f (ξ) h · h ≤ εkhk2 , dove abbiamo posto 1/2 n X n X 2 2 2 ε = ∂xi x j f (x) − ∂xi x j f (ξ) . i=1 j=1
Si osservi infine che ε tende a zero per h → 0: infatti il punto ξ converge a x e, per ipotesi, tutte le derivate parziali sono continue.
§ 11. Ottimizzazione libera La teoria dell’ottimizzazione studia gli estremi locali e globali di una funzione sul suo dominio. Ricordiamo che se f è definita su un sottoinsieme
§ 11. Ottimizzazione libera
363
D ⊂ Rn allora il punto x¯ ∈ D è di massimo locale (rispettivamente minimo locale) se f (x) ¯ ≥ f (x) (rispettivamente f (x) ¯ ≤ f (x)), per ogni x ∈ D sufficientemente vicino a x. ¯ Il punto di estremo si dice stretto se la disuguaglianza vale in senso stretto, e globale se vale su tutto D. Quando si parla di ottimizzazione libera si intende che la ricerca degli estremi avviene nell’interno di D: in tal caso il punto è “libero” di variare in tutto un intorno sferico, contrapponendola all’ottimizzazione vincolata, che analizzeremo fra breve, dove il punto è soggetto a vincoli, tipicamente espressi da una o più equazioni (o disequazioni) del tipo Gi (x) = 0. Come prima osservazione se x¯ è un punto di estremo locale interno al dominio vale la diretta estensione multidimensionale del Teorema di Fermat. ◦
(VII.60) Teorema. Se x¯ ∈ D è un punto di estremo locale per f , e f è differenziabile in x, ¯ allora ∇ f (x) ¯ = 0. Dimostrazione. Per ogni i fissato, consideriamo una traccia di f , cioè la funzione di una variabile 1(xi ) = f (x¯1 , . . . , x¯i−1 , xi , x¯i+1 , . . . , x¯n ); per ipotesi 1 ha un estremo locale in x¯i . Osserviamo inoltre che, poiché il punto x¯ è interno al dominio, tale traccia è definita almeno in un intervallo aperto contenente x¯i ; sappiamo inoltre che 1 è derivabile in tale punto, quindi (per il Teorema di Fermat) 1′ (x¯i ) = 0, ¯ = 0 per ogni i. ovvero ∂xi f (x)
(VII.61) Definizione. Se ∇ f (x) ¯ = 0 il punto x¯ viene detto punto critico o stazionario per f . Il teorema precedente pone dunque l’essere punto critico come condizio◦
ne necessaria affinché x¯ ∈ D sia un punto di estremo. Sappiamo tuttavia non tutti i punti critici sono massimi o un minimi locali. Un punto critico che non è né di massimo né di minimo locale viene detto punto di sella (o colle). Come già nel caso delle funzioni di una variabile, la Formula di Taylor al secondo ordine è uno strumento di grande utilità quando ci si pone il problema di stabilire la natura di un punto critico, cioè si vuole riconoscere se un punto critico è un massimo o un minimo locale, oppure un punto di sella. Supponiamo dunque che la funzione sia di classe C2 e consideriamo il suo sviluppo d Taylor al second’ordine nel punto critico. Poiché ∇ f (x) ¯ = 0, otteniamo f (x¯ + h) − f (x) ¯ =
1 H f (x)h ¯ · h + o(khk2 ), 2
per khk → 0.
Per definizione siamo in presenza di un minimo (rispettivamente massimo) locale quando il primo membro della precedente equazione risulta non negativo (rispettivamente non positivo), se l’incremento h è sufficientemente piccolo. Possiamo ragionevolmente immaginare che il termine o(khk2 ) possa essere trascurato per h piccolo: in tal modo siamo ricondotti a studiare il segno della forma quadratica q(h) = H f (x)h ¯ · h.
Come
il Lettore ben sa sinonimi spesso usati sono estremo relativo ed estremo assoluto.
364
Funzioni differenziabili tra spazi vettoriali
A questo scopo ricordiamo che, secondo la Definizione (IV.72), la forma quadratica q(x) è definita positiva se per ogni x , 0 si ha q(x) > 0, è definita negativa se per ogni x , 0 si ha q(x) < 0 ed è indefinita se esistono h1 e h2 tali che q(h1 ) < 0 < q(h2 ). È dunque il segno della forma quadratica q a determinare la natura del punto critico: difatti vale il teorema seguente, che riprende, estendendolo, il risultato già enunciato nel caso delle funzioni di due variabili, a pagina 298.
Le
forme quadratiche sono state studiate nel Capitolo IV, § 5.
(VII.62) Test dell’hessiana. Se f è di classe C2 in A e x ∈ A è un suo punto critico allora, detta q la forma quadratica associata alla matrice hessiana q(h) = H f (x)h ¯ · h, ➔ q definita positiva
=⇒
x¯ è di minimo stretto;
➔ q definita negativa
=⇒
➔ q indefinita
x¯ è di sella.
=⇒
x¯ è di massimo stretto;
Dimostrazione. Iniziamo a dimostrare il primo punto. Per quanto detto dobbiamo vedere che se q è definita positiva e R(h) = o(khk2 ) per h → 0 allora q(h) + R(h) ≥ 0 per h sufficientemente piccolo. Per ipotesi q(h) > 0 per ogni h , 0 quindi in particolare q è strettamente positiva sulla sfera S = {h ∈ Rn : khk = 1}. Essendo S un insieme chiuso e limitato (e q continua), il Teorema di Weierstrass (visto a pagina 341) assicura l’esistenza del ¯ minimo di q, h: ¯ = min q(h), h ∈ S = m > 0 . q(h) Se ora scegliamo un qualunque h , 0 (non necessariamente in S) otteniamo, utilizzando il fatto che la forma quadratica q è un polinomio omogeneo di secondo grado, h h = khk2 q ≥ mkhk2 . q(h) = q khk · khk khk
Otteniamo perciò
! R(h) . q(h) + R(h) ≥ mkhk + R(h) = khk m + khk2 2
2
Ricordando la definizione di “o piccolo” ed il fatto che m è strettamente positivo, è facile mostrare che l’ultima quantità tra parentesi è strettamente positiva se khk è sufficientemente piccola. Questo conclude la dimostrazione del primo punto. Per dimostrare il secondo punto si può procedere in modo analogo. Per quanto riguarda l’ultimo, dal fatto che q è indefinita, otteniamo l’esistenza di due vettori k1 e k2 per cui q(k1 ) > 0 e q(k2 ) < 0. Non è restrittivo supporre che questi due vettori abbiano norma unitaria. Se poniamo h1 = λk1 otteniamo che kh1 k2 = λ2 , perciò possiamo scrivere ! R(h1 ) . q(h1 ) + R(h1 ) = λ2 q(k1 ) + R(h) = λ2 q(k1 ) + kh1 k2
Se q è omogeneo di secondo grado
e λ ∈ R allora q(λx) = λ2 q(x) per ogni x. Infatti h/khk appartiene ad S ed il minimo di q su S vale m. Inoltre, per ogni forma quadratica q, q(λh) = λ2 q(h).
Utilizzando
il Teorema della permanenza del segno.
Oppure
sostituendo f con − f ed utilizzando quanto appena visto.
Stiamo
di nuovo usando il fatto che q(λh1 ) = λ2 q(h1 ), che implica che il segno di una forma quadratica è costante sulle semirette uscenti dall’origine.
§ 12. Il Teorema delle funzioni implicite
365
Ragionando come sopra otteniamo che, per λ sufficientemente piccolo, q(h1 ) + R(h1 ) è strettamente positivo; di conseguenza x¯ non può essere un punto di massimo locale per f . Allo stesso modo, posto h2 = λk2 , otteniamo che per λ sufficientemente piccolo q(h2 )+R(h2 ) è strettamente negativo, perciò x¯ non può essere neppure un punto di minimo locale, il che conclude la dimostrazione.
Per conoscere il segno di una forma quadratica, nota la matrice ad essa associata, possiamo utilizzare il Criterio di Sylvester enunciato a pagina 203, secondo cui una forma quadratica q su Rn è definita positiva se e soltanto se tutti i minori principali d1 , d2 , . . . , dn della matrice associata a q (cioè i determinanti delle sue sottomatrici principali) sono positivi. Ricordiamo che le sottomatrici principali, anche dette sottomatrici di nord-ovest, sono " # a11 a12 a13 a11 a12 a A1 = (a11 ) A2 = A3 = 21 a22 a23 . . . a21 a22 a31 a32 a33 e i minori principali sono i loro determinanti a11 a12 a12 a d3 = a21 a22 d1 = a11 d2 = 11 a21 a22 a31 a32
a13 a23 a33
Con ragionamenti analoghi è pos-
sibile dimostrare condizioni non dissimili da queste: ad esempio se q è semidefinita positiva, il punto critico x¯ non può essere un punto di massimo, ma solo di sella o di minimo. Ne segue che per l’hessiana l’essere semidefinita non è una condizione conclusiva rispetto alla natura del punto critico: in casi del genere sarà necessaria un’analisi più dettagliata (si veda l’Esempio (VI.42) a pagina 300). Ritroviamo in questo criterio il Test dell’hessiana (VI.40) enunciato nel Capitolo VI.
...
La forma quadratica è invece definita negativa se essi alternano il segno partendo dal negativo, cioè se (−1)k dk > 0, per ogni k. Un altro criterio importante è basato sul segno degli autovalori ed è stato enunciato nel Corollario (IV.86) a pagina 209: una forma quadratica è definita positiva (risp. negativa) se e soltanto gli autovalori della matrice associata sono tutti positivi (risp. negativi). È indefinita se ci sono autovalori sia positivi che negativi.
§ 12. Il Teorema delle funzioni implicite Nel Capitolo VI, § 10, abbiamo esaminato sotto quali condizioni un insieme di livello di una funzione di due variabili del tipo 1(x, y) = 0 sia il grafico di una funzione y = y(x) (oppure x = x(y)). I risultati ottenuti erano di natura locale, ovvero, noto un punto appartenente all’insieme di livello, l’esistenza (e unicità) della funzione implicita era garantita in un intorno di tale punto. Ci proponiamo ora di analizzare lo stesso problema quando sia la funzione 1 che le variabili x ed y sono dei vettori. Più precisamente, date m funzioni Gi definite su un sottoinsieme di Rn+m a valori in R, vogliamo stabilire sotto quali condizioni a partire da un sistema del tipo G1 (x1 , . . . , xn , y1 , . . . , ym ) = 0 .. . Gm (x1 , . . . , xn , y1 , . . . , ym ) = 0
Ci
riferiamo al Teorema di Dini, visto a pagina 308.
La funzione implicitamente definita dall’equazione 1(x, y) = 0.
366
Funzioni differenziabili tra spazi vettoriali
sia possibile esplicitare y1 , . . . , ym in funzione di x1 , . . . , xn . Se poniamo G = (G1 , . . . , Gm ), x = (x1 , . . . , xn ) e y = (y1 , . . . , ym ), il sistema precedente può essere scritto nella forma vettoriale
Ovvero
risolvere le m equazioni del sistema rispetto alle variabili y1 , . . . , ym .
G(x, y) = 0 , e ci poniamo il problema dell’esistenza di una funzione implicita y = ϕ(x), definita in un sottoinsieme di Rn e a valori in Rm . Soffermiamoci un momento su un caso particolare, che sappiamo risolvere: quello dei sistemi lineari. Infatti se G1 , . . . , Gm sono lineari nelle loro n + m variabili allora il sistema diviene a11 x1 + · · · + a1n xn + b11 y1 + · · · + b1m ym = 0 .. . am1 x1 + · · · + amn xn + bm1 y1 + · · · + bmm ym = 0 ovvero prende la forma Ax+By = 0, con A e B matrici, la prima di ordine m × n, la seconda quadrata di ordine m. In questo caso abbiamo che se B è invertibile, cioè se det B , 0, allora possiamo esplicitare y in funzione di x, ottenendo y = −B−1 Ax. Nel caso non lineare, in cui la funzione G sia comunque differenziabile, possiamo avvalerci dell’approssimazione lineare della funzione per stabilire l’esistenza della funzione implicita, in un intorno di un punto assegnato. Riusciamo in questo modo, attraverso considerazioni tutt’altro che banali, a dimostrare un risultato di natura locale, del tutto analogo al Teorema di Dini, già dimostrato per le funzioni di due variabili nel capitolo precedente.
Se det(B) , 0, allora per ogni
x∈ Rn possiamo determinare un unico y tale che il sistema sia soddisfatto. Il sistema lineare definisce quindi globalmente la variabile y in funzione di x.
(VII.63) Teorema di Dini per sistemi. Sia G : A ⊂ Rn+m → Rm , con A aperto, una funzione di classe C1 (A), e sia (x0 , y0 ) ∈ A tale che ① G(x0 , y0 ) = 0, ② det D y G(x0 , y0 ) , 0 allora esistono δ > 0, σ > 0 ed una funzione y = ϕ(x) definita in I = Bδ (x0 ) ⊂ Rn a valori in J = Bσ (y0 ) ⊂ Rm , tale che ➔ y0 = ϕ(x0 ); ➔ G(x, y) = 0 in I × J ⇐⇒ y = ϕ(x);
Dy G è la matrice jacobiana di G rispetto alle variabili y1 , . . . , ym , ovvero la matrice quadrata di ordine m ∂ y1 G1 . . . ∂ ym G1 . . .. . D y G = .. ∂ y 1 Gm . . . ∂ y m Gm
➔ ϕ è a sua volta di classe C1 (I, J) e la sua matrice jacobiana vale −1 (10) Jϕ (x) = − D y G(x, ϕ(x)) · Dx G(x, ϕ(x)),
∀x ∈ I.
Dimostrazione. Suddividiamo la dimostrazione in alcuni passi. Passo 1. Riduzione ad un problema di punto fisso. L’invertibilità della matrice Q = Dy G(x0 , y0 ) garantisce che G(x, y) = 0 ⇐⇒ Q−1 G(x, y) = 0 ⇐⇒ y − Q−1 G(x, y) = y.
Si
tratta di dimostrare, in primo luogo, un risultato di esistenza e di unicità (della funzione implicita); nel paragrafo § 5 abbiamo visto un teorema, il Teorema delle Contrazioni, che garantisce l’esistenza ed unicità di un punto fisso per una contrazione di uno spazio metrico completo in se stesso. Tentiamo quindi di applicare questo risultato, o meglio la sua generalizzazione dell’Esercizio 28 .
§ 12. Il Teorema delle funzioni implicite
367
➔ ϕ (h(x)) = x e h ϕ(y) = y, ∀x ∈ Bδ (x0 ) e ∀y ∈ Bσ (y0 ),
Il Teorema di inversione locale Vediamo ora una importante conseguenza del Teorema di Dini. Questo teorema generalizza il risultato valido nel caso monodimensionale: una funzione derivabile e strettamente monotona in un punto risulta essere invertibile in un intorno del punto. La natura di questo risultato, come il Teorema di Dini, è locale. Teorema di inversione locale. Siano h : A ⊂ Rn → Rn , A aperto, una funzione di classe C1 in A e x0 ∈ A. Sia y0 l’immagine di x0 attraverso h, y0 = h(x0 ), e supponiamo che det Jh (x0 ) , 0. Allora esistono δ, σ > 0 e una unica funzione ϕ tali che ➔ h (Bδ (x0 )) = Bσ (y0 ), ➔ ϕ : Bσ (y0 ) → Bδ (x0 ) è di classe C1 in Bσ (y0 ),
➔ Jϕ (y0 ) = (Jh (x0 ))−1 .
La dimostrazione di questo importante teorema è un’applicazione del Teorema di Dini ed è svolta nell’Esercizio 43 . Confrontiamo questo enunciato con quanto noto nel caso lineare: se h è un operatore lineare su tutto Rn , e A è la matrice quadrata associata (che è anche la matrice jacobiana Jh ), abbiamo imparato nel Capitolo IV che l’invertibilità di h è garantita quando il determinante della matrice A è non nullo. Nel caso lineare, si tratta di invertibilità globale, cioè su tutto Rn , mentre in questo Teorema h non è necessariamente lineare e si garantisce l’invertibilità soltanto nell’intorno di un punto fissato.
La ricerca di punti tali che G(x, y) = 0 è quindi equivalente alla ricerca di punti fissi per la seconda componente della funzione T : D ⊂ A ⊂ Rn+m → Rm ,
T(x, y) = y − Q−1 G(x, y),
dove D verrà determinato in seguito (osserviamo che T(x0 , y0 ) = y0 ). Passo 2. Esistenza, unicità e continuità della funzione implicita. Per applicare il Teorema delle Contrazioni a T (più precisamente alla sua seconda componente) dobbiamo innanzitutto dimostrare che esiste L < 1 tale che kT(x, y1 ) − T(x, y2 )k ≤ Lky1 − y2 k per ogni (x, y1 ), (x, y2 ) ∈ D. Vogliamo quindi stimare l’incremento di T nella variabile y; per farlo usiamo il risultato dimostrato nell’Esercizio 35 . Se chiamiamo T j , j = 1, . . . , m, le m componenti di T e poniamo ∇y T j (x, y) = ∂y1 T j (x, y), . . . , ∂ym T j (x, y) , abbiamo kT(x, y1 ) − T(x, y2 )k ≤
√
" m max
Vogliamo
quindi arrivare a dire che per ogni x¯ in un opportuno intorno di x0 esiste un unico y¯ appartenente ad un intorno di y0 tale che T(x, ¯ y) ¯ = y. ¯
La norma è quella euclidea in Rm . è la riga j-esima della matrice D y T valutata in (x, y).
∇y T j (x, y)
# max k∇y T j (x, ξ)k ky1 − y2 k.
j=1,...,m ξ∈[y1 ,y2 ]
La matrice jacobiana di T rispetto a y è −1
Dy T(x, y) = Im − Q Dy G(x, y) e quindi se la valutiamo nel punto (x0 , y0 ) otteniamo una matrice con tutti gli elementi nulli, infatti
Ricordiamo
che il differenziale d un’applicazione lineare è l’applicazione stessa, si veda l’Esempio (VII.39).
Dy T(x0 , y0 ) = Im − Q−1 Q = 0n . Grazie all’ipotesi G ∈ C1 e alla continuità della norma, possiamo determinare r > 0 tale che (per ogni j = 1, . . . , m) √ mk∇y T j (x, y)k ≤ L < 1, per ogni (x, y) ∈ Br (x0 ) × Br (y0 ).
Si veda l’Esercizio 13 alla fine del capitolo.
368
Funzioni differenziabili tra spazi vettoriali
T è dunque una contrazione nella seconda variabile (uniformemente nella prima) nell’insieme D = Br (x0 ) × Br (y0 ); questo però non è sufficiente a garantire l’esistenza di un punto fisso y¯ = y( ¯ x), ¯ per ogni x¯ ∈ Br (x0 ). È infatti necessario che y vari in un insieme completo e, non solo, l’immagine di T deve ancora appartenere a tale insieme. Ricordando che i sottoinsiemi chiusi di Rm sono completi, prendiamo y ∈ Br/2 (y0 ) ⊂ Br (y0 ). Scegliamo inoltre 0 < δ < r tale che (grazie alla continuità di T in x) si abbia kT(x, y0 ) − T(x0 , y0 )k ≤
1−L r, 2
Si veda l’Esercizio
21 .
∀x ∈ Bδ (x0 ).
Mostriamo ora che l’immagine attraverso T dell’insieme Bδ (x0 ) × Br/2 (y0 ) è contenuta in Br/2 (y0 ): kT(x, y) − y0 k = kT(x, y) − T(x0 , y0 )k
≤ kT(x, y) − T(x, y0 )k + kT(x, y0 ) − T(x0 , y0 )k ≤ Lky − y0 k +
r 1−L r 1−L r≤L + r= . 2 2 2 2
Pur
di scegliere x0 sufficientemente vicino a x, possiamo stimare kT(x, y0 ) − T(x0 , y0 )k con la quantità r(1 − L)/2.
Possiamo quindi concludere che per ogni x¯ ∈ Bδ (x0 ) esiste un unico y¯ = y( ¯ x) ¯ ∈ Bσ (y0 ) (con σ > r/2) tale che G(x, ¯ y) ¯ = 0. Inoltre, grazie al Teorema delle Contrazioni dell’Esercizio 28 , la mappa ϕ : Bδ (x0 ) → Bσ (y0 ),
x¯ 7→ ϕ(x) ¯ = y( ¯ x) ¯
è continua. Passo 3. Regolarità della funzione implicita e calcolo della sua matrice jacobiana. Poiché G è di classe C1 , grazie al Teorema (VII.43), deduciamo che è differenziabile nel punto (x0 , y0 ). Quindi, usando la Definizione (VII.38) con h = (x − x0 , y − y0 ), possiamo scrivere G(x, y) = JG (x0 , y0 )(x − x0 , y − y0 ) + o k(x − x0 , y − y0 )k = Dx G(x0 , y0 )(x − x0 ) + Dy G(x0 , y0 )(y − y0 ) + o kx − x0 k + ky − y0 k .
A questo punto scegliamo nella relazione precendente (x, y) ∈ Bδ (x0 ) × Bσ (y0 ) con y = ϕ(x), dove ϕ è la funzione implicita definita al Passo 2. Otteniamo 0 = P(x − x0 ) + Q(ϕ(x) − ϕ(x0 )) + o kx − x0 k + kϕ(x) − ϕ(x0 )k , dove abbiamo posto P = Dx G(x0 , ϕ(x0 )) e Q = Dy G(x0 , ϕ(x0 )). Sfruttando l’invertibilità di Q abbiamo (11) ϕ(x) − ϕ(x0 ) = −Q−1 P(x − x0 ) + Q−1 o kx − x0 k + kϕ(x) − ϕ(x0 )k . La relazione precedente diventa equivalente alla differenziabilità di ϕ in x0 con matrice jacobiana −Q−1 P se mostriamo che Q−1 o kx − x0 k + kϕ(x) − ϕ(x0 )k è un “o piccolo” di kx − x0 k, ossia che Q−1 o kx − x0 k + kϕ(x) − ϕ(x0 )k lim = 0. x→x0 kx − x0 k I dettagli di quest’ultima parte della dimostrazione sono rimandati all’Esercizio 38 alla fine del capitolo.
Ricordando che G(x0 , y0 ) = 0. Abbiamo
spezzato la matrice jacobiana di G in due blocchi, Dx G (contenente le derivate rispetto alla x) e D y G (contenente quelle rispetto ad y). Più in generale, se M è una matrice di ordine m × (n + m), la possiamo scrivere come M = (A|B) con A di ordine m × n e B quadrata di ordine m. È facile convincersi che per ogni v ∈ Rn , w ∈ Rm si ha M(v, w) = Av + Bw.
È inoltre semplice verificare che una funzione è “o piccolo” di kx − x0 k + ky − y0 k se e solo se lo è di k(x − x0 , y − y0 )k.
§ 13. Ottimizzazione vincolata
Il ragionamento fatto per il calcolo di Jϕ (x0 ) può essere ripetuto in ogni punto di I (eventualmente scegliendo δ più piccolo) Senza ulteriori sforzi si ottiene dunque la formula (10) da cui si deduce, essendo G di classe C1 , che ϕ ∈ C1 (I, J).
(VII.64) Osservazione. Il Teorema di Dini viene spesso utilizzato nel modo seguente. Consideriamo ancora G : A ⊂ Rn+m → Rm di classe C1 (A) e un punto x¯ = (x¯ 1 , . . . , x¯ n+m ) ∈ A tale che G(x) ¯ = 0. Se sappiamo che il rango della matrice jacobiana JG (x) ¯ è massimo (cioè uguale a m), allora, grazie al Teorema (IV.64) deduciamo l’esistenza di una sottomatrice di JG (x), ¯ quadrata di ordine m, il cui determinante è non nullo. Ciò significa che è possibile individuare m variabili che soddisfano l’ipotesi ② del teorema. Quindi, se il rango di JG (x) ¯ è massimo, m variabili risultano esplicitabili in funzione delle restanti n in un intorno di x. ¯
369
Infatti,
grazie all’ipotesi ②, det D y G(x, ϕ(x)) , 0 per ogni x in un intorno di x0 , poiché det D y G(·, ϕ(·)) è una funzione continua a valori reali non nulla in x0 .
Visto
nel Capitolo IV a pagi-
na 193.
A tal proposito si veda anche l’Esercizio 40 a pagina 386.
§ 13. Ottimizzazione vincolata Per completare lo studio dell’ottimizzazione di funzioni di più variabili, rimane da analizzare la situazione in cui la funzione da ottimizzare sia soggetta a dei vincoli. Ci proponiamo di dimostrare, con l’ausilio del Teorema di Dini per i sistemi, la versione vettoriale del Teorema dei moltiplicatori di Lagrange, già incontrato per il caso bidimensionale nel Capitolo VI a pagina 305. In quel frangente la ricerca degli estremi di una funzione, definita su un dominio di R2 , veniva vincolata all’insieme di livello di un’altra funzione di due variabili e, sotto opportune ipotesi di regolarità per il vincolo, veniva fornita una condizione necessaria affinché un punto fosse un estremo vincolato. Ora, col fine di rendere più agevole l’utilizzo del Teorema di Dini, consideriamo funzioni definite su domini di Rn+m , n, m ≥ 1, e ci proponiamo di determinarne gli estremi soggetti a m vincoli, a loro volta corrispondenti agli insiemi di livello di m funzioni scalari con n + m variabili. Consideriamo le funzioni f : A ⊂ Rn+m → R
Nel Capitolo VI abbiamo considerato n = m = 1.
e 1 : A ⊂ Rn+m → Rm
con A aperto. Indicheremo con (x, y) un generico punto di Rn+m intendendo x = (x1 , . . . , xn ) ∈ Rn e y = (y1 , . . . , ym ) ∈ Rm . (VII.65) Teorema dei moltiplicatori di Lagrange. Se (x0 , y0 ) ∈ A è un punto di estremo locale per f nell’insieme Z = {(x, y) : 1(x, y) = k ∈ Rm } e det D y 1(x0 , y0 ) , 0 allora esiste λ¯ = (λ¯ 1 , . . . , λ¯ m ) ∈ Rm tale che (12) J f (x0 , y0 ) = λ¯ · J1 (x0 , y0 ).
Equivalente a richiedere che ∇11 (x0 , y0 ), . . . , ∇1m (x0 , y0 ), siano vettori linearmente indipendenti. Ovvero ∇ f (x0 , y0 ) =λ¯ 1 ∇11 (x0 , y0 )+ · · · + λ¯ m ∇1m (x0 , y0 ).
370
Funzioni differenziabili tra spazi vettoriali
Dimostrazione. Iniziamo a considerare il seguente sistema di m equazioni nelle incognite (λ1 , · · · , λm ) = λ Dy f (x0 , y0 ) = λ · Dy 1(x0 , y0 ), corrispondente alle ultime m righe del sistema (12). Essendo det Dy 1(x0 , y0 ) , 0, la matrice Dy 1(x0 , y0 ) è invertibile e tale sistema ammette una ed una sola soluzione h i−1 λ¯ = Dy f (x0 , y0 ) · Dy 1(x0 , y0 ) . Abbiamo quindi dimostrato la tesi per le ultime m righe del sistema (12). Concludiamo dimostrando che il vettore λ¯ appena determinato soddisfa anche le prime n equazioni, ovvero che (13) Dx f (x0 , y0 ) = λ¯ · Dx 1(x0 , y0 ). Per farlo usiamo il Teorema di Dini applicato alla funzione G (traslata di 1) definita come G(x, y) = 1(x, y) − k. Essendo 1, di classe C1 , lo è anche G, inoltre G(x0 , y0 ) = 0 e det Dy G(x0 , y0 ) = det Dy 1(x0 , y0 ) , 0. Dunque G soddisfa le ipotesi del Teorema di Dini nel punto (x0 , y0 ). Esistono quindi due intorni I = Bδ (x0 ), J = Bσ (y0 ), ed una unica funzione ϕ di classe C1 (I, J), tale che ϕ(x0 ) = y0 e G(x, ϕ(x)) = 0, per ogni x ∈ I. Inoltre, la matrice jacobiana della funzione implicita ϕ in x0 è
Infatti 1(x, ϕ(x)) = k, ∀x ∈ I.
h i−1 h i−1 Jϕ (x0 ) = − Dy G(x0 , y0 ) · Dx G(x0 , y0 ) = − Dy 1(x0 , y0 ) · Dx 1(x0 , y0 ). Consideriamo ora la funzione composta F(x) = f (x, ϕ(x)), definita su I; poiché f ha un estremo in (x0 , y0 ), F ha un estremo in vx0 , e il suo vettore gradiente è nullo in x0 . Applicando il Teorema (VII.45) per la derivazione di una funzione composta, otteniamo
strato a pagina 363.
Sostituendo
il valore della jacobiana della funzione implicita, quindi ¯ quello di λ.
0 = JF (x0 ) = Dx f (x0 , y0 ) + Dy f (x0 , y0 ) · Jϕ (x0 ) h i−1 = Dx f (x0 , y0 ) − Dy f (x0 , y0 ) · Dy 1(x0 , y0 ) · Dx 1(x0 , y0 ) = Dx f (x0 , y0 ) − λ¯ · Dx 1(x0 , y0 )
da cui si ricava l’equazione (13).
Grazie al Teorema (VII.60), dimo-
Il Teorema dei moltiplicatori di Lagrange fornisce quindi una procedura per la ricerca dei punti di estremo per una funzione f , di m + n variabili, soggetta ad m vincoli di classe C1 , corrispondenti agli insiemi di livello di altrettante funzioni, 11 = k1 , . . . 1m = km , ancora di m + n variabili. Tali punti devono essere ricercati nell’unione dei seguenti insiemi: ➔ i punti che soddisfano i vincoli e in cui i vettori ∇11 , . . . , ∇1m sono tra loro linearmente dipendenti;
Esercizi
371
➔ i punti critici liberi della funzione Lagrangiana L(x, y, λ) = f (x, y) + λ[1(x, y) − k]. Il sistema che si ottiene imponendo ∇L(x, y, λ) = 0 ha n + 2m equazioni: le prime n + m corrispondono alla (12), le ultime m sono le equazioni del vincolo.
Definita
su un opportuno sottoinsieme di Rn+2m su cui i vettori ∇11 , . . . ∇1m – o meglio, le prime n + m componenti dei punti critici di L – siano linearmente indipendenti.
Esercizi (VII.1) In un qualsiasi insieme X si può definire la distanza banale tra due suoi elementi x, y ∈ X ( 0, se x = y, d(x, y) = 1, se x , y. Dimostrare che si tratta in effetti di una distanza. Stabilire poi quali sono gli insiemi aperti e quelli chiusi. Soluzione. La funzione d è certamente positiva ed è nulla se e solo se x = y. Anche la proprietà di simmetria è banalmente verificata. Per verificare la disuguaglianza triangolare osserviamo che quando x = y il termine a sinistra vale 0, certamente minore della somma di due quantità non negative. Quando invece x , y il termine a sinistra vale 1 e il termine a destra vale almeno uno, infatti almeno una tra le quantità d(x, z) e d(z, y) è non nulla (z non può essere uguale sia ad x che ad y essendo questi due elementi distinti). Preso x0 ∈ X Br (x0 ) = {y ∈ X : d(x0 , y) < r}, quindi se r < 1 la palla contiene solo x0 altrimenti, se r ≥ 1, contiene tutti gli elementi dell’insieme X. Dato D ⊂ X, osserviamo che ogni punto x0 ∈ D è interno: infatti la palla B1/2 (x0 ) è ridotta al solo centro ed è quindi interamente contenuta in D. Tutti gli insiemi sono quindi aperti. Analogamente se x < D allora x è esterno a D. Quindi, per ogni D, ∂D è vuoto e quindi D è anche chiuso. (VII.2) Calcolare il limite lim
(x,y)→(0,0)
f (x, y),
con
xy , |x| + |y| . f (x, y) = p 2 2 x +y
Soluzione. Usiamo la proprietà (VII.17) (a pagina 337) che permette di calcolare separatamente i limiti xy e lim |x| + |y| lim p (x,y)→(0,0) (x,y)→(0,0) x2 + y2 Entrambi i limiti sono nulli, (per il primo si veda l’Esercizio (V.13) svolto a pagina 267) quindi il limite da calcolare è (0, 0).
Secondo la Definizione (VII.1).
372
Funzioni differenziabili tra spazi vettoriali
(VII.3) Dimostrare che se (X, dX ) e (Y, dY ) sono due spazi metrici e f : D ⊂ X → Y, allora sono equivalenti le affermazioni: ① f è continua in D; ¯ sono intorni ② per ogni x¯ ∈ D, le controimmagini di intorni di f (x) ¯ di x; ③ le controimmagini di aperti sono aperti; ④ le controimmagini di chiusi sono chiusi. ¯ allora esiste una palla di Soluzione. ① =⇒ ② Sia V un intorno di f (x), ¯ interamente contenuta raggio ε e centrata in f (x) in V. Dunque, per con ¯ ⊂ Bε f (x) ¯ ⊂ V. Se U è la controimmatinuità, esiste δ tale che f (Bδ (x)) ¯ ⊂ U, quindi U è un gine di V, ovvero U = x ∈ X : f (x) ∈ V , allora Bδ (x) ¯ intorno di x. ② =⇒ ③ Segue dal fatto che gli aperti sono intorni dei punti che vi appartengono. ¯ è un aperto ③ =⇒ ① Sia x¯ ∈ D fissato. Per ogni ε > 0, la palla Bε f (x) ¯ la sua controimmagine, U, è quindi un aperto contenencontenente f (x), ¯ Poiché tutti i punti di un insieme aperto sono te x. punti interni, esiste ¯ ⊂ U, quindi f (Bδ (x)) ¯ ⊂ Bε f (x) ¯ . δ > 0 tale che Bδ (x) ③ ⇐⇒ ④ È sufficiente osservare che se S è un qualsiasi sottoinsieme di Y e T = {x ∈ X : f (x) ∈ S} è la sua controimmagine allora X r T = Y r S.
Infatti
la Definizione (VII.18) di continuità di f in x¯ può essere riscritta nel modo seguente ¯ ⊂ Bε f (x) ¯ . ∀ε, ∃ δ : f (Bδ (x))
(VII.4) Dimostrare che f (x) = 1/x, definita e continua sulla semiretta (0, +∞), non è uniformemente continua sull’intervallo I = (0, 1]. Provare inoltre che 1(x) = x2 , definita e continua su tutto R, risulta essere uniformemente continua su I. Soluzione. Per dimostrare che f non è uniformemente continua su I dobbiamo provare che esiste ε > 0 tale che per ogni δ esistano x1 , x2 ∈ I tali che |x1 − x2 | < δ ma | f (x1 ) − f (x2 )| ≥ ε. Per farlo sfruttiamo il fatto che f diverge a +∞ quando x tende a 0+ . Infatti preso un qualsiasi δ ∈ (0, 1) possiamo scegliere x1 = δ/5 e x2 = δ/10 per cui 1 5 δ 1 − <δ ma |x1 − x2 | = x1 x2 = δ > 5. 10
Si
intende δ l’ampiezza di I.
∈
(0, 1), vista
È quindi sufficiente prendere 0 < ε ≤ 5. Se invece consideriamo la funzione 1(x) = x2 osserviamo che per ogni x1 , x2 ∈ (0, 1] vale la maggiorazione |1(x1) − 1(x2)| = |x21 − x22 | = |(x1 − x2 )(x1 + x2 )|
≤ (|x1 | + |x2 |)|x1 − x2 | < 2|x1 − x2 |.
Quindi per ogni ε > 0 possiamo scegliere δ = ε/2 per cui se |x1 − x2 | < δ allora, per la stima appena vista, |1(x1) − 1(x2 )| < ε.
Infatti x1 , x2 ∈ I e x1 , x2 , quindi entrambi sono minori di 1 e almeno uno dei due è strettamente minore.
Esercizi
373
(VII.5) Sia (X, d) uno spazio metrico completo e T : X → X. Dimostrare che se esiste p ∈ N tale che l’iterata p-esima di T è una contrazione, allora T ammette un unico punto fisso. Soluzione. Grazie al Teorema delle Contrazioni, sappiamo che l’iterata Tp ¯ Per dimostrare l’esistenza di un punto ammette un unico punto fisso, x. fisso per T notiamo che ¯ = x¯ Tp (x)
⇐⇒
¯ = T(x) ¯ T (Tp (x))
¯ = T(x). ¯ Tp (T(x))
⇐⇒
¯ è un punto fisso di Tp . Per l’unicità, necessariamente Quindi anche T(x) ¯ = x¯ e quindi x¯ è anche un punto fiso per T. T(x) Veniamo ora all’unicità. Sapendo che Tp ammette un unico punto fisso, è sufficiente mostrare che se xˆ è punto fisso di T allora lo è anche di Tp . In effetti abbiamo ˆ = xˆ =⇒ T2 (x) ˆ = T(x) ˆ = xˆ =⇒ . . . =⇒ Tp (x) ˆ = T(x) ˆ = x. ˆ T(x) (VII.6) Supponiamo che le funzioni f : R2 → R e 11 , 12 : R → R siano continue. Dimostrare che la funzione integrale Z
12 (x)
h(x) =
f (x, y) dy 11 (x)
è continua su tutto R. Supposto inoltre che anche ∂x f : R2 → R, e 1′1 , 1′2 : R → R siano continue, dimostrare che h ∈ C1 (R) e Z
h′ (x) = f (x, 12 (x))1′2(x) − f (x, 11 (x))1′1(x) +
12 (x) 11 (x)
∂f (x, y) dy. ∂x
Soluzione. Passo 1. Iniziamo considerando il caso in cui le funzioni 11 e 12 sono costanti; h diventa Z
d
h(x) =
c < d, c, d ∈ R.
f (x, y) dy, c
Prendiamo x0 ∈ R e consideriamo il rettangolo R = [x0 − 1, x0 + 1] × [c, d]; grazie al Teorema di Heine-Cantor, f è uniformemente continua su R e, in particolare, ∀ε, ∃ δ : |t| < min{δ, 1} =⇒ | f (x0 + t, y) − f (x0 , y)| < ε, ∀y ∈ [c, d]. Per ogni ε > 0, se scegliamo t tale che |t| < min{δ, 1}, la continuità di h in x0 segue dalla stima Z d |h(x0 + t) − h(x0 )| ≤ | f (x0 + t, y) − f (x0 , y)| dy ≤ |d − c|ε. c
Anche ∂x f risulta essere uniforme-
mente continua su R, useremo questo fatto per dimostrare che h ∈ C1 (R).
374
Funzioni differenziabili tra spazi vettoriali
Per dimostrare la derivabilità di h in x0 consideriamo Z Z d f (x0 + t, y) − f (x0 , y) dy = h(x0 + t) − h(x0 ) =
d
∂f (ξ y , y)t dy c ∂x c # Z d" Z d ∂f ∂f ∂f =t (ξ y , y) − (x0 , y) dy + t (x0 , y) dy. ∂x ∂x c c ∂x
Stiamo
applicando il Teorema di Lagrange alla funzione k(x) = f (x, y), per ogni y fissato in [c, d]. La quantità ξy (dipendente da y) appartiene quindi a (x0 , x0 + t).
∂f
Dalla continuità uniforme di ∂x in R, segue che per ogni ε > 0, pur di scegliere t sufficientemente piccolo, Z d " # Z d ∂f ∂f ∂f ∂f (ξ y , y) − (x0 , y) dy ≤ | (ξ y , y) − (x0 , y)| dy ≤ ε|d − c| ∂x ∂x ∂x ∂x c c e quindi h(x0 + t) − h(x0 ) t # Z d Z d" ∂f ∂f ∂f (ξ y , y) − (x0 , y) dy + (x0 , y) dy = lim t→0 c ∂x ∂x c ∂x Z d ∂f = (x0 , y) dy. c ∂x
h′ (x0 ) = lim t→0
Con un ragionamento del tutto analogo a quello fatto per h, si dimostra che h′ è continua su tutto R. Passo 2. Per considerare il caso in cui gli estremi dell’integrale dipendono in modo continuo dalla variabile x, definiamo la funzione Z s H(r, s, u) = f (u, y) dy. r
H risulta essere continua su tutto R3 , infatti lo è nelle prime due variabili per il Teorema Fondamentale del calcolo, nella terza per quanto dimostrato nel passo precedente. Le sue derivate parziali sono inoltre funzioni continue su R, infatti Z s ∂f ∂H ∂H ∂H (r, s, u) = − f (u, r), (r, s, u) = f (u, s), (r, s, u) = (u, y) dy. ∂r ∂s ∂u r ∂x Consideriamo quindi 1 : R → R3 , definita da 1(x) = 11 (x), 12 (x), x ; dalla continuità della funzioni 11 , 12 , 1′1 , 1′2 seguono la continuità e la differenziabilità di 1 su tutto R3 . La funzione integrale di partenza risulta quindi essere la composizione di H e 1: h(x) = (H ◦ 1)(x) per ogni x ∈ R. La continuità e la differenziabilità di h seguono da quelle di H e di 1; grazie al Teorema (VII.45), e in particolare all’Esempio (VII.46), a pagina 353, otteniamo h′ (x) = ∇H(11 (x), 12(x), x) · 1′ (x)
∂H ∂H ∂H (11 (x), 12 (x), x)1′1(x) + (11 (x), 12(x), x)1′2(x) + (11 (x), 12(x), x) ∂r ∂s ∂t e concludiamo sostituendo le espressioni delle derivate parziali di H. =
Ancora
per il Teorema Fondamentale del calcolo e per il passo precedente.
E da quella della funzione identità 13 (x) = x.
Esercizi
375
(VII.7) Sia F : R3 → R3 un campo vettoriale di classe C2 . Dimostrare la formula rot rot F = ∇(div F) − ∆F. Soluzione. Innanzitutto osserviamo che, visto che il campo è di classe C2 , le derivate seconde miste non dipendono dall’ordine di derivazione. Iniziamo calcolando il primo membro. Abbiamo j k ∂ y F3 − ∂z F2 i rot F = det ∂x ∂ y ∂z = ∂z F1 − ∂x F3 , F1 F2 F3 ∂x F2 − ∂ y F1 da cui rot rot F = det
i ∂x ∂ y F3 − ∂z F2
j ∂y ∂z F1 − ∂x F3
2 2 2 2 ∂xy F2 − ∂ yy F1 − ∂zz F1 + ∂xz F3 2 = ∂ yz F3 − ∂2zz F2 − ∂2xx F2 + ∂2xy F1 2 ∂xz F1 − ∂2xx F3 − ∂2yy F3 + ∂2yz F2
k ∂z ∂x F2 − ∂ y F1
Per quanto riguarda il secondo, invece, otteniamo div F = ∂x F1 + ∂ y F2 + ∂z F3 , da cui 2 2 2 ∂xx F1 + ∂xy F2 + ∂xz F3 ∇(div F) = ∂2xy F1 + ∂2yy F2 + ∂2yz F3 , 2 ∂xz F1 + ∂2yz F2 + ∂2zz F3 mentre 2 ∂xx F1 + ∂2yy F1 + ∂2zz F1 ∆F = ∂2xx F2 + ∂2yy F2 + ∂2zz F2 . 2 2 2 ∂xx F3 + ∂ yy F3 + ∂zz F3 Sottraendo le ultime due equazioni si ottiene la formula desiderata. (VII.8) Determinare i punti critici della funzione f : R3 → R f (x, y, z) = x2 + y2 + z2 − xyz. e discuterne la loro natura. Soluzione. Per quanto dimostrato nel Teorema (VII.60) a pagina 363, i punti critici risolvono il sistema 2x − yz = 0 2y − xz = 0 2z − xy = 0
Il laplaciano
di un vettore si esegue componente per componente: ∆ F1 i + F2 j + F3 k = ∆F1 i+∆F2 j+∆F3 k.
376
Funzioni differenziabili tra spazi vettoriali
di cui le soluzioni sono (0, 0, 0), (2, 2, 2), (2, −2, −2), (−2, 2, −2) e infine (−2, −2, 2). La matrice hessiana di f è 2 −z −y H f (x, y, z) = −z 2 −x . −y −x 2
In particolare H f (0, 0, 0) è diagonale e gli elementi della diagonale sono tutti strettamente positivi, quindi la forma quadratica ad essa associata è definita positiva e l’origine è un minimo stretto per f . Per studiare gli altri punti osserviamo che per ogni x, y, z ∈ R f (x, −y, −z) = f (x, y, z)
f (−x, y, −z) = f (x, y, z) f (−x, −y, z) = f (x, y, z)
Per
risolvere il sistema possiamo ad esempio ricavare x dalla prima equazione e sostituire nella seconda. Si ottiene 4y = yz2 le cui soluzioni sono y = 0 oppure z = ±2. Se si considera la prima si trova come soluzione (0, 0, 0); se si prende z = 2, la prima e la terza equazione diventano x=y
e
xy = 4.
Si trovano quindi i punti (2, 2, 2), (−2, 2, −2). Infine se si sceglie z = −2 si trovano le terne (2, −2, −2), (−2, 2, −2).
dunque la natura dei punti (2, 2, 2), (2, −2, −2), (−2, 2, −2) e (−2, −2, 2) è la stessa e possiamo limitarci a studiare (2, 2, 2). I minori principali di 2 −2 −2 H f (2, 2, 2) = −2 2 −2 −2 −2 2 sono d1 = 2, d2 = 0, d3 = −32. Non possiamo quindi dedurre nulla utilizzando il Criterio di Sylvester. Il determinante della matrice è però negativo, quindi, grazie a quanto dimostrato nell’Esercizio 38 a pagina 223 e ricordiamo che gli autovalori di una matrice simmetrica sono reali e distinti, H f (2, 2, 2) ha almeno un autovalore negativo. Essendo inoltre d1 = 2, lungo la direzione (1, 0, 0) la forma quadratica è strettamente positiva. Abbiamo quindi una (auto)direzione lungo la quale la forma quadratica è strettamente negativa, una lungo la quale è strettamente positiva: il punto (2, 2, 2) è quindi una sella. (VII.9) Mostrare che il sistema (x1 + x2 )2 + y21 x2 + 2y2 − 6 = 0 (x1 − x2 )2 + y2 y2 − 2x1 x2 − 3 = 0 1 definisce implicitamente y1 = y1 (x1 , x2 ) e y2 = y2 (x1 , x2 ) in un intorno del punto (0, 1, 1, 2). Calcolare le derivate parziali delle funzioni definite implicitamente nel punto (0, 1). Soluzione. Vogliamo verificare le ipotesi del Teorema di Dini per sistemi visto a pagina 366; usando la stessa notazione consideriamo x = (x1 , x2 ), y = (y1 , y2 ) e G : R4 → R2 definita nel modo seguente: G(x, y) = (x1 + x2 )2 + y21 x2 + 2y2 − 6, (x1 − x2 )2 + y21 y2 − 2x1 x2 − 3 .
Ovvero
che il determinante di una matrice è il prodotto dei suoi autovalori.
Esercizi
377
Il sistema è dunque equivalente alla scrittura vettoriale G(x, y) = 0. Sostituendo il punto (0, 1, 1, 2) otteniamo G(0, 1, 1, 2) = (0, 0). Essendo G polinomiale è certamente di classe C1 su tutto R4 e la matrice jacobiana di G rispetto alle variabili y1 , y2 , è " # " # 2y1 x2 2 2 2 D y G(x, y) = =⇒ D y G(0, 1, 1, 2) = 2y1 y2 y21 4 1 il cui determinante è non nullo. Dal Teorema di Dini deduciamo quindi che il sistema di partenza definisce implicitamente una funzione y = ϕ(x) da un intorno di (0, 1) a valori in un intorno di (1, 2). Tale funzione non solo è continua, ma è anche differenziabile in un intorno di (0, 1); la sua matrice jacobiana è −1 Jϕ (x) = − D y G(x, φ(x)) · Dx G(x, φ(x)) dove "
# " # 2(x1 + x2 ) + y21 2 3 =⇒ Dx G(0, 1, 1, 2) = . −4 2 −2(2x1 − x2 )
2(x1 + x2 ) Dx G(x, y) = 2(x1 − 2x2 )
Le derivate parziali in (0, 1) delle funzioni implicite sono quindi "
# " #−1 " 2 ∂x1 y1 (0, 1) ∂x2 y1 (0, 1) 2 2 · =− −4 ∂x1 y2 (0, 1) ∂x2 y2 (0, 1) 4 1 " # 5/3 −1/6 = . −8/3 −4/3
# " # " # 1 1 −2 3 2 3 = · 2 −4 2 6 −4 2
Il
calcolo delle derivate parziali delle funzioni implicite poteva essere eseguito nel modo seguente (calcoliamo quelle rispetto ad x1 ). In primo luogo si derivano rispetto ad x1 le due equazioni del sistema di partenza interpretando y1 e y2 come funzioni di x1 e x2 ; si ottiene: 2(x1 + x2 ) + 2x2 y1 ∂x1 y1 + 2∂x1 y2 = 0 2(x1 − x2 ) + 2y1 ∂x y1 y2 + y2 ∂x y2 − 2x2 = 0, 1 1 1
quindi si sostituiscono i valori x1 = 0, x2 = 1, y1 = 1 e y2 = 2 2 + 2∂x1 y1 + 2∂x1 y2 = 0 4 + 4∂x y1 + ∂x y2 = 0, 1
1
e si ricava facilmente ∂x1 y1 (0, 1) = 5/3, ∂x1 y2 (0, 1) = −8/3.
(VII.10) Dimostrare che fra tutti i poligoni di n vertici inscritti nella circonferenza unitaria, quello di area massima è quello regolare. Soluzione. Abbiamo già dimostrato questa affermazione nel caso dei triangoli, nell’Esercizio 46 a pagina 329. Supponiamo che la tesi sia vera per tutti gli interi superiori a tre fino a n − 1, e dimostriamola per gli n-agoni. Ragioniamo in modo simile a quanto fatto nell’Esercizio 46 , suddividendo il poligono nell’unione di n triangoli con un vertice nel centro della circonferenza, e denotando con xi gli angoli al centro di tali triangoli. L’area totale del triangolo è la somma delle aree dei triangolini e vale 1X sin xi . 2 n
A(x1 , . . . , xn ) =
i
Vogliamo dunque massimizzare la funzione A con i vincoli n X i
xi = 2π
e
0 ≤ xi ≤ π.
I vincoli imposti non sono del tipo
contemplato nelle ipotesi del Teorema dei moltiplicatori di Lagrange; infatti solo il primo corrisponde all’insieme di livello di una funzione, mentre il secondo è un cosiddetto “vincolo di disuguaglianza”. Per poter applicare questo risultato, dimostriamo che A non può essere massima se uno degli angoli vale 0 oppure π.
378
Funzioni differenziabili tra spazi vettoriali
Come prima cosa dimostriamo che il massimo non può essere assunto per uno degli angoli uguale a zero o a π. A questo fine osserviamo che la successione 2k sin 2π è strettamente crescente se k ≥ 3. Dunque nel k passare da n − 1 ad n, cioè nell’aggiungere l’ennesimo vertice, il valore massimo aumenta di una quantità strettamente positiva. Se uno degli angolo cade in 0 o in π, il suo contributo all’area sarà nullo ed il valo2π n−1 . Il massimo è quindi assunto re dell’area sarà al massimo 2 sin n−1 internamente al vincolo 0 ≤ xi ≤ π, cioè quando 0 < xi < π per ogni i; possiamo quindi applicare il metodo dei moltiplicatori di Lagrange aln la funzione Pn A sull’insieme aperto {x ∈ R : 0 < xi < π} con il vincolo 1(x) = i xi − 2π = 0, il cui gradiente è il vettore (1, . . . , 1). Troviamo dunque un moltiplicatore λ tale che cos xi = λ ,
Infatti, grazie al fatto che tan x > x in (0, π/2), si verifica senza difficoltà che la funzione sin x x è strettamente decrescente su [0, π].
i = 1, . . . , n .
Possiamo concludere che, per tutti gli indici i, xi = arccos λ ∈ (0, π). Ovviamente questo fatto implica che xi = 2π/n e quindi la tesi. (VII.11) Utilizzare il Teorema di Dini (VII.63) a pagina 366, per determinare sotto quali condizioni l’intersezione fra due superfici di livello regolari dà luogo ad un arco di curva regolare. In tale caso determinarne il versore tangente. Soluzione. Come sappiamo, il Teorema di Dini esprime delle condizioni locali vicino ad una soluzione assegnata. Supponiamo dunque che le due superfici abbiano equazione 1(x, y, z) = k e h(x, y, z) = c, e che esse si intersechino nel punto P(x0 , y0 , z0 ). Consideriamo la matrice jacobiana della funzione G(x, y, z) = (1(x, y, z), h(x, y, z)): " # 1x (x0 , y0 , z0 ) 1 y (x0 , y0 , z0 ) 1z (x0 , y0 , z0 ) JG (x0 , y0 , z0 ) = hx (x0 , y0 , z0 ) h y (x0 , y0 , z0 ) hz (x0 , y0 , z0 ) e supponiamo che abbia rango massimo (cioè due). Allora, scambiando eventualmente il ruolo delle variabili, possiamo pensare che sia il secondo sottodeterminante di ordine due a non essere nullo: " # 1 (x , y , z ) 1z (x0 , y0 , z0 ) det y 0 0 0 ,0. h y (x0 , y0 , z0 ) hz (x0 , y0 , z0 ) In base al Teorema di Dini, allora, il sistema di equazioni G(x, y, z) = 0 definisce implicitamente, nell’intorno del punto P, una funzione (y, z) = ϕ(x). Abbiamo dunque una curva parametrizzata con il parametro t = x: r(t) = (t, y(t), z(t)). Sappiamo anche dalla formula (10) che si tratta di una parametrizzazione di classe C1 . Possiamo anche asserire che la parametrizzazione è regolare, in quanto la prima componente della derivata r′ vale comunque uno. Possiamo ragionare in modo del tutto analogo nel caso sia un’altro minore di ordine due ad essere non singolare. Una condizione equivalente al fatto che JG abbia rango massimo è che i gradienti
F VII.6
Esercizi
379
∇1(x0 , y0 , z0 ) e ∇h(x0 , y0 , z0 ) siano linearmente indipendenti. Per calcolare il vettore tangente alla curva, possiamo ragionare tenendo in considerazione che lungo la curva, sia 1 che h sono costanti. Pertanto, il suo vettore tangente è ortogonale a entrambi i gradienti, e dunque è parallelo al loro prodotto vettoriale (si veda la Figura VII.6): T=
∇1(x0 , y0 , z0 ) × ∇h(x0 , y0 , z0 ) k∇1(x0 , y0 , z0 ) × ∇h(x0 , y0 , z0 )k
Tenendo
conto che la curva appartiene ad entrambe le superfici di livello, e ragionando come nell’Esercizio (VI.26) a pagina 291.
(VII.12) Siano date due superfici chiuse in R3 , di equazioni ϕ1 (x, y, z) = 0 e ϕ2 (x, y, z) = 0, prive di punti in comune. Suppo→ − niamo che le funzioni ϕi siano di classe C1 e che ∇ϕi (x, y, z) , 0 se ϕi (x, y, z) = 0 (i = 1, 2). Supponiamo che la coppia di punti P1 = (x1 , y1 , z1 ) e P2 = (X2 , Y2 , Z2 ) renda minima la distanza fra pun−−−→ ti delle due superfici. Dimostrare che il vettore P1 P2 è ortogonale ad entrambi i gradienti ∇ϕ1 e ∇ϕ2 (e dunque alle superfici stesse). Soluzione. Vogliamo studiare le condizioni di estremalità della funzione quadrato della distanza, dipendente dalle sei variabili f (x, y, z, X, Y, Z) = (x − X)2 + (y − Y)2 + (z − Z)2
Le variabili (x, y, z) indicano le coordinate di un punto su ϕ1 , (X, Y, Z) quelle di un punto su ϕ2 .
con due vincoli: 11 (x, y, z, X, Y, Z) = ϕ1 (x, y, z) = 0 12 (x, y, z, X, Y, Z) = ϕ2 (X, Y, Z) = 0 . Calcoliamone i gradienti ∂ϕ ∂ϕ1 ∂ϕ1 1 ∇11 (x, y, z, X, Y, Z) = ∂x (x, y, z), ∂y (x, y, z), ∂z (x, y, z), 0, 0, 0 ∇12 (x, y, z, X, Y, Z) = 0, 0, 0, ∂ϕ1 (X, Y, Z), ∂ϕ1 (X, Y, Z), ∂ϕ1 (X, Y, Z) . ∂X ∂Y ∂Z Notiamo che, come funzioni delle sei variabili, i gradienti di 11 e 12 e sono ortogonali e pertanto, in base alla proposizione (IV.41) sono linearmente indipendenti. Possiamo quindi utilizzare il metodo dei moltiplicatori di Lagrange a più vincoli. Per il Teorema (VI.55) esistono λ1 e λ2 tali che, nel punto di minimo, ∇ f = λ1 ∇11 + λ2 ∇12 . Osservato che ∇ f (x, y, z, X, Y, Z) = 2(x − X, y − Y, z − Z, X − x, Y − y, Z − z)
Osserviamo che le prime tre com-
e ∂ϕ ∂ϕ ∂ϕ λ1 ∇11 + λ2 ∇12 = λ1 ∂x1 (x, y, z), λ1 ∂y1 (x, y, z), λ1 ∂z1 (x, y, z), ∂ϕ ∂ϕ ∂ϕ λ2 ∂X1 (X, Y, Z), λ2 ∂Y1 (X, Y, Z), λ2 ∂Z1 (X, Y, Z) , otteniamo, in notazione vettoriale, −−−→ 2P1 P2 = −λ1 ∇ϕ1 (x1 , y1 , z1 ) = λ2 ∇ϕ2 (X2 , Y2 , Z2 ) .
−−−→ ponenti di ∇ f sono −2P1 P2 , mentre quelle di λ1 ∇11 + λ2 ∇12 sono λ1 ∇ϕ1 (x1 , y1 , z1 ). Le seconde tre in−−−→ vece sono rispettivamente 2P1 P2 e λ2 ∇ϕ2 (X2 , Y2 , Z2 ).
380
Funzioni differenziabili tra spazi vettoriali
(VII.13) Sia A = (ai j ) una matrice di ordine n simmetrica. Dimostriamo che la forma quadratica corrispondente f (x) = Ax · x ha n autovalori reali λi corrispondenti ad n autovettori vi mutuamente ortogonali e che sono soluzioni dei problemi di minimo vincolato: λ1 = min{ f (x) : kxk2 = 1}
λ2 = min{ f (x) : kxk2 = 1 , x · v1 = 0}
Si tratta di una dimostrazione al-
...
λn = min{ f (x) : kxk2 = 1 , x · v1 = 0 , . . . , x · vn−1 = 0} . Soluzione. Innanzitutto osserviamo che i punti critici di f con il vincolo 10 (x) = kxk2 = 1 (che è ovviamente un vincolo regolare) risolvono il problema agli autovalori: ∇ f (x) = λ∇10 (x)
⇐⇒
Ax = λx .
ternativa del Teorema Spettrale a pagina (IV.83).
Abbiamo
già osservato, infatti, che ∇ f (x) = 2Ax e ∇(kxk2 ) = 2x.
Osservato che la sfera unitaria, B1 (0), è un insieme chiuso e limitato (o compatto), possiamo applicare il Teorema di Weierstrass al problema di minimo min{ f (x) : 10 (x) = 1} e dedurre l’esistenza di un elemento v1 ∈ B1 (0) tale che f (v1 ) = min f (x) : 10 (x) = 1 . Deduciamo quindi l’esistenza di un moltiplicatore λ1 tale che è quindi un autovalore di A e v1 il corrispondente autovettore.
Av1 = λ1 v1 .
λ1
Moltiplicando scalarmente per v1 otteniamo λ1 = f (v1 ) . In questo caso, quindi, il moltiplicatore di Lagrange ha esattamente il valore del minimo vincolato. Procediamo ora alla determinazione del secondo autovalore. Denotiamo 11 (x) = x · v1 e risolviamo problema di minimo con due vincoli min f (x) : 10 (x) = 1 , 11 (x) = 0 . Di nuovo, il vincolo è un insieme compatto ed il minimo è assunto in v2 : possiamo quindi applicare il metodo dei moltiplicatori di Lagrange con più vincoli. Osserviamo che ∇10 (x) = 2x e ∇11 (x) = v1 sono di certo linearmente indipendenti sul vincolo: essi sono infatti ortogonali. Il Teorema (VI.55) dunque asserisce l’esistenza di due moltiplicatori λ2 e µ1 tali che ∇ f (v2 ) = λ2 ∇10 (v2 ) + µ1 ∇11 (v2 )
⇐⇒
Av2 = λ2 v2 + µ1 v1 .
Infatti
è intersezione della sfera unitaria (insieme chiuso e limitato) con la controimmagine di 0 per la funzione continua 11 (insieme chiuso).
Esercizi
381
Ora moltiplichiamo l’espressione trovata per v1 ; poiché, per costruzione, v2 è ortogonale a v1 , otteniamo Av2 · v1 = λ2 v2 · v1 + µ1 v1 · v1 = µ1 . Inoltre, essendo A simmetrica e v1 il suo primo autovettore, abbiamo Av2 · v1 = Av1 · v2 = λ1 v1 · v2 = 0 Quindi µ1 è nullo. Moltiplichiamo ora la stessa espressione per v2 : otteniamo nuovamente che il valore del moltiplicatore λ2 è proprio il valore del minimo vincolato: λ2 = f (v2 ) . Procedendo in modo ricorsivo, ci ritroviamo a risolvere il problema di minimo con i + 1 vincoli min f (x) : 10 x = 1 , 11 (x) = 0 , . . . , 1i (x) = 0 , dove, al solito, 10 (x) = kxk2 , 11 (x) = x · v1 , . . . , 1i (x) = x · vi . Osservato nuovamente che si tratta di un vincolo compatto e che il minimo, diciamo vi+1 è assunto, possiamo applicare il metodo dei moltiplicatori di Lagrange, poiché i gradienti delle funzione che definiscono il vincolo sono mutuamente ortogonali. Troviamo dunque i+ 1 moltiplicatori λi+1 , µ1 , . . . , µi tali che Avi+1 = λi vi+1 + µ1 v1 + · · · + µi vi . Moltiplicando successivamente per v1 , . . . , vi si verifica facilmente che i moltiplicatori µi sono tutti nulli. Moltiplicando infine per vi+1 si verifica nuovamente che il moltiplicatore λi+1 è proprio il minimo vincolato di f . ✩ (VII.14) Mostrare che due norme qualsiasi (che indichiamo con k·kA e k·kB ) su Rn sono equivalenti, cioè che esistono due costanti c1 , c2 > 0 tali che c1 kxkB ≤ kxkA ≤ c2 kxkB per ogni x ∈ V. (Segue che se una successione converge rispetto alla metrica indotta da una norma, allora converge nella metrica indotta da qualsiasi altra norma) Soluzione. È sufficiente mostrare che se k·kA è una norma, allora k·kA è equivalente una norma fissata k·k, che sarà la norma euclidea. Infatti, se esistono a1 , a2 > 0 tali che a1 kxk ≤ kxkA ≤ a2 kxk
Una norma è una funzione Rn → R che verifica le proprietà elencate nella proposizione (IV.38):
① (positività) x , 0 =⇒ kxk > 0, kxk = 0 ⇐⇒ x = 0.
② (omogeneità) kcxk = |c| kxk.
③ (disuguaglianza triangolare) kx + yk ≤ kxk + kyk.
382
Funzioni differenziabili tra spazi vettoriali
per ogni x ∈ Rn e b1 , b2 > 0 tali che b1 kxk ≤ kxkB ≤ b2 kxk, per ogni x ∈ Rn , allora a2 a1 kxkB ≤ kxkA ≤ kxkB b2 b1 a2 , c1 kxkB ≤ kxkA ≤ c2 kxkB per ogni x ∈ V. b1 Per prima cosa mostriamo che la funzione N : Rn → R definita da N(x) = kxkA è continua (rispetto alla norma euclidea). Infatti, se gli ei sono i vettori della base standard e xi le componenti di x, si ha per l’omogeneità e la disuguaglianza triangolare n n n X X X |xi |N(ei ) ≤ M |xi |, xi ei ≤ N(x) = N
cioè, ponendo c1 = a1 /b2 e c2 =
i=1
i=1
i=1
dove M è il massimo degli N(ei ). Ma |xi |2 ≤ kxk2 per ogni i, e quindi n X
M i=1
|xi | ≤ Mnkxk.
Allora per ogni x e y in Rn
Segue
|N(x) − N(y)| ≤ N(x − y) ≤ Mnkx − yk, e dunque N è una funzione continua Rn → R. Segue che la funzione N assume un massimo m2 > 0 e un minimo m1 > 0 sul sottospazio chiuso e limitato di Rn S = {x ∈ Rn : kxk = 1} , cioè per ogni x ∈ S si ha m1 ≤ N(x) ≤ m2 . Ma allora se x ∈ Rn , x , 0, si ha
x ∈ S, e quindi per ogni x , 0 per kxk
l’omogeneità di N N(x) x m1 ≤ N ≤ m2 =⇒ m1 ≤ ≤ m2 =⇒ m1 kxk ≤ N(x) ≤ m2 kxk. kxk kxk
dalla disuguaglianza triangolare: N(x) = N(y+(x− y)) ≤ N(y)+ N(x − y) =⇒ N(x) −N(y) ≤ N(x − y). Analogamente N(y) − N(x) ≤ N(x − y), e quindi |N(x) − N(y)| ≤ N(x − y).
Esercizi
383
Dimostrazione della Formula (V.18)
Supponiamo di sapere che
Per definizione dobbiamo dimostrare che, se σ è una generica poligonale inscritta, allora, posti Z b A = sup Lunghezza(σ) e B = kr′ (t)k dt,
(∗)
σ
a
si ha A = B. Sia a = t0 < t1 < · · · < tn < tn+1 = b una partizione dell’intervallo [a, b] e σ la poligonale corrispondente. Utilizzando la terza delle Proprietà (V.13) a pagina 236 abbiamo
Z t
Z t i+1
i+1 ′
kr(ti+1 ) − r(ti )k = r (t) dt
≤ kr′ (t)k dt,
ti
ti da cui, sommando su i, n n Z ti+1 X X Lunghezza(σ) = kr(ti+1 )−r(ti )k ≤ kr′ (t)k dt = B i=0
i=0
ti
cioè A ≤ B. Per dimostrare la disuguaglianza opposta osserviamo che, essendo r′ continua sull’intervallo chiuso e limitato [a, b], allora è uniformemente continua, per cui possiamo applicare il Teorema di Heine– Cantor (VII.30) a pagina 341: fissato ε > 0 possiamo trovare δ in modo che, per ogni t, s ∈ [a, b] con |t−s| < δ vale kr′ (t) − r′ (s)k < ε. Fissiamo ora una partizione di [a, b] in modo che, per ogni i, ti+1 − ti < δ. Dalla disuguaglianza triangolare otteniamo che, se t ∈ [ti , ti+1 ], allora kr′ (t)k < kr′ (ti )k + ε. Ma allora Z ti+1 Z ti+1 kr′ (t)k dt < (kr′ (ti )k+ε) dt = (kr′ (ti )k+ε)(ti+1 −ti ). ti
ti
kr′ (ti )k(ti+1 − ti ) ≤ kr(ti+1 ) − r(ti )k + ε(ti+1 − ti ).
Allora possiamo proseguire la precedente catena di disuguaglianze ottenendo Z ti+1 kr′ (t)k dt < kr(ti+1 ) − r(ti )k + 2ε(ti+1 − ti ), ti
da cui, sommando su i, n X B< kr(ti+1 )−r(ti )k+2ε(b−a) = Lunghezza(σ)+2ε(b−a) i=0
e passando al limite per ε → 0 otteniamo B ≤ A. Per concludere la dimostrazione dobbiamo quindi verificare (∗). Abbiamo
Z t
Z ti+1
i+1 ′
′ ′ kr (ti )k(ti+1 −ti ) = kr (ti )k dt = r (ti ) dt
t ti
Z ti
i+1
=
r′ (ti ) − r′ (t) + r′ (t) dt
ti
Z t
Z t
i+1 i+1
′ ′ ′ ≤ r (t) dt + r (ti ) − r (t) dt
ti
≤ kr(ti+1 ) − r(ti )k +
Z
ti
ti
ti+1
kr′ (ti ) − r′ (t)k dt
≤ kr(ti+1 ) − r(ti )k + ε(ti+1 − ti ),
dove negli ultimi passaggi abbiamo sfruttato la seconda e la terza delle Proprietà (V.13), oltre all’uniforme continuità di r′ .
✎ Diamoci da fare. . . (Soluzioni a pagina 624) 1 Per ogni coppia di elementi x, y ∈ Rn siano n X
d1 (x, y) = n=1
|xi − yi |
e d∞ (x, y) = max {|xi − yi |}. i=1,...,n
Dimostrare che d1 e d∞ sono delle distanze. Determinare quindi le palle aperte Br (0) ⊂ R2 , r > 0, rispetto alla distanza d1 oppure la distanza d∞ e confrontarle con la palla aperta di raggio r rispetto alla norma euclidea. 2 Verificare che se X è uno spazio vettoriale e k·kX è una norma allora la funzione dX : X × X → R, definita da dX (x, y) = kx − ykX è una distanza. ✩ 3 Verificare che se (X, dX ) è uno spazio metrico con la struttura di spazio vettoriale e se la distanza dX è
invariante per traslazioni e omogenea nelle dilatazioni (si veda l’approfondimento a pagina 334) allora kxkX = dX (x, 0) è una norma. ✩ 4 Si consideri il sottoinsieme (disco unitario) di R2 B = {x = (x1 , x2 ) ∈ R2 : x21 + x22 ≤ 1} e la funzione dR definita su B × B nel modo seguente (d indica la distanza euclidea in R2 ) ( d(x, y), se x, y e 0 sono allineati, dR (x, y) = d(x, 0) + d(0, y), altrimenti. Dopo aver verificato che dR è una distanza, descriverne le palle aperte. È possibile definire una norma a partire dalla distanza dR (si veda l’approfondimento a pagina 334)?
384
o 5 Determinare i punti di accumulazione e quelli di frontiera dei seguenti sottoinsiemi di Rn e dire se tali insiemi sono aperti o chiusi. (a) {(n, m) : n, m ∈ Z} = Z × Z ⊂ R2 ;
(b) {2−n + 5−m : n, m ∈ N} ⊂ R;
(c) {(−1)n /[1 + 1/n] : n ∈ N} ⊂ R;
(d) Q ⊂ R;
(e) {x ∈ R2 : 1 < kxk < 2};
(f) {x = (x1 , . . . , xn ) ∈ Rn : x1 > 2};
Funzioni differenziabili tra spazi vettoriali
13 Verificare che la norma di uno spazio vettoriale è una funzione continua se si munisce lo spazio della distanza indotta dalla norma. K 14 Dimostrare che in uno spazio metrico (X, d) la funzione distanza d : X × X → R (Definizione (VII.1) a pagina 332) è continua in entrambe le sue variabili. K 15 Dimostrare che dati tre spazi metrici (X, dX ), (Y, dY ) e (Z, dZ ) e due funzioni continue f : X → Y e 1 : Y → Z, la funzione composta 1 ◦ f : X → Z è continua.
K 16 Dimostrare che se un sottoinsieme limitato di Rn contiene infiniti punti, allora tale insieme ha almeno un punto di accumulazione. (Suggerimento: ripercorrere la 6 Sia D ⊂ R un sottoinsieme limitato. Dimostrare dimostrazione del Teorema di Bolzano–Weierstrass vista che gli estremi inferiore inf(D) e superiore sup(D) sono nell’approfondimento a pagina 340.) punti di frontiera per D. K 17 Dimostrare che se S è un sottoinsieme di Rn conK 7 Dimostrare che in uno spazio metrico, se A è un intenente infiniti elementi e K ⊂ Rn un insieme chiusieme aperto allora il suo complementare, X r A, è un so e limitato tale che S ⊂ K, allora S ha un punto di insieme chiuso e, viceversa, il complementare di un inaccumulazione s¯ ∈ K. sieme chiuso è un insieme aperto. (Suggerimento: segue dal fatto che la frontiera di un insieme coincide con la K 18 Dimostrare che un sottoinsieme K di Rn è chiuso frontiera del suo complementare.) e limitato se e soltanto se ogni sua successione ammette una sottosuccessione convergente ad un limite in K. K 8 (Teorema di unicità del limite) Sia xn una successione ✩ 19 Utilizzando la nozione di compattezza introdotta di uno spazio metrico (X, d); dimostrare che se nell’approfondimento a pagina 342 dimostrare che dati lim xn = x e lim xn = y due spazi metrici (X, dX ) e (Y, dY ) di cui il primo comn→+∞ n→+∞ patto e una funzione continua f : X → Y allora anche allora x = y. (Suggerimento: utilizzare la disuguaglianza f (X) ⊂ Y è compatto. triangolare per la distanza.) ✩ 20 Utilizzando la nozione di compattezza introdotta K 9 Dimostrare che in uno spazio metrico (X, d) la sucnell’approfondimento a pagina 342 dimostrare il Teorecessione xn ⊂ X converge al limite x¯ ∈ X se in ogni ma di Heine–Cantor, ovvero che se f : X → Y è una intorno sferico centrato in x¯ cadono tutti gli elementi funzione continua fra gli spazi metrici (X, dX ) e (Y, dY ) e della successione, eccetto al più un numero finito. se X è compatto allora f è uniformemente continua. (g) {x = (x1 , . . . , xn ) ∈ Rn : x1 = 0}.
K 10 Dimostrare che in uno spazio metrico (X, d) un pun- K 21 Dimostrare che i sottoinsiemi chiusi di uno spazio metrico completo sono completi. to x¯ è di accumulazione per l’insieme D ⊂ X se e soltanto se esso è il limite di una successione xn di elementi di D, ✩ 22 Si consideri una successione di Cauchy xn in uno ¯ tutti diversi da x. spazio metrico (X, dX ). Dimostrare che se xn ammette 2 ¯ allora l’intera successione un’estratta convergente a x, 11 Determinare il dominio D ⊂ R della funzione ¯ converge a x; dedurre quindi che se X è uno spazio f (x, y) = f1 (x, y), f2 (x, y) metrico sequenzialmente compatto allora X è completo. q 23 Dopo aver verificato che la mappa σ : R × R → = 1 − (x2 + y2 ), log(1 + x + y) . [0, +∞) definita da K 12 Sia f una funzione definita tra gli spazi metrici (X, dX ) e (Y, dY ). Dimostrare che se f è sequenzialmente continua allora è continua e viceversa (si veda la Definizione (VII.18)).
σ(x, y) = |ex − ey | è una distanza, dimostrare che lo spazio metrico (R, σ) non è completo. (Suggerimento: considerare ad esempio la successione xn = −n.)
Esercizi
385
24 Si consideri la successione di funzioni in C([0, 1]) fn (x) = x1/n . (a) Verificare che tale successione è di Cauchy rispetto ad entrambe le distanze integrali, d1 e d2 , definite negli Esempi (VII.6) e (VII.7) a pagina 333; (b) verificare quindi che fn non è convergente in C([0, 1]) rispetto ad entrambe le metriche integrali e dedurre la non completezza di C([0, 1]) rispetto a tali metriche. 25 Dopo aver verificato che la funzione T : [1, +∞) → [1, +∞),
T(x) = 1 +
Dopo aver osservato che F risulta derivabile in 0 e ¯ F′ (0) = Dv f (x), considerare f (x) = kxk2 e dimostrare che ¯ = 2x¯ · v, Dv f (x)
∀x, ¯ v ∈ Rn .
31 Determinare la matrice jacobiana della funzione f : R2 → R3 definita da 2 f (x, y) = sin x cos y, x2 + xy, ey x .
1 1+x
K 32 Si consideri la funzione 1 : Rn → R, 1(x) = kxkα , dove α ≥ 2 è un parametro reale. Dopo aver dimostrato è√ una contrazione, determinare un’approssimazione di che 1 è differenziabile in ogni x ∈ Rn , verificare che 2 corretta alla terza cifra decimale. (∗) ∇1(x) · x = α1(x). 26 Sia (X, dX ) uno spazio metrico completo ed f una Più in generale dimostrare il seguente risultato noto comappa contrattiva da X in se stesso, ovvero tale che me Teorema di Eulero per le funzioni omogenee: Se 1 : A ⊂ Rn → R, A aperto, è una funzione omogenea dX ( f (x1 ), f (x2 )) < dX (x1 , x2 ), ∀x1 , x2 ∈ X. di grado α, ovvero Dimostrare che f ha al più un punto fisso. 1(λx) = λα 1(x), ∀λ ∈ R e ∀x ∈ A tale che λx ∈ A ✩ 27 Nelle ipotesi dell’esercizio precedente, dimostrare allora se 1 è differenziabile in x vale la relazione (∗). che se X è anche compatto allora f ha esattamente un punto fisso. (Suggerimento: si osservi che la mappa b 33 Si considerino la funzione 1 : R3 → R2 , le cui componenti sono 11 (x, y, z) = x2 + y2 +z2 e 12 (x, y, z) = x+ y+z F : X → R, F(x) = dX (x, f (x)) è continua.) e una generica funzione f : R2 → R differenziabile su K 28 (Teorema del punto fisso con parametro) Siano tutto R2 . Verificare che, se h è la funzione composta f ◦1, (X, dX ) e (S, dS ) due spazi metrici, di cui il primo comvale la relazione pleto e T : X × S → X. Dimostrare che se, per ogni x, 2 2 k∇hk = 4 ∂1 f 11 + 3 ∂2 f + 4 ∂1 f ∂2 f 12 . T(x, ·) : S → X è continua e se esiste α ∈ (0, 1) tale che per ogni s ∈ S dove le funzioni h e 1 si intendono valutate in (x, y, z), dX (T(x1 , s), T(x2 , s)) ≤ αdX (x1 , x2 ) (cioè T è continua nella seconda variabile ed è una con¯ l’unico punto fisso trazione nella prima) allora detto x(s) ¯ della contrazione T(·, s) la mappa F : S → X, F(s) = x(s) è continua. 29 Giustificare la definizione parametrica
mentre f in 1(x, y, z).
34 Si consideri la funzione f : R → R2 definita da f (t) = (sin t, cos t). Verificare che per ogni t ∈ (0, 2π) f (2π) − f (0) , J f (t) e che quindi f è un controesempio alla validità del Teorema di Lagrange per funzioni a valori vettoriali.
K 35 Dimostrare che se f : A ⊂ Rn → Rm , A aperto, è di classe C1 in A e se il segmento [x, x + h] è interamente contenuto in A, allora vale la seguente stidi retta tangente data a pagina 234 ad una curva di ma dell’incremento della funzione f agli estremi del parametrizzazione regolare r in r(t0 ). segmento √ n 30 Sia f : R → R, una funzione derivabile lungo la k f (x + h) − f (x)k ≤ mαkhk, n direzione v nel punto x¯ ∈ R . Definiamo ora la mappa dove α = max j=1,...,m α j e α j = maxξ∈[x,x+h] k∇ f j (ξ)k. F : R → R nel modo seguente (Suggerimento: utilizzare il Corollario (VII.47) a pagiF(t) = f (x¯ + tv). na 355.) p(t) = r(t0 ) + tr′ (t0 ),
t ∈ R,
386
Funzioni differenziabili tra spazi vettoriali
b 36 Determinare i punti critici delle seguenti funzioni ✩ 41 Concludere la soluzione dell’Esercizio (IV.8), a pa(definite su R3 ) e discuterne la natura: gina 217: mostrare che se M è una matrice (simmetrica) e Pk è una successione di matrici ortogonali tali che la 1 1 1 (a) f (x, y, z) = + + + 16xyz; successione di matrici Mk = P−1 MPk converge ad una x y z k matrice diagonale D, allora D è la diagonalizzazione (b) 1(x, y, z) = xy + yz + zx; di M mediante una trasformazione ortogonale Q, cioè (c) h(x, y, z) = xy − yz + zx; esiste Q ortogonale tale che Q−1 MQ = D. 37 Verificare le Regole (VII.54) a pagina 358. o 42 Sia n ≥ 2 e K 38 Concludere la dimostrazione del Teorema di Dini per i sistemi (VII.63) ovvero dimostrare che il termif (x) = x1 + x2 + ... + xn ne Q−1 o kx − x0 k + kϕ(x) − ϕ(x0 )k è un “o piccolo” di kx − x0 k (si veda la notazione introdotta a pagina 366 definita per xi > 0 per ogni i = 1, 2, ..., n (cioè la funzione e seguenti). Il Lettore può seguire il seguente schema che valuta la somma di n numeri positivi). dimostrativo: (a) Determinare il minimo di f sotto la condizione (a) Mostrare che la tesi è equivalente alla limitatezza di kϕ(x) − ϕ(x0 )k/kx − x0 k. x1 · x2 ... · xn = 1 (b) Dopo aver osservato che se una quantità è “o piccolo” di kx − x0 k + kϕ(x) − ϕ(x0 )k allora può essere scritta come prodotto η(x, ϕ(x)) kx − x0 k + kϕ(x) − ϕ(x0 )k
(ovvero che il prodotto sia uguale a 1). (b) Si deduca la disuguaglianza tra media geometrica e media aritmetica
√ x1 + x2 + ... + xn con η tale che limx→x0 η(x, ϕ(x)) = 0, daln x1 · x2 · · · xn ≤ n la (11) a pagina 368 dedurre che il rapporto kϕ(x) − ϕ(x0 )k/kx − x0 k può essere maggiorato da valida per ogni numero xi ≥ 0. ! kϕ(x) − ϕ(x0 )k k−Q−1 P(x − x0 )k 1 1+ . K 43 Siano h : A ⊂ Rn → Rn , A aperto, una funzione di + kx − x0 k 2 kx − x0 k classe C1 in A e x0 ∈ A. Sia y0 = h(x0 ) tale che e quindi la tesi. det Jh (x0 ) , 0. 39 Si consideri la funzione f : R5 → R2 , definita da f1 (x1 , x2 , y1 , y2 , y3 ) = x2 2 + x1 y1 − y2 + 2,
f2 (x1 , x2 , y1 , y2 , y3 ) = x1 cos x2 − x2 + y1 − 2y3 .
Dimostrare che posti x = (x1 , x2 ) e y = (y1 , y2 , y3 ), l’equazione f (x, y) = 0 definisce implicitamente una unica funzione x = ϕ(y) da un intorno di (−2, 2, −1/2) in un intorno di (1, 0). Calcolare quindi la matrice jacobiana della funzione implicita nel punto (−2, 2, −1/2).
40 Si consideri una funzione r : D ⊂ R2 → R3 , r(u, v) = (r1 (u, v), r2 (u, v), r3 (u, v)). Dimostrare, usando il Teorema di Dini, che se (u0 , v0 ) ∈ D il rango della matrice jacobiana # " ru (u0 , v0 ) Jr (u0 , v0 ) = rv (u0 , v0 ) è massimo (cioè uguale a due) allora è possibile esprimere una delle tre componenti di r in termini delle altre due in un intorno del punto r(u0 , v0 ).
e si consideri G : R2n → Rn definita da G(x, y) = y−h(x). (a) Verificare che G soddisfa le ipotesi del Teorema di Dini per sistemi (VII.63). (Suggerimento: i ruoli delle variabili x e y sono scambiati.) (b) Dedurre l’esistenza di δ, σ > 0 e di una unica funzione ϕ di classe C1 Bσ (y0 ), Bδ (x0 ) tali che ϕ (h(x)) = x e h ϕ(y) = y, per ogni x ∈ Bδ (x0 ) e per ogni y ∈ Bσ (y0 ). (c) Applicando la formula (10) a pagina 366 verificare che Jϕ (y0 ) = − (Jh (x0 ))−1 . Quanto chiesto è il contenuto del Teorema di Inversione Locale enunciato nell’approfondimento a pagina 367.
O Binômio de Newton é tão belo como a Vênus de Milo. O que há é pouca gente para dar por isso. óóóó—óóóóóó óóó—óóóóóóó óóóóóóóó (O vento lá fora.)(19)
C APITOLO
Poesias de Álvaro de Campos (1935) F ERNANDO P ESSOA (1888–1935)
VIII
Sistemi di equazioni differenziali
In questo capitolo sviluppiamo in maniera più sistematica la teoria delle equazioni differenziali ordinarie. Abbiamo già avuto modo di incontrarne parecchie nel Capitolo I, in relazione con alcuni semplici modelli matematici di interesse nelle scienze applicate, e abbiamo imparato a risolverne alcuni tipi. In generale, tuttavia, non esistono formule risolutive universali e lo studio delle equazioni differenziali si rivolge verso i problemi di esistenza e unicità delle soluzioni e alle loro proprietà qualitative piuttosto che alle tecniche di risoluzione esplicita. Il pilastro su cui poggia tale teoria è il Teorema di Esistenza e Unicità per il problema ai valori iniziali: la sua validità circoscrive i modelli deterministici, cioè quelli la cui evoluzione è completamente determinata dallo stato ad un
dato istante. Le sue conseguenze sono molteplici e permettono un’analisi delle proprietà geometriche e topologiche delle soluzioni. Ci soffermeremo in particolare sul concetto di stabilità e sulle proprietà qualitative delle traiettorie. Vedremo infine alcune applicazioni nel caso dei sistemi lineari e di alcuni semplici sistemi non lineari. La lettura di questo capitolo richiede molte delle nozioni e del linguaggio del calcolo differenziale avanzato sviluppato nel Capitolo VII, oltre ad una buona dimestichezza con gli argomenti dell’algebra lineare del Capitolo IV. Questo capitolo è legato al Capitolo I, di cui costituisce il completamento teorico: essi possono essere svolti contestualmente, utilizzando il materiale del Capitolo I come fonte di esempi ed esercizi.
N
el Capitolo I abbiamo analizzato molti esempi di equazioni differenziali e abbiamo imparato come determinarne analiticamente l’insieme di tutte le soluzioni, in dipendenza da uno o più parametri. Ora ci occuperemo di equazioni differenziali vettoriali del prim’ordine in forma normale, cioè di equazioni del tipo (1)
y′ = f (t, y),
dove la funzione vettoriale data f è definita su un certo dominio di A ⊂ R × Rn a valori in Rn . La funzione incognita y sarà quindi una funzione a valori vettoriali in Rn e definita su un certo intervallo I che
«Vettoriale»
perché la funzione incognita y ha valori vettoriali, «del primo ordine» perché compare solo la derivata prima della funzione incognita, e «in forma normale» perché la derivata di grado massimo della funzione incognita, y′ , è ricavata in funzione di t e della variabile vettoriale y.
388
Sistemi di equazioni differenziali
sceglieremo indifferentemente aperto, chiuso o semiaperto, purché non vuoto, né ridotto ad un solo punto. (VIII.1) Definizione. Diciamo che y : I → Rn è una soluzione di (1) nell’intervallo I se y è derivabile in I , e, per ogni t ∈ I, si ha (t, y(t)) ∈ Ae y′ (t) = f (t, y(t)).
se I include l’estremo sinistro supporremo che in tali punti esista la derivata destra e analogamente per l’estremo destro; in tali estremi la derivata va intesa come derivata destra o sinistra rispettivamente.
L’equazione si dice autonoma se la funzione f dipende solo da y e non c’è dipendenza esplicita dalla variabile t. Nel caso contrario si parla di equazione dipendente dal tempo. Siano f1 (t, y1 , . . . , yn ), f2 (t, y1 , . . . , yn ), . . . , fn (t, y1 , . . . , yn ) le componenti scalari della funzione a valori vettoriali f . Allora l’equazione differenziale vettoriale (1) può essere scritta equivalentemente come un sistema di n equazioni differenziali nelle n funzioni incognite y1 , y2 , . . . , yn ′ y1 = f1 (t, y1 , y2 , . . . , yn ) y′ = f2 (t, y1 , y2 , . . . , yn ) 2 (2) .. . y′ = fn (t, y1 , y2 , . . . , yn ). n
Le soluzioni a volte vengono dette
Il sistema (2) è a sua volta detto un sistema del primo ordine in forma normale. Naturalmente, quando n = 1, il sistema si riduce ad una unica equazione (scalare) del primo ordine, patrimonio del Capitolo I. La gran parte delle equazioni e dei sistemi di equazioni differenziali di interesse nella teoria e nelle applicazioni si può ricondurre alla forma di equazione differenziale vettoriale (1).
Il
(VIII.2) Esempio (Oscillatore armonico). Consideriamo l’equazione dell’oscillatore armonico unidimensionale (equazione (3) a pagina 6) mx′′ (t) = −kx(t) − γx′ (t) + 1(t) o, equivalentemente, l’equazione lineare del secondo ordine (8) a pagina 16 ax′′ (t) + bx′ (t) + cx(t) = 1(t), con a, b, c ∈ R costanti. A patto di dividere per il coefficiente di x′′ , si può supporre m = a = 1. Ponendo y = x′ , l’equazione precedente è equivalente al sistema ( ′ x = f1 (t, x, y) = y y′ = f2 (t, x, y) = −by − cx + 1(t), che è del tipo (2) con f1 (t, x, y) = y e f2 (t, x, y) = −by − cx + 1(t).
integrali o curve integrali dell’equazione differenziale e l’insieme di tutte le soluzioni viene chiamato il suo integrale generale.
Quando
n = 2 a volte, in modo un po’ ambiguo, invece di usare la notazione " # y (t) y(t) = 1 y2 (t)
si preferisce la " # x(t) y(t) = . y(t) Lettore è invitato, per famigliarizzarsi con le nuove notazioni, a riscrivere l’equazione (1) a pagina 2 nella forma y′ = f (t, y): poichè y′ (t) = ky(t), dove k è un parametro fissato, abbiamo f (t, y) = f (t, y) = ky (notiamo che f non dipende da t). La (2) a pagina 3, analogamente, può essere scritta come y′ (t) = y(t)(k − hy(t)), e quindi è in forma normale al primo ordine, e corrisponde alla scelta f (t, y) = y(k − hy). La generica equazione a variabili separabili (equazione (4) a pagina 8) si riscrive come y′ = f (t, y) con f (t, y) = 1(t)h(y). L’equazione lineare (5) a pagina 11, corrisponde invece alla scelta f (t, y) = a(t)y +b(t).
In
forma vettoriale, posto y = (x, y) abbiamo l’equazione " # y y′ = f (t, y) = . −by − cx + 1(t)
Sistemi di equazioni differenziali
389
(VIII.3) Esempio (Equazioni di ordine n in forma normale). Ogni equazione differenziale di ordine n in forma normale è equivalente ad un sistema di n equazioni del prim’ordine. Infatti, ragionando come nell’Esempio precedente, un’equazione della forma y(n) = 1(t, y, y′, . . . , y(n−1) ) è equivalente al sistema di equazioni ′ y = y2 y2 1′ y = y3 y3 2 ′ (3) ⇐⇒ y = f (t, y) = .. .. . . 1(t, y1, y2 , . . . , yn ) y′ = 1(t, y1, y2 , . . . , yn ), n
ottenuto definendo le n componenti di y come y1 = y, y2 = y′ , . . . , yn = y(n−1) .
(VIII.4) Esempio (Sistemi meccanici di masse puntiformi). Un sistema di tre corpi celesti soggetti ad una mutua forza di attrazione gravitazionale newtoniana si può descrivere attraverso le posizioni ri (t) ∈ R3 , i = 1, 2, 3. Dette m1 , m2 , m3 le masse dei corpi celesti e G la costante universale di gravitazione, dalla seconda legge di Newton deriviamo un sistema di 3 equazioni differenziali vettoriali: r3 −r1 −r1 m1 r¨1 (t) = Gm1 m2 |rr22−r 3 + Gm1 m3 |r −r |3 1| 3 1 r3 −r2 r1 −r2 + Gm m m r ¨ (t) = Gm m 2 3 2 2 2 1 3 |r1 −r2 | |r3 −r2 |3 m3 r¨3 (t) = Gm3 m1 r1 −r3 3 + Gm3 m2 r2 −r3 3 . |r1 −r3 | |r2 −r3 | Poiché ognuna delle posizioni ri (t) è un vettore dello spazio tridimensionale, abbiamo un sistema di 3 × 3 = 9 equazioni del second’ordine. Considerando come incognite anche le velocità vi = ri′ , possiamo ricondurci ad un sistema di 2 × 9 = 18 equazioni del prim’ordine, ponendo y = (r1 , r2 , r3 , v1 , v2 , v3 ) ∈ (R3 )6 ed f : D ⊂ (R3 )6 → (R3 )6 v1 v2 v3 f (r1 , r2 , r3 , v1 , v2 , v3 ) = Gm r2 −r1 + Gm r3 −r1 2 |r2 −r1 |3 3 |r3 −r1 |3 −r2 r3 −r2 Gm1 |rr1−r + Gm 3 |r3 −r2 |3 3 1 2| r1 −r3 −r3 Gm1 |r1 −r3 |3 + Gm2 |rr22−r 3 3|
.
Abbiamo quindi n = 18, cioè di un sistema di 18 equazioni differenziali scalari del primo ordine. La soluzione è il vettore contenente le tre posizioni dei tre corpi e loro tre le velocità. Possiamo raffigurarci il moto dei tre corpi disegnando le tre traiettorie nello spazio tridimensionale, come
m i ai = Fi 2
3
1
F VIII.1: una soluzione del sistema dei tre corpi.
Il dominio della funzione f è dato dall’insieme di tutti i vettori y = (r1 , r2 , r3 , v1 , v2 , v3 ) di (R3 )6 tali che ri , r j , per i, j = 1, 2, 3 e i , j.
390
Sistemi di equazioni differenziali
nella Figura VIII.1. Va osservato tuttavia che tali linee non rappresentano né il grafico né il sostegno della soluzione vettoriale. In un sistema meccanico, ognuno dei corpi materiali può spostarsi in una o più direzioni indipendenti. Il numero di tali direzioni è detto numero di gradi di libertà del punto. Se i corpi si possono muovere in maniera indipendente, la somma dei loro gradi di libertà è detto numero di gradi di libertà del sistema. Per esempio ciascuno dei tre corpi celesti può muoversi nello spazio tridimensionale, ha pertanto tre gradi di libertà. Il numero di gradi di libertà del sistema è 9.
Tali nozioni sono state introdotte nel Capitolo V a pagina 228.
§ 1. Campi di vettori e curve tangenti Un’equazione vettoriale autonoma definita su Rn : (4)
y′ = f (y)
si presta ad una interessante interpretazione geometrica. Ad ogni punto dello spazio di coordinate y, associamo infatti un vettore velocità f (y) : la curva tracciata da una soluzione deve quindi avere in ogni punto il vettore tangente (vettore velocità) uguale al vettore del campo f (y). Tali curve prendono il nome di traiettorie o orbite. Da questo punto di vista assumono particolare rilievo i punti in cui il campo di velocità si annulla; essi sono detti punti di equilibrio, e corrispondono a soluzioni costanti dell’equazione differenziale: le traiettorie corrispondenti si riducono a punti. È perciò significativo disegnare le traiettorie nello spazio Rn insieme con il campo di velocità. Tale disegno prende il nome di ritratto di fase e può essere prodotto con l’ausilio di un software apposito come è avvenuto per la Figura VIII.2. Da tale raffigurazione grafica possiamo dedurre alcune informazioni di ordine qualitativo sulle soluzioni anche quando non siamo in grado di risolvere esplicitamente il sistema. In tale rappresentazione, tuttavia, vanno perse alcune informazioni di ordine cinematico, cioè relative alla parametrizzazione della curva integrale, come il modulo della sua velocità. (VIII.5) Esempio (Piano delle fasi). Consideriamo un’equazione differenziale autonoma scalare del tipo (5)
x′′ (t) = 1(x),
x ∈ R,
dove x è la posizione sulla retta R. Il corrispondente campo di vettori piano è quindi descritto dall’equazione differenziale nel piano R2 : ( ′ x =y y′ = 1(x) corrispondente al campo di velocità " #! " # x y f = y 1(x)
Utilizzando
la terminologia introdotta nel Capitolo VII, a pagina 356, f è un campo vettoriale, che chiameremo campo di velocità.
ATTENZIONE! Le traiettorie nello spazio Rn non vanno confuse con le soluzioni, di cui sono in effetti il sostegno, né con i grafici di esse, che sono invece sottoinsiemi di Rn+1 .
⊚
Sappiamo
che ad una sistema meccanico a n gradi di libertà è associata l’equazione vettoriale del secondo ordine in dimensione n r′′ = F(r) (si veda a tal proposito l’Esempio (VIII.4)). Questa, ponendo v = r′ , risulta equivalente all’equazione vettoriale in dimensione 2n del primo ordine ( ′ r =v v′ = F(r). Gli stati del sistema sono descritti dalla coppia di vettori (r, v). Lo spazio R2n delle (r, v) viene detto spazio delle fasi. Nello spazio delle fasi è definito il campo velocità f (r, v) = (v, F(r)).
§ 1. Campi di vettori e curve tangenti
391
definito nello spazio euclideo bidimensionale (che in questo contesto viene chiamato il piano delle fasi). L’equazione dell’oscillatore armonico senza attrito e con frequenza unitaria ω = 1
Si veda anche l’Esercizio (I.7) a pagina 24.
x′′ + x = 0, fa parte della classe (5) con 1(x) = −x. Il campo di velocità associato all’equazione è definito dalla funzione " #! " # x y f = y −x ed è perpendicolare in ogni punto al vettore (x, y). Pertanto ogni traiettoria deve essere tangente, nel generico punto (x, y) del piano, al vettore perpendicolare ad (x, y) stesso, come si vede nella Figura VIII.2. Conosciamo una famiglia di soluzioni dell’equazione, dipendente da due costanti, x(t) = C1 cos t + C2 sin t. Dunque la corrispondente famiglia di soluzioni del sistema associato ha equazione vettoriale " # " # x(t) C1 cos t + C2 sin t y= = . y(t) −C1 sin t + C2 cos t Osserviamo che le traiettorie corrispondenti sono circonferenze di raggio q 2 pari a C1 + C22 . In effetti tali curve sono in ogni punto tangenti al campo di velocità f .
Campi di direzioni per equazioni dipendenti dal tempo
F VIII.2: traiettorie nel piano delle fasi per l’equazione dell’oscillatore armonico, corrispondente al sistema ( ′ x =y y′ = −x.
Infatti si ha (C1 cos t + C2 sin t)2 + (−C1 sin t + C2 cos t)2 = C21 + C22 .
Un’equazione vettoriale dipendente dal tempo y′ = f (t, y) è equivalente ad un’equazione vettoriale autonoma in questo senso: si considera una variabile vettoriale ausiliaria u = (τ, y), nello spazio con una dimensione di più, Rn+1 , imponendo che la derivata di τ rispetto a t valga uno: in altre parole componiamo il sistema ( ′ τ =1 y′ = f (τ, y), il cui campo di velocità è dunque 1(τ, y) = (1, f (τ, y)). Con questo artificio possiamo estendere le osservazioni sulla rappresentazione delle soluzioni per le equazioni autonome anche a quelle non autonome, con in più il
F VIII.3: campo di direzioni per l’equazione differenziale y′ = t + y, dell’Esempio (VIII.6).
392
Sistemi di equazioni differenziali
vantaggio che ora le traiettorie coincidono con i grafici delle soluzioni. Consideriamo per esempio l’equazione differenziale scalare y′ =
dy = f (t, y). dt
(cioè la (1) in dimensione n = 1), il cui campo di velocità nel piano ty è (t, y) 7→ (1, f (t, y)): poiché non si annulla mai, esso determina un campo di direzioni, che associa ad ogni punto (t, y) la pendenza della retta tangente alla soluzione y(t) che si trovi a passare per quel punto. È possibile quindi analizzare graficamente un’equazione del primo ordine in una variabile, studiando la funzione f (t, y). (VIII.6) Esempio. Consideriamo l’equazione differenziale lineare y′ = f (t, y) = t + y, le cui soluzioni sono (parametrizzate dalla costante C) y(t) = −t − 1 + Cet . La retta tangente ad una soluzione y(t) nel punto (t, y) ha coefficiente angolare f (t, y) = t + y. Invece di disegnare l’intera retta tangente, la rappresentiamo con una piccola freccia (di lunghezza costante), come in Figura VIII.3. Le rette di equazione t + y = k sono gli insiemi di livello di f , e lungo una di queste rette la direzione è quindi costante. Lungo la retta t + y = 0 si ha pendenza nulla, e quindi ogni soluzione ha derivata zero quando y(t) + t = 0, cioè quando interseca la retta di equazione t + y = 0. Inoltre le soluzioni sono decrescenti nel semipiano t + y < 0 e crescenti nel semipiano t + y > 0. Una analisi di questo tipo può essere utile, specialmente nel caso in cui non si sappia risolvere esplicitamente l’equazione.
§ 2. Il problema ai valori iniziali Immaginiamo che una particella puntiforme si muova seguendo il campo di velocità f (t, y), che dipende dal tempo e dalla posizione nello spazio degli stati. Se se ne conosce lo stato al tempo t0 ed è lasciata a sé stessa nel campo, la particella seguirà la traiettoria per cui in ogni punto il vettore velocità è quello assegnato da f , o non è possibile prevederne il moto? Più in generale, se il nostro scopo è prevedere l’evoluzione di un sistema fisico, è naturale associare all’equazione differenziale delle condizioni aggiuntive (come la posizione iniziale). Si parla allora di «problema». Il più semplice dei problemi, che è quello che considereremo principalmente in questo capitolo, è quello ai valori iniziali. Sia f : A ⊂ R × Rn → Rn definita su un aperto A di R × Rn ; sia (t0 , y0 ) un punto fissato di A.
Abbiamo
imparato a risolvere le equazioni lineari del prim’ordine nel Capitolo I e sappiamo che l’unica soluzione dell’equazione y′ (t) = a(t)y(t) + b(t) con la condizione iniziale y(t0 ) = y0 è ! Z t y(t) = eA(t) y0 + b(s)e−A(s) ds , Rt
t0
dove A(t) = t a(s) ds. Il Lettore 0 può rinfrescarsi la memoria con una sbirciata a pagina 12 (si rammentino anche gli Esercizi 25 e 26 a pagina 31).
La
maggior parte delle equazioni differenziali, infatti, non possono essere risolte integrando algebricamente, come invece si mostra nei primi esempi. Occorre quindi procedere con metodi qualitativi e numerici.
Altri
tipi di problemi sono considerati nell’Esercizio 31 .
§ 2. Il problema ai valori iniziali
Il metodo di Eulero L’idea su cui poggia l’interpretazione geometrica di un’equazione differenziale come un campo di direzioni può essere utilizzata per costruire una soluzione approssimata dei problemi ai valori iniziali y(t0 ) = y0 nell’intervallo [t0 , t0 + δ]. A tale fine, costruiamo una funzione lineare a tratti, la cui pendenza cerca di seguire il campo di direzioni, correggendosi man mano, nel modo che spieghiamo. Sia h > 0 un piccolo parametro (detto passo) e consideriamo dei valori equispaziati ti+1 = ti +h, in modo che tn = t0 +δ. Definiamo y1 = y0 + h f (t0 , y0 ) e, ricorsivamente, yi+1 = yi + h f (ti , yi ). Consideriamo la funzione lineare a tratti y(t) = yi + (t − ti ) f (ti , yi ) ,
se t ∈ [ti , ti+1 ].
In che senso y è una soluzione approssimata del problema ai valori iniziali? Innanzitutto abbiamo, per definizione, y(t0 ) = y0 . Inoltre, sotto opportune ipotesi di regolarità della funzione f , y risolve l’equazione differenziale a meno di un errore proporzionale al passo h: difatti, se t ∈ [ti , ti+1 ],
393
e dunque, se abbiamo una limitazione sia su | f | ≤ M che sulla norma del gradiente: k∇ f k ≤ L otteniamo q √ |y′ (t)− f (t, y(t))| ≤ L(t−ti ) 1 + f (ti , yi )2 ≤ L 1 + M2 h. Con tali limitazioni, si dimostra che il problema ai valori iniziali ammette una unica soluzione e che essa dista da y meno di una quantità proporzionale ad h (si veda l’Esercizio 9 ). Il metodo di Eulero è detto del prim’ordine, perché l’errore è proporzionale al passo h alla prima potenza. Si possono facilmente elaborare metodi di ordine k arbitrariamente alto, a patto che la funzione f ammetta derivate limitate fino all’ordine k.
y′ (t) − f (t, y(t)) = f (ti , yi ) − f (t, yi + (t − ti ) f (ti , yi ))
(VIII.7) Definizione. Il problema ( y′ = f (t, y) (6) y(t0 ) = y0 è detto problema ai valori iniziali, o problema di Cauchy. L’uguaglianza y(t0 ) = y0 è detta la condizione iniziale. Una soluzione del problema di Cauchy è una soluzione dell’equazione differenziale y : I → Rn tale che t0 ∈ I e y(t0 ) = y0 . (VIII.8) Esempio. Consideriamo il sistema ad un grado di libertà dell’equazione (5), che può essere riscritto come sistema del primo ordine ( ′ x =y y′ = 1(x) in cui x è la posizione e y = x′ la velocità. Assegnare una condizione iniziale al tempo t0 significa assegnare la posizione x(t0 ) = x0 e la velocità y(t0 ) = y0 del corpo. Analogamente, una condizione iniziale per l’equazione dei 3 corpi celesti dell’Esempio (VIII.4) dovrà consistere in un vettore ξ di dimensione 18, contenente le posizioni ri (t0 ) e le velocità iniziali vi (t0 ) per ciascuno dei tre corpi celesti. Come vedremo nel prossimo paragrafo, queste determinano univocamente la traiettoria dei tre
Si veda la Definizione (VIII.1).
394
Sistemi di equazioni differenziali
corpi celesti per tutti i tempi passati e futuri, sempre che non avvengano delle collisioni. Se y è un vettore di coordinate che rappresenta lo stato di un sistema fisico, la cui evoluzione è determinata dall’equazione differenziale y′ = f (t, y), allora la soluzione al problema (6) non è altro che l’evoluzione del sistema fisico nel tempo, sapendo che al tempo t0 lo stato è uguale a quello dello stato iniziale y0 scelto. Da questo punto di vista, due questioni sono di basilare importanza: ➔ l’esistenza di una soluzione: contrariamente a quanto ci si potrebbe aspettare, non è detto che un generico problema ai valori iniziali ammetta una soluzione; in una tale situazione il modello scelto è evidentemente inadeguato a descrivere una fenomeno fisico;
Cioè
finché il vettore y = (r1 , r2 , r3 , v1 , v2 , v3 ) rimane nel dominio della funzione f . Ovverosia, finché i tre corpi si trovano, ad ogni istante fissato, in tre punti distinti dello spazio.
In termini cinematici, se
f rappresenta il campo di velocità, allora y0 è la posizione iniziale. In termini prettamente analitici, la soluzione y(t) non è altro che una funzione, cui assegnamo il valore iniziale y(t0 ) (cioè i valori delle sue componenti y1 (t0 ), . . . , yn (t0 )).
➔ l’unicità della soluzione: l’esistenza di diverse soluzioni allo stesso problema sarebbe in contrasto con l’idea, naturale in una visione deterministica, che l’evoluzione del sistema sia completamente prevedibile a patto di essere in possesso di tutte le informazioni necessarie. Il fatto fondamentale per il problema (6) è il seguente: sotto opportune ipotesi di regolarità del campo vettoriale, l’evoluzione del sistema è completamente determinata dalle condizioni iniziali. In termini più tecnici, vale il seguente teorema. (VIII.9) Teorema (di esistenza e unicità locale). Sia A ⊂ R × Rn un aperto e sia f = f (t, y) : A ⊂ R × Rn → Rn una funzione continua e di classe C1 rispetto alla variabile y. Se (t0 , y0 ) ∈ A, allora esiste δ > 0 tale che per il problema ai valori iniziali ( y′ = f (t, y)
Dire che è di classe C1 rispetto alla variabile (vettoriale) y significa che esistono tutte le derivate parziali ∂ yi f e sono funzioni continue in A.
y(t0 ) = y0 esiste una e una unica soluzione definita sull’intervallo [t0 − δ, t0 + δ]. Questo teorema ha un vastissimo campo di applicazione che comprende i sistemi meccanici dai più semplici, come il pendolo semplice (Esercizio 1 ), ai più complicati, come i sistemi di molti corpi in interazione. Comprende inoltre le equazioni differenziali di ordine arbitrario. Va osservato, tuttavia, che si parla qui di esistenza locale di una soluzione, nel senso che quando t si allontana da t0 , non si garantisce più né l’esistenza (la soluzione potrebbe essere una funzione non definita su tutto R) né l’unicità. D’altra parte, abbiamo già incontrato nel Capitolo I alcune equazioni (non lineari) le cui soluzioni non possono essere definite per tutti i tempi, a causa di comportamenti catastrofici: ci riferiamo all’esplosione in tempo finito dell’Esempio (I.1) a pagina 9. L’esistenza per tutti i tempi (detta esistenza globale) è l’oggetto di un altro enunciato, che richiede ipotesi più restrittive.
Rimandiamo la dimostrazione del Teorema(VIII.9) alla fine del § 3 (a pagina 402).
Nel
futuro o nel passato, è irrilevante: il teorema garantisce l’esistenza e l’unicità sia nel futuro che nel passato. Si veda anche l’Esercizio 14 a pagina 30.
§ 2. Il problema ai valori iniziali
(VIII.10) Teorema (di esistenza e unicità globale). Sia I = [a, b] ⊂ R un intervallo e t0 ∈ I un valore fissato. Supponiamo che f e le sue n derivate parziali ∂ yi f , i = 1, . . . , n, siano funzioni continue in I × Rn . Supponiamo inoltre che le derivate parziali ∂ yi f siano limitate, cioè che esista una costante L0 > 0 per cui
∂ f ∀(t, y) ∈ I × Rn , ∀i = 1, . . . , n. (t, y)
≤ L0 , (7) ∂yi Allora esiste una e una sola soluzione per il problema (6) definita su tutto l’intervallo I.
395
Ad esempio le equazioni lineari del primo ordine viste nel Capitolo I soddisfano a questa condizione sugli intervalli in cui i coefficienti sono continui! (Abbiamo già dimostrato esistenza ed unicità per queste equazioni negli Esercizi 25 e 26 a pagina 31).
Alcuni esempi e controesempi (VIII.11) Esempio. Un caso molto semplice ma significativo, avviene quando la funzione f (t, y) non dipende da y ma soltanto da t. Consideriamo il problema ai valori iniziali ( y′ = f (t) y(t0 ) = y0 con f continua su I = [a, b] e t0 ∈ I. Per il Teorema Fondamentale del Calcolo, la funzione integrale Z t F(t) = y0 + f (s) ds t0
è una soluzione. Ciò prova l’esistenza di (almeno) una soluzione. D’altra parte, se y(t) è una soluzione, allora per ogni t ∈ [a, b] si ha y′ (t) = f (t) Rt Rt e quindi t y′ (s) ds = t f (s) ds. Ma per il Teorema di Valutazione questo 0 0 significa che per ogni t ∈ [a, b] y(t) − y(t0 ) = F(t) − F(t0 ). La condizione iniziale y(t0 ) = y0 impone dunque y(t) = F(t). La soluzione trovata è quindi unica. Il Capitolo I di questo volume contiene un’ampia collezione di esempi di equazioni a cui applicare i due Teoremi di esistenza e unicità di soluzioni per problemi ai valori iniziali. Concentriamoci ora su alcuni esempi e controesempi, che mostrano come, in generale, né l’esistenza né l’unicità della soluzione siano garantite al di fuori dell’insieme delle ipotesi dei Teoremi (VIII.9) e (VIII.10). (VIII.12) Esempio (Controesempio all’esistenza di soluzioni). Consideriamo la funzione definita a tratti 1 se y ≤ 0 f (y) = 0 se y > 0,
Ricordiamo
due teoremi importanti dal primo volume: il Teorema Fondamentale del Calcolo (Teorema (XI.22)): Se f è una funzione continua nell’intervallo [a, b], allora R x la sua funzione integrale F(x) = f (t) dt è derivabile nell’intervallo a [a, b] e risulta F′ (x) = f (x) (∀x ∈ [a, b]) e il Teorema di Valutazione (Teorema (XI.6)): Se f è una funzione continua nell’intervallo [a, b] e se F è una sua primitiva, allora Rb f (x) dx = F(b) − F(a). a
396
Sistemi di equazioni differenziali
che rappresenta una sorta di interruttore che annulla la velocità quando y passa da valori negativi a valori positivi. Il problema ai valori iniziali (
y′ (t) = f (y) y(0) = 0
non ha alcuna soluzione. Infatti, supponiamo che ne abbia una: allora y′ (0) = f (0) = 1 e, in base al Teorema della permanenza del segno, il rapporto incrementale y(t)/t rimane positivo per piccoli valori di t. Conseguentemente, per ogni t > 0 prossimo allo zero, abbiamo y(t) > 0 e pertanto y′ (t) = f (y(t)) = 0. Dunque y > 0 è costante in un intervallo del tipo [0, 0 + δ] e vale 0 ad un estremo, assurdo.
Osserviamo
che si tratta di una funzione f discontinua in y = 0. In effetti c’è un teorema, il Teorema di Peano, che garantisce l’esistenza di almeno una soluzione (in un intorno di t0 ) sotto la sola ipotesi di continuità della funzione f . La dimostrazione di questo celebre teorema esula dalla trattazione di questo volume ma si può trovare ad esempio in [Hirsch e Smale(1974), Piccinini et al.(1978)].
(VIII.13) Esempio. Consideriamo il problema ai valori iniziali ! t ′ y = sin 1 + y2 y(1) = 0. La funzione f (t, y) = sin t/(1 + y2 ) verifica tutte le ipotesi del Teorema (VIII.10); in particolare vale l’ipotesi di limitatezza della derivata. Infatti risulta ! 2ty t ∂ y f (t, y) = − cos 2 1 + y (1 + y2 )2 e per ogni I = [a, b] ⊂ R fissato a priori, si ha ∂ f y (t, y) ≤ 2 max {|a|, |b|}
|y| . (1 + y2 )2
Infine la funzione in una variabile 1(y) = y/(1 + y2 )2 è limitata su R, perché è continua e tende a 0 quando |y| tende a +∞. Il Teorema (VIII.10) garantisce quindi che la soluzione del problema ai valori iniziali è definita su ogni intervallo limitato [a, b] che contiene t0 = 1, ed è quindi definita su tutto R. (VIII.14) Esempio (Controesempio all’esistenza globale). Nel problema di Cauchy y′ = y2 , y(0) = 1 sono verificate le ipotesi del Teorema (VIII.9), ma non è verificata l’ipotesi (7) del Teorema (VIII.10). Osserviamo infatti che la derivata ∂ y f = 2y non è limitata per y ∈ R, benché sia una funzione continua. Il problema ha soluzione (unica) y(t) = 1/(2−t). Non vi è esistenza globale, in quanto non esistono soluzioni definite al di fuori della semiretta (−∞, 2).
Dopo
aver osservato che la funzione ha limite zero all’infinito, si può facilmente calcolare il massimo del modulo di tale funzione, cercandone√i punti critici. Tale massimo vale 3 3/16, un numero certamente inferiore a 1.
Secondo la Definizione (VIII.1), una soluzione è una funzione derivabile, e dunque continua, in ogni punto dell’intervallo (a, b). Non sono pertanto ammesse singolarità né, quindi, asintoti verticali, se non agli estremi dell’intervallo.
§ 3. Esistenza e unicità delle soluzioni per il problema ai valori iniziali
397
(VIII.15) Esempio (Controesempio all’unicità di soluzioni). Consideriamo il problema 3p 3 ′ y(t) y (t) = 2 y(1) = 0. L’equazione è a variabili separabili, e le sue soluzioni che non si annullano soddisfano la relazione Z Z q 2 3 y2 (t) = t + C dt ⇐⇒ √3 dy = 3 y al variare di C ∈ R. Elevando al cubo si trova y(t)2 = (t + C)3p , da cui, imponendo t + C > 0 , si deduce che le due funzioni y(t) = ± (t + C)3 risolvono l’equazione differenziale sulla semiretta (−C, +∞). Se ora cerchiamo tra le funzioni trovate quelle che verificano il passaggio per il punto (1, 0) troviamo innanzitutto che y ≡ 0 è una soluzione del problema ai valori iniziali. In realtà il problema ha altre soluzioni (oltre a quella nulla) definite su tutto R; se infatti per ogni k ≥ 1 definiamo t
j § 3. Esistenza e unicità delle soluzioni per il problema ai valori iniziali In questa sezione dimostreremo, nell’ordine, il Teorema (VIII.10) e il Teorema (VIII.9). Sia A ⊂ R × Rn un aperto e sia f : A ⊂ R × Rn → Rn una funzione continua e di classe C1 rispetto alla variabile y. Consideriamo un dato iniziale (t0 , y0 ) ∈ A, e torniamo a considerare il problema ai valori iniziali (6) ( y′ = f (t, y) (6) y(t0 ) = y0 . Cominciamo a dimostrare il seguente lemma.
Serve ad estrarre la radice.
F VIII.4: le soluzioni dell’Esempio (VIII.15) formano il cosiddetto pennello di Peano.
Dove
uk e vk sono nulle e quindi l’equazione differenziale è soddisfatta da entrambe in (−∞, k).
Vedremo
nell’Esercizio 10 un risultato che garantisce l’unicità della soluzione per (6) a prescindere dall’esistenza.
398
Sistemi di equazioni differenziali
(VIII.16) Lemma (formulazione integrale). Siano t0 , t1 due scalari. Una funzione φ(t) continua definita sull’intervallo [t0 , t1 ] è C1 e soluzione del problema (6) se e soltanto se è soluzione della seguente equazione integrale Z t (8) φ(t) = y0 + f (s, φ(s)) ds per ogni t ∈ [t0 , t1 ].
Dove
s’intende che l’intervallo è [t1 , t0 ] se t1 < t0 .
t0
Dimostrazione. Se φ è C1 e risolve (6) allora, integrando l’equazione φ′ (t) = f (t, φ(t)) su [t0 , t] per ogni t e usando la condizione iniziale, otteniamo la (8). D’altra parte, se φ è continua e soddisfa (8) in [t0 , t1 ], allora φ(t0 ) = y0 ed essendo f continua, grazie al Teorema Fondamentale del Calcolo, otteniamo che φ è derivabile con derivata continua e soddisfa (6).
Abbiamo già utilizzato questo ragionamento nella discussione dell’Esempio (VIII.11).
Il Lemma (VIII.16) è il passaggio chiave nelle dimostrazioni di esistenza (e unicità) per le soluzioni del problema ai valori iniziali. Le seguenti osservazioni saranno importanti nel seguito. (VIII.17) Osservazione (Completezza). L’equazione (8) può essere anche scritta come φ = T(φ), se T è l’operatore che alla funzione φ associa una nuova funzione T(φ) definita da Z t (9) T(φ)(t) = y0 + f (s, φ(s)) ds. t0
Per definire in modo più chiaro l’operatore T, consideriamo lo spazio X = C([t0, t1 ], Rn ) di tutte le funzioni continue definite sull’intervallo [t0 , t1 ] a valori in Rn : l’operatore T associa alla funzione φ ∈ X la funzione T(φ) ∈ X, i cui valori sono definiti dalla (9). Risolvere il problema ai valori iniziali è quindi ricondotto al problema di trovare un punto fisso per l’operatore T. Come vedremo tra poco, è essenziale il seguente fatto: lo spazio di funzioni (detto anche spazio funzionale) X definito sopra è uno spazio metrico completo rispetto alla metrica definita da d∞ (ψ1 , ψ2 ) = kψ1 − ψ2 k∞ = max kψ1 (t) − ψ2 (t)k t∈[t0 ,t1 ]
se ψ1 , ψ2 ∈ X.
(VIII.18) Osservazione (Prolungamento). Consideriamo tre istanti di tempo successivi t0 < t1 < t2 . Indichiamo con φ(t) una funzione definita sull’intervallo [t0 , t1 ] che sia soluzione dell’equazione integrale Z t φ(t) = y0 + f (s, φ(s)) ds per ogni t ∈ [t0 , t1 ], t0
Si veda l’Esempio (VII.5) e la Pro-
posizione (VII.33) rispettivamente a pagina 332 e 344.
§ 3. Esistenza e unicità delle soluzioni per il problema ai valori iniziali
399
e ψ(t) una funzione definita su [t1 , t2 ] che sia soluzione dell’equazione integrale Z t ψ(t) = φ(t1 ) + f (s, ψ(s)) ds per ogni t ∈ [t1 , t2 ]. t1
Allora la funzione y(t) definita sull’unione dei due intervalli [t0 , t1 ] ∪ [t1 , t2 ] = [t0 , t2 ] dalla condizione φ(t) se t ∈ [t0 , t1 ] y(t) = ψ(t) se t ∈ [t1 , t2 ] è ben definita (dato che φ(t1 ) = ψ(t1 )), continua, e verifica Z t f (s, y(s)) ds se t ∈ [t0 , t1 ], y0 + t0 y(t) = Z Z t t φ(t1 ) + f (s, y(s)) ds = y0 + f (s, y(s)) ds se t ∈ [t1 , t2 ]. t1
Osserviamo che φ(t1 ) = y0 +
(VIII.19) Osservazione (Lipschitzianità). Se f ammette derivate parziali ∂ yi f continue e limitate da L0 sulla striscia I × Rn (e se f è continua su un insieme aperto contenente la striscia I × Rn ) allora per ogni t ∈ I e per ogni y1 , y2 ∈ Rn abbiamo la maggiorazione (segue banalmente dal risultato dell’Esercizio 35 a pagina 385) √ (10) k f (t, y1 ) − f (t, y2 )k ≤ Lky1 − y2 k, L = nL0 . L’ipotesi di esistenza di una costante L > 0 tale che valga la precedente disuguaglianza viene detta ipotesi di Lipschitz in y uniforme in t sulla striscia I × Rn . A questo punto siamo pronti a dimostrare il Teorema (VIII.10). Dimostrazione del Teorema (VIII.10). Passo 1. Come abbiamo visto nell’Osservazione (VIII.17), la risoluzione del problema (6) su un intervallo I0 = [t0 , t0 + δ] o I0 = [t0 − δ, t0 ] è equivalente alla ricerca di una funzione φ, definita e continua su I0 , che sia un punto fisso per l’operatore T : X → X definito da (9) sullo spazio metrico completo X = C(I0 , Rn ). A tal scopo tentiamo di applicare il Teorema delle contrazioni, visto nel § 5 del Capitolo VII, che assicura esistenza ed unicità di un punto fisso per una contrazione da uno spazio metrico completo in sé stesso. Serve semplicemente capire sotto quali condizioni l’operatore T : X → X è una contrazione. Mostriamo che se l’ampiezza dell’intervallo δ = |t1 − t0 | è sufficientemente piccola, allora T è una contrazione, cioè che esiste una costante α < 1 tale che ∀ψ1 , ψ2 ∈ X. d∞ T(ψ1 ), T(ψ2 ) ≤ αd∞ ψ1 , ψ2 , [Qua fugiunt hostes, via munienda est]
t1
f (s, y(s)) ds t0
e quindi se t ∈ [t1 , t2 ] Z t y(t) = φ(t1 ) + f (s, y(s)) ds
t0
da cui si deduce, per il Lemma (VIII.16), che y è una soluzione del problema ai valori iniziali (6) definito su tutto [t0 , t2 ]. Un procedimento analogo vale naturalmente nel caso in cui t2 < t1 < t0 oppure t2 < t0 < t1 .
Z
Z
t1
t1
Z
t
f (s, y(s)) ds
f (s, y(s)) ds +
= y0 + Z
t1
t0 t
f (s, y(s)) ds.
= y0 + t0
400
Sistemi di equazioni differenziali
Abbiamo la stima d∞ T(ψ1 ), T(ψ2 ) = maxkT(ψ1 )(t) − T(ψ2 )(t)k t∈I0
Z
≤ max t∈I0
≤ L max t∈I0
Infatti per ogni t kT(ψ1 )(t) − T(ψ2 )(t)k
Z t
=
f (s, ψ1 (s)) − f (s, ψ2 (s)) ds
t0
Z t k f (s, ψ1 (s)) − f (s, ψ2 (s))k ds; ≤
t
t0
Z
k f (s, ψ1 (s)) − f (s, ψ2 (s))k ds t
t0
kψ1 (s) − ψ2 (s)k ds Z
≤ Ld∞ kψ1 − ψ2 k∞ max t∈I0
t t0
t0
ds = Ld∞ ψ1 , ψ2 |t1 − t0 |.
Dunque T è una contrazione non appena si sceglie l’ampiezza dell’intervallo δ < 1/L. Per il Teorema delle Contrazioni (VII.36), segue che T ha un unico punto fisso, y = T(y), corrispondente ad una unica soluzione del problema ai valori iniziali in [t0 , t1 ] (o in [t1 , t0 ]). Passo 2. Procediamo come descritto nell’Osservazione (VIII.18), per piccoli passi (di ampiezza 1/(2L), per esempio). Illustriamo il prolungamento verso destra: il prolungamento verso sinistra è perfettamente analogo. Se b − t0 < 1/L, basta scegliere t1 = b e la procedura termina al primo passo con una soluzione definita su [t0 , b]. Altrimenti, si ponga t1 = t0 + 1/(2L): per quanto visto nell’osservazione (VIII.18) esiste una soluzione definita su [t0 , t1 ], che indichiamo con y1 . Consideriamo ora il nuovo problema ai valori iniziali ( y′ = f (t, y) y(t1 ) = y1 (t1 ). Applicando il ragionamento precedente a questo problema per l’intervallo [t1 , t2 ], con δ = |t2 −t1 | < 1/L, si trova che esso ha una (unica) soluzione, che chiameremo y2 , definita sull’intervallo [t1 , t2 ]. Come prima, se b − t1 < 1/L, si pone t2 = b, altrimenti t2 = t1 + 1/(2L). La funzione definita a pezzi come y1 (t) t ∈ [t0 , t1 ] y(t) = y2 (t) t ∈ [t1 , t2 ] è continua e derivabile in [t0 , t2 ] e risolve su questo intervallo il problema ai valori iniziali di partenza. Ora, se t2 = b abbiamo finito. Altrimenti si ripete la procedura, aggiungendo ad ogni passo un intervallo di ampiezza δ = 1/(2L) < 1/L su cui esiste unica la soluzione, fino a quando si raggiunge l’estremo destro b. La costruzione termina necessariamente in un numero finito N di passi, perché a ogni passo aumentiamo la lunghezza dell’intervallo di esistenza della soluzione di 1/(2L), fino quando t0 +N/(2L) ≥ b. Procedendo in modo analogo dal punto t0 fino all’estremo sinistro a otteniamo la soluzione definita sull’intervallo I assegnato.
(VIII.20) Osservazione. Nella dimostrazione del Teorema delle Contrazioni (VII.36) (a pagina 345) il punto fisso dell’operatore T : X → X viene determinato iterando l’operatore, cioè come limite della successione definita per ricorrenza a partire da un punto iniziale x0 = ξ ∈ X ( x0 = ξ xn = T(xn−1 ) se n > 0.
la seconda maggiorazione segue invece da quanto detto nell’Osservazione (VIII.19).
Per
una dimostrazione alternativa, che non necessita di questo secondo passo, rimandiamo all’Esercizio 8 al fondo del capitolo.
§ 3. Esistenza e unicità delle soluzioni per il problema ai valori iniziali
Sofja Kovalevskaja Sofja Vasilyevna Kovalevskaja (Sof~ Vasi& l~evna Kovale&vska(20) , nota anche come Sonia Kovalevsky, 1850–1891) scienziata, scrittrice, rivoluzionaria e femminista è un personaggio contraddittorio e moderno. La Kovalevskaja fu una seria e originale ricercatrice, pienamente inserita nei circoli matematici del tempo, ma fu anche un’anima libera ed appassionata, una donna di acuta intelligenza ed umanità, dotata di spirito e bellezza fuori dal comune. Grazie al giudizio di un professore, che la giudicò «un novello Pascal», riuscì a vincere le resistenze del padre e ad accedere come uditore all’Università di San Pietroburgo. Aderì al movimento nichilista, si sposò fittiziamente con Vladimir Kovalevskii e insieme fuggirono a Heidelberg dove Sofja potè frequentare l’Università. Abbandonato il marito, con cui si ricongiungerà più tardi, si spostò a Gottinga dove ottenne il Dottorato, prima donna europea dopo il Rinascimento. Si trasferì poi a Berlino, dove, grazie al suo talento di matematica divenne l’allieva prediletta, amica
e collaboratrice del grande Weierstrass. Portata dalla passione politica, insieme a quella scientifica, a girovagare per l’Europa, la Kovalevskaja, rimasta vedova con una figlia piccola, approdò a Stoccolma dove potè finalmente iniziare la carriera di docente universitaria. I suoi lavori la collocano tra i grandi matematici del secolo scorso. Si occupò principalmente di analisi e un famoso teorema, l’analogo per le equazioni alle derivate parziali del Teorema (VIII.9) di esistenza e unicità locale, porta oggi il suo nome. Fra i suoi lavori ricordiamo, inoltre, una ricerca sulla propagazione della luce in un mezzo cristallino ed uno studio sugli anelli di Saturno. Nel 1888 ricevette il prestigioso premio Bordin dall’Académie des Sciences francese per un lavoro sulla rivoluzione di un corpo rigido intorno a un punto. Riportiamo una sua famosa citazione: “Chi non ha mai avuto occasione di approfondire la conoscenza della matematica, la confonde con l’aritmetica e la considera un’arida scienza. In realtà è una scienza che richiede molta immaginazione. Uno dei più grandi matematici del nostro secolo osserva giustamente che è impossibile essere matematico senza avere l’animo del poeta. È necessario rinunciare all’antico pregiudizio secondo il quale il poeta deve inventare qualcosa che non esiste, che immaginazione e invenzione sono la stessa cosa. A me pare che il poeta deve soltanto percepire qualcosa che gli altri non percepiscono, vedere più lontano degli altri. E il matematico deve fare la stessa cosa.”
Questo metodo naturalmente può essere applicato direttamente all’operatore integrale definito in (9), per definire una successione di funzioni continue sull’intervallo [t0 , t1 ] che converge uniformemente alla soluzione del problema ai valori iniziali. Partendo dalla funzione costante y0 (t) = y0 (o da una qualsiasi altra funzione) si può costruire la successione di funzioni yn in X = C([t0 , t1 ]), definita per ricorrenza da Z
t
(11) yn (t) = y0 +
401
f (s, yn−1 (s)) ds. t0
La successione così definita è detta successione delle iterate di Picard, o di Picard–Liouville, e converge uniformemente alla soluzione, a patto che l’ampiezza dell’intervallo sia sufficientemente piccola (come nella dimostrazione sopra).
Ricordiamo
che la convergenza uniforme è la convergenza nella norma k·k∞ di C([t0 , t1 ]).
402
Sistemi di equazioni differenziali
(VIII.21) Esempio. Costruiamo la successione yn delle iterate di Picard per la soluzione del problema di Cauchy ( y′ = ay y(0) = 1. Rt Se y0 = 1, il primo elemento della successione è y1 (t) = y0 + 0 f (y0 ) ds = Rt 1 + 0 a ds = 1 + at. Calcoliamo i successivi: Z t a2 t 2 y2 (t) = 1 + a(1 + as) ds = 1 + at + 2 0 ! Z t 2 2 a2 t 2 a3 t 3 as + y3 (t) = 1 + ds = 1 + at + a 1 + as + 2 2 3! 0 ... Z
t
yn (t) = 1 + 0
n−1 n X X ak sk ak t k . a ds = k! k! k=0
k=0
Osserviamo che la successione delle iterate di Picard yn converge, uniformemente su ogni intervallo limitato [a, b] ⊂ R, alla funzione +∞ k k X at k=0
k!
= eat .
Torniamo alla dimostrazione del Teorema (VIII.9). Cercheremo di modificare la prima parte della dimostrazione del Teorema (VIII.10), in modo che funzioni anche in questo contesto più generale, dando una soluzione locale del problema ai valori iniziali come punto fisso di un opportuno operatore. Dimostrazione del Teorema (VIII.9). La ipotesi di continuità delle derivate parziali ∂yi f implica la loro limitatezza su ogni sottoinsieme K ⊂ A ⊂ R × Rn chiuso e limitato, ma non necessariamente su tutto A. Quindi, in base a quanto detto nell’Osservazione (VIII.19), per ogni insieme chiuso e limitato K ⊂ A esiste una costante LK (dipendente da K) tale che, per ogni (t, y1 ), (t, y2 ) ∈ K si ha k f (t, y1 ) − f (t, y2 )k ≤ LK ky1 − y2 k, ovvero f risulta essere localmente Lipschitziana rispetto a y uniformemente in t. Per a > 0 e b > 0 definiamo il “rettangolo” chiuso (e limitato) R = R(a, b) = {(t, y) ∈ R×Rn : |t−t0 | ≤ a, ky− y0 k ≤ b}. Consideriamo a e b abbastanza piccoli, per cui R ⊂ A (A è aperto, e quindi esistono tali a e b). La disuguaglianza (10) risulta essere soddisfatta per una certa costante che dipende da R, che indichiamo con LR . Ripercorriamo la dimostrazione del Teorema (VIII.10): l’intervallo su cui cercheremo la soluzione sarà un intervallo del tipo I0 = [t0 − δ, t0 + δ], con δ da determinare (piccolo a piacere). Invece di tutto lo spazio metrico completo X = C(I0 , Rn ), ne consideriamo il sottoinsieme chiuso Y = φ ∈ C(I0 , Rn ) : kφ(t) − y0 k ≤ b .
Ma non
su tutto R!
converge uniformemente
§ 3. Esistenza e unicità delle soluzioni per il problema ai valori iniziali
In quanto sottoinsieme chiuso dello spazio metrico completo (C(I0 , Rn ), d∞ ), è a sua volta uno spazio metrico completo. L’operatore T (definito in (9)) risulta ben definito da Y in Y se kT(φ)(t) − y0 k ≤ b,
403
Si veda l’Esercizio 21 a pagina 384.
∀t ∈ I0 .
Se MR = maxR f (t, y), abbiamo la stima Z t kT(φ)(t) − y0 k ≤ k f (s, φ(s))k ds ≤ MR (t − t0 ) ≤ MR δ. t0
Quindi se si sceglie δ ≤ b/MR , si ha T(φ) ∈ Y per ogni φ ∈ Y. Possiamo così concludere che se ( ) 1 b δ = min , ,a 2LR MR allora T è una contrazione dallo spazio metrico completo Y in se stesso, dunque ammette un unico punto fisso corrispondente ad una unica soluzione del problema ai valori iniziali in I0 .
Il teorema di esistenza locale può essere certamente usato poi per prolungare la soluzione anche oltre l’intervallo su cui si è trovata, mediante l’Osservazione (VIII.18), ragionando esattamente come nel secondo passo della dimostrazione del Teorema (VIII.10). In questo caso però l’ampiezza degli intervalli [ti , ti+1 ] su cui sono definiti i pezzi potrebbe non essere costante (dipende dalla costante di Lipschitz LR e dalle misure a e b dei rettangoli R(a, b)). Potrebbe essere il termine di una serie convergente (come 2−n ), oppure divergente. Così facendo otteniamo il più grande intervallo su cui è definita la (unica) soluzione del problema (6). (VIII.22) Definizione. Poniamo Tmax = sup{t1 > t0 : la soluzione di (6) è prolungabile su [t0 , t1 ]} e Tmin = inf{t1 < t0 : la soluzione di (6) è prolungabile su [t1 , t0 ]}. Allora l’intervallo massimale di definizione della soluzione di (6) è Imax = (Tmin , Tmax ). (VIII.23) Osservazione. Vale la pena di notare che, se f soddisfa le ipotesi del Teorema (VIII.9) di esistenza ed unicità, Imax non può contenere Tmin e Tmax . Infatti se ad esempio avessimo Tmax ∈ Imax , vorrebbe dire che la soluzione y (è definita e) risolve l’equazione in t = Tmax . In particolare il punto (Tmax , y(Tmax )) apparterrebbe al dominio A di f , perciò sarebbe possibile usare tale punto come dato iniziale per un nuovo problema di Cauchy. Grazie a quanto visto nell’Osservazione (VIII.18) otterremmo di fatto un prolungamento della soluzione oltre Tmax , in contrasto con la sua definizione. In prossimità di Tmax abbiamo quindi quattro possibilità:
Eventualmente può accadere che Tmax = +∞ e/o Tmin = −∞.
404
Dipendenza continua dai dati Nelle ipotesi del Teorema (VIII.10) di esistenza e unicità globali possiamo risolvere i problemi di Cauchy per ogni coppia di valori iniziali (t0 , y0 ). In questo modo è definita, per ogni t ∈ (a, b), la funzione che associa a y l’unica soluzione del problema di Cauchy (6) con dato iniziale y0 = y, calcolata al tempo t. Indichiamo con Φ(t, y; t0 ) tale valore. È naturale porsi il problema della continuità di tale funzione, rispetto alle variabili (t, y). Questo problema rientra in quello della dipendenza continua della soluzione dai dati, dove per «dati» intendiamo sia la condizione iniziale che la forma stessa dell’equazione differenziale; ci chiediamo se, variando di poco il modello, la soluzione a sua volta vari di poco. Una risposta affermativa a questa domanda è di particolare importanza, poiché ci consente di non preoccuparci troppo degli intrinseci errori che si commettono misurando le variabili fisiche che descrivono lo stato di un sistema; non solo, ci autorizza anche all’utilizzo di metodi numerici per il calcolo di soluzioni approssimate. Un problema
Sistemi di equazioni differenziali
che goda delle tre proprietà di esistenza, unicità e dipendenza continua dai dati viene detto problema ben posto. È possibile – e non eccessivamente difficile, come si vede nell’Esercizio 12 – dimostrare il risultato seguente: Corollario. Nelle ipotesi del Teorema (VIII.10), si ha kΦ(t, y1 ; t0 ) − Φ(t, y2 ; t0 )k ≤ ky1 − y2 keL|t−t0 | ,
dove L è la costante dell’equazione (10). In altre parole, le soluzioni corrispondenti a dati iniziali vicini sono vicine fra loro in ogni intervallo limitato di tempi. Tuttavia, esse possono divergere quando t tende all’infinito. Per esempio, nell’equazione lineare y′ = y ogni soluzione con dato iniziale non nullo, per quanto piccolo, si discosterà dallo zero a velocità esponenziale nel tempo. La stabilità di una soluzione, è invece quella proprietà per cui tutte le altre soluzioni, se partono con dati iniziali vicini, sono prossime ad essa per tutti i tempi. Esamineremo le proprietà relative alla nozione di stabilità delle soluzioni in alcuni semplici casi nel § 7.
➔ Tmax < +∞, limt→Tmax y(t) non esiste;
Spesso,
➔ Tmax < +∞, limt→Tmax y(t) = L ∈ R, nel qual caso il punto (Tmax , L) ∈ ∂A (la soluzione “muore” perché esce dal dominio di definizione dell’equazione differenziale); ➔ Tmax < +∞, limt→Tmax y(t) = ±∞, la soluzione “esplode” in tempo finito e presenta un asintoto verticale in corrispondenza di t = Tmax ;
sfruttando queste considerazioni, è possibile dimostrare che una soluzione è definita su tutto R (cioè che Imax = (−∞, +∞)) anche in situazioni in cui non è possibile applicare il Teorema (VIII.10) di esistenza globale. Si veda a tal proposito l’Esercizio (VIII.4) a pagina 441.
➔ Tmax = +∞, la soluzione è prolungabile indefinitamente (nel futuro). Analoghe considerazioni valgono in prossimità di Tmin .
§ 4. Equazioni differenziali lineari Nel Capitolo I abbiamo studiato le equazioni lineari scalari; vogliamo ora dedicarci alla loro generalizzazione vettoriale. Come qualcuno ricorderà, l’insieme di tutte le matrici quadrate n × n costituisce uno spazio vettoriale di dimensione n2 rispetto alla somma componente-per-componente di matrici e la moltiplicazione per uno scalare. Se i coefficienti di una matrice non sono costanti ma dipendono (con continuità) dalla variabile t, definita in un certo intervallo I ⊂ R, allora si ha una curva di matrici (nello spazio di tutte le matrici), ovvero una funzione matriciale continua,
Ci
si può rinfrescare la memoria con la Definizione (IV.1) a pagina 164, e con l’importante lista nell’Esempio (IV.5). Gli n2 vettori della base standard sono le matrici con tutti i coefficienti zero tranne uno, che è uguale a 1.
§ 4. Equazioni differenziali lineari
405
che indicheremo con la consueta simbologia A(t), per t ∈ I. Consideriamo l’equazione differenziale (1) in Rn , e supponiamo che la funzione f (t, y) si scriva come f (t, y) = A(t)y + b(t) per una funzione matriciale A(t) e una funzione vettoriale b(t) date. Cioè, consideriamo l’equazione differenziale lineare
Una funzione matriciale continua,
dunque, non è altro che una funzione continua a valori nello spazio delle 2 matrici n × n, identificato con Rn .
(12) y′ = A(t)y + b(t). Se il termine b(t) è zero, allora l’equazione è detta lineare omogenea e si scrive come (13) y′ = A(t)y. La prima proprietà saliente delle equazioni differenziali lineari vettoriali è che esse hanno esistenza e unicità globale delle soluzioni dei problemi ai valori iniziali. (VIII.24) Teorema (esistenza e unicità globale). Se la matrice dei coefficienti A(t) e il termine b(t) sono funzioni continue di t in un intervallo I = [a, b], allora per ogni istante t0 ∈ I e per ogni dato iniziale y0 ∈ Rn il problema ai valori iniziali (
y′ = A(t)y + b(t) y(t0 ) = y0
ha una e una sola soluzione definita su tutto l’intervallo I. Dimostrazione. Verifichiamo che le ipotesi del Teorema (VIII.10) di esistenza e unicità globale sono verificate. La funzione f (t, y) = A(t)y + b(t) è certamente continua; inoltre se le funzioni vettoriali ai (t) indicano le colonne di A, per i = 1, . . . , n, allora le n derivate parziali di f in y sono n X ∂yi ai (t)yi + b(t) = ai (t), i=1
che sono per ipotesi funzioni continue in I × Rn (A(t) è continua). In particolare, le funzioni vettoriali ai (t) sono quindi limitate su [a, b]: per ogni i = 1, . . . , n esiste una costante Li tale che kai (t)k ≤ Li ,
La funzione f (t, y) risulta lineare nella variabile y se l’equazione è omogenea. Altrimenti, per b(t) , 0, è quella che si dice una trasformazione lineare affine del vettore y.
∀t ∈ I.
Ponendo L0 = maxi=1,...,n Li si ha kai (t)k ≤ L0 , ∀t ∈ I, ∀i = 1, . . . , n.
Il prossimo lemma riprende una proprietà formale delle equazioni lineari, già vista nel caso scalare (Esercizio 37 a pagina 32). (VIII.25) Lemma (Principio di sovrapposizione). Se u(t) è una soluzione dell’equazione y′ = A(t)y + b(t) e v(t) è una soluzione dell’equazione ˆ , allora la somma u(t) + v(t) è soluzione della somma delle y′ = A(t)y + b(t) ′ ˆ equazioni y = A(t)y + [b(t) + b(t)].
L’esistenza
e unicità globale per le equazioni lineari scalari sono già state dimostrate nell’Esercizio 26 a pagina 31.
406
Sistemi di equazioni differenziali
Dimostrazione. Sommiamo termine a termine le equazioni u′ (t) = A(t)u(t) + b(t)
e
ˆ v′ (t) = A(t)v(t) + b(t)
ˆ da cui otteniamo u′ (t) + v′ (t) = A(t)u(t) + b(t) + A(t)v(t) + b(t) ˆ [u(t) + v(t)]′ = A(t)[u(t) + v(t)] + [b(t) + b(t)]
(VIII.26) Teorema. Se la funzione matriciale A(t) è continua nell’intervallo I ⊂ R, allora l’insieme S di tutte le soluzioni definite su I dell’equazione differenziale omogenea in Rn y′ = A(t)y costituisce uno spazio vettoriale di dimensione n. Dimostrazione. Cominciamo a mostrare che S è uno spazio vettoriale. Per il Principio di sovrapposizione, se u e v sono due soluzioni di y′ = A(t)y, allora anche la somma è una soluzione. Se c ∈ R è uno scalare e u è una soluzione, allora cu è una soluzione, infatti
Per la linearità del prodotto di una matrice per un vettore.
d (cu) = cu′ = c[A(t)u] = A(t)(cu). dt Quindi S è uno spazio vettoriale. Sia t0 un istante dell’intervallo di tempo I ⊂ R. Per il Teorema (VIII.24), per ogni y0 ∈ Rn esiste un’unica soluzione u (cioè un elemento di S) che soddisfa la condizione iniziale u(t0 ) = y0 . In altre parole, c’è una corrispondenza biunivoca tra i dati iniziali y0 ∈ Rn e le soluzioni in S. Cerchiamo di determinare una base per S, sfruttando questa corrispondenza. Ai vettori della base standard di Rn (che indichiamo con e1 , e2 , . . . , en ) corrisponderanno quindi le soluzioni degli n problemi ai valori iniziali ( y′ = A(t)y
Infatti
per la Definizione (IV.15) (a pagina 169) la dimensione di uno spazio vettoriale è il numero di elementi di una sua qualsiasi base.
y(t0 ) = ei , che indicheremo con φ1 , φ2 , . . . , φn ∈ S. Avremo concluso quando avremo mostrato che si tratta di una base di S. Siano c1 , c2 , . . . , cn scalari reali per cui la combinazione lineare c1 φ1 + c2 φ2 + . . . + cn φn = 0 sia zero (in S, cioè nello spazio di tutte le soluzioni). In particolare, valutando l’equazione precedente in t = t0 , si ha c1 φ1 (t0 ) + c2 φ2 (t0 ) + . . . + cn φn (t0 ) = 0 =⇒ c1 e1 + c2 e2 + . . . + cn ei = 0 da cui segue che ci = 0 per ogni i, cioè che le φi sono linearmente indipendenti. Per mostrare che costituiscono una base, dobbiamo mostrare che ogni elemento di S è combinazione lineare delle φi . Sia quindi φ una soluzione. Lo stato iniziale φ(t0 ) ∈ Rn è certamente combinazione lineare degli ei , cioè esistono n costanti scalari ci (le coordinate di φ(t0 ) nella base standard) per cui φ(t0 ) = c1 e1 + c2 e2 + . . . + cn en .
ATTENZIONE! Le n funzioni f1 , . . . , fn sono linearmente dipendenti se esistono n numeri reali c1 , . . . , cn per cui c1 f1 + . . . + cn fn = 0, cioè per ogni t si ha vale c1 f1 (t) + . . . + cn fn (t) = 0 (e gli scalari non dipendono da t).
⊚
§ 4. Equazioni differenziali lineari
407
ˆ la funzione definita da Sia ora φ ˆ = c1 φ1 (t) + c2 φ2 (t) + . . . + cn φn (t). φ(t) ˆ sono elementi di S (risolvono l’equazione omogenea), e assumono Sia φ che φ lo stesso valore in t = t0 , infatti ˆ 0 ). φ(t0 ) = c1 e1 + c2 e2 + . . . + cn en = c1 φ1 (t0 ) + c2 φ2 (t0 ) + . . . + cn φn (t0 ) = φ(t Ma per l’unicità non possono esserci due soluzioni diverse allo stesso problema ˆ cioè φ è combinazione lineare delle φi . ai valori iniziali, e quindi φ = φ,
In particolare, il ragionamento appena utilizzato si può ripetere per dimostrare il seguente fatto: (VIII.27) Se φ1 , φ2 , . . . , φn ∈ S sono n soluzioni tali che i vettori φ1 (t), φ2 (t), . . . , φn (t) sono linearmente dipendenti per t = t0 allora sono linearmente dipendenti per ogni t, e viceversa. (VIII.28) Corollario. Se la funzione matriciale A(t) è continua nell’intervallo I ⊂ R, e w1 , w2 , . . . , wn sono n soluzioni linearmente indipendenti dell’equazione differenziale omogenea y′ = A(t)y, allora la soluzione generale è data da tutte le combinazioni lineari y = c1 w1 + c2 w2 + . . . + cn wn . Data l’equazione omogenea y′ = A(t)y, una base dello spazio S delle soluzioni (cioè ogni insieme di n soluzioni linearmente indipendenti) viene detto un insieme fondamentale di soluzioni per l’equazione. (VIII.29) Esempio (Equazioni lineari di ordine n). L’equazione differenziale scalare di ordine n in forma normale lineare si può scrivere come (14) y(n) (t) = an−1 (t)y(n−1) (t) + . . . + a1 (t)y′ (t) + a0 (t)y(t) + b(t). La corrispondente equazione omogenea è (15) y(n) (t) = an−1 (t)y(n−1) (t) + . . . + a1 (t)y′ (t) + a0 (t)y(t). Ricordiamo come nell’Esempio (VIII.3) si è ricondotta un’equazione differenziale scalare di ordine n all’equazione vettoriale del primo ordine (3). L’equazione vettoriale corrispondente è, con la notazione matriciale (si ricordi il prodotto righe per colonne), ′ 1 0 ··· 0 y1 0 y1 0 y′ 0 0 1 ··· 0 y2 0 2 . . . . .. .. + .. . .. .. .. (16) .. = .. . . . . ′ y 0 0 0 · · · 1 yn−1 0 n−1 ′ yn a0 (t) a1 (t) a2 (t) · · · an−1 (t) yn b(t)
Ripetiamo il ragionamento. Le φi sono linearmente dipendenti in un istante t0 (cioè i loro valori vettoriali lo sono) se esistono c1 , . . . , cn ∈ R, non tutti nulli, tali che c1 φ1 (t0 ) + . . . + cn φn (t0 ) = 0 ∈ Rn .
Ma allora la funzione
φ(t) = c1 φ1 (t) + . . . + cn φn (t) risolve l’equazione y′ = A(t)y e φ(t0 ) = 0. Per unicità otteniamo φ(t) ≡ 0, dato che anche la funzione costante 0 risolve lo stesso problema ai valori iniziali. Cioè se le φi sono dipendenti in t0 , lo sono sempre (con la stessa combinazione lineare). Ragionando allo stesso modo, se fossero dipendenti in un qualche t lo sarebbero anche in t0 : quindi se sono indipendenti in t0 lo sono sempre.
408
Sistemi di equazioni differenziali
Supponiamo di conoscere n soluzioni scalari w1 (t), · · · , wn (t), linearmente indipendenti dell’equazione omogenea associata. Ad esse corrispondono le soluzioni vettoriali wn (t) w2 (t) w1 (t) w′n (t) w′ (t) w′ (t) 2 1 w1 (t) = .. .. .. , · · · , wn (t) = , w2 (t) = . . . (n−1) (n−1) (n−1) w2 (t) w1 (t) wn (t)
Cioè
tali che, se c1 w1 (t) + · · · cn wn (t) = 0, per ogni t, allora c1 = · · · = cn = 0.
anch’esse linearmente indipendenti (si veda l’Esercizio 22 a pagina 453). La soluzione generale dell’equazione scalare sarà dunque data da tutte le combinazioni lineari y = c1 w1 + . . . + cn wn , mentre la soluzione generale del sistema associato è l’insieme di tutte le combinazioni lineari y = c1 w1 + c2 w2 + . . . + cn wn . La struttura di spazio vettoriale dell’integrale generale dell’equazione omogenea si riflette, tramite il principio di sovrapposizione, su quella dell’insieme delle soluzioni dell’equazione non omogenea, che risulta essere uno spazio affine (si veda l’approfondimento a pagina 409). (VIII.30) Corollario. Se la funzione matriciale A(t) è continua nell’intervallo I ⊂ R, e yp è una soluzione (detta soluzione particolare) dell’equazione completa y′ = A(t)y + b(t), allora tutte le altre soluzioni si scrivono come y = yp + w,
Abbiamo già dimostrato questo fatto, nel caso n = 2, nell’Esercizio 34 a pagina 32.
dove w è una soluzione dell’equazione omogenea y′ = A(t)y. La soluzione generale è quindi la somma di una soluzione particolare dell’equazione completa e della soluzione generale dell’equazione omogenea, ovvero y = yp + c1 w1 + c2 w2 + . . . + cn wn .
Qui w1 , . . . , wn ′
Dimostrazione. Se yp e y entrambe risolvono y = A(t)y + b(t), allora la loro differenza φ = y − yp (per il principio di sovrapposizione) risolve l’equazione omogenea y′ = A(t)y, e quindi è combinazione lineare degli elementi φi di una base per lo spazio delle soluzioni (dell’omogenea), appunto un insieme fondamentale di soluzioni.
è un insieme fondamentale di soluzioni dell’equazione omogenea associata.
(VIII.31) Esempio. Torniamo all’Esempio (VIII.2), in cui abbiamo trasformato in sistema del primo ordine l’equazione lineare del secondo ordine
Il Corollario (VIII.30) è particolar-
x′′ (t) + bx′ (t) + cx(t) = 1(t), con b, c ∈ R costanti e 1(t) funzione data, equivalente al sistema " # " # ( ′ y1 = y2 0 1 0 ′ ⇐⇒ y = y+ . −c −b 1(t) y′2 = −by2 − cy1 + 1(t),
mente utile tutte volte che, magari con un po’ di fantasia, riusciamo ad indovinare una soluzione particolare dell’equazione non omogenea insieme a due (o n) soluzioni linearmente indipendenti di quella omogenea, come nel caso dell’Esercizio (I.8) a pagina 25.
§ 4. Equazioni differenziali lineari
Sistemi lineari differenziali e non a confronto
Un teorema sulla struttura dell’insieme delle soluzioni, analogo al Corollario (VIII.28), era stato già incontrato per sottospazi lineari (affini) di Rn , cioè le soluzioni di sistemi di equazioni lineari. Per quanto abbiamo visto nel Teorema (III.12) a pagina 105, l’insieme di soluzioni di un sistema di k equazioni in n incognite si scrive come {P + t1 v1 + t2 v2 + . . . + td vd : t1 , t2 , . . . , td ∈ R} , n
dove P è un punto di R e i vettori vi sono soluzioni dell’equazione omogenea. Il punto P corrisponde alla soluzione particolare yp , i vettori vi alle soluzioni fondamentali φi . Non è una coincidenza: un sistema di k equazioni in n variabili si scrive come Av = b,
409
con A matrice (k × n) e b vettore di Rk . L’operatore lineare L : Rn → Rk definito da Lv = Av ha per nucleo l’insieme di soluzioni dell’equazione omogenea Lv = 0. Quindi le soluzioni dell’equazione non omogenea Lv = b sono formate dalla soluzione particolare più le soluzioni della omogenea. L’analogia con il Corollario (VIII.30) deriva dal fatto che se si definisce l’operatore differenziale lineare L : C1 (I, Rn ) → C(I, Rn ),
y 7→ Ly = y′ − A(t)y,
il cui nucleo è composto dalle soluzioni dell’equazione omogenea y′ = A(t)y, allora le soluzioni S dell’equazione lineare completa, y′ = A(t)y + b(t), non sono altro che le soluzioni in C1 (I, Rn ) dell’equazione Ly = b,
che quindi saranno date da una soluzione particolare più gli elementi del nucleo di L.
Si tratta di un sistema lineare in dimensione n = 2, e quindi se w1 e w2 sono due soluzioni indipendenti dell’equazione omogenea associata e yp una soluzione particolare, per il Corollario (VIII.30) l’insieme delle soluzioni è dato da y(t) = yp (t) + c1 w1 (t) + c2 w2 (t). Osserviamo che si può tornare al caso scalare considerando semplicemente la prima componente dei vettori (la seconda componente ne è la derivata). Nel Capitolo I, § 4, sono state presentate coppie di soluzioni (linearmente indipendenti) dell’equazione omogenea. Il Teorema (VIII.26) garantisce quindi che non ci sono altre soluzioni, come anticipato a pagina 16.
Matrice wronskiana e risolvente Torniamo a ragionare su un insieme fondamentale di soluzioni per l’equazione omogenea y′ = A(t)y, ovvero su una base dello spazio delle sue soluzioni. La matrice W = (w1 , w2 , . . . , wn ) che ha per colonne gli elementi di un insieme fondamentale di soluzioni è detta a sua volta matrice fondamentale di soluzioni. In genere è denotata con il simbolo W(t) (è detta a volte matrice wronskiana delle n soluzioni w1 , w2 , . . . , wn ). Se indichiamo con c = (c1 , . . . , cn ) il vettore delle costanti arbitrarie otteniamo che, con questa notazione, la soluzione generale dell’equazione omogenea si scrive come y = c1 w1 + c2 w2 + . . . + cn wn = W(t)c.
Nel caso in cui il sistema proven-
ga da un’equazione lineare di ordine n, come nell’Esempio (VIII.29), una matrice wronskiana avrà la forma w (t) ··· wn (t) ′1 w1 (t) ··· w′n (t) .. .. W(t) = . . . (n−1) (n−1) w1 (t) · · · wn (t)
410
Sistemi di equazioni differenziali
Se vogliamo che sia soddisfatta una data condizione iniziale y(t0 ) = y0 sarà sufficiente scegliere y(t) = W(t)W(t0 )−1 y0 . Ogni matrice wronskiana contiene dunque le informazioni necessarie per risolvere tutti i problemi di Cauchy. Abbiamo ora bisogno di estendere le operazioni di derivazione e di integrazione alle funzioni matriciali. Se i coefficienti di A(t) sono le n2 funzioni ai j (t), allora i coefficienti della derivata A′ (t) sono le n2 derivate R t2 R t2 a′i j (t). Analogamente i coefficienti di t A(t) dt sono t ai j (t) dt. È facile 1 1 mostrare che valgono le regole di derivazione per somme e prodotti: d [A(t) + B(t)] = A′ (t) + B′(t) e dt
d [A(t)B(t)] = A′ (t)B(t) + A(t)B′(t). dt
Poiché A(t)W(t) = (A(t)w1 (t), A(t)w2(t), . . . , A(t)wn (t)), otteniamo il seguente risultato. (VIII.32) Proposizione. La funzione matriciale W(t) soddisfa l’equazione differenziale lineare omogenea
Si noti
che, in base alla Proposizione (VIII.27), ogni matrice wronskiana W(t) è invertibile in ogni istante t.
Possiamo anche interpretare A come funzione a valori nello spazio normato delle matrici. La norma di una matrice A può essere definita, in analogia con la norma euclidea in Rn come sX kAk = a2i j .
i,j
La funzione A(t) è continua o differenziabile se sono continue o differenziabili le sue componenti le ai j (t) (si veda anche l’Esercizio 24 ).
W ′ = A(t)W. Nel caso in cui l’insieme fondamentale di soluzioni W(t) soddisfi anche la condizione iniziale W(0) = In (cioè wi (0) = ei per i = 1, . . . , n, dove i vettori ei sono i versori della base standard di Rn ), la matrice fondamentale viene anche detta matrice risolvente o matrice di transizione, e viene indicata anche con Φ(t). L’unica soluzione dell’equazione y′ = A(t)y che soddisfa la condizione iniziale y(0) = y0 ∈ Rn può essere calcolata facilmente a partire da Φ(t), come prodotto con il dato iniziale
A
volte è utile esprimere esplicitamente la dipendenza dal tempo iniziale, e quindi si scrive Φ(t, 0).
Infatti, derivando si ottiene
y(t) = Φ(t)y0 .
y′ (t) = Φ′ (t)y0 = A(t)Φ(t)y0 = A(t)y(t), e valutando per t = 0
(VIII.33) Esempio. Consideriamo l’equazione del secondo ordine
y(0) = Φ(0)y0 = In y0 = y0 .
x′′ (t) − x′ (t) − x(t) = 0, caso particolare dell’Esempio (VIII.31). Da quanto visto nel Capitolo I, le soluzioni sono λ1 t
x(t) = c1 e
λ2 t
+ c2 e
,
dove λ1 > 0 > λ2 sono le radici del polinomio caratteristico P2 (λ) = λ2 − λ − 1. Il sistema piano corrispondente (ponendo y = x′ ) è ( ′ " ′# " #" # " # x =y x 0 1 x x ⇐⇒ ′ = =A . y 1 1 y y y′ = x + y
Le due radici sono
√ √ 1− 5 1+ 5 , λ2 = . 2 2 Vale la pena di riandare a pagina 206, dove per la stessa matrice (con le righe scambiate), sono stati trovati i due autovalori, insieme con gli autovettori corrispondenti √ √ b1 = (1, (1+ 5)/2), b2 = (1, (1− 5)/2). λ1 =
§ 4. Equazioni differenziali lineari
411
Come abbiamo imparato nell’Esempio (VIII.29), un sistema fondamentale di soluzioni è " λt # " λt # e 1 e 2 w1 (t) = w2 (t) = . λ1 eλ1 t λ2 eλ2 t Perciò la matrice wronskiana che ha per colonne queste due soluzioni vettoriali è # " λt e 1 eλ2 t W(t) = λ1 eλ1 t λ2 eλ2 t " # 1 1 Ovviamente abbiamo W(0) = S = (b1 , b2 ) = , I2 e pertanto, se λ1 λ2 vogliamo trovare la matrice risolvente, dovremo moltiplicare la matrice wronskiana per l’inversa di W(0): calcoliamo 1 − λ2 − λ2 W −1 (0) = λ1λ− λ2 λ1−1 1 λ1 − λ2 λ1 − λ2 di modo che " 1 −λ2 eλ1 t + λ1 eλ2 t Φ(t) = W(t)W (0) = λ1 − λ2 −λ1 λ2 eλ1 t + λ1 λ2 eλ2 t −1
# eλ1 t − eλ2 t . λ1 eλ1 t − λ2 eλ2 t
È importante osservare che w1 (t) = eλ1 t b1
w2 (t) = eλ2 t b2 .
Dunque l’integrale generale dell’equazione vettoriale è y(t) = c1 eλ1 t b1 + c2 eλ2 t b2 .
Il Lettore può facilmente verificare che in effetti " λt λ e 1 W ′ (t) = 12 λ1 t λ1 e
# " λ2 eλ2 t 0 = 1 λ22 eλ2 t
Come
già osservato a suo tempo a pagina 206, (b1 , b2 ) è una base diagonalizzante per A: infatti se S = (b1 , b2 ) si ha " # λ 0 S−1 AS = 1 . 0 λ2
Come già detto, le soluzioni hanno la forma y(t) = c1 eλ1 t b1 + c2 eλ2 t b2 , e sono definite su tutto l’asse reale (come potevamo aspettarci dal Teorema (VIII.24)). Dato che il sistema è autonomo, possiamo interpretarle come le equazioni parametriche delle traiettorie del sistema nel piano delle fasi xy. Se ad esempio c2 = 0 e c1 > 0, la corrispondente soluzione diviene y(t) = c1 eλ1 t b1 , la cui traiettoria è la semiretta parallela all’autovettore b1 : inoltre, poiché λ1 > 0, la semiretta è percorsa nel verso uscente dall’origine; per ogni c1 > 0 otteniamo quindi la medesima traiettoria. Analogamente se c2 = 0 e c1 < 0 otteniamo la semiretta opposta alla precedente, sempre percorsa in senso uscente. Analogamente avviene per le traiettorie corrispondenti alle soluzioni con c1 = 0, che questa volta sono percorse in senso entrante verso l’origine, poiché λ2 < 0. Se infine c1 = c2 = 0 la traiettoria si riduce ad un punto (l’origine). Di conseguenza, se c1 = 0 o c2 = 0 si ottengono traiettorie rettilinee, lungo le rette di equazioni r1 (s) = sb1 e r2 (s) = sb2 . Lungo una soluzione, la pendenza y/x è uguale al quoziente (c1 λ1 eλ1 t + c2 λ2 eλ2 t )/(c1 eλ1 t + c2 eλ2 t ). Poiché λ1 > λ2 , possiamo concludere che tutte le traiettorie, con c1 e c2 diversi da zero, hanno direzioni asintotiche alla retta r1 per t → +∞ ed alla retta r2 , per per t → −∞. Possiamo vederne alcune rappresentate in Figura VIII.5.
# 1 W(t). 1
F VIII.5
412
Sistemi di equazioni differenziali
§ 5. Sistemi lineari omogenei a coefficienti costanti Consideriamo il caso particolare di un’equazione lineare omogenea del tipo (13) in cui A è una matrice n × n a coefficienti costanti (reali) (17) y′ = Ay,
detto sistema lineare omogeneo a coefficienti costanti. Per risolvere completamente il problema occorre determinare n soluzioni linearmente indipendenti o, meglio ancora, trovare la matrice risolvente del sistema, cioè la soluzione (matriciale) del problema ai valori iniziali matriciale ( Φ′ = AΦ (18) Φ(0) = In .
Dato
che la matrice non dipende dal tempo, il sistema è autonomo. Faremo quindi utilizzo sistematico, almeno quando n = 2, della rappresentazione grafica delle traiettorie nel piano delle fasi xy (come visto nell’Esempio (VIII.33)). In particolare, osserviamo subito che y(t) ≡ 0 è sempre soluzione dell’equazione data, perciò l’origine del piano xy è sempre una traiettoria del sistema (costituita da un unico punto).
(VIII.34) Osservazione (La funzione Φ(t) come flusso di trasformazioni dello spazio). Il punto di Rn che al tempo 0 è in y0 verrà trasportato, al tempo t1 , nel punto y1 = Φ(t1 )y0 . Allora per ogni t ∈ R la matrice Φ(t) rappresenta una trasformazione di Rn in sé, con le seguenti proprietà: Φ(0)x = x per ogni x ∈ Rn (cioè Φ(0) è l’identità); Φ(t) [Φ(s)x] = Φ(t)Φ(s)x = Φ(t + s)x. Queste due proprietà implicano in particolare che Φ(−t)Φ(t) = In , cioè che Φ(−t) rappresenta la trasformazione inversa di Φ(t), dato che ne è la matrice inversa. Osserviamo che queste proprietà sono le stesse di cui gode la funzione esponenziale eat che, non a caso, è la matrice (1 × 1) risolvente dell’equazione y′ = ay.
Una
famiglia continua di trasformazioni dello spazio che soddisfa tali proprietà prende il nome di flusso di trasformazioni.
Infatti ea0 = 1, eat (eas c) = ea(t+s) c e
Matrice A diagonalizzabile
e−at · eat = 1.
Prendendo spunto dall’analisi sviluppata nell’Esempio (VIII.33), possiamo facilmente calcolare un sistema fondamentale di soluzioni in termini di un sistema di autovettori per A, come segue dal seguente lemma. (VIII.35) Lemma. Se u ∈ Rn è un autovettore per A con autovalore λ, allora la funzione vettoriale eλt u è soluzione dell’equazione omogenea y′ = Ay. Dimostrazione.
d λt (e u) = λeλt u = eλt (λu) = eλt (Au) = A(eλt u). dt
Ricordando la Proposizione (IV.78) a pagina 205 possiamo applicare il Lemma per trovare immediatamente l’integrale generale nel caso delle matrici diagonalizzabili.
La
traiettoria corrispondente a questa soluzione è chiaramente la semiretta di equazione parametrica y¯ = su,
s>0
(abbiamo posto particolare,
s
=
eλt ).
In
λ > 0 =⇒ lim y(t) ¯ =0 t→−∞
e λ < 0 =⇒ lim y(t) ¯ = 0, t→+∞
(VIII.36) Corollario. Se la matrice A n × n è diagonalizzabile nella base di autovettori u1 , u2 , . . . , un relativi agli autovalori λ1 , λ2 , . . . , λn , allora un insieme fondamentale di soluzioni per (17) è dato dalle n funzioni wi (t) = eλi t ui ,
i = 1, . . . , n.
e si dice che la traiettoria corrispondente è rispettivamente uscente o entrante (asintoticamente) nell’origine. Se invece λ = 0 allora u e tutti i suoi multipli sono traiettorie costituite da un unico punto corrispondenti a soluzioni costanti (si veda a tal proposito l’Esercizio (VIII.8) a pagina 445).
§ 5. Sistemi lineari omogenei a coefficienti costanti
413
(VIII.37) Esempio (Polinomio caratteristico). Torniamo alla solita equazione scalare del secondo ordine (7) normalizzata x′′ (t) + bx′ (t) + cx(t) = 0, che abbiamo riesaminato negli" Esempi#(VIII.2) e (VIII.31). La matrice del 0 1 sistema 2 × 2 associato è A = . Il suo polinomio caratteristico è −c −b 1 −λ = λ2 + λb + c. pA (λ) = det(A − λI2 ) = −c −b − λ Se quindi pA (λ) ha discriminante positivo ∆ = b2 − 4c > 0, la matrice A ha autovalori distinti, ed è quindi diagonalizzabile. La soluzione generale del sistema di equazioni y′ = Ay associato è data da " # x(t) = c1 eλ1 t u1 + c2 eλ2 t u2 , y(t) dove u1 , u2 sono gli autovettori di A. Gli autovettori si calcolano molto semplicemente nel modo seguente. Se λ è un autovalore, allora λ2 = −bλ − c, e quindi risolve il sistema ( " # " #" # 1 0 1 1 λ=λ λ2 = −bλ − c ⇐⇒ λ λ = −c −b λ . Quindi gli autovettori sono u1 = (1, λ1 ) e u2 = (1, λ2 ), e la soluzione generale è " # " # " # x(t) 1 1 = c1 eλ1 t + c2 eλ2 t , y(t) λ1 λ2 che corrisponde alla soluzione generale x(t) = c1 eλ1 t + c2 eλ2 t dell’equazione scalare (basta considerare solo la prima componente). Osserviamo che il polinomio caratteristico pA (λ) è uguale al polinomio caratteristico dell’equazione scalare P2 (λ), introdotto nel Capitolo I. Le radici di P2 (λ) sono quindi esattamente gli autovalori di A. Il caso in cui la matrice A sia diagonale (se i termini sulla diagonale sono λ1 , λ2 , . . . , λn , scriveremo A = diag(λ1 , λ2 , . . . , λn )) è particolarmente semplice, dato che le n equazioni sono disaccoppiate e si possono risolvere direttamente: in componenti il sistema (17) si può scrivere ′ y1 (t) = c1 eλ1 t y1 = λ1 y1 ′ λ t y2 (t) = c2 e 2 y2 = λ2 y2 =⇒ ··· ··· ′ y (t) = c eλn , yn = λn yn . n
n
Consideriamo un’equazione lineare di ordine n come nell’Esempio (VIII.29), a coefficienti costanti:
y(n) +an−1 y(n−1) +. . .+a1 y′ +a0 y = 0. Nell’Esempio (VIII.3) si è ricondotta all’equazione vettoriale del primo ordine corrispondente alla matrice 0 1 0 ··· 0 0 0 1 · · · 0 . . . . .. . .. .. .. . . . 0 0 0 ··· 1 −a0 −a1 −a2 · · · −an−1
Si può verificare, per esempio per induzione (Esercizio 27 ), che il polinomio caratteristico della matrice A, p(λ) = det (A − λIn ), è uguale a h i (−1)n λn + an−1 λn−1 + . . . + a1 λ + a0 .
414
Sistemi di equazioni differenziali
dove c1 , c2 , . . . , cn sono costanti arbitrarie. Si vede facilmente che le n soluzioni λ1 t 0 0 e 0 eλ2 t 0 .. , .. , · · · , .. . . . eλn t 0 0 costituiscono un insieme fondamentale di soluzioni e che la matrice diagonale λ1 t 0 · · · 0 e 0 eλ2 t · · · 0 (19) diag(eλ1 t , eλ2 t , . . . , eλn t ) = . .. .. .. .. . . . λn t 0 0 ··· e è la matrice risolvente (cioè la soluzione di (18)). Supponiamo più in generale che la matrice A sia diagonalizzabile, cioè che esista una base (u1 , u2 , . . . , un ) di Rn composta da autovettori per A. In questa base la matrice A risulta diagonale, e quindi si può procedere come sopra. La matrice S = (u1 , u2 , . . . , un ) (cioè quella con gli autovettori sulle colonne) è la matrice diagonalizzante di A , tale cioè che S−1 AS
è diagonale.
Proposizione
(IV.78)
a
pagi-
na 205.
Ricordiamo
che A è diagonalizzabile, per esempio, se è simmetrica, oppure se ha n autovalori reali distinti.
Si vede subito che, con queste notazioni, la matrice fondamentale W(t) ottenuta dalle funzioni del Corollario (VIII.36) soddisfa W(0) = S. Quindi la matrice risolvente è Φ(t) = W(t)S−1 , dato che d (W(t)S−1 ) = W ′ (t)S−1 = AW(t)S−1 = AΦ(t), dt Φ(0) = W(0)S−1 = SS−1 = In . Questa discussione risolve completamente il problema di determinare la matrice risolvente del sistema omogeneo a coefficienti costanti, nel caso in cui la matrice A del sistema sia diagonalizzabile. Come abbiamo già osservato, visto che il sistema è anche autonomo, nel caso bidimensionale è possibile rappresentarne le traiettorie nel piano delle fasi. Il diagramma corrispondente può subire sensibili variazioni a seconda degli autovalori. Per ora ci limitiamo ad illustrare graficamente alcuni esempi, rimandando il Lettore al § 7 per una discussione più completa.
ATTENZIONE! Il prodotto S−1 W(t) non è in genere anch’esso la matrice risolvente. Lo è a patto che S (equivalentemente S−1 ) commuti d −1 (S W(t)) = con A: infatti risulta dt S−1 W ′ (t) = S−1 AW(t), e questo è uguale a AS−1 W(t) se S−1 A = AS−1 ⇐⇒ AS = SA. Ma S è la matrice diagonalizzante di A, e quindi questo succede solo se A è già diagonale, e S è un multiplo dell’identità In .
⊚
§ 5. Sistemi lineari omogenei a coefficienti costanti
415
(VIII.38) Esempio (Nodo a stella). Si consideri la matrice diagonale A = diag(λ, λ) = λI2 , con unico autovalore λ ∈ R, λ , 0. Allora la matrice risolvente dell’equazione (17) è la matrice diagonale diag(eλt , eλt ) e tutte le direzioni sono autovettori. Ne segue che tutte le traiettorie sono semirette per (ma non contenenti) l’origine, eccetto l’origine stessa: le traiettorie risultano uscenti se λ > 0, entranti se λ < 0, come in Figura VIII.6 e VIII.7 rispettivamente. Ne segue che ciascuna traiettoria ha una determinata “direzione di ingresso” (o uscita) dell’origine. In una situazione del genere si parla di nodo a stella. (VIII.39) Esempio (Nodo). Se i due autovalori λ1 , λ2 di A sono diversi, allora A è diagonalizzabile e i due autovettori u1 e u2 (necessariamente linearmente indipendenti dato che λ1 , λ2 ) individuano due direzioni invarianti per il flusso, corrispondenti alle due soluzioni fondamentali eλ1 t u1 e eλ2 t u2 . Se λ1 e λ2 hanno lo stesso segno, si dice che il sistema presenta un nodo. Come per l’Esempio (VIII.38) le traiettorie possono essere tutte entranti (se λ1 , λ2 < 0) oppure tutte uscenti (se λ1 , λ2 > 0). Stavolta però la direzione di ingresso/uscita non è arbitraria come nel caso del nodo a stella, ma ci sono due direzioni preferenziali individuate dagli autovettori di A, per questo motivo a volte si parla di nodo a due tangenti. Vediamo in Figura VIII.11 il nodo corrispondente alla matrice A = diag(−1, −2) (la figura verrà giustificata nell’Esempio (VIII.69) a pagina 430). (VIII.40) Esempio (Sella). Nel caso in cui i due autovalori λ1 e λ2 siano uno positivo e uno negativo, allora come per l’Esempio (VIII.39) A è diagonalizzabile e i due autovettori individuano due direzioni invarianti per il flusso. In questo caso una direzione sarà entrante (quella con λi < 0) e una uscente (quella con λi > 0). Queste sono le uniche traiettorie che partono o arrivano (per t → ±∞) nell’origine, a differenza dei nodi (in cui tutte arrivano, oppure tutte partono dall’origine). Tutte le altre sono invece asintotiche alla direzione entrante per tempi negativi e a quella uscente per tempi positivi . Si può vedere in Figura VIII.12 un semplice esempio con A = diag(1, −2). Uno meno semplice è l’Esempio (VIII.33), già visto, con la Figura VIII.5.
Matrice esponenziale Per risolvere il caso generale, in cui A non sia necessariamente diagonalizzabile, cerchiamo di determinare la matrice risolvente per approssimazioni successive, partendo proprio dal problema di Cauchy che essa risolve, che scriviamo sotto forma di equazione integrale: Z t Φ(t) = In + AΦ(s) ds. 0
A tale fine, ragionando esattamente come abbiamo fatto nell’Esempio (VIII.21), costruiamo la successione Φn delle iterate di Picard per la so-
F VIII.6
F VIII.7
Si
veda l’Esempio (VIII.69) a pagina 430.
416
Sistemi di equazioni differenziali
luzione del problema di Cauchy, con l’unica differenza che ora le funzioni in gioco hanno valori matriciali e le potenze di una matrice sono da intendersi nel senso della moltiplicazione fra matrici. Porremo dunque primo elemento della successione sarà Φ1 (t) = R t Φ0 = In , edR il t In + 0 AIn dt = In + 0 A dt = In + At. Calcoliamo i successivi: Z
t
Z
t
A2 t 2 A(In + As) ds = In + At + 2 0 ! Z t 2 2 As A2 t 2 A3 t 3 + Φ3 (t) = In + A In + As + ds = In + At + 2 2 3! 0 Φ2 (t) = In +
... Φ j (t) = In + 0
j−1 j X X Ak sk Ak t k A . ds = k! k! k=0
k=0
A questo punto viene spontaneo esprimere la matrice risolvente sotto forma della serie di potenze di matrici: (20) Φ(t) =
∞ X Ak k=0
k!
tk = In + At +
A2 2 A3 3 t + t +... 2 3!
Tuttavia, per dare un senso a tale serie dobbiamo esaminarne la convergenza, il che ci costringe a soffermarci per un momento sulle nozioni relative alle successioni e serie di matrici. A questo fine, conviene ricordare che lo spazio di tutte le matrici n×n è uno spazio vettoriale normato. Come abbiamo visto nell’Esercizio (IV.7) a pagina 216, verifica anche la disuguaglianza kABk ≤ kAk kBk. La spazio delle matrici ha quindi una metrica naturale, definita da d(A, B) = kA−Bk. Consideriamo la convergenza di successioni di matrici rispetto a questa metrica. Come per le serie di numeri e le serie di funzioni, una serie converge quando converge la successione delle somme parziali. Il seguente criterio di convergenza sarà molto utile fra poco. (VIII.41) Lemma. Se Ak è una successione di matrici taliP che la successione P ∞ delle norme ∞ kA k converge, allora la serie di matrici k k=0 k=0 Ak converge. Dimostrazione. Osserviamo che se B = (bi j ) è una matrice P con coefficienti bi j , allora |bi j | ≤ kBk per ogni coppia di indici i, j. Se dunque ∞ k=0 kAk k converge, e indichiamo con ai(k)j il coefficiente (i, j)-esimo di Ak , allora per ogni i, j (e per ogni P (k) (k) k) si ha |ai j | ≤ kAk k. Ma allora la serie ∞ k=0 ai j è assolutamente convergente (per il criterio del confronto). Ma tutte le componenti convergono se e solo se la serie di matrici converge.
In analogia con il caso n = 1, definiamo la funzione esponenziale matriciale come segue (semplificando sensibilmente la notazione).
Abbiamo
già ricordato a pagina 410 l’espressione della norma euclidea definita da v u tX n kAk =
a2i j .
i,j=1
§ 5. Sistemi lineari omogenei a coefficienti costanti
417
(VIII.42) Definizione. Per ogni A matrice n× n la matrice esponenziale eA è definita dalla serie A
e =
∞ X Ak k=0
k!
1 1 = I n + A + A2 + A3 + . . . 2 3!
Tale serie converge per ogni A, in base al Lemma precedente: infatti, dato che kABk ≤ kAkkBk, per induzione si mostra che kAk k ≤ kAkk , e quindi il ∞ X ak raggio di convergenza è almeno quello della serie , dove a = kAk, k! k=0 che è infinito. Con la Definizione (VIII.42), la soluzione (20) del sistema (18) si può quindi scrivere in modo sintetico come Φ(t) =
∞ X (At)k k=0
k!
= eAt = etA .
Osserviamo che, in completa analogia con le serie di potenze reali, tali serie si possono derivare termine a termine rispetto a t, con il risultato (scontato) Φ′ (t) =
∞ X ktk−1 (A)k k=1
k!
=A
∞ k−1 X t (A)k−1 k=1
(k − 1)!
= AΦ(t).
Ciò che abbiamo fatto può essere riassunto nel seguente enunciato. (VIII.43) Teorema. Sia A una matrice n × n. La funzione esponenziale di matrici Φ(t) = etA è la matrice risolvente per l’equazione y′ = Ay, cioè è l’unica soluzione, definita per ogni t, del problema ai valori iniziali ( ′ Φ (t) = AΦ(t) Φ(0) = In . Un altro modo per esprimere lo stesso concetto è la seguente importante formula:
(21)
Si veda l’Esercizio (IV.7) a pagina 216.
d At e = AeAt , dt
e0n = In .
(VIII.44) Osservazione. Quando trattiamo matrici diagonali si ha che D = diag(λ1 , λ2 , . . . , λn )
=⇒
eD = diag(eλ1 , eλ2 , . . . , eλn ),
come abbiamo visto nell’equazione (19).
Sappiamo infatti che i coefficien-
ti φi j (t) della matrice Φ(t) sono sviluppabili in serie di potenze, con un raggio di convergenza infinito.
418
Sistemi di equazioni differenziali
(VIII.45) Corollario. Siano A e B due matrici n × n. Allora: ① Se AB = BA (cioè le due matrici commutano), allora eA+B = eA eB ; −1 ② e−A = eA . j Dimostrazione. Per prima cosa mostriamo per induzione che se A commuta con B, allora A commuta con Bk per ogni k intero. Se k = 1 si ha proprio AB1 = AB = BA = B1 A. Supponiamolo vero per k − 1: allora ABk = ABBk−1 = B ABk−1 = BBk−1 A = Bk A, |{z} induzione
e quindi è vero per k. Possiamo quindi dimostrare che se A commuta con B, allora A commuta con l’esponenziale eB . Infatti, se commuta con tutte le potenze Bk si ha ∞ ∞ ∞ ∞ X Bk X ABk X Bk A X Bk A. AB = BA =⇒ A = = = k! k! k! k! k=0
k=0
k=0
k=0
At Bt
Consideriamo ora le due funzioni matriciali F(t) = e e e G(t) = e(A+B)t . In t = 0 si ha F(0) = In In = In = G(0). Le derivate sono d At Bt d d At Bt e e = e e + eAt eBt = AeAt eBt + eAt BeBt dt dt dt = AeAt eBt + BeAt eBt = AF(t) + BF(t) = (A + B)F(t),
F′ (t) =
d (A+B)t e = (A + B)e(A+B)t = (A + B)G(t). dt Ma allora entrambe le funzioni sono matrici risolventi per l’equazione y′ = (A + B)y, e per l’unicità deve essere F(t) = G(t), e cioè la ① è vera. Per la ②, basta osservare che −A e A commutano, e quindi G′ (t) =
e−A eA = eA e−A = e0n
−1
(VIII.46) Se A e S sono matrici n × n e S è invertibile, allora eS S−1 eA S.
AS
=
In
altre parole, due matrici simili hanno esponenziali simili.
Dimostrazione. Poniamo B = S−1 AS, e osserviamo che per ogni k intero Bk = S−1 Ak S. Infatti B = S−1 AS =⇒ B2 = (S−1 AS)(S−1 AS) = S−1 A2 S =⇒ B3 = BB2 = (S−1 AS)(S−1 A2 S) = S−1 A3 S ···
=⇒ Bk = BBk−1 = (S−1 AS)(S−1 Ak−1 S) = S−1 Ak S. Allora S−1 AS
e
∞ ∞ ∞ X X Ak Bk X S−1 Ak S −1 S = S−1 eA S. =e = = = S k! k! k! B
k=0
k=0
k=0
§ 5. Sistemi lineari omogenei a coefficienti costanti
419
(VIII.47) Proposizione. Se D è una matrice diagonale, allora D = diag(λ1 , λ2 , . . . , λn ) =⇒ eD = diag(eλ1 , eλ2 , . . . , eλn ). Se A è una matrice diagonalizzabile, ed S è la matrice che diagonalizza A (cioè S−1 AS = D è diagonale), allora eA = SeD S−1 . Dimostrazione. Se D è diagonale, allora la formula segue facilmente dall’Osser−1 vazione (VIII.44). Ora, per la (VIII.46) si ha eS AS = S−1 eA S, e quindi ponendo −1 −1 D = S AS si ha (moltiplicando a destra per S e a sinistra per S) eD = S−1 eA S =⇒ eA = SeD S−1 .
Anche
direttamente: dato che Dk = diag(λk1 , λk2 , . . . , λkn ) per ogni k, eD =
∞ X 1 k D k! k=0
(VIII.48) Osservazione. Finora niente di nuovo sotto il sole. Stiamo parafrasando il fatto, già formulato e dimostrato nel Corollario (VIII.36), che nella base diagonalizzante di A la matrice risolvente è diagonale con termini eλi t , dove i λi sono gli autovalori di A. Quindi se A ha autovalori distinti, oppure se è simmetrica, il sistema y′ = Ay si risolve a patto di determinare gli autovettori/autovalori di A.
∞ X 1 diag(λk1 , λk2 , . . . , λkn ) = k! k=0 ∞ ∞ ∞ X X λk1 X λk2 λkn , ,..., = diag k! k! k! k=0
k=0
k=0
= diag(eλ1 , eλ2 , . . . , eλn ).
(VIII.49) Esempio (Nodo improprio). Sia A una matrice 2 × 2 con un unico autovalore λ (cioè con due autovalori coincidenti, come si dice). Se A è diagonalizzabile, allora S−1 AS = λI2 (se S è la matrice degli autovettori), da cui si deduce che (moltiplicando a sinistra per S e a destra per S−1 ) A = SλI2 S−1 = λSS−1 = λI2 , cioè A è già diagonale. Cioè, una matrice 2 × 2 con un autovalore doppio è diagonalizzabile se e solo se è già diagonale. Un esempio di matrice non diagonalizzabile è quindi " # λ b A= 0 λ " # 0 b con b, λ ∈ R e b , 0. Se poniamo B = , si ha A = λI2 + B, e da ① 0 0 di (VIII.45) eA = eλI2 eB = eλ eB . Dato che B2 = 02 , si ha Bk = 02 per ogni k ≥ 2, e quindi " # ∞ X Bk 1 b = I2 + B = . eB = 0 1 k! k=0
Allora la matrice risolvente dell’equazione (17) è " # tA λt 1 bt e =e . 0 1 La traiettoria che passa per il punto (x0 , y0 ) ∈ R2 al tempo t = 0 è pertanto " #" # λt 1 bt x0 y(t) = e . 0 1 y0
F VIII.8: nodo improprio con λ = 1 e b = 2.
È
possibile, senza troppa fatica, dimostrare che ogni matrice 2×2 con un solo autovalore non diagonalizzabile è simile ad una matrice del tipo " # λ b (Esercizio 25 a pagina 453). 0 λ
420
Sistemi di equazioni differenziali
È possibile verificare che se λ < 0 le traiettorie sono entranti nell’origine per t → +∞, mentre se λ > 0 sono uscenti. Si può vedere un ritratto di fase in Figura VIII.8. Notiamo che c’è solo una retta invariante per il flusso. Il punto (0, 0) viene detto nodo improprio.
Esercizio (VIII.10) a pagina 447. O anche nodo ad una tangente.
Autovalori complessi Abbiamo analizzato il caso di matrici con autovalori reali. Naturalmente può accadere che il polinomio caratteristico pA (λ) presenti radici complesse. In questo caso occorre considerare la matrice come se fosse la matrice di un operatore sullo spazio vettoriale complesso Cn , e anche i corrispondenti autovettori saranno vettori complessi di Cn . Ricordiamo però che i coefficienti di pA (λ) sono reali (dato che A ha coefficienti reali), e quindi se pA (λ) ha una radice λ, anche il coniugato λ è una radice di pA (λ). Analizzeremo il caso in dimensione 2, per cui se esiste un autovalore complesso λ non reale, allora anche il suo coniugato λ è autovalore, e non ce ne sono altri. Questo significa che, avendo due autovalori distinti, la matrice A è diagonalizzabile in senso complesso cioè che esiste una " # λ 0 matrice quadrata S con coefficienti complessi tale che S−1 AS = . 0 λ (VIII.50) Se A è una matrice 2 × 2 a coefficienti reali, con due autovalori complessi coniugati λ = α + iβ e λ = α − iβ (con β , 0), allora esiste una base di R2 in cui A viene rappresentata dalla matrice " # α −β Aˆ = . β α j Dimostrazione. Sia u + iv un autovettore complesso per l’autovalore λ, con u e v vettori di R2 . Allora u − iv è un autovettore complesso per l’autovalore coniugato λ: A(u + iv) = λu + iv
=⇒
riveda l’approfondimento a pagina 211 se necessario.
Infatti,
se il polinomio si scrive
come
pA (λ) = c0 +c1 λ+. . .+cn−1 λn−1 +cn λn con coefficienti ci ∈ R. si ha pA (λ) = 0
⇐⇒
c0 + c1 λ + . . . + cn−1 λn−1 + cn λn =c0 + c1 λ + . . . + cn−1 λn−1 + cn λn =c0 + c1 λ + . . . + cn−1 λ =0
n−1
+ cn λ
n
⇐⇒ pA (λ) = 0.
Ricordiamo anche l’Esercizio 38 a pagina 223, in cui abbiamo dimostrato che c0 = det A, cioè il prodotto degli autovalori di A, cn−1 = (−1)n−1 tr A, cioè la somma degli autovalori di A e cn = (−1)n .
A(u − iv) = A(u + iv) = λ(u + iv) = λ(u − iv).
Dato che u + iv e u − iv sono autovettori corrispondenti ad autovalori distinti, sono linearmente indipendenti (rispetto alle combinazioni lineari a coefficienti complessi). Allora anche u e v sono due vettori indipendenti di R2 . Ora, la coppia di vettori (v, u) costituisce una base di R2 in cui si ha ( Av = αv + βu A(u + iv) = λ(u + iv) = (α + iβ)(u + iv) =⇒ Au = −βv + αu, = (αu − βv) + i(αv + βu) # " α −β . cioè A prende la forma Aˆ data da Aˆ = β α
(VIII.51) Esempio. La matrice " # 0 1 A= −ω2 0
Si
Se
per assurdo esistessero due coefficienti a, b ∈ R tali che au + bv = 0, allora ponendo a+b a−b a−b a+b +i z2 = +i 2 2 2 2 si otterrebbe anche la dipendenza lineare di (u + iv) e (u − iv)
z1 =
z1 (u + iv) + z2 (u − iv) = 0.
§ 5. Sistemi lineari omogenei a coefficienti costanti
421
ha due autovalori immaginari puri ±iω, "a #cui corrispondono gli autova" # 1 0 lori complessi coniugati u ± iv, con u = ev= . Poiché Au = −ωv 0 ω e Av = ωu, nella base (v, u) otteniamo la matrice " # 0 −ω ˆ A= . ω 0
Infatti il polinomio caratteristico è λ2 + ω2 = 0.
Infatti abbiamo A(u ± iv) ±iω(u ± iv).
=
Si
tratta di un multiplo della rotazione di π/2.
"
# 0 1 Infatti, detta S = la matrice corrispondente al cambiamento di ω 0 " # 0 ω−1 base, abbiamo S−1 = e, come si verifica immediatamente, A = 1 0 ˆ −1 . SAS " # # α −β A α cos β − sin β (VIII.52) Proposizione. A = . =⇒ e = e sin β cos β β α "
" j Dimostrazione. Definiamo la matrice J2 =
0 1
# −1 . Allora si ha 0
Infatti J2 commuta con I2
A = αI2 + βJ2 =⇒ eA = eαI2 eβJ2 . Dato che αI2 è la matrice diag(α, α), eαI2 = (eα )I2 . Non resta quindi che calcolare eβJ2 . Osserviamo che J22 = −I2 ,
J32 = −J2 ,
h J42 = I2 , . . . , J2h 2 = (−1) I 2 ,
J2h+1 = (−1)h J2 2
∀h ∈ N
e quindi eβJ2 =
∞ ∞ ∞ ∞ X X X X βk Jk2 βk Jk2 β2h J2h βk Jk2 2 = + = + k! k! k! (2h)! k=0
=
k=0 k pari
∞ X (−1)h β2h I2 + (2h)!
h=0 (k = 2h)
k=1 k dispari
∞ X h=0 (k = 2h + 1)
h=0 (k = 2h)
∞ X h=0 (k = 2h + 1)
β2h+1 J2h+1 2 (2h + 1)!
(−1)h β2h+1 J2 (2h + 1)!
∞ ∞ X (−1)h β2h+1 X (−1)h β2h J . I2 + = 2 (2h)! (2h + 1)! h=0
h=0
Ricordando ora gli sviluppi in serie di Taylor delle funzioni circolari, otteniamo # # " # " " cos β − sin β 0 − sin β cos β 0 . = + eβJ2 = cos β I2 + sin β J2 = sin β cos β sin β 0 0 cos β
Ovvero sin x =
∞ X h=0
(VIII.53) Esempio. Riprendiamo l’Esempio (VIII.51), utilizzando la Proposizione (VIII.46) per calcolare la matrice esponenziale " # " # cos ωt − sin ωt −1 cos ωt −ω−1 sin ωt tA e =S S = . sin ωt cos ωt ω sin ωt cos ωt
cos x =
∞ X
(−1)h
h=0
x2h+1 (−1) . (2h + 1)! h
x2h e (2h)!
422
Sistemi di equazioni differenziali
Matrici e numeri complessi La matrice J2 ha esattamente le stesse proprietà formali dell’unità immaginaria i ∈ C (cioè i2 = −1). C’è di più: se associamo al numero complesso x + iy ∈ C la matrice # " x −y M(x + iy) = xI2 + yJ2 = y x ci rendiamo immediatamente conto che la somma va a finire nella somma M(x + iy + u + iv) = M(x + iy) + M(u + iv),
Meno ovvio e più interessante è che anche il prodotto di numeri complessi va a finire nel prodotto delle matrici: M(x + iy)M(u + iv) = (xI2 + yJ2 )(uI2 + vJ2 ) = (xu − yv)I2 + (xv + yu)J2 = M((x + iy)(u + iv)).
Osserviamo anche che la trasposta tJ2 = −J2 , e che il coniugato i = −i, quindi la trasposizione nelle 2 × 2 corrisponde al prendere il coniugato in C. Quindi tutte le operazioni algebriche su C corrispondono fedelmente ad operazioni sulle matrici, e l’esponenziale eA corrisponde all’esponenziale complesso ez = ex eiy = ex (cos y + i sin y)
ed anche il prodotto per uno scalare reale
che abbiamo già incontrato nella (10) a pagina 51.
M(c(x + iy)) = cM(x + iy).
Questo esempio si generalizza con facilità nel seguente risultato. (VIII.54) Corollario. Se A è una matrice 2 × 2 con i due autovalori complessi non reali (necessariamente coniugati) α ± iβ, allora un sistema fondamentale di soluzioni per y′ = Ay è dato dalle due funzioni y1 (t) = eαt v cos βt + u sin βt , y2 (t) = eαt −v sin βt + u cos βt , dove u + iv è un autovettore per l’autovalore α + iβ. Cioè, nella base (v, u) le soluzioni sono yˆ 1 = eαt (cos βt, sin βt),
yˆ 2 = eαt (− sin βt, cos βt).
Dimostrazione. Sia v, u la base di R2 in cui A ha la forma della proposizione (VIII.50). Se S = (v, u) è la matrice corrispondente, si ha quindi # " α −β ˆ = A. S−1 AS = β α Poniamo il cambio di coordinate y = S y: ˆ l’equazione y′ = Ay diventa S yˆ ′ = AS yˆ ⇐⇒ yˆ ′ = S−1 AS yˆ = Aˆ y. ˆ Sappiamo che la matrice fondamentale per quest’equazione è # " ˆ = etAˆ = eαt cos βt − sin βt , Φ(t) sin βt cos βt cioè un insieme di soluzioni è # " # " # " cos(βt + π/2) − sin βt cos βt . = eαt , yˆ 2 (t) = eαt yˆ 1 (t) = eαt sin(βt + π/2) cos βt sin βt
La
matrice che permette di trasformare A (con autovalori complessi) in Aˆ (di cui sappiamo calcolare la matrice esponenziale) è S = (v, u). A questo punto, grazie al Teorema (VIII.43) e alla proposizione (VIII.46), la matrice risolvente per il sistema è ˆ
etA = SetA S−1 . Si veda anche l’Esercizio 34 .
§ 6. Sistemi lineari non omogenei
423
Tornando alle coordinate y si ha yi = S yˆ i , cioè y1 (t) = eαt (v cos βt + u sin βt),
y2 (t) = eαt (−v sin βt + u cos βt).
(VIII.55) Esempio (Centro). Se i due autovalori sono immaginari puri (cioè α = 0) allora la risolvente è (nella base v, u della parte immaginaria e reale dell’autovettore corrispondente all’autovalore α + iβ) " # " # cos βt − sin βt tA αt cos βt − sin βt e =e = . sin βt cos βt sin βt cos βt È facile vedere (Esempio (VIII.70) a pagina 431) che tutte le traiettorie (a parte l’origine) sono delle ellissi, e che le soluzioni ruotano periodicamente (tutte con lo stesso periodo 2π/β) attorno all’origine. In questa situazione si parla di centro. Il caso più semplice, con u = (1, 0) e v = (0, 1) è rappresentato in Figura VIII.2. Il caso con due vettori non ortogonali (u = (−1, 1), v = (1, 0)) si trova invece in Figura VIII.9. (VIII.56) Esempio (Fuoco/spirale). La matrice " # −1 −3 A= 3 −1 ha autovalori complessi coniugati λ = −1 + 3i, λ = −1 − 3i. Gli autovettori 2 "(in C )# corrispondenti sono (i, 1) e (−i, 1). Dato che A ha già la forma α −β , con α = −1 e β = 3, la corrispondente matrice risolvente è data β α da " # " # tA αt cos βt − sin βt −t cos 3t − sin 3t e =e =e sin βt cos βt sin 3t cos 3t
F " VIII.9: #centro con matrice −1 −2 (Esercizio 34 ). A= 1 1
In Figura VIII.10 vediamo alcune delle traiettorie del sistema. Come si vede (e come si può dimostrare, Esercizio (VIII.13) a pagina 449) esse spiraleggiano attorno all’origine, a patto che la parte reale α sia non nulla. L’origine è detta fuoco, e il sistema è detto un sistema a spirale.
§ 6. Sistemi lineari non omogenei Nella Proposizione (VIII.27) a pagina 407, abbiamo messo in evidenza il seguente fatto notevole: se n soluzioni wi dell’equazione omogenea y′ = A(t)y (con A(t) continua) sono linearmente dipendenti ad un istante t = t0 , allora sono linearmente dipendenti sempre (cioè per ogni t). Segue che se sono linearmente indipendenti in t = t0 , allora sono linearmente indipendenti sempre. Cioè: n soluzioni di un’equazione differenziale omogenea in Rn sono linearmente indipendenti se e soltanto se i loro dati iniziali (al tempo t0 ) sono linearmente indipendenti. Osserviamo che abbiamo menzionato in tre modi l’“indipendenza” delle n funzioni vettoriali wi (t), i = 1, . . . , n:
F VIII.10
424
Sistemi di equazioni differenziali
① indipendenza delle n funzioni wi , come elementi dello spazio vettoriale di tutte le funzioni di classe C1 sull’intervallo I; ② indipendenza per ogni t degli n vettori wi (t) ∈ Rn ; ③ indipendenza ad un certo istante fissato t0 degli n vettori wi (t0 ) ∈ Rn . È più chiaro forse se parliamo di “dipendenza” invece di “indipendenza” (di cui è la negazione — ma attenzione ai quantificatori): ①’ dipendenza di funzioni C1 : esistono c1 , . . . , cn ∈ R (non dipendenti da t) tali che per ogni t, c1 w1 (t) + . . . + cn wn (t) = 0; ②’ dipendenza per ogni t: esistono c1 (t), . . . , cn (t) (dipendenti da t) tali che per ogni t, c1 (t)w1 (t) + . . . + cn (t)wn (t) = 0; ③’ dipendenza per t0 fissato : esistono n scalari c1 , . . . , cn ∈ R tali che c1 w1 (t0 ) + . . . + cn wn (t0 ) = 0. La negazione di ① è ①’ e la negazione della ③ è la ③’, da cui segue (come abbiamo detto sopra) che anche la ① e la ③ sono equivalenti.
Non è difficile convincersi che ①’ =⇒ ②’ =⇒ ③’. Abbiamo mostrato poco fa che ③’ =⇒ ①’, dunque le ①’, ②’, ③’ sono equivalenti. Attenzione che la negazione di ② non è la ②’ (quantificatori. . . ).
(VIII.57) Lemma. Sia W(t) una soluzione matriciale sull’intervallo I dell’equazione omogenea W ′ = A(t)W in un intervallo I, su cui A(t) è continua. Sia t0 ∈ I. Le seguenti affermazioni sono equivalenti: ① la matrice W(t) è una matrice fondamentale per l’equazione, cioè le sue colonne sono gli n elementi di una base delle spazio vettoriale delle soluzioni dell’equazione y′ = A(t)y; ② per ogni t ∈ I, det W(t) , 0; ③ det(W(t0 )) , 0. Dimostrazione. Le tre affermazioni sono equivalenti alle affermazioni ①, ② e ③ analizzate poco sopra. Abbiamo visto che ① ⇐⇒ ③, cioè W(t) è una matrice fondamentale se e solo se det(W(t0 )) , 0. Ora, possiamo applicare questo risultato rispetto ad un punto qualsiasi t ∈ I, per cui se W(t) è fondamentale, allora det(W(t)) , 0 per qualsiasi t. Ma allora ① =⇒ ② =⇒ ③ =⇒ ①, cioè la tesi.
Il determinante di una n-upla di funzioni vettoriali è detto determinante wronskiano, o più semplicemente wronskiano delle funzioni vettoriali wi . Viene indicato con il simbolo w(w1 , . . . , wn ; t) = det(w1 (t), . . . , wn (t)). Segue dal Lemma (VIII.57) che il determinante wronskiano di un insieme di soluzioni di un’equazione lineare omogenea o è sempre nullo oppure non cambia segno (cioè è sempre positivo oppure è sempre negativo).
Ricordiamo infatti che per il Teo-
rema (IV.59) n vettori di Rn sono linearmente indipendenti se e solo se il loro determinante è diverso da zero.
§ 6. Sistemi lineari non omogenei
(VIII.58) Osservazione. Il Lemma (VIII.57) vale per insiemi di soluzioni di equazioni differenziali omogenee: in generale non è detto che se il determinante wronskiano di n funzioni vettoriali si annulla (in un punto o ovunque), allora le funzioni sono linearmente dipendenti. Si veda l’Esercizio 31 a pagina 223, oppure si consideri più semplicemente la seguente matrice " # 1 t B(t) = , det B(t) ≡ 0, t t2 il cui determinante è sempre nullo ma le due funzioni vettoriali b1 (t) = (1, t), b2 (t) = (t, t2 ) non sono linearmente dipendenti.
425
Infatti
se esistessero due coefficienti c1 , c2 ∈ R, non entrambi nulli, tali che c1 b1 (t) + c2 b2 (t) = 0
Per il Lemma (VIII.57) la matrice fondamentale W(t) è invertibile per ogni t. Quindi possiamo dimostrare il seguente teorema (già incontrato, per le equazioni del secondo ordine, nell’Esercizio 38 a pagina 32) che consente di trovare una soluzione particolare per l’equazione completa.
dovrebbe essere c1 + c2 t = 0 per ogni t, e questo non è possibile se c1 e c2 sono costanti.
(VIII.59) Teorema (variazione delle costanti). Se W(t) è una matrice fondamentale per l’equazione omogenea y′ = A(t)y sull’intervallo I, allora la (unica) soluzione del problema ai valori iniziali ( y′ = A(t)y + b(t)
Viene spontaneo chiedersi perché l’ossimoro «variazione delle costanti». Osserviamo R t l’enunciato: il termine c(t) = t W −1 (s)b(s) ds è una 0 funzione vettoriale, e se φ1 , φ2 , . . . , φn sono le colonne della matrice fondamentale W(t) (cioè gli elementi di un insieme fondamentale di soluzioni per l’equazione omogenea associata), allora la soluzione particolare dell’equazione completa si può anche scrivere come y(t) = W(t)c(t) = c1 (t)w1 (t) + . . .
y(t0 ) = 0 Z
t
W −1 (s)b(s) ds.
è la seguente: y(t) = W(t) t0
Dimostrazione. Si ha Z y(t0 ) = W(t0 )
+cn (t)wn (t), t0
W −1 (s)b(s) ds = 0.
t0
Inoltre ! Z t Z t d W −1 (s)b(s) ds + W(t)W −1(t)b(t) W −1 (s)b(s) ds = W ′ (t) W(t) dt t0 t0 " # Z t = A(t) W(t) W −1 (s)b(s) ds + b(t) = A(t)y(t) + b(t).
y′ (t) =
t0
(VIII.60) Esempio. Consideriamo l’equazione scalare del secondo ordine con coefficienti non costanti (22) x′′ + p(t)x′ + q(t)x = b(t), con p(t), q(t) e b(t) continue in un intervallo I ⊂ R. Il sistema associato è ( ′ " ′# " #" # " # x =y x 0 1 x 0 ⇐⇒ ′ = + . y −q(t) −p(t) y b(t) y′ = −p(t)y − q(t)x + b(t)
che è una “combinazione lineare” delle yi (come se y fosse soluzione dell’equazione omogenea) con coefficienti non costanti ci (t).
Combinando il Teorema (VIII.59)
con il Corollario (VIII.30) è possibile determinare la soluzione generale dell’equazione lineare non omogenea (non necessariamente autonoma) y′ = A(t)y+b(t), a patto di conoscere una matrice fondamentale W(t) per l’equazione omogenea e a patto di riuscire a integrare W −1 (s)b(s). Lo vedremo fatto in alcuni esempi ed esercizi.
426
Sistemi di equazioni differenziali "
# 0 1 La matrice A(t) = e il vettore b(t) sono continue in t (sul−q(t) −p(t) l’intervallo I). Una matrice fondamentale, W(t), per l’equazione omogenea y′ = A(t)y, sarà della forma " # f (t) 1(t) W(t) = ′ f (t) 1′ (t) e il determinante wronskiano det(W(t)) = w( f, 1; t) = f (t)1′ (t) − 1(t) f ′ (t) non è mai nullo. Si ha " ′ # 1 1 (t) −1(t) W(t)−1 = , det W(t) − f ′ (t) f (t) e quindi per t0 ∈ I una soluzione particolare è Z t y(t) = W(t) W −1 (s)b(s) ds t0
"
#Z t " ′ #" # 1 f (t) 1(t) 1 (s) −1(s) 0 ds f ′ (t) 1′ (t) t0 w( f, 1; s) − f ′ (s) f (s) b(t) " # " #Z t 1 −1(s)b(s) f (t) 1(t) ds = ′ f (t) 1′ (t) t0 w( f, 1; s) f (s)b(s) " # " # f (t) 1(t) = c(t) ′ + d(t) ′ , f (t) 1 (t) =
dove Z
t
(23) c(t) = t0
−1(s) b(s) ds, w( f, 1; s)
Z
t
d(t) = t0
f (s) b(s) ds. w( f, 1; s)
(VIII.61) Osservazione. Consideriamo il caso di coefficienti p(t) = p e q(t) = q costanti per l’equazione (22). Si tratta dell’equazione del secondo ordine lineare, normalizzata, già affrontata nel Capitolo I (equazione (8) a pagina 16). Se λ1 , λ2 sono le radici reali e distinte del polinomio caratteristico λ2 + pλ + q, allora p = −λ1 − λ2 , q = λ1 λ2 e la matrice wronskiana è " λt # e 1 eλ2 t =⇒ w(eλ1 t , eλ2 t ; t) = λ2 e(λ1 +λ2 )t −λ1 e(λ1 +λt )t = (λ2 −λ1 )e−pt . λ1 eλ1 t λ2 eλ2 t Le due funzioni c(t) e d(t), introdotte nell’Esempio (VIII.60), sono Z t c(t) = −(λ2 − λ1 )−1 e−λ1 s b(s) ds, t0
Z
d(t) = (λ2 − λ1 )−1
t
e−λ2 s b(s) ds, t0
Ogni soluzione deve essere del tipo (x(t), y(t)) con y(t) = x′ (t).
In questo caso chiaramente
w dipende solo dalle due funzioni scalari f e 1 si semplifica la notazione. È questo il modo con cui originariamente (nell’Esercizio 31 a pagina 223) fu definito il determinante wronskiano, o il wronskiano di n funzioni.
§ 7. Proprietà qualitative dei sistemi autonomi
427
e quindi una soluzione particolare dell’equazione (22) è y(t) = c(t)eλ1 t + d(t)eλ2 t "Z t Z −1 −λ2 (s−t) = (λ2 − λ1 ) e b(s) ds − Z
= (λ2 − λ1 )−1
t0 th
t0
#
t
e−λ1 (s−t) b(s) ds, t0
i e−λ2 (s−t) − e−λ1 (s−t) b(s) ds.
Nel caso di autovalori complessi coniugati si perviene a formule analoghe, come si vede, ad esempio, svolgendo l’Esercizio 38 .
A questo
punto occorre calcolare l’integrale di una funzione del tipo ecs b(s). Questo è certamente possibile in molti casi: se b(s) è un polinomio, se è una funzione esponenziale eks , una funzione trigonometrica sin ωs, cos ωs, o un prodotto di funzioni di questo tipo. Non sempre è immediato questo calcolo, ma ci si può provare.
§ 7. Proprietà qualitative dei sistemi autonomi Consideriamo un’equazione vettoriale autonoma : y′ = f (y), e supponiamo che f : Rn → Rn sia una funzione di classe C1 . In tale caso, il campo f individua la direzione della velocità di una particella che passi in una certa posizione qualunque sia l’istante considerato. Questo, per i sistemi lineari in dimensione n = 2, ci ha permesso di leggere graficamente il comportamento del sistema in termini di traiettorie nel ritratto di fase. In questo paragrafo ci proponiamo di formalizzare questo punto di vista e di applicarlo a sistemi anche non lineari. Il fatto che f sia di classe C1 ci assicura della validità del Teorema (VIII.9), cosicché abbiamo sempre esistenza e unicità locali: per ogni dato iniziale, possiamo definire la soluzione y sul suo intervallo massimale di esistenza.
Cioè in cui in cui il campo di velocità f (t, y) non dipende esplicitamente dal tempo, ma solo dal vettore posizione y.
Per
semplicità supporremo che l’equazione differenziale sia definita su tutto Rn , anche se molte delle considerazioni che faremo valgono anche per equazioni con domini più piccoli.
(VIII.62) Definizione. Un traiettoria del sistema è il sostegno di una soluzione y parametrizzata sul suo intervallo massimale di esistenza. Abbiamo già visto in molti esempi che la presenza di soluzioni costanti dà luogo a traiettorie che si riducono ad un punto: in tal caso il vettore velocità è sempre nullo e la parametrizzazione non può certo essere regolare. (VIII.63) Definizione. Il punto y0 ∈ Rn si dice punto di equilibrio per il sistema y′ = f (y) se vale
O anche punto critico o punto stazionario.
f (y0 ) = 0. Alternativamente, i punti di equilibrio sono tutte e sole le traiettorie corrispondenti a soluzioni costanti nel tempo. Una delle caratteristiche che più colpiscono nei ritratti di fase visti nel § 5 è che le diverse traiettorie non si intersecano mai, fatto invece falso
L’equivalenza delle due definizioni è immediata.
428
Sistemi di equazioni differenziali
nel caso di sistemi non autonomi (si veda ad esempio l’Esercizio (VIII.9) a pagina 446). Ciò non è casuale, ma risulta essere una conseguenza del Teorema (VIII.9) di esistenza e unicità locale, anche se non così diretta: dire che due traiettorie non si intersecano non significa dire che due soluzioni non passano per lo stesso punto al medesimo istante (che è la tesi del teorema di unicità), ma che due soluzioni corrispondenti a traiettorie diverse non passano per lo stesso punto neppure in istanti diversi. (VIII.64) Proprietà. Se y1 (t) è una soluzione di y′ = f (y), allora, per ogni costante T ∈ R, anche y2 (t) = y1 (t + T) lo è. Dimostrazione. Dato che y1 è di classe C1 per definizione, anche y2 lo è perciò possiamo derivarla: y′2 (t) =
d y1 (t + T) = y′1 (t + T) · 1 = f (y1 (t + T)) = f (y2 (t)). dt
(VIII.65) Proprietà. Se f ∈ C1 , due traiettorie non coincidenti hanno intersezione vuota. Dimostrazione. Dimostriamo che se due traiettorie passano per lo stesso punto allora coincidono, cioè che se y1 (t) e y2 (t) sono due soluzioni di y′ = f (y) tali che y1 (t1 ) = y2 (t2 ), allora y2 (t) = y1 (t+t1 −t2 ), per ogni t. Poniamo w(t) = y1 (t+t1 −t2 ). Sia y2 (per ipotesi) che w (per la precedente proprietà con T = t1 − t2 ) sono soluzioni di y′ = f (y). Inoltre per ipotesi abbiamo w(t2 ) = y1 (t2 + t1 − t2 ) = y1 (t1 ) = y2 (t2 ). Per unicità otteniamo w(t) = y2 (t) per ogni t del comune intervallo massimale di definizione.
Il
Lettore non si lasci ingannare dal fatto che, ad esempio nel nodo a stella, i grafici delle traiettorie sembrano essere rette che si intersecano nell’origine. Come abbiamo già più volte osservato ciascuna di quelle rette è in realtà l’unione di tre diverse traiettorie (due semirette e un punto) che non hanno punti in comune tra loro. Si intende che se l’intervallo massimale I1 = (a, b) di definizione di y1 non è tutto R, quello I2 di definizione di y2 sarà una traslazione di I1 : I2 = (a − T, b − T). Nel Capitolo V abbiamo visto (a pagina 229) che se r(t) : (a, b) → Rn è una parametrizzazione di una curva allora r¯(τ) : (a − T, b − T) → Rn , r¯(τ) = r(t + T), parametrizza la stessa curva. Come conseguenza di questo fatto e della precedente proprietà otteniamo quindi che ad ogni data traiettoria corrispondono infinite diverse soluzioni/parametrizzazioni, legate tra loro da traslazioni di arbitraria ampiezza T.
(VIII.66) Osservazione. Quindi se due diverse soluzioni passano per lo stesso punto y0 ∈ Rn , anche in istanti diversi, sono una la traslata dell’altra e quindi (per l’osservazione precedente) descrivono la stessa traiettoria. In particolare potrebbe accadere che la medesima soluzione passi per uno stesso punto in due istanti diversi, cioè che y(t1 ) = y(t2 )
con t1 , t2 .
In questo caso la precedente proprietà assicura che, posto T = t1 − t2 , y(t + T) = y(t)
per ogni t.
Si ottiene perciò che una soluzione con questa proprietà è periodica di periodo |T| e che la corrispondente orbita è una curva chiusa. Da quanto detto dovrebbe risultare chiaro che il dualismo soluzioni
←→
traiettorie
è in qualche modo una declinazione del già noto dualismo parametrizzazioni
←→
(sostegni di) curve.
In realtà questo ci dice anche che
questa soluzione è definita su tutto R (infatti è |T|–periodica, ed il suo intervallo massimale di definizione contiene sia t1 che t2 , cioè ha ampiezza maggiore di |T|).
§ 7. Proprietà qualitative dei sistemi autonomi
È naturale chiedersi fino a che punto questa analogia possa essere portata avanti. Ad esempio: in quali casi una traiettoria risulta essere una curva regolare? È subito chiaro che ciò non è sempre possibile. Sfruttando nuovamente l’unicità è facile vedere che se una soluzione ha velocità nulla in un istante, allora è costante. Da quanto detto segue che qualunque soluzione non costante corrisponde ad una traiettoria regolare (nel senso delle curve). Possiamo riassumere la precedente discussione nel seguente risultato. (VIII.67) Teorema (Classificazione delle traiettorie). Sia f ∈ C1 (Rn , Rn ). Allora per ogni punto y0 ∈ Rn dello spazio delle fasi passa una e una sola traiettoria dell’equazione y′ = f (y) che, al variare di y0 , può essere
429
Ricordiamo
che una curva si dice regolare se ammette una parametrizzazione r di classe C1 tale che il vettore velocità r′ (t) è diverso da 0 per ogni t. Ne segue che, se interpretiamo una soluzione del sistema come parametrizzazione, questa è per definizione di classe C1 , e sarà regolare non appena la velocità non si annulla.
➔ un punto di equilibrio, cioè y0 stesso (corrispondente ad una soluzione costante); ➔ una curva regolare chiusa (corrispondente ad una famiglia di soluzioni periodiche, una traslata dell’altra); ➔ una curva regolare non chiusa (corrispondente ad una famiglia di soluzioni non periodiche, una traslata dell’altra). Alla luce del teorema precedente risulta chiara l’importanza per i sistemi autonomi dello studio del cosiddetto ritratto di fase, cioè delle traiettorie nello spazio delle fasi. Nel seguito vedremo alcuni esempi di tale studio nel caso bidimensionale. È particolarmente rilevante, da un punto di vista dinamico, classificare i punti di equilibrio rispetto alle caratteristiche delle soluzioni con dati iniziali vicini: si tratta di capire se l’equilibrio “attrae” verso di sé le altre traiettorie o le respinge. Abbiamo già visto un’ampia casistica relativa ai sistemi lineari nel paragrafo precedente. Possiamo formalizzare le diverse situazioni nella seguente definizione. (VIII.68) Definizione. Dato il sistema autonomo y′ = f (y), un suo punto di equilibrio y0 si dice stabile (secondo Liapunov) se per ogni ε > 0 esiste δ > 0 tale che per ogni x0 ∈ Rn con kx0 −y0 k < δ la soluzione φ(t) del sistema con dato iniziale y(0) = x0 è definita su [0, +∞) e per ogni t ∈ [0, +∞) si ha kφ(t) − y0 k < ε. Se tale condizione non vale y0 si dice instabile. Se infine per ogni x0 (sufficientemente vicino a y0 ) la soluzione del medesimo problema soddisfa limt→+∞ y(t) = y0 , allora y0 è un punto di equilibrio asintoticamente stabile.
Sistemi lineari autonomi. Stabilità Consideriamo l’equazione y′ = Ay, con A matrice (costante) di ordine 2. Essa, oltre che autonoma, è anche lineare, perciò possiamo sfruttare i risultati ottenuti nel § 5 per ottenere esplicitamente le soluzioni e,
La stabilità secondo Liapunov richiede quindi che, a patto di scegliere il dato iniziale sufficientemente vicino al punto di equilibrio, la soluzione corrispondente gli rimanga arbitrariamente vicino per tutti i tempi. Può essere utile osservare esplicitamente che un punto di equilibrio asintoticamente stabile è anche stabile, ma non vale necessariamente il viceversa (in tal caso si usa la locuzione semplicemente stabile). Alcuni testi definiscono la stabilità asintotica imponendo che entrambi i limiti limt→±∞ y(t) valgano y0 .
430
Sistemi di equazioni differenziali
eliminando il parametro t, dedurre il ritratto di fase (giustificando così a posteriori molte delle figure che abbiamo già visto lungo il capitolo). Grazie all’Esercizio 25 a pagina 453 sappiamo che, a meno di un cambiamento di coordinate lineare, possiamo supporre che A sia scritta in una delle tre “forme normali” descritte dall’esercizio. (VIII.69) Esempio (Autovalori reali distinti). Sia # " λ 0 , A= 1 0 λ2 con autovettori u1 = (1, 0) (corrispondente all’autovalore λ1 ) e u2 = (0, 1) (corrispondente a λ2 ). Dal Corollario (VIII.36) segue che la soluzione generale del sistema si scrive come λ1 t x(t) = c1 e λ1 t λ2 t y(t) = c1 u1 e + c2 u2 e , cioè y(t) = c2 eλ2 t , con t ∈ R. Come abbiamo già più volte osservato se c1 = c2 = 0 la soluzione è costante e corrisponde al punto di equilibrio (0, 0). Se invece solo una delle due costanti arbitrarie è nulla otteniamo quattro traiettorie distinte, corrispondenti ai quattro semiassi del piano cartesiano, entranti o uscenti dall’origine a seconda dei segni degli autovalori. Infine, quando ambedue le costanti sono diverse da zero, abbiamo che ciascuna traiettoria appartiene ad uno dei quattro quadranti, a seconda dei segni di c1 e c2 . Per tracciare il grafico corrispondente possiamo ricavare dall’espressione di x(t) et = (x/c1 )1/λ1 e sostituire in quella di y(t) ottenendo y = c2
x c1
λ2 /λ1
= k|x|λ2 /λ1 ,
Se
gli autovalori di A sono reali e distinti allora A è diagonalizzabile, perciò siamo nel caso ① dell’Esercizio 25 . In questo esempio supponiamo anche che A sia invertibile, cioè che entrambi gli autovalori siano non nulli. Il caso “degenere” è trattato nell’Esercizio (VIII.8) a pagina 445.
Infatti
x e c1 hanno lo stesso segno, perciò x/c1 è positivo.
Abbiamo posto k = c2 |c1 |−λ2 /λ1 .
che, al variare di k e ristretta ad uno dei quadranti, è l’equazione delle traiettorie. Se λ1 e λ2 sono entrambi negativi, come nella matrice " # −1 0 A= 0 −2 dell’Esempio (VIII.39) a pagina 415, allora le considerazioni precedenti portano all’equazione y = kx2 . Ne segue che le traiettorie non rettilinee corrispondono a rami di parabola, e tutte tendono all’origine per t → +∞ (Figura VIII.11). Il caso in cui gli autovalori sono entrambi positivi, ad esempio " # 1 0 A= 0 2
Più
in generale si tratta di rami della curva y = k|x|α , con α > 0. Tali rami saranno asintoticamente tangenti (nell’origine) all’asse x se α > 1, cioè se λ1 < λ2 , e asintoticamente tangenti all’asse y se vale il viceversa.
§ 7. Proprietà qualitative dei sistemi autonomi
F VIII.11: nodo a due tangenti.
431
F VIII.12: sella.
è sostanzialmente analogo: di nuovo (sulle traiettorie non rettilinee) vale y = kx2 , ma questa volta le traiettorie tendono all’origine per t → −∞, perciò sono uscenti dall’origine. Il ritratto di fase si può quindi dedurre da quello precedente semplicemente invertendo l’orientazione delle traiettorie. In entrambi i casi considerati l’origine è un nodo (a due tangenti) per il sistema. Se infine gli autovalori hanno segno opposto, come nella matrice " # 1 0 A= 0 −2 dell’Esempio (VIII.40) a pagina 415, l’equazione delle traiettorie è y = kx−2 .
Nel caso generale y = k|x|−α , con α > 0.
Ne segue che tutte le traiettorie non rettilinee si allontanano dall’origine per t → ±∞, asintotiche all’asse orizzontale per t → +∞ e a quello verticale per t → −∞ (Figura VIII.12). In questo caso l’origine è una sella per il sistema corrispondente. (VIII.70) Esempio (Autovalori complessi coniugati). Consideriamo il sistema corrispondente alla matrice " # α −β A= . β α
Questo caso corrisponde al ③ dell’Esercizio 25 (supponiamo β , 0).
La sua matrice risolvente è data da " # At αt cos βt − sin βt W(t) = e = e , sin βt cos βt
Stiamo
utilizzando il Teorema (VIII.43) a pagina 417, unitamente alla Proposizione (VIII.52) a pagina 421.
432
Sistemi di equazioni differenziali
perciò, come al solito, la soluzione generale del sistema è αt x(t) = e c1 cos βt − c2 sin βt At y(t) = e c, cioè y(t) = eαt c sin βt + c cos βt , 1 2 con t ∈ R. Ancora una volta i valori c1 = c2 = 0 corrispondono all’origine vista come punto di equilibrio nel piano delle fasi. Negli altri casi possiamo elevare al quadrato le espressioni per x(t) e y(t) e sommarle membro a membro. Otteniamo 2
2
2αt 2
x +y =e
k .
Ne segue che per α = 0, cioè quando gli autovalori sono puramente immaginari, le traiettorie sono circonferenze di equazione x2 + y2 = k2 , e l’origine è un centro per il sistema dato (si veda la Figura VIII.2 a pagina 391). Se invece α , 0 non è immediato dedurre l’equazione delle traiettorie: però, dato che x2 + y2 è il quadrato della distanza del generico punto della traiettoria dall’origine, risulta chiaro dall’espressione trovata che per α < 0, ad esempio, ogni traiettoria tende asintoticamente all’origine per t → +∞ e se ne allontana per t → −∞. Per α , 0 l’origine è un fuoco per il sistema ed il ritratto di fase è del tipo di quello illustrato in Figura VIII.10 (a pagina 423). In tutti gli esempi considerati il comportamento delle traiettorie in prossimità del punto di equilibrio (l’origine) varia in funzione degli autovalori della matrice. Grossolanamente possiamo distinguere tre situazioni:
Dopo aver sfruttato l’identità fondamentale sin2 t+cos2 t = 1 abbiamo posto c21 + c22 = k2 .
Ovviamente
per α > 0 si ottiene la situazione opposta.
Giustificheremo
completamente tale figura, determinando l’equazione (polare) delle traiettorie, nell’Esercizio (VIII.13) a pagina 449.
➔ tutte le traiettorie tendono asintoticamente all’origine per t → +∞ (nodo con autovalori negativi, fuoco con autovalori di parte reale negativa), o comunque ➔ tutte le traiettorie rimangono “vicine” all’origine per tutti i tempi (oltre ai precedenti il centro); ➔ alcune traiettorie (o tutte) si allontanano indefinitamente dall’origine (sella, nodo con autovalori positivi, fuoco con autovalori di parte reale positiva). Ricordando la Definizione (VIII.68) possiamo riepilogare la casistica dei sistemi lineari bidimensionali, relativamente alla stabilità dell’origine, come segue. (VIII.71) Sia A una matrice 2 × 2 invertibile, con autovalori (eventualmente complessi) λ1 e λ2 . Allora l’origine è un punto di equilibrio, e si dice ➔ nodo se gli autovalori sono reali con lo stesso segno (asintoticamente stabile se gli autovalori sono negativi, instabile se sono positivi); ➔ sella se gli autovalori sono reali e di segno opposto (sempre instabile);
Questa classificazione tiene conto
anche del caso in cui gli autovalori siano reali e coincidenti, trattato nell’Esercizio (VIII.10) a pagina 447.
§ 8. Sistemi non lineari
433
➔ centro se gli autovalori sono puramente immaginari (stabile ma non asintoticamente); ➔ fuoco se gli autovalori non sono reali né puramente immaginari (asintoticamente stabile se gli autovalori hanno parte reale negativa, instabile se hanno parte reale positiva). Osserviamo che la definizione di stabilità non richiede affatto che il sistema sia bidimensionale. In particolare, per un sistema lineare n × n a coefficienti costanti vale il seguente risultato, generalizzazione diretta dell’analogo per n = 2. (VIII.72) Teorema. L’origine è un punto di equilibrio asintoticamente stabile per l’equazione y′ = Ay se e solo se tutti gli autovalori di A hanno parte reale negativa.
Non
solo, è possibile dare definizioni di stabilità anche per traiettorie non necessariamente di equilibrio: si veda a tal proposito l’Esercizio (VIII.14) a pagina 450.
La dimostrazione di questo fatto è una conseguenza della formula risolutiva generale dei sistemi n × n, che esula dalla trattazione di questo volume.
§ 8. Sistemi non lineari A differenza di quanto visto per i sistemi autonomi lineari, nel caso non lineare non è possibile, in generale, ottenere esplicitamente la soluzione generale del sistema, né tanto meno dedurre da questa il grafico delle traiettorie. Se il sistema è bidimensionale è comunque possibile cercare di ottenere l’equazione delle traiettorie senza passare da quella della soluzione generale. Consideriamo infatti il sistema ( ′ x = f (x, y) y′ = 1(x, y) ed una sua soluzione (x(t), y(t)) che parametrizzi una traiettoria passante per (x0 , y0 ). Grazie alla Proprietà (VIII.64) non è restrittivo supporre (x(0), y(0)) = (x0 , y0 ). Se (x0 , y0 ) non è un punto di equilibrio allora almeno una delle componenti della soluzione ha derivata non nulla nel punto in questione: per fissare le idee supponiamo x′ (0) = f (x0 , y0 ) , 0. Dato che x(t) è di classe C1 otteniamo che è monotona vicino a t = 0, perciò è invertibile e localmente possiamo scrivere t = t(x)
con
1 d t(x) = ′ . dx x (t(x))
Ma allora possiamo sostituire nell’espressione di y ottenendo che anche la funzione y = y(t(x)) è di classe C1 rispetto alla sua variabile x. Dalla regola di derivazione delle funzioni composte otteniamo y′ (t(x)) 1(x, y(t(x))) d d y(t(x)) = y′ (t(x)) · t(x) = ′ = . dx dx x (t(x)) f (x, y(t(x))) Scrivendo, con un piccolo abuso di notazione, y(t(x)) = y(x) otteniamo che tale funzione risolve l’equazione differenziale 1(x, y(x)) d y(x) = . dx f (x, y(x))
Continuiamo
ad indicare con il simbolo ′ la derivazione rispetto alla variabile t e scriviamo esplicitamente le altre.
434
Sistemi di equazioni differenziali
(VIII.73) (Equazione differenziale delle traiettorie) Le traiettorie non di equilibrio del sistema autonomo bidimensionale ( ′ x = f (x, y) y′ = 1(x, y) sono localmente delle curve cartesiane che soddisfano l’equazione differenziale dy 1(x, y) = dx f (x, y) quando f (x, y) , 0 e la
È
immediato vedere che la traiettoria passante per un punto in cui f = 0 e 1 , 0 ammette retta tangente verticale in tale punto.
f (x, y) dx = dy 1(x, y) quando 1(x, y) , 0. (VIII.74) Esempio (Pendolo semplice). Il moto di un pendolo piano senza attrito è descritto dall’equazione (24) x′′ + sin x = 0, che al solito, posto y = x′ , è equivalente al sistema autonomo (non lineare) ( ′ x =y y′ = − sin x.
Più
avanti, nell’Esempio (VIII.78), ci occuperemo anche dell’equazione del pendolo con attrito.
Dato che x rappresenta un angolo,
y = x′ è proporzionale alla velocità angolare del pendolo. Come è naturale attendersi, nei punti di equilibrio tale velocità è nulla.
La funzione vettoriale f (x, y) = (y, − sin x) è chiaramente di classe C1 su tutto R2 . Derivando otteniamo ∂x f (x, y) = (0, − cos x) e ∂ y f (x, y) = (1, 0); entrambe le derivate sono limitate, perciò il Teorema di esistenza globale (VIII.10) ci assicura che tutte le soluzioni del sistema dato sono definite per ogni istante. Osserviamo che il sistema possiede infiniti punti di equilibrio, infatti (y, − sin x) = (0, 0)
⇐⇒
(x, y) = (kπ, 0), k ∈ Z.
Per f (x, y) = y , 0 l’equazione delle traiettorie è data da dy sin x =− , dx y che è un’equazione a variabili separabili: integrando (in x) abbiamo y
dy = − sin x dx
⇐⇒
1 2 y = cos x + C, 2
dove C è un’arbitraria costante di integrazione. A questo punto è possibile disegnare il ritratto di fase semplicemente studiando, al variare di C, le
F VIII.13
§ 8. Sistemi non lineari
435
F VIII.14: il grafico in alto è l’energia potenziale −U(x) = − cos x associata al sistema dinamico del pendolo semplice. In basso invece è illustrato il corrispondente ritratto di fase. I punti di minimo di −U corrispondono a punti di equilibrio stabile nel piano (x, x′ ); i suoi punti di massimo ad equilibri instabili. Quando l’energia totale h ∈ [−1, 1) le orbite sono periodiche, se invece h > 1, le traiettorie sono curve non limitate.
p funzioni y = ± 2(cos x + C). Osserviamo che avremmo potuto ottenere la relazione che lega x ed y ragionando in altro modo e cioè utilizzando la conservazione dell’energia totale del sistema. Infatti, come abbiamo osservato a suo tempo nell’Esercizio (VI.6) a pagina 315, le soluzioni dell’equazione differenziale del second’ordine conservativa soddisfano la legge della conservazione dell’energia, che in questo caso è 1 1 h(x, y) = y2 − U(x) = y2 − cos x = costante sulle soluzioni. 2 2 Leptraiettorie sono dunque contenute nelle curve aventi equazione y = ± 2(U(x) + C); non è difficile dedurre il loro grafico da quello di U, come si vede in Figura VIII.14. Una funzione h(y) che, come l’energia totale, è costante lungo le soluzioni di una equazione differenziale, è detta un integrale primo dell’equazione. Nel caso piano un integrale primo (che non sia già la funzione costante) consente di descrivere le traiettorie nello spazio delle fasi. Quando un sistema ammette un integrale primo, gli eventuali punti di massimo o di minimo dell’integrale primo, se isolati, sono sempre punti di equilibrio stabile per il sistema, come stiamo per verificare nel caso dell’energia totale.
Ricordiamo che il potenziale U(x)
di un’equazione del tipo x′′ = f (x) deve soddisfare la relazione ∇U(x) = f (x).
Nel caso scalare tale relazione si d riduce a U(x) = f (x). dx
In
dimensione più alta questo chiaramente non è vero: per esempio, una equazione in R3 restringe le traiettorie a una superficie, e occorrerebbero due integrali primi indipendenti per descrivere tutte le soluzioni.
(VIII.75) Esempio (Ritratto di fase di un sistema conservativo). Consideriamo l’equazione differenziale del second’ordine conservativa in Rn : mr¨ = ∇U(r). Come noto, ad essa corrisponde il sistema del primo ordine in R2n , il cui campo di velocità è f (r, v) = (v, m−1 ∇U(r)). La funzione m h(r, v) = kv(t)k2 − U(r(t)) 2
Da non confondersi con la velocità v = r′ della particella.
436
Sistemi di equazioni differenziali
Le leggi di Keplero L’equazione r krk3 diventa, in un sistema di coordinate polari (r, ϑ) con centro nel centro della forza, GM r¨ − rϑ˙ 2 = − 2 , r (P) rϑ¨ + 2r˙ ϑ˙ = 0 r¨ = −GM
(si veda l’Esercizio 45 ). La seconda equazione equivale alla conservazione del momento angolare (si veda a pagina 238): (ℓ) r2 ϑ˙ = ℓ ; che, inserita nella prima porta a GM ℓ2 =− 2 . r3 r Ora, poniamo u = 1/r e deriviamo rispetto all’angolo ϑ; utilizzando (ℓ) otteniamo r¨ −
dt d 1 r2 r˙ r˙ d u= =− =− dϑ dϑ dt r ℓ r2 ℓ ! d2 dt d r˙ r2 ℓ2 GM GM u=− = − 2 3 − 2 = −u + 2 . dϑ2 dϑ dt ℓ ℓ r r ℓ Si osservi che troviamo un oscillatore armonico traslato della quantità GM/ℓ2 . Posto p = ℓ2 G−1 M−1 otteniamo, integrando l’ultima equazione, pu = 1 + ε cos(ϑ +
ϑ0 ), dove ε è una costante arbitraria, ovvero p r= . 1 + ε cos(ϑ + ϑ0 ) Si tratta dell’equazione di una conica in un sistema di coordinate polari (si veda anche il volume I, a pagina 91, o l’Esercizio 4 a pagina 270) centrato in un fuoco. Più precisamente, troviamo un’ellisse se ε ∈ [0, 1), una parabola per ε = 1 e una iperbole se ε > 1. Restringiamo la nostra attenzione al caso ε ∈ [0, 1) e osserviamo che la minima e la massima distanza dal centro sono rispettivamente p/(1 + ε) e p/(1 − ε): il semiasse mag2 giore dell’ellisse √ è dunque√a = p/(1−ε ), mentre quello minore b = a 1 − ε2 = ap, essendo ε l’eccentricità dell’ellisse. Abbiamo dimostrato in questo modo la prima delle leggi di Keplero enunciate nel riquadro a pagina 235. Già sapevamo che la seconda è equivalente alla conservazione del momento angolare, che abbiamo per altro già utilizzato poco sopra. Ora dimostriamo la terza. Chiamiamo T il periodo necessario per una rivoluzione: integrando l’equazione (ℓ) in [0, T] e ricordando che ℓ è il doppio della velocità areolare otteniamo 2 Area (ellisse) = ℓT =⇒ 2πab = ℓT. Perciò, elevando al quadrato e ricordando che b2 = ap = otteniamo T2 =
4π2 3 a. GM
è costante lungo le soluzioni; dunque le traiettorie sono contenute negli insiemi di livello di h. Ci proponiamo ora di dedurre il ritratto di fase di un sistema di questo tipo a partire dal grafico dell’energia potenziale −U nel caso in cui n = 1. Come prima cosa osserviamo che l’energia cinetica, mkv(t)k2/2 è una quantità positiva e pertanto il moto avviene nei sottolivelli di −U, ovvero quando −U ≤ h . Non è inoltre difficile convincersi che negli istanti in cui v(t) = x′ (t) = 0 allora −U è massima, cioè assume il valore h. In tali punti se −U′ < 0 allora U′ > 0 e quindi x′′ > 0 e x′ passa da valori negativi a valori positivi; viceversa se −U′ > 0. Infine, se −U è inferiormente limitata, allora, se non vuote, le traiettorie sono curve chiuse corrispondenti ad orbite periodiche, a punti di equilibrio o a moti asintotici ai punti di equilibrio. Abbiamo utilizzato questo tipo di ragionamenti per disegnare il ritratto di fase in Figura VIII.14. (VIII.76) Esempio (Stabilità dei minimi dell’energia potenziale). Supponiamo che l’energia potenziale −U abbia un minimo locale stretto nella posizione r0 . Allora ∇U(r0 ) = 0 ed il punto (0, r0 ) è stazionario per
Cioè
è un integrale primo del
sistema.
In
particolare, non esistono orbite del sistema ad energia h < infr −U(r).
§ 8. Sistemi non lineari
437
il campo f . L’energia corrispondente è h0 = −U(r0 ). Consideriamo ora una soluzione (r1 , v1 ) con valori iniziali in prossimità di (0, r0 ). Purché tali valori siano sufficientemente vicini La sua energia h1 sarà prossima ad h0 : h0 − η < h1 < h0 + η; ciò implica, in particolare, che, per ogni t m −U(r0 ) = h0 ≤ −U(r1 (t)) = h1 − kv1 (t)k2 ≤ h1 < h0 + η. 2 | {z } | {z } =min[−U(r)]
In particolare, ricordando che ogni t, U(r1 (t)) < −h0 < η − h1
≤0
m kv1 (t)k2 = h1 + U(r1 (t)), otteniamo, per 2 e
kv1 (t)k2 < 2η/m.
Queste relazioni, valendo per ogni t, implicano la stabilità nel senso di Liapunov. Infatti, fissato ε > 0, troviamo η ∈ (0, mε2/2) tale che, F VIII.15
U(r) ∈ (h0 − η, h0 ) =⇒ kr − r0 k < ε . Infine, in corrispondenza di tale η possiamo determinare δ > 0 tale che p kvk2 + kr − r0 k2 < δ implichi h0 − η < m2 kvk2 + U(r) < h0 + η.
(VIII.77) Esempio (Modello preda–predatore). Un celebre modello dovuto a Volterra che descrive l’interazione tra due specie biologiche, una di prede e una di predatori, che convivono nello stesso ambiente è dato dal sistema autonomo ( ′ x = ax − bxy y′ = −cy + dxy,
dove x ed y rappresentano rispettivamente il numero di prede e di predatori in un certo istante e le costanti a, b, c e d sono tutte positive. Data la natura del modello, è naturale cercare soluzioni non negative sia in x che in y. Sostituendo y(t) ≡ 0 si vede che la seconda equazione è automaticamente soddisfatta, mentre la prima diviene x′ = ax che implica x(t) = Ceat . Per C = 0 si ottiene perciò la soluzione di equilibrio (x(t), y(t)) ≡ (0, 0), mentre per C > 0 la traiettoria è l’intero semiasse delle x positive, percorso verso destra al crescere del tempo. Analogamente, per x(t) ≡ 0 si trova y(t) = Ce−bt , da cui si ricava di nuovo il punto di equilibrio (0, 0) (per C = 0) e la traiettoria corrispondente al semiasse delle y positive, percorso verso il basso (per C > 0). Ne segue, per unicità, che tutte le traiettorie che transitano da punti del primo quadrante non possono mai uscirne. Osserviamo che l’origine non è l’unico punto di equilibrio del sistema, infatti c a (x(a − by), y(−c + dx)) = (0, 0) ⇐⇒ (x, y) = (0, 0), (x, y) = , . d b L’equazione delle traiettorie è data da dy y(−c + dx) = , dx x(a − by)
Si
veda l’approfondimento a pagina 6. Come è facile vedere, il modello prevede che, in assenza di predatori, le prede crescano esponenzialmente con una legge malthusiana, e la crescita viene mitigata proporzionalmente al numero di incontri medio tra prede e predatori (cioè xy); viceversa, i predatori si estinguono esponenzialmente in assenza di prede.
F VIII.16: alcune traiettorie del sistema di Lotka–Volterra, con a = b = c = d = 1.
438
Sistemi di equazioni differenziali
che è di nuovo a variabili separabili, perciò possiamo integrarla e determinare un integrale primo del sistema: lungo le traiettorie si ha E(x, y) = dx + by − c ln x − a ln y = costante. a c ∇E(x, y) = d − , b − , x y
" 2 c/x HE (x, y) = 0
a − by dy −c + dx = , y dx x da cui
Osserviamo che vale !
Infatti si ha
#
0 , a/y2
a ln y − by = −c ln x + dx + C
(ricordiamo che stiamo supponendo x e y positive).
ed inoltre E(x, y) → +∞ se una tra x o y tende a 0 o a +∞. Quindi ricaviamo che il punto di equilibrio (c/d, a/b) è un minimo assoluto per E; il fatto che E → +∞ quando x o y divergono a +∞ suggerisce che gli insiemi di livello di E siano curve chiuse. In effetti, ragionando come nell’Esercizio (VI.16) a pagina 323, è possibile dimostrare che ciò è vero, in accordo con la Figura VIII.16. Sfruttando il Teorema (VIII.67) deduciamo che tutte le traiettorie del sistema corrispondono ad orbite periodiche. Questo dimostra la prima delle tre leggi di Volterra (approfondimento a pagina 6). Proseguendo l’analisi è anche possibile ottenere le altre due leggi, si vedano a tal proposito gli Esercizi 41 e 42 a pagina 455. Come negli esempi precedenti, la conoscenza di un integrale primo (che non sia già una costante) per un sistema autonomo bidimensionale è sufficiente per tracciare il ritratto di fase. È importante però sottolineare che non tutti i sistemi bidimensionali possiedono integrali primi, nel qual caso per ottenere delle informazioni soddisfacenti oltre all’utilizzo dell’equazione delle traiettorie è necessario ricorrere a quello di tecniche non elementari. Concludiamo comunque questo capitolo con alcune considerazioni su un sistema non trattabile mediante lo studio di un suo integrale primo.
F VIII.17: linee di livello dell’energia (dissipata) e campo di velocità per il pendolo piano con attrito debole
(VIII.78) Esempio (Pendolo con attrito). L’equazione newtoniana che descrive il moto di un pendolo piano con attrito può ricondursi all’equazione differenziale del secondo ordine x′′ + kx′ + sin x = 0, dove x = x(t) è l’angolo tra il pendolo e la verticale all’istante t, e k è un coefficiente positivo (che misura l’effetto dell’attrito). L’equazione può essere scritta come sistema ( ′ x =y (25) y′ = − sin x − ky. I punti di equilibrio sono (kπ, 0), con k = 0, ±1, ±2, . . ., corrispondenti alle posizioni verticali (in basso e in alto) del pendolo. Posto h(x, y) =
1 2 y − cos x 2
osserviamo che ora l’energia non è più costante lungo le traiettorie, ma
F VIII.18: campo di velocità e traiettorie nel piano delle fasi per il pendolo piano con attrito debole (il coefficiente di attrito è k = 0.4).
Esercizi
439
decresce: infatti d h = yy′ + sin xx′ = y(− sin x − ky) + y sin x = −ky2 ≤ 0. dt L’energia viene dunque dissipata lungo le traiettorie. Torniamo alla Figura VIII.14, in cui sono disegnate le traiettorie dell’equazione del pendolo non forzato, che seguono le linee di livello della funzione h. Le traiettorie dell’equazioni con attrito attraversano le linee di livello di h nel verso in cui la funzione decresce, come si vede nella Figura VIII.18, dove sono disegnati il campo di vettori velocità e alcune traiettorie. Le traiettorie più significative sono quelle rappresentate in Figura VIII.19.
Esercizi (VIII.1) È dato il problema di Cauchy nell’incognita (scalare) y = y(t) (
F VIII.19: le traiettorie significative per il flusso del pendolo piano con attrito sono quelle che collegano i punti di equilibrio. Dalla figura appare che l’origine sia un punto di equilibrio stabile mentre ϑ = ±π sono punti di equilibrio instabile
y′ = −(1 + t)y3 y(0) = k.
Dopo aver stabilito che per ogni valore del parametro k ∈ R ammette una unica soluzione, determinarla (prestando particolare attenzione all’intervallo massimale di definizione). Soluzione. Osserviamo che la funzione f (t, y) = −(1+t)y3 è un polinomio, perciò ammette derivate di ogni ordine continue su tutto R2 . Ne segue che per qualunque valore di k è possibile applicare il Teorema (VIII.9) di esistenza ed unicità locale. L’equazione proposta è alle variabili separabili: vediamo subito che la y(t) ≡ 0 risolve l’equazione, e verifica anche il dato iniziale per k = 0. Grazie all’unicità (e alla continuità delle soluzioni) ne segue che ogni altra soluzione (con k , 0) verifica y(t) , 0 sull’intervallo di definizione. Possiamo perciò dividere l’equazione per −y3 (t) ed integrare, ottenendo −
y′ (t) =t+1 y3 (t)
⇐⇒
1 t2 + t + C. = 2 2y2 (t)
Imponendo y(0) = k possiamo ricavare la costante di integrazione C in funzione del parametro k: si ha C = 1/2k2 , da cui y2 (t) =
k2 . k2 t2 + 2k2 t + 1
Abbiamo trovato quest’espressione sotto la condizione k , 0, ma è immediato vedere che essa è coerente anche con la soluzione corrispondente a k = 0, perciò d’ora in poi possiamo far cadere questa distinzione. Da
Invece
la sua derivata parziale rispetto ad y ∂ y f (t, y) = −3(1 + t)y2
non risulta limitata su nessun intervallo di tempo, perciò non è possibile applicare il Teorema (VIII.10) di esistenza globale.
440
Sistemi di equazioni differenziali
quanto visto y(t) è definita quando il secondo membro della precedente equazione è non negativo cioè quando il radicando a denominatore è strettamente positivo. Osserviamo che l’equazione (in t) k2 t2 +2k2 t+1 = 0 ha soluzioni reali se e solo se k4 − k2 ≥ 0, cioè se k ≤ −1 o k ≥ 1. Ne segue che per −1 < k < 1 il trinomio k2 t2 + 2k2 t + 1 è positivo per ogni t ∈ R e possiamo scrivere r k2 k = √ . y(t) = ± 2 2 2 2 k t + 2k2 t + 1 k t + 2k2 t + 1 Se invece k = −1 o k = 1 il trinomio a denominatore si annulla per t = −1 ed è positivo altrimenti. Ricordando che il dominio di definizione di una soluzione di un’equazione differenziale deve essere un intervallo, e che per la condizione iniziale deve contenere l’istante t = 0, abbiamo che in entrambi i casi l’intervallo massimale di definizione è dato da Imax = (−1, +∞). Se infine k < −1 o k > 1 allora k2 t2 + 2k2 t + 1 > √0 se e solo se t < −1 − α oppure t > −1 + α, dove abbiamo posto α = k4 − k2 /k2 . Dato che 0 < α < 1, otteniamo che l’intervallo di definizione contenente t = 0 è sempre il secondo dei due. In definitiva la soluzione del problema proposto vale y(t) = √
k k2 t 2
+ 2k2 t + 1
con t ∈ Imax ,
dove
Imax
R se − 1 < k < 1 se k = ±1 (−1, +∞) = √ 4 2 k −k , +∞ se k < −1 o k > 1. −1 + k2
¯ (VIII.2) Verificare che l’unica soluzione y = y(t) del problema di Cauchy ( y′ = (t2 − y2 ) arctan t y(0) = 2 è di classe C2 sul suo intervallo massimale di definizione. Scriverne lo sviluppo di Taylor del secondo ordine, centrato in t = 0, con resto di Peano. Soluzione. La funzione f (t, y) = (t2 − y2 ) arctan t ammette derivate di ogni ordine continue su tutto R2 . Dal Teorema (VIII.9) di esistenza ed unicità locale deduciamo che il problema dato ammette una unica soluzione y = ¯ di classe C1 . Ma allora, per il Teorema di derivazione delle funzioni y(t) ¯ composte visto a pagina 291, otteniamo che la funzione f (t, y(t)) = y¯ ′ (t)
⊚ ATTENZIONE! Abbiamo otte-
nuto due diverse espressioni, perciò dobbiamo scegliere quella corretta tenendo conto della condizione iniziale. Dai ragionamenti di unicità che abbiamo fatto all’inizio dell’esercizio, risulta che y(t) e k devono avere lo stesso segno, giustificando la nostra scelta.
Infatti in questo caso k2 t2 + 2k2 t + 1 = 0 se
t=
−k2 ±
√ k4 − k2 . k2
Esercizi
441
è di classe C1 , cioè che y¯ è di classe C2 dove è definita. Ne segue che possiamo scriverne lo sviluppo richiesto come ¯ = y(0) ¯ + y¯ ′ (0)t + y(t)
1 ′′ y¯ (0)t2 + o(t2 ) 2
per t → 0.
Ragionando
in modo analogo è possibile vedere (per induzione) che in realtà y¯ è di classe Ck , per ogni k intero. Si veda a tal proposito anche l’Esercizio 5 a pagina 451.
¯ Dalla condizione iniziale sappiamo che y(0) = 2. Sostituendo nell’equazione otteniamo ¯ y¯ ′ (0) = f (0, y(0)) = 0. Per calcolare y¯ ′′ (0) possiamo derivare l’equazione membro a membro (abbiamo già osservato che entrambi i membri sono derivabili). Otteniamo i t2 − y¯ 2 (t) d h 2 ¯ · y¯ ′ (t)) arctan t + , y¯ ′′ (t) = t − y¯ 2 (t) arctan t = (2t − 2 y(t) dt 1 + t2 da cui, sostituendo, y¯ ′′ (0) = −4 ed infine ¯ = 2 − 2t2 + o(t2 ) y(t)
per t → 0.
¯ (VIII.3) Verificare che l’unica soluzione y = y(t) del problema di Cauchy √ ′ 4 3 3 y = (t + y ) t y(0) = −3 è una funzione pari. √3 Soluzione. Sia f (t, y) = (t4 + y3 ) t che ∂ y f (t, y) sono funzioni continue su R2 , perciò il Teorema (VIII.9) assicura l’esistenza e l’unicità della soluzione al problema dato. Si tratta perciò di dimostrare che vale ¯ ¯ (dove è definita). A tale scopo poniamo z(t) = y(−t). ¯ y(−t) = y(t) Da un ¯ = −3. Dall’altro z è derivabile e vale lato z(0) = y(0) √3 √3 z′ (t) = − y¯ ′ (−t) = −((−t)4 + y¯ 3 (−t)) −t = (t4 + z3 (t)) t. Quindi anche z risolve il problema assegnato. Dall’unicità della soluzione ¯ segue z(t) = y(t), che è la tesi. ¯ (VIII.4) Verificare che l’unica soluzione y = y(t) del problema di Cauchy ( y′ = y(2 − y)esin y y(0) = 1
è definita su tutto R, e che soddisfa ¯ = 0, lim y(t)
t→−∞
¯ = 2. lim y(t)
t→+∞
Quindi
da risultati di unicità è a volte possibile dedurre proprietà di simmetria delle soluzioni. Si veda a tal proposito l’Esercizio 7 .
Più
in generale è possibile dimostrare che se f ∈ C1 (a, b) e se a < l1 < l2 < b sono due suoi zeri consecutivi, allora la soluzione di ( ′ y (t) = f (y(t)) con y0 ∈ (l1 , l2 ) y(t0 ) = y0 ha come intervallo massimale tutto R e (se f > 0 in (l1 , l2 )) ammette y = l1 come asintoto orizzontale a −∞ e y = l2 come asintoto orizzontale a +∞ (si veda l’Esercizio 16 ). Questo fatto però non è vero in generale, si veda il prossimo esercizio.
442
Sistemi di equazioni differenziali
Soluzione. La funzione f (t, y) = y(2 − y)esin y ammette derivate di ogni ordine continue su tutto R2 . Per il Teorema (VIII.9) di esistenza ed unicità ¯ del problema proposto esiste ed è unica, locale, la soluzione y = y(t) con intervallo massimale Imax = (Tmin , Tmax ) ∋ 0. Non è invece possibile applicare il Teorema (VIII.10) di esistenza globale, infatti ∂ y f (t, y) = 2 − 2y + y(2 − y) cos y esin y non è limitata. Ciò nonostante, vediamo subito che y1 (t) ≡ 0 e y2 (t) ≡ 2 sono soluzioni ¯ < 2 per t ∈ Imax . dell’equazione data: per unicità otteniamo che 0 < y(t) ¯ ¯ è monotona Ma allora y¯ ′ (t) = f (t, y(t)) > 0 su Imax . Quindi la funzione y(t) e limitata su Imax , perciò ammette limite finito per t che tende agli estremi di Imax . Tenendo conto dell’Osservazione (VIII.23) a pagina 403 e del fatto che f è definita su tutto R2 , questo implica che Imax = R. Inoltre, per monotonia, ¯ = L ≤ 2. 0 < lim y(t) t→+∞
Ma allora, grazie all’equazione differenziale, anche y¯ ′ (t) ammette limite per t → +∞. Si ha infatti ¯ lim y¯ ′ (t) = lim f (t, y(t)) = L(2 − L)esin L .
t→+∞
t→+∞
Dalle proprietà delle funzioni derivabili di una variabile sappiamo che ¯ ammette limite finito per t → +∞ e anche y¯ ′ (t) ammette limite, se y(t) allora quest’ultimo deve essere nullo. Ne deduciamo L(2 − L)esin L = 0
da cui, ricordando che L > 0,
L = 2.
Abbiamo visto nel primo volume,
Capitolo VIII, che se il grafico di una funzione derivabile ammette asintoto orizzontale, allora la sua derivata ha due possibilità: o non ammette limite, o, se lo ammette, questo è 0.
¯ = 0. Ragionando analogamente si prova che limt→−∞ y(t) (VIII.5) Risolvere il problema di Cauchy y(2 − y) ′ y = 2(1 + t2 ) y(0) = 1 e determinare i limiti della soluzione agli estremi del suo intervallo massimale di definizione. Soluzione. Usando il Teorema (VIII.9) è facile verificare che la soluzione y = y(t) esiste, è unica e verifica 0 < y(t) < 2. Per altro, l’equazione è alle variabili separabili, perciò possiamo determinare esplicitamente la soluzione: si ha y′ (t) y′ (t) y 2y′ (t) 1 = + = = arctan t + C. , da cui ln 2 y(t)(2 − y(t)) y(t) 2 − y(t) 1 + t 2−y
Infatti y(t) ≡ 0 e y(t) ≡ 2 sono soluzioni dell’equazione che non possono essere intersecate per unicità. Ragionando come nell’esercizio precedente si può anche vedere che questo implica che la soluzione al problema dato è monotona crescente e definita su tutto R.
Esercizi
443
Imponendo la condizione iniziale si trova C = 0 e quindi y=
2earctan t , 1 + earctan t
con t ∈ R.
Quindi la soluzione ammette asin-
Agli estremi dell’intervallo massimale si ha quindi 2e−π/2 >0 e lim y(t) = t→−∞ 1 + e−π/2
2eπ/2 lim y(t) = < 2. t→+∞ 1 + eπ/2
(VIII.6) Tracciare un grafico qualitativo delle soluzioni del problema ( y′ = sin y y(0) = a,
toti orizzontali ma, a differenza dell’esercizio precedente, questi non coincidono con le soluzioni costanti. In effetti se y(t) → L (finito) per t → ±∞ dall’equazione otteniamo lim y′ (t) = lim
t→±∞
t→±∞
y(t)(2 − y(t)) =0 2(1 + t2 )
a prescindere dal valore di L, che quindi non subisce restrizioni.
al variare di a ∈ [0, 2π], senza determinare l’espressione analitica della soluzione. Soluzione. Seguiamo il seguente schema di ragionamento. 1. Esistenza e unicità. Osserviamo che f (t, y) = sin y è di classe C1 su tutto R2 , e che |∂ y f (t, y)| = | cos y| ≤ 1 per ogni y. Grazie al Teorema (VIII.10) di esistenza ed unicità globale possiamo affermare che per ogni punto del piano ty passa una e una sola soluzione dell’equazione differenziale, definita per ogni t ∈ R. 2. Soluzioni costanti. Si trovano imponendo che la soluzione sia y(t) ≡ C con C ∈ R. Sostituendo nell’equazione differenziale si trova 0 = sin C, da cui C = nπ dove n è un qualunque numero intero (anche n = 0). Data la restrizione sul dato iniziale, sono tre le soluzioni costanti che ci interessano, vale a dire y = 0, y = π e y = 2π; le altre soluzioni non possono intersecare queste rette orizzontali. Le soluzioni non costanti si dividono perciò in una famiglia di soluzioni, indicate con y1 , comprese tra 0 e π e una seconda famiglia y2 di soluzioni comprese tra π e 2π. 3. Segno di y′ . Il segno di y′ è importante, perché decide la monotonia delle soluzioni: coincide col segno di f (t, y) = sin y e dunque nella nostra striscia avremo che y′ > 0 ⇐⇒ y ∈ (0, π)
Lo
schema che proponiamo può essere applicato allo studio di una qualsiasi altra equazione differenziale.
Corrispondono
ai punti d’equilibrio del sistema monodimensionale autonomo y′ = sin y!
Dato
che, se y(t) risolve l’equazione differenziale, ogni sua traslata y(t) + 2nπ lo fa (il Lettore lo verifichi!), i grafici delle soluzioni per a < 0 o a > 2π si possono dedurre da quelli che stiamo tracciando per traslazione.
y′ < 0 ⇐⇒ y ∈ (π, 2π)
e
Le soluzioni y1 sono quindi tutte monotone crescenti mentre le y2 sono strettamente decrescenti. 4. Segno di y′′ . Dato che y ed f sono di classe C1 , anche la loro composta lo è; ma allora l’equazione differenziale implica che y′ è di classe C1 , perciò possiamo derivare l’equazione differenziale: y′′ (t) = cos(y(t))y′(t) = cos(y(t)) · sin(y(t)) = Il segno di y′′ è quindi π 3 y′′ > 0 ⇔ y ∈ 0, ∪ π, π 2 2
e
1 sin(2y(t)). 2
y′′ < 0 ⇔ y ∈
π 3 , π ∪ π, 2π . 2 2
F VIII.20
444
Sistemi di equazioni differenziali
Le rette y = π2 e y = 32 π sono i luoghi dei punti di flesso delle due famiglie di soluzioni. 5. Limiti. Le soluzioni dell’equazione sono definite su tutto R: si può quindi esaminare il loro comportamento asintotico per t → ±∞. Ragionando come nell’Esercizio (VIII.4) otteniamo lim y1 (t) = 0,
t→−∞
lim y1 (t) = π e
lim y2 (t) = 2π,
t→+∞
t→−∞
O, ancora meglio, come nell’Esercizio 16 .
lim y2 (t) = π.
t→+∞
A questo punto, tenendo conto di tutte le informazioni trovate, possiamo tracciare un grafico qualitativo delle soluzioni, ricordando ovviamente che non si possono intersecare tra di loro (si veda la Figura VIII.20). ✩ (VIII.7) Tracciare un grafico qualitativo delle soluzioni del seguente problema di Cauchy quando |a| > 1 ( y′ = (y2 − 1)3
Considereremo
nell’Esercizio 17 .
il caso |a| ≤ 1
y(0) = a
Soluzione. Data la presenza delle soluzioni costanti y ≡ ±1 e vista l’applicabilità del teorema di esistenza ed unicità locale abbiamo che se a > 1 allora la corrispondente soluzione assumerà sempre valori maggiori di 1, mentre se a < −1 la soluzione sarà sempre minore di −1. Dallo studio del segno di y′ scopriamo inoltre che tali soluzioni sono sempre crescenti sul loro intervallo di definizione. Segue che, se a > 1 la soluzione è crescente e inferiormente limitata dalla retta y = 1, quindi, grazie all’Esercizio 15 lim ya (t) = 1,
t→−∞
Il
Lettore è inoltre invitato a verificare che y′′ > 0 se y > 1, invece y′′ < 0 quando y < −1.
se a > 1
e analogamente lim ya (t) = −1,
t→+∞
se a < −1.
Dunque se a > 1 l’intervallo massimale di definizione è un intervallo del tipo (−∞, β), con 0 < β ≤ +∞, invece se a < −1 è (α, +∞) con −∞ ≤ α < 0. Iniziamo a considerare il caso a > 1; la soluzione ya (t) non è definita su tutto R se e solo se β è finito e
lim ya (t) = B
t→β−
lim− ya (t) = +∞.
t→β
Osserviamo inoltre che, essendo ya convessa, anche quando β = +∞ il limite destro della funzione è +∞. Ci chiediamo quindi: quanto “tempo” impiega la soluzione per raggiungere una quota grande a piacere? Per capirlo torniamo all’equazione differenziale e dividiamone entrambi i membri per (y2 − 1)3 ; integrando ora rispetto al tempo su [0, β] otteniamo Z
β 0
y′ (t) dt =β (y2 (t) − 1)3
Questo perché se
Z
⇐⇒
+∞ a
dy = β. − 1)3
(y2
con B finito (ya ammette certamente limite perché è monotona), risolvendo il problema di Cauchy con dato ya (β) = B si prolunga la soluzione a destra di β.
Stiamo procedendo come per l’in-
tegrazione di un’equazione a variabili separabili (si veda il Capitolo I).
Cambiando variabile e sfruttando
il fatto che ya (t) → +∞ quando x → β (finito o infinito).
Esercizi
Scopriamo così che la soluzione non è definita in tutto R se e soltanto se l’integrale improprio Z +∞ dy 2 (y − 1)3 a risulta convergente. Essendo 1/(s2 − 1)3 ∼ 1/s6 , che è integrabile all’infinito, concludiamo che tale integrale converge e che β è finito. La soluzione quindi esplode avvicinandosi a β− : presenta cioè un asintoto verticale in t = β < +∞. Una analisi del tutto equivalente permette di studiare le soluzioni con dato a < −1; in questo caso il tempo (negativo) impiegato dalla soluzione per raggiungere una quota “piccola a piacere” è Z a dy − 2 3 −∞ (y − 1) ed essendo anche in questo caso l’integrale convergente deduciamo che il suo intervallo massimale di definizione è di tipo (α, +∞) con α > −∞ e che t = α è un asintoto verticale. (VIII.8) Trovare la soluzione generale e disegnare il ritratto di fase del sistema lineare autonomo ( ′ x =x−y y′ = −x + y.
445
Occorre
riguardare la teoria degli integrali impropri: ad esempio nel primo volume, Capitolo XII.
In
generale dato il problema di Cauchy autonomo ′ y (t) = f (y(t)) y(0) = y 0 con f ∈ C1 (R), l’integrale Z
y(t) y0
dy f (y)
rappresenta “il tempo” impiegato dalla soluzione del problema di Cauchy per raggiungere la quota y(t). La soluzione risulta quindi definita su tutto [0, +∞) se e solo se 1/ f ha integrale divergente in [a, +∞).
Soluzione. Il sistema è lineare omogeneo ed autonomo, con matrice dei coefficienti " # 1 −1 A= . −1 1 Essendo il polinomio caratteristico pA (λ) = λ2 − 2λ, gli autovalori sono λ1,2 = 0, 2, perciò A è diagonalizzabile. I corrispondenti autovettori si trovano immediatamente: per λ1 = 0 si ha " # ( v1 − v2 = 0 1 ⇐⇒ v = c , Av = 0 ⇐⇒ 1 −v1 + v2 = 0 mentre per λ2 = 2 si ha ( " # v1 − v2 = 2v1 1 Av = 2v ⇐⇒ ⇐⇒ v = c . −1 −v1 + v2 = 2v2 Dal Corollario (VIII.36) a pagina 412 otteniamo che la soluzione generale dell’equazione omogenea è data da " # " # 2t 1 1 2t x(t) = c1 + c2 e y = c1 + c2 e , cioè 1 −1 y(t) = c1 − c2 e2t .
F VIII.21
Infatti ad ogni coppia λ autovalo-
re e v autovettore corrisponde la soluzione veλt (ed ovviamente, nel caso λ = 0, eλt ≡ 1).
446
Sistemi di equazioni differenziali
Osserviamo che, sommando membro a membro, si trova x + y = 2c1 , perciò tutte le traiettorie sono contenute in rette parallele a quella di equazione y = −x. Se c1 è fissata, per c2 = 0 si ottiene la soluzione costante, corrispondenti a una traiettoria puntiforme, del tipo (x, y) = (c1 , c1 ). Per c2 > 0 si ottiene la semiretta (aperta) che parte da (c1 , c1 ) (per t → −∞) avente x crescente e y decrescente . Viceversa, per c2 < 0 si ottiene la semiretta uscente da (c1 , c1 ) e avente x decrescente e y crescente. Il ritratto di fase corrispondente è illustrato in Figura VIII.21.
Quindi
tutti i punti della retta y = x sono punti di equilibrio per il sistema, e sono instabili.
(VIII.9) Trovare la soluzione generale del sistema lineare ′ −2t x =x−y+e y′ = −x + y − 3e−2t . Trovare poi le soluzioni che soddisfano le condizioni iniziali x(0) = 0, y(0) = 5 e
x(0) = 1, y(0) = 2
e tracciare le corrispondenti traiettorie nel piano delle fasi xy. Soluzione. Il sistema è del tipo " y′ = Ay + b(t),
con A =
# " −2t # 1 −1 e , b(t) = , −1 1 −3e−2t
perciò il sistema omogeneo associato a quello proposto è anche autonomo, mentre il sistema completo non lo è. Per risolverlo ricorriamo al Corollario (VIII.30) a pagina 408 e quindi cerchiamo un insieme fondamentale di soluzioni dell’equazione omogenea w′ = Aw. Abbiamo già risolto questo sistema nell’esercizio precedente: la sua soluzione generale è data da " # " # " # 1 1 2t 1 e2t w = c1 + c2 e = c = W(t)c. 1 −1 1 −e2t Per trovare una soluzione particolare del sistema non omogeneo, ricordando il Teorema (VIII.59) di variazione delle costanti, cerchiamo una soluzione del tipo yp (t) = W(t)c(t); sostituendo si ottiene W(t)c′ (t) = b(t), da cui " # " −2t # " −2t # 1 −e2t −e2t e −e ′ −1 c (t) = W (t)b(t) = − 2t · = . −1 1 −3e−2t 2e−4t 2e Integrando e sostituendo abbiamo " # " # " # 1 e−2t 0 1 e2t = −2t yp (t) = W(t)c(t) = · e 1 −e2t 2 −e−4t
F VIII.22
Ricordiamo che " a c
" #−1 1 d b = d ad − bc −c
−b a
#
(ammesso che il determinante ad−bc non sia nullo).
Esercizi
447
da cui finalmente la soluzione generale del sistema proposto " # " # " # 0 1 1 2t y = −2t + c1 + c2 e . e 1 −1 Per trovare le soluzioni particolari richieste dobbiamo imporre le condizioni iniziali: per la prima si ha " # " # " # ( 0 = c1 + c2 0 1 1 2t da cui la soluzione y1 (t) = −2t + 2 −2 e , e 1 −1 5 = 1 + c1 − c2 mentre la seconda fornisce ( " # " # 1 = c1 + c2 0 1 da cui y2 (t) = −2t + . e 1 2 = 1 + c1 − c2 Le due traiettorie corrispondenti sono illustrate in FiguraVIII.22. Come si vede, pur essendo traiettorie distinte queste si intersecano. (VIII.10) Disegnare il ritratto di fase del sistema lineare autonomo ( ′ x = x + by
Questo fatto illustra il motivo per cui, nel caso di sistemi non autonomi, solitamente l’utilizzo del piano delle fasi non è di grossa utilità.
y′ = y.
Soluzione. La matrice dei coefficienti del sistema proposto è triangolare superiore, ha due autovalori coincidenti e non è diagonalizzabile (se b , 0) . Come abbiamo già visto nell’Esempio (VIII.49) a pagina 419 la soluzione generale del sistema è data da " #" # t t x(t) = c1 e + c2 bte t 1 bt c1 y(t) = e , cioè y(t) = c et . 0 1 c2
Se
b = 0 otteniamo che tutte le traiettorie sono delle semirette: siamo infatti nel caso del nodo a stella, Figura VIII.6 a pagina 415.
2
Per c2 = 0 otteniamo tre traiettorie, cioè l’origine ed i due semiassi delle x. Se invece c2 , 0 possiamo ricavare t = ln(y/c2) = ln |y| − ln |c2 | (ben definita quando y ha lo stesso segno di c2 ) e sostituire ottenendo x=
c1 y + by(ln |y| − ln |c2 |) = ky + by ln |y|. c2
A questo punto è sufficiente eseguire un semplice studio di funzione per ottenere il ritratto di fase nel piano xy. Si può vedere, ad esempio, che per t → −∞ x(t) e y(t) tendono a zero, ed al limite la generica traiettoria è tangente all’asse x (si veda la Figura VIII.8 a pagina 419). Le traiettorie sono quindi uscenti dall’origine. (VIII.11) Al variare del parametro reale α discutere la stabilità dell’origine e descrivere le traiettorie del sistema " # 2α 1 y′ = y. −1 0
Abbiamo posto k = c1 /c2 −b ln |c2 |. Nel caso generale (
x′ = λx + by y′ = λy,
con considerazioni analoghe, si ottiene che per λ > 0 le traiettorie sono uscenti dall’origine (che è quindi un punto di equilibrio instabile), mentre per λ < 0 sono entranti nell’origine (asintoticamente stabile). In ogni caso, al limite, sono tutte tangenti all’asse x, il che giustifica la terminologia nodo ad una tangente.
448
Sistemi di equazioni differenziali
Soluzione. Il sistema è lineare omogeneo e autonomo. Dobbiamo perciò calcolare gli autovalori della matrice dei coefficienti A. Abbiamo " # √ 2α − λ 1 pA (λ) = det = λ2 − 2αλ + 1 = 0 ⇐⇒ λ1,2 = α ± α2 − 1. −1 −λ Quindi se α2 − 1 > 0 gli autovalori sono reali e distinti, ed è facile vedere che sono entrambi positivi per α > 0 ed entrambi negativi per α < 0. Se α2 − 1 = 0 gli autovalori sono coincidenti. Tenuto conto di quanto visto nell’Esempio (VIII.49) a pagina 419, dato che la matrice A non è diagonale non è neppure diagonalizzabile. Se infine α2 − 1 < 0 gli autovalori sono complessi coniugati, di parte reale α (in particolare per α = 0 sono puramente immaginari). Quindi A è sempre invertibile e, seguendo la Proposizione (VIII.71) a pagina 432, otteniamo ➔ α < −1, autovalori reali, distinti e negativi: l’origine è un nodo a due tangenti asintoticamente stabile; ➔ α = −1, autovalori coincidenti e negativi, matrice non diagonalizzabile: l’origine è un nodo ad una tangente asintoticamente stabile; ➔ −1 < α < 0, autovalori complessi coniugati con parte reale negativa: l’origine è un fuoco asintoticamente stabile; ➔ α = 0, autovalori puramente immaginari: l’origine è un centro (semplicemente stabile); ➔ 0 < α < 1, autovalori complessi coniugati con parte reale positiva: l’origine è un fuoco instabile; ➔ α = 1, autovalori coincidenti e positivi, matrice non diagonalizzabile: l’origine è un nodo ad una tangente instabile; ➔ α > 1, autovalori reali, distinti e positivi: l’origine è un nodo a due tangenti instabile. (VIII.12) Trovare la soluzione generale delle equazioni lineari y′′′ − 3y′′ + 3y′ − y = 0
e
y(4) + 2y′′ + y = 0.
Soluzione. Dall’equivalenza tra equazioni di ordine n e sistemi del primo ordine di n equazioni, sappiamo che l’insieme delle soluzioni della prima equazione è uno spazio vettoriale di dimensione 3, mentre quello della seconda è di dimensione 4. Per quanto riguarda la prima, il polinomio caratteristico associato è λ3 − 3λ2 + 3λ − 1 = (λ − 1)3 , che ha tre radici coincidenti λ1,2,3 = 1. Questo ci fornisce una prima soluzione, y(t) = et . Possiamo cercare le
Abbiamo
introdotto il polinomio caratteristico di un’equazione scalare nel Capitolo I. Si veda anche l’Esempio (VIII.37) a pagina 413.
Esercizi
altre “fattorizzando” l’equazione. Indicando con D la derivazione rispetto a t, infatti, l’equazione si scrive come
449
Infatti (D − 1)y = y′ − y,
(D − 1)2 y = (D − 1)(y′ − y)
(D − 1)3 y = 0. Posto v(t) = (D − 1)2 y(t) otteniamo (D − 1)v = (D − 1)3 y = 0 ⇐⇒ v′ − v = 0 ⇐⇒ v = c1 et .
= y′′ − y′ − y′ + y
ed infine
(D − 1)3 y = (D − 1)(y′′ − 2y′ + y) = y′′′ − 3y′′ + 3y′ − y.
A questo punto poniamo w(t) = (D − 1)y(t), ottenendo (D − 1)w = v = c1 et ⇐⇒ w′ − w = c1 et ⇐⇒ w = c1 tet + c2 et . Infine
= y′′ − 2y′ + y
Infatti l’equazione si scrive come e−t w′ − e−t w = c1 ,
da cui, integrando,
e−t w(t) = c1 t + c2 .
(D − 1)y = w = c1 tet + c2 et ⇐⇒ y′ − y = c1 tet + c2 et . L’ultima equazione si può riscrivere come [e−t y]′ = e−t y′ − e−t y = c1 t + c2 , ed infine (rinominando la costante c1 ) y(t) = c1 t2 et + c2 tet + c3 et . Il polinomio caratteristico della seconda equazione è λ4 + 2λ2 + 1 = (λ2 + 1)2 , che quindi ha quattro radici immaginarie, λ1,2 = i e λ3,4 = −i. Possiamo procedere come nel caso precedente. L’equazione si fattorizza come (D2 + 1)2 y = 0. Ponendo v = (D2 + 1)y si ha (D2 + 1)v = (D2 + 1)2 y = 0 ⇐⇒ v′′ + v = 0 ⇐⇒ v(t) = c1 cos t + c2 sin t. Quindi (D2 + 1)y = v = 0 ⇐⇒ y′′ + y = c1 cos t + c2 sin t. Abbiamo imparato a risolvere equazioni di questo tipo nel Capitolo I. A patto di rinominare le costanti arbitrarie otteniamo y(t) = c1 t cos t + c2 t sin t + c3 cos t + c4 sin t. (VIII.13) È dato il sistema lineare autonomo ( ′ x = −x − 3y y′ = 3x − y. Dopo averlo scritto in coordinate polari, risolverlo e dedurne il ritratto di fase.
Si
veda l’Esercizio (I.8) a pagina 25.
Da ragionamenti analoghi a quel-
li appena visti, è possibile dedurre la soluzione generale per equazioni scalari lineari a coefficienti costanti di ordine n. La risoluzione di sistemi di n equazioni invece risulta essere più laboriosa ed esula dalla trattazione di questo volume.
450
Sistemi di equazioni differenziali
Soluzione. Al solito, le coordinate polari sono individuate dalle relazioni x = r cos ϑ, y = r sin ϑ, dove, in questo contesto, tutte e quattro le variabili sono pensate come dipendenti da t. Derivando la relazione r2 (t) = x2 (t) + y2 (t) otteniamo 2rr′ = 2xx′ + 2yy′ ; ricordando invece che tan ϑ(t) = y(t)/x(t) abbiamo ! y2 ′ y′ x − yx′ 2 2 ′ cioè x 1 + 2 ϑ = y′ x − yx′ . 1 + tan ϑ ϑ = x2 x Riassumendo ′ ′ ′ rr = xx + yy (26) r2 ϑ′ = xy′ − x′ y. Applicando quanto visto al sistema in questione abbiamo ′ ′ ′ 2 2 2 rr = xx + yy = x(−x − 3y) + y(3x − y) = −x − y = −r r2 ϑ′ = x(3x − y) − y(−x − 3y) = 3x2 + 3y2 = 3r2 . La prima equazione è semplicemente la r′ = −r che ha come integrale generale r(t) = c1 e−t . La seconda invece è la ϑ′ = 3 da cui ϑ(t) = 3t + c2 . Ricavando t in funzione di ϑ otteniamo l’equazione polare delle traiettorie r = ke−ϑ/3 (dove k = c1 ec2 /3 ). Le traiettorie sono quindi delle spirali che si tendono all’origine in senso antiorario. Il ritratto di fase corrispondente è rappresentato in Figura VIII.10 a pagina 423. (VIII.14) Dopo aver scritto il sistema autonomo ′ 2 2 x = −y + x(1 − x − y ) y′ = x + y(1 − x2 − y2 ) in coordinate polari, risolverlo e dedurne il ritratto di fase. Soluzione. Utilizzando le formule (26) otteniamo h i h i rr′ = xx′ + yy′ = x −y + x(1 − x2 − y2 ) + y x + y(1 − x2 − y2 ) = (x2 + y2 )(1 − x2 − y2 ) = r2 (1 − r2 )
e h i h i r2 ϑ′ = xy′ − x′ y = x x + y(1 − x2 − y2 ) − y −y + x(1 − x2 − y2 ) = x2 + y2 = r2 .
Per
r = 0 otteniamo la traiettoria corrispondente all’origine, perciò possiamo supporre r > 0 e semplificare.
Dall’espressione
delle soluzioni in coordinate polari possiamo ricavare anche quella in coordinate cartesiane: x = r cos ϑ = c1 e−t cos(3t + c2 ),
y = r sin ϑ = c1 e−t sin(3t + c2 ), in accordo con quanto visto nell’Esempio (VIII.56), a pagina 423.
Esercizi
451
Osserviamo che l’origine è un punto di equilibrio del sistema, che in coordinate polari corrisponde alla soluzione r(t) ≡ 0. Per r > 0 il sistema si può scrivere come ( ′ r = r(1 − r2 ) ϑ′ = 1,
che risulta essere disaccoppiato nelle due variabili. La seconda equazione è risolta da ϑ(t) = t + h, perciò tutte le traiettorie “ruotano” attorno all’origine, in senso antiorario, a velocità angolare costante. La prima invece è stata risolta (separando le variabili) nell’Esercizio 17 (a) a pagina 30: avevamo trovato le soluzioni costanti r ≡ 0 e r ≡ 1, la prima corrispondente all’origine, la seconda ad una traiettoria chiusa, la circonferenza unitaria centrata nell’origine. Le altre soluzioni invece sono q r(t) = k exp(2t)/(k exp(2t) + 1), t ∈ R se 0 < r < 1 q r(t) =
k exp(2t)/(k exp(2t) − 1), t ∈ (− ln k/2, +∞)
se r > 1.
F VIII.23
Dalle espressioni di r e ϑ è facile ricavare quelle di x e y. Si vede (anche dall’equazione per r) che, quando r è minore di 1, cresce tendendo a 1, mentre quando e maggiore di 1 decresce (sempre tendendo a 1). Il ritratto di fase corrispondente è disegnato in Figura VIII.23. Probabilmente senza troppe sorprese, la traiettoria corrispondente alla circonferenza r = 1 viene detta ciclo limite asintoticamente stabile per il sistema.
✎ Diamoci da fare. . . (Soluzioni a pagina 629) 1 Consideriamo l’equazione del pendolo forzato con attrito: mx′′ (t) = −k sin(x(t)) − γx′ (t) + 1(t). Ridurre l’equazione ad un’equazione del prim’ordine vettoriale e discutere il significato fisico del problema di Cauchy. Stabilire infine se è applicabile il Teorema (VIII.9) di esistenza e unicità locale. 2 Utilizzando il Teorema (VIII.9), dimostrare che l’integrale generale dell’equazione x′′ (t) = −ω2 x(t) (con ω , 0) è dato dalla famiglia C1 sin(ωt) + C2 cos(ωt), al variare di C1 e C2 in R. 3 Scrivere il sistema di equazioni di prim’ordine equivalente all’equazione lineare di quarto ordine y(4) (t) + 2y′′ (t) + y(t) = 0 ed esplicitare la matrice associata al sistema.
4 La famiglia di soluzioni di un’equazione differenziale del tipo y′′ = 1(y, y′ ) conterrà in genere due costanti arbitrarie. Per le seguenti famiglie di funzioni dipendenti da due costanti arbitrarie determinare l’equazione differenziale di cui sono l’integrale generale. (Suggerimento: eliminare le costanti confrontando tra loro le espressioni di y, y′ e y′′ .) (a) y(x) = c1 ex + c2 e−x ; (b) y(x) = c1 + c2 x; (c) y(x) = (c1 + c2 x)ex . K 5 Dimostrare che se f : I × Rn → Rn , I ⊂ R, è di classe Ck (k intero positivo) allora una soluzione φ del problema y′ (t) = f (t, y(t)) è di classe Ck+1 (sul suo dominio); inoltre se f è C∞ allora anche φ lo è. (Suggerimento: utilizzare il teorema di derivazione delle funzioni composte.)
452
Sistemi di equazioni differenziali
6 Costruire la successione yn delle iterate di Picard K 11 (Lemma di Gronwall) Sia I ⊂ R un intervallo e (definita nell’equazione (11) a pagina 401) per la t0 ∈ I. Dimostrare che se f è una funzione continua e soluzione del problema di Cauchy non negativa in I, che verifica Z t ( ′ y (t) = y(t) + t L f (s) ds per ogni t ∈ I, f (t) ≤ c + t0 y(0) = 1. allora per ogni t ∈ I K 7 Sia f : R2 → R di classe C1 tale che (*)
f (−t, −v) = f (t, v),
f (t) ≤ ceL|t−t0 | .
∀(t, v) ∈ R2 .
K✩ 12 Sia Φ(t, y; t0 ) la soluzione del problema di CauDimostrare che se yˆ è una soluzione del problema di chy con dato iniziale y come definita nel riquadro a Cauchy pagina 404. Utilizzando il Lemma di Gronwall dell’esercizio precedente, dimostrare che nelle ipotesi del ( y′ = f (t, y) Teorema (VIII.10), si ha y(0) = 0 kΦ(t, y1 ; t0 ) − Φ(t, y2 ; t0 )k ≤ ky1 − y2 keL|t−t0 | , allora yˆ è una funzione dispari. Analogamente dimostrare che se sostituiamo l’ipotesi (*) con (**)
f (−t, v) = − f (t, v),
∀(t, v) ∈ R2
allora yˆ è pari K 8 Dimostrare il Teorema di esistenza e unicità globale (VIII.10), visto a pagina 395, utilizzando il Teorema di punto fisso per l’iterata p-esima di una mappa dell’Esercizio (VII.5) (a pagina 373). (Suggerimento: dimostrare che se p è sufficientemente grande, dalla stima del Passo 1 del Teorema (VIII.10) si ha che l’operatore T p è una contrazione sull’intero intervallo [t0 , b]. Dedurre così l’esistenza di una unica soluzione del problema su tutto [a, b] senza ricorrere alla costruzione di un prolungamento.)
dove L è la costante dell’equazione (10). K 13 (Teorema di confronto) Siano y1 e y2 le soluzioni dei problemi di Cauchy ( ′ yi = fi (t, yi ) yi (t0 ) = zi con z1 ≤ z2 . Dimostrare che se f1 (t, y) ≤ f2 (t, y) per ogni t ∈ [a, b] e y ∈ R, e fi verificano le ipotesi del Teorema di esistenza globale, allora y1 (t) ≤ y2 (t)
∀t ∈ [t0 , b].
14 Discutere esistenza e unicità delle soluzioni del problema di Cauchy t ′′ y = 1 + y2 + (y′ )2 y(0) = 1, y′ (0) = 2.
K 9 Nelle ipotesi del Teorema di esistenza e unicità globale (VIII.10), dimostrare che esiste una costante K > 0 tale che se kψ′ (t) − f (t, ψ(t))k < ε in (a, b) e kψ(t0 ) − y0k < ε, allora la distanza d∞ (ψ, y) < Kε, dove y è l’unica Determinare poi lo sviluppo di Taylor con resto di Peano soluzione del problema di Cauchy y′ (t) = f (t, y(t)) in di ordine 2 della soluzione, centrato nell’istante iniziale. (a, b) con condizione iniziale y(t0 ) = y0 . (Suggerimento: si utilizzi l’Esercizio 8 insieme con la stima dell’errore (3) K 15 Sia f di classe C1 e yˆ una soluzione dell’equazione nell’Osservazione (VII.37) a pagina 347.) autonoma K 10 (Teorema di unicità) Dimostrare che se la funzione f : R = [t0 − r1 , t0 + r1 ] × [y0 − r2 , y0 + r2 ] ⊂ R × R → R è continua e decrescente nella seconda variabile, ovvero se per ogni (t, y1 ), (t, y2 ) ∈ R tali che y1 ≤ y2 si ha f (t, y1 ) ≥ f (t, y2 ), allora il problema ai valori iniziali (6) ammette al più una soluzione (locale). (Suggerimento: procedere con un ragionamento per assurdo.)
y′ (t) = f (y(t)) su un intervallo del tipo (a, +∞) con a ≥ −∞. Dimostrare che ˆ =l∈R lim y(t)
t→+∞
=⇒
f (l) = 0.
Esercizi
453
K 16 Sia f di classe C1 (a, b) e a < l1 < l2 < b tali che f (l1 ) = f (l2 ) = 0 e
f (s) > 0,
∀s ∈ (l1 , l2 ).
Dimostrare che se yˆ è una soluzione del problema di Cauchy ( ′ y (t) = f (y(t)) con y0 ∈ (l1 , l2 ) y(t0 ) = y0
21 Attraverso lo studio del segno di y′ mostrare che tutte le soluzioni dell’equazione y′ = (4t2 − y2 )(ey − 1) sono prolungabili su tutto R. 22 Data un’equazione lineare di ordine n y(n) (t) = an−1 (t)y(n−1) (t) + . . . + a1 (t)y′ (t) + a0 (t)y(t)
allora l’intervallo massimale di yˆ è R e ˆ = l1 lim y(t)
t→−∞
e
ˆ = l2 . lim y(t)
t→+∞
e k sue soluzioni w1 (t), · · · , wk (t), dimostrare che esse sono linearmente indipendenti se e soltanto se sono linearmente indipendenti le soluzioni vettoriali wk (t) w1 (t) ′ ′ wk (t) w1 (t) , . . . , w (t) = w1 (t) = .. .. k . . (n−1) (n−1) wk (t) w1 (t)
17 Tracciare un grafico qualitativo delle soluzioni del problema di Cauchy ( y′ = (y2 − 1)3 y(0) = a
al variare di a ∈ [−1, 1]. 18 Valutare l’applicabilità dei Teoremi di esistenza e unicità locale e globale (VIII.9) e (VIII.10) al problema di Cauchy ( y′ = 5ty − ty2 y(0) = a,
quindi, senza risolvere esplicitamente l’equazione, ma studiando solamente il segno di y′ nel piano (t, y), disegnare un grafico qualitativo delle soluzioni al variare del parametro a ∈ R e dire per quali problemi si può garantire l’esistenza di una soluzione su tutto R. ✩ 19 Al variare di a ∈ R determinare l’intervallo massimale della soluzione del problema di Cauchy ( y′ = ey (y2 − 1) y(0) = a.
20 Stabilire per quali valori di y0 sono garantite esistenza ed unicità locali e globali per il problema di Cauchy ′ t ty2 y = (3y − e )(1 − e ) y(0) = y0 . Determinarne le eventuali soluzioni costanti e i punti del piano in cui le soluzioni hanno retta tangente orizzontale. Stabilire inoltre per quali y0 esistono soluzioni su tutto R.
dell’equazione vettoriale (16) associata (si veda a pagina 407). 23 Utilizzando l’Esercizio 22 , dimostrare che le funzioni sin ωt e cos ωt sono linearmente indipendenti. b 24 Mostrare che se A(t) e B(t) sono due funzioni matriciali, allora ① A(t) è continua se e solo se tutti i coefficienti ai j (t) sono funzioni continue di t. ② A(t) è differenziabile se e solo se tutti i coefficienti ai j (t) sono differenziabili. d [A(t) + B(t)] = A′ (t) + B′ (t); dt d [A(t)B(t)] = A′ (t)B(t) + A(t)B′ (t). ④ dt ③
o 25 Sia A una matrice 2 × 2. Dimostrare che esiste una matrice invertibile S tale che S−1 AS ha una delle seguenti forme: " # λ1 0 ① , con λ1 , λ2 ∈ R (A diagonalizzabile); 0 λ2 # " λ 1 , con λ ∈ R (A ha un unico autovalore e ② 0 λ non è diagonalizzabile); # " α −β , con α, β ∈ R (A ha due autovalori ③ : β α complessi coniugati distinti α ± iβ).
454
Sistemi di equazioni differenziali
# " a b è una matrice (co- b 30 Dopo aver calcolato la soluzione generale dei 26 Mostrare che se A = c d seguenti sistemi (utilizzando il risultato del Corollastante) 2 × 2 e y(t) è una soluzione dell’equazione rio (VIII.36)) selezionare la soluzione con il dato iniziale y′ = Ay, allora le componenti y1 (t), y2 (t) di y(t) risolindicato # " vono l’equazione del secondo ordine (detta equazione 5 −1 ′ y, y(0) = (2, −1); (a) y = secolare) 3 1 # " u′′ − (tr A)u′ + (det A)u = 0, −2 1 y, y(0) = (1, 3); (b) y′ = −5 4 dove tr A è la traccia di A, e det A il suo determinante. 1 1 2 (Suggerimento: si veda l’esercizio 40 a pag. 33.) 0 2 2 ′ (c) y = y, y(0) = (2, 0, 1); −1 1 3 27 Data la matrice ′ x = x + 6y 1 0 ··· 0 0 ′ y =x x(0) = 0, y(0) = 1, z(0) = 0; (d) 0 1 ··· 0 0 . ′ . . . . z = 3y + z .. .. .. .. A = .. ′ 0 x = −z 0 0 ··· 1 ′ −a0 −a1 −a2 · · · −an−1 x(0) = 7, y(0) = 5, z(0) = 5. (e) y = 2x z′ = −x + 2y + 4z, dimostrare, per induzione che il suo polinomio caratteristico, p(λ) = det (A − λIn ), è uguale a h i (−1)n λn + an−1 λn−1 + . . . + a1 λ + a0 .
o 31 In molti problemi fisici si è interessati alle soluzioni di un’equazione differenziale (per noi di secondo ordine lineare a coefficienti costanti) su un prefissato intervallo (a, b) soddisfacenti delle condizioni ai limiti dell’intervallo. Tali condizioni possono coinvolgere non solo i valori K 28 Si dimostri che, per il problema ai valori iniziali della soluzione in a e in b, ma anche quelli della sua derivata prima o, ancora più in generale, una loro commatriciale ( binazione lineare. Problemi di questo tipo prendono il Y′ = f (t)AY nome di Problemi ai limiti. Y(0) = I0 , Studiare l’insieme delle soluzioni dei seguenti problemi al variare del parametro λ nell’insieme con f funzione scalare continua, la successione delle indicato: iterate di Picard (si veda anche a pagina 415), ( ′′ y + λ2 y = cos t Z t λ > 0; (a) y(0) = 0, y(π) = 0, Y0 (t) = I0 , Yn (t) = I0 + f (t)AYn−1 (s) ds ( ′′ 0 y + 4y′ + (4 + λ2 )y = 0 λ ∈ R. (b) AF(t) ′ 2y(0) + y′ (0) = 0, y(1) = 0, converge proprio all’esponenziale e I0 , dove F = f . b 29 Utilizzare il Corollario (VIII.36) per determinare la soluzione generale del sistema omogeneo a coefficienti ′ costanti matrici: # Ay, quando A è unadelle seguenti " y = 1 1 1 −1 1 ; (a) (e) 2 1 −2; 4 1 √ # " 2 −1 0 1 3 (b) √ ; 3 −1 0 1 1 1 0 1 # " (f) ; 3 −2 ; (c) 1 1 0 2 −2 6 −3 3 1 0 0 1 4 3; (d) (g) 0 2 1. −1 1 2 0 1 2
32 Determinare una matrice wronskiana e la matrice risolvente del sistema ( ′ x = 2x + y y′ = x + 2y. Quindi determinarne la soluzione con dato iniziale x(0) = 1, y(0) = 2. 33 Determinare l’integrale generale del sistema omogeneo a coefficienti costanti y′ = Ay, quando A è una delle seguenti matrici con autovalori complessi (si veda il Corollario (VIII.54)) e classificare l’origine come punto di equilibrio:
Esercizi
455
# # " # " −1 1 −1 −2 1 −1 . ; (c) ; (b) (a) −4 −1 1 1 2 1 34 Dopo aver calcolato la matrice risolvente associata al sistema (b) dell’esercizio precedente determinarne la soluzione con dato iniziale y(0) = (3, 2). "
35 Considerare le seguenti matrici non diagonalizzabili e determinare l’integrale generale del sistema omogeneo a coefficienti costanti y′ = Ay e dedurre il ritratto di fase: # # " " 0 2 2 1 . ; (b) (a) 0 0 −1 0 36 Al variare di a ∈ R studiare la stabilità e la natura ′ dell’origine A "è la matrice: # # #per il sistema " y = Ay dove " 0 1 −3 a − 2 a 1 . ; (c) ; (b) (a) a 2 1 1 1 a 37 Usando il metodo descritto nel Teorema (VIII.59), a pagina 425, di variazione delle costanti arbitrarie, trovare soluzione particolare dei sistemi seguenti. una ( ′ x = 4x − 3y + sin t x′ = 2x − y + 2t (b) (a) ′ 2 y′ = 8x − 6y − cos t. y = 3x − 2y − t ; 38 Utilizzando il Teorema (VIII.59) di variazione delle costanti arbitrarie, trovare una soluzione particolare dell’equazione dell’oscillatore armonico forzato x′′ (t) + ω2 x(t) = a cos(φt). (Suggerimento: si utilizzi la formula (23) con f (t) = cos ωt e 1(t) = sin ωt.) o 39 Seguendo il procedimento visto nell’Esercizio (VIII.12), determinare la soluzione generale delle seguenti equazioni lineari a coefficienti costanti omogenee: (a) y(3) − y′ = 0; (c) y(4) − 2y′′ + y = 0; (b) y(4) − y′′ = 0;
41 Sia (x(t), y(t)) una soluzione del sistema di Lotka– Volterra (studiato nell’Esempio (VIII.77) a pagina 437) con periodo T. Mostrare che 1 T
Z
T
x(t) dt = 0
c , d
1 T
Z
T
y(t) dt = 0
a . b
42 Dedurre dall’esercizio precedente la terza legge di Volterra: un prelievo indiscriminato delle due popolazioni (come avviene nella pesca) determina un aumento percentuale del numero medio delle prede e una diminuzione percentuale del numero medio dei predatori. 43 Dopo aver verificato che l’origine è un punto di equilibrio per i seguenti sistemi non lineari, studiarne la stabilità utilizzando le coordinate polari (si veda l’Esempio (VIII.13) e in particolare il sistema (26)): ′ 2 2 x = y + x[cos(x + y ) − 1] (a) y′ = −x + y[cos(x2 + y2 ) − 1]; x2 + y2 − 1 −y x′ = −2x 4 + x2 + y2 (b) x2 + y2 − 1 y′ = −2y + x. 4 + x2 + y2 44 Per i seguenti sistemi conservativi ad un grado di libertà disegnare un grafico qualitativo della funzione energia potenziale (scegliendo quella che si annulla in 0) e dedurne la configurazione delle traiettorie nel piano (x, x′ ):
(d) y(4) = y.
(a) x′′ = 3x2 − 1, (b) x′′ = x − x3 . 40 Determinare le soluzioni delle seguenti equazioni lineari a coefficienti costanti utilizzando il metodo delle Per quali valori dell’energia totale esistono orbite funzioni simili (visto per le equazioni di second’ordine chiuse? nel Capitolo I a pagina 18) (a) y(3) − y′ = ex ; (c) y(4) +2y′′ +y = x2 +x+1. ✩ 45 Utilizzando le formule (26), dedurre la validità delle equazioni (P) nel riquadro a pagina 436. (b) y(4) + y = sin x;
❊❊❊
I could be bounded in a nutshell and count myself a king of infinite space. Hamlet, Act II, Scene 2 W ILLIAM S HAKESPEARE (1564–1616)
C APITOLO
IX Integrali multipli
In questo capitolo estendiamo le idee essenziali del calcolo integrale alle funzioni di più variabili. Esporremo a grandi linee la teoria dell’integrale secondo Riemann e ne vedremo le principali applicazioni al calcolo delle aree, dei volumi, delle masse, dei momenti e dei baricentri dei solidi e alla probabilità. Svilupperemo le principali tecniche di calcolo degli integrali doppi mediante riduzione ad integrazioni semplici successive e mediante l’utilizzo di opportuni cambiamenti di variabile. Tutte queste nozioni verranno infine estese alle
funzioni di tre variabili. La gran parte del Capitolo può essere svolta senza altro prerequisito che una buona conoscenza dell’integrale in una variabile. Fa eccezione il paragrafo sui cambiamenti di variabile nell’integrale doppio, § 6, che richiede di avere trattato preliminarmente la nozione di linearizzazione e di jacobiana (Capitolo VII, § 6). In caso di necessità esso può venire addirittura saltato, procedendo direttamente all’applicazione all’integrazione in coordinate polari in § 7.
L’
area (con segno) di una regione di piano compresa tra il grafico di una funzione di una variabile e l’asse x può essere definita e calcolata per mezzo dell’integrale di Riemann, come abbiamo visto nel primo volume. Allo stesso modo, in stretta connessione con la definizione ed il calcolo del volume (con segno) della regione dello spazio delimitata dal grafico di una funzione di due variabili, introdurremo gli integrali multipli. Abbiamo già esaminato il concetto di volume con segno di un parallelepipedo nel Capitolo III, § 5, dove è stato definito per mezzo della funzione determinante. In valore assoluto, il volume è dato semplicemente dal prodotto dell’altezza e dell’area della base. Pertanto, abbiamo già definito e siamo in grado di calcolare tale volume nel caso particolare in cui la funzione sia costante ed il suo dominio sia un rettangolo (o un parallelogramma). Se la funzione non è costante, la regione delimitata dal suo grafico ed il piano xy non è un parallelepipedo e dobbiamo ancora definire il suo volume. Cominciamo con il caso in cui il dominio della funzione sia comunque un rettangolo. Ragionando in
F IX.1: il cilindroide V = {(x, y, z) ∈ R3 : a ≤ x ≤ b, c ≤ y ≤ d, 0 ≤ z ≤ f (x, y)} è la regione sopra il rettangolo R e sotto il grafico di f .
458
Integrali multipli
F IX.2: partizione del rettangolo R in n · m rettangoli Ri j .
modo del tutto analogo a come abbiamo fatto a suo tempo per le funzioni di una variabile, attraverso un procedimento di approssimazione con funzioni costanti a tratti, definiamo l’integrale come il limite dei volumi approssimanti: le somme di Riemann.
Si
veda anche il breve richiamo della definizione di integrale di Riemann nel commento a pagina 236.
§ 1. Somme di Riemann ed integrale come limite Consideriamo una funzione f definita e limitata su un rettangolo chiuso e limitato R = [a, b] × [c, d] = {(x, y) : a ≤ x ≤ b, c ≤ y ≤ d}. Supponiamo (solo inizialmente) che la funzione sia positiva e chiamiamo V il solido compreso tra R e il grafico di f , disegnato nella Figura IX.1: V = {(x, y, z) ∈ R3 : a ≤ x ≤ b, c ≤ y ≤ d, 0 ≤ z ≤ f (x, y)}.
Come
nel caso delle funzioni di una variabile, la definizione può essere estesa a funzioni illimitate o ai domini illimitati, tramite la nozione di integrale improprio, come faremo più avanti, alle pagine 484 e 505.
Chiameremo cilindroide
un solido
siffatto.
Il primo passo consiste nel dividere R in sottorettangoli, dividendo l’intervallo [a, b] in n sottointervalli [xi−1 , xi ], con n + 1 punti a = x0 < x1 < x2 < · · · < xn = b. Analogamente dividiamo l’intervallo [c, d] (sull’asse delle y) in m sottointervalli [y j−1 , y j ], con m + 1 punti c = y0 < y1 < y2 < · · · < ym = d. Tracciando le n + 1 rette parallele all’asse y di equazione x = xi e le m + 1 rette parallele all’asse x di equazione y = y j , otteniamo una partizione di R in n · m sottorettangoli di R, come nella Figura IX.2, Ri j = [xi−1 , xi ] × [y j−1 , y j ] = {(x, y) : xi−1 ≤ x ≤ xi , y j−1 ≤ y ≤ y j }, ciascuno di area Ai j = (xi − xi−1 )(y j − y j−1 ).
Questo
corrisponde a scegliere una partizione di [a, b] ed una di [c, d].
§ 1. Somme di Riemann ed integrale come limite
459
F IX.3: se f ≥ 0 una sua somma di Riemann rappresenta il volume della regione formata da parallelepipedi affiancati (pluri-parallelepipedo).
(IX.1) Definizione. Chiamiamo ampiezza della partizione la lunghezza della più grande diagonale di un sottorettangolo della suddivisione: q (xi − xi−1 )2 + (y j − y j−1 )2 : i = 1, . . . , n, j = 1, . . . , m . δP = max Scegliamo ora un punto base (x∗i j , y∗i j ) in ognuno dei rettangoli Ri j , e consideriamo un parallelepipedo di base Ri j e altezza f (x∗i j , y∗i j ), come si vede nella Figura IX.3. Il volume di questo parallelepipedo è pari all’area del rettangolo di base per l’altezza, vale a dire f (x∗i j , y∗i j )Ai j . Ora compiamo questa operazione per ciascuno dei rettangoli Ri j della suddivisione e sommiamo i volumi dei parallelepipedi corrispondenti: otteniamo la quantità n X m X
f (x∗i j , y∗i j )Ai j ,
i=1 j=1
che possiamo interpretare come un’approssimazione del volume totale di V. (IX.2) Definizione. Chiamiamo somma di Riemann della funzione f , corrispondente alla suddivisione di R nei sottorettangoli Ri j e alla scelta di punti base (x∗i j , y∗i j ) ∈ Ri j , la somma n X m X i=1 j=1
f (x∗i j , y∗i j )Ai j .
Osserviamo che se δP tende a 0 allora lo fanno anche tutti i lati di tutti i rettangoli della partizione.
È ragionevole figurarsi che il volume di tale parallelepipedo approssimi la parte di V che si proietta su Ri j .
Riassumiamo il significato di que-
sta somma: per ogni sottorettangolo Ri j valutiamo f nel punto base scelto, la moltiplichiamo per l’area del sottorettangolo e poi sommiamo tutti i risultati. Osserviamo che la definizione data ha senso a prescindere dal segno di f , perciò è bene ricordare che una somma di Riemann rappresenta un volume solo nel caso di funzioni positive.
460
Integrali multipli
F IX.4: esempi di somme di Riemann per la funzione z = 16 − x2 − 2y2 .
Oltre alle somme di Riemann possiamo definire la somma inferiore e la somma superiore, relative alla partizione P: s(P) =
n X m X
m i j Ai j ,
mi j = inf f, Ri j
i=1 j=1 n X m X
S(P) =
Mi j Ai j ,
Mi j = sup f. Ri j
i=1 j=1
Esse rappresentano l’approssimazione per difetto e per eccesso del volume V: si ha infatti, per ogni scelta dei punti base, s(P) ≤
n X m X i=1 j=1
f (x∗i j , y∗i j )Ai j ≤ S(P).
Definiamo infine la convergenza delle somme di Riemann al tendere a zero dell’ampiezza della suddivisione, attraverso la medesima nozione di passaggio al limite introdotta a suo tempo per le somme integrali delle funzioni di una sola variabile (si veda la Figura IX.4). (IX.3) Definizione. Diciamo che le somme di Riemann della funzione f convergono al limite S quando l’ampiezza della suddivisione tende a zero se, fissato un qualunque ε > 0, possiamo trovare δ > 0 per cui, comunque si prenda una suddivisione di ampiezza δP < δ e comunque si scelgano i punti base (x∗i j , y∗i j ), la somma di Riemann corrispondente differisca da S per una quantità minore di ε: n X m X δP < δ =⇒ f (x∗i j , y∗i j )Ai j − S < ε. i=1 j=1
Quando tale limite esiste, il suo valore definisce l’integrale doppio della funzione f sul rettangolo R.
Infatti, per definizione, mi j ≤ f (x∗i j , y∗i j ) ≤ Mi j per ogni i e j.
Come
abbiamo già osservato nel primo volume per le funzioni in una sola variabile, il limite delle somme di Riemann può esistere o meno, a seconda delle caratteristiche della funzione che si integra.
§ 2. Il calcolo degli integrali doppi su rettangoli
461
(IX.4) Definizione. L’integrale doppio di f sul rettangolo R è "
R
f (x, y) dx dy = lim
δP →0
n X m X
f (x∗i j , y∗i j )Ai j
i=1 j=1
quando il limite delle somme di Riemann esiste. In tal caso diciamo che la funzione è integrabile sul rettangolo. L’esistenza dell’integrale, dunque, significa che, al tendere a zero della massima ampiezza dei rettangoli della suddivisione di R, i volumi (con segno) di tutti i possibili pluri-parallelepipedi tendono ad un limite comune. Chiamiamo volume (con segno) della regione solida V compresa tra il grafico di z = f (x, y) e il rettangolo R il valore del limite. Nel caso di funzioni positive l’integrale definisce il volume del solido V:
f ≥ 0 =⇒ Volume(V) =
"
Le variabili x e y che compaiono nell’integrale doppio non hanno alcun significato speciale e possono essere sostituite con altri simboli senza mutare il valore dell’integrale, che non è una funzione ma un numero, dipendente soltanto da f e dal rettangolo R in considerazione. Anche il simbolo dx dy non ha alcuna vera funzione, se non quella di ricordare che è stato effettuato il limite, al tendere a zero dell’ampiezza della partizione, delle aree dei rettangoli Ai j = ∆xi ∆y j nelle somme di Riemann; tale simbolo viene chiamato l’elemento d’area. Alcuni testi utilizzano il simbolo dA oppure dR per indicare l’elemento d’area.
f (x, y) dx dy.
R
Come vedremo nel § 5, oltre a quello di (aree e) volumi, l’integrale doppio si applica al calcolo di molte quantità di interesse nella meccanica ed in altre discipline; scopo del prossimo paragrafo è quello di sviluppare gli strumenti per il calcolo effettivo dell’integrale. Terminiamo questa breve introduzione alla definizione di integrale doppio menzionando una sua formulazione equivalente, che coinvolge gli estremi superiore ed inferiore delle somme inferiori e superiori, del tutto analoga a quella enunciata a suo tempo per l’integrale in una variabile. (IX.5) Teorema. Una funzione limitata è integrabile sul rettangolo se e soltanto se l’estremo superiore delle somme inferiori, fra tutte partizioni del rettangolo, è uguale all’estremo inferiore delle somme superiori fra le partizioni. Tali estremi sono a loro volta uguali all’integrale doppio.
§ 2. Il calcolo degli integrali doppi su rettangoli Per calcolare gli integrali doppi, così come capita per quelli semplici, non si applica praticamente mai la definizione di somma di Riemann, ma ci si riduce al calcolo di due integrali semplici. Per fare questa rifuzione occorre la nozione di integrazione parziale, operazione che corrisponde alla derivazione parziale. Data la funzione f : [a, b] × [c, d] → R, integrare parzialmente rispetto a x significa integrare rispetto ad y ∈ [c, d] la famiglia delle tracce di f ad x ∈ [a, b] fissato.
Questo Teorema fornisce una chiave di lettura leggermente diversa dell’integrabilità e porta a dimostrare due utili criteri, che il Lettore trova enunciati negli Esercizi 4 e 5 in fondo al capitolo. La dimostrazione del Teorema è del tutto simile a quella del Teorema analogo per gli integrali monodimensionali che abbiamo dimostrato nel primo volume ed è svolta nell’Esercizio 3 .
Si
veda nel Capitolo VII, dove, nell’Esercizio (VII.6) a pag. 373, viene dimostrata la continuità e la derivabilità degli integrali parziali.
462
Integrali multipli
F IX.5: significato geometrico dell’integrale iterato.
(IX.6) Esempio. Se f (x, y) = x2 y3 e [a, b]×[c, d] = [1, 3]×[0, 1] otteniamo, per ogni valore fissato di x ∈ [1, 3], # " Z 1 4 y=1 x2 2 3 2y = . x y dy = x 4 y=0 4 0 Analogamente, integrare parzialmente f rispetto a x significa integrare la traccia x 7→ x2 y3 tra due estremi x = 1 a x = 3.
Integrando parzialmente la funzione z = f (x, y) rispetto alla variabile y otteniamo una nuova funzione A della sola variabile x: Z d A(x) = f (x, y) dy, x ∈ [a, b] , c
che rappresenta l’area (con segno) della sezione trasversale del solido V contenuta nel piano verticale passante per x parallelo al piano yz (si veda la Figura IX.5). Possiamo allora pensare di integrare la nuova funzione A rispetto a x nell’intervallo [a, b]: ! Z b Z b Z d A(x) dx = f (x, y) dy dx. a
a
c
Questo integrale viene chiamato integrale iterato e il suo valore è un numero, che ha un preciso significato geometrico. Infatti, se prendiamo per buono il Principio di Cavalieri secondo il quale se due regioni solide hanno sezioni trasversali corrispondenti di uguale area, allora hanno lo stesso volume, possiamo interpretare l’integrale iterato come il volume del solido V: Z b Volume(V) = A(x) dx. a
D’altra parte, anche l’integrale doppio rappresenta il volume con segno del solido V compreso tra R e la superficie z = f (x, y), cioè " f (x, y) dx dy. Volume(V) = R
Se la funzione integranda f è continua sul rettangolo R, la funzione integrale A è ben definita e continua in base all’Esempio (VII.6) a pagina 373.
Per
la funzione dell’Esempio ab-
biamo Z 3 Z 1
1 0
! Z x2 y3 dy dx =
3 1
x2 13 dx = . 4 6
Come abbiamo fatto a suo tempo
quando abbiamo visto le applicazioni dell’integrale nel primo volume.
§ 2. Il calcolo degli integrali doppi su rettangoli
463
Pertanto l’integrale doppio e quello iterato coincidono. Ragionando analogamente, ma usando le sezioni trasversali di V con y fissato, si ottiene l’uguaglianza tra l’integrale doppio e il secondo integrale iterato, che è quindi uguale al primo: ! ! Z d Z b " Z b Z d f (x, y) dx dy = f (x, y) dx dy = f (x, y) dy dx. R
c
a
a
c
(IX.7) Esempio. Calcoliamo, per la stessa funzione dell’Esempio precedente, il secondo degli integrali iterati. La prima operazione è l’integrazione rispetto alla variabile x: " 3 #x=3 Z 3 26 3 x 3 2 3 = y y . x y dx = 3 3 1 x=1 Questa funzione va ora integrata rispetto a y. Abbiamo " # y=1 Z 1 26 3 26 y4 13 y dy = . = 3 3 4 y=0 6 0
Notiamo
che il simbolo dell’elemento d’area dx dy che compare nell’integrale doppio assume, nei due integrali iterati, un funzione importante: quella di indicare l’ordine con cui si devono eseguire le integrazioni parziali. Nelle formule di riduzione si scrive dy dx per indicare che si integra prima rispetto a y tra y = c e y = d; poi si integra la funzione ottenuta rispetto a x da x = a e x = b. Analogamente la scrittura Z dZ b f (x, y) dx dy c
a
impone di integrare prima rispetto a x (l’operazione più interna) e in un secondo momento rispetto a y.
Il ragionamento esposto manca di rigore in due punti. Innanzitutto non abbiamo mai dato una dimostrazione del Principio di Cavalieri, che d’altra parte non avremmo potuto enunciare se non in relazione all’unica nozione di volume che abbiamo finora definito per regioni generiche dello spazio, cioè proprio l’integrale doppio. Inoltre, al momento, non abbiamo alcuna prova dell’esistenza dell’integrale doppio per le funzioni continue sul rettangolo. A questi problemi risponde il Teorema di riduzione, un risultato fondamentale per il Calcolo integrale. (IX.8) Teorema (Formule di Riduzione). Se f è continua sul rettangolo R = [a, b] × [c, d] allora è integrabile e l’integrale doppio è uguale all’integrale iterato: "
Z
b
Z
d
f (x, y) dx dy =
R
!
Z
d
Z
f (x, y) dy dx = a
c
!
b
f (x, y) dx dy. c
a
Spesso le parentesi vengono omesse e si scrive semplicemente Z dZ b f (x, y) dx dy. c
a
(IX.9) Esempio. Il Teorema (IX.8) permette il calcolo effettivo di molti integrali doppi su rettangoli. È particolarmente utile nel calcolo degli integrali di funzioni della forma (fattorizzata) f (x, y) = 1(x)h(y): per esempio, per calcolare l’integrale " x sin y dx dy I= R
In alcuni testi il Teorema viene detto Teorema di Fubini, o di Fubini– Tonelli, dai nomi dei due matematici italiani Guido Fubini e Leonida Tonelli. Gli enunciati dimostrati da Fubini e Tonelli sono in realtà molto più generali del nostro Teorema, che risale a Cauchy. Ne vedremo nel seguito una modesta estensione, valida per domini semplici (e non solo rettangoli), nel Teorema (IX.16). La dimostrazione del Teorema (IX.8) si trova nel riquadro a pagina 464.
464
Integrali multipli
Dimostrazione del Teorema (IX.8) Fissiamo una qualunque suddivisione del rettangolo R in sottorettangoli Ri j . Innanzitutto dimostriamo che l’integrale iterato ! Z b Z d f (x, y) dy dx I= c
a
è in effetti una somma di Riemann della funzione f , relativa a una opportuna scelta dei punti base. A questo fine definiamo la funzione Z y F(x, y) = f (x, η) dη c
che è di classe C1 in base all’Esempio (VII.6) a pagina 373, e F y (x, y) = f (x, y). Perciò abbiamo Z b I= [F(x, d) − F(x, c)] dx Z
a
m bX
= a
j=1
m Z X
b
= a
j=1
[F(x, y j ) − F(x, y j−1 )] dx [F(x, y j ) − F(x, y j−1 )] dx
m X n Z X
i=1 j=1
xi−1
I=
i=1 j=1
n X m X F(ξi j , y j ) − F(ξi j , y j−1 ) i=1 j=1
n X m X ∗ ∗ ≤ f (xi j , yi j ) − f (ξi j , ηi j ) Ai j
[F(x, y j ) − F(x, y j−1 )] dx.
Poiché, per ogni j, la funzione [F(x, y j ) − F(x, y j−1 )] è continua sull’intervallo [xi−1 , xi ], per il Teorema della Media integrale in ognuno di questi intervallini possiamo trovare, R xi per ogni indice j, un numero ξi j tale che x [F(x, y j ) − F(x, y j−1 )] dx = i−1 [F(ξi j , y j )−F(ξi j, y j−1 )](xi −xi−1 ). Dunque, moltiplicando e dividendo per y j − y j−1 , (1)
i=1 j=1
Successivamente, utilizziamo in modo essenziale il Teorema di Heine–Cantor sull’uniforme continuità delle funzioni continue, a pagina 341. In corrispondenza di ogni ε > 0, possiamo trovare δ > 0 tale che | f (x, y) − f (ξ, η)| < ε/(b − a)(d − c) ogniqualvolta i punti (x, y) e (ξ, η) distano meno di δ. In particolare, se l’ampiezza della nostra suddivisione è inferiore a δ, per ogni scelta dei punti base (x∗i j , y∗i j ) nei rettangolini, la distanza dai punti (ξi j , ηi j ) è inferiore a δ e pertanto, detta σ la somma di Riemann corrispondente, abbiamo m n X X [ f (x∗i j , y∗i j ) − f (ξi j , ηi j )]Ai j |σ − I| =
xi
= j=1 i=1
Ora applichiamo il Teorema di Lagrange a ciascuna delle funzioni F(ξi j , y), nell’intervallo [y j−1 , y j ]: troviamo allora i punti ηi j ∈ [y j−1 , y j ] tali che i rapporti incrementali di tali funzioni siano uguali al valore della derivata rispetto a y in tali punti: f (ξi j , ηi j ). Di conseguenza, per tali punti base, I si scrive come somma di Riemann: n X m X I= f (ξi j , ηi j )Ai j .
y j − y j−1
Ai j .
<
n X m X i=1 j=1
ε Ai j = ε . (b − a)(d − c)
Abbiamo quindi dimostrato che comunque si fissi ε > 0, esiste δ > 0 sufficientemente piccolo per cui per ogni partizione di ampiezza inferiore a δ e ogni scelta di punti base le somme di Riemann differiscono da I meno di ε. Secondo la Definizione (IX.3) abbiamo quindi la tesi.
su R = [1, 2] × [0, π], dato che f (x, y) = x sin y è una funzione continua, il valore dell’integrale si ottiene calcolando uno dei due integrali iterati. Per esempio, scegliendo di integrare prima rispetto a y e poi rispetto a x si ha Z 2Z π Z 2 Z 2 y=π I= x sin y dy dx = x − cos y y=0 dx = 2x dx = 3.
In
Il Teorema (IX.8) garantisce che invertendo l’ordine di integrazione il
se 1 e h sono funzioni continue e R = [a, b] × [c, d].
1
0
1
1
generale, quindi, grazie al Teorema (IX.8) abbiamo Z b " Z d 1(x)h(y) dx dy = 1(x) dx h(y) dy, R
a
c
§ 3. Integrazione su domini generici
risultato non cambia: Z πZ 2 Z I= x sin y dx dy = 0
1
π 0
"
x2 2
465
#x=2
Z
π
sin y dy = x=1
0
3 sin y dy = 3. 2
(IX.10) Esempio. Calcoliamo il volume del solido V che giace sotto il grafico di z = y2 − x2 e sopra il quadrato R = [−1, 1] × [1, 3]. Come abbiamo osservato, si tratta di valutare l’integrale doppio " (y2 − x2 ) dx dy. Volume(V) = I =
Infatti
per ogni (x, y) ∈ R risulta f (x, y) = y2 −x2 ≥ 0 (il minimo valore di y2 in R è 1, e si toglie x2 che ha per massimo valore 1).
R
Per valutare I sfruttiamo il Teorema (IX.8): I è uguale all’integrale iterato ! Z (y2 − x2 ) dy dx =
"
#y=3 y3 dx − x2 y −1 1 −1 3 y=1 " #x=1 Z 1 26 2x3 26 2 = 16. − 2x dx = x− = 3 3 x=−1 −1 3 Z
I=
1
Z
3
1
§ 3. Integrazione su domini generici La definizione e la teoria che abbiamo sviluppato finora, e in particolare il Teorema di riduzione (IX.8), ci permettono di integrare le funzioni continue sui rettangoli. D’altra parte, nelle applicazioni, capita di frequente di voler integrare delle funzioni su domini che non siano rettangoli. Ci occupiamo ora di definire l’integrale di una funzione limitata su un dominio generico D che sia limitato. Per prima cosa possiamo estendere la nostra funzione f anche al di fuori di D, ponendo il suo valore uguale a zero: f (x, y) se (x, y) ∈ D (2) f (x, y) = 0 altrimenti. F IX.6
L’integrale di f su D è definito come l’integrale della sua estensione f . (IX.11) Definizione. L’integrale della funzione f sul dominio D è (se esiste) l’integrale di f su un qualunque rettangolo R che racchiude D e si indica " " f (x, y) dx dy = (3) f (x, y) dx dy . D
R
In tale caso si dice che f è integrabile su D.
F IX.7
466
Integrali multipli
Lasciamo al Lettore la verifica che la definizione non dipende dalla scelta del rettangolo R. Questa definizione aderisce alla nostra intuizione di integrale come volume col segno del cilindroide delimitato dal grafico della funzione, dal piano xy, e che si proietta sul dominio D, poiché l’estensione della funzione a zero al di fuori di D non produce alcun contributo di volume. La Definizione (IX.11) ci permette anche di definire l’area di una generica regione piana D: infatti l’area deve essere uguale al volume del cilindro di altezza unitaria che ha per base D: si tratta dunque, secondo questa interpretazione, dell’integrale della funzione costantemente uno sul dominio D.
L’area di D è chiamata anche misura della regione piana D, come vedremo tra poco.
(IX.12) Definizione. Diciamo che un sottoinsieme limitato del piano è misurabile (secondo Peano–Jordan) se la funzione f (x, y) ≡ 1 è integrabile su D. In tale caso poniamo " 1 dx dy . Area(D) = D
Ogni volta che diamo una nuova definizione di un concetto già introdotto in precedenza occorre confrontare le diverse definizioni. Lo facciamo con l’enunciato che segue, che mette in relazione la misura secondo Peano– Jordan con la nozione di area interna (ed esterna). (IX.13) Teorema. Un sottoinsieme limitato D del piano è misurabile secondo Peano–Jordan se e soltanto se l’estremo superiore delle aree dei poligoni contenuti in D eguaglia l’estremo inferiore delle aree di quelli contenenti D e i due valori sono uguali all’area. Enunciamo infine alcune proprietà dell’integrale doppio, utili nel calcolo degli integrali,e del tutto analoghe a quelle dell’integrale monodimensionale. Supponiamo che f e 1 siano integrabili su D e c ∈ R. (IX.14) Linearità. " " " 1 dx dy; f dx dy + [ f + 1] dx dy = ① ②
D
D
D
"
c f dx dy = c
D
"
f dx dy.
D
(IX.15) Monotonia. ① Se f ≤ 1 allora
"
D
f dx dy ≤
"
1 dx dy;
D
" " | f | dx dy. f dx dy ≤ ② | f | è integrabile su D e D
D
F IX.8
Abbiamo
introdotto la nozione di area interna nel primo volume. Si veda anche l’approfondimento a pagina 472.
Notiamo l’evidente analogia fra questo ed il Teorema (IX.5). Approfondiremo il concetto di misura secondo Peano–Jordan in relazione all’integrale nel riquadro a pagina 472. Invitiamo il Lettore a dimostrare queste proprietà come esercizio, partendo dalla Definizioni (IX.4) e (IX.11) e deducendone le proprietà dei limiti delle somme di Riemann corrispondenti agli enunciati.
§ 4. Integrazione su regioni semplici
467
F IX.9: esempi di regioni semplici, le prime due sono y–semplici, la terza x–semplice.
§ 4. Integrazione su regioni semplici La Definizione (IX.11) di integrale su una regione generica è dunque assai utile da diversi punti di vista, ma ha purtroppo un grosso difetto dal punto di vista del calcolo effettivo degli integrali e del riconoscimento dell’integrabilità di una funzione. È da notare infatti che l’estensione f di un funzione continua sul dominio D generalmente non è una funzione continua sul rettangolo R ma può presentare delle discontinuità sulla frontiera ∂D. Questo fatto rende purtroppo inutilizzabile il Teorema di riduzione (IX.8), lasciando insoluti i problemi di quali funzioni siano integrabili e, nel caso, di come calcolarne l’integrale. Per ovviare a questi inconvenienti ci viene in aiuto una nuova versione delle formule di riduzione, valida non più per i soli rettangoli ma per le regioni semplici. Di queste regioni sappiamo già calcolare l’area, grazie al calcolo integrale sviluppato nel primo volume. Ricordiamo che una regione D ⊂ R2 è detta y–semplice se è compresa tra i grafici di due funzioni della variabile x, cioè se è del tipo D = {(x, y) ∈ R2 : a ≤ x ≤ b, 11 (x) ≤ y ≤ 12 (x)}. Come è noto dalla teoria degli integrali monodimensionali, l’area di una regione semplice è data dalla formula Z b (4) Area(D) = 12 (x) − 11 (x) dx. a
Osserviamo che questo integrale può essere facilmente letto come integrale iterato: ! Z b Z b Z 12 (x) 12 (x) − 11 (x) dx = 1 dy dx; a
a
Qui 11 e 12 sono funzioni continue
definite sull’intervallo chiuso e limitato [a, b], con 11 (x) ≤ 12 (x) per ogni x. Analogamente si possono definire le regioni x–semplici come quelle del tipo D = {c ≤ y ≤ d, h1 (y) ≤ x ≤ h2 (y)},
con h1 ≤ h2 continue su [c, d]. La loro area è data da Z d Area(D) = h2 (y) − h1 (y) dy c
(si veda la Figura IX.9).
11 (x)
d’altra parte, dalla Definizione (IX.12) sappiamo che " 1 dx dy. Area(D) = D
Questo suggerisce che gli integrali doppi su regioni semplici possano essere ancora calcolati mediante integrali iterati, in modo del tutto simile a quanto visto nel caso dei rettangoli nel Teorema (IX.8).
Ma non dimostra.
468
Integrali multipli
(IX.16) Teorema (Formule di riduzione). Ognifunzione f continua su un insieme semplice D è integrabile su D. Inoltre valgono le formule di riduzione: ! Z b Z 12 (x) " f (x, y) dx dy = ➔ D y–semplice =⇒ f (x, y) dy dx; D
➔ D x–semplice =⇒
"
a
Z
11 (x)
d
Z
h2 (y)
f (x, y) dx dy =
D
c
! f (x, y) dx dy.
h1 (y)
Rimandiamo la dimostrazione di questo importante risultato nel riquadro a pagina 469. Comunque, gli integrali iterati esistono, dato che la R 12 (x) funzione x 7→ 1 (x) f (x, y) dy è continua (Esercizio (VII.6) a pagina 373).
Ricordando la Definizione (IX.11) possiamo scrivere ugualmente " Z bZ d f (x, y) dx dy = f (x, y) dy dx R
a
c
Il primo integrale, cioè quello rispetto alla variabile y, si può intendere indifferentemente esteso fra gli estremi c e d oppure fra 11 (x) e 12 (x), visto che la traccia f (x, y) si annulla quando y è al di fuori dell’intervallo [11 (x), 12 (x)]. Si tratta dunque dello medesima tesi del Teorema (IX.8), ma in questo Teorema la funzione f può essere discontinua sulla frontiera di D.
1
(IX.17) Osservazione. In base al Teorema (IX.16), tutte le regioni semplici sono misurabili secondo Peano–Jordan e le funzioni continue su di esse sempre integrabili. Inoltre, vale la formula "
Z
b
dx dy =
D
a
12 (x) − 11 (x) dx ,
che ci rassicura del fatto che le due nozioni di area di una regione piana che abbiamo dato finora (l’una tramite l’integrale di Riemann e l’altra secondo Peano–Jordan) coincidono per le regioni semplici. (IX.18) Esempio. Calcoliamo " (x + y2 ) dx dy I= D
dove la regione D è delimitata dalla parabola y = x2 e dalla retta y = 2x + 3. La regione è disegnata in Figura IX.10, ed è chiaramente y–semplice. Per poterne dare la rappresentazione analitica è necessario conoscere le ascisse dei punti di intersezione tra la retta e la parabola. Queste si trovano facilmente sostituendo y = 2x + 3 in y = x2 : si ottiene l’equazione x2 − 2x − 3 = 0, risolta da x = 3 e x = −1. La regione D si rappresenta quindi come D = {(x, y) ∈ R2 : −1 ≤ x ≤ 3, x2 ≤ y ≤ 2x + 3}. La funzione f (x, y) = x + y2 è continua, e il Teorema (IX.16) permette di
F IX.10
§ 4. Integrazione su regioni semplici
469
Dimostrazione del Teorema (IX.16) La dimostrazione ricalca in buona parte quella del Teorema (IX.8) nel riquadro a pagina 464, ma richiede di utilizzare il Criterio di integrabilità enunciato nell’Esercizio 4 . Dimostriamo la formula per le regioni y–semplici. Sia dunque D = {(x, y) : a ≤ x ≤ b, 11 (x) ≤ y ≤ 12 (x)} ⊂ R = [a, b] × [c, d]. Detto I l’integrale iterato, in base al Criterio, per dimostrare la tesi basta dimostrare l’esistenza, per ogni ε > 0 di una partizione Pε del rettangolo tale che −2ε < R ys(Pε ) − I ≤ S(Pε ) − I < 2ε. Consideriamo F(x, y) = c f (x, η) dη e osserviamo che F è sempre una funzione continua, mentre non è derivabile rispetto a y per y = 1i (x). Notiamo che, comunque, il suoi rapporti incrementali rispetto a y sono limitati dal minimo e massimo di f : R y2 f (x, η) dη F(x, y2 ) − F(x, y1 ) y m≤ = 1 ≤ M. y2 − y1 y2 − y1
Prendiamo ε e δ come nella dimostrazione del Teorema (IX.8), ed una prima suddivisione di ampiezza inferiore sia a δ che a δ1 = ε/(4(b − a)(M − m)). Ora utilizziamo il Teorema (VII.30) sull’uniforme continuità delle funzioni 11 e 12 . Possiamo trovare un µ > 0 tale che |x1 − x2 | < µ =⇒ |1i (x1 ) − 1i (x2 )| < δ1 , per i = 1, 2. Possiamo raffinare ulteriormente la partizione del solo intervallo [a, b], aggiungendovi dei punti, se necessario, in modo che (xi − xi−1 ) < µ. In questo modo, otteniamo la proprietà fondamentale che ogni striscia verticale avente come base l’intervallo [xi−1 , xi ] interseca
il grafico della funzione 11 in al più due rettangolini contigui verticalmente (e lo stesso vale per 12 ). Questo fa sì che il contributo di area dei rettangolini intersecanti la frontiera di D sia al più 4δ1 (b − a). Ora, seguendo il ragionamento esposto nel riquadro a pagina 464, arriviamo alla scrittura di I della formula (1). Questa volta, I è quasi una somma di Riemann: mancano all’appello, rispetto alla volta precedente, quei rettangolini che, intersecando il grafico dell funzioni 11 e 12 , fanno sì che la funzione F(ξi j , y) non sia più derivabile rispetto a y ed il Teorema di Lagrange non si possa applicare al rapporto incrementale corrispondente. Consideriamo la differenza # n X m " X F(ξi j , y j ) − F(ξi j , y j−1 ) s(P) − I = mi j − Ai j . y j − y j−1 i=1 j=1 Notiamo che il contributo alla somma è del tipo [ f (x∗i j , y∗i j ) − f (ξi j , ηi j )]Ai j se il rettangolino corrispondente non interseca il grafico delle 1i : in tal caso il rapporto incrementale è della forma F y (ξi j , ηi j ) = f (ξi j , ηi j )] e mi j = f (x∗i j , y∗i j ) per il Teorema di Weierstrass. Altrimenti è comunque maggiore di m − M. Complessivamente, dunque, s(P) − I ≥ −ε + (m − M)×
× Area(tutti i rettangolini intersecanti i grafici di 1i ).
Abbiamo stimato tale area precedentemente. Pertanto s(P) − I > −2ε Con un ragionamento del tutto analogo si prova che S(P) − I < 2ε.
⊚ ATTENZIONE! Come si trova-
ricondurre il calcolo del suo integrale su D a un integrale iterato: Z
3
Z
!
2x+3
Z
3
(x + y2 ) dy dx =
I= x2
−1
"
# 3 y=2x+3
xy + −1
y 3
dx y=x2
! (2x + 3)3 x6 3 = 2x + 3x + −x − dx 3 3 −1 #x=3 " 3776 1 x4 1 7 2 3 3 2 4 = − x . = x + x + (2x + 3) − 3 2 24 4 21 x=−1 21 Z
3
2
(IX.19) Esempio. Calcoliamo l’integrale iterato Z
1
Z
1
2
e y dy dx. 0
x
no gli estremi di integrazione? Il primo passo da fare è il disegno della regione di integrazione: la piu’ piccola striscia verticale che contiene la regione fornisce gli estremi dell’integrale esterno. I limiti di integrazione dell’integrale interno si possono leggere prendendo uno dei segmenti verticali di ascissa x come riferimento, come in Figura IX.10; l’ordinata del punto più basso del segmento è y = x2 = 11 (x), e questo è il primo estremo di integrazione. L’ordinata del punto più alto è y = 2x + 3 = 12 (x), secondo estremo di integrazione. Per domini x–semplici si procede analogamente, questa volta disegnando segmenti paralleli all’asse x, come nell’esempio seguente.
470
Integrali multipli
2
Dato che, come sappiamo, le primitive (rispetto ad y) della funzione e y non sono esprimibili mediante funzioni elementari, non possiamo procedere direttamente. La Formula di riduzione (IX.16) relativa a domini y–semplici però permette di ricondurre l’integrale iterato a un integrale doppio. A quel punto, se il dominio è anche x–semplice, si può trasformare l’integrale dato in un nuovo integrale iterato ma con la prima integrazione rispetto a x. Per ottenere l’integrale doppio dobbiamo prima ricostruire il dominio piano di integrazione: si tratta di un dominio y– semplice (perché la prima integrazione è rispetto a y), in cui gli estremi per y, a x fissato, sono y = x e y = 1. Gli estremi dell’integrazione rispetto a x indicano che la regione è contenuta nella striscia 0 ≤ x ≤ 1. In totale si ha Z 1Z 1 " 2 y2 e y dx dy e dy dx = D
x
0
dove D = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, x ≤ y ≤ 1}. Per invertire l’ordine di integrazione dobbiamo esprimere il dominio come x–semplice (Figura IX.12):
F IX.11
D = {(x, y) : 0 ≤ y ≤ 1, 0 ≤ x ≤ y}. Si ha allora Z " y2 e dx dy = D
Z
1
Z
y
Z
1
y2
e dx dy = 0
0
0 1
2
e y y dy =
= 0
2
x=y
e y [x]x=0 dy
1 h y2 i y=1 1 e = (e − 1). y=0 2 2
Infine, vale la pena di sottolineare che, anche per gli integrali doppi, vale la proprietà di additività rispetto al dominio. (IX.20) Teorema. Supponiamo che gli insiemi semplici D1 , D2 , . . . , Dk non abbiano, a due a due, punti in comune oltre ad una parte della frontiera. Allora ogni funzione continua sull’unione D = D1 ∪D2 ∪· · ·∪Dk è integrabile e " " " f (x, y) dx dy + · · · + f (x, y) dx dy. f (x, y) dx dy = D
D1
Dk
Ora che sappiamo calcolare gli integrali doppi di funzioni continue su regioni semplici possiamo usare il Teorema (IX.20) di additività rispetto al dominio per estendere le nostre capacità di calcolo a tutte le regioni che non sono necessariamente semplici, ma che possono essere suddivise in un numero finito di sottoregioni semplici (si veda la Figura IX.13). Tali domini verranno detti semplicemente decomponibili.
F IX.12
La
dimostrazione di questo semplice enunciato, tuttavia, è delicata e richiede alcune riflessioni più approfondite sulle aree e le loro proprietà. Il Lettore interessato ne troverà la traccia nel riquadro a pagina 472.
§ 4. Integrazione su regioni semplici
471
F IX.13: D non è semplice, ma è dato dall’unione di D1 , y–semplice, e D2 , x–semplice.
(IX.21) Esempio. Consideriamo la regione D in Figura IX.14. D può essere vista come unione di tre regioni semplici rispetto a y: D1 = {(x, y) : −1 ≤ x ≤ 0, −1 ≤ y ≤ 1 + x2 }, √ D2 = {(x, y) : 0 ≤ x ≤ 1, −1 ≤ y ≤ − x}, √ D3 = {(x, y) : 0 ≤ x ≤ 1, x ≤ y ≤ 1 + x2 }. Grazie al Teorema (IX.20) di additività rispetto al dominio possiamo calcolare, ad esempio, l’area di D. Sappiamo infatti che " " " " dx dy. dx dy + dx dy + dx dy = Area(D) = D2
D1
D
D3
Per il calcolo di ciascuno dei tre integrali utilizziamo ancora le Formule di riduzione: Z 0 Z 0 Z 1+x2 " y=1+x2 dx = y y=−1 dx dy dx dy = D1
−1
−1
−1
" #x=0 x3 7 2 2 + x = 2x + = = . 3 3 −1 x=−1 Z 1 Z 1 Z − √x " √ 2 √ 3 x=1 1 dy dx = 1 − x dx = x − dx dy = = . x 3 3 x=0 −1 0 D2 0 Z 1 Z 1 Z 1+x2 " √ 2 dx = x dx 1 + x − dy dx dy = √ D3
Z
0
0
x
0
" #x=1 x3 2 √ 3 2 = x+ x − = . 3 3 3 x=0
Complessivamente, quindi, l’area della regione è 10/3.
F IX.14
472
Integrali multipli
La misura di Peano–Jordan e integrale di Riemann Chiamiamo area interna e area esterna di un sottoinsieme limitato del piano, D, rispettivamente l’estremo superiore delle aree dei poligoni contenuti in D e l’estremo inferiore delle aree dei poligoni contenti D, ovvero Area(D) = sup{Area(P) : P ⊂ D è un poligono} Area(D) = inf{Area(P) : P ⊃ D è un poligono}.
Se D non contiene alcun poligono (ad esempio, se si riduce ad un segmento), assumeremo per convenzione che Area(D) = 0. È abbastanza facile, utilizzando il Teorema (IX.5), dedurre dalla Definizione (IX.12) che un insieme D è misurabile secondo Peano–Jordan se e soltanto l’area interna ed esterna coincidono. In tale caso la sua area, o misura, è data dal valore comune Area(D) = Area(D) = Area(D), si veda a tale proposito l’Esercizio 9 . Con questa definizione, tutte le figure della geometria elementare ed i rettangoloidi della teoria dell’integrale monodimensionale sono misurabili e la loro area coincide con quella che già conosciamo. Un utile criterio di misurabilità si può esprimere con l’annullarsi dell’area della frontiera ∂D. Poiché gli insiemi di area nulla sono trascurabili anche nel calcolo degli integrali, è particolarmente importante saperli riconoscere: a tale fine possiamo avvalerci della seguente caratterizzazione (Esercizio 10 ):
Proposizione. Un insieme D ha misura di Peano– Jordan nulla se e soltanto se per ogni ε > 0 esiste un numero finito di rettangoli R1 ,. . . , RN la cui unione Ωε contiene D e la cui area totale sia inferiore a ε. Questo criterio permette di dimostrare facilmente, per esempio, che hanno area nulla tutti i grafici delle funzioni integrabili e le curve regolari (Esercizio 12 ). Abbiamo un importante criterio di integrabilità (si veda Esercizio 13 ): Teorema. Una funzione limitata su un rettangolo che sia continua al di fuori di insieme di misura di Peano–Jordan nulla è integrabile. Valgono inoltre le formule di riduzione del Teorema (IX.16), sotto l’unica ipotesi di esistenza dell’integrale iterato. Infine, anche il Teorema (IX.20) di additività rispetto ai domini si estende facilmente al caso di una unione finita di insiemi misurabili (ci si cimenti con l’Esercizio 14 ): Teorema. Se D1 e D2 sono insiemi misurabili la cui intersezione ha misura nulla, allora una funzione è integrabile su D1 ∪ D2 se e soltanto se è integrabile singolarmente su D1 e D2 . Inoltre l’integrale sull’unione dei domini è la somma dei due integrali: " f (x, y) dx dy =
"
D1 ∪D2
f (x, y) dx dy + D1
"
f (x, y) dx dy . D2
Il Lettore interessato ad approfondire la misura di Peano–Jordan può riferirsi al [Pagani e Salsa(1991)].
§ 5. Applicazioni dell’integrale doppio Il procedimento di passaggio al limite utilizzato nel § 1 per definire l’integrale suggerisce una metodologia generale per calcolare quantità di interesse in molte applicazioni, dalla geometria, alla probabilità e alla fisica, attraverso il passaggio al limite da un problema discreto (cioè con un numero finito di parti) ad un problema continuo. Abbiamo visto che gli integrali doppi permettono di calcolare aree e volumi; in questo paragrafo consideriamo alcune applicazioni fisiche, come il calcolo di masse, cariche elettriche, baricentri e momenti di inerzia. Vedremo che il concetto fondamentale, quello di densità, si applica anche in altre circostanze, ed in particolare alla densità di probabilità di due variabili aleatorie.
§ 5. Applicazioni dell’integrale doppio
473
Densità Consideriamo una lamina che occupa una regione D del piano. Dire che la densità (superficiale) della lamina è costantemente uguale a ρ0 , significa dire che rapporto fra la massa contenuta in un rettangolo R ⊂ D e l’area di R è costante: massa(R) = ρ0 . Area(R) Se invece tale rapporto non è costante, possiamo considerare il rapporto massa(R) come una densità media e definire la densità nel punto (x, y) Area(R) come il limite (se esiste) (5)
ρ(x, y) = lim δ→0
massa(Rδ (x, y)) , Area(Rδ (x, y))
al tendere a zero della diagonale δ del rettangolo Rδ (x, y) contenente il punto (x, y), come nella Figura IX.15. Ora, rovesciando il punto di vista, supponiamo di conoscere la funzione densità puntuale e di volerne dedurre la massa totale della lamina, o di una sua porzione: possiamo utilizzare il procedimento di approssimazione tramite le somme di Riemann. Suddividiamo infatti un rettangolo contenente D in sottorettangoli Ri j e poniamo ρ uguale a zero fuori da D, come in Figura IX.16. Se il rettangolino Ri j è molto piccolo, e se la densità è una funzione continua, possiamo pensare che ρ sia approssimativamente costante in Ri j e valga dunque ρ(x∗i j , y∗i j ) per una scelta arbitraria del punto base nel rettangolino. La massa contenuta nel rettangolino sarà quindi circa massa(Ri j ) ≈ ρ(x∗i j , y∗i j ) Area(Ri j ), e la massa totale sarà approssimativamente una somma di Riemann n X m n X m X X massa(D) = massa(Ri j ) ≈ ρ(x∗i j , y∗i j ) Area(Ri j ). i=1 j=1
i=1 j=1
Se la funzione ρ è integrabile su D, le somme di Riemann convergono, al tendere a zero dell’ampiezza della partizione, verso l’integrale doppio di f su D, che è quindi la massa della lamina: " ρ(x, y) dx dy. massa(D) = D
Il ragionamento esposto qui sopra si può ripetere, oltre al caso della massa, anche ad altre grandezze fisiche. Per esempio, se una carica elettrica è distribuita su una regione piana D, si parlerà della funzione densità di carica (prima media e poi, passando al limite, puntuale) σ(x, y) (in unità di carica per unità di superficie). Nota σ, si può calcolare la carica totale attraverso l’integrale: " σ(x, y) dx dy. Q= D
F IX.15
F IX.16
In questa
discussione stiamo trascurando quei rettangolini che intersecano il bordo di D. Tale omissione è giustificata, se la funzione ρ è continua e D è misurabile secondo Peano–Jordan (si veda la discussione nel riquadro di approfondimento a pagina 472).
La giustificazione rigorosa di que-
sto fatto, tuttavia, non è per nulla banale. Si veda il riquadro di approfondimento a pagina 474.
474
Integrali multipli
Misura, integrale e densità La discussione sulla relazione fra massa e densità superficiale di una lamina ci induce a ragionare un po’ più a fondo su cosa intendiamo per misurare la massa delle porzioni della lamina. Dobbiamo supporre di poter di misurare la massa di tutta una classe di sottoinsiemi F della lamina. Ragionevolmente, F dovrà contenere tutti i sottoinsiemi dotati di area, cioè misurabili nel senso di Peano–Jordan; in particolare questa classe contiene tutti i rettangoli. Poter misurare i sottoinsiemi della classe F vuole dire avere definita una funzione µ : F → [0, +∞) che associa ad ogni sottoinsieme E ∈ F un numero positivo (la massa di E) e che tale funzione verifichi le proprietà seguenti: i) l’insieme vuoto ha misura nulla: µ(∅) = 0; ii) additività: se E1 e E2 sono insiemi disgiunti in F, allora µ(E1 ∪ E2 ) = µ(E1 ) + µ(E2 ). A tali proprietà di base ne aggiungiamo una: iii) limitatezza rispetto all’area: esiste una costante K tale che, per ogni E ∈ F si abbia µ(E) ≤ K Area(E). Vorremmo, in tale situazione, poter asserire l’esistenza di una funzione positiva, limitata e integrabile (la densità ρ), definita su tutta la lamina, tale che, per ogni sottoinsieme E in F, si abbia: " (∗) µ(E) = ρ(x, y) dx dy . E
Purtroppo tale enunciato non è vero, in questa accezione. Per arrivare ad un tale risultato, occorre introdurre la nozione di misura σ-additiva definita sopra una σ-algebra(21) F. Una funzione µ : F → [0, +∞) prende il nome di misura σ-additiva se gode delle due proprietà: i) L’insieme vuoto ha misura nulla: µ(∅) = 0; ii) additività numerabile o σ-additività: se E1 , E2 , E3 , . . . è una successione di insiemi +∞ +∞mutuamente [ X disgiunti in F, allora µ Ei = µ(Ei ). i=1
i=1
Vi è un teorema molto notevole, noto come Teorema di Radon–Nikodym, che assicura (come caso particolare) che, per una misura σ-additiva e limitata (ipotesi iii)), esiste sempre una funzione densità ρ. In altre parole (∗) è verificata, ma la nozione di integrale non è più da intendersi nel senso di Riemann, ma in quello di Lebesgue (per una introduzione all’integrale e alla misura di Lebesgue si veda per esempio [Rudin(1976), Pagani e Salsa(1991)], [Rudin(1987), Kolmogorov e Fom¯ın(1975), Royden(1988)]). Inoltre, si può dimostrare che l’equazione (5) rimane valida per quasi tutti i punti (x, y): ovvero che l’eventuale insieme in cui è violata è trascurabile (cioè ha misura di Lebesgue nulla).
(IX.22) Esempio. Calcoliamo la carica totale per una distribuzione di carica nella regione delimitata fra l’asse x e la funzione y = sin x, x ∈ [0, π] in cui la densità sia proporzionale alla distanza dall’asse x. Abbiamo σ(x, y) = σ0 y, dove σ0 è la costante di proporzionalità, e " Z π Z sin x Z σ0 π σ0 π σ(x, y) dx dy = σ0 Q= y dy dx = . sin2 x dx = 2 0 4 D 0 0
Baricentro e momenti di inerzia Per un sistema di n punti nel piano, di masse mi e posizioni Pi = (xi , yi ), le coordinate del baricentro sono, com’è noto, n n 1 X 1 X mi xi , mi yi . y= M M i=1 i=1 P doveM = ni=1 mi è la massa totale del sistema. Consideriamo una lamina piana, avente densità superficiale di massa variabile (e continua) ρ(x, y),
x=
Sul
baricentro di un sistema di punti nel piano si veda anche l’Esercizio (VI.9) a pagina 316.
§ 5. Applicazioni dell’integrale doppio
475
che occupa una regione D: vorremmo determinarne il baricentro. A tale fine, ragioniamo nuovamente approssimando la lamina con un sistema finito di punti materiali (il cui numero tenderà poi all’infinito); consideriamo infatti, come nella Figura IX.16, una partizione di D in rettangolini Ri j . Il sistema di punti approssimante è dato dai punti P∗i j = (x∗i j , y∗i j ) aventi masse m∗i j = ρ(x∗i j , y∗i j ) Area(Ri j ), dove i punti P∗i j sono punti base arbitrariamente scelti nei rettangolini Ri j . La coordinata x del baricentro di tale sistema di punti è XX XX 1 1 mi j x∗i j = ρ(x∗i j , y∗i j ) Area(Ri j )x∗i j . massa(D) massa(D) n
x¯ =
m
i=1 j=1
n
m
i=1 j=1
Di nuovo, riconosciamo nel secondo membro una somma di Riemann della funzione f (x, y) = xρ(x, y). Se essa è integrabile, possiamo passare al limite al tendere a zero dell’ampiezza della suddivisione, ottenendo " 1 x¯ = ρ(x, y)x dx dy. massa(D) D Analoghe considerazioni valgono ovviamente per la coordinata y. Ricordando l’espressione della massa di D, abbiamo infine che le coordinate del baricentro (x, y) sono ! ! xρ(x, y) dx dy yρ(x, y) dx dy D (6) x¯ = ! y¯ = !D . ρ(x, y) dx dy ρ(x, y) dx dy D D In particolare, se la densità ρ è costante, allora si elide dalla frazione; si ottengono così le coordinate del baricentro geometrico, o centroide, di D: ! ! x dx dy y dx dy D x¯ = ! y¯ = !D . dx dy dx dy D D
Con un ragionamento del tutto analogo si perviene alla definizione dei momenti di inerzia di una distribuzione piana di massa. Ricordiamo che il momento di inerzia di una particella di massa m rispetto a un asse è definito come mr2 dove r è la distanza della particella dall’asse; ad esempio il momento di inerzia rispetto all’asse y è mx2 . Fisicamente esso misura la resistenza del punto a mettersi in rotazione attorno all’asse in considerazione. Se consideriamo una lamina piana di densità ρ(x, y) che occupa la regione D, i momenti di inerzia rispetto agli assi x e y della lamina sono: " " 2 ρ(x, y)x2 dx dy. ρ(x, y)y dx dy Iy = Ix = D
D
Infine, in modo del tutto analogo si definisce il momento di inerzia polare, relativo all’asse ortogonale al piano e passante per l’origine: " ρ(x, y)(x2 + y2 ) dx dy. I0 = D
Nel
caso in cui ρ è costante e la lamina è una regione semplice, abbiamo già imparato come calcolare il baricentro nel primo volume, Capitolo XI.
476
Integrali multipli
(IX.23) Esempio. Determiniamo il baricentro di una lamina omogenea di densità ρ(x, y) = 2 + x che occupa la regione compresa tra l’asse delle x e y = 1 − x2 . La regione occupata dalla lamina è illustrata in Figura IX.17. La massa della lamina è Z 1 Z 1−x2 " (2 + x) dx dy = (2 + x) dy dx massa(D) = D 1
Z
= −1
Z
2y + xy
1
y=1−x2 y=0
−1
0
Z
1
dx = −1
(2 − 2x2 + x − x3 ) dx
" #1 x3 8 (2 − 2x ) dx = 4 x − = ; 3 0 3
F IX.17
2
=2 0
Ricordiamo
d’altra parte "
xρ dx dy =
D
Z
" Z
−1
Z
2xy + x2 y
1
0
Z
1
i y=1−x2 y=0
(2 + x)x dy dx −1
0
Z
1
dx = −1
x3 x5 (x − x ) dx = 2 − 3 5 Z
(2x − 2x3 + x2 − x4 ) dx
#1
4
Z
1−x2
yρ dx dy =
D
1−x2
"
2
=2 "
Z
(2 + x)x dx dy =
D 1h
=
1
= 0 1 −1
0
4 , 15
xy2 y + 2
#y=1−x2
2
(2 + x)y dy dx = −1
"
le proprietà di simmetria degli integrali monodimensionali: se f (−x) = − f (x) allora Ra f (x) dx = 0; se f (−x) = f (x) −a Ra Ra allora −a f (x) dx = 2 0 f (x) dx. Le useremo ripetutamente in questo capitolo.
dx y=0
! x5 x − x3 + dx 2 2 −1 " #1 Z 1 2x3 x5 16 2 4 =2 (1 − 2x + x ) dx = 2 x − = + . 3 5 0 15 0 Z
1
1 − 2x2 + x4 +
=
Il baricentro della lamina ha dunque coordinate x¯ =
4 3 1 = , 15 8 10
y¯ =
16 3 2 = . 15 8 5
Probabilità congiunta Ad una variabile casuale X corrisponde una legge di probabilità, che associa ad ogni sottoinsieme dei possibili valori di X la probabilità che la variabile assuma valori in esso. Nei casi più semplici di variabile aleatoria continua, alla legge di probabilità viene associata una funzione, la densità di probabilità, con la proprietà che la probabilità che X assuma valori nell’intervallo [a, b] è data dall’integrale di f fra a e b: Z P(a ≤ X ≤ b) =
b
f (x) dx. a
Si
veda il primo volume, Capitolo XII.
§ 6. Cambiamento di variabile negli integrali doppi
477
Per esempio, al tempo di attesa in una coda, prima che la nostra richiesta (per esempio di una risposta di un operatore telefonico) venga soddisfatta, viene associata una densità di probabilità del tipo (dove 1/c rappresenta il tempo medio d’attesa) x<0 0 f (x) = ce−cx x ≥ 0 . Consideriamo ora una coppia di variabili aleatorie X e Y. La funzione densità congiunta di X e Y è una funzione f (x, y) per cui la probabilità che la coppia (X, Y) appartenga al dominio D sia l’integrale doppio Z f (x, y) dx dy. P((X, Y) ∈ D) =
Cioè il valore atteso Z
+∞
x f (x) dx . −∞
Questo vuol dire che la probabilità
che la risposta arrivi nel tempo T > 0 è Z T ce−cx dx = 1 − e−cT . 0
D
Le variabili aleatorie X e Y vengono dette indipendenti se la loro densità congiunta è il prodotto delle densità di probabilità individuali. (IX.24) Esempio. Stiamo partecipando a una festa della birra, in cui notiamo che il tempo medio di attesa per le salamelle è di 10 minuti, mentre quello di un boccale di birra è di 5 minuti. Assumendo che i tempi di attesa siano indipendenti, possiamo calcolare la probabilità di essere serviti tanto di salsicce che di birra in meno di 20 minuti, come segue. La funzione densità congiunta dei due tempi di attesa è −x/10 −y/5 e e x≥0ey≥0 f (x, y) = f1 (x) f2 (y) = 10 5 0 altrimenti. Dobbiamo pertanto semplicemente integrare la funzione triangolo delimitato dagli assi e dalla retta x + y = 20: P=
1 50
1 = 10 1 = 10
Z
20
Z
20−x
e−x/10 e−y/5 dy dx = Z Z
0
0 20
0
1 50
Z
20
h
e−x/10 e−y/5 sul 50
e−x/10 (−5)e−y/5
0
i y=20−x y=0
dx
e−x/10 1 − e(x−20)/5 dx
20 0
(e−x/10 − e−4+x/10 ) dx = 1 + e−4 − 2e−2 ≈ 0.7476 .
§ 6. Cambiamento di variabile negli integrali doppi Abbiamo già avuto modo di constatare l’utilità dei cambiamenti di variabile nel calcolo degli integrali della funzioni di una variabile: ci riferiamo alla Regola di sostituzione incontrata nel primo volume, che permette di
F IX.18: Guido Fubini (18791943), è stato uno dei maggiori matematici italiani, e non solo italiani, della prima metà del XX secolo e ha lasciato un’orma profonda sia nell’Analisi, sia nella Geometria. Perso il posto di professore di Analisi Matematica al Politecnico di Torino in seguito alle leggi razziali del 1938, nel 1939 emigrò negli Stati Uniti. Dissero di lui: Facile agli entusiasmi, amante della libertà e di carattere aperto e rettilineo, parlava sempre francamente, senza perifrasi e senza preoccupazioni di carattere politico o personale. (B. Segre)
478
Integrali multipli
F IX.19: trasformazione biunivoca T tra il piano uv e il piano xy.
cambiare la variabile di integrazione.In questo paragrafo ci occupiamo di analizzare la corrispondente regola di sostituzione per gli integrali doppi, la cui applicazione risulterà particolarmente utile. Infatti, come vedremo in diversi esempi, l’uso di un sistema di coordinate adatto permette di sfruttare le eventuali simmetrie non soltanto della funzione ma anche del dominio di integrazione. Per esempio, utilizzeremo sistematicamente le coordinate polari per calcolare gli integrali su domini che hanno simmetria rotazionale come i dischi o i settori circolari. In generale, un cambiamento di variabili è una funzione T : R2 → R2 , T : (u, v) 7→ (x(u, v), y(u, v)), che lega le coordinate (x, y) alle (u, v): avremo dunque, in notazione vettoriale, " # " #! " # x u x(u, v) =T = . y v y(u, v) Supponiamo che la funzione T sia biunivoca e chiamiamo T −1 la sua inversa: allora ad ogni coppia (x, y) di una regione T corrisponde una e una sola coppia (u, v) = T −1 (x, y) della regione S = T −1 (T), come illustrato nella Figura IX.19. Per capire come opera la funzione T è importante stabilire in che modo viene deformato l’insieme S nell’insieme T, per diverse scelte di regioni piane. Inoltre, poiché siamo interessati alle relazioni fra integrali, è naturale cercare di mettere in relazione l’area delle due regioni. (IX.25) Esempio. Consideriamo una funzione T, lineare dal piano uv al piano xy: " #! " # " # " # u au + bv u a b T = =A , A= . v cu + dv v c d Per via della linearità, T trasforma parallelogrammi del piano uv in altri parallelogrammi del piano xy. Infatti, il parallelogramma di lati a e b è
Ricordiamo che operando il cam-
biamento di variabile x = 1(t), l’integrale di f (x) su [a, b] si trasforma secondo la relazione Z 1−1 (b) Z b f (1(t))1′ (t) dt. f (x) dx = a
1−1 (a)
Ad esempio la sostituzione x = t2 permette di calcolare facilmente l’inZ 1 2 tet dt, riconducendolo tegrale 0 Z 1 1 x all’integrale immediato e dx. 2 0
Qui, con un piccolo abuso, abbia-
mo chiamato con lo stesso nome le variabili (x, y) e le componenti scalari delle funzione T: x = x(u, v),
Nel
senso della (IV.24) a pagina 174.
y = y(u, v).
Definizione
§ 6. Cambiamento di variabile negli integrali doppi
l’insieme parametrizzato da r(u, v) = ua + vb, con (u, v) ∈ [0, 1] × [0, 1]. La sua immagine è dunque T(r(u, v)) = uT(a) + vT(b), che è il parallelogramma generato dai vettori T(a) = Aa e T(b) = Ab. Vi è un rapporto costante tra l’area di un parallelogramma S e quella della sua immagine T(S), il cui fattore di proporzionalità è il modulo del determinante della matrice associata A: Area(T(S)) = | det(A)| Area(S) . Cosa succede se S non è un parallelogramma? Dato che una funzione lineare manda parallelogrammi in parallelogrammi, allora manda poligoni in poligoni, mantenendo il medesimo fattore di proporzionalità fra l’area del poligono e quello della sua immagine. In particolare, manda poligoni inclusi in S in poligoni inclusi in T(S) e ugualmente per quelli contenenti S, che hanno immagine contenente T(S). Perciò possiamo concludere in base alla Definizione (IX.12) di misura secondo Peano–Jordan che la relazione di proporzionalità fra l’area di un insieme e quella della sua immagine vale per tutti gli insiemi dotati di area. (IX.26) SeT è una funzione lineare, allora, per ogni insieme S, misurabile secondo Peano–Jordan, si ha Area(T(S)) = | det(JT )| Area(S) , dove JT = A è la matrice associata, nonché la matrice jacobiana di T. (IX.27) Esempio. Consideriamo ora la trasformazione del piano (r, ϑ) nel piano (x, y) associata alle coordinate polari x = r cos ϑ, y = r sin ϑ: " #! " # r r cos ϑ T = . ϑ r sin ϑ
479
Infatti, se a e b sono i due vettori
che generano il parallelogramma S, e si pone B = (a, b) (cioè B è la matrice con a e b per colonne), risulta che la matrice che ha per colonne i due vettori che generano il parallelogramma T(S) (cioè Aa e Ab) è il prodotto (Aa, Ab) = AB, e dunque per la Formula di Binet (IV.60) a pag. 191 si ha Area(S) = |det(B)|, Area(T(S) = |det(AB)|
=⇒ Area(T(S)) = |det(A)||det(B)|
= |det(A)| Area(S).
Ricordiamo
che, come dalla Definizione (VII.41), la matrice jacobiana della funzione T(u, v) = (x(u, v), y(y, v)) è la matrice ∂x ∂x ∂u ∂v JT (u, v) = ∂y ∂y . ∂u ∂v
Un rettangolo S del piano rϑ S = {(r, ϑ) : a ≤ r ≤ b, α ≤ ϑ ≤ β} corrisponde al settore circolare T = T(S) di angolo β − α compresa fra le circonferenze di raggio a e b, disegnato in Figura IX.20. Osserviamo che, a parità del valore dell’area di S, l’area dell’immagine T(S) diventa sempre più grande man mano che a cresce, cioè quando la figura si allontana dall’origine. Abbiamo infatti: Area(T(S))) =
1 2 (b − a2 )(β − α) 2
e
Area(T(S)) 1 = (a + b), Area(S) 2 cioè il fattore di trasformazione delle aree tramite la funzione T non è più costante, ma dipeende dalla posizione e dalla forma di S. Qual è il
F IX.20
480
Integrali multipli
limite del fattore di trasformazione delle aree al tendere a zero dei lati del rettangolo S? Supposto S = {(r, ϑ) : r0 ≤ r ≤ r0 + ∆ϑ, ϑ0 ≤ ϑ ≤ ϑ0 + ∆ϑ} abbiamo Area(T(S)) 1 = (2r + ∆r) = r. (∆r,∆ϑ)→(0,0) Area(S) 2 lim
Tale limite è in relazione con la matrice jacobiana della trasformazione T, infatti " #! cos ϑ −r sin ϑ r = det(JT )(r, ϑ) = det = r cos2 ϑ + r sin2 ϑ. sin ϑ r cos ϑ Questa’ultima relazione è tutt’altro che casuale e corrisponde ad un preciso significato geometrico del determinante della matrice jacobiana di una trasformazione T. Possiamo ragionare in questo modo: prendiamo un rettangolino nel piano uv del tipo S = [u0 , u0 + ∆u] × [v0 , v0 + ∆v] e consideriamo la sua immagine T(S); questa non sarà, in generale, un rettangolo, né un parallelogramma. Tuttavia, utilizzando la definizione di differenziabilità (VII.41) a pagina 350, possiamo approssimare T con la sua linearizzazione: " " # #! " #! u0 + ∆u ∆u u0 T + JT (u0 , v0 ) ≈T v0 + ∆v ∆v v0
F IX.21
dove abbiamo trascurato i termini di ordine superiore al primo nell’incremento (∆u, ∆v). In questa approssimazione, l’immagine di S della linearizzazione è un parallelogramma la cui area, come abbiamo visto nella proposizione (IX.26), è uguale all’area di S per il modulo del determinante della matrice jacobiana. Pertanto possiamo concludere che (7)
Area(T(S)) = | det(JT )(u0 , v0 )| . (∆u,∆v)→(0,0) Area(S) lim
D’ora in avanti chiameremo jacobiano della funzione T il determinante della matrice jacobiana e lo denoteremo nel modo seguente: ∂(x, y) ∂x ∂y ∂x ∂y = det(JT ) = − . ∂(u, v) ∂u ∂v ∂v ∂u Ora utilizziamo la relazione asintotica fra le aree (7) per “indovinare” la formula del cambiamento di variabile in un integrale doppio. Sia S una regione del piano uv, T = T(S) e consideriamo una funzione f : T → R. Suddividiamo S con rettangoli Si j e indichiamo con Ti j le loro immagini sul piano xy, come nel disegno in Figura IX.22. Ora, abbiamo sempre definito le somme di Riemann in termini di partizioni di rettangoli, ma possiamo pensare di sostituirli con i rettangolini deformati Ti j , dei quali co∂(x,y)
nosciamo il valore approssimato dell’area: Area(Ti j ) ≈ | ∂(u,v) | Area(Si j ).
Bisogna fare attenzione: in questa ∂(x,y)
formula | ∂(u,v) | non è necessariamente costante (se T non è lineare). Lo jacobiano deve essere calcolato in un punto qualsiasi del rettangolo di Si j .
§ 6. Cambiamento di variabile negli integrali doppi
481
F IX.22: l’area di Ti j , immagine del rettangolino Si j attraverso T, si ottiene moltiplicando quella di Si j per lo jacobiano di T valutato in un quasiasi punto di Si j .
In questo modo, attraverso le somme di Riemann, possiamo confrontare gli integrali: "
T
≈
f (x, y) dx dy ≈
n X m X i=1 j=1
n X m X
f (x∗i j , y∗i j ) Area(Ti j )
i=1 j=1
" ∂(x, y) ∂(x, y) f (T(u∗i j , v∗i j )) f (T(u, v)) Area(S ) ≈ ij ∂(u, v) du dv ∂(u, v) T
Questo ragionamento, benché approssimativo, ci suggerisce la corretta regola di sostituzione per gli integrali doppi. (IX.28) Teorema. Supponiamo che T : A ⊂ R2 → R2 sia una trasformazione di classe C1 , T(u, v) = (x(u, v), y(u, v)), che sia: ➔ biunivoca da un aperto misurabile S del piano uv in un aperto misurabile T = T(S) del piano xy, ➔ con jacobiano sempre non nullo, e limitato. Allora, per ogni f : T → R integrabile su T, vale la formula " " ∂(x, y) du dv. f (x(u, v), y(u, v)) f (x, y) dx dy = (8) ∂(u, v) S T Osserviamo che abbiamo enunciato il Teorema per gli aperti misurabili, quali per esempio l’interno di un insieme semplice o semplicemente decomponibile. Può sembrare una formulazione inusuale, visto che abbiamo sempre integrato su domini chiusi. D’altra parte, abbiamo definito la differenziabilità (e quindi la classe C1 (A)) solamente sui domini aperti. Inoltre, in questa forma, l’enunciato è più adatto all’applicazione alle coordinate polari. Menzioniamo un corollario del Teorema, di dimostrazione immediata, particolarmente utile quando si voglia integrare sui domini chiusi:
La dimostrazione di questo Teorema va al di là degli scopi di questo testo. Il Lettore interessato può consultare i libri citati in appendice, tra cui [Pagani e Salsa(1991)]. Ne daremo una dimostrazione in un caso molto particolare nell’Esercizio 25 del prossimo capitolo (pagina 566).
Per meglio ricordare la relazione, possiamo figurarci che, nel cambiamento di variabili, l’“elemento (infinitesimale) d’area” dx dy si trasformi secondo la legge ∂(x, y) du dv. dx dy = ∂(u, v) Teniamo presente, tuttavia, che si tratta di una regola mnemonica priva di significato (in realtà il significato ci sarebbe anche, ma è accessibile solo alle cinture nere di integrazione e forme differenziali).
482
Integrali multipli
(IX.29) Corollario. Supponiamo che T : A ⊂ R2 → R2 sia una trasformazione di classe C1 che sia: ➔ biunivoca da un aperto A del piano uv in un aperto T(A) del piano xy, ➔ con jacobiano sempre non nullo. Allora, per ogni chiuso, limitato, e misurabile C ⊂ A e ogni funzione f : D = T(C) → R integrabile vale la formula: " " ∂(x, y) f (x(u, v), y(u, v)) f (x, y) dx dy = (9) du dv. ∂(u, v) C D (IX.30) Esempio. Sia D il quadrato di vertici (±1, 0) e (0, ±1): calcoliamo " (x2 − y2 )2 dx dy, D
utilizzando il cambiamento di variabili x = (u + v)/2, y = (u − v)/2. In questo caso la trasformazione T è lineare, cioè " #! " #" # u 1/2 1/2 u T = . v 1/2 −1/2 v
Si
possono facilmente ricavare le relazioni u = x + y e v = x − y.
Non è difficile calcolare la trasformazione inversa T −1 " #! " #" # 1 1 x −1 x T = , y 1 −1 y per mezzo della quale troviamo i vertici del quadrato C = T −1 (D), che sono i punti (1, 1), (−1, 1), (1, −1), (−1, −1). Il determinante jacobiano di Tè " #! 1 1/2 1/2 det =− . 1/2 −1/2 2 Perciò, secondo la formula (9) abbiamo " " 1 (x2 − y2 )2 dx dy = (uv)2 du dv. 2 D C
Infatti x2 − y2 = (x + y)(x − y) = uv.
Infine possiamo utilizzare le Formule di riduzione (IX.8) e calcolare 1 2
"
1 u v du dv = 2 C
Z
Z
1
2 2
1
2
v2 dv =
u du −1
−1
2 . 9
§ 7. Integrali doppi in coordinate polari
483
F IX.23: esempi di rettangoli polari: T1 = {(r, ϑ) : 0 ≤ r ≤ 1, 0 ≤ ϑ ≤ 2π}, T2 = {(r, ϑ) : 1/4 ≤ r ≤ 1, 0 ≤ ϑ ≤ 2π}, T3 = {(r, ϑ) : 1 ≤ r ≤ 3, −π/2 ≤ ϑ ≤ π/4}.
§ 7. Integrali doppi in coordinate polari Ci proponiamo di utilizzare le coordinate polari per calcolare l’integrale ! doppio T f (x, y) dx dy se T è un disco, una corona o un settore circolare (Figura IX.23), e l’espressione della funzione f in coordinate polari non è eccessivamente complicata. Tutte queste regioni corrispondono, attraverso il cambiamento di variabili T(r, ϑ) = (r cos ϑ, r sin ϑ), a rettangoli del piano rϑ. Per questa ragione vengono detti rettangoli polari. La trasformazione in coordinate polari (Esempio (IX.27)) ha jacobiano " # cos ϑ −r sin ϑ ∂(x, y) ∂(r, ϑ) = det sin ϑ r cos ϑ = r . Lo jacobiano è dunque una funzione limitata sui limitati del piano rϑ ed è diverso da zero tranne nei punti con r = 0. La trasformazione è biunivoca, ancora una volta, tranne nei punti del piano rϑ con r = 0, che vengono tutti mandati nell’origine del piano xy. Dunque sono soddisfatte le ipotesi del Teorema (IX.28) relativo al cambiamento di variabili nell’integrale. Possiamo quindi enunciare il risultato seguente: (IX.31) Teorema. Denotiamo T(r, ϑ) = (r cos ϑ, r sin ϑ). Sia S ⊂ (0, +∞) × (0, 2π) un aperto misurabile del piano rϑ e sia T = T(S). Allora, per ogni f : T → R integrabile su T, vale la relazione " " f (r cos ϑ, r sin ϑ)r dr dϑ. f (x, y) dx dy = (10) T
F IX.24: rettangolo polare.
Per esempio un aperto semplice o semplicemente decomponibile.
S
Direttamente dalla formula qui sopra, dopo aver osservato che l’integrale su un rettangolo aperto è uguale all’integrale sul rettangolo chiuso , si ricava quindi il seguente risultato.
Alla
luce della discussione nel riquadro a pagina 472, visto che la frontiera della rettangolo ha misura di Peano Jordan nulla.
484
Integrali multipli
(IX.32) Se f è continua sul rettangolo polare T = T(S), dove S = (a, b) × (α, β), allora "
T
Z
b
Z
β
f (r cos ϑ, r sin ϑ)r dr dϑ.
f (x, y) dx dy = α
a
(IX.33) Esempio. Utilizziamo le coordinate polari per calcolare " x dx dy 2 + y2 x T dove T è la parte di corona circolare delimitata da x2 + y2 = 1 e x2 + y2 = 4, che si trova nel semipiano x ≥ 0. La regione T, disegnata in Figura IX.25, è un rettangolo polare, corrispondente nel piano rϑ al rettangolo π π . S = 1 ≤ r ≤ 2 ,− ≤ ϑ ≤ 2 2 Di conseguenza, secondo la Proposizione (IX.32), si ha " Z πZ 2 2 x r cos ϑ dx dy = r dr dϑ 2 2 π x + y r2 T 1 −2 Z π i π2 2 cos ϑ dϑ = sin ϑ π = 2 . = − π2
−2
F IX.25
(IX.34) Esempio. Utilizziamo le coordinate polari per calcolare " 1 dx dy p 2 Da x + y2 + d2
È
dove Da è il disco di raggio a > 0, x2 + y2 ≤ a2 e d > 0 è un parametro. Il disco è ovviamente un rettangolo polare, corrispondente nel piano rϑ al rettangolo S = {0 ≤ r ≤ a , 0 ≤ ϑ ≤ 2π}. Di conseguenza, secondo la Proposizione (IX.32) abbiamo Z 2π Z a " 1 1 dx dy = r dr dϑ p √ 0 0 Da x2 + y2 + d2 r2 + d2 Z 2π Z a √ r dr dϑ = 2π a2 + d2 − |d| . = √ 0 0 r2 + d2 | {z } d √2 2 r +d = dr
(proporzionale a) il potenziale del campo elettrico generato da una carica uniformemente distribuita su un disco di raggio a con centro nell’origine e contenuto nel piano z = 0, calcolato nel punto P = (0, 0, d). Infatti, suddividiamo il disco in piccoli rettangoli polari, come nella Figura IX.24. Scegliamo un punto base (r∗i j , ϑ∗i j ) in ogni rettangolino polare, ognuno dei quali ha approssimativamente area r∗i j ∆ri ∆ϑ j . Poniamo che nel punto base sia concentrata una carica proporzionale all’area del rettangolino polare corrispondente, che dà quindi un contributo al potenziale pari alla carica divisa per la qdistanza dal punto P, che vale (r∗i j )2 + d2 : Ui j = Kr∗i j ∆ri ∆ϑ j q
1 (r∗i j )2
. Sommando + d2
i contributi di tutti i rettangolini, si hanno somme di Riemann che tendono all’integrale considerato.
§ 8. Aree di superfici cartesiane
485
(IX.35) Osservazione (Integrale improprio). Nell’esempio precedente possiamo pensare di fare tendere d a zero e ci immaginiamo di ottenere il limite finito 2πa. Nei fatti si tratta di definire un integrale in senso improprio, perché se d = 0, la funzione integranda è illimitata nei pressi dell’origine. Definiamo l’integrale improprio come limite degli integrali sulla famiglia dei domini ottenuti sottraendo al dominio un disco centrato nella singolarità (l’origine) e raggio b < a: "
Da
1
dx dy = lim p b→0 x2 + y2 Z 2π Z = lim b→0
0
"
b
Da rDb
a
1 dx dy p x2 + y2
1 √ r dr dϑ = lim 2π(a − b) = 2πa . b→0 r2
§ 8. Aree di superfici cartesiane Vediamo ora un’applicazione non fisica ma geometrica dell’integrale doppio al calcolo delle aree di superfici non necessariamente piane. In particolare, prendiamo in considerazione le superfici cartesiane, cioè i grafici di funzioni del tipo z = f (x, y). Per definire l’area di una superficie Σ ⊂ R3 potremmo pensare di procedere in modo analogo a quanto fatto per la lunghezza di una curva, cioè iniziare ad approssimare la superficie con un poliedro “inscritto” in essa, per il quale una nozione di area è già definita grazie alla geometria euclidea, per poi fare tendere a zero le aree delle facce del poliedro. Tuttavia, contrariamente al caso delle curve, questa procedura non conduce ad una definizione di area adeguata. Migliori risultati si ottengono approssimando la superficie con poliedri “circoscritti”, cioè le cui facce sono tangenti alla superficie. Descriviamo in dettaglio il procedimento nel caso di superfici cartesiane. Sia quindi f : D → R una funzione di classe C1 , a cui corrisponde la superficie n o Σ = (x, y, z) ∈ R3 : (x, y) ∈ D, z = f (x, y) . Supponiamo che D sia un dominio semplice: possiamo seguire la procedura vista più volte (ad esempio nel § 5) e suddividere il dominio di integrazione D in tanti rettangoli Ri j , con i lati paralleli agli assi. Escludiamo i rettangolini che intersecano la frontiera di D. In ogni rettangolo fissiamo un punto (x∗i j , y∗i j ) ed approssimiamo l’area della parte di Σ che sta sopra Ri j con quella della corrispondente parte del piano tangente in (x∗i j , y∗i j , f (x∗i j , y∗i j )), che indichiamo con e Σi j .Dato che e Σi j si proietta ortogonalmente su Ri j , (ragionando come a pagina 112) sappiamo che la relazione che intercorre tra le loro aree è data da Area(Ri j ) = Area(e Σi j ) cos γ,
Abbiamo introdotto la nozione di superficie cartesiana a pagina 257.
Si veda a tal proposito il Capitolo V, § 4. Questa procedura è detta più propriamente superficie.
triangolazione
della
f ∈ C1 è necessaria per poter parlare di piani tangenti a Σ.
La condizione
Così facendo non si costruisce un
vero e proprio poliedro, in quanto le “facce” e Σi j non hanno alcun motivo per incollarsi tra loro in modo continuo. Come vedremo, questo problema si risolve abbastanza facilmente.
486
Integrali multipli
dove γ è l’angolo formato dal versore verticale k e dal versore N(x∗i j , y∗i j ) normale al grafico, vale a dire dai due versori perpendicolari rispettivamente al piano xy ed al piano tangente. D’altra parte, essendo k e N versori, sappiamo che cos γ = k · N(x∗i j , y∗i j ) = q
1 1 + k∇ f (x∗i j , y∗i j )k2
,
Come abbiamo visto nell’Esempio
(VI.22) a pagina 289, N(x∗i j , y∗i j ) è dato da − fx (x∗i j , y∗i j ), − fy (x∗i j , y∗i j ), 1 . q 1 + k∇ f (x∗i j , y∗i j )k2
da cui Area(e Σi j ) =
q
1 + k∇ f (x∗i j , y∗i j )k2 · Area(Ri j ).
Se l’ampiezza della suddivisione è sufficientemente piccola, è ragionevole supporre che l’area totale di Σ sia approssimativamente uguale alla somma n X m X
Area(e Σi j ) =
i=1 j=1
n X m q X i=1 j=1
1 + k∇ f (x∗i j , y∗i j )k2 · Area(Ri j ),
p che è una somma di Riemann della funzione continua 1 + k∇ f k2 . Grazie al Teorema (IX.16) a pagina 468 sappiamo che se D è un insieme semplice questa somma, al tendere a zero dell’ampiezza della suddivisione, tende ad un integrale doppio. (IX.36) Definizione. SeD ⊂ R2 è un insieme semplice contenuto in un aperto A ed f è di classe C1 (A), allora l’area della superficie Σ, grafico di f ristretta a D, è data da " q 1 + k∇ f k2 dx dy. Area(Σ) =
O
semplicemente decomponibile o ancora, più in generale, misurabile secondo Peano–Jordan.
La formula per l’area di una superficie cartesiana può essere facilmente estesa a tutte le superfici parametriche regolari. Ce ne occuperemo nel Capitolo X, § 6.
D
(IX.37) Esempio. Ci proponiamo di calcolare l’area della p superficie, semisferica di raggio 1, grafico della funzione f (x, y) = 1 − x2 − y2 , con 2 (x, y)p ∈ D, dove D = {(x, y) ∈ Rp : x2 + y2 ≤ 1}. Abbiamo fx (x, y) = −x/ 1 − x2 − y2 ed f y (x, y) = −y/ 1 − x2 − y2 , da cui 1 + k∇ f (x, y)k2 = 1 +
y2 1 x2 + = . 2 2 2 2 1−x −y 1−x −y 1 − x2 − y2
Passando in coordinate polari otteniamo Z 2π Z 1 " dx dy r dr dϑ = Area(Σ) = p √ 2 2 0 0 D 1−x −y 1 − r2 ir=1 h√ = 2π. = −2π 1 − r2 r=0
∇ f è definito solo all’interno di D ma, come vedremo, questo non crea problemi all’integrazione.
§ 9. Integrale triplo
487
§ 9. Integrale triplo In questo paragrafo estendiamo la nozione di integrale alle funzioni di tre variabili. È chiaro come effettuare tale estensione, quando si abbia ben compresa la definizione di integrale doppio su un dominio piano. Cominciamo dal caso più semplice di una funzione f (x, y, z) definita su un parallelepipedo R = [a, b] × [c, d] × [r, s] . Per definire l’integrale triplo iniziamo col sezionare il parallelepipedo R mediante piani paralleli a ciascuno dei piani coordinati. A tale fine consideriamo una partizione dell’intervallo [a, b], a = x0 < x1 < x2 < · · · < xn = b, una dell’intervallo [c, d], c = y0 < y1 < y2 < · · · < ym = d e infine una dell’intervallo [r, s], r = z0 < z1 < z2 < · · · < zl = s. Si ottengono in questo modo n × m × l parallelepipedi Ri jk = [xi−1 , xi ] × [y j−1 , y j ] × [zk−1 , zk ], come in Figura IX.26, ciascuno di volume Vi jk = (xi − xi−1 )(y j − y j−1 )(zk − zk−1 ) = ∆xi ∆y j ∆zk e diagonale q (xi − xi−1 )2 + (y j − y j−1 )2 + (zk − zk−1 )2 .
δi jk =
L’ampiezza della suddivisione è la più grande delle diagonali dei parallelepipedi Ri jk della suddivisione: q δP = max (xi − xi−1 )2 + (y j − y j−1 )2 + (zk − zk−1 )2 . i=1,...,n, j=1,...,m, k=1,...,l
Scegliamo ora un punto base (x∗i j , y∗i j , z∗i j ) in ognuno dei parallelepipedi Ri jk : possiamo così definire la tripla somma di Riemann n X m X l X
f (x∗i j , y∗i j , z∗i j )Vi jk .
i=1 j=1 k=1
(IX.38) Definizione. L’integrale triplo di f sul parallelepipedo R è il limite delle somme di Riemann al tendere a zero dell’ampiezza della partizione: (11)
$
f (x, y, z) dx dy dz = lim
R
quando tale limite esiste.
δP →0
n X m X l X i=1 j=1 k=1
f (x∗i j , y∗i j , z∗i j )Vi jk
F IX.26
Il significato del limite è del tutto analogo a quello della Definizione (IX.3).
488
Integrali multipli
Come nel caso delle funzioni di due variabili, l’integrale si può definire equivalentemente come nel Teorema (IX.5). Di nuovo, con gli stessi ragionamenti utilizzati in precedenza, si può asserire che l’integrale esiste sicuramente quando f è continua sul parallelepipedo e che valgono le formule di riduzione analoghe al quelle del Teorema (IX.8). Tutte le proprietà degli integrali doppi viste in questo capitolo hanno un analogo per gli integrali tripli, così come le applicazioni in campo fisico richiamate nel § 5. Come per gli integrali doppi, definiamo l’integrale di una funzione limitata f : E → R su una regione limitata E ⊂ R3 come l’integrale su un parallelepipedo R ⊃ E della funzione f che coincide con f su E e vale zero al di fuori di E. Analogamente, si definisce il volume di Peano–Jordan tridimensionale di un insieme E come l’integrale su E della funzione costante uno: $ dx dy dz, Volume(E) =
Si veda a questo proposito l’Esercizio (IX.17) a pagina 508.
E
sempre che tale integrale esista (in tale caso diciamo che E è misurabile secondo Peano–Jordan). Valgono nel caso tridimensionale le considerazioni teoriche del tutto analoghe a quelle già fatte nel caso della misura piana, comprese quelle nel riquadro di approfondimento a pagina 472.
Formule di riduzione: integrazione per fili e per strati Per il calcolo concreto dell’integrale in tre variabili, abbiamo diversi modi di ordinare le variabili: a ciascuna di esse corrisponde una formula di riduzione a tre integrazioni semplici successive. Inoltre possiamo interpretare tali formule di riduzione pensando di eseguire dapprima una integrazione doppia e successivamente una semplice (o viceversa). Per gli integrali tripli abbiamo pertanto tre tipi diversi di formule di riduzione: (IX.39) Teorema. Se f è continua sul parallelepipedo R = [a, b] × [c, d] × [r, s] allora ! Z s Z $ f (x, y, z) dx dy dz = f (x, y, z) dz dx dy R
r
[a,b]×[c,d] Z b Z
= Z
a b
! f (x, y, z) dy dz dx
[c,d]×[r,s] dZ s
Z
f (x, y, z) dz dy dx
= a
c
r
Il significato del primo integrale iterato è facile da comprendere: si esegue prima l’integrazione più interna, rispetto alla variabile z, tenendo fissate x e y. Il risultato è una funzione delle due variabili x e y, Z s L(x, y) = f (x, y, z) dz r
Integrale per fili. Integrale per strati.
§ 9. Integrale triplo
489
che verrà poi integrata in un secondo tempo. Poiché la prima integrazione avviene lungo il segmento in cui x e y sono fissati e z varia fra r e s tale metodo di calcolo prende il nome di integrazione per fili. Nell’integrazione per strati invece, si esegue prima un integrale doppio sul rettangolo del piano in cui x è fissata, {x} × [c, d] × [r, s], ottenendo così una funzione della sola variabile x, che viene successivamente integrata sull’intervallo [a, b]. (IX.40) Esempio. Calcoliamo $ (xy + z2 ) dx dy dz R
dove R = [0, 1] × [0, 2] × [0, 3]. Questo equivale a calcolare l’integrale iterato #z=3 Z 1Z 2Z 3 Z 1Z 2" z3 dx dy (xy + z2 ) dz dy dx = xyz + 3 z=0 0 0 0 0 0 #y=2 Z 1Z 2 Z 1" y2 = (3xy + 9) dx dy = 3x + 9y dx 2 0 0 0 y=0 Z 1 = (6x + 18) dx = [3x2 + 18x]x=1 x=0 = 21. 0
Allo
stesso risultato si perviene scegliendo un diverso ordine di integrazione, ad esempio Z 3Z 2Z 1 (xy + z2 ) dx dy dz 0
Z
0 0 3Z 2
(y/2 + z2 ) dy dz
= 0
Z =
0 3
(1 + 2z2 ) dz
0
2 z=3 = 21. = z + z3 3 z=0
Regioni semplici in R3 In R3 ci sono tre tipi di regioni semplici, in corrispondenza ai tre assi coordinati. (IX.41) Definizione. Una regione solida E è detta z–semplice se è compresa tra i grafici di due funzione continue di x e y, cioè è di tipo E = {(x, y, z) ∈ R3 : (x, y) ∈ D, u1 (x, y) ≤ z ≤ u2 (x, y)} dove D ⊂ R2 , proiezione di E sul piano z = 0, è un insieme piano semplice oppure semplicemente decomponibile. Con lo stesso tipo di ragionamenti che hanno portato a dimostrare il Teorema (IX.16) per il calcolo degli integrali doppi come integrali iterati, si può dimostrare che ogni funzione continua su un insieme semplice è integrabile e vale la seguente formula di riduzione:
(12)
$
E
f (x, y, z) dx dy dz =
"
D
Z
u2 (x,y) u1 (x,y)
! f (x, y, z) dz dx dy.
In modo analogo si definiscono le regioni solide x–semplici e y–semplici.
Integrale per fili.
490
Integrali multipli
F IX.27: regioni semplici in R3 : la prima è z–semplice, la seconda è y–semplice, la terza è semplice rispetto a x.
(IX.42) Esempio. Utilizziamo la formula di integrazione per fili per calcolare il volume della sfera E = {(x, y, z) : x2 + y2 + z2 ≤ R2 }. La proiezione di E sul piano xy è il disco D = {(x, y) : x2 + y2 ≤ R2 }, perciò possiamo scrivere q q E = (x, y, z) ∈ R3 : (x, y) ∈ D, − R2 − x2 − y2 ≤ z ≤ R2 − x2 − y2 . Si tratta dunque di un insieme z-semplice a cui possiamo applicare la formula (12); " Z √R2 −x2 −y2 √ Volume(E) = dz dx dy − R2 −x2 −y2 D " q R2 − x2 − y2 dx dy = (passando alle coordinate polari) =2 Z
D R Z 2π
=2 0
=
0
Z √ R2 − r2 r dϑ dr = 4π
R 0
4π 3 R. 3
√ R2 − r2 r dr | {z } 1 d 2 2 3/2 (R −r ) =− 3 dr
u1 (x,y)
Successivamente si deve calcolare l’integrale doppio " L(x, y) dx dy, D
Con lo stesso ragionamento seguito nell’esempio si dimostra la formula fondamentale per il calcolo del volume di una regione solida semplice rispetto a z e che giustifica una volta di più la definizione di volume come integrale triplo: " " Z u2 (x,y) ! [u2 (x, y) − u1 (x, y)] dx dy. dz dx dy = (13) Volume = u1 (x,y)
significato della riduzione della formula (12) è il seguente: dopo aver fissato x e y, si integra la funzione z 7→ f (x, y, z)rispetto a z tra i due estremi (dipendenti da x e y) z = u1 (x, y) e z = u2 (x, y). Di nuovo, si tratta di un integrale lungo un segmento verticale, cosa che giustifica il nome di questo metodo: integrazione per fili. Il risultato è un numero dipendente da x e y, ovvero una funzione di due variabili Z u2 (x,y) f (x, y, z) dz. L(x, y) =
e questo verrà fatto di volta in volta sfruttando le formule di riduzione per gli integrali doppi.
D
Il
D
Analoghe formule valgono per domini semplici rispetto agli altri assi. Oltre al metodo di integrazione per fili, per gli insiemi tridimensionali generici possiamo avvalerci anche di quello per strati. Sia E ⊂ R3 un
§ 9. Integrale triplo
491
dominio di integrazione delimitato dai piani z = r e z = s; fissata la quota z, chiamiamo Dz la proiezione sulle prime due coordinate della sezione orizzontale di quota z di E: n o Dz = (x, y) ∈ R2 : (x, y, z) ∈ E . Supponiamo che, per ogni z ∈ [r, s], il dominio piano Dz sia a sua volta semplice, o almeno misurabile. Allora, ogni funzione continua su E è integrabile e vale la seguente formula di integrazione per strati rispetto a z:
(14)
$
Z
s
f (x, y, z) dx dy dz =
E
r
! f (x, y, z) dx dy dz.
"
Dz
La formula precedente fornisce finalmente la giustificazione teorica al Principio di Cavalieri, da noi menzionato in § 2 nell’introduzione euristica alle formule di riduzione per gli integrali doppi.
Integrale per strati. Analoghe
formule valgono per l’integrazione per strati rispetto a x o rispetto a y.
Applicazioni degli integrali tripli Gli integrali tripli permettono di calcolare, oltre al volume, la massa, i momenti e il baricentro di regioni dello spazio tridimensionale, si vedano gli Esercizi dal 48 al 55 . In questo paragrafo ci proponiamo di utilizzare l’integrale triplo per calcolare il potenziale elettrico (o gravitazionale) generato da una carica elettrica uniformemente distribuita in un corpo tridimensionale. (IX.43) Esempio. Utilizziamo la formula (14) per calcolare il potenziale del campo elettrico generato da una carica uniformemente distribuita entro un volume sferico agente su un punto al di fuori della sfera stessa. Possiamo ricondurci con traslazioni e rotazioni al caso in cui la sfera sia centrata nell’origine e abbia raggio ρ, ed il punto in cui calcoliamo il potenziale stia sull’asse z a quota λ > ρ. Possiamo ragionare in modo del tutto simile a come già fatto nel commento all’Esempio (IX.34), sapendo che una carica puntiforme q posta nel punto Q = (x, y, z) genera una campo elettrico il cui potenziale, valutato nel punto P = (X, Y, Z), vale 1 . UQ (X, Y, Z) = ε0 q p 2 (X − x) + (Y − y)2 + (Z − z)2 Ora, suddividiamo la sfera con dei parallelepipedi Ri jk , in cui scegliamo dei punti base Q∗i jk = (x∗i jk , y∗i jk , z∗i jk ). In ogni parallelepipedo vi è una carica pari a q Volume(Ri jk ), il cui contributo di potenziale nel punto (0, 0, λ) è Ui jk = ε0 q Volume(Ri jk ) q
1 (x∗i jk )2
+
(y∗i jk )2
+ (z∗i jk − λ)2
.
Il ragionamento
è del tutto simile a quello portato nella discussione delle analoghe applicazioni dell’integrale doppio nel § 5 e consiste nell’approssimare il corpo continuo con un sistema finito di punti per poi far tendere a zero l’ampiezza della suddivisione. Nel passaggio al limite le somme di Riemann tendono agli integrali corrispondenti.
Infatti
si verifica facilmente che ∇U = E, dove E indica il campo elettrico (si veda il Capitolo VII a pagina 355 e 361).
492
Sommando tutti i contributi e passando al limite delle triple somme di Riemann al tendere a zero dell’ampiezza della suddivisione, perveniamo all’espressione del potenziale nel punto (0, 0, λ): $ 1 U(0, 0, λ) = ε0 q dx dy dz, p 2 2 E x + y + (z − λ)2 dove E è la sfera di raggio ρ. Ora utilizziamo la formula di integrazione per strati (14); per ogni z ∈ [−ρ, ρ] la sezione corrispondente è il disco di p raggio ρ2 − z2 , ovvero Dz = {(x, y) ∈ R2 : x2 + y2 ≤ ρ2 − z2 }: abbiamo pertanto Z ρ " 1 dx dy dz . U(0, 0, λ) = ε0 q p 2 2 2 x + y + (z − λ) Dz −ρ Abbiamogià calcolato l’integrale doppio in dx dy nell’Esempio (IX.34); in p questo caso abbiamo a = ρ2 − z2 e d = λ − z e perciò troviamo: " q 1 2 2 ρ + λ − 2λz − (λ − z) . dx dy = 2π p x2 + y2 + (z − λ)2 Dz Perciò possiamo calcolare Z ρh q i ρ2 + λ2 − 2λz −(λ − z) dz U(0, 0, λ) = 2πε0 q −ρ | {z } −1 d 2 2 3/2 = (ρ +λ −2λz) 3λ dz 4πε qρ3 ε0 Q −1 0 [(λ − ρ)3 − (λ + ρ)3 ] − 2λρ = = . = 2πε0 q 3λ 3λ λ 4πqρ3 è la carica totale contenuta nella sfera. Osserviamo 3 dunque che sul punto P agisce una forza elettrica complessiva il cui potenziale è uguale a quello di una carica puntiforme posta nel centro della sfera di intensità pari alla carica totale distribuita uniformemente nella sfera. È questa una proprietà importantissima, che incontreremo di nuovo più avanti quando studieremo le proprietà relative al flusso del campo elettrico (Esempio (X.39)).
Dove Q =
Cambiamento di variabile negli integrali tripli Anche le considerazioni relative al cambiamento di variabili negli integrali doppi si possono estendere agli integrali tripli (e a integrali di ordine più elevato). Consideriamo una trasformazione T di classe C1 dallo spazio R3 in sé, descritta dalle relazioni x u x(u, v, w) y v y(u, v, w) = T = . z w z(u, v, w)
Integrali multipli
In
effetti, il ragionamento è del tutto generale e si può ripetere per calcolare il potenziale U(X, Y, Z) nel punto (X, Y, Z) generato da una carica di densità δ(x, y, z) distribuita entro un volume qualsiasi E: U(X, Y, Z) = #
E
ε0 qδ(x, y, z) dx dy dz . p (x − X)2 + (y − Y)2 + (z − Z)2
Come
detto, stiamo eseguendo l’integrale triplo integrando per strati. In questo caso la formula (14) ha una interessante interpretazione fisica: il potenziale totale generato dalla la sfera viene ottenuto integrando i potenziali corrispondenti ai dischi bidimensionali (gli strati, appunto) in cui la sfera viene tagliata dalle sezioni orizzontali.
§ 9. Integrale triplo
Definiamo lo jacobiano di T come il determinante della matrice jacobiana: ∂x ∂x ∂x ∂u ∂v ∂w ∂y ∂y ∂y ∂(x, y, z) . = det JT = det ∂(u, v, w) ∂u ∂v ∂w ∂z ∂z ∂z ∂u ∂v ∂w Sappiamo dalla relazione (7) a pagina 480 che, per le trasformazioni del piano, lo jacobiano rappresenta il fattore (puntuale) di trasformazione delle aree secondo T; analogamente, in dimensione tre lo jacobiano rappresenta il fattore infinitesimale di trasformazione dei volumi. Non è dunque difficile indovinare come si estende il Teorema (IX.28) al caso tridimensionale. Supponiamo, come nel Teorema (IX.28), che T sia biunivoca da un aperto misurabile S in un aperto misurabile T = T(S), con determinante jacobiano sempre non nullo e limitato. Allora, per ogni f : S → T continua, vale la formula, analoga alla (8) $ f (x, y, z) dx dy dz R $ ∂(x, y, z) f (x(u, v, w), y(u, v, w), z(u, v, w)) = du dv dw. ∂(u, v, w) S Ricordiamo che in R3 le coordinate cilindriche (r, ϑ, z) (illustrate nelle Figure IX.28) sono legate alle coordinate cartesiane dalle relazioni (si veda anche a pag. 138, nel Capitolo III) x = r cos ϑ y = r sin ϑ (15) z = z,
493
Ricordiamo
che la matrice jacobiana è definita come ∂x ∂x ∂x ∂u ∂v ∂w ∂y ∂y ∂y JT = ∂u . ∂v ∂w ∂z ∂z ∂z ∂u
∂v
∂w
Per
convincersi di questo fatto occorre linearizzare T, come abbiamo fatto a pagina 480 nel caso di trasformazioni piane.
La
misurabilità è intesa nel senso della teoria di Peano–Jordan in dimensione tre.
Per
meglio memorizzare la formula, possiamo immaginarci che la trasformazione T faccia variare l’elemento di volume secondo la formula ∂(x, y, z) du dv dw. dx dy dz = ∂(u, v, z) Di nuovo, si tratta di una regola mnemonica visto che l’elemento di volume non è mai stato definito.
dove r ≥ 0, ϑ ∈ [0, 2π) (oppure in (−π, π]) e z ∈ R. Lo jacobiano della trasformazione è pertanto cos ϑ −r sin ϑ 0 ∂(x, y, z) ∂(r, ϑ, z) = det sin ϑ r cos ϑ 0 = r 0 0 1 che produce la trasformazione dx dy dz = r dr dϑ dz. L’uso delle coordinate cilindriche è particolarmente utile per trattare domini dello spazio con simmetria assiale rispetto all’asse z. (IX.44) Esempio. Calcoliamo l’integrale di f (x, y, z) = z sulla regione solida E interna alla sfera x2 + y2 + z2 = 1 e sopra il paraboloide z = x2 + y2 − 1. Le due superfici si intersecano lungo il cilindro verticale (x2 + y2 − 1)2 = z2 = 1 − x2 − y2 ,
F IX.28: coordinate cilindriche.
494
Integrali multipli
e possiamo scrivere in coordinate cartesiane 2
2
2
q
2
E = {(x, y, z) : x + y ≤ 1, x + y − 1 ≤ z ≤
1 − x2 − y2 }.
L’insieme si semplifica notevolmente passando a coordinate cilindriche; tenendo conto delle (15) si trova √ E′ = T −1 (E) = {(r, ϑ, z) : r ∈ [0, 1], ϑ ∈ [0, 2π), r2 − 1 ≤ z ≤ 1 − r2 }. Si tratta di una regione semplice rispetto alla terza coordinata, dunque l’integrale di f (r, ϑ, z) = z si calcola facilmente grazie alle formule di riduzione. Si ha così $ $ zr dr dϑ dz z dx dy dz = E
T −1
Z
2π
Z
1
F IX.29: coordinate sferiche.
√ 1−r2
Z
zr dz dr dϑ
= Z
0 2π
Z
r2 −1
0 1
r [1 − r2 − (r2 − 1)2 ] dr dϑ 2 0 0 " 6 #r=1 r r4 π =π − + = . 6 4 r=0 12 =
Un altro sistema di coordinate in R3 è quello delle coordinate sferiche, in cui ogni punto P è rappresentato dalla terna (r, φ, ϑ). x = r sin φ cos ϑ y = r sin φ sin ϑ (16) z = r cos φ. Dal calcolo dello jacobiano della trasformazione (si veda l’Esercizio 42 ) si ottiene l’elemento di volume in coordinate sferiche dx dy dz = r2 sin φ dr dφ dϑ. (IX.45) Esempio. Come applicazione delle coordinate sferiche calcoliamo $ (x2 + y2 ) dx dy dz R
dove R è la regione solida interna alla sfera x2 + y2 + z2 = 4 ed esterna alla sfera x2 + y2 + z2 = 1. Si ha semplicemente Z 2π Z π Z 2 $ 2 2 (x + y ) dx dy dz = (r sin φ)2 r2 sin φ dr dφ dϑ R
0
= 2π
"
0 # 5 2
r 5
1
Z
1 π
sin3 φ dφ = 0
248 π. 15
Si
veda pagina 141.
nel
Capitolo
III,
a
Il valore di r è la distanza dall’ori-
gine di P, φ (la colatitudine) è l’angolo che la retta passante per O e P forma col semiasse positivo delle z; infine ϑ (la longitudine) è la coordinata angolare della proiezione del segmento OP sul piano z = 0. ϑ ha quindi lo stesso significato che nelle coordinate cilindriche.Si ha r ≥ 0, φ ∈ [0, π] e ϑ ∈ [0, 2π). Si veda anche la Figura IX.29.
Esercizi
495
Esercizi (IX.1) Calcolare le somme di Riemann della funzione f (x, y) = √ 1 − x2 sul rettangolo R = [−1, 1] × [−2, 2] corrispondenti alle suddivisioni in 4, 16 e 64 rettangolini uguali, scegliendo i centri come punti base. Soluzione. Cominciamo a suddividere il rettangolo in 4 rettangoli uguali di area ∆A = 2 come in Figura IX.30. Su ciascuno costruiamo il parallelepipedo che ha per altezza il valore di f nel centro del rettangolo: si tratta dei punti di ascissa ±1/2 e ordinata ±1. Quindi i 4 parallelepipedi hanno √ tutti altezza h = f (±1/2, y) = 3/2 e la somma dei loro volumi vale √ s1 = 4 · ∆A · h = 4 3 ≈ 6.9282. Questo valore costituisce una prima approssimazione del volume del solido richiesto. Ripetiamo ora il procedimento con una suddivisione più fitta del rettangolo di base, per esempio in 16 rettangoli uguali di area pari a ∆A = 1/2. Costruiamo 16 parallelepipedi ciascuno avente per altezza il valore di f nel centro del rettangolo su cui è costruito. Ne segue √ che 8 di loro hanno altezza pari a h1 = √f (±3/4, y) = 7/4, mentre gli altri 8 hanno altezza h2 = f (±1/4, y) = 15/4. Calcoliamo il volume di ciascun parallelepipedo e sommiamo: √ √ s2 = 8 · ∆A · h1 + 8 · ∆A · h2 = 7 + 15 ≈ 6.5187.
(- 12 ,1)
( 12 ,1)
(- 12 , -1)
( 12 , -1) F IX.30
Abbiamo ottenuto una seconda approssimazione del volume V del solido. Se proviamo a raffinare ancora la suddivisione del rettangolo, scegliendo 64 rettangolini di area 1/8, procedendo col calcolo dei volumi dei parallelepipedi si trova s3 ≈ 6.3678. Come si vede dalla Figura IX.31, l’integrale è la metà del volume del cilindro circolare di equazione z2 + x2 = 1 che ha per asse di rotazione l’asse y, per basi due cerchi di raggio 1, e avente altezza 4. Il volume del mezzo cilindro è quindi V=
1 π (1)2 · 4 = 2π ≈ 6.2831. 2
(IX.2) Calcolare " xexy dx dy I= R
dove R = [0, 1] × [0, 2].
F IX.31
496
Integrali multipli
Soluzione. Possiamo applicare il Teorema (IX.8), poiché f (x, y) = xexy è una funzione continua su R; dunque il valore di I è uguale a quello dell’integrale iterato. Integrando prima rispetto a y si ha ! Z 1 Z 2 I= xexy dy dx. 0
0
Pensiamo x costante; una primitiva della funzione y 7→ xexy è exy , dunque si ha Z 2 y=2 xexy dy = [exy ] y=0 = e2x − 1. 0
Vediamo cosa succede integrando
prima rispetto a x; il calcolo è fin dall’inizio più complicato perché determinare una primitiva di x 7→ xexy (pensando y costante) richiede l’uso della formula di integrazione per parti: Z Z exy exy xexy dx = x − 1· dx y y =x
exy exy − 2. y y
Per finire integriamo la funzione ottenuta rispetto a x tra x = 0 e x = 1: #x=1 " 2x Z 1 e2 3 e = −x − . I= (e2x − 1) dx = 2 2 2 0 x=0
Si ottiene così " xy #x=1 Z 1 e exy xexy dx = x − 2 y y x=0 0
(IX.3) Disegnare il dominio e invertire l’ordine di integrazione del seguente integrale
A questo punto dobbiamo integrare la funzione ottenuta rispetto a y tra y = 0 e y = 2. . . ma non riusciamo a terminare il nostro calcolo perché non è possibile determinare una primitiva della funzione y−2 e y ! Nell’applicare il Teorema (IX.8), è meglio fare attenzione a come si sceglie l’ordine di integrazione.
Z
1
Z
1 x
f (x, y) dy dx. 1 2
x2
Soluzione. L’integrale iterato rappresenta l’integrale doppio di f sulla regione 1 1 D = (x, y) : ≤ x ≤ 1, x2 ≤ y ≤ 2 x
=
ey ey 1 − 2 + 2. y y y
disegnata in Figura IX.32. Per scambiare l’ordine di integrazione è opportuno scrivere D come unione di regioni x–semplici non sovrapposte, D = D1 ∪ D2 dove 1 1 √ D1 = (x, y) : ≤ y ≤ 1, ≤ x ≤ y , 4 2 ( ) 1 1 D2 = (x, y) : 1 ≤ y ≤ 2, ≤ x ≤ . 2 y Possiamo ora scrivere, grazie alle formule di riduzione Z 2Z Z 1 Z √y " f (x, y) dx dy + f (x, y) dx dy = 1 4
D
1 2
(IX.4) Calcolare " x2 y dx dy D
dove D è la regione disegnata in Figura IX.33.
1
1 y
f (x, y) dx dy. 1 2
F IX.32
Esercizi
497
Soluzione. D può essere visto come unione dei tre domini semplici D1 = {(x, y) : −2 ≤ x ≤ −1, −x − 2 ≤ y ≤ −x − 1}
D2 = {(x, y) : −1 ≤ x ≤ 0, −1 ≤ y ≤ x + 1}
D3 = {(x, y) : x ≥ 0, x2 + y2 ≤ 1} dunque per definizione si ha "
3 " X
x2 y dx dy
F IX.33
Poiché il dominio D3 è simmetrico rispetto all’asse x e la funzione da integrare è dispari rispetto a y, l’ultimo integrale è nullo. Calcoliamo ora i restanti integrali applicando le formule di riduzione
Si veda a questo proposito l’Eser-
x2 y dx dy =
D
Di
i=1
Z
"
x2 y dx dy =
D1
−1
Z
−2 −1
Z
0
Z
−x−1
x2 y dy dx
−x−2
i x2 h = (−x − 1)2 − (−x − 2)2 dx −2 2 #−1 " 4 x3 1 x = . = − − 4 2 −2 4 "
Z
D2
−1
x2 y dy dx = "
= L’integrale richiesto è
Z
x+1
x2 y dx dy =
!
−1
−1
−2
# 4 0
x5 x + 10 4
−1
=−
1/2 x2 (1 + x)2 − 1 dx
3 . 20
2
D
x y dx dy = 0 + 1/4 − 3/20 = 1/10.
(IX.5) Calcolare " (x2 + y) dx dy D
dove D è la parte di corona circolare delimitata da x2 + y2 = 1 e x2 + y2 = 4 compresa tra le rette y = x e y = −x. Soluzione. La regione D è un rettangolo polare 1 ≤ r ≤ 2,
−
π π ≤ϑ≤ . 4 4
cizio 19 .
498
Integrali multipli
Di conseguenza la Proposizione (IX.32) dice "
Z 2
(x + y) dx dy =
D
Z
Z
π 4
"
π 4
= Z
− π4
π 4
= Z
− π4 π 4
2
(r2 cos2 ϑ + r sin ϑ)r dr dϑ
− π4
(
1
r4 r3 cos2 ϑ + sin ϑ 4 3
#r=2 dϑ r=1
7 15 cos2 ϑ + sin ϑ) dϑ 4 3
7 15 15 + cos 2ϑ + sin ϑ) dϑ 8 8 3 ϑ= π4 15 15 7 15 15 = = ϑ+ sin 2ϑ − cos ϑ π+ . 8 16 3 16 8 ϑ=− π4
=
− π4
ATTENZIONE! Quando passiamo dalle coordinate cartesiane a quelle polari, sostituendo a f (x, y) la funzione di r e ϑ definita come f (r cos ϑ, r sin ϑ), dobbiamo sostituire all’elemento d’area dx dy l’espressione r dr dϑ, dove compare il termine moltiplicativo r.
⊚
(
Abbiamo
applicato l’identità tri-
gonometrica cos2 ϑ =
1 (1 + cos 2ϑ). 2
(IX.6) Calcolare l’area della regione T in Figura IX.34. Soluzione. Per calcolare l’area è utile operare la trasformazione u=
y , x
v = y + x,
inversa della funzione T definita dalle equazioni x=
v , u+1
y=
uv . u+1
Allora la regione T corrisponde nel piano uv al rettangolo S = T −1 (T) 1 ≤ u ≤ 2, 1 ≤ v ≤ 3 . S = (u, v) : 2 Poiché lo jacobiano di T è " v − (u+1) 2 ∂(x, y) = det v ∂(u, v) (u+1)2
1 # u+1 u u+1
=
F IX.34
T si ottiene per esempio ricavando
y = v − x dalla seconda e sostituendo nella prima. Si ricava x dalla relazione ux = v −x e si sostituisce di nuovo nella seconda per avere y in funzione di u e v.
|v| , (u + 1)2
sempre diverso da zero per (u, v) ∈ S, ne segue che l’area della regione T risulta essere Z 2Z 3 " " v ∂(x, y) dv du dx dy = Area(T) = ∂(u, v) du dv = 1 2 1 (u + 1) S T 2 " 2 #v=3 Z 2 4 1 1 u=2 v = = = 4 − du 2 1 2 u + 1 3 (u + 1) u=1/2 v=1 2
Si può controllare il risultato pen-
sando alla regione come a differenza di triangoli, le cui aree si calcolano elementarmente; volendo invece scrivere T come unione di regioni y– semplici occorre invece suddividere in almeno 4 parti.
Esercizi
499
✩ (IX.7) Calcolare l’integrale "
2
D
e y/x dx dy x2 y2
dove D è la regione D = {(x, y) : x2 ≤ y ≤ 2x2 , y2 ≤ x ≤ 2y2 }. Soluzione. La forma del dominio suggerisce di operare il cambiamento di variabile y x v = 2, u = 2, x y ovvero di considerare la trasformazione ! y x F : (x, y) 7→ 2 , 2 x y
F IX.35
che trasforma il dominio D nel quadrato D′ = {(u, v) : u ∈ [1, 2], v ∈ [1, 2]}. Per trasformare correttamente l’integrale occorre che si usi il Teorema (IX.28), dunque ci serve lo jacobiano della trasformazione inversa di F. Possiamo calcolare questo jacobiano senza ricavare esplicitamente le equazioni di F −1 : infatti dal Teorema di inversione locale enunciato nell’approfondimento a pagina 367, sappiamo che 1 |det JF−1 (u, v)| = det JF (x, y) Lo jacobiano di F è 2y − x3 ∂(u, v) ∂(x, y) = det 12 y
1 x2 −2x y3
=
3 . x2 y2
Osserviamo ora che, moltiplicando u e v si trova uv = permette di esprimere lo jacobiano di F −1 come 2 2 1 ∂(x, y) x y = = . ∂(u, v) 3 (x,y)=F−1 (u,v) 3u2 v2
1 xy ,
relazione che
L’integrale richiesto risulta essere " " y/x2 " e 1 2 2 u ∂(x, y) eu du dv u v e dx dy = du dv = ∂(u, v) 2 y2 3 x ′ ′ D D D Z Z 1 2 2 u 1 2 1 = e dv du = · 1 · [eu ]u=2 u=1 = (e − e). 3 1 1 3 3
Lo jacobiano di F è sempre diverso da zero per (x, y) ∈ D!
500
Integrali multipli
Regioni polari Si chiamano regioni polari, domini come quello disegnato in Figura IX.36. Si rappresentano facilmente in coordinate polari come regioni semplici rispetto a r, ovvero D = {(r, ϑ) : α ≤ ϑ ≤ β, h1 (ϑ) ≤ r ≤ h2 (ϑ)}. Combinando il Teorema (IX.31) con la Formula di riduzione (IX.16) si ottiene la seguente formula: Z β Z h1 (ϑ) " f (x, y) dx dy = (17) f (r cos ϑ, r sin ϑ)r dr dϑ. α
D
h1 (ϑ)
F IX.36: regione polare.
(IX.8) Utilizzare questo risultato per calcolare il volume del solido che giace sotto la superficie z = 4 − x2 − y2 , sopra il piano xy e dentro il cilindro (x − 1)2 + y2 = 1. Soluzione. Consideriamo il disco D del piano xy di equazione (x − 1)2 + y2 ≤ 1, che ha per bordo la circonferenza di raggio 1 centrata nel punto (1, 0) (Figura IX.37). Poiché per (x, y) ∈ D si ha 4 − x2 − y2 ≥ 4 − 2x ≥ 0, il solido si trova effettivamente sopra il piano xy e il suo volume è dato dalla formula " (4 − x2 − y2 ) dx dy. Volume = D
Per calcolare l’integrale cominciamo col rappresentare il dominio in coordinate polari. Sostituendo x = r cos ϑ e y = r sin ϑ l’equazione della circonferenza diventa (r cos ϑ − 1)2 + r2 sin2 ϑ = 1 ⇔ r2 − 2r cos ϑ = 0 ⇔ r = 2 cos ϑ (anche r = 0, è soluzione, e corrisponde all’origine). Per descrivere D come regione r–semplice, ovvero come unione di infiniti segmenti su raggi che partono dall’origine, disegniamo un generico segmento di raggio che parte da (0, 0) e che termina sulla circonferenza. Le sue coordinate polari descriveranno la regione D. Intanto osserviamo che ϑ può variare tra −π/2 e π/2 (altrimenti il raggio non interseca la regione). Per ϑ fissato, ci muoviamo lungo il raggio a partire dall’origine verso la circonferenza: il primo r possibile è r = 0, l’ultimo corrisponde alla coordinata radiale del punto sulla circonferenza, ovvero r = 2 cos ϑ. Perciò il disco è dato da D = {(r, ϑ) : −π/2 ≤ ϑ ≤ π/2, 0 ≤ r ≤ 2 cos ϑ}. Grazie alla formula (17) si ha Z " 2 2 (4 − x − y ) dx dy = D
Z
π/2
"
= −π/2
−π/2 # 4 r=2 cos ϑ
r 2r − 4 2
π/2
Z
2 cos ϑ 0
(4 − r2 )r dr dϑ Z
π/2
dϑ = r=0
−π/2
(8 cos2 ϑ − 4 cos4 ϑ) dϑ.
F IX.37
Esercizi
501
Per finire l’esercizio basta calcolare l’ultimo integrale. Cominciamo a trattare l’integrale di cos4 ϑ, che semplifichiamo integrando per parti: Z Z 4 3 cos ϑ dϑ = cos ϑ sin ϑ + 3 cos2 ϑ sin2 ϑ dϑ Z Z 3 2 = cos ϑ sin ϑ + 3 cos ϑ dϑ − 3 cos4 ϑ dϑ da cui 4
R
Z
cos4 ϑ dt = cos3 ϑ sin ϑ + 3 Z
π/2
cos2 ϑ dϑ e
cos2 ϑ dϑ. −π/2
−π/2
Si ha allora Z π/2
Z 2
−π/2
4
(8 cos ϑ − 4 cos ϑ) dϑ = 5 · 2
Z
=5 0
Capitolo II a pagina 55 abbiamo visto che cos4 t = 81 (cos(4t) + 4 cos 2t + 3): questa identità permette di calcolare l’integrale in modo diretto. Svolgiamo l’esercizio in modo alternativo, per chi non ricordasse la formula.
π/2
cos4 ϑ dϑ = 3
4
R
Nel
π/2
π/2
cos2 ϑ dϑ 0
ϑ=π/2 5 1 = π. (1 + cos 2ϑ) dϑ = 5 ϑ + sin 2ϑ 2 2 ϑ=0
(IX.9) Calcolare l’integrale di x3 y f (x, y) = p x2 + y2 prima sulla regione D1 in Figura IX.38 e poi sulla regione D2 in Figura IX.39. Soluzione. La regione D1 è il rettangolo polare [1, 2]×[−π/2, π/4]; inoltre anche la funzione da integrare si semplifica passando a coordinate polari, perché diventa f (r, ϑ) = r3 cos3 ϑ sin ϑ. Conviene quindi calcolare l’integrale tramite la formula (IX.32) a pagina 483: Z πZ 2 " 4 x3 y dx dy = (r3 cos3 ϑ sin ϑ)r dr dϑ p x2 + y2 D1 1 − π2 " #π/4 " 5 #2 Z π Z 2 4 cos4 ϑ r 31 3 4 = cos ϑ sin ϑ dϑ r dr = − =− . 4 80 − π2 1 −π/2 5 1 La regione D2 si trova nel primo quadrante, sia dentro al cerchio di raggio 1 centrato nell’origine, sia dentro al cerchio di raggio 1 e centro (1, 0). Le due circonferenze si intersecano nel primo quadrante nel punto di ascissa (x − 1)2 + (1 − x2 ) = 1 ⇔ −2x + 1 + 1 = 1 ⇔ x =
1 , 2
F IX.38: regione D1 .
F IX.39: regione D2 .
502
Integrali multipli
√ e ordinata y = 3/2. √ La retta passante per l’origine e per questo punto, 3x, divide D2 in due sottoregioni. La prima, sotto alla di equazione y = √ retta y = 3 è il rettangolo polare A π A = (r, ϑ) : 0 ≤ ϑ ≤ , 0 ≤ r ≤ 1 . 3 Per trovare la seconda, B, procediamo come nell’esercizio precedente: sostituiamo x = r cos ϑ e y = r sin ϑ nell’equazione della circonferenza (x − 1)2 + y2 = 1 e troviamo la relazione r2 − 2r cos ϑ, da cui l’equazione in polari r = 2 cos ϑ. Possiamo allora rappresentare B come π π ≤ ϑ ≤ , 0 ≤ r ≤ 2 cos ϑ . B = (r, ϑ) : 3 2 Sfruttando l’additività dell’integrale doppio possiamo calcolare il valore dell’integrale di f su D2 come somma degli integrali di f su A e su B. Il primo si calcola semplicemente come nella prima parte dell’esercizio come Z πZ 1 " 3 x3 y dx dy = (r3 cos3 ϑ sin ϑ)r dr dϑ p A x2 + y2 0 0 #π/3 " 5 #1 " Z 1 Z π 3 r 3 cos4 ϑ 3 4 = . cos ϑ sin ϑ dϑ r dr = − = 4 5 0 64 0 0 0 Per il secondo, sfruttando la formula (17) si trova Z π Z 2 cos ϑ " 2 x3 y dx dy = (r3 cos3 ϑ sin ϑ)r dr dϑ p π x2 + y2 0 B 3 " #π/2 Z π 2 25 1 25 cos9 ϑ 8 = = . − cos ϑ sin ϑ dϑ = 5 π3 5 9 720 π/3 In totale
!
3
D2
√x 2 y
x +y2
dx dy = 3/64 + 1/720 = 139/2880.
(IX.10) Calcolare il volume del solido E delimitato dal piano z = 0 e dalla porzione di superficie di equazione z = xy(y + x − 1) che si proietta in D = {(x, y) : x2 + y2 ≤ 1, x ≥ 0}. Soluzione. Osserviamo che la funzione f (x, y) = xy(y + x − 1) cambia di segno su D; dallo studio del segno di f si infatti ha che la funzione è positiva in D+ = D ∩ {(x, y) : y > 1 − x oppure y < 0} mentre è negativa in D− = D ∩ {(x, y) : y > 0, y < 1 − x} (regione ombreggiata in Figura IX.40). Il volume della regione E si può calcolare come Volume(E) = Volume(E+ ) + Volume(E− )
F IX.40
Esercizi
503
dove E± è la parte di solido che si proietta su D± , di equazione
Il ragionamento
E+ = {(x, y) ∈ D+ : 0 ≤ z ≤ f (x, y)}, E− = {(x, y) ∈ D− : f (x, y) ≤ z ≤ 0}. Dalla formula (13) abbiamo " + f (x, y) dx dy, Volume(E ) =
che porta al calcolo del volume si può riassumere nella formula " | f (x, y)| dx dy. Volume = D
Volume(E− ) =
"
D−
D+
− f (x, y) dx dy.
Si ha Z
"
D−
Z
− f (x, y) dx dy = 1
= 0
1
Z
0
1−x
xy(1 − y − x) dy dx
0
1 1 1 − x(1 − x)3 + x(1 − x)(1 − x)2 dx = . 3 2 120
Per quanto riguarda il volume di E+ , dall’additività dell’integrale, e sfruttando le formule di riduzione risulta Z 1 Z √1−x2 " Z 1Z 0 f (x, y) dy dx f (x, y) dx dy = f (x, y) dy dx + √ D+
Z
0
1
= 0
1−x # √ 2 2 y= 1−x
"
y3 xy2 y x + − 3 2 2
0
Z
1
+ 0
y=1−x
"
y3 xy2 y2 + − x 3 2 2
− 1−x2
# y=0
=
√ y=− 1−x2
1 1 + . 60 8
I
conti per il calcolo di questo integrale ono un po’ laboriosi; il Lettore è invitato a svolgerli per esteso.
In totale il volume di E è 1/120 + 1/60 + 1/8 = 3/20. (IX.11) Consideriamo una lamina omogenea di densità δ(x, y) = 4 − x che occupa la regione del piano D in Figura IX.41. Calcolarne la massa, le coordinate del baricentro e il momento d’inerzia rispetto all’asse y. Soluzione. La massa è data dall’integrale "
Z
1
Z
x2 +1
δ(x, y) dx dy =
D
Z =
−1
2x2
(4 − x) dy dx
h x3 i1 16 = . 4(1 − x2 ) dx = 8 x − 3 0 3 −1 1
Le coordinate del baricentro della lamina si calcolano con le formule (6): occorre quindi calcolare " " y(4 − x) dx dy. x(4 − x) dx dy, D
D
Osserviamo intanto che per ragioni di simmetria si ha " " x2 dx dy. x(4 − x) dx dy = − D
D
Infatti
R1 −1
x(1 − x2 ) dx.
504
Integrali multipli
Calcolando l’integrale con le formule di riduzione si trova Z
"
1
Z
D
Z
x2 +1
x2 dx dy = 2
1
x2 dy dx = 2 2x2
0
"
0
x2 (1 − x2 ) dx
x3 x5 =2 − 3 5
#1
= 0
4 . 15
x¯ = −4/15 · 3/16 = −1/20. Per il calcolo del secondo integrale, tenendo sempre conto delle simmetrie si ha Z
"
D
y(4 − x) dx dy = 8
1
Z
Z
x2 +1
y dy dx = 4 2x2
0
0
1
F IX.41
(x2 + 1)2 − 4x4 dx
#1 " 16 x3 x5 = 4 −3 + 2 + x = 4 . 5 3 15 0
Si trova così la seconda coordinata del baricentro y¯ = 416/15·3/16 = 4/5. (IX.12) Calcolare il baricentro della lamina di densità ρ(x, y) proporzionale alla distanza della lamina dall’asse x, che occupa la regione D in Figura IX.42. Soluzione. In questo caso la forma della lamina suggerisce di passare in coordinate polari; infatti D è il rettangolo polare D = {(r, ϑ) : 1 ≤ r ≤ 2, 0 ≤ ϑ ≤
π }. 2
La densità della lamina è ρ(x, y) = ky, dove k è la costante di proporzionalità; in coordinate polari avremo ρ(r, ϑ) = kr sin ϑ. La sua massa è quindi massa =
" Z
Z
Z
2
r2 sin ϑ dr dϑ
ky dx dy = k D
"
π 2
sin ϑ
=k 0
Inoltre "
π 2
r3 3
#2
0
dϑ = 1
F IX.42
1
7 7 k[− cos ϑ]π/2 = k. 0 3 3
Passando in coordinate polari, bixρ dx dy = k
D
"
Z yx dx dy = k
D
Z
"
π 2
sin ϑ cos ϑ
=k 0
π 2
sogna sempre ricordarsi del termine r dr dϑ.
r3 sin ϑ cos ϑ dr dϑ
0 # 4 2
r 4
dϑ = 1
" #π/2 15 sin2 ϑ 15 k k, = 4 2 0 8
Esercizi
505
"
yρ dx dy = k
D
Z
"
y2 dx dy = k
D
Z
π 2
"
# 4 2
Ricordiamo che Z r3 sin2 ϑ dr dϑ
0
Z π 2 15 dϑ = =k k sin2 ϑ dϑ 4 0 0 1 15 ϑ sin 2ϑ π/2 15 = k − πk. = 4 2 4 16 0 π 2
r sin ϑ 4 2
Il baricentro della lamina ha dunque coordinate x¯ =
15 3 45 = , 8 7 56
y¯ =
15 3 45 π = π. 16 7 112
Integrali impropri In analogia con gli integrali monodimensionali, possiamo definire l’integrale improprio di una funzione di due variabili su un dominio illimitato, attraverso un passaggio al limite su una famiglia di integrali su domini limitati. Vediamone subito un esempio applicato a un problema di probabilità. (IX.13) Siamo ancora alla stessa festa della birra dell’Esempio (IX.24). Qual è la probabilità che la birra venga servita almeno 10 minuti dopo la salsiccia? Soluzione. Calcoliamo la probabilità che la birra venga servita almeno 10 minuti dopo la salsiccia, ma comunque entro il tempo T > 10. A tale fine consideriamo la funzione densità congiunta dei due tempi di attesa: −x/10 −y/5 e e x≥0ey≥0 f (x, y) = f1 (x) f2 (y) = 10 5 0 altrimenti. Si tratta dunque, come già nell’Esempio (IX.24), di calcolare l’integrale della funzione f (x, y) sui triangoli DT = {(x, y) : 10 ≤ y ≤ T , 0 ≤ x ≤ y − 10}: "
f (x, y) dx dy =
DT
=
=
1 50 1 50 1 5
Z
T
Z
y−10
e−x/10 e−y/5 dx dy 10 Z T
Z
10
0
h
e−y/5 e−x/10 (−10)
ix=y−10 x=0
T
(e−y/5 − e1−3y/10 ) dy =
10
dy
2 1 −2 e − e−T/5 + e1−3T/10 . 3 3
Vogliamo ora definire l’integrale di f sul semipiano y > x + 10, che è un insieme illimitato. Per la definizione di f , è sufficiente definire l’integrale
ϑ sin 2ϑ − 2 4 Z sin 2ϑ ϑ cos2 ϑ dϑ = + 2 4 sin2 ϑ dϑ =
come si può ottenere facilmente integrando per parti due volte, o sfruttando le formule di Werner a pagina 55.
506
Integrali multipli
sull’intersezione del semipiano con il primo quadrante, cioè sull’insieme D = {(x, y) : 0 ≤ x ≤ y − 10 , 10 ≤ y}. È ragionevole, anche dal punto di vista dell’applicazione probabilistica, definire tale integrale come il limite, per T → +∞ degli integrali sui triangoli DT : " " 1 f (x, y) dx dy = e−2 ≈ 4.511. f (x, y) dx dy = lim T→+∞ 3 DT D (IX.14) Si definisce l’integrale doppio su tutto R2 come " " f (x, y) dx dy f (x, y) dx dy = lim r→+∞
R2
In
base a questo calcolo, circa il 4.5% di clienti, se avrà aspettato l’arrivo della birra prima di assaggiare la salamella, si troverà nella penosa situazione di doverla mangiare fredda.
Dr
dove Dr = {(x, y) : x2 + y2 ≤ r2 } è il disco centrato nell’origine e raggio r > 0. Mostrare che " 2 2 e−x −y dx dy = π. R2
Utilizzando questo risultato, mostrare che l’integrale improprio Z a Z √ 2 −x2 e dx = lim e−x dx = π. a→+∞
R
−a
Soluzione. Fissato b > 0 si calcola in polari l’integrale doppio sul disco Db centrato nell’origine e di raggio b Ib =
Z
"
−x2 −y2
e
2π
Z
b
Db
0 2
2
e−r rdrdϑ.
dx dy = 0
2
2
Una primitiva di re−r è −e−r /2, da cui Ib = π(1 − e−b ). Il quadrato Qa è contenuto nel disco circoscritto, ovvero in D √2a e contiene il disco inscritto di raggio a. Per la proprietà di monotonia degli integrali si ha " 2 2 e−x −y dx dy ≤ I √2a . Ia ≤ Qa
Passando al limite per a → +∞ si ha I √2a → π e Ia → π, da cui si ottiene la prima formula. Si osserva ora grazie al Teorema di Fubini che ! Z a " Z a −x2 −y2 −y2 −x2 e dx dy = e e dx dy Qa
Z
a
Z −y2
e −a
dy ·
a
−a
−x2
e −a
−a
Z
a
!2 −x2
e
dx = −a
dx
Questo
integrale gioca un ruolo fondamentale nel calcolo delle probabilità, come abbiamo visto nel primo volume.
Esercizi
da cui
507
q Ra √ 2 Ia ≤ −a e−x dx I √2a . Passando al limite per a → +∞ si ottiene
infine l’integrale improprio Z √ 2 e−x dx = π. R
(IX.15) Utilizzando la formula di integrazione per strati (14), trovare il volume dell’insieme E = {(x, y, z) : 2|y| + |x| ≤ 1 − z2 }. Soluzione. Si tratta di calcolare l’integrale triplo $ dx dy dz. Volume(E) = E
Le sezioni di E con piani perpendicolari all’asse z, ovvero con piani di tipo z = h sono rombi: Dh = {(x, y, h) : 2|y| + |x| ≤ 1 − h2 },
al variare di h (cioè di z) tra −1 e 1, valori oltre i quali Dh è vuoto; infatti se |h| > 1 la disequazione 2|y| + |x| ≤ 1 − h2 < 0 non ha soluzioni. Applicando la formula di integrazione per strati (14) abbiamo ! Z 1 Z Z 1 $ dx dy dz = dx dy dz = Area(Dz ) dz, −1
E
−1
Dz
dunque dobbiamo calcolare l’area delle sezioni Dh . Trattandosi di rombi, sappiamo dalla geometria elementare che l’area si ottiene dal semiprodotto delle diagonali. Le diagonali di Dh si trovano (si veda la Figura IX.43) sugli assi coordinati e valgono 2(1 − h2 ) e 1 − h2 . Ricaviamo così 2 2
Area(Dh ) = (1 − h )
e infine
Z
Z
1
Volume(E) =
1
Area(Dz ) dz = −1
−1
(1 − z2 )2 dz =
16 . 15
(IX.16) (Solidi di rotazione) La regione solida n o E = (x, y, z) : z ∈ [a, b], x2 + y2 ≤ [ f (z)]2 si può ottenere ruotando il dominio piano {(x, z) : z ∈ [a, b], 0 ≤ x ≤ f (z)} attorno all’asse z. Dimostrare la formula Z
b
[ f (z)]2 dz.
Volume(E) = π
F IX.43
a
Calcolare poi il volume √ del solido ottenuto ruotando attorno all’asse z il grafico di f (z) = | sin z| per z ∈ [0, 2π].
Come
si trova facilmente calcolando i punti di intersezione con gli assi, ovvero sostituendo prima x = 0 e poi y = 0 nell’espressione 2|y|+|x| = 1 − h2 .
Si veda a questo proposito il Teorema di Pappo enunciato nell’Esercizio 51 .
508
Integrali multipli
Soluzione. Le sezioni di E con i piani orizzontali z = h sono cerchi di raggio f (h) Dh = {(x, y, h) : x2 + y2 ≤ [ f (h)]2 },
ciascuno di area Area(Dh ) = π[ f (h)]2 . Dalla formula di integrazione per strati si ha Z b Z b Volume(E) = Area(Dz ) dz = π [ f (z)]2 dz. a
a
√ Se ora poniamo f (z) = | sin z| il volume del solido è Z 2π Z π Volume(E) = π | sin z| dz = 2π sin z dz = 4π. 0
0
(IX.17) Il momento di inerzia rispetto all’asse z di un solido di densità δ(x, y, z) che occupa la regione E ∈ R3 è dato dall’integrale $ δ(x, y, z)(x2 + y2 ) dx dy dz.
Si veda pagina 472 e seguenti.
E
Determinare il momento di inerzia del solido interno al cono z = p x2 + y2 e alla sfera x2 + y2 + z2 = a2 (dove a > 0), supponendo che abbia densità costante δ(x, y, z) = 1. Soluzione. La regione è un solido di rotazione intorno all’asse z, descritto dalle relazioni cartesiane q q E = {(x, y, z) : x2 + y2 ≤ a2 , x2 + y2 ≤ z ≤ a2 − x2 − y2 }. Data la simmetria assiale rispetto a z, è conveniente usare le coordinate cilindriche per rappresentarlo. Se T è la trasformazione in coordinate cilindriche o n √ E′ = T −1 (E) = (r, ϑ, z) : 0 ≤ r ≤ a, 0 ≤ ϑ < 2π, r ≤ z ≤ a2 − r2 . Il momento richiesto è $ $ 2 2 r2 · r dr dϑ dz (x + y ) dx dy dz = I= E
Z
2π
Z
3
r
dϑ
= 0
Ra
Z
a
0
√ a2 −r2
E′
Z
dz dr = 2π
r
0
a
√ r3 ( a2 − r2 − r) dr = 2π(I1 − I2 ),
dove I2 = 0 r4 dr = a5 /5. Per calcolare I1 , operiamo la sostituzione u = a2 − r2 , da cui du = −2r dr. Si ha così Z a √ Z 2 √ 1 0 2 1 2 2 √ 3 2 √ 5 u=a 3 2 2 I1 = r a − r dr = − a u − (a − u) u du = u 2 a2 2 3 5 u=0 0 2 5 1 2 3 1 5 a. = aa − a = 3 5 15
Vista a pagina 493. calcolare l’integrale su E′ sfruttiamo la formula di riduzione (12): si noti che E′ è semplice rispetto alla terza variabile.
Per
Esercizi
509
In totale il momento di inerzia del solido è I = 2πa5 (−1/5 + 2/15) = −2/15πa5 .
✎ Diamoci da fare. . . (Soluzioni a pagina 637) 1 Sia f : R = [a, b] × [c, d] → R una funzione continua. Dimostrare che esiste un punto (ξ, η) ∈ R per cui " f (x, y) dx dy = f (ξ, η) Area(R) .
(b)
(Suggerimento: utilizzare il teorema dei valori intermedi.)
(d)
R
2
2 Sia f : R → R una funzione continua. Dimostrare che, se R = [x, x + ∆x] × [y, y + ∆y] allora R f (x, y) dx dy R lim = f (x, y). (∆x,∆y)→(0,0) Area(R) (Suggerimento: utilizzare l’Esercizio 1 .) 3 Dimostrare il Teorema (IX.5). 4 Dimostrare che una funzione limitata f : R → R è integrabile sul rettangolo R con integrale I se e soltanto se, comunque fissato ε > 0 esiste una partizione Pε del rettangolo tale che −ε < s(Pε ) − I ≤ S(Pε ) − I < ε. 5 Dimostrare che una funzione limitata f : R → R è integrabile sul rettangolo R con integrale I se e soltanto se, comunque fissato ε > 0 esiste una partizione Pε del rettangolo tale che S(Pε ) − s(Pε ) < ε.
(a)
(c)
(e)
R 4 R 12x 0
3x2
0
2x √
R 1 R 3x R2R
f (x, y) dy dx;
4−x2 2
1− x4 √ 2 R 4x−x2
0
R
f (x, y) dy dx;
1
0
R4R
√
f (x, y) dy dx; f (x, y) dy dx;
8x
√ f (x, y) dy dx; 4x−x2 0 R 1 R 1−y (f) 0 √ 2 f (x, y) dx dy; − 1−y R 1 R √3−y2 f (x, y) dx dy; (g) 0 y2 /2 R π R sin x (h) 0 0 f (x, y) dy dx.
b 8 Calcolare i seguenti integrali doppi ! x cos y dx dy, D = {(x, y) : 0 ≤ x ≤ 1, 0 ≤ y ≤ (a) D x2 }; ! p x y2 − x2 dx dy, D = {(x, y) : 0 ≤ y ≤ 1, 0 ≤ (b) D x ≤ y}; ! 2 ex dx dy, D = {(x, y) : 0 ≤ x ≤ 1, 0 ≤ y ≤ x}; (c) !D √ (x + y) dx dy, D delimitato da y = x2 e y = x; (d) D ! xey dx dy, D è il triangolo di vertici (0, 0), (4, 0), (e) D (2, 2); ! x dx dy, D = {(x, y) : y ≥ −x + 2, x2 + (y − 1)2 ≤ (f) D 1}; ! ex/y dx dy, D = {(x, y) : 0 ≤ y ≤ 1, 0 ≤ x ≤ y2 }; (g) !D x (h) dx dy, D è la regione compresa tra la D x2 +y2 parabola y = x2 /2 e la retta y = x; ! 2 x dx dy, D = {(x, y) : 1 ≤ x ≤ 2, x1 ≤ y ≤ x}. (i) D y2
b 6 Calcolare i seguenti integrali iterati e integrali doppi su rettangoli. ! xyey dx dy, R = {(x, y) : 0 ≤ x ≤ 1, 0 ≤ y ≤ 2}; (a) D ! (x3 y2 − 4x2 y) dx dy, R = {(x, y) : 0 ≤ y ≤ 3, 0 ≤ (b) D x ≤ 1}; ! sin(x + 3y) dx dy, R = {(x, y) : 0 ≤ y ≤ π/3, 0 ≤ (c) D x ≤ π}; 9 Dimostrare il Teorema (IX.13). ! (y cos xy) dx dy, R = [−π/4, π/4] × [0, 1]; (d) D K 10 Dimostrare che un insieme D ha misura di Peano– R1R4 Jordan nulla se e soltanto se per ogni ε > 0 esiste un nu(e) 0 2 e2x+y dx dy; mero finito di rettangoli (o triangoli, o poligoni) R1 ,. . . , R 1 R √3 2 1+x (f) −1 0 1+y RN la cui unione contiene D la cui area totale sia infe2 dy dx; riore a ε. (Suggerimento: utilizzare il criterio enunciato R2R2 √ (g) 0 0 x + y dx dy; nell’Esercizio 4 .) R2 R1 2 2 K 11 Dimostrare che un insieme D è misurabile secondo (h) −2 −1 (x + y ) dy dx. Peano–Jordan se e soltanto se la sua frontiera ha mio 7 Disegnare i domini ai quali si riferiscono gli integrali sura nulla. (Suggerimento: utilizzare il criterio enunciato seguenti e invertire l’ordine di integrazione. nell’Esercizio 5 insieme all’Esercizio precedente.)
510
Integrali multipli
K 12 Dimostrare che il grafico di una funzione continua o 18 Disegnare la regione di integrazione e calcolare 1 : [a, b] → R ha misura di Peano–Jordan nulla. (Suggli integrali iterati; se necessario, invertire l’ordine di gerimento: utilizzare i criteri enunciati negli Esercizi 5 e integrazione. R 1 R ey √ 10 .) (a) 0 y x dx dy; R R K 13 Dimostrare che una funzione limitata su un ret1 3 2 (b) 0 3y ex dx dy; tangolo che sia continua al di fuori di insieme di area R1R1 nulla è integrabile. (Suggerimento: utilizzare i criteri (c) 0 x2 x3 sin(y3 ) dy dx; enunciati negli Esercizi 5 e 10 , insieme al Teorema di R3R9 Heine–Cantor (VII.30) sull’uniforme continuità.) (d) 0 y2 y cos(x2 ) dx dy. K 14 Dimostrare che se D1 e D2 sono insiemi misurabili K 19 Sia D un insieme misurabile e f continua su D. Si la cui intersezione ha misura nulla, allora una funziodimostri che: ne integrabile singolarmente su D1 e D2 è integrabile su se D è simmetrico rispetto all’asse x, ovvero (x, y) ∈ D1 ∪ D2 . Inoltre l’integrale sull’unione dei domini è la D ⇔ (x, −y) ∈ D e f è! dispari in y, ovvero somma dei due integrali: f (x, y) = − f (x, −y), risulta D f (x, y) dx dy = 0; " se D è simmetrico rispetto all’asse y, ovvero (x, y) ∈ f (x, y) dx dy D ⇔ (−x, y) ∈ D e f ! è dispari in x, ovvero D1 ∪D2 " " f (x, y) = − f (−x, y), risulta D f (x, y) dx dy = 0. = f (x, y) dx dy + f (x, y) dx dy. D1 D2 o 20 Con riferimento al dominio D in figura, esprimere D come unione di regioni semplici. Sfruttando (Suggerimento: si scriva la funzione come somma, f = l’Esercizio 19 , calcolare l’integrale fD1 + fD2 − fD1 ∩D2 .) " xy dx dy. 15 Si chiama valore medio della funzione f nel D dominio D il valore " 1 f (x, y) dx dy. Area(D) D Calcolare il valore medio della funzione f (x, y) = xy2 in D = [0, 1] × [0, 1]. 16 Calcolare il valore medio del quadrato della distanza tra il punto di coordinate (x, y) del cerchio (x − a)2 + y2 ≤ R2 e l’origine. b 17 Calcolare il volume del solido S dato. (a) S è il solido sotto z = x2 + y2 e sopra la regione del piano xy delimitata dalle curve y = x2 e x = y2 ; (b) S è il solido sotto z = xy e sopra il triangolo di vertici (1, 1, 0), (4, 1, 0) e (1, 2, 0); (c) S è il solido sotto z = 9−x− y e sopra la regione del piano xy delimitata dalle curve y = x e x = y2 − y;
Figura IX.44 (d) S è il solido delimitato dai piani x = 0, y = 0, z = 0 e x + y + z = 1; b 21 Calcolare gli integrali passando a coordinate polari. ! 2 2 (e) S è il solido delimitato dal cilindro x + y = 1 e xy dx dy, D è il disco di centro l’origine e (a) D dai piani y = z, z = 0 con z ≥ 0; raggio 3; ! p (b) x2 + y2 dx dy, D = {(x, y) ∈ R2 : 1 ≤ x2 + y2 ≤ (f) S è il solido delimitato dai cilindri x2 + y2 = 4 e D 2 2 y + z = 4. 4}
Esercizi
!
511
2
2
e−x −y dx dy, D è la regione delimitata da x = pD 4 − y2 e x = 0; ! x dx dy, D è la regione compresa tra x2 + y2 = 4 (d) D 2 e x + y2 − 2x = 0; ! y dx dy, D = {(x, y) ∈ R2 : x2 + y2 − 6x ≤ 0, y ≥ (e) D 0}. (c)
24 Calcolare l’integrale doppio " r y2 x2 1 − 2 − 2 dx dy a b D nella regione D delimitata dall’ellisse x2 /a2 + y2 /b2 = 1, usando il cambio di coordinate x/a = r cos ϑ e y/b = r sin ϑ.
b 22 Usando le coordinate polari calcolare il volume del o 25 Trasformare solido S dato. Z 4 Z 3x f (x, y) dy dx (a) S è la regione compresa tra il cilindro di equazione 0 x x2 + y2 = t2 e la sfera x2 + y2 + z2 = R2 , con R > t. con le nuove variabili u = x + y, uv = y. (b) S è il solido sopra al disco del piano xy descritto da x2 + y2 ≤ 9 e sotto z = x2 + y2 ; (c) S è il solido che appartiene sia al cilindro di equazione x2 + y2 = 1 che all’ellissoide 4x2 + 4y2 + z2 = 64;
26 Disegnare i domini le cui aree si esprimono con gli integrali Z Z Z Z √ x+2
2
dx
1−y2
1
dy,
dx.
dy
(d) S è il solido delimitato dal paraboloide z = 4 − x2 − y2 e dal piano z + y + x = 1
Calcolare le aree.
(e) S è il solido dentro la sfera x2 + y2 + z2 = 16 e fuori dal cilindro x2 + y2 = 4.
27 Calcolare l’area dell’ellisse (y − x)2 + x2 = 1.
✩ 23 Nell’approssimazione di Fraunhofer, valida per grandi distanze focali, l’intensità dell’onda diffratta da un’apertura circolare piana D di diametro d, nel punto (x, y) del piano dell’immagine è data dal quadrato del modulo dell’integrale doppio esteso all’apertura: Z Z 2iπ (xs+yt) Ψ(x, y) = e λf ds dt , D
dove λ è la lunghezza dell’onda ed f la distanza focale.
Figura IX.45 Si dimostri che il valore dipende soltanto dal raggio p R = x2 + y2 e che Z
d/2
Z
2π
Ψ(R) = 0
0
! 2πrR r cos sin(ϑ) dϑ dr . λf
−1
x2
0
1−y
✩ 28 Calcolare l’area della figura limitata dalla curva !2 y2 x2 x2 y2 + − . = 4 9 4 9 29 Calcolare l’area del quadrilatero curvilineo limitato dagli archi di parabola x2 = ay, x2 = by, y2 = cx e y2 = dx (0 < a < b, 0 < c < d). 30 Usare la trasformazione data per calcolare l’integrale. ! (3x + 4y) dx dy, dove D è la regione delimitata (a) D dalle rette y = x, y = x − 2, y = −2x e y = −2x + 3. La trasformazione è: x = 13 (v − u), y = 31 (v + 2u); ! x2 dx dy, dove D è la regione delimitata dall’el(b) D lisse 9x2 + 4y2 = 36. La trasformazione è: x = 2u, y = 3v; ! xy dx dy, dove D è la regione del primo qua(c) D drante delimitata dalle rette y = x, y = 3x, e dalle iperboli xy = 1 e xy = 3. La trasformazione è: x = u/v, y = v. 31 Calcolare l’area della regione √ D = {(x, y) : y ≥ 3(x − 1), x2 + y2 ≥ 1, (x − 1)2 + y2 ≤ 1}.
512
Integrali multipli
o 32 Calcolare l’integrale sfruttando un opportuno 41 Calcolare il momento d’inerzia rispetto all’asse x di cambiamento di variabili. un triangolo limitato dalle rette x + y = 2, x = 2, y = 2. ! xy dx dy, dove D è la regione del primo delimi(a) 42 Calcolare lo jacobiano della trasformazione in D tata dalle rette 2x − y = 1, 2x − y = −3, 3x + y = 1 coordinate sferiche. e 3x + y = −2; ! b 43 Calcolare i seguenti integrali tripli. ex+y dx dy, dove D è la regione descritta dalla (b) # D x2 dx dy dz dove E = {0 ≤ x ≤ 2, 0 ≤ y ≤ (a) disuguaglianza |x| + |y| ≤ 1; E y−x 2x, 0 ≤ z ≤ x}; ! # cos x+y dx dy, dove D è il trapezio di vertici (c) D y dx dy dz dove E è il tetraedro delimitato dai (b) E (1, 0), (2, 0), (0, 2), (0, 1). piani x = 0, y = 0, z = 0, x + 3y + z = 4; # z2 dx dy dz dove E è delimitato dal para(c) 33 Determinare la massa di una lamina circolare di E raggio R sapendo che la sua densità è proporzionale alla boloide x = 1 − y2 − z2 e dal piano x = distanza dal centro della lamina, e vale δ sull’orlo della 0; # lamina. z dx dy dz dove E è la regione solida che (d) E
34 Calcolare il baricentro di una lamina omogenea di densità costante che occupa la regione D, per ciascuno dei domini seguenti.
(a) D è il triangolo rettangolo di vertici (0, 0), (a, 0) e (0, b); (b) D è un settore circolare di angolo 2α e raggio R;
soddisfa x2 + y2 + z2 ≤ 3 e x2 + y2 ≤ 2z; # dx dy dz dove E è la regione delimitata dalle (e) E superfici x2 + y2 +z2 = 2z e x2 + y2 = z2 che contiene il punto (0, 0, 1); # 3xy2 z3 dx dy dz dove E = {(x, y, z) : 0 ≤ x ≤ (f) E 1, 0 ≤ z ≤ x, 0 ≤ y ≤ xz}.
(c) D è limitato dalle parabole y2 = 4x + 4 e y2 = b 44 −2x + 4; (a) 2 (d) D è il segmento di parabola y = x limitato dalla (b) retta x = 1. 35 Per ciascuna delle regioni D dell’Esercizio 20 calcolare il baricentro di una lamina omogenea di densità costante che occupa la regione D.
Calcolare il volume del corpo E. E è limitato dalle superfici x = −3 e x = 1 − y2 − z2 ;
E è il tetraedro che ha per vertici l’origine e i punti (0, 0, −2), (2, 0, 0) e (0, 2, 0);
(c) E è delimitato dal cilindro x2 + y2 = 4 e dai piani z = y e z = 3y; (d) E è la regione limitata dalle superficie x2 + 4y2 = z2 e z = ±1.
36 Sia D la regione delimitata dalla cardioide di equazione r = a(1 + cos ϑ). Calcolare il baricentro di una o 45 Indicare i limiti di integrazione dell’integrale triplo $ lamina omogenea che ha la forma di D. f (x, y, z) dx dy dz E 37 In una lamina quadrata di lato a la densità è proporzionale al quadrato della distanza da uno dei suoi dove E è il tetraedro delimitato dal piano x + y + z = 1 vertici, detto A. Calcolare il momento d’inerzia della e dai piano coordinati. Scrivere poi altri due integrali piastra rispetto a uno dei lati che passa per A. iterati equivalenti. 38 Calcolare il momento d’inerzia di un quadrato di o 46 Esprimere l’integrale iterato lato 3 rispetto all’asse che passa per uno dei suoi vertici Z 1 Z √1−x2 Z y+1 ed è perpendicolare al piano del quadrato. f (x, y, z) dz dy dx. −1 0 −2 39 Calcolare il momento d’inerzia di una corona circolare di raggio interno r e esterno R rispetto al suo centro come integrale triplo. Scrivere poi altri due integrali e rispetto a un suo diametro. iterati equivalenti. # dx dy dz dove E è il solido racchiu47 Calcolare 40 Calcolare i momenti di inerzia rispetto agli assi di E so dall’ellissoide x2 /a2 + y2 /b2 + z2 /c2 = 1, usando la una corona circolare di densità costante ρ, di centro trasformazione x = au, y = bv, z = cw. l’origine e raggi 1 e 2.
Esercizi
513
48 La forma della Terra può essere approssimata con un ellissoide avente semiassi a = b = 6378Km e c = 6356Km. Usare l’esercizio precedente per stimare il volume della Terra.
55 Calcolare baricentro e momento di inerzia rispetto all’asse y delle regioni solide disegnate nelle seconda riga della Figura IX.46.
49 Integrando la funzione 1, calcolare il volume del o 56 Disegniamo su un foglio rette parallele a distanza tetraedro delimitato dai piano coordinati e dal piano d > 0 tra loro. Un ago di lunghezza l < d viene lanciato x + y + z = 1. sul foglio. 50 Calcolare il volume della regione E interna al cilindro x2 + y2 = 1, compresa tra il paraboloide z = x2 + y2 −2 e il piano x + y + z = 4. K 51 (Teorema di Pappo) Sia T un insieme limitato di area finita contenuto nel piano x = 0. Sia E il solido che si ottiene facendo ruotare T di un angolo giro intorno all’asse z. Mostrare che vale la formula
Calcolare la probabilità che l’ago intersechi una retta.
Volume(E) = 2π y¯ Area(T) dove y¯ è la coordinata rispetto all’asse y del centroide di T, ovvero il baricentro della lamina di densità δ(x, y) = 1 che occupa la regione piana T. o 52 Sia D = {(x, y) : x2 < y < (2 − |x|)};
(a) trovare l’area di D; (b) trovare il baricentro della lamina di densità δ(x, y) = 1 che occupa la regione D; (c) trovare il volume dei solidi Sx e S y ottenuto facendo ruotare D intorno all’asse x e all’asse y, rispettivamente.
53 Calcolare il baricentro del solido di densità costante delimitato da x = y2 e dai piani x = z e x = 1.
57 Un lampadario ha due lampadine, una rossa e una blu, i cui tempi di vita X e Y sono variabili aleatorie indipendenti con densità esponenziale di medie r e b rispettivamente. Calcolare la probabilità che le lampadine rossa bruci prima della lampadina blu. 58 Sia X una variabile aleatoria positiva con densità fX (x). Mostrare che il valore atteso di X, E[X] verifica la formula Z
+∞
P(X > x) dx.
E[X] = 0
54 Calcolare il baricentro del cono gelato e del tetraedro in Figura IX.46. 59 Siano X e Y due variabili aleatorie con funzione densità congiunta cx(x + y) f (x, y) = 0
x ≥ 0, y ≥ 0, x + y ≤ 1 altrimenti;
(a) calcolare il valore della costante c; (b) calcolare P(X ≤ 1/2).
Figura IX.46
60 Siano X, Y, Z tre variabili aleatorie uniformi su [0, 1], indipendenti. Calcolare la probabilità che X sia maggiore di YZ.
El profesor y su vida de perros. La frustración en diferentes planos. La sensación de molestia a los dientes gue produce el sonido de la tiza.(22) da “Vida de perros” (Versos da salón, 1962) N ICANOR PARRA (1914–)
C APITOLO
X Integrali su curve e superfici
Questo capitolo tratta dei teoremi fondamentali del calcolo integrale e differenziale per le funzioni a valori vettoriali (i campi di vettori). Il Teorema di Gauss–Green stabilirà una relazione di fondamentale importanza fra gli integrali curvilinei e gli integrali doppi. Introdurremo successivamente il concetto di flusso di un campo di vettori attraverso una superficie nello spazio e lo metteremo in relazione sia con l’integrale curvilineo che con gli integrali tripli. Tratteremo i Teoremi del rotore e della divergenza, che costituiscono le versioni vettoriali del Teorema fondamentale del Calcolo Integrale. Applicando tali teoremi si arriva alla formulazione differenziali delle principali leggi della fisica: dalle leggi di Gauss e Ampère alle equazio-
ni di Maxwell, dalla legge di Fourier all’equazione del calore, dalla legge della conservazione della massa all’equazione di continuità. La lettura di questo capitolo richiede di aver preliminarmente svolto nel dettaglio la teoria delle curve e delle superfici del Capitolo V, il calcolo differenziale per le funzioni di più variabili del Capitolo VI, e il calcolo integrale in due e tre variabili del Capitolo IX. È inoltre indispensabile una buona familiarità con i vettori e gli elementi di geometria del Capitolo III. La lettura del Capitolo VII è consigliata per l’introduzione e gli esercizi preliminari su rotore e divergenza, ma non è indispensabile (tali nozioni verranno opportunamente richiamate nel testo).
§ 1. Integrali curvilinei Consideriamo un filo (molto sottile) disposto lungo una curva γ, parametrizzata da r : [a, b] → R3 , e supponiamo di conoscerne la densità lineare di massa δ, variabile da punto a punto. Scelta una partizione a = t0 < t1 < t2 < · · · < tn = b dell’intervallo [a, b], immaginiamo di suddividere il filo in piccoli archi di estremi r(ti−1 ), r(ti ). Come sappiamo dalla teoria svolta nel Capitolo V, la lunghezza di ciascuno degli archi vale Z ti ∆si = kr′ (t)k dt; ti−1
Se la porzione di massa ∆m è di-
stribuita uniformemente sul tratto di filo di lunghezza ∆s, allora la densità lineare di massa è il rapporto tra la massa e la lunghezza del tratto in questione, δ = ∆m ∆s . Se invece la massa varia da punto a punto, la densità lineare in r(t0 ) è data dal limite del precedente rapporto al tendere di ∆s a zero (cfr. pag. 473).
516
Integrali su curve e superfici
Se la curva è di classe C1 , possiamo utilizzare il Teorema della media integrale e scrivere ∆si = kr′ (ξi )k (ti − ti−1 )
per opportuni punti ξi ∈ [ti−1 , ti ]. Supponiamo che δ sia una funzione continua. Possiamo allora approssimare la densità lineare nell’i–esimo tratto di curva con il suo valore nel punto r(ξi ): δ(r(t)) ≈ δ(r(ξi )),
se ti−1 ≤ t ≤ ti .
Ne segue che la massa dell’i-esimo archetto è circa ∆mi ≈ δ · ∆si ≈ δ(r(ξi )) · kr′ (ξi )k (ti − ti−1 ) ,
Sappiamo
dal Teorema (V.18), a pagina 240, che la lunghezza di una curva regolare γ, quando ne sia nota una parametrizzazione di classe C1 , è data dalla formula integrale Z b Lunghezza(γ) = kr′ (t)k dt. a
Tale formula vale anche per le curve regolari a tratti. Nel corso di questo Capitolo tratteremo esclusivamente tale classe di curve.
da cui
massa(γ) ≈
n X i=1
δ(r(ξi )) · kr′ (ξi )k (ti − ti−1 ) .
Si tratta di una somma di Riemann, che ha come limite, al tendere a zero dell’ampiezza della partizione, l’integrale Z b massa(γ) = δ(r(t))kr′ (t)k dt. a
Osserviamo come tale integrale dipenda solo dalla funzione densità δ e dalla forma del filo γ, e non dalla particolare parametrizzazione scelta, né dall’orientazione che essa induce sulla curva. In particolare scegliendo come parametrizzazione quella secondo l’ascissa curvilinea s, r¯(s) = r(t(s)), otteniamo che la formula precedente si riscrive come Z L massa(γ) = δ(r¯(s)) ds. 0
Per enfatizzare l’indipendenza dalla parametrizzazione scelta e allo stesso tempo per poter scrivere il precedente integrale senza doverne scegliere una, si utilizza la seguente scrittura: Z δ(x, y, z) ds, massa(γ) = γ
che interpretiamo come integrale della densità lungo la curva. Più in generale, date una qualunque funzione continua f : A ⊂ R3 → R ed una curva regolare a tratti γ parametrizzata da r : [a, b] → R3 , definiamo l’integrale della funzione lungo la curva come segue. (X.1) Definizione. L’integrale curvilineo di f lungo γ è Z
Z
b
f (r(t))kr′ (t)k dt
f ds = γ
Z
a b
= a
q f (x(t), y(t), z(t)) (x′ (t))2 + (y′ (t))2 + (z′ (t))2 dt.
La
dimostrazione di questo fatto è analoga a quella relativa alla lunghezza di una curva, Esercizio 10 a pagina 271).
Infatti,
posto t = t(s), possiamo cambiare di variabile nell’integrale e usare il fatto che 1 ds, dt = t′ (s) ds = ′ kr (t(s))k
si veda a tal proposito l’equazione (1) a pagina 242. Osserviamo che in quest’ultima formula compaiono solo la curva γ e l’ascissa curvilinea s, che è un parametro intrinseco della curva, e non la parametrizzazione. È chiaro però che per calcolare l’integrale è necessario sostituire (x(t), y(t), z(t)) al posto di (x, y, z) e kr′ (t)k dt al posto di ds.
Ovviamente stiamo supponendo γ ⊂ A. A volte questo integrale viene detto integrale curvilineo di prima specie. Rimarchiamo ancora una volta che, dal punto di vista operativo, la formula fondamentale è ds = kr′ (t)k dt.
§ 1. Integrali curvilinei
517
(X.2) Esempio. Calcoliamo l’integrale curvilineo Z x2 y ds, γ
dove γ = {(x, y) ∈ R2 : x2 + y2 = 4, y ≥ 0}, cioè la semicirconferenza nel piano xy centrata nell’origine, di raggio 2 sopra l’asse delle x. Usiamo per γ la parametrizzazione, sicuramente regolare, r(t) = 2 cos t i+2 sin t j, t ∈ [0, π]. Otteniamo kr′ (t)k ≡ 2, perciò Z π Z Z 32 16 π d 3 2 2 cos t dt = (2 cos t) · (2 sin t) · 2 dt = − x y ds = . 3 0 dt 3 0 γ
Se
γ è una curva piana e f un campo scalare piano, l’integrale da calcolare si riduce a Z b q f (x(t), y(t)) (x′ (t))2 + (y′ (t))2 dt. a
Una volta introdotto l’integrale curvilineo, risulta chiaro che la formula per il calcolo della lunghezza di una curva è solo un suo caso particolare, quando la funzione integranda vale identicamente 1: Z ds, Lunghezza(γ) = γ
in perfetta analogia con quanto visto per le aree di figure piane (a pagina 466) ed i volumi di solidi, espressi in termini di integrali doppi e tripli della funzione unitaria.
Applicazioni dell’integrale curvilineo Nell’affrontare le applicazioni dell’integrale doppio alla meccanica (Capitolo IX, § 5), abbiamo visto uno schema di ragionamento piuttosto generale che permette, date delle formule che valgono per problemi “discreti” (cioè che coinvolgono un numero finito di masse puntiformi), di generalizzarle a situazioni “continue” (cioè, ad esempio, ad una densità di massa distribuita su un oggetto bidimensionale). Abbiamo così ottenuto delle formule per il baricentro ed i momenti di inerzia di lamine piane, mediante integrali doppi che coinvolgono la densità superficiale di massa. Come è ragionevole attendersi, nel caso la massa non sia distribuita su lamine ma su fili,tali formule mantengono la loro validità a patto di sostituire gli integrali doppi con integrali curvilinei. Torniamo dunque a considerare un filo disposto lungo la curva γ ⊂ R3 avente densità lineare di massa δ(x, y, z). Come già detto la massa totale del filo è data da Z δ(x, y, z) ds. massa = γ
¯ y, ¯ z¯) del baricentro sono allora date da Le coordinate (x, R R R xδ(x, y, z) ds yδ(x, y, z) ds zδ(x, y, z) ds γ γ γ (1) x¯ = R y¯ = R z¯ = R . δ(x, y, z) ds δ(x, y, z) ds δ(x, y, z) ds γ γ γ
F X.1: interpretazione geometrica dell’integrale curvilineo nel caso delle curve piane: si tratta dell’area della superficie verticale che si proietta sulla curva γ ed è limitata dal grafico della funzione f . Si veda anche l’Esercizio (X.9).
Consideriamo
n masse puntiformi mi , situate in (xi , yi , zi ), con i = 1, . . . , n, ed una certa quantità, che sarà ad esempio un momento di inerzia, un potenziale, che dipenda da massa e posizione come n X f (xi , yi , zi )mi . i=1
Allora la quantità corrispondente, per una densità lineare di massa δ(x, y, z) distribuita lungo una curva γ, è data da Z f (x, y, z)δ(x, y, z) ds. γ
518
Integrali su curve e superfici
(X.3) Esempio. Supponiamo che due masse, entrambe uguali ad m, siano distribuite uniformemente rispettivamente su un filo disposto lungo una semicirconferenza di raggio R e su una lamina che occupa un semicerchio di ugual raggio. Ci chiediamo quale delle configurazioni ha il baricentro più vicino al centro del cerchio. Traduciamo in termini matematici il problema: se pensiamo che il semicerchio in questione sia centrato nell’origine del piano xy e contenuto nel semipiano delle y positive, abbiamo che le due configurazioni, da un punto di vista geometrico, corrispondono rispettivamente alla curva n o γ = (x, y) ∈ R2 : x2 + y2 = R2 , y ≥ 0 e alla regione piana n o D = (x, y) ∈ R2 : x2 + y2 ≤ R2 , y ≥ 0 . Dato che la massa è distribuita uniformemente, la densità di massa è costante in entrambi i casi, perciò le coordinate del baricentro (in questo caso centroide) non dipendono dalla densità ma solo dalla geometria della configurazione. Per quanto riguarda il filo, possiamo parametrizzare γ mediante r(t) = R cos t i + R sin t j, con 0 ≤ t ≤ π. Otteniamo r′ (t) = −R sin t i + R cos t j, da cui ds = kr′ (t)k dt = R dt e quindi R Rπ x ds R cos t · R dt R2 [sin π − sin 0] γ = = 0 Rπ x¯γ = R =0 πR ds R dt γ
e
R γ
y¯ γ = R
0
Rπ
y ds
γ
= ds
0
R sin t · R dt R2 [− cos π + cos 0] 2R Rπ = = . πR π R dt 0
Per quanto riguarda invece la lamina, abbiamo che D è un rettangolo polare , perciò in base alla Proposizione (IX.32) a pagina 483, RπR R ! x dx dy r cos ϑ · r dr dϑ x¯D = !D = 0 R0 π R R dx dy r dr dϑ D 0 0 R3 /3 [sin π − sin 0] = 0, πR2 /2 R πRR ! r sin ϑ · r dr dϑ y dx dy = 0 R0 π R R y¯ D = !D dx dy r dr dϑ D 0 0 =
=
R3 /3 [− cos π + cos 0] 4R . = 3π πR2 /2
Ne deduciamo che il semicerchio ha il baricentro più vicino al suo centro che la semicirconferenza.
Se δ è costante si ha, per esempio, R
γ
x¯ = R
δ
xδ ds
γ
R
= δ ds
δ
γ
R
x ds
γ
ds
R
γ
= R
x ds
γ
ds
,
e lo stesso vale anche per le altre coordinate (sia quando gli integrali sono curvilinei che doppi). A partire dalla massa avremmo anche potuto calcolare le densità, rispettivamente lineare e superficiale, che valgono m m = δγ = Lunghezza(γ) πR e m 2m δD = . = Area(D) πR2
Dato
che entrambe le configurazioni sono simmetriche rispetto all’asse delle y, avremmo potuto dedurre che la coordinata x di entrambi i baricentri è nulla senza fare alcun calcolo. Allo stesso modo, gli integrali a denominatore rappresentano lunghezze ed aree di figure geometriche elementari, perciò avremmo potuto calcolarli usando le ben note formule.
§ 2. Integrali curvilinei di campi vettoriali
519
Analoghe generalizzazioni valgono anche per le formule dei momenti di inerzia. (X.4) Esempio. Calcoliamo il momento d’inerzia rispetto all’asse z Z x2 + y2 δ(x, y, z) ds Iz = γ
dell’elica circolare r(t) = cos t i + sin t j + t k, t ∈ [0, 2π], avente densità √ ′ di massa costante δ(x, y, z) ≡ 1. Si ha ds = kr (t)k dt = 2 dt (si veda l’Esempio (V.20) a pagina 240), perciò Z 2π √ √ Iz = (cos2 t + sin2 t) · 1 · 2 dt = 2 2π.
Il momento
di inerzia rispetto ad un asse di una distribuzione di masse P puntiformi è dato da i r2i mi , dove ri rappresenta la distanza dell’i–esima massa dall’asse. Nel casoqdell’asse z si ha ovviamente ri = x2i + y2i , il che giustifica la formula che usiamo.
0
§ 2. Integrali curvilinei di campi vettoriali In fisica si definisce il lavoro compiuto dalla forza costante F agente su una particella lungo uno spostamento rettilineo dalla posizione r1 alla posizione r2 come il prodotto scalare della forza con lo spostamento: lavoro = F · (r2 − r1 ).
Ora che siamo in possesso di una teoria consistente per le curve in R3 (e in particolare dell’integrale curvilineo) siamo in grado di estendere questa definizione al caso in cui la forza non sia necessariamente costante, né la traiettoria rettilinea. Supponiamo che F sia una funzione continua della posizione e che la curva r sia regolare. Come al solito, suddividiamo lo spostamento in piccoli tratti che siano approssimativamente rettilinei e sui quali la forza si possa considerare costante: ciò significa fissare una partizione a = t0 < t1 < t2 < · · · < tn = b dell’intervallo [a, b], e approssimare il lavoro compiuto lungo lo spostamento da r(ti−1 ) a r(ti ) con (lavoro)i ≈ F(r(ti−1 )) · (r(ti ) − r(ti−1 )) ; se r è derivabile con continuità e l’ampiezza della partizione è sufficientemente piccola, tale lavoro può essere ancora approssimato con (lavoro)i ≈ F(r(ti−1 )) ·
r(ti ) − r(ti−1 ) (ti − ti−1 ) ≈ F(r(ti−1 )) · r′ (ti−1 )(ti − ti−1 ) ti − ti−1
e dunque il lavoro totale con la somma di Riemann lavoro ≈
n X i=1
F(r(ti−1 )) · r′ (ti−1 )(ti − ti−1 ).
Passando infine al limite al tendere a zero dell’ampiezza della suddivisione otteniamo l’espressione integrale Z b lavoro = F(r(t)) · r′ (t) dt. a
Si
veda il ragionamento utilizzato nella dimostrazione del Teorema (V.18) a pagina 383.
520
Integrali su curve e superfici
Ancora una volta è di immediata verifica il fatto che l’integrale ottenuto non dipende dalla particolare parametrizzazione di γ che abbiamo scelto, a patto che percorra la curva da r(a) a r(b) e non viceversa. Scegliamo quindi la parametrizzazione secondo l’ascissa curvilinea r¯(s) = r(t(s)), 0 ≤ s ≤ L. Cambiando di variabile nell’integrale otteniamo Z
L
lavoro = 0
r′ (t(s)) ds = F(r¯(s)) · ′ kr (t(s))k
Z
L 0
F(r¯(s)) · T(s) ds,
dove T(s) indica il versore tangente a γ in r¯(s) (si veda la Definizione (V.9) a pagina 234). Dato un campo vettoriale F : A ⊂ R3 → R3 e una curva regolare a tratti γ parametrizzata da r : [a, b] → R3 , possiamo dare la seguente definizione. (X.5) Definizione. Il lavoro compiuto da F per spostare un punto materiale lungo γ da r(a) a r(b) (detto anche integrale curvilineo di seconda specie di F lungo la curva)si definisce come Z
Z γ
F · T ds = Z
b
F(r(t)) · r′ (t) dt
a b
= a
F1 x(t), y(t), z(t) · x′ (t) + F2 x(t), y(t), z(t) · y′ (t)+ +F3 x(t), y(t), z(t) · z′ (t) dt
dove T è il versore tangente a γ. Nel caso in cui γ sia una curva chiusa, l’integrale precedente viene anche detto circuitazione di F lungo γ, e indicato con il simbolo I F · T ds. γ
Per gli integrali curvilinei di seconda specie si usano anche le notazioni seguenti Z
Z γ
(2)
F · T ds =
Z
γ
F · dr F1 (x, y, z) dx + F2 (x, y, z) dy + F3 (x, y, z) dz .
= γ
⊚ ATTENZIONE! L’ultima notazione va utilizzata con cautela. L’espressione Z 1(x, y, z) dx γ
In
effetti l’integrale è lo stesso per diverse parametrizzazioni aventi la stessa orientazione; è lo stesso in valore assoluto ma cambia invece di segno su parametrizzazioni che invertono l’orientazione. Si veda a tal proposito l’Esercizio 4 a pagina 564.
Ricordiamo ancora una volta che, dall’equazione (1) a pagina 242, dt = t′ (s) ds =
1 ds. kr′ (t(s))k
Stiamo ovviamente supponendo γ ⊂ A. Mentre l’integrale curvilineo di prima specie non dipende dalla parametrizzazione, perciò viene calcolato semplicemente su delle curve, quello di seconda specie dipende dal verso di percorrenza, perciò è ben definito su delle curve orientate.
§ 2. Integrali curvilinei di campi vettoriali
521
indica infatti l’integrale curvilineo che, data una parametrizzazione della curva γ, si calcola come Z b 1(x(t), y(t), z(t))x′(t) dt , a
ed è dunque un numero reale. Occorre porre attenzione a non confondere l’integrale curvilineo con l’integrale (dipendente dai parametri y e z) Z b A(y, z) = 1(x, y, z) dx , a
che interviene nell’integrazione multipla, e che è invece una funzione di due variabili. (X.6) Esempio. Dato il campo piano F(x, y) = y2 i + 2xy j, calcoliamo il lavoro compiuto da tale campo per spostare un punto materiale (nel piano) da (0,0) ad (1,1) quando la traiettoria è ➔ il segmento γ1 sulla retta di equazione y = x;
Se γ è una curva piana e F un campo vettoriale piano, l’integrale da calcolare si riduce a Z b F1 (x(t), y(t)) · x′ (t)+ a
+F2 (x(t), y(t)) · y′ (t) dt.
➔ l’arco γ2 sulla parabola di equazione y = x2 . Possiamo parametrizzare γ1 come r1 (t) = t i + t j, t ∈ [0, 1]. Otteniamo r′ (t) = i + j, da cui Z 1 Z 1 Z 2 3t2 dt = 1. (t , 2t · t) · (1, 1) dt = F · T ds = γ1
0
0
Per quanto riguarda γ2 , la sua parametrizzazione naturale è data da r2 (t) = t i + t2 j, t ∈ [0, 1], da cui r′ (t) = i + 2t j e Z 1 Z 1 Z 2 2 2 (t ) , 2t · t · (1, 2t) dt = F · T ds = 5t4 dt = 1. γ2
0
0
(X.7) Esempio. Il lavoro compiuto dal campo vettoriale F(x, y, z) = i + j + x k lungo l’elica circolare γ di parametrizzazione r(t) = cos t i + sin t j + t k, t ∈ [0, 2π], è dato da Z 2π Z (1, 1, cos t) · (− sin t, cos t, 1) dt F · T ds = γ
Z
0
2π
(− sin t + cos t + cos t) dt = 0.
= 0
Il fatto che in questo caso i due risultati siano uguali non è casuale: come vedremo nel prossimo paragrafo, la proprietà che il lavoro non dipenda dal percorso ma solo dal punto iniziale e da quello finale caratterizza una importantissima classe di campi vettoriali, i campi conservativi.
522
Integrali su curve e superfici
(X.8) Esempio (Teorema delle forze vive). Calcoliamo il lavoro compiuto dalla forza risultante su una particella di massa m che percorra la traiettoria γ con legge oraria r : [a, b] → R3 . Dalla seconda legge della dinamica la forza risultante vale F = ma = mr′′ . Il lavoro è dato da Z b Z b Z m d ′ (r (t) · r′ (t)) dt mr′′ (t) · r′ (t) dt = F · T ds = 2 dt γ a a Z b m 1 1 d 2 = (v (t)) dt = mv2 (b) − mv2 (a). 2 a dt 2 2 Come è noto, la quantità mv2 /2 è l’energia cinetica associata alla particella. Abbiamo quindi dimostrato che il lavoro compiuto dalla forza risultante lungo una certa traiettoria è uguale alla differenza tra l’energia cinetica finale e quella iniziale della particella.
Quindi
r(t) rappresenta la posizione della particella all’istante t, v(t) = kr′ (t)k la su velocità scalare e a(t) = r′′ (t) la sua accelerazione. Ovviamente r è una parametrizzazione di γ. Ricordiamo che, per le Regole (V.11) a pagina 235, d ′ (r (t) · r′ (t)) = 2r′′ (t) · r′ (t). dt
§ 3. Campi conservativi C’è una particolare classe di campi vettoriali per la quale il calcolo del lavoro diventa particolarmente semplice e significativo: si tratta dei campi gradiente, che abbiamo introdotto nell’Esempio (VI.6) a pagina 315. Sia U : A ⊂ R3 → R. Il suo campo gradiente è dato da ∇U(x, y, z) =
∂U ∂U ∂U (x, y, z) i + (x, y, z) j + (x, y, z) k. ∂x ∂y ∂z
Abbiamo visto che i corpi soggetti a tali campi di forze conservano l’energia totale. Questa importantissima proprietà giustifica la definizione di campo conservativo. (X.9) Definizione. Dato un campo vettoriale F : A ⊂ R3 → R3 , questo si dice campo conservativo se è il campo gradiente di una qualche funzione; cioè, se esiste una funzione U : A → R di classe C2 tale che ∇U(x, y, z) = F(x, y, z). In questo caso U si dice funzione potenziale di F. (X.10) Esempio. Il campo piano F(x, y) = y2 i + 2xy j che abbiamo considerato nell’Esempio (X.6) è conservativo, infatti posto U(x, y) = xy2 è immediato verificare che ∂x U = F1 e ∂ y U = F2 . Se r(t) : [a, b] → A è di classe C1 allora possiamo esprimere la derivata della funzione composta U(r(t)) : [a, b] → R come
d U(r(t)) = ∇U(r(t)) · r′ (t). dt Integrando sull’intervallo [a, b] ed applicando il Teorema Fondamentale del Calcolo integrale, troviamo dunque la seguente versione della Formula di Valutazione per gli integrali di linea:
Supponiamo che A sia un insieme (aperto e) connesso, cioè che dati due qualsiasi punti in A esista sempre una curva, tutta contenuta in A, che li congiunge (si veda anche il riquadro di approfondimento a pagina 343). L’ipotesi è ragionevole, visto che il nostro scopo è calcolare integrali curvilinei di F. La funzione potenziale è definita a meno di una costante additiva: se U è un potenziale, anche U + C, con C ∈ R, lo è. Ovviamente un campo piano F(x, y) è conservativo se esiste una funzione U(x, y) tale che ∇U = F. Stiamo usando le Regole (V.11) a pagina 235.
§ 3. Campi conservativi
523
(X.11) Il lavoro compiuto da un campo conservativo continuo ∇U lungo una curva regolare a tratti γ è uguale alla variazione della funzione potenziale agli estremi della curva: Z ∇U · T ds = U(r(b)) − U(r(a)). γ
Si ha infatti Z
γ
Z
∇U · T ds =
Z
b a
∇U(r(t)) · r′ (t) dt
b
d U(r(t)) dt = U(r(b)) − U(r(a)). dt Se γ1 , γ2 sono due curve aventi gli stessi estremi (nell’ordine) P e Q, allora =
Ne segue che l’integrale non dipende direttamente da γ, ma solo dai suoi estremi. (X.12) Esempio. Ritorniamo al campo vettoriale F = i + j + x k dell’Esempio (X.7). Abbiamo già visto che il lavoro compiuto da F lungo l’elica γ dell’esempio in questione è nullo. D’altra parte, gli estremi dell’elica sono rispettivamente (1, 0, 0) e (1, 0, 2π). Consideriamo il segmento γ˜ che congiunge tali punti, avente parametrizzazione r(t) = i + t k, con t ∈ [0, 2π]. Otteniamo Z 2π Z 2π Z F · T ds = (1, 1, 1) · (0, 0, 1) dt = 1 dt = 2π γ˜
0
a
lavoro(γ1 ) = U(Q)−U(P) = lavoro(γ2 ).
0
che non è nullo. Da quanto detto segue che F non è conservativo.
Due problemi sono di fondamentale importanza: ➔ come riconoscere se un campo è conservativo? ➔ una volta riconosciuto che un campo è conservativo, come ricavarne un potenziale? Prenderemo in considerazione la prima questione, particolarmente delicata, nella parte finale di questo paragrafo. La chiave per analizzare entrambi i problemi risiede nel seguente risultato. (X.13) Teorema. Sia F : A ⊂ R3 → R3 un campo vettoriale di classe C1 . Le seguenti affermazioni sono equivalenti: ① F è conservativo (cioè ammette una funzione potenziale); ② date due curve γ1 e γ2 contenute in A e aventi gli stessi estremi (nell’ordine) si ha Z Z F · T ds; F · T ds = γ1
γ2
③ data una qualunque curva chiusa γ ⊂ A la sua circuitazione è nulla: I F · T ds = 0. γ
La dimostrazione completa di questo Teorema si trova nell’approfondimento a pagina 526.
524
Integrali su curve e superfici
In effetti la discussione che inizia questo paragrafo è la dimostrazione che la prima affermazione implica la seconda. Il metodo per la costruzione del potenziale, che stiamo per dare, dimostra invece il viceversa. (X.14) Esempio. Consideriamo il campo F(x, y, z) = 2xy sin z i + x2 sin z j + x2 y cos z k, e supponiamo di sapere che è conservativo. Indichiamo con U un suo potenziale, incognito e definito a meno di una costante additiva. Se consideriamo una qualunque curva γ il cui primo estremo sia (a mo’ d’esempio) l’origine O = (0, 0, 0) ed il secondo il generico punto P = (x, y, z), da quanto detto deduciamo che Z F · T ds dove γ congiunge O a P. U(x, y, z) − U(0, 0, 0) = γ
Dato che l’integrale non dipende dal percorso, possiamo scegliere una particolare γ e calcolare il secondo membro. Per comodità scegliamo come percorso una spezzata con lati paralleli agli assi. Per la precisione, costruiamo γ come giustapposizione di tre segmenti γ1
γ2
F X.2
γ3
(0, 0, 0) −→ (x, 0, 0) −→ (x, y, 0) −→ (x, y, z), (si veda la Figura X.2). Possiamo parametrizzare γ1 come r1 (t) = t i, con t ∈ [0, x]. Otteniamo r1′ (t) = i da cui Z x Z (0, 0, 0) · (1, 0, 0) dt = 0. F · T ds = γ1
Nel
calcolo di questo e dei prossimi integrali, la variabile di integrazione è t mentre x, y e z sono pensate come costanti.
0
Allo stesso modo possiamo parametrizzare γ2 come r2 (t) = x i + t j, con t ∈ [0, y], ottenendo Z y Z 0, 0, x2t · (0, 1, 0) dt = 0, F · T ds = γ2
0
e γ3 come r3 (t) = x i + y j + t k, con t ∈ [0, z], da cui Z z Z 2xy sin t, x2 sin t, x2 y cos t · (0, 0, 1) dt F · T ds = γ3
0
Z
z
= x2 y 0
cos t dt = x2 y [sin t]z0 = x2 y sin z.
Dato che γ = γ1 ∪ γ2 ∪ γ3 possiamo sommare i tre contributi ottenendo Z F · T ds = x2 y sin z. U(x, y, z) − U(0, 0, 0) =
Ovviamente la procedura descrit-
ta funziona solo se il campo in questione è conservativo. Se in via di esempio provassimo ad applicarla al campo F = i + j + x k dell’Esempio (X.12) otterremmo Z x Z (1, 1, t)·(1, 0, 0) dt = x, F·T ds = γ1
2
U(x, y, z) = x y sin z + C ,
con C costante arbitraria.
y
(1, 1, x)·(0, 1, 0) dt = y,
F·T ds = Z
γ2
γ
In definitiva, dato che U(0, 0, 0) è costante possiamo scrivere
0
Z
Z
0
Z
γ3
z
(1, 1, x)·(0, 0, 1) dt = xz,
F·T ds = 0
e quindi U(x, y, z) = x+y+xz+C. Però ∇U = (1 + z, 1, x) , (1, 1, x), quindi U non è un potenziale di F.
§ 3. Campi conservativi
525
È immediato verificare che U è di classe C2 su tutto R3 e che il suo gradiente è uguale a F, il che dimostra a posteriori che il campo dato è effettivamente conservativo. Se il lavoro compiuto da un campo vettoriale non dipende dalla curva ma solo dagli estremi, la tecnica appena vista permette sempre di costruire un potenziale. (X.15) Costruzione del potenziale. Se F : A ⊂ R3 → R3 è conservativo allora si può determinarne una funzione potenziale U
Ricordiamo che stiamo assumendo l’insieme A aperto e connesso.
① fissando un punto P0 ∈ A (il potenziale calcolato sarà quello per cui U(P0) = 0);
Per esempio, ma non necessariamente, l’origine (sempre che appartenga ad A).
② considerando il generico punto P = (x, y, z) ∈ A e scegliendo una curva γ di estremi P0 e P; R ③ calcolando U(x, y, z) = γ F · T ds.
Tale γ esiste di certo perchè A è connesso; l’ideale è, se possibile, scegliere una spezzata con lati paralleli agli assi coordinati.
È possibile verificare, utilizzando la definizione, che le derivate parziali della funzione così definita sono effettivamente le componenti del campo, concludendo così la dimostrazione del Teorema (X.13) (si veda il riquadro a pagina 526).
Campi irrotazionali Passiamo ora alla questione più spinosa di come si possa riconoscere a prima vista se un campo F = (F1 , F2 , F3 ) sia conservativo. Una prima condizione necessaria, importante ma non decisiva, si può ottenere grazie al Teorema di Schwarz sullo scambio dell’ordine di derivazione nelle derivate seconde miste (pagina 294). Infatti, se F è conservativo e U, di classe C2 , un suo potenziale, abbiamo ∂x U = F1 , ∂ y U = F2 e ∂z U = F3 . Otteniamo dunque ∂ y F1 = ∂ y (∂x U) = ∂x (∂ y U) = ∂x F2 ,
Il teorema di Schwarz dice che se la funzione f è di classe C2 allora ∂ y (∂x f ) = ∂x (∂ y f )
(e lo stesso vale per le derivate rispetto alle altre variabili).
e allo stesso modo ∂z F1 = ∂x F3 ,
∂z F2 = ∂ y F3 .
Ricordando la definizione di rotore di un campo vettoriale possiamo riassumere in modo compatto le tre precedenti relazioni dicendo che il rotore di un campo conservativo è sempre nullo. (X.16) Proposizione. Se F : A ⊂ R3 → R3 è conservativo allora rot F = 0.
Abbiamo
visto a pagina 356 che rot F è definito come ∂ y F3 − ∂z F2 ∂ F − ∂ F rot F = z 1 . x 3 ∂ x F2 − ∂ y F1
526
Integrali su curve e superfici
Dimostrazione del Teorema (X.13) L’equivalenza ② ⇐⇒ ③ è l’argomento dell’Esercizio 6 a pagina 564, mentre ① =⇒ ② è stata dimostrata nella Proposizione (X.11). Rimane da dimostrare che l’indipendenza dal cammino ② implica l’esistenza di un potenziale ①. Supponiamo che il lavoro compiuto da F, definito in A, dipenda solo dal punto iniziale e da quello finale e non dal percorso. Fissato P0 = (x0 , y0 , z0 ) ∈ A consideriamo una qualunque curva γ avente primo estremo in P0 e secondo estremo nel generico punto P = (x, y, z) ∈ A (la curva γ esiste perché abbiamo supposto che A sia connesso). Ne segue che il lavoro compiuto da F lungo γ dipende solo da P, cioè è una funzione ben definita in A, che indichiamo con U: Z U(x, y, z) = F · T ds dove γ congiunge P0 a P γ
(per poter calcolare l’integrale precedente è necessario che γ possa essere scelta di classe C1 a tratti; questo fatto, di non facile dimostrazione, deriva dall’ipotesi che A sia aperto). Dobbiamo quindi dimostrare che ∇U = F. Abbiamo Z Z U(x + h, y, z) − U(x, y, z) = F · T ds − F · T ds, γ2
γ1
dove γ1 e γ2 sono due qualsiasi curve aventi entrambe il primo estremo in P0 ed il secondo rispettivamen-
te in P e Ph = (x + h, y, z). Fissata γ1 , scegliamo come γ2 l’unione di γ1 con il segmento rettilineo γh che congiunge P a Ph (tale segmento è contenuto in A, se h è sufficientemente piccolo, perché A è aperto). Per le proprietà di additività dell’integrale rispetto al dominio otteniamo Z U(x + h, y, z) − U(x, y, z) = F · T ds. γh
Ora, γh è parametrizzato da r(t) = (x + th) i + y j + z k, con t ∈ [0, 1], perciò Z Z 1 Z 1 F·T ds = F(r(t))·(h, 0, 0) dt = h F1 (x+th, y, z) dt, γh
0
0
da cui Z 1 U(x + h, y, z) − U(x, y, z) lim F1 (x+th, y, z) dt. = lim h→0 h→0 0 h Dato che la funzione integranda è continua in t possiamo applicare il Teorema della Media Integrale (primo volume, Capitolo XI) ottenendo Z 1 F1 (x+th, y, z) dt = F1 (x+ξh h, y, z) con 0 ≤ ξh ≤ 1. 0
Facendo tendere h a 0 otteniamo che ∂x U(x, y, z) = F1 (x, y, z). Analogamente si prova che ∂y U(x, y, z) = F2 (x, y, z) e ∂z U(x, y, z) = F3 (x, y, z). Ne segue che F è conservativo (ed U un suo potenziale).
(X.17) Esempio. Il campo F = i + j + x k non può essere conservativo, infatti rot F = (∂ y F3 − ∂z F2 ) i + (∂z F1 − ∂x F3 ) j + (∂x F2 − ∂ y F1 ) k = − j , 0 (avevamo già osservato questo fatto nell’Esempio (X.12)).
L’annullarsi del rotore è quindi un requisito necessario per l’esistenza di un potenziale. (X.18) Definizione. Un campo F per il quale rot F = 0 si dice irrotazionale. Disgraziatamente la condizione di irrotazionalità è solo necessaria e non sufficiente: esistono infatti campi irrotazionali che non sono conservativi.
Abbiamo
(X.19) Esempio. Consideriamo il campo piano
F conservativo =⇒ F irrotazionale.
F=
−y x i+ 2 j, 2 2 x +y x + y2
ottenuto una condizione necessaria affinché F sia conservativo:
Tipicamente però la condizione più spesso utilizzata è la negazione della precedente, vale dire “ F non irrotazionale ” =⇒ “F non conservativo”.
§ 3. Campi conservativi
527
(definito e) di classe C1 su A = R2 r {(0, 0)}. Come discusso nell’Esercizio 5 a pagina 564, si tratta del campo magnetico generato da una corrente elettrica continua in un filo rettilineo. Poiché ! ! y2 − x2 −y x = ∂ = , ∂y 2 x x + y2 x2 + y2 x2 + y2 2 abbiamo che F è irrotazionale. Per vedere che ciò nonostante F non può essere conservativo, consideriamo la circonferenza γ di centro l’origine e raggio 1, percorsa in senso antiorario, e vediamo che I F · T ds , 0. γ
Infatti, utilizzando l’usuale parametrizzazione della circonferenza r(t) = cos t i + sin t j, t ∈ [0, 2π], abbiamo Z
I
γ
2π
− sin t
cos t
· (− sin t, cos t) dt , cos2 t + sin2 t cos2 t + sin2 t Z 2π sin2 t + cos2 t dt = 2π. =
F · T ds =
0
Nel
caso in cui F sia un campo piano, la condizione di irrotazionalità si riduce a ∂ x F2 = ∂ y F1 .
In base al Teorema (X.13), il campo non può essere conservativo, in quanto è violata la condizione di annullamento dell’integrale sulle curve chiuse. Se F è conservativo e γ è una curva chiusa allora necessariamente I F · T ds = 0. γ
Infatti su γ il punto iniziale e quello finale del percorso coincidono, perciò l’integrale in questione è uguale a quello calcolato sulla traiettoria che rimane sempre ferma in un punto.
0
Esistono tuttavia delle condizioni sul dominio A di un campo F che rendono la condizione di irrotazionalità sufficiente affinché F sia conservativo su A. (X.20) Supponiamo che l’insieme A goda della seguente proprietà: se γ è una curva chiusa e regolare contenuta in A, allora tutta la regione di piano delimitata da γ è contenuta in A. Se F : A ⊂ R2 → R2 è un campo di classe C1 e irrotazionale, allora F è conservativo su A. Al solito, A è aperto e connesso. La dimostrazione di questo risultato è un’applicazione del Teorema di Gauss–Green, che vedremo nel prossimo paragrafo, ed è svolta nell’Esercizio 6 a pagina 564. Un campo irrotazionale dunque, può essere conservativo o meno a seconda delle proprietà del suo dominio. È possibile che si possa trovare un potenziale su un certo dominio ma non per un altro. Per comprendere meglio questo fenomeno invitiamo il Lettore a svolgere l’Esercizio (X.5) a pagina 554, in cui cercheremo di applicare la Procedura (X.15) per costruire un potenziale per il campo dell’esempio precedente su un dominio che sia il più grande possibile. Verificheremo che il campo è conservativo sul piano privato della semiretta negativa: R2 r (x, y) : y = 0, x < 0 . Questo ci mostra un fatto estremamente importante: la proprietà di un campo di essere conservativo non dipende solo dalla sua “espressione algebrica”, ma anche dal suo dominio di definizione (o di eventuale restrizione). In effetti, se da un lato un campo irrotazionale non è sempre conservativo,
F X.3: Gli insiemi che soddisfano la proprietà in (X.20) sono quello in alto e quello in basso a destra, ma quest’ultimo non è connesso.
Il campo
dell’esempio precedente è C1 (A), A = R2 r {0}. Osserviamo che A non verifica la condizione geometrica espressa in (X.20), ad esempio la circonferenza unitaria contiene l’origine che non è un punto di A.
528
Integrali su curve e superfici
dall’altro è sempre possibile restringerne opportunamente il dominio in modo che divenga conservativo. A prescindere da queste condizioni, osserviamo comunque che in ogni caso possiamo sempre costruire un candidato potenziale U seguendo la Procedura (X.15), per poi verificare direttamente se U è effettivamente un potenziale (e quindi se F è conservativo). (X.21) Esempio. Il campo gravitazionale piano generato da un corpo di massa M, posto nell’origine di R2 è dato da G(x, y) = −
x2
GMy GMx 3/2 i − 2 3/2 j, 2 +y x + y2
dove G è la costante di gravitazione universale. È immediato verificare che G è irrotazionale. Osserviamo che l’insieme di definizione di G è A = R2 r {(0, 0)}, lo stesso del campo non conservativo studiato nell’esempio precedente, quindi a priori potremmo aspettarci qualche problema. Proviamo comunque a seguire la Procedura (X.15) per costruirne un candidato potenziale. L’origine non appartiene al dominio A del campo, perciò dobbiamo scegliere un altro punto di partenza, a mo’ d’esempio P0 = (1, 0). Per comodità esprimiamo in coordinate polari il generico punto P = (x, y) = (r cos ϑ, r sin ϑ), dove r > 0 e 0 ≤ ϑ < 2π. Infine fissiamo il percorso γ che congiunge P0 a P come l’unione di due tratti: il segmento γ1 dell’asse x che congiunge (1, 0) ad (r, 0), e l’arco di circonferenza γ2 , di raggio r, che va da (r, 0) a (r cos ϑ, r sin ϑ) (si veda la Figura X.4). Se r ≥ 1 abbiamo Z r Z r Z GM 1 GMt − 2 dt = − 3 , 0 · (1, 0) dt = GM − GM F · T ds = r t t 1 γ1 1 (invitiamo il lettore a verificare che per 0 < r < 1 si ottiene lo stesso risultato); d’altra parte Z ϑ Z −GMr cos t −GMr sin t , · (−r sin t, r cos t) dt = 0, F · T ds = r3 r3 γ2 0 p da cui, ricordando che r = x2 + y2 , Z Z GM F · T ds = p F · T ds + U(x, y) = − GM. γ2 γ1 x2 + y2 Lasciamo al Lettore la facile verifica del fatto che la funzione U così definita è di classe C2 su tutto A e che ∇U = G. Abbiamo così dimostrato che G è conservativo. Per concludere questo paragrafo osserviamo che, nei casi più semplici, è possibile ricavare un potenziale anche senza utilizzare il metodo generale che abbiamo sviluppato, ma semplicemente per “ispezione diretta” (si veda anche l’Esercizio (X.4) a pagina 553).
Si veda anche
l’Esempio (VII.50)
a pagina 356.
F X.4 sarà percorso da sinistra a destra (e quindi parametrizzato da r1 (t) = t i, t ∈ [1, r])o viceversa a seconda che r sia maggiore o minore di 1, mentre γ2 sarà percorso in senso antiorario (parametrizzato da r2 (t) = r cos t i + r sin t j, t ∈ [0, ϑ]).
γ1
Il
potenziale così trovato è quello che si annulla in (1, 0) (e su tutti i punti a distanza unitaria dall’origine). Il potenziale che viene solitamente utilizzato in fisica è invece, per convenzione, quello che si annulla “all’infinito”, vale a dire GM . U(x, y) = p x2 + y2
§ 4. Teorema di Gauss–Green
529
(X.22) Esempio. Torniamo al campo piano F(x, y) = y2 i + 2xy j che abbiamo considerato nell’Esempio (X.6). Si ha ∂ y y2 = 2y = ∂x 2xy , perciò F è irrotazionale. Inoltre F è di classe C1 su tutto R2 , perciò grazie alla proposizione (X.20) è anche conservativo. Se U è un suo potenziale si deve avere ∂x (U(x, y)) = y2 , da cui Z U(x, y) = y2 dx = xy2 + C1 (y).
Visto
che stiamo integrando rispetto ad x, la costante arbitraria di integrazione è effettivamente costante rispetto ad x, ma potrebbe dipendere da y.
Analogamente, da ∂ y (U(x, y)) = 2xy otteniamo Z U(x, y) = 2xy dy = xy2 + C2 (x). Confrontando le due espressioni abbiamo che deve essere C1 (y) = C2 (x): il primo membro non dipende da x ed il secondo non dipende da y, perciò devono essere entrambi uguali alla medesima costante C. Quindi U(x, y) = xy2 + C.
Si
verifica immediatamente che ∇U = F.
§ 4. Teorema di Gauss–Green A pagina 262 abbiamo messo in relazione (sotto certe ipotesi) l’area di una regione piana D, racchiusa da una curva γ = ∂D (parametrizzata da r(t) = x(t) i + y(t) j, t ∈ [t1 , t2 ]) con degli integrali che ora possiamo interpretare come integrali curvilinei I Z t2 I x dy Area(D) = x(t)y′ (t) dt = (0, x) · T ds = Z
=−
γ
γ
t1
t2
I
′
x (t)y(t) dt = t1
γ
(−y, 0) · T ds = −
I
y dx. γ
D’altra parte nel Capitolo IX abbiamo visto (sotto altre ipotesi) che la stessa area può essere espressa come integrale doppio: " dx dy. Area(D) = D
Questo fatto suggerisce che vi sia una relazione tra gli integrali doppi su un dominio e quelli curvilinei lungo la sua frontiera. In effetti, la formula per l’area è solo un caso particolare di un teorema generale, il Teorema di Gauss–Green. Per enunciare questo teorema è evidentemente necessario dare delle condizioni su D in modo che siano bene definiti entrambi gli integrali in questione. Facciamo quindi le seguenti ipotesi: ➔ D ⊂ R2 è l’unione di un numero finito di regioni semplici rispetto ad entrambi gli assi che abbiano in comune solo tratti di frontiera;
Utilizziamo qui la notazione introdotta in (2) a pagina 520.
530
Integrali su curve e superfici
F X.5: dominio ammissibile per il Teorema di Gauss–Green, con frontiera orientata positivamente.
➔ ∂D è l’unione di un numero finito di curve chiuse regolari a tratti (cioè ciascuna possiede una parametrizzazione di classe C1 e con vettore tangente non nullo, eccetto al più un numero finito di punti). Come stiamo per vedere, l’enunciato del teorema coinvolge l’integrale curvilineo di un campo vettoriale su ∂D. Dato che tali integrali dipendono dal verso di percorrenza della curva è necessario scegliere una orientazione di ∂D.
Se, come comunemente capita, la frontiera ∂D è unione di un numero finito di segmenti e di grafici di funzioni continue di una variabile, è sufficiente richiedere che tali funzioni abbiano derivata continua eccetto al più un numero finito di punti.
(X.23) Definizione. Se D è un insieme piano come sopra allora la frontiera di D (considerata come unione di curve) è orientata positivamente se, percorrendo ciascuna curva, D rimane a sinistra. Per indicare che la frontiera di D è orientata positivamente si usa il simbolo ∂+ D. F X.6
Per esempio se D è la regione piana delimitata da una singola curva chiusa allora l’orientazione positiva di ∂D è quella antioraria. Viceversa se D è una corona circolare, allora ∂+ D si ottiene percorrendo in senso antiorario la circonferenza esterna e in senso orario quella interna, come in Figura X.6. (X.24) Teorema di Gauss–Green. Siano D ⊂ R2 come sopra e F(x, y) un campo piano di classe C1 su un aperto contenente D. Allora I " F · T ds. ∂x F2 − ∂ y F1 dx dy = D
∂+ D
Dimostrazione. Riportiamo la dimostrazione del teorema solo nel caso in cui D sia una singola regione semplice rispetto ad entrambi gli assi e di conseguenza ∂D una singola curva chiusa. Il caso generale si ottiene da questo in modo sostanzialmente diretto utilizzando le proprietà di additività dagli integrali. Per le ipotesi fatte abbiamo che D può essere espresso in due modi, n o D = (x, y) ∈ R2 : a ≤ x ≤ b, 11 (x) ≤ y ≤ 12 (x) n o = (x, y) ∈ R2 : c ≤ y ≤ d, h1 (y) ≤ x ≤ h2 (y) , dove le funzioni 11 , 12 , h1 ed h2 sono di classe C1 , almeno a tratti. Grazie a questa osservazione, la dimostrazione del teorema è un semplice, per quanto calcoloso, esercizio di verifica; l’unica cosa a cui bisogna fare attenzione è quella di calcolare [Risus abundat in ore stultorum]
I
=
∂+ D
F1 dx + F2 dy
Per la dimostrazione del caso ge-
nerale si veda l’Esercizio (X.6) a pagina 555.
§ 4. Teorema di Gauss–Green
531
gli integrali che coinvolgono F1 mediante la prima rappresentazione di D e quelli che coinvolgono F2 mediante la seconda. Abbiamo infatti ! " Z d Z h2 (y) ∂x F2 dx dy ∂x F2 dx dy = h1 (y)
c
D
Z =
c
d
F2 (h2 (y), y) − F2 (h1 (y), y) dy = A.
Allo stesso modo " Z − ∂y F1 dx dy = −
b
a
D
applicando il Teorema Fondamentale del Calcolo alla funzione continua ∂x F2 .
F1 (x, 12 (x)) − F1 (x, 11 (x)) dx = B.
Di conseguenza il primo membro della formula che vogliamo dimostrare è uguale a A+B. Veniamo al secondo membro. Una volta introdotta una parametrizzazione il suo integrando si scrive come F1 (x(t), y(t))x′ (t) + F2 (x(t), y(t))y′ (t). Come detto per integrare la parte in F1 utilizziamo la prima rappresentazione di D. Da questo punto di vista ∂+ D può essere decomposta in quattro tratti: il grafico γ1 di 11 , percorso da sinistra a destra, il segmento verticale γ2 sulla retta x = b percorso dal basso verso l’alto, il grafico γ3 di 12 , percorso da destra a sinistra e infine il segmento verticale γ4 sulla retta x = a percorso dall’alto al basso. Sui due segmenti la x è costante quindi F1 (x(t), y(t))x′ (t) = 0. Ne deduciamo che l’integrale del primo addendo vale Z b Z −a F1 (t, 11 (t)) · 1 dt + F1 (−t, 12 (−t)) · (−1) dt = B. −b
a
Stiamo
Una
procedura molto simile a quella che stiamo per seguire è spiegata più in dettaglio a pagina 262.
Parametrizziamo γ1
come r1 (t) = t i + 11 (t) j, t ∈ [a, b], γ3 come r3 (t) = −t i + 12 (−t) j, t ∈ [−b, −a].
Sostituendo integrale vale −
−t R b con t il secondo F (t, 12 (t)) dt. a 1
Con ragionamenti del tutto analoghi si prova che l’integrale del secondo addendo vale Z d Z −c F2 (h2 (t), t) · 1 dt + F2 (h1 (−t), −t) · (−1) dt = A. −d
c
Quindi anche il secondo membro della Formula di Gauss–Green vale A + B ed il Teorema è dimostrato.
Una volta in possesso di questo risultato le formule dell’area viste a pagina 262 ne sono semplicemente dei casi particolari corrispondenti a F=xj
oppure
F = −y i,
infatti in entrambi i casi ∂x F2 − ∂ y F1 = 1. È possibile utilizzare il Teorema di Gauss–Green per calcolare circuitazioni di campi mediante un integrale doppio quando il calcolo risulta particolarmente complesso con la definizione. (X.25) Esempio. Calcoliamo l’integrale I 2 I = (sin x + y) dx + (−3x + e y ) dy, γ
Alternativamente,
utilizzando le notazioni (2), possiamo scrivere I I y dx x dy = − Area(D) = γ
γ
1 = 2
I
γ
x dy − y dx.
532
Integrali su curve e superfici
dove γ è la circonferenza {(x, y) ∈ R2 : x2 + y2 = 4} percorsa in senso antiorario. Chiaramente γ può essere vista come la frontiera, orientata positivamente, del cerchio D = {(x, y) ∈ R2 : x2 + y2 ≤ 4}; D è ovviamente semplice rispetto ad ambedue gli assi e la sua frontiera γ è una curva 2 chiusa e regolare. Infine, F(x, y) = (sin x + y) i + (−3x + e y ) j è di classe C1 su tutto R2 . Tutte le ipotesi sono dunque verificate, perciò possiamo applicare il teorema appena visto. Dato che ∂x F2 (x, y) = −3 e ∂ y F1 (x, y) = 1 abbiamo " (−3 − 1) dx dy = −4 Area(D) = −16π. I= D
(X.26) Esempio. L’ipotesi fatta nel teorema che il campo F sia di classe C1 su un aperto che contiene il chiuso D non può essere indebolita: consideriamo infatti il campo −y x i+ 2 j F= 2 x + y2 x + y2
D si accorda alle notazioni del teo-
rema a patto di scegliere 11,2 (x) = √ ∓ 4 − x2 , −2 ≤ x ≤ 2, h1,2 (y) = p ∓ 4 − y2 , −2 ≤ y ≤ 2.
Osserviamo
che mediante la definizione, utilizzando l’usuale parametrizzazione per γ data da r(t) = 2 cos t i + 2 sin t j, t ∈ [0, 2π], l’integrale in questione si scrive come Z 2π h (sin(2 cos t) + 2 sin t)(−2 sin t) 0
i 2 + −6 cos t + e4 sin t (2 cos t) dt,
sicuramente non di facile soluzione!
che, come abbiamo visto nell’Esempio (X.19) a pagina 526, è irrotazionale su A = R2 r{(0, 0)}. Se tentiamo di applicare il Teorema di Gauss–Green a F sul cerchio {(x, y) : x2 + y2 ≤ 1}, eventualmente privato dell’origine, potremmo erroneamente pensare che la circuitazione di F lungo la circonferenza di raggio 1 sia nulla, in quanto l’integrale del rotore è nullo. Questo però, come abbiamo visto, è falso (la circuitazione vale 2π). Il problema sta nel fatto che F non è di classe C1 nell’origine.
§ 5. Superfici regolari fino al bordo. Orientabilità Dopo aver trattato l’integrazione di campi scalari e vettoriali lungo curve, ci accingiamo a considerare l’integrazione su superfici. A tale scopo, oltre alle definizioni di base (Capitolo V, § 9 e Capitolo VI, § 4) saranno necessarie alcune nozioni più profonde di teoria delle superfici, che andiamo ad esporre in questo paragrafo. Abbiamo visto a pagina 289 la Definizione (VI.21) di superficie regolare. È anche possibile dare la nozione di superficie regolare a pezzi, analoga a quella di curva regolare a tratti vista a pagina 234, se pur in modo un po’ macchinoso: diremo che Σ è regolare a pezzi se contiene un numero finito di curve regolari a tratti, dette spigoli, che la suddividono in un numero finito di superfici regolari, dette facce, in modo che ogni spigolo “confini” con al più due facce. Come il Lettore avrà certamente capito, la situazione che abbiamo in mente è quella di un “poliedro a facce e spigoli curvi”. (X.27) Esempio. Consideriamo la superficie Σ definita da n o Σ = (x, y, z) ∈ R3 : x2 + y2 + (1 + |z|)2 = 4 .
Una
superficie è regolare se ammette una parametrizzazione r(u, v) di classe C1 su D ⊂ R2 e tale che ru × rv , 0 nei punti interni di D.
Fatta
eccezione degli degli spigoli, detti vertici.
estremi
In particolare tutti i poliedri sono superfici chiuse e regolari a pezzi.
§ 5. Superfici regolari fino al bordo. Orientabilità
533
L’equazione che la definisce contiene a primo membro la somma di tre quadrati. Questo ci suggerisce l’utilizzo delle coordinate sferiche (introdotte nel Capitolo III, § 8): se poniamo infatti x = 2 cos u sin v, y = 2 sin u sin v, 1 + |z| = 2 cos v, l’equazione è automaticamente verificata. Almeno in partenza, per la definizione delle coordinate sferiche, abbiamo u ∈ [0, 2π] e v ∈ [0, π]. Visto che x e y sono già espressi in funzione dei parametri, rimane da ricavare z. Otteniamo |z| = 2 cos v − 1. Ora, se 2 cos v − 1 è negativo tale equazione non ha soluzioni, perciò dobbiamo imporre la restrizione 2 cos v − 1 ≥ 0 che implica
0≤v≤
π . 3
Per tali valori di v otteniamo z = ±(2 cos v − 1). Siamo così costretti ad esprimere Σ come unione di due pezzi, Σ1 parametrizzato da r1 (u, v) = 2 cos u sin v i + 2 sin u sin v j + (2 cos v − 1) k, (u, v) ∈ [0, 2π] × [0, π/3]
F X.7: Σ è l’unione di due calotte sferiche, ottenute dalle sfere di equazione x2 + y2 + (z − 1)2 = 4 e x2 + y2 + (z + 1)2 = 4.
e Σ2 da r2 (u, v) = 2 cos u sin v i + 2 sin u sin v j − (2 cos v − 1) k, (u, v) ∈ [0, 2π] × [0, π/3]. Ne segue che Σ è regolare a pezzi, e le due calotte sferiche Σ1 e Σ2 sono le sue facce. Inoltre le due calotte hanno dei punti in comune che corrispondono ai valori di v per cui 2 cos n o v−1 = 0. Quindi la circonferenza γ = (x, y, z) ∈ R3 : x2 + y2 = 3, z = 0 è l’intersezione di Σ1 e Σ2 , ed è l’unico spigolo di Σ. Una rappresentazione di Σ è illustrata in Figura X.7. Infine, Σ è il bordo dell’insieme aperto n o A = (x, y, z) ∈ R3 : x2 + y2 + (1 + |z|)2 < 4 . Nel Capitolo VI, § 4 abbiamo definito la nozione di superficie regolare (e quindi quella di piano tangente) solo nei punti interni al dominio D dei parametri. Con un po’ di cautela, questa limitazione può essere aggirata. Consideriamo ad esempio la parametrizzazione r(u, v) = cos u i + sin u j + v k,
(u, v) ∈ [0, 2π] × [0, 1].
Come abbiamo visto nell’Esempio (V.47) a pagina 257, la superficie Σ corrispondente è una superficie cilindrica. Osserviamo che l’insieme su cui variano i parametri è il rettangolo chiuso D = [0, 2π] × [0, 1], sottoinsieme del piano uv: in effetti, come avevamo richiesto a pagina 256, D è la chiusura dell’insieme aperto (0, 2π) × (0, 1), la cui frontiera è una curva chiusa regolare a tratti (il perimetro del rettangolo). Ripercorrendo
Lasciamo al Lettore la verifica che r1 ed r2 sono regolari.
534
Integrali su curve e superfici
la discussione con cui abbiamo introdotto la nozione di piano tangente, vediamo che r è di classe C1 su (0, 2π) × (0, 1), ed inoltre ru × rv = (− sin u, cos u, 0) × (0, 0, 1) = (cos u, sin u, 0) , 0, perciò Σ ammette piano tangente in r(u0 , v0 ) per 0 < u0 < 2π e 0 < v0 < 1. Per quanto detto, la nostra definizione non ci permette al momento di definire un piano tangente nei punti corrispondenti ai valori u0 = 0, u0 = 2π oppure v0 = 0, v0 = 1. Questo è piuttosto spiacevole: se da un lato i punti corrispondenti agli estremi per v sono effettivamente punti in cui la superficie “si interrompe”, perciò potrebbe essere questionabile l’opportunità di definire un piano tangente in questi punti, dall’altro i punti del tipo (1, 0, v0) = r(0, v0 ) = r(2π, v0 ) (con 0 < v0 < 1) hanno le medesime caratteristiche di tutti gli altri punti del cilindro, perciò la mancata definizione di un piano tangente risulta essere un’evidente lacuna della costruzione teorica. Il motivo per cui non avevamo definito il piano tangente anche per i punti corrispondenti a ∂D stava nel fatto che la definizione di differenziabilità che abbiamo dato riguarda solo i punti interni del dominio di una funzione, perciò non si applica ai punti di ∂D quando r è definita esattamente in D. Nel caso che stiamo considerando, però, l’espressione che definisce r è di classe C1 su tutto R2 , ed i punti di ∂D sono punti interni di R2 ! Ne segue che possiamo pensare a r come definita su un aperto più grande, contenente D, e calcolare ru × rv anche sui punti di ∂D. Otteniamo ru (0, v0) × rv (0, v0 ) = (1, 0, 0) = ru (2π, v0 ) × rv (2π, v0),
I
punti (1, 0, v0 ) = r(0, v0 ) = r(2π, v0 ) sono penalizzati semplicemente dalla nostra scelta della parametrizzazione. Per esempio r˜(u, v) = cos u i + sin u j + v k, dove −π ≤ u ≤ π, 0 ≤ v ≤ 1,
parametrizza lo stesso cilindro, ma questa volta il piano tangente in (1, 0, v0 ) risulta definito (mentre non è definito quello nei punti del tipo (−1, 0, v0 ), che con la precedente parametrizzazione non davano alcun tipo di problema).
perciò possiamo definire il piano tangente a Σ in r(0, v0) come quello ortogonale a ru × rv in tale punto, cioè il piano verticale x=1 (in perfetto accordo con quanto ci aspettavamo). A volte però le cose possono non andare così bene. (X.28) Esempio. Consideriamo la superficie Σ di parametrizzazione r(u, v) = (cos 3u + cos u) i + (sin 3u − sin u) j + v k, dove (u, v) ∈ [−π/4, π/4] × [0, 1]. Di nuovo r può essere vista come una funzione di classe C1 su tutto R2 , perciò possiamo calcolare ru ×rv su tutto D, frontiera inclusa. Si ha ru (u, v) = (−3 sin 3u − sin u, 3 cos 3u − cos u, 0), rv (u, v) = (0, 0, 1) e di conseguenza ru (u, v) × rv (u, v) = (3 cos 3u − cos u) i + (3 sin 3u + sin u) j. Si può vedere facilmente che ru ×rv non si annulla mai, perciò certamente Σ ammette piano tangente in tutti i punti corrispondenti all’interno di D.
Con
qualche calcolo si dimostra
che
kru (u, v)×rv (u, v)k =
√ 10 − 6 cos 4u,
che è sempre diverso da 0.
§ 5. Superfici regolari fino al bordo. Orientabilità
535
F X.9: costruzione del nastro di Moebius.
Vediamo cosa accade sui punti di ∂D. Osserviamo che (come nel caso del cilindro) diversi punti di ∂D corrispondono allo stesso punto di Σ, infatti si ha π π r − , v0 = (0, 0, v0) = r , v0 . 4 4 D’altra parte, però, lo stesso non accade per ru × rv , infatti √ √ π π ru − , v0 × rv − , v0 = (−2 2, −2 2, 0) 4 4 e √ √ π π ru , v0 × rv , v0 = (−2 2, 2 2, 0). 4 4 Ne segue che, se Σ ammettesse piano tangente in (0, 0, v0), questo dovrebbe essere contemporaneamente perpendicolare a due vettori non paral leli, e questo è evidentemente impossibile (si veda la Figura X.8). Tenendo conto della discussione fatta siamo quindi portati ad estendere, con le dovute precisazioni, la nozione di regolarità per una superficie Σ anche ai punti di r(∂D).
F X.8
In modo un po’ colorito, possiamo
dire che Σ è un superficie regolare a pezzi composta di . . . un solo pezzo!
(X.29) Definizione. Una superficie Σ si dice regolare fino al bordo se ammette una parametrizzazione r : D → R3 tale che ➔ r è definita e di classe C1 su A, dove A è un opportuno aperto contenente D, ➔ kru (u, v) × rv (u, v)k , 0 per ogni (u, v) ∈ D e ➔ se (u1 , v1 ) e (u2 , v2 ) appartengono a ∂D e r(u1 , v1 ) = r(u2 , v2 ) allora i corrispondenti versori normali sono paralleli: N(u1 , v1 ) = ±N(u2 , v2 ). È chiaro che per una superficie regolare fino al bordo possiamo definire il piano tangente in ogni suo punto, frontiera inclusa. Vale la pena di osservare che l’ultima condizione può essere verificata anche con il segno meno, come vediamo nel prossimo esempio. (X.30) Esempio (Nastro di Moebius). Il nastro di Moebius è una superficie di cui si può costruire un modello prendendo una striscia rettangolare di carta ed incollandone le due estremità dopo averne ruotata una
Il versore normale N=
ru (u, v) × rv (u, v) kru (u, v) × rv (u, v)k
è ben definito in quanto ru (u, v) × rv (u, v) , 0.
536
Integrali su curve e superfici
di mezzo giro (si vedano le Figure X.9 e X.10). È facile convincersi che su una simile superficie non è possibile definire in modo coerente un versore normale. In effetti, il nastro non possiede una “faccia esterna” e una “faccia interna”, fatto che non avevamo osservato in alcun precedente esempio. Se si scrive una parametrizzazione del nastro si può vedere che risulta essere una superficie regolare fino al bordo, e che la terza condizione della relativa definizione vale con il segno meno (si veda l’Esercizio (X.12) a pagina 560).
Invitiamo il Lettore a costruire un nastro di Moebius per sperimentarne alcune delle inconsuete proprietà: cosa accade se si ritaglia il nastro lungo la sua circonferenza mediana? E se si ritaglia lungo una direzione ad essa parallela, ma non mediana?
Le superfici come il nastro di Moebius sono dette non orientabili, a differenza delle altre superfici che abbiamo visto in tutti gli altri esempi, che sono “dotate di due facce” e vengono dette orientabili. (X.31) Definizione. Una superficie Σ di parametrizzazione r, regolare fino al bordo, è detta orientabile se il versore normale N=
F X.10: una superficie non orientabile: il nastro di Moebius.
ru × rv kru × rv k
varia con continuità su Σ, cioè se per ogni (u1 , v1 ) e (u2 , v2 ) appartenenti a ∂D vale r(u1 , v1 ) = r(u2 , v2 )
=⇒
N(u1 , v1 ) = N(u2 , v2 ).
(X.32) Esempio (Superfici definite come insiemi di livello di funzioni). Una classe importante di superfici regolari orientabili è data dalle superfici di livello. Consideriamo l’insieme di livello k di una funzione di tre variabili 1(x, y, z), che sia di classe C1 e regolare, cioè ∇1 non si annulli mai sull’insieme di livello. Allora, nell’intorno di ogni suo punto, in base al Teorema di Dini, la superficie ammette una parametrizzazione cartesiana, rispetto ad un sottoinsieme delle variabili. Supponiamo per comodità che questa sia data da una funzione z = ϕ(x, y). Già conosciamo (si veda l’Esempio (VI.22) a pagina 289) l’espressione del piano tangente e del vettore normale: osserviamo ora che il vettore normale è sempre parallelo al gradiente ∇1; infatti, inserendo l’espressione delle derivate di ϕ (pagina 324) nella formula del vettore normale (pagina 289), si ricava immediatamente N(x, y, ϕ(x, y)) =
F X.11: una superficie orientabile.
∇1(x, y, ϕ(x, y)) . k∇1(x, y, ϕ(x, y))k
Il versore normale così definito varia con continuità sulla superficie: possiamo dunque concludere che si tratta di una superficie orientabile.
§ 6. Integrali di superficie Nel Capitolo IXabbiamo dato la definizione di area per una superficie cartesiana regolare Σ′ , grafico della funzione f (x, y) con (x, y) ∈ D′ e D′
Definizione (IX.36) a pagina 486.
§ 6. Integrali di superficie
537
dominio di integrazione, come " q 1 + k∇ f k2 dx dy. Area(Σ′ ) = D′
Ci proponiamo ora di estendere tale definizione al caso di superfici parametriche regolari qualunque, e più in generale di definire l’integrale di una funzione su una superficie. Molte idee sono simili a quelle utilizzate per lo sviluppo degli integrali su curve, con cui supponiamo il Lettore sia ormai familiare. Consideriamo quindi una superficie Σ di parametrizzazione regolare fino al bordo r(u, v), dove (u, v) ∈ D ⊂ R2 . Come abbiamo osservato nel commento a pagina 288, localmente una superficie regolare è sempre una superficie cartesiana: possiamo perciò pensare di dividere Σ in varie parti, ciascuna delle quali sia grafico di una funzione che esprime una tra x, y e z mediante le altre due, calcolare l’area di ciascuna parte mediante la formula per le superfici cartesiane, ed infine sommare i contributi. Tornando ad esprimere gli integrali rispetto ad u e v, si ottiene l’espressione " kru × rv k du dv. Area(Σ) = D
È possibile verificare che, come è naturale attendersi, l’integrale trovato non dipende dalla parametrizzazione di Σ. Più in generale, data una funzione continua f : A ⊂ R3 → R, che ad esempio può rappresentare la densità superficiale della massa distribuita su Σ, possiamo definire in modo analogo l’integrale di superficie di f su Σ (che corrisponderebbe quindi alla massa totale). (X.33) Definizione. Date una funzione continua f : A ⊂ R3 → R e una superficie regolare fino al bordo Σ parametrizzata da r : D → R3 , definiamo integrale di superficie di f su Σ " " f (r(u, v))kru (u, v) × rv (u, v)k du dv. f dσ = Σ
D
Nel caso f ≡ 1 l’integrale precedente definisce l’area della superficie Σ. Come nel caso dell’integrale curvilineo, introduciamo una notazione formale per mettere in risalto il fatto che l’integrale superficiale così definito non dipende dalla parametrizzazione. A questo scopo introduciamo l’elemento d’area
(3)
dσ = kru (u, v) × rv (u, v)k du dv,
Quindi r è di classe C1 su A ⊃ D e ru × rv non è mai nullo. Tenendo conto della discussione a margine di pagina 256 e della definizione di area per una superficie cartesiana, supporremo sempre che D sia unione di un numero finito di insiemi semplici, con frontiera un numero finito di curve chiuse e regolari a tratti. I dettagli di questo di questo cal-
colo (essenzialmente un cambiamento di variabile in integrali doppi) sono contenuti nell’Esercizio (X.7) a pagina 556. Anche l’indipendenza dalla parametrizzazione si verifica con calcoli simili.
Ovviamente stiamo supponendo Σ ⊂ A. Come la scelta di una parametrizzazione per una curva trasforma l’integrale curvilineo in integrale in una variabile, quella per una superficie trasforma l’integrale di superficie in un integrale doppio. È anche possibile calcolare integrali di superficie su superfici regolari a pezzi, sfruttando l’additività rispetto al dominio.
538
Integrali su curve e superfici
ed esprimiamo l’area di Σ come integrale di superficie rispetto all’elemento d’area " " kru × rv k du dv. dσ = Area(Σ) = D
Σ
È l’analogo della lunghezza di una curva, che è data da Z ds, γ
È facile vedere che questa formula è coerente con quelle già date di area di una regione piana o area di una superficie cartesiana. (X.34) Esempio. Una lamina è disposta lungo la superficie sferica Σ di equazione x2 + y2 + z2 = 1, e la sua densità superficiale di massa in un generico punto è proporzionale (secondo una costante k) al quadrato della distanza del punto dal piano yz. Ci proponiamo di calcolare la massa totale della lamina. Indicando con δ la densità superficiale di massa, abbiamo δ(x, y, z) = kx2 . La massa totale è quindi data da " kx2 dσ. massa =
dove l’elemento di lunghezza ds è una quantità intrinseca della curva (cioè che non presuppone parametrizzazione). Una volta fissata la parametrizzazione, si ha la ben nota formula ds = kr′ (t)k dt.
La distanza di (x, y, z) dal piano yz vale |x|.
Σ
Per calcolare questo integrale dobbiamo parametrizzare Σ. Possiamo usare, per esempio, le coordinate sferiche, ottenendo la parametrizzazione r(u, v) = sin u cos v i + sin u sin v j + cos u k, dove D = [0, π] × [0, 2π]. Abbiamo i j ru × rv = det cos u cos v cos u sin v − sin u sin v sin u cos v
(u, v) ∈ D,
k sin2 u cos v 2 − sin u = sin u sin v 0 cos u sin u
Poiché
e quindi
sin u.
p sin4 u cos2 v + sin4 u sin2 v + cos2 u sin2 u q = sin2 u sin2 u + cos2 u = sin u.
kru × rv k =
Otteniamo perciò dσ = sin u du dv e la massa richiesta è data da " " 2 k sin2 u cos2 v · sin u du dv kx dσ = D Σ ! ! Z 2π Z π cos2 v dv sin3 u du =k 0
0
π 2π 1 4 1 1 v + sin 2v = kπ. = k cos3 u − cos u 3 2 4 3 0 0
Una volta in possesso della definizione di integrale di superficie, non è difficile immaginare il genere di applicazioni che se ne possono fare: in effetti, tutte le applicazioni che abbiamo già visto dell’integrale doppio
0 ≤ u ≤ π, si ha | sin u| =
§ 6. Integrali di superficie
539
o dell’integrale curvilineo possono essere riscritte per configurazioni superficiali non necessariamente piatte. Per esempio, se δ rappresenta una densità superficiale di massa distribuita su una lamina dislocata lungo Σ, allora le coordinate del baricentro sono date da ! ! ! xδ(x, y, z) dσ yδ(x, y, z) dσ zδ(x, y, z) dσ x¯ = !Σ , y¯ = !Σ , z¯ = !Σ , δ(x, y, z) dσ δ(x, y, z) dσ δ(x, y, z) dσ Σ Σ Σ dove (come abbiamo già osservato) il denominatore delle tre espressioni è la massa della lamina. (X.35) Esempio. Supponiamo che due masse, entrambe uguali ad m, siano distribuite uniformemente rispettivamente su una lamina disposta lungo una superficie semisferica di raggio R e su un solido che occupa una semisfera di ugual raggio. Ci chiediamo quale delle configurazioni ha il baricentro più vicino al centro del sfera. Introducendo un opportuno sistema di riferimento, le due configurazioni corrispondono rispettivamente alla superficie n o Σ = (x, y, z) ∈ R3 : x2 + y2 + z2 = R2 , z ≥ 0
Si veda come d’esempio la discussione a pagina 517.
Il
Lettore potrà facilmente costruirsi, per il suo personale uso e consumo, formule per i momenti d’inerzia e quant’altro.
e al solido n o E = (x, y, z) ∈ R3 : x2 + y2 + z2 ≤ R2 , z ≥ 0 . Dato che la massa è distribuita uniformemente, la densità di massa è costante ed il baricentro dipende solo dalla geometria della configurazione; possiamo quindi porre δ ≡ 1. In entrambi i casi otteniamo subito per simmetria che x¯ = y¯ = 0, perciò dobbiamo solo calcolare z¯ . Per quanto riguarda la lamina, osserviamo che√Σ è una superficie cartesiana parametrizzata da r(u, v) o= u i + v j + R2 − u2 − v2 k, con n 2 2 (u, v) ∈ D = (u, v) ∈ R : u + v2 ≤ R2 . Otteniamo facilmente che R du dv dσ = kru × rv k du dv = √ 2 R − u2 − v2 da cui !
Σ
z¯Σ = !
z dσ
Σ
dσ
=
!
D
R du dv
Area(Σ)
=
R Area(D) 1 = R. 2 2πR2
Per quanto riguarda invece il solido E, la formula da usare è quella analoga con gli integrali tripli al posto di quelli di superficie. Integrando per strati abbiamo R R ! RR # z dx dy dz z Area(Dz ) dz z dx dy dz 0 Dz = = 0 z¯E = #E , Volume(E) 2πR3 /3 dx dy dz E
Infatti
Σ è il grafico di f (u, v) = R2 − u2 − v2 e in questo caso, come abbiamo più volte osservato, q kru × rv k = 1 + k∇ f k2 . √ Da fu = −u/ R2 − u2 − v2 e √ fv = −v/ R2 − u2 − v2 otteniamo facilmente il risultato cercato. √
Si 490.
veda l’Esercizio § 9 a pagina
540
Integrali su curve e superfici
Dove Dz è l’insieme dei punti (x, y) tali che (x, y, z) ∈ E. Tenendo conto della definizione di E si vede che n o Dz = (x, y) ∈ R2 : x2 + y2 ≤ R2 − z2 √ è un cerchio di raggio R2 − z2 , perciò Area(Dz ) = π(R2 − z2 ). Otteniamo perciò h iR RR 2 2 3 R2 z2 /2 − z4 /4 πz(R − z ) dz 3 0 = = R. z¯E = 0 8 2πR3 /3 2R3 Ne deduciamo che la semisfera solida ha il baricentro più vicino al suo centro che la superficie semisferica.
§ 7. Integrali di superficie di campi vettoriali Nel § 2 abbiamo introdotto gli integrali curvilinei di campi vettoriali come estensione della nozione fisica di lavoro. Anche gli integrali di superficie di campi vettoriali trovano la loro motivazione nell’estensione di una quantità fisica, quella di flusso. (X.36) Esempio. Consideriamo un liquido, di densità di massa costante δ kg/m3 , che si muova in un condotto con velocità costante ed uniforme v m/s, ed una superficie piana Σ di area A m2 , permeabile al liquido. Calcoliamo la massa di liquido che fluisce attraverso Σ nell’unità di tempo. È chiaro che tale quantità dipenderà dalla posizione di Σ rispetto al moto del liquido: detto N il versore normale al piano che contiene Σ, il flusso sarà massimo quando v e N sono paralleli, mentre sarà nullo quando i due vettori sono perpendicolari. In generale, è facile vedere che tale quantità è data da flusso = (δv · N)A.
Al solito, vogliamo estendere l’idea di flusso ad un campo vettoriale variabile F (nell’esempio, F = δv) attraverso un superficie Σ non necessariamente piana. A tale scopo, è necessario specificare alcune proprietà geometriche relative a Σ. Di sicuro essa deve possedere un versore normale in ogni punto (o quasi), ma questo non basta per la definizione del flusso. Tale versore dovrà definire in modo coerente la “faccia” di Σ da cui “entra” F e quella da cui esce. Siamo quindi portati a supporre che Σ sia orientabile. Sotto queste ipotesi procediamo in modo ormai abituale: suddividiamo Σ in piccole parti che si possano approssimare con delle superfici di area ∆σ e di versore normale N, calcoliamo il prodotto scalare (F · N)∆σ, sommiamo tutti i contributi e passiamo al limite, ottenendo l’integrale di superficie " F · N dσ. Σ
Visto
che il liquido percorre |v| metri in un secondo, tutto il liquido che attraversa Σ in una unità di tempo occupa il cilindro non retto avente base in Σ e superficie parallela a v. Tale cilindro ha altezza |v| cos γ, dove γ è l’angolo formato da v e da N, e quindi il suo volume vale A|v| cos γ.
Vedansi
la Definizione (X.31) a pagina 536 e la discussione che la precede: non è molto sensato, ad esempio, definire il flusso di una quantità attraverso il nastro di Moebius.
§ 7. Integrali di superficie di campi vettoriali
541
F X.12: le due possibili orientazioni di una superficie orientabile.
Se poi introduciamo una parametrizzazione r(u, v) di Σ, vediamo che l’espressione precedente si semplifica.
Infatti N=
(X.37) Definizione. Dato un campo vettoriale continuo F : A ⊂ R3 → R3 e una superficie Σ regolare fino al bordo ed orientabile, parametrizzata da r : D → R3 , il flusso di F attraverso Σ è dato da " " F(x(u, v), y(u, v), z(u, v)) ·(ru(u, v) × rv(u, v)) du dv. F · N dσ = D
Σ
(X.38) Esempio. Dato un fluido a densità costante unitaria, supponiamo che la sua velocità nel generico punto (x, y, z) sia data da
ru × rv e dσ = kru ×rv k du dv. kru × rv k
Una volta scelta una parametrizzazione di Σ, ne viene fissata anche l’orientazione; per calcolare il flusso rispetto all’orientazione opposta basterà cambiare di segno l’integrale. Al solito, è possibile calcolare flussi attraverso superfici regolari a pezzi, sfruttando l’additività rispetto al dominio, a patto di aver definito una orientazione coerente.
v(x, y, z) = y i − x j + k. Ci proponiamo di calcolare il flusso del fluido attraverso la porzione di paraboloide n o Σ = (x, y, z) ∈ R3 : z = x2 + y2 , z ≤ 1 , verso l’alto. La superficie Σ è cartesiana e si puònparametrizzare mediante o r(u, v) = u i + v j + (u2 + v2 ) k, con (u, v) ∈ D = (u, v) ∈ R2 : u2 + v2 ≤ 1 . Abbiamo ru = i + 2u k, rv = j + 2v k e ru × rv = −2u i − 2v j + k. Abbiamo dunque " " (v, −u, 1) · (−2u, −2v, 1) du dv F · N dσ = flusso = D Σ " du dv = Area(D) = π. =
D
Abbiamo introdotto la nozione di flusso con l’esempio del fluido, ma questo concetto è molto più generale e si applica sia a campi di forze (vedremo fra poco il flusso del campo elettrico) che al flusso del calore, in cui il campo in considerazione è il gradiente della funzione temperatura.
La
parametrizzazione scelta è coerente con l’orientazione richiesta (“verso l’alto”), infatti la terza componente di ru × rv è positiva. Per calcolare il flusso verso il basso basterà cambiare di segno quello verso l’alto.
542
Integrali su curve e superfici
(X.39) Esempio (Flusso del campo elettrico). Il flusso del campo elettrico attraverso la superficie Σ è definito dall’integrale del campo sulla superficie " E · N dσ. Σ
Il campo elettrico generato da una particella di carica Q posta nell’origine nel punto r è E = εQ
r , krk3
dove ε è una costante. Calcoliamo il flusso elettrico uscente dalla superficie sferica Σa di raggio a > 0. Ovviamente la normale esterna alla sfera nel punto r vale N = r/krk. Abbiamo perciò E · N = εQ/krk2 = εQ/a2 , poiché krk = a su Σa . Conseguentemente " " εQ E · N dσ = 2 dσ = 4πεQ. a Σa Σa | {z }
Si
veda l’approfondimento a pagina 361 e l’Esempio (IX.43) a pagina 491.
Area Σa =4πa2
§ 8. Teoremi del rotore e della divergenza Nel § 4 abbiamo visto che il Teorema di Gauss–Green mette in relazione l’integrale di una certa quantità sulla frontiera di un certo dominio con l’integrale di una opportuna “derivata” di questa quantità sull’intero dominio. In realtà non è la prima volta che incontriamo un teorema avente questo spirito: certamente il Lettore ricorderà il Teorema Fondamentale del Calcolo, incontrato nel primo volume: se f = f (t) è derivabile su [a, b] allora Z b f ′ (t) dt. f (b) − f (a) = a
Anche questo teorema mette in relazione un “integrale” sulla frontiera di un dominio con l’integrale della derivata sull’intero dominio (cioè l’intervallo). Si possono formulare risultati analoghi anche per integrali di superficie e di volume. Concludiamo questa lunga avventura presentandone i due più celebri (e più utili nelle applicazioni): il Teorema del rotore, che come quello di Gauss–Green mette in relazione integrali di superfici e curvilinei, ma in R3 , ed il Teorema della divergenza, che mette in relazione integrali tripli e di superficie.
Teorema del rotore Consideriamo una superficie Σ semplice, regolare fino al bordo e orientabile, parametrizzata da r : D ⊂ R2 → R3 . Supporremo che D soddisfi
In
questo caso la frontiera si riduce a due punti, perciò l’integrale 0–dimensionale è semplicemente una somma; la differenza di segno dei due addendi è data dal fatto che la direzione di “uscita” dall’intervallo è quella positiva in b e quella negativa in a.
§ 8. Teoremi del rotore e della divergenza
543
le medesime ipotesi fatte nell’enunciare il Teorema di Gauss–Green (si veda a pagina 529), cioè che D sia l’unione di un numero finito di regioni semplici rispetto ad entrambi gli assi, e che ∂D sia l’unione di un numero finito di curve regolari a tratti. Come forse il Lettore ricorda, non abbiamo mai dato una definizione generale di frontiera di Σ. Data la complessità della questione, nemmeno ora lo faremo veramente, ci limiteremo a dare una definizione molto particolare, che però risulterà sufficiente per i nostri scopi. (X.40) Definizione. Se Σ, parametrizzata da r, e D sono come sopra, allora la frontiera di D è l’unione di k curve regolari a tratti F X.13: Orientazione positiva della frontiera di Σ.
∂D = γ1 ∪ γ2 ∪ · · · ∪ γk . Per ciascuna γi fissiamo una parametrizzazione orientata positivamente pi (t) = ui (t) i + vi (t) j, con t ∈ Ii . Allora la frontiera di Σ orientata positivamente, indicata con ∂+ Σ, è l’unione delle curve γ˜ i = r(γi ) parametrizzate da r˜i (t) = r(pi (t)) = r(ui (t), vi(t)),
Si veda la Definizione (X.23).
con t ∈ Ii .
(X.41) Esempio. Torniamo sul cilindro Σ, di parametrizzazione r(u, v) = cos u i + sin u j + v k,
(u, v) ∈ [0, 2π] × [0, 1],
che abbiamo considerato nell’Esempio (V.47) a pagina 257, e poi a pagina 533. Come abbiamo visto, Σ è una superficie semplice, regolare fino al bordo ed orientabile. In questo caso D è il rettangolo [0, 2π] × [0, 1] nel piano uv, e la sua frontiera, composta di una unica curva chiusa costituita da quattro segmenti, è orientata positivamente se percorsa in senso antiorario (si veda la Figura X.14). L’immagine attraverso r di ∂+ D risulta essere data da una curva chiusa costituita da quattro tratti: la circonferenza della base inferiore del cilindro, percorsa in senso antiorario; il segmento verticale di estremi (1, 0, 0) e (1, 0, 1), percorso verso l’alto; la circonferenza della base superiore, percorsa in senso orario; di nuovo lo stesso segmento verticale, stavolta percorso verso il basso (si veda la Figura X.15). Utilizzeremo ∂+ Σ unicamente allo scopo di calcolare circuitazioni di campi lungo essa; dato che gli integrali curvilinei di campi vettoriali cambiano di segno cambiando il verso di percorrenza, risulta allora chiaro che il contributo su un tratto percorso due volte, in versi opposti (in questo caso il segmento verticale) è nullo. In pratica, quindi, per il calcolo di integrali curvilinei di campi vettoriali, ∂+ Σ si riduce all’unione delle due circonferenze (ciascuna percorsa secondo la propria orientazione), in maggior accordo con l’idea intuitiva di “frontiera di una superficie laterale cilindrica”. Per quanto visto nel precedente esempio, d’ora in poi elimineremo tacitamente da ∂+ Σ tutti i tratti che vengono percorsi due volte, con orientazione opposta. Dotati della nozione di frontiera orientata positivamente di
F X.14
F X.15
544
Integrali su curve e superfici
una superficie tridimensionale, siamo finalmente pronti ad estendere il Teorema di Gauss–Green dal piano allo spazio. (X.42) Teorema del rotore (Stokes). Siano ➔ Σ una superficie semplice, regolare fino al bordo e orientabile, parametrizzata da r : D ⊂ R2 → R3 , avente versore normale N = ru × rv /kru × rv k e frontiera orientata positivamente ∂+ Σ; ➔ F : A ⊂ R3 → R3 un campo vettoriale di classe C1 (con A aperto e Σ ⊂ A). Allora la circuitazione di F lungo ∂+ Σ è uguale al flusso del rotore di F attraverso Σ: I " F · T ds. rot F · N dσ = ∂+ Σ
Σ
Dimostrazione di un caso particolare. La dimostrazione del Teorema di Stokes nel caso generale risulta particolarmente complessa. Qui ci limitiamo a dare la dimostrazione nel caso in cui ➔ Σ è una superficie cartesiana di parametrizzazione r(u, v) = u i + v j + f (u, v) k, con (u, v) ∈ D, dove f è di classe C2 su un aperto contenente D;
Nel caso in cui Σ sia una superficie piana il Teorema di Stokes si riduce a quello di Gauss–Green. In tale caso, infatti, possiamo scegliere r(u, v) = u i + v j, (u, v) ∈ D, e quindi ∂+ Σ = ∂+ D, N = k, e rot F · N = ∂x F2 − ∂ y F1 .
Dimostrazioni più generali,
almeno per quanto riguarda la forma di D, si possono ottenere ragionando come nell’Esercizio (X.6) a pagina 555.
➔ D è una regione semplice rispetto ad entrambi gli assi, la cui frontiera è costituita da una unica curva regolare (si veda la Figura X.16).
Come abbiamo visto più volte, in questo caso si ha ru × rv = − fu i − fv j + k, perciò possiamo scrivere il primo membro della Formula di Stokes come " rot F · N dσ Σ " (4) i h = − ∂y F3 − ∂z F2 fu − (∂z F1 − ∂x F3 ) fv + ∂x F2 − ∂y F1 du dv, D
dove le derivate parziali di F sono valutate in (u, v, f (u, v)). Passiamo ora al secondo membro. Se ∂+ D è parametrizzata da (x(t), y(t)), con a ≤ t ≤ b, allora ∂+ Σ è parametrizzata da F X.16 (x(t), y(t), z(t)) = (x(t), y(t), f (x(t), y(t))). Abbiamo I ∂+ Σ
Z F · T ds =
Z
b
b
′ F1 x (t) + F2 y′ (t) + F3 fu x′ (t) + fv y′ (t) dt
b
= Z
F1 x′ (t) + F2 y′ (t) + F3 z′ (t) dt
a
a
= Ia =
∂+ D
F1 + F3 fu x′ (t) + F2 + F3 fv y′ (t) dt F1 + F3 fu , F2 + F3 fv · T ds.
§ 8. Teoremi del rotore e della divergenza
545
Siamo quindi riusciti a trasformare un integrale curvilineo su ∂+ Σ in uno su ∂+ D. Possiamo applicare il Teorema di Gauss–Green a quest’ultimo integrale, ottenendo I I F · T ds = F1 + F3 fu , F2 + F3 fv · T ds ∂+ Σ ∂+ D " (5) ∂u F2 + F3 fv − ∂v F1 + F3 fu du dv. = D
A questo punto basta svolgere le derivate parziali presenti in quest’ultimo integrale per concludere. A tale scopo è utile scrivere esplicitamente gli argomenti delle funzioni: ∂u F2 (u, v, f (u, v)) + F3 (u, v, f (u, v)) fv (u, v) = ∂x F2 + ∂z F2 fu + ∂x F3 fv + ∂z F3 fu fv + F3 fuv e analogamente ∂v F1 (u, v, f (u, v)) + F3 (u, v, f (u, v)) fu (u, v) = ∂y F1 + ∂z F1 fv + ∂y F3 fu + ∂z F3 fv fu + F3 fvu . Sostituendo in (5) e semplificando otteniamo I " h i F · T ds = ∂x F2 + ∂z F2 fu + ∂x F3 fv − ∂y F1 + ∂z F1 fv + ∂y F3 fu du dv, ∂+ Σ
D
che è proprio il secondo membro di (4).
(X.43) Esempio. Consideriamo il campo F(x, y, z) = −y3 i + x3 j − z3 k. Calcoliamo il lavoro compiuto da F per spostare un punto materiale lungo l’ellisse γ intersezione del cilindro x2 + y2 = 1 e del piano x + z = 3, orientata in senso antiorario se vista dall’alto. A tale scopo possiamo utilizzare il teorema appena visto, infatti γ è una curva chiusa e quindi può essere interpretata come la frontiera (orientata) di una opportuna superficie. Se scegliamo n o Σ = (x, y, z) ∈ R3 : x2 + y2 ≤ 1, z = 3 − x , con parametrizzazione cartesiana r(u, v) = u i + v j + (3 − u) k, (u, v) ∈ n o D = (u, v) ∈ R2 : u2 + v2 ≤ 1 , è immediato vedere che ∂+ Σ = γ (con l’orientazione indotta da r). Da un lato abbiamo ru × rv = i + k, dall’altro 0 j k i ∂ 0 rot F = det x ∂ y ∂z = . 3 3x2 + 3y2 −y x3 −z3 Otteniamo " " I 0, 0, 3u2 + 3v2 · (1, 0, 1) du dv rot F · N dσ = F · T ds = γ
Σ
=
"
D
Z 2 2 3 u + v du dv = D
3 = π. 2
2π
Z
1
"
r4 3r · r dr dϑ = 6π 4
#r=1
2
0
0
r=0
In effetti esistono infinite superfi-
ci la cui frontiera è data da γ, ed il Teorema del rotore ci assicura che l’integrale non dipende dalla superficie scelta. Per questo motivo cercheremo sempre di scegliere la superficie che comporta il minor numero di calcoli (nell’esempio, quella piana).
546
Integrali su curve e superfici
Per usare la definizione di lavoro, occorre parametrizzare γ, per esempio come r(t) = cos t i + sin t j + (3 − cos t) k,
t ∈ [0, 2π].
Infatti
Applicando ripetutamente le formule di bisezione si ha
Z
Z
I γ
F · T ds =
Z
2π
h
0 2π
=
h
2π
i
− sin3 t · (− sin t) + cos3 t · cos t − (3 − cos t)3 · sin t dt 4
4
0
Z 2π "
1 − cos 2t 2
2
" =
i
sin t + cos t dt
0
(3 − cos t)3 sin t dt
1 + cos 2t + = 2 0 Z 2π 1 1 + cos 4t 3 = + dt = π. 2 4 2 0
(3 − cos t)4 4
#2π = 0. 0
2 # dt
Ovviamente,
se pur in modo più laborioso, abbiamo ottenuto lo stesso risultato.
Grazie al Teorema di Stokes, che è l’analogo tridimensionale di quello di Gauss–Green, possiamo estendere la proposizione (X.20), vista a pagina 527, al caso di campi vettoriali non necessariamente piani. (X.44) Supponiamo che l’insieme A goda della seguente proprietà: se γ è una curva chiusa e regolare contenuta in A, allora è la frontiera (orientata) di una superficie Σ tutta contenuta in A. Se F : A ⊂ R3 → R3 è un campo di classe C1 e irrotazionale, allora F è conservativo su A. A mo’ d’esempio, il campo gravitazionale generato da una massa puntiforme (o quello elettrostatico generato da una carica puntiforme) è irrotazionale su A = R3 r {(0, 0, 0)}. Anche se la dimostrazione rigorosa è molto complicata, appare abbastanza intuitivo che qualunque curva chiusa in R3 che non passa per l’origine è la frontiera di una superficie che non contiene l’origine. Ne segue che tale campo è conservativo.
Teorema della divergenza Come preannunciato, il risultato di questo paragrafo mette in relazione integrali tripli con quelli di superficie. Iniziamo ad enunciarlo nella situazione più semplice, per discuterne poi qualche generalizzazione. Consideriamo una regione solida limitata E ⊂ R3 , che supponiamo semplice rispetto a tutti e tre gli assi (si veda la Definizione (IX.41) a pagina 489). La sua frontiera è allora costituita da una singola superficie, che supponiamo regolare. Tale superficie risulta inoltre orientabile: sceglieremo come orientazione quella indotta dalla normale esterna, che indicheremo con Ne . La normale esterna alla frontiera di una regione solida è il versore normale alla superficie che punta all’esterno del solido stesso.
Al
solito, A è aperto e connesso. Le ipotesi (le proprietà di A) delle proposizioni (X.44) e (X.20) possono essere indebolite e generalizzate come segue: ogni curva chiusa in A, continua e parametrizzata da γ : [0, 1] → A, γ(0) = γ(1), è tale che γ può essere deformata in A ad una mappa costante su γ(0) = γ(1), cioè esiste una funzione continua H : [0, 1] × [0, 1] → A tale che per ogni t ∈ [0, 1] si ha H(0, t) = γ(t), H(1, t) = γ(0) = γ(1), e per ogni s ∈ [0, 1] H(s, 0) = γ(0) = H(s, 1). Se A ha questa proprietà (per ogni γ) si dice semplicemente connesso. Quindi sia (X.44) che (X.20) sono corollari della seguente proposizione (che non dimostriamo): Un campo di vettori C1 e irrotazionale su un dominio semplicemente connesso è sempre conservativo. Si veda l’Esercizio 6 per una dimostrazione semplice di (X.44).
§ 8. Teoremi del rotore e della divergenza
547
(X.45) Teorema della divergenza (Gauss). Siano ➔ E ⊂ R3 una regione solida, semplice rispetto a tutti e tre gli assi, la cui frontiera ∂E è una superficie regolare, avente normale esterna Ne ;
Abbiamo definito la divergenza di un campo vettoriale F a pagina 356 come lo scalare div F = ∂x F1 + ∂ y F2 + ∂z F3 .
➔ F : A ⊂ R3 → R3 un campo vettoriale di classe C1 (con A aperto ed E ⊂ A). Allora il flusso di F attraverso ∂E è uguale all’integrale triplo su E della divergenza di F: " $ F · Ne dσ. div F dx dy dz = ∂E
E
Dimostrazione. Dato che div F = ∂x F1 + ∂y F2 + ∂z F3 otteniamo subito che il primo membro della formula che vogliamo dimostrare vale $ div F dx dy dz E $ $ $ = ∂x F1 dx dy dz + ∂y F2 dx dy dz + ∂z F3 dx dy dz. E
E
E
D’altra parte, il secondo membro vale " " " " F · Ne dσ = F1 i · Ne dσ + F2 j · Ne dσ + F3 k · Ne dσ. ∂E
∂E
∂E
Per concludere la dimostrazione del teorema possiamo quindi verificare che ciascuno degli addendi a secondo membro della prima equazione è uguale al corrispondente addendo nella seconda. Dimostriamo ad esempio che $ " ∂z F3 dx dy dz = F3 k · Ne dσ, ∂E
E
e per questo sfruttiamo il fatto che E è z–semplice, cioè che si può scrivere come n o E = (x, y, z) ∈ R3 : (x, y) ∈ D, 11 (x, y) ≤ z ≤ 12 (x, y) , dove D è la proiezione di E sul piano xy. Sfruttando la formula di integrazione iterata abbiamo ! $ " Z 12 (x,y) ∂z F3 (x, y, z) dz dx dy ∂z F3 dx dy dz = 11 (x,y) E D (6) " = F3 (x, y, 12 (x, y)) − F3 (x, y, 11 (x, y)) dx dy. D
D’altra parte possiamo vedere la superficie ∂E come l’unione di tre parti: la “base inferiore” Σ1 , la “base superiore” Σ2 , ed infine la “superficie laterale” Σ3 che si proietta su ∂D (si veda la Figura X.17). Ora, su Σ3 vale Ne · k = 0, infatti Ne è parallelo al piano xy mentre k è verticale. Otteniamo perciò che " " " F3 k · Ne dσ = F3 k · Ne dσ + F3 k · Ne dσ. ∂E
Σ1
F X.17
∂E
Σ2
Le formule $
∂x F1 dx dy dz =
"
e $
∂ y F2 dx dy dz =
"
E
E
∂E
∂E
F1 i·Ne dσ
F2 j·Ne dσ,
si dimostrano in modo analogo, sfruttando il fatto che E è anche x– semplice ed y–semplice, rispettivamente.
548
Integrali su curve e superfici
Entrambe le superfici sono cartesiane. Iniziamo considerando Σ2 , che è parametrizzata da r(u, v) = u i + v j + 12 (u, v) k, con (u, v) ∈ D. Otteniamo subito che k · Ne dσ = k · (ru × rv ) du dv = du dv, perciò "
Σ2
F3 (x, y, z) k · Ne dσ =
"
Infatti ru × rv = (−∂u 12 , −∂v 12 , 1),
F3 (u, v, 12 (u, v)) du dv.
D
Per Σ1 possiamo ragionare in modo del tutto analogo, ricordando però che stavolta Ne punta verso il basso; otteniamo " " F3 (x, y, z) k · Ne dσ = − F3 (u, v, 11 (u, v)) du dv. D
Σ1
Quindi "
∂E
F3 k · Ne dσ =
"
D
F3 (u, v, 12 (u, v)) du dv −
"
F3 (u, v, 11 (u, v)) du dv,
D
da cui, tenendo conto della (6), ricaviamo subito la tesi.
Come abbiamo detto, il teorema appena dimostrato vale sotto ipotesi più generali: con ragionamenti analoghi a quelli visti per estendere il Teorema di Gauss–Green possiamo anche considerare solidi che siano l’unione di un numero finito di regioni semplici rispetto a tutti e tre gli assi, o con frontiera solamente regolare a pezzi. (X.46) Esempio. Consideriamo il campo vettoriale F = 2xy2 i + 2x2 y j + (x2 + y2 )z2 k e la superficie chiusa Σ, frontiera del cilindro solido E = {(x, y, z) ∈ R3 : x2 + y2 ≤ 4, 0 ≤ z ≤ 2}. Applichiamo il teorema appena visto per calcolare il flusso di F uscente da Σ. Abbiamo div F = 2y2 + 2x2 + 2z(x2 + y2 ) = 2(x2 + y2 )(z + 1), da cui "
∂E
che punta verso l’alto, perciò in senso concorde a quello della normale esterna.
$
$
2(x2 + y2 )(z + 1) dx dy dz ! Z 2 " 2 2 2(z + 1) dz dx dy (x + y ) = 0 D " (x2 + y2 ) dx dy, =8
F · Ne dσ =
div F dx dy dz =
E
D
E
n o dove D = (x, y) ∈ R2 : x2 + y2 ≤ 4 . Passando in coordinate polari otteniamo infine " 4 #r=2 Z 2π Z 2 " r 2 F · Ne dσ = 8 r · r dr dϑ = 16π = 64π. 4 r=0 ∂E 0 0
Si
veda ad esempio l’Esercizio (X.6) a pagina 555.
§ 8. Teoremi del rotore e della divergenza
Le equazioni di Maxwell e di continuità
La legge di Gauss asserisce che la carica totale entro un volume V è proporzionale al flusso elettrico: " E · Ne dσ Q(V) = ε0 Σ
in base al Teorema della divergenza abbiamo pertanto, per ogni regione solida V: $ Q(V) ε0 div E dx dy dz. = Volume (V) Volume (V) V Passando al limite al tendere a zero della diagonale, su parallelepipedi del tipo [x, x + ∆x] × [y, y + ∆y] × [z, z + ∆z], otteniamo che, in ogni punto, la divergenza del campo elettrico è proporzionale alla densità di carica σ: ε0 div E = σ.
549
In modo molto simile si perviene ad una formulazione differenziale del principio della conservazione della massa per un fluido di densità ρ(x, t) e campo di velocità u(x, t). Il flusso uscente da una regione solida V rappresenta la massa di fluido uscente da V nell’unità di tempo: ovverosia, detta m(V) la massa presente nella regione solida V, " $ d − m(V) = ρu·N dσ = div(ρu) dx dy dz. dt ∂+ V V # ρ dx dy dz e dunque, D’altra parte m(V) = V derivando sotto il segno di integrale si ottiene l’uguaglianza, valida per ogni regione solida V, $ $ ∂ρ dx dy dz = div(ρu) dx dy dz, − V V ∂t da cui l’identità puntuale, detta equazione di continuità ∂ρ = div(ρu). − ∂t
Al solito avremmo potuto anche calcolare il flusso richiesto mediante la definizione; invitiamo il Lettore a svolgere l’utile, per quanto calcolosa, verifica. Il Teorema della divergenza si generalizza facilmente ai domini che sono unioni di un numero finito di regioni solide soddisfacenti le ipotesi del teorema, purché esse si intersechino vicendevolmente soltanto attraverso un numero finito di porzioni delle loro frontiere, e che tali porzioni siano a loro volta superfici regolari a pezzi. Infatti i flussi attraverso le parti comuni della frontiera si elidono, poiché la normale interna ad una delle parti è esterna a quella adiacente. Con tale estensione possiamo estendere il Teorema della divergenza a domini che presentino dei buchi sferici e pervenire ad un’applicazione di importanza fondamentale in elettrostatica, la legge di Gauss. (X.47) Esempio (Legge di Gauss). Consideriamo il campo elettrico E generato da N cariche puntiformi di posizioni xi e cariche Qi , contenute entro una superficie Σ. Dimostriamo che il flussoPuscente dalla superficie Σ è uguale a 4πεQ, dove Q è la carica totale: Q = i Qi . Scriviamo il campo totale come somma dei campi generati da ciascuna carica E=
N X i=1
Ei = ε
N X i=1
Qi
r − xi , kr − xi k3
di modo che il flusso totale sia la somma dei flussi elettrici dei campi Ei . Per calcolare l’i-esimo di tali flussi, sottraiamo al volume V delimitato da Σ una sfera Bai (xi ) di raggio ai > 0 e centro xi ∈ V, che sia completamente
Si
veda pagina 561.
l’Esercizio
(X.13)
a
550
Integrali su curve e superfici
contenuta in V. Chiamiamo Vi il sottoinsieme corrispondente. Il campo elettrico Ei = εQi
r − xi kr − xi k3
è ora di classe C1 su un aperto contenente Vi Sotto le ipotesi di regolarità su Σ richieste da tale teorema, possiamo applicare il Teorema della divergenza. A tale fine è fondamentale osservare che la divergenza di Ei è nulla . Pertanto applicando il Teorema della divergenza troviamo " " $ Ei · Ne dσ Ei · N dσ = div Ei dx dy dz = 0= ∂+ Vi
Vi
Infatti,
abbiamo rimosso dal volume originario V la singolarità xi .
Come
abbiamo mostrato a suo tempo nell’Esempio (VII.52) a pagina 357.
Σ∪∂Bai (xi )
Notiamo che, su ciascuna delle sferette ∂Bai , il vettore normale uscente da Vi è diretto verso l’interno della sferetta: possiamo quindi scrivere, ricordando il valore del flusso elettrico uscente dalla superficie di una sfera calcolato nell’Esempio (X.39), 0=
"
Σ∪∂Bai (xi )
Ei · Ne dσ =
"
Σ
E · Ne dσ − =
"
∂+ Bai (xi )
"
Σ
Ei · N dσ
E · Ne dσ − 4πεQi .
In
Sommando tutti i flussi parziali otteniamo il valore del flusso totale: "
Σ
E · Ne dσ =
N " X i=1
∂+ Bai (xi ))
Ei · Ne dσ = 4πε
N X
Qi = 4πεQ.
i=1
fisica si pone 4πε = 1/ε0 , dove ε0 è detta costante dielettrica del vuoto. Con questa convenzione la legge di Gauss recita: la carica totale entro la superficie Σ è uguale a ε0 per il flusso elettrico attraverso Σ.
Esercizi (X.1) Un filo γ, di densità lineare di massa costante, è dislocato lungo la cicloide di parametrizzazione r(t) = (t − sin t) i + (1 − cos t) j,
t ∈ [0, 2π].
Calcolare le coordinate del baricentro di γ. Soluzione. Dato che la densità di massa è costante abbiamo R R y ds x ds γ γ , , y¯ = R . x¯ = R ds ds γ γ
Stiamo
Abbiamo r′ (t) = (1 − cos t) i + sin t j, perciò
Infatti, se 0 ≤ t ≤ 2π,
p kr′ (t)k = 1 − 2 cos t + cos2 t + sin2 t = 2
r
t 1 − cos t = 2 sin . 2 2
usando le formule (1) a pagina 517. Ovviamente la curva è piana perciò z¯ = 0.
t t |sin | = sin . 2 2 In particolare, la parametrizzazione è regolare eccetto nei due punti corrispondenti a t = 0, t = 2π.
Esercizi
551
Otteniamo subito Z 2π Z t t 2π = 8. ds = 2 sin dt = −4 cos 2 2 0 γ 0
Stiamo
usando la Definizione (X.1) a pagina 516.
Calcoliamo ora gli integrali a numeratore. Abbiamo Z
Z
2π
x ds = γ
t dt, 2
(t−sin t)·2 sin 0
Z
Z
2π
y ds = γ
(1−cos t)·2 sin 0
t dt. 2
Integrando per parti otteniamo Z
2π 0
Z 2π t t 2π t − −4 cos dt 2t sin dt = 2t −2 cos 2 2 0 2 0 t 2π = 8π + 8 sin = 8π. 2 0
D’altra parte, utilizzando le formule di Werner, Z
Z
3t t − cos dt = 0 2 2 0 0 Z 2π Z 2π 8 3t t t − sin + sin dt = . −2 cos t sin dt = 2 2 2 3 0 0 2π
t −2 sin t sin dt = 2
2π
cos
Mettendo assieme le informazioni trovate otteniamo 8π + 0 x¯ = = π, 8π
E tenendo conto che Z
2π
2 sin
8 + 8/3 4 y¯ = = . 8 3
0
t dt = 8. 2
(X.2) Calcolare, al variare della costante α ∈ R, il lavoro compiuto dal campo vettoriale F(x, y, z) = exz (xz + yz + α) i + exz j + exz (x2 + xy) k lungo la curva n o γ = (x, y, z) ∈ R3 : y = x2 , xz = 1, 1 ≤ x ≤ 2 percorsa nel verso delle x crescenti. Soluzione. Possiamo ottenere una parametrizzazione di γ scegliendo x = t come parametro. Si ottiene subito che γ è parametrizzata da r(t) = t i + t2 j +
1 k, t
t ∈ [1, 2].
È
immediato verificare che γ è regolare e che F è di classe C1 .
552
Integrali su curve e superfici
Stiamo
usando la Definizione (X.5) a pagina 520.
Perciò Z
Z γ
F · T ds =
Z
2
F(r(t)) · r′ (t) dt
1
1 e(1 + t + α), e, e(t2 + t3 ) · 1, 2t, − 2 dt t 1 Z 2 h i2 (1 + t + α + 2t − 1 − t) dt = αt + t2 = (α + 3)e. =e 2
=
1
1
(X.3) Determinare, se esistono, i valori di α per cui il campo vettoriale F del precedente esercizio è conservativo. Per tali valori determinarne un potenziale e verificare il risultato del precedente esercizio. Soluzione. In base alla Proposizione (X.16) a pagina 525, se rot F , 0 allora F non è conservativo. Abbiamo xz xz i j k xe − xe −∂ F + ∂ F ∂x ∂y ∂z rot F = det = x 3 z 1 . xz xz xz xz 2 e (xz + yz + α) e e (x + xy) ze − zexz Quindi la prima e la terza componente di rot F sono nulle per ogni valore di α. La seconda vale −∂x F3 + ∂z F1 = −zexz (x2 + xy) − exz (2x + y) + xexz (xz + yz + α) + exz (x + y) = exz (−x2z − xyz − 2x − y + x2 z + xyz + αx + x + y) = exz (α − 1)x.
Perciò se α , 1 F non è conservativo. Se invece α = 1 possiamo utilizzare la Procedura (X.15) a pagina 525 e costruire un candidato potenziale U, per poi vedere direttamente se F è effettivamente conservativo o meno (oppure, appoggiandoci sulla Proposizione (X.44) a pagina 546, osservare che per α = 1 sicuramente F è conservativo: infatti è irrotazionale ed è definito e di classe C1 su tutto R3 ; in ogni caso dovremmo poi determinare un potenziale). Seguendo quanto visto nell’Esempio (X.14) a pagina 524, consideriamo i tre segmenti γ1 , che congiunge (0, 0, 0) a (x, 0, 0), γ2 , che congiunge (x, 0, 0) a (x, y, 0), e γ3 , che congiunge (x, y, 0) a (x, y, z). Otteniamo Z x Z (1, . . . , . . . ) · (1, 0, 0) dt = x F · T ds = Z
Z
γ1
γ1
γ1
0
Z
F · T ds =
0
y
(. . . , 1, . . . ) · (0, 1, 0) dt = y
Z z h iz . . . , . . . , ext (x2 + xy) · (0, 0, 1) dt = ext (x + y) F · T ds = 0 xz
= e (x + y) − (x + y).
0
⊚ ATTENZIONE! Stiamo cercan-
do i valori di α per cui, per ogni valore di x, y e z, il rotore F è nullo. Il fatto che il rotore sia nullo per x = 0 non è di alcuna utilità.
Visto che F è definito su R3 , i segmenti considerati appartengono al dominio di F, perciò ci limitiamo a calcolare i termini che non vengono moltiplicati per 0. Osserviamo che l’ultimo integrale è valido anche per x = 0. Ricordiamo infine che α = 1.
Esercizi
553
Quindi il candidato potenziale, che è dato dalla somma dei tre contributi, vale U(x, y, z) = exz (x + y). È immediato verificare che U è di classe C2 su tutto R3 e che ∇U = F, perciò, per α = 1, F è conservativo ed U è un suo potenziale. Infine, se γ è la curva dell’esercizio precedente, allora i suoi estremi valgono r(1) = (1, 1, 1) e r(2) = (2, 4, 1/2), perciò Z F · T ds = U(2, 4, 1/2) − U(1, 1, 1) = 6e − 2e = 4e, γ
in accordo con quanto avevamo già trovato (se α = 1 allora (α+3)e = 4e). (X.4) Dato il campo vettoriale F(x, y, z) =
! √ y 1 x i + (2y + z) j + √ − 2 k, z 2 z z
z > 0,
verificare che è conservativo calcolandone un potenziale per “ispezione diretta” (si veda l’Esempio (X.22) a pagina 529). Soluzione. Se F ammette un potenziale U allora, integrando rispetto ad x, Z Z x 1 dx = + C1 (y, z), ∂x U = F1 =⇒ U(x, y, z) = F1 (x, y, z) dx = z z dove la costante di integrazione C1 lo è rispetto ad x, ma potrebbe dipendere da y e z. Analogamente Z √ √ ∂ y U = F2 =⇒ U(x, y, z) = (2y + z) dy = y2 + y z + C2 (x, z) e Z ∂z U = F3 =⇒ U(x, y, z) =
! √ y x x − dz = y z + + C3 (x, y). √ 2 z 2 z z
Ora dobbiamo confrontare le tre diverse espressioni di U: se riusciamo a renderle coerenti avremo verificato che F è conservativo (e calcolato un suo potenziale). Dalla prima e la terza abbiamo √ √ x x + C1 (y, z) = y z + + C3 (x, y) =⇒ C3 (x, y) = −y z + C1 (y, z). z z Visto che il secondo membro dell’ultima equazione è costante in x anche il primo deve esserlo, quindi √ C3 (x, y) = D(y) e C1 (y, z) = y z + D(y). Utilizzando anche il secondo integrale otteniamo √ √ x x y2 + y z + C2 (x, z) = y z + + D(y) =⇒ C2 (x, z) − = D(y) − y2 . z z
554
Integrali su curve e superfici
Ora, il secondo membro è costante in x e z, il primo è costante in y, e devono essere uguali. Ne segue che devono essere entrambi uguali alla medesima costante C. Otteniamo x D(y) = y2 + C e C2 (x, z) = + C. z Sostituendo in tutte e tre le espressioni di U otteniamo la medesima equazione √ x U(x, y, z) = + y2 + y z + C. z È immediato verificare che ∇U = F, quindi F è conservativo ed U è un suo potenziale. (X.5) Si utilizzi la Procedura (X.15) per dimostrare che il campo F=
x2
−y x i+ 2 j, 2 +y x + y2
dell’Esempio (X.19) è conservativo su A = R2 r (x, y) : y = 0, x < 0 , cioè sul piano privato della semiretta delle x negative. Soluzione. Seguendo quanto visto nell’Esempio (X.21) a pagina 528 scegliamo come punto di partenza P0 = (1, 0) e lo congiungiamo con il generico P = (x, y) = (r cos ϑ, r sin ϑ), mediante l’unione del segmento γ1 che congiunge (1, 0) ad (r, 0) e dell’arco di circonferenza γ2 , di raggio r, che va da (r, 0) a (r cos ϑ, r sin ϑ). L’integrale di F lungo γ1 è sempre nullo: infatti, se ad esempio r ≥ 1, una parametrizzazione di γ1 è data da r1 (t) = t i, con t ∈ [1, r], da cui Z r Z t F · T ds = 0, 2 · (1, 0) dt = 0. t γ1 1
Qui
r > 0 e, data la forma del dominio, −π < ϑ < π.
Se
0 < r < 1 allora r1 (t) = −t i, con t ∈ [−1, −r], e di nuovo Z 1 Z −t F·T ds = 0, 2 ·(−1, 0) dt = 0. t γ1 r
Possiamo invece parametrizzare γ2 , per ϑ ≥ 0, come r2 (t) = r cos t i + r sin t j, con t ∈ [0, ϑ]. Abbiamo Z ϑ Z Z ϑ −r sin t r cos t F · T ds = , · (−r sin t, r cos t) dt = dt = ϑ. r2 r2 γ2 0 0
Se invece ϑ < 0 γ2
Ne ricaviamo che
Per tornare ad esprimere ϑ in fun-
y arctan + π x π 2 Z y F · T ds = ϑ = U(x, y) = arctan x γ π − 2 y arctan − π x
x < 0, y > 0 x = 0, y > 0 x>0 x = 0, y < 0 x < 0, y < 0
è parametrizzato da r2 (t) = r cos(−t) i +r sin(−t) j, con t ∈ [0, −ϑ], e di nuovo Z F · T ds = ϑ. γ2
zione di (x, y) è necessario ricordare che tan ϑ = y/x e che −π/2 < arctan k < π/2 per ogni k, oltre al fatto che abbiamo scelto −π < ϑ < π.
Esercizi
555
Ora, è facile verificare che, data una qualunque costante C, si ha ! −y y x ∇ arctan + C = 2 , = F, x x + y2 x2 + y2 Con un po’ di pazienza è facile vedere che la funzione U che abbiamo costruito è di classe C2 e che è un potenziale del campo F, conservativo su A. Come abbiamo visto nell’Esempio (X.19) F non è però conservativo su R2 r{(0, 0)}. Infatti U non può essere esteso a tutto A in modo continuo, infatti, se x0 < 0 è fissato, abbiamo lim U(x0 , y) = π,
y→0+
mentre
lim U(x0, y) = −π.
y→0−
(X.6) Dimostrare il Teorema di Gauss–Green nel caso in cui D sia l’unione di un numero finito di regioni normali rispetto ad entrambi gli assi, nel senso seguente: D = ∪ni=1 Di con Di semplice rispetto ad entrambi gli assi e per ogni i , j, Di e D j (i , j) hanno in comune solo tratti di frontiera regolare. Soluzione. Grazie all’additività rispetto ai domini dell’integrale doppio si ha " n " X (∂x F2 − ∂ y F1 ) dx dy = (∂x F2 − ∂ y F1 ) dx dy. D
i=1
Di
Applicando la formula di Green su ciascuna Di si trova "
D
(∂x F2 − ∂ y F1 ) dx dy =
n I X i=1
∂+ Di
F · T.
Osserviamo ora che gli integrali di linea lungo le frontiere comuni di due regioni adiacenti compaiono 2 volte nella sommatoria, con orientazione opposta: quindi si elidono nella somma totale, e rimangono solo gli integrali lungo archi di curva che compongono ∂+ D. Si ha quindi I
n I X i=1
∂+ Di
F·T =
∂+ D
F · T,
che dimostra la formula di Green per il dominio D. Vale la pena di osservare che il teorema di Green vale anche per regioni che contengono buchi, come in Figura X.18. Infatti è sempre possibile dividere regioni di questo tipo con un numero opportuno di “tagli” in modo che ciascuna sottoregione sia normale rispetto ad entrambi gli assi.
F X.18: decomposizione di una regione con buchi.
556
Integrali su curve e superfici
(X.7) Sia r(u, v) = φ(u, v) i + ψ(u, v) j + η(u, v) k,
(u, v) ∈ D
una parametrizzazione regolare della superficie Σ, e supponiamo che la funzione
′
T: D → D ,
" # " # x φ(u, v) T(u, v) = = y ψ(u, v)
sia biunivoca tra D e D′ , con determinante jacobiano sempre non nullo. Posto f (x, y) = η ◦ T −1 (x, y) = η(u(x, y), v(x, y)) verificare che " q " 1 + k∇ f k2 dx dy. kru × rv k du dv = D′
D
Soluzione. Poniamo q a(x, y) = 1 + k∇ f (x, y)k2
e
b(u, v) = kru (u, v) × rv (u, v)k,
di modo che la formula da verificare si riscriva come " " a(x, y) dx dy. b(u, v) du dv = D′
D
Le condizioni richieste su T fanno sì che siano verificate le ipotesi del Teorema (IX.28) a pagina 481 di cambiamento di variabile negli integrali doppi. Possiamo quindi scrivere " " a(φ(u, v), ψ(u, v)) · |det JT (u, v)| du dv, a(x, y) dx dy = D′
D
perciò ci basta dimostrare che a(φ(u, v), ψ(u, v)) · |det JT (u, v)| = b(u, v). Poniamo infine j(u, v) = det JT (u, v) = φu ψv − φv ψu . Da un lato q (7) a(φ(u, v), ψ(u, v)) · |det JT (u, v)| = | j| 1 + fx (φ, ψ)2 + f y (φ, ψ)2 . Dall’altro
i ru × rv = det φu φv
j ψu ψv
k ψu ηv − ψv ηu ηu = ηu φv − ηv φu . ηv j
Ora, visto che η(u, v) = f (φ(u, v), ψ(u, v)), otteniamo ηu = fx φu + f y ψu e ηv = fx φv + f y ψv , perciò fx φv ψu + f y ψv ψu − fx φu ψv − f y ψu ψv − j fx (φ, ψ) f φ φ + f ψ φ − f φ φ − f ψ φ − j f (ψ, φ) ru × rv = x u v . y u v x v u y v u = y φu ψv − φv ψu j
Esercizi
In definitiva b(u, v) =
557
q j2 fx (φ, ψ)2
+
j2 f
y
(ψ, φ)2
+
j2
q = | j| 1 + fx (φ, ψ)2 + f y (φ, ψ)2 ,
da cui, confrontando con (7), si ottiene la tesi. (X.8) Determinare l’area di quella parte di superficie cilindrica di equazione x2 + y2 = 2x che si trova dentro la sfera x2 + y2 + z2 = 4. Soluzione. La superficie Σ di cui è richiesta l’area, rappresentata in Figura X.19, si esprime come n o Σ = (x, y, z) ∈ R3 : x2 + y2 = 2x, x2 + y2 + z2 ≤ 4 . Le variabili x e y sono legate da un’equazione, perciò cerchiamo di esprimerle mediante un unico parametro. L’equazione in questione è quella di una circonferenza nel piano xy avente centro in (1, 0) e raggio unitario; una possibile parametrizzazione di tale circonferenza è data da x = 1 + cos u, y = sin u, con u ∈ [0, 2π]. D’altra parte, z è libera di variare, per cui scegliamo il secondo parametro in modo che z = v. Tenendo conto delle limitazioni imposte abbiamo che Σ è parametrizzata da r(u, v) = (1 + cos u) i + sin u j + v k, p p − 2(1 − cos u) ≤ v ≤ 2(1 − cos u), 0 ≤ u ≤ 2π.
Alternativamente, usando le coor-
dinate polari con polo nell’origine, la circonferenza si scrive come r2 = 2r cos ϑ, da cui r = 2 cos ϑ e x = 2 cos2 ϑ, y = 2 sin ϑ cos ϑ, con ϑ ∈ [−π/2, π/2]. Invitiamo il Lettore a svolgere l’esercizio autonomamente usando questa differente parametrizzazione.
Ora che abbiamo parametrizzato Σ dobbiamo calcolare dσ. Abbiamo j k cos u i − sin u cos u 0 sin u =⇒ kru × rv k = 1, ru × rv = det = 0 0 0 1 da cui dσ = kru × rv k du dv = du dv ed infine Z 2π Z √2(1−cos u) " √ dσ = Area(Σ) = dv du Σ 0 − 2(1−cos u) Z 2π Z 2π r 1 − cos u u u 2π = 16. du = 4 sin du = −8 cos =4 2 2 2 0 0 0 (X.9) (Interpretazione geometrica dell’integrale curvilineo) Sia γ una curva (regolare) contenuta nel piano xy ed f : R2 → R una funzione continua e positiva (o comunque non negativa su γ). Consideriamo il cilindroide Σ che si appoggia su γ, compreso tra il piano xy ed il grafico di f , vale a dire n o Σ = (x, y, z) ∈ R3 : (x, y) ∈ γ, 0 ≤ z ≤ f (x, y) . Verificare che Area(Σ) =
R
γ
f ds.
F X.19
558
Integrali su curve e superfici
Soluzione. Se γ è parametrizzata da p(t) = x(t) i + y(t) j, con t ∈ [a, b], possiamo usare u = t come primo parametro per Σ e v = z come secondo parametro. Otteniamo che Σ è parametrizzata da
Come da ipotesi supponiamo p di classe C1 con kp′ k , 0.
0 ≤ v ≤ f (x(u), y(u)), a ≤ u ≤ b.
r(u, v) = x(u) i + y(u) j + v k, Si ha i ru × rv = det x′ (u) 0
k y′ (u) 0 = −x′ (u) . 1 0
j y′ (u) 0
Quindi q kru (u, v) × rv (u, v)k =
(y′ (u))2 + (x′ (u))2 = kp′ (u)k,
Osserviamo che se
da cui Area(Σ) =
"
Z
Z
!
f (x(u),y(u)) ′
dσ = a
Σ b
Z
b
0
kp (u)k dv du Z
f (x(u), y(u))kp′(u)k du =
=
f ds.
f ≡ 1 allora Σ può essere vista come un rettangolo di altezza 1 e di base Lunghezza(γ), piegato in modo tale da appoggiarsi su γ. con quest interpretazione si trova di nuovo la formula per la lunghezza di γ.
γ
a
(X.10) Calcolare l’area della porzione del semicilindro circolare x2 + y2 = 1, y ≤ 0 compresa tra i piani z = 0 e z = −y. Soluzione. Tenendo presente quanto visto nell’esercizio precedente, si tratta di calcolare l’integrale curvilineo di f (x, y) = −y lungo n o γ = (x, y) ∈ R2 : x2 + y2 = 1, y ≤ 0 .
Infatti
f è non negativa su γ.
Parametrizzando γ con r(t) = cos t i+sin t j, t ∈ [π, 2π] otteniamo kr′ (t)k ≡ 1 e quindi Z 2π Z −y ds = − sin t dt = 2. Area = γ
π
(X.11) Data la regione solida illimitata (in x) 1 E = (x, y, z) : x ≥ 1, y2 + z2 ≤ 2 , x è possibile definirne il volume e la superficie come limite, per b → +∞, delle corrispondenti quantità calcolate per la regione n o Eb = E ∩ (x, y, z) ∈ R3 : x ≤ b . Determinare il volume e l’area di E.
Dato
che la regione è illimitata nella sola direzione x utilizziamo le definizioni proprie della teoria degli integrali impropri per funzioni di una variabile.
Esercizi
559
Soluzione. Il volume di Eb è dato da " Volume(Eb ) = dx dy dz = dy dz dx Eb 1 { y2 +z2 ≤1/x2 } Z b Z b n o 1 2 2 2 = Area( y + z ≤ 1/x ) dx = π 2 dx x 1 1 b 1 1 =π 1− , =π − x 1 b Z
$
b
perciò Volume(E) = limb→+∞ Volume(Eb ) = π è una quantità finita nonostante la regione sia illimitata. La superficie “laterale” Σb di Eb può invece essere parametrizzata mediante r(u, v) = u i +
1 1 cos v j + sin v k, u u
(u, v) ∈ [1, b] × [0, 2π],
da cui j i ru × rv = det 1 − u12 cos v 0 − u1 sin v
1 k − u3 − u12 sin v = − u1 cos v . 1 1 − u sin v u cos v
Otteniamo r kru (u, v) × rv (u, v)k =
1 1 1 + = u u6 u2
r
1 +1 u4
e quindi l’area di Σb vale Z b r " Z b Z 2π r 1 1 1 1 + 1 dv du = 2π + 1 du. dσ = 4 u u u4 1 u 0 Σb 1 L’integrale ottenuto appare piuttosto complesso da calcolare. Possiamo però passare al limite ottenendo l’integrale improprio Z +∞ r 1 1 Area(Σ) = 2π + 1 du. u u4 1 Sfruttando la teoria degli integrali impropri che abbiamo studiato nel primo volume otteniamo facilmente che l’integrale diverge, e quindi l’area della superficie laterale di E (e a maggior ragione quella della superficie totale) è infinita. Abbiamo ottenuto l’apparente paradosso di una regione di volume finito ma di superficie infinita: se potessimo costruire un barattolo della forma di ∂E non potremmo mai avere abbastanza vernice per colorarne le pareti, ma potremmo riempirlo con una quantità finita di vernice! Il paradosso è solo apparente, perché uno strato di vernice sulle pareti di ∂E ha spessore positivo, per quanto piccolo, e non nullo.
r 1 1 1 +1 > per ogni u u4 u u. Come è noto, l’integrale tra 1 e +∞ del secondo membro diverge e di conseguenza, per il criterio del confronto, anche quello del primo.
Infatti
560
Integrali su curve e superfici
(X.12) In riferimento all’Esempio (X.30) a pagina 535, se la striscia di carta ha dimensioni 8π × 2 e la torsione avviene in modo uniforme, una possibile parametrizzazione del nastro di Moebius Σ è data da u u u cos u i + 4 + v sin sin u j + v cos k, r(u, v) = 4 + v sin 2 2 2
Come il Lettore
scrupoloso potrà facilmente verificare, Esercizio 38 a pagina 567.
dove (u, v) ∈ [0, 2π] × [−1, 1]. Verificare che Σ è una superficie regolare fino al bordo, e che la terza condizione della relativa definizione vale con il segno meno. Soluzione. Sicuramente r è di classe C1 su tutto R2 . Abbiamo u v u ru (u, v) = −4 sin u − v sin sin u + cos cos u i 2 2 2 v u v u u + 4 cos u + v sin cos u + cos sin u j − sin k 2 2 2 2 2 e rv (u, v) = sin
u u u cos u i + sin sin u j + cos k. 2 2 2
Iniziamo a verificare che r è regolare all’interno di D, cioè che ru × rv , 0 per 0 < u < 2π, −1 < v < 1 (in realtà i calcoli risulteranno validi anche per v = ±1). È chiaro che il calcolo di ru × rv risulta estremamente laborioso, fortunatamente ci possiamo limitare a calcolarne la componente verticale. Abbiamo xu yv = −4 sin2 u sin xv yu = 4 cos2 u sin
u u v u u − v sin2 sin2 u + cos cos u sin sin u, 2 2 2 2 2
u u v u u + v sin2 cos2 u + cos sin u sin cos u, 2 2 2 2 2
Infatti da un lato sin(u/2) > 0 per
da cui, sottraendo, u u (ru × rv ) · k = xu yv − xv yu = − sin v sin + 4 , 0 per u , 0, 2π. 2 2 Ne segue che Σ è regolare all’interno di D. Veniamo ai punti corrispondenti a u = 0, 2π. Da un lato abbiamo, per esempio, r(0, 0) = 4 i + v k = r(2π, −v), dall’altro ru (0, v) × rv (0, v) = 4 i −
v j, 2
ru (2π, −v) × rv (2π, v) = −4 i +
v j. 2
Quindi ru × rv non si annulla neppure al bordo, e N(0, v) = −N(2π, v): la superficie Σ risulta regolare fino al bordo ma non orientabile.
0 < u < 2π, dall’altro sia sin(u/2) che v sono quantità di modulo minore di 1.
Anzi, lo è anche nei punti r(u, −1), r(u, 1), con 0 < u < 2π.
Esercizi
561
(X.13) Calcolare (mediante la definizione di flusso) il flusso del campo vettoriale F = 2xy2 i+2x2 y j+(x2 +y2 )z2 k uscente dalla superficie Σ, frontiera del cilindro solido E = {(x, y, z) ∈ R3 : x2 + y2 ≤ 4, 0 ≤ z ≤ 2}. Soluzione. La superficie data è una superficie regolare a pezzi, unione delle tre superfici regolari n o Σ1 = (x, y, z) ∈ R3 : x2 + y2 ≤ 4, z = 0 , n o Σ2 = (x, y, z) ∈ R3 : x2 + y2 ≤ 4, z = 2 , n o Σ3 = (x, y, z) ∈ R3 : x2 + y2 = 4, 0 ≤ z ≤ 2 . Possiamo quindi calcolare il flusso di F attraverso le tre superfici e poi sommare i tre contributi. Σ1 è parametrizzata da n o r1 (u, v) = u i + v j, (u, v) ∈ D1 = (u, v) : u2 + v2 ≤ 4 . Otteniamo subito ∂u r1 × ∂v r1 = i × j = k e F(r1 ) = 2uv2 i + 2u2 v j, perciò " " F(r1 ) · (∂u r1 × ∂v r1 ) du dv = 0. F · Ne dσ = − flusso1 = D1
Σ1
Analogamente Σ2 è parametrizzata da r2 (u, v) = u i + v j + 2 k,
n o (u, v) ∈ D2 = (u, v) : u2 + v2 ≤ 4 .
da cui ancora ∂u r2 × ∂v r2 = k e " F(r2 ) · (∂u r2 × ∂v r2 ) du dv flusso2 = D2 " (. . . , . . . , 4(u2 + v2 )) · (0, 0, 1) du dv = D2 2π
Z
Z
2
! 4r · r dr dϑ = 32π. 2
= 0
0
Infine Σ3 è parametrizzata da r3 (u, v) = 2 cos u i + 2 sin u j + v k,
(u, v) ∈ D3 = [0, 2π] × [0, 2].
Otteniamo i j ∂u r3 × ∂v r3 = det −2 sin u 2 cos u 0 0
k 2 cos u 0 = 2 sin u 1 0
ATTENZIONE! La normale a Σ1 , esterna rispetto ad E, è rivolta verso il basso. Questo è il motivo del segno meno (ininfluente) davanti al secondo integrale. Analogamente, per gli integrali successivi, è necessario controllare che ru ×rv sia concorde a Ne .
⊚
562
Integrali su curve e superfici
e quindi flusso3 =
"
F(r3 ) · (∂u r3 × ∂v r3 ) du dv
"
(16 cos u sin2 u, 16 cos2 u sin u, . . . ) · (2 cos u, 2 sin u, 0) du dv
D3
=
D3 2π
Z
Z
2
= 0
Z
! 64 cos2 u sin2 u dv du
0
Z
2π 2
=2
16 sin (2u) du = 16 0
0
2π
(1 − cos 4u) du = 32π.
Il
In definitiva il flusso richiesto vale 32π + 32π = 64π. (X.14) (Integrazione per parti) Sono dati il campo scalare 1 ed il campo vettoriale F, entrambi di classe C1 su R3 , e la regione solida E ⊂ R3 , semplice rispetto a tutti e tre gli assi, la cui frontiera ∂E è una superficie regolare, avente normale esterna Ne . Utilizzando opportunamente il Teorema della divergenza dimostrare la seguente formula di integrazione per parti (per integrali multipli): $ " $ 1 div F dx dy dz. 1F · Ne dσ − ∇1 · F dx dy dz = ∂E
E
E
risultato, ovviamente, concorda con quello trovato nell’Esempio (X.46) a pagina 548.
Il
Lettore può notare l’analogia con la formula di integrazione per parti per integrali di una variabile: Z b Z b f ′ 1 dt. f 1′ dt = [ f 1]ba − a
Soluzione. L’unico integrale di superficie della formula proposta corrisponde al flusso del campo vettoriale (di classe C1 ) 1F uscente da ∂E. Proviamo perciò ad applicare il Teorema della divergenza a tale campo. Otteniamo $ " div(1F) dx dy dz. (1F) · Ne dσ = ∂E
E
Ma dalle Regole (VII.54) viste a pagina 358 sappiamo che div(1F) = ∇1 · F + 1 div F. Basta perciò sfruttare la linearità dell’integrale e riarrangiare gli addendi per ottenere la formula richiesta. (X.15) Sfruttando il Teorema della divergenza, calcolare il flusso del campo F = (x + yz) i + (y − xz) j + (z − ex sin y) k uscente dalla superficie Σ, frontiera del solido E = {(x, y, z) ∈ R3 : x2 + y2 + z2 ≤ 4, x2 + y2 ≥ 1}. Soluzione. Dal Teorema della divergenza sappiamo che $ div F dx dy dz. flusso = E
a
Esercizi
563
Dobbiamo quindi calcolare la divergenza del campo, data dalla somma div F = ∂x F1 + ∂ y F2 + ∂z F3 dove ∂xF1 = 1,
∂yF2 = 1,
∂zF3 = 1.
Risulta allora flusso =
$
3 dx dy dz = 3 Volume(E).
E
Per calcolare il volume di E, osserviamo che data la simmetria della regione è sufficiente determinare il volume della porzione di E che vive nel primo ottante (ovvero dove tutte le coordinate sono positive) e moltiplicare il risultato per 8. Questa regione può facilmente essere descritta come regione semplice rispetto a z, dalle relazioni q E+ = {(x, y, z) ∈ R3 : x ≥ 0, y ≥ 0, 1 ≤ x2 + y2 ≤ 4, 0 ≤ z ≤ 4 − x2 − y2 }, dove D = {(x, y ∈ R2 : x ≥ 0, y ≥ 0, 1 ≤ x2 + y2 ≤ 4}. Volume(E+ ) =
" q D
Z
4 − x2 − y2 dx dy =
π/2 0
Z
2 1
√ 4 − r2 r dr dϑ
i2 π √ πh = − (4 − r2 )3/2 = 3. 1 6 2 √ 3 e infine il flusso del campo è pari a In totale si ha Volume(E) = 4π √ flusso = 12π 3.
✎ Diamoci da fare. . . (Soluzioni a pagina 643) b 1 Calcolare l’integrale curvilineo piano Z I= f ds. γ
(a) f (x, y) = 9x/4y, γ parametrizzata da r(t) = (t3 /3) i + (t4 /4) j, t ∈ [1, 2]; (b) f (x, y) = x, γ l’arco di parabola di equazione y = 1 − x2 nel primo quadrante;
(a) f (x, y, z) = x2 y/z, γ parametrizzata da r(t) = 3t i + 3t2 j + 2t3 k, t ∈ [1, 2];
(b) f (x, y, z) = −2xez , γ parametrizzata da r(t) = cos t i + sin t j + t k, t ∈ [0, π];
(c) f (x, y, z) = ln(x + y + z), γ il segmento che congiunge (1, 0, 1) a (0, 2, 3); √ (d) f (x, y) = 1 − xz, γ l’intersezione tra il cilindro x2 + z2 = 1 ed il piano x + y + z = 1.
b 3 Calcolare l’integrale curvilineo Z I= F · T ds, (d) f (x, y) = xy, γ l’arco di circonferenza di equazione γ x2 + y2 − 2y = 0 nel secondo quadrante. con γ parametrizzata da r. b 2 Calcolare l’integrale curvilineo (a) F(x, y) = x2 i+(x+ y) j, r(t) = t2 i+(t−t2 ) j, t ∈ [0, 1]; Z (b) F(x, y, z) = (x + z) i + (z + y) j + (y + x) k, I= f ds. r(t) = t i + sin t j + cos t k, t ∈ [0, 2π]; γ (c) f (x, y) = x cos y, γ parametrizzata da r(t) = 2 cos t i + 2 sin t j, t ∈ [0, π/2];
564
Integrali su curve e superfici
Dedurre poi le proposizioni (X.20) a pagina 527 e (X.44) (c) F(x, y, z) = sin(xy) i + x2 z j + z k, r(t) = πt2 i + a pagina 546. (1/t2 ) j + cos t k, t ∈ [0, 2π]; √ x (d) F(x, y, z) = e i + ln y j + arctan z k, r(t) = t + 1 i + b 7 Dato il campo piano F stabilire se è conservativo e in (t + 1) j + (1 − t) k, t ∈ [0, 1]. caso affermativo trovarne un potenziale. K 4 Dimostrare che l’integrale curvilineo Z I= F · T ds γ
rimane invariato per cambiamenti di parametrizzazione che conservano l’orientazione di γ e cambia di segno per cambiamenti che la invertono.
(a) F = (y2 − x2 ) i + x2 y j;
(b) F = (y2 − x3 y3 ) i + (2xy − 43 x4 y2 ) j; (c) F = 2x cos y i + (−x2 sin y + 4y3 ) j;
(d) F = (x + ey ) i + (2y + xey ) j; 2 (e) F = − 2xy + x2 i + xy2 j.
5 Una corrente continua in un filo rettilineo induce un b 8 Stabilire se il campo F è conservativo e in caso affermativo trovarne un potenziale. Calcolare poi l’intecampo magnetico B tangente ad ogni cerchio perpendigrale lungo la curva γ composta dai segmenti rettilinei colare al filo e centrato nel filo stesso. Si dimostra con da (0, 0, 0) a (0, 1, 1), da (0, 1, 1) a (2, 2, 4) e da (2, 2, 4) a un ragionamento di simmetria che l’intensità del campo (2, 2, 0). magnetico dipende soltanto dalla distanza dal filo. La legge di Ampère asserisce che la circuitazione del campo (a) F = ey i + xey j + (z + ez ) k; è proporzionale all’intensità della corrente: (b) F = 2xy sin z i + x2 sin z j + x2 y cos z k; Z (c) F = ln x i + ln y j + ln z k; B · T ds = µ0 I γ (d) F = ex sin y i + ex cos z j + z3 k; dove µ0 è una costante (detta permeabilità magnetica (e) F = xy2 i + zy2 j + yz2 k. del vuoto). Dimostrare che, ad una distanza r dal filo, si 9 Mostrare che ogni campo vettoriale della forma F = ha f (x) i + 1(y) j + h(z) k con f, 1, h funzioni derivabili, è µ0 I kBk = irrotazionale. 2πr 10 Sia C il cilindro (pieno) C = {(x, y, z) ∈ R3 : x2 + y2 ≤ 4, 0 ≤ z ≤ 1}. ① Supponendo che la densità di massa di C sia δ(x, y, z) = λz, con λ > 0, calcolare le coordinate del baricentro di C. ② Calcolare il flusso del campo 3
F(x, y, z) = eyz (z − 2) i + cos x sin z j + xy k. uscente dalla superficie di C. Figura X.20 K 6 Dimostrare la seguente caratterizzazione dei campi conservativi: se F : A ⊂ R3 → R3 è un campo vettoriale di classe C1 , con A aperto e connesso, allora F è conservativo se e solo se, data una qualunque curva chiusa γ ⊂ A, vale I F · T ds = 0. γ
11 Dato il campo vettoriale F =
2x x2 +y2
2y
i + ( x2 +y2 + 3) j,
① determinare il dominio D di F e verificare che il campo è irrotazionale; ② mostrare che F è conservativo nel dominio D. 12 Dato il campo vettoriale Fα = y2 cos z i+αxy cos z j− xy2 sin z k, ① determinare per quali valori di α il campo è irrotazionale e discutere se è conservativo;
Esercizi
565
② per i valori di α trovati determinare il potenziale di F che si annulla nel punto (1, 1, 0) e
① mostrare che è irrotazionale;
③ sia γ la curva formata dal segmento che congiunge A = (1, 1, π) e B = (2, 2, π). Calcolare il lavoro di F per spostare un punto materiale lungo γ da A a B.
③ mostrare che il campo non è conservativo su R2 r {(0, 0)}.
2
13 Dato il campo vettoriale F = ( x22x+y +2xyex ) i+( x21+y + 2
ex ) j,
18 Calcolare l’integrale curvilineo Z x3 dy γ
① determinare il dominio di F e verificare che il campo è irrotazionale; ② determinare il più grande sottoinsieme di R2 contenente il punto A(0, −1) nel quale F sia conservativo; ③ determinare il potenziale che si annulla in A; ④ calcolare il lavoro di F per spostare un punto materiale lungo il segmento da A a B(0; −5). 14 Dato il campo vettoriale F = 2y ( x2 +y2 +1 )
② trovare un potenziale definito nel semipiano x > 0;
( x2 +y2x2 +1
+ f (z)) i +
j + 2xz k,
① determinare una funzione f (z) per cui il campo F sia irrotazionale e discutere se è conservativo; ② determinare un potenziale di F; ③ sia γ la circonferenza di centro l’origine e raggio 1; calcolare il lavoro di F lungo la curva chiusa γ percorsa in senso orario. 15 Calcolare, al variare del parametro reale α, l’integrale di ω = exy (yz + xy + α)dx + exy (x2 + xz)dy + exy dz sulla curva parametrizzata da (t, 1/t, t2 ) con t ∈ [1, 2]. Dire per quali valori di α la forma differenziale ω è esatta. Per tali valori, calcolare un potenziale e sfruttare il risultato per verificare la correttezza dell’integrale. 16 Dato il campo vettoriale " # −y x F= i + + 2y j, (x − y)2 (x − y)2 ① determinare il dominio di F; ② stabilire se il campo è irrotazionale; ③ trovare (se possibile) un potenziale di F definito sul quarto quadrante. 17 Dato il campo vettoriale F=
2x − y x + 2y i+ 2 j 2 2 x +y x + y2
dove γ è il bordo dell’insieme D = {(x, y) : 1 ≤ x2 + y2 ≤ 4} orientato positivamente, verificando il risultato con la formula di Green. 19 Applicando la formula di Green calcolare I 2(x2 + y2 ) dx + (x + y)2 dy γ
dove γ è il perimetro del triangolo di vertici (1, 1), (2, 2) e (1, 3), percorso in verso antiorario. Verificare il risultato calcolando direttamente l’integrale. 20 Applicare il Teorema di Gauss–Green per mostrare che le coordinate del baricentro di una lamina piana di densità costante che occupa la regione D limitata da una curva semplice e chiusa γ sono I I 1 1 x2 dy, y¯ = − y2 dx x¯ = 2A γ 2A γ dove A è l’area di D. 21 Applicare il Teorema di Gauss–Green per calcolare area e baricentro della regione limitata dalla curva γ. (a) γ ha equazione r(t) = a cos3 t i + a sin3 t j per t ∈ [0, 2π]; (b) γ è composta da segmento di estremi A(−1, 0) e B(1, 0), poi dal quarto di circonferenza (x − 1)2 + (y − 1)2 = 1 da B a C(0, 1), e infine dall’arco di parabola y = −x2 + 1 da C fino a A.
o 22 Una circonferenza di raggio r rotola su una circonferenza fissa di raggio R = 4r, esternamente ad essa. Calcolare l’area della regione limitata dalla epicicloide, ovvero dalla curva descritta da un punto qualsiasi della circonferenza mobile. o 23 Sfruttando il Teorema di Gauss–Green mostrare che l’integrale curvilineo Z −y dx + x dy x2 + y2 γ vale 2π per ogni curva semplice chiusa γ che contiene l’origine.
566
Integrali su curve e superfici
2
t , y(t) = o 24 Sia γ la curva piana definita! da x(t) = 1−t 2 1 − t per t ∈ [−1, 1/2]. Calcolare D y dx dy dove D è la regione del piano compresa tra gli assi e l’arco di γ tra i punti A(0, 1) e B( 21 , 0).
K 25 Utilizzare il Teorema di Gauss–Green per provare la formula del cambiamento di variabili negli integrali doppi (8) quando f (x, y) = 1, il cambiamento di variabili (x, y) = T(u, v) sia di classe C2 , abbia determinante jacobiano sempre positivo ed il dominio di integrazione D sia delimitato da una curva Γ regolare a tratti: " " ∂(x, y) Area(D) dx dy = du dv. D C ∂(u, v) Si tenga in considerazione il fatto che, se il determinante jacobiano di T sia sempre positivo, si può dimostrare che T mantiene l’orientazione positiva delle curve. K 26 (Teoremi del rotore e della divergenza nel piano) Supponiamo che F e D verifichino le ipotesi del Teorema di Gauss–Green. Dimostrare che " I rot F · k dx dy = F · T ds + D " I∂ D div F dx dy = F · Ne ds D
∂D
Dove Ne è il versore normale uscente da D. (Suggerimento: si applichi il Teorema di Gauss–Green una volta al campo F = F1 i+F2 j ed un’altra al campo G = −F2 i+F1 j, che sono perpendicolari in ogni punto, osservando che l’orientazione positiva della frontiera implica che F · T = G · Ne .)
(a) Σ è la parte di paraboloide x = y2 + z2 con x ≤ 2, f (x, y, z) = z; (b) Σ è la parte di sfera x2 + y2 + z2 = 4 che giace sopra p al cono z = x2 + y2 e f (x, y, z) = x2 z; (c) Σ è la parte di piano z+x−3 = 0 interna al cilindro x2 + y2 = 1 e f (x, y, z) = xz; (d) Σ è la regione triangolare di vertici (1, 0, 0), (0, 2, 0), (0, 0, 2) e f (x, y, z) = x. 29 Trovare il baricentro di una lamina sottile di densità costante che ha la forma della parte di sfera x2 + y2 + z2 = 4 che giace sotto al piano z = 1. 30 Trovare il momento di inerzia rispetto all’asse z di una lamina sottile di densità costante che la forma della superficie conica x2 + y2 − z2 = 0, 0 ≤ z ≤ 2 che giace sotto al piano z = −1.
b 31 Usare il Teorema del rotore per valutare gli integrali indicati, dove F(x, y, z) = z i + x j + y k. ! rot F·N dσ dove Σ è la porzione di sfera x2 +y2 + (a) Σ 2 z = 16 tale che y ≥ −1, con orientazione (0, 0, 4) verso l’alto; ! rot F · N dσ dove Σ è la porzione di sfera di (b) Σ equazione x2 + y2 + z2 = 4 interna al cilindro x2 + y2 = 1, nel semispazio z > 0, orientata verso l’alto; R (c) γ F · T ds dove γ è il triangolo di vertici A(1, 1, 0), B(2, 0, 2) e C(0, 2, 1), orientato da B a A e poi C; R (d) γ F · T ds dove γ è l’intersezione del cilindro x2 + z2 = 1 con x + y + z = 1, percorsa in senso antiorario.
K 27 Dedurre dalle formule precedenti che, se F è di b 32 Sfruttando il Teorema del rotore, calcolare la classe C1 allora circuitazione di F lungo γ (orientata positivamente). I 1 (a) F = 3xyz i − x j − y k, γ è l’intersezione del cilindro rot F(x) · k = lim 2 F · T ds r→0 πr ∂+ D (x) x2 + y2 = 1 e del piano 3x + 3y + 2z = 0; I r 1 (b) F(x, y, z) = x2 z i + xy2 j + z2 k, γ definita da div F(x) = lim 2 F · Ne ds , r→0 πr ( ∂Dr (x) x+y+z = 1 dove Dr (x) è il disco di centro x e raggio r. Ovvero il rotox2 + y2 = 9. re di un campo piano in un punto x rappresenta la densità 33 Sia γ la curva ottenuta intersecando la sfera unitasuperficiale di circuitazione di F nel punto e pertanto miria di equazione x2 + y2 + z2 = 1 con il piano y = 2z. sura quanto ruota F per unità di area. Allo stesso modo, Calcolare l’integrale di linea il rotore di un campo piano in un punto x rappresenta la Z densità superficiale di flusso uscente di F nel punto. (z − 2y)dx + (z − 2x)dy + (x + 3y + y2 )dz b 28 Valutare i seguenti integrali di superficie γ " sia utilizzando il Teorema del rotore che usando la f dσ. definizione di integrale di linea, parametrizzando γ. Σ
Esercizi
567
o 34 Sfruttando il Teorema del rotore due volte, calcola- K 41 Sia E un dominio solido delimitato da una sure il flusso del rotore di F = y3 cos z i + x3 ez j − yz2 sin x k perficie chiusa S e sia u una funzione C2 (E) tale che uscente dalla superficie sferica (x − 1)2 + y2 + z2 = 5 che u(x, y, z) = 0 su S. Mostrare che se ∆u = 0 allosi trova in z ≥ 1. ra u(x, y, z) = 0 in tutto E. (Suggerimento: considerare F = ∇u e applicare la formula di integrazione per parti di b 35 Usare il Teorema della divergenza per valutare pagina 562.) " Σ
f · N dσ.
(a) f (x, y, z) = (xy + ez ) i + (z2 + x2 ) j + z k, Σ è la superficie formata dalla porzione di cilindro x2 + y2 = 1 compreso tra i piano z = −1 e z = 1 e dai punti (x, y, ±1) con x2 + y2 ≤ 1;
(b) f (x, y, z) = (x + y) i + (y + z) j + (z + x) k, Σ è il cubo nel primo ottante di lato 2;
(c) f (x, y, z) = (x2 + y) i + (y2 + xz) j + z2 k, Σ è la sfera unitaria;
K 42 Il problema di Dirichlet per il Laplaciano è il problema ai valori al contorno (
∆u(x, y, z) = f (x, y, z) u(x, y, z) = 1(x, y, z)
in E in S
dove f e 1 sono funzioni date, definite rispettivamente su E e su S, il bordo di E. Mostrare che il problema ha al massimo una soluzione. (Suggerimento: applicare l’esercizio precedente alla differenza u − v tra due soluzioni distinte del problema.)
(d) f (x, y, z) = (x + y) i + z j + x k, Σ è la frontiera della regione solida definita dalle relazioni x2 + y2 ≤ z ≤ K 43 Supponiamo che E e Σ = ∂E verifichino le ipotesi 1, con x ≤ 0. del Teorema della divergenza e che 1 sia una funzione scalare di classe C1 in un aperto A contenente E. 36 Calcolare il flusso del campo F(x, y, z) = x3 y i+x2 j+ Mostrare che xy3 k uscente dalla sfera unitaria, sia direttamente che applicando il Teorema della divergenza. " $ √ 1N dσ = ∇1 dx dy dz, 2 2 2 37 Sia E la regione solida 1 ≤ z ≤ 3, x + y ≤ z ,
0 ≤ y ≤ xz. Chiamiamo Σ la parte di ∂E che soddisfa x2 + y2 = z2 . Mostrare che il flusso del campo F = y i + (z − x) j + y k attraverso Σ è nullo. 38 Verificare la parametrizzazione del nastro di Moebius data nell’Esercizio (X.12) a pagina 560.
Σ
E
dove l’integrale di una funzione a valori vettoriale si definisce integrando componente per componente. (Suggerimento: applicare il Teorema della divergenza alle componenti scalari F = 1e, dove e è, di uno degli elementi della base canonica di R3 , i, j o k.)
K 39 Utilizzare il Teorema di Gauss–Green per dimostrare le formule di derivazione per parti nel K 44 (Principio di Archimede) Un solido occupa la regione V si superficie S = ∂V, ed è immerso in un liquido piano: " Z " di densità costante ρ0 . Si verifica che, se il liquido è in ∂ ∂ equilibrio, allora la pressione alla profondità z (orienf 1 dx dy = f 1 dx dy f 1 dy − D ∂x ∂+ D D ∂x tando l’asse z verso il basso) è pari a p = ρ0 1z, dove 1 e è l’intensità ella forza di gravità alla superficie terrestre. Z " " La forza totale agente sul solido, dovuta alla pressione ∂ ∂ f 1 dx dy. f 1 dy − f 1 dx dy = − del liquido sulla sua superficie, è pari a ∂+ D D ∂y D ∂y " F=− pNe dσ . K 40 Sfruttando le formule di derivazione per parti vi∂V ste nell’Esercizio 39 , dimostrare che se D ⊂ R2 , f, 1 ∈ Dimostrare che F = −W k, dove W è il peso del liquiC2 (D) e f = 1 = 0 su ∂D, allora do spostato dal solido. (Si osservi che, avendo orienta" " to l’asse z verso il basso, la forza totale è diretta ver1∆ f dx dy = f ∆1 dx dy. so l’alto) (Suggerimento: utilizzare l’esercizio precedente, D D osservando che ∇p = ρ0 1 k.)
Epilogo LA STORIA La storia non si snoda come una catena di anelli ininterrotta. In ogni caso molti anelli non tengono. La storia non contiene il prima e il dopo, nulla che in lei borbotti a lento fuoco. La storia non è prodotta da chi la pensa e neppure da chi l’ignora. La storia non si fa strada, si ostina, detesta il poco a poco, non procede né recede, si sposta di binario e la sua direzione non è nell’orario. La storia non giustifica e non deplora, la storia non è intrinseca perché è fuori. La storia non somministra carezze o colpi di frusta. La storia non è magistra di niente che ci riguardi. Accorgersene non serve a farla più vera e più giusta. La storia non è poi la devastante ruspa che si dice. Lascia sottopassaggi, cripte, buche e nascondigli. C’è chi sopravvive. La storia è anche benevola: distrugge quanto più può: se esagerasse, certo sarebbe meglio, ma la storia è a corto di notizie, non compie tutte le sue vendette. La storia gratta il fondo come una rete a strascico con qualche strappo e più di un pesce sfugge. Qualche volta s’incontra l’ectoplasma d’uno scampato e non sembra particolarmente felice. Ignora di essere fuori, nessuno glie n’ha parlato. Gli altri, nel sacco, si credono più liberi di lui. da “Satura”, 1962-1970 (E UGENIO M ONTALE , 1896–1981)
F X.21: L’epitaffio sulla tomba di D. Hilbert: «Wir müssen wissen, wir werden wissen» (dobbiamo conoscere, e conosceremo!).
570
Epilogo
Due soluzioni del sistema x′ = 10(y − x), y′ = −xz + 28x − y, z′ = xy − 83 z, corrispondenti ai dati iniziali (x(0), y(0), z(0)) = (0.1, 0.2, 0.01) [sopra] e (x(0), y(0), z(0)) = (0.1, 0.2, 0) [sotto].
Soluzioni degli esercizi
Capitolo I 1 Si procede in modo analogo alla risoluzione R dell’et quazione (1) a pagina 2 e si ottiene p(t) = p0 e 0 k(s) ds . Dato che p(t) > 0 per ogni t, la popolazione si estingue R +∞ se limt→+∞ p(t) = 0, ovvero se l’integrale improprio k(s) ds diverge a −∞. 0
2 (a) La popolazione segue la legge di Malthus p′ = kp per un certo k > 0 incognito; quindi p(t) = p(0)ekt ed essendo p(3) = 8000 abbiamo 16 = e3k , k = (ln 16)/3. Quindi dopo t ore sono presenti p(t) = 500 · 16t/3 batteri. (b) p(4) = 500 · 164/3 = 20159. (c) 32000 = 500 · 16t/3 , ovvero t = 9/2, cioè dopo 4 ore 1/2. 3 (a) Sapendo che p′ = kp abbiamo che p0 e2k = 600 e p0 e8k = 75000; quindi p0 = 120 e quindi sappiamo anche che e2k = 5. (b) p(t) = 120 · 5t/2 . (c) 375000 = 120 · 5t/2 , ovvero 5t/2 = 3125, quindi dopo 10 ore. 4 (a) La massa m(t) soddisfa l’equazione differenziale m′ = km, risolta da m(t) = m0 ekt , dove m0 > 0 è la massa iniziale. Nel nostro caso, quindi, m(t) = 100ekt ; sapendo che 50 = 100e1590k troviamo k = − ln 2/1590. (b) 65 mg. (c) 2762 anni. 5 La pergamena ha circa 2378 anni. Infatti, procedendo come nell’esercizio precedente, troviamo k = −(log 2)/5730, quindi se y0 è la quantità di carbonio iniziale vogliamo determinare t tale che 75/100 y0 = y0 ekt da cui si ricava t = 5730(log 4 − log 3)/ log 2. 6 Se p0 = 0, k/h abbiamo le soluzioni costanti, definite su tutto R. Si tratta di capire quale intervallo del dominio di definizione delle funzioni p(t) = kDekt /(1 + hDekt ),
D = p0 /(k − hp0 )
contiene il valore t = 0, ovvero per quali valori 1+hDekt , 0 o, equivalentemente, ekt , 1 − k/(hp0 ). Quando p0 ∈ (0, k/h] allora la soluzione è definita su tutto R; infatti 1−k/(hp0 ) < 0. Detto t¯ = 1/k ln(1−k/(hp0 )), quando p0 < 0
si ha che t¯ > 0 e l’intervallo di definizione è (−∞, t¯), quando invece p0 > k/h è (t¯, +∞), infatti in questo caso t¯ < 0. L’andamento di alcune soluzioni è illustrato in Figura 1.
F 1 8 (a) p ≡ m e p ≡ k/h. (b) Il tasso di crescita p′ /p = (k − hp)(1 − m/p) è strettamente positivo solo se p ∈ (m, k/h); è nullo quando p = m oppure p = k/h; è strettamente negativo se p ∈ (0, m) oppure p > k/h. In particolare se p0 ∈ (0, m) il numero di individui diminuisce. (c) Supponendo p(t) , m, k/h e dividendo per (k − hp(t))(p(t) − m) otteniamo p(t) =
k/h − m + m, 1 − Deht(m−k/h)
D=
p0 − k/h . p0 − m
(d) Nel primo caso la popolazione diminuisce fino ad estinguersi dopo un tempo t = ln[k(p0 − m)/(hm(p0 − k/h))]/(hm − k). Nel secondo caso cresce e per t → +∞ tende al valore k/h; nel terzo caso diminuisce tendendo ancora a k/h quando t → +∞.
9 (a) p ≡ k/h (per p ≡ 0 l’equazione non è definita). (b) Il tasso di crescita p′ /p = log(k/hp) è strettamente positivo se e solo se p(t) < k/h. (c) Supponendo p(t) > 0, p(t) , k/h e dividendo per p(t) log(k/ hp(t)) otteniamo ! k −t h p(t) = eDe , D = log p0 . h k
572
Soluzioni degli esercizi – Capitolo I
integrazione. Dai dati abbiamo 100 = C + S,
80 = Ce10k + S,
65 = Ce20k + S.
Ricavando il valore di e10k in funzione di C dalla seconda equazione (in cui si è sostituita la prima) e sostituendolo nella terza troviamo C = 80. Quindi dalla prima ricaviamo che la temperatura della stanza è di 20◦ C.
F 2: alcune funzioni di Gompertz (k = 1 e k/h = 1000). 10 Se I(t) è il numero di individui infetti al tempo t, l’equazione che ne descrive l’andamento è I′ (t) = CI(t)(5000 − I(t))
cioè un’equazione logistica. La soluzione con I(0) = 160 è 5000Ae5000Ct 160 4 , A= = . 1 + Ae5000Ct 5000 − 160 121 Dato che I(7) = 1200 troviamo C = ln(363/38)/35000. Vogliamo quindi determinare t¯ tale che I(t¯) = 4000. Calcoliamo 1 ln(121) ∼ 14, 9; t¯ = 5000C la popolazione sarà quindi infetta all’80% dopo circa 15 giorni. √ 11 Ponendo 1(t) ≡ 2 e h(y) = y si ha che h è definita su [0, +∞). y ≡ 0 è dunque (l’unica) soluzione costanp te; supponendo y , 0 si ottiene y(t) = t + C e quindi y(t) = (t + C)2 , una famiglia di parabole con vertice nel p punto (−C, 0). Essendo y(t) = t + C > 0, le soluzioni non nulle sono rami ascendenti di parabole con vertice sull’asse y = 0. Si osservi che per ogni punto dell’asse y quindi passa sia la soluzione costante che un ramo ascendente di parabola. I(t) =
12 Procediamo come nell’Esercizio (I.4), svolto a pagina 21. La Legge di Newton fornisce l’equazione T ′ (t) = K(T(t) + 5) con K < 0 (T rappresenta la temperatura del corpo) da cui T(t) = CeKt − 5. Ponendo t = 0 all’istante di ritrovamento troviamo C = 25. Sapendo che T(30) = 15 calcoliamo quindi K = 1/30 ln(4/5). Concludiamo esplicitando tˆ (negativo) tale che T(tˆ) = 37 = 25eKtˆ − 5 ovvero tˆ = 30 ln(42/25)/ ln(4/5) ≃ −69, 7. Il delitto è stato quindi commesso alle 1:10 di notte. 13 Procediamo come nell’esercizio precedente. Dalla legge di Newton ricaviamo la legge di raffreddamento T(t) = Cekt + S, con k < 0 costante di raffreddamento, 0 < S < 100 temperatura della stanza e C costante di
14 Chiamiamo y(t) la quantità di materiale in combustione al tempo t. Detta T(t) la temperatura del deposito, secondo le ipotesi risulta y′ (t) = k1 T(t) e T(t) = k2 y2 (t). Dunque y risolve l’equazione differenziale a variabili separabili y′ = ky2 , dove k = k1 k2 . Risolvendo l’equazione si trova Z Z ′ y (t) −1 dt = k dt =⇒ = kt + C, C ∈ R. y2 (t) y(t) Perciò y(t) = −1/(kt+C). Imponendo la condizione iniziale y(0) = y0 si ricava il valore della costante C = −1/y0 . L’esplosione avrà luogo all’istante t = 1/(ky0 ). 15 y(t) è crescente se y2 − 3y + 2 è una quantità positiva, ovvero se y < 1 oppure se y > 2; è decrescente se 1 < y < 2. Le soluzioni costanti sono y ≡ 0, y ≡ 1 e y ≡ 2.
16 (a) Crescenti in {(x, y) : y > −x}; tangente orizzontale sulla retta y = −x; decrescenti altrove. (b) Crescenti all’esterno della circonferenza unitaria centrata nell’origine; tangente orizzontale sulla circonferenza; decrescenti all’interno. (c) Crescenti se −x < y(x) < x; tangente orizzontale se y(x) = ±x; decrescenti altrove.
17 (a) Le soluzioni costanti sono r(t) ≡ 0 e r(t) ≡ 1, con t ∈ R; per r diverso da tali valori possiamo dividere ed integrare, ottenendo 2 ln |r|−ln |1−r|−ln |1+r| = 2t+C, cioè r2 /|1 − r2 | = k exp(2t), con k > 0. Per 0 < r < 1 p si ottiene r(t) = k exp(2t)/(k exp(2t) + 1), con t ∈ R; p k exp(2t)/(k exp(2t) − 1), per r > 1 si ottiene r(t) = con t ∈ (− ln k/2, +∞). (b) Osserviamo che y(t) , −1, ∀t. Integrando abbiamo (y(t) + 1)3 = − 43 t4 + C, ed essendo h(y) = (y + 1)3 invertibile su tutto R troviamo p 3 y(t) = C − 3t4 /4 − 1. Quindi se C < 0, la soluzione è definita su R, altrimenti abbiamo√ due rami √di soluzioni definiti rispettivamente su (−∞, 4 4C/3) e ( 4 4C/3, +∞). (c) y(x) ≡ 0, x ∈ R, è l’unica soluzione costante; supponendo y(x) , 0 e x , −1, dividiamo per y(x)(1 + x3 ) e√ integrando otteniamo la famiglia di soluzioni y(x) = 3 C 1 + x3 , C ∈ R, definite su (−∞, −1) oppure su (1, +∞). (d) y(x) ≡ −1, x ∈ R, è l’unica soluzione costante; le altre soluzioni, definite su tutto R sono y(x) = C(x + 1) − 1. (e) Non ci sono soluzioni costanti; dopo una prima x(s) integrazione si ottiene ee = s + C, C ∈ R; quindi x(s) = ln(ln(s + C)), con s > 1 − C. (f) Non ci sono soluzioni costanti e integrando si ottiene y(x) = ln(ex + C),
Soluzioni degli esercizi – Capitolo I
definite su R quando C ≥ 0, su (log(−C), +∞) se C < 0. (g) Le soluzioni sono y(t) ≡ 0 e y(x) = C(x2 − 1), definite sugli intervalli (−∞, −1), (−1, 1) oppure (1, +∞). (h) Le soluzioni sono le curve y(t) = −t + ln(t + 1 + Cet ); osserviamo che deve essere C > −1, altrimenti l’argomento del logaritmo sarebbe sempre negativo o nullo; se C > −1 la soluzione è definita su (t∗ , +∞) con t∗ < 0. 18 x ≡ ±2 sono le soluzioni costanti; quelle che non le intersecano sono x(t) = 4/(1 − ke4t ) − 2, con k , 0. Le soluzioni passanti per i punti (0,0), (0,3) e (0,-3) sono quelle corrispondenti ai valori k = −1, k = 1/5 e k = 5. La prima è definita su tutto R, la seconda su (−∞, 1/4 ln 5) la terza su (−(ln 5)/4, +∞). 19 (a) Osserviamo che se y risolve l’equazione, allora ha segno costante, infatti y(t) è certamente sempre diversa da 0; essendo y(0) = −1, la soluzione cercata è sempre negativa; integrando otteniamo y(t) = p − 2 ln(1 + et ) + 1 − 2 ln 2. (b) La soluzione è u(s) = √ 2 ln s + s2 ed è definita su (t∗ , +∞), con t∗ > 0. (c) La 1 soluzione in forma implicita è y(x) + y3 (x) = 3 log x ed 3 è definita su (0, +∞) (la funzione H(y) = y + y3 /3è invertibile su tutto R.) (d) y = 0. (e) La soluzione in forma implicita è cos y(t) = cos t − t + C; possiamo esplicitare y quando y ∈ [kπ, (k + 1)π], con k ∈ Z; essendo y(0) = π/2 scegliamo k = 0 e otteniamo y(t) = arccos(cos t − t + C); sostituendo si ha C = −1. 20 La retta normale in un punto P = (xP , yP ) ha equazione y = yp − (x − xP )/y′P ed interseca l’asse y nel punto (0, yP + xP /y′P ). Troviamo quindi l’equazione (6 − yP )y′P = xP che ha come soluzioni le curve della famiglia (la variabile dipendente rimane definita in forma implicita) 12yP − y2P = x2P + C. La soluzione per (3, 2) ha C = 11, troviamo quindi la circonferenza x2 +(y−6)2 = 25. 21 Con la sostituzione z(t) = y(t)/t si arriva all’equazione a variabili separabili z′ (t) = (z(t)−1)/t. Quest’ultima ha una sola soluzione costante, z ≡ 1. Quando z(t) , 1 invece abbiamo z(t) = k|t| + 1, dove k è positivo (soluzioni con z > 1) o negativo (z < 1). Torniamo a y: da z ≡ 1 ricaviamo y(t) = t, che è soluzione separatamente su (−∞, 0) e su (0, +∞); le altre soluzioni sono y(t) = kt2 + t, tutte definite su (−∞, 0) oppure su (0, +∞). Imponendo la condizione iniziale troviamo k = −1 e y = −t2 + t, definita su (0, +∞). −x 22 (a) y(x) = ln |x|+C sono soluzioni su intervalli che non contengono x = 0, ±eC ; y = 0 è soluzione su (−∞, 0) e su (0, +∞). (b) x(t) = −t ln(ln |t| + C) definite su (−eC , 0) oppure su (0, eC ). (c) y(x) = x tan(ln |x| + C), definite su (e−π/2+kπ+C , eπ/2+kπ+C ) oppure su (−eπ/2+kπ+C , −e−π/2+kπ+C ). (d) y(t) = −t è soluzione; le altre soluzioni, in forma
573
y(t)+t
y(t)
implicita, sono t − 2 ln | / t| = ln |t| + C; tutte sono definite sulle semirette (−∞, 0) e (0, +∞). 23 La retta tangente ad un generico punto P = (xP , yP ) ha equazione y = yp + y′P (x − xP ) ed interseca gli assi nei punti A = (xP − yP /y′P , 0) e B = (0, yP − y′P xP ). Imponendo che il punto medio di AB coincida con P otteniamo y y′P = xPP che ammette come soluzioni la famiglia di rette passanti per l’origine y(x) = Cx (l’equazione può essere intesa a variabili separabili, lineare di prim’ordine oppure omogenea). Il passaggio per (1, 1) impone C = 1, la curva cercata è quindi y(x) = x, definita su (0, +∞). 24 Supponiamo che almeno localmente la curva sia una funzione y = y(x). Quindi P = (x, y(x)), la retta tangente in P ha equazione y¯ = y(x) + y′ (x)(x¯ − x) e il punto T ha coordinate (−y(x)/y′ (x)+x, 0). La relazione che deve sussistere tra y′ (x), y(x) e x pertanto è !2 !2 y(x) y(x) 2 − x + y (x) = y′ (x) y′ (x) da cui ricaviamo, dopo aver notato che le rette y(x) = ±x non sono soluzione 2xy 2y/x y′ (x) = 2 = . x − y2 1 − y2 /x2
Abbiamo quindi un’equazione omogenea. La funzione e sostituendo z(x) = y(x)/x, questa soddisfa l’equazione a variabili separabili
1 z + z3 x 1 − z2 le cui soluzioni (oltre alla costante z ≡ 0 corrispondente alla soluzione nulla) in forma implicita sono z(x)/(1 + z2 (x)) = kx con k , 0. Tornando alla variabile y troviamo la famiglia di circonferenze y = k(x2 + y2 ). z′ (x) =
25 Dimostriamo che se due soluzioni coincidono per un certo valore di t allora coincidono su tutto (c, d). Sia t0 ∈ (c, d) tale che y1 (t0 ) = y2 (t0 ). Allora la funzione w(t) = y1 (t) − y2 (t) soddisfa l’equazione w′ (t) = a(t)w(t) e inoltre w(t0 ) = 0. Dall’equazione deduciamo che w(t) = keA(t) , con A(t) primitiva di a(t) e k ∈ R; dalla condizione iniziale otteniamo k = 0. Quindi w ≡ 0, ovvero y1 (t) = y2 (t). 26 Procediamo in modo analogo a quanto fatto R t a pagina (6). Scegliamo in questo caso A(t) = t a(s) ds, 0 quindi A(t0 ) = 0. Integriamo sul generico intervallo (t0 , t) (oppure (t, t0 )) l’espressione (e−A(t) y(t))′ = b(t)e−A(t) e otteniamo ! Z t b(s)e−A(s) ds . y(t) = eA(t) y0 + t0
574
27
Soluzioni degli esercizi – Capitolo I
Sottraendo le due equazioni y′1 (t) = 1(t)h(y1 (t)) + b(t),
y′2 (t) = 1(t)h(y2 (t)) + b(t)
possiamo scrivere, se (y1 − y2 )(t) , 0, (y1 − y2 )′ (t) = 1(t) Poniamo
(h(y1 (t)) − h(y2 (t))) (y1 (t) − y2 (t)). y1 (t) − y2 (t)
(h(y1 (t)) − h(y2 (t))) 1(t) y1 (t) − y2 (t) a(t) = 1(t)h′ (y1 (t))
se (y1 − y2 )(t) , 0 se (y1 − y2 )(t) = 0.
Allora y = y1 − y2 risolve l’equazione lineare y′ = a(t)y. Utilizzando il risultato dell’Esercizio 25 possiamo concludere che y(t) è nulla per ogni t oppure non si annulla per alcun t. 28 (a) y(t) = 2t + Ce−t , su tutto R. (b) y(x) = − 21 sin2 x + 2 sinC 2 x , definite su intervalli in cui sin x non 6 x si annulla. (c) y(x) = −x2 − 3x − 6 − + C ex , separax tamente su (−∞, 0), (0, +∞). (d) y(t) = t2 (et + C), sepat ratamente su (−∞, 0), (0, +∞). (e) x(t) = Ce(e ) − 1, defi2 nita su tutto R. (f) y(t) = et (t + C), definita su tutto R. (g) y(x) = Cx2 −x− 21 , separatamente su (−∞, 0), (0, +∞).
nea, allora la loro differenza risolve l’omogenea (per l’Esercizio 33 ), quindi x − xp = xo per qualche xo soluzione dell’equazione omogenea. Viceversa, se x = xp + xo allora, calcolandone le derivate otteniamo x′′ + bx′ + cx = x′′p + x′′o + bx′p + bx′o + cxp + cxo = x′′p + bx′p + cxp = f essendo xo soluzione dell’omogenea e xp della non omogenea. 35 (a) y = C1 e2x + C2 e−3x − e−x /3. (b) y = C1 ex + C2 e−2x − x2 /2 − x/2 − 3/4. (c) y = C1 ex + C2 e3x + x/3 + 10/9. (d) y = C1 + C2 e−2x + x(x2 /6 − x/4 − 1/4); (e) y = C1 ex + C2 e−x −(cos x)/2. (f) y = C1 cos(2x)+C2 sin(2x)+(cos x)/3. (g) y = C1 cos(2x) + C2 sin(2x) + ex (cos x)/5 + ex (sin x)/10. (h) y = C1 + C2 e−2x + ex /3. (i) y = C1 ex + C2 xex + x2 ex /2. (j) y = C1 sin x + C2 cos x + (x2 /2 − x + 1)ex .
36 Vogliamo determinare le costanti C1 e C2 nei tre diversi casi. (a). Imponiamo y(0) = C1 + C2 − 1/3 = 1 ed essendo y′ (x) = 2C1 e2x − 3C2 e−3x + e−x /3 anche y′ (0) = 2C1 − 3C2 + 1/3 = 0; si ottiene C1 = 11/15 e C2 = 3/5. (b). y(0) = C1 + C2 − 3/4 = 1, y′ (x) = C1 ex − 2C2 e−2x − x − 1/2, y′ (0) = C1 − 2C2 − 1/2 = 0; quindi C1 = 5/12 e C2 = 4/3. (e). y(0) = C1 +C2 −1/2 = 1, y′ (x) = C1 ex −C2 e−x +(sin x)/2, y′ (0) = C1 − C2 = 0; quindi C1 = C2 = 3/4. 37 (a) x = C1 + C2 e−2t + et /3 − e−2t /2 − te−2t /2. (b) x = C1 et/2 + C2 e−t − (t2 /2 + t)e−t − [9 sin(2t) + 2 cos(2t)]/85.
29 (a) y(t) = 2t, su R; (b) y(x) = −1/2 sin2 x + 1/(2 sin2 x), su (0, π); (c) y(x) = −x2 − 3x − 6 − 6/x, su t (−∞, 0); (d) y(t) = t2 (et +e), su (0, +∞); (e) x(t) = 5ee −1 −1, su R.
38 (a) Le soluzioni dell’omogenea associata sono ¯ C1 sin t + C2 cos t. Cerchiamo quindi u(t) = C1 (t) sin t + C2 (t) cos t con C1 e C2 che soddisfano il sistema
30 (a) Oltre alla soluzione y ≡ 0 definita su tut2 to R; ci sono le soluzioni y(t) = [C + t/2]2 e2t , definite per t ≥ −2C. (b) y ≡ 0 è soluzione su tutto R; y(x) = (−x + 1/4 + Ce−4x )−1/4 , definita sugli intervalli tali per cui −x + 1/4 + Ce−4x > 0. (c) y ≡ 0 è soluzione su tutto R; y(x) = (−1 − 2x + Cex )−1/3 , sugli intervalli in cui −1 − 2x + Cex , 0. (d) y ≡ 0 è so2 luzione su tutto R; y = (Ce−x /4 − 1)2 con C > 0 sop p no soluzioni su [−2 log C, 2 log C]. (e) Le soluzio√ ni sono −x − 1/2 + Ce2x definite sugli intervalli in cui l’argomento della radice è positivo.
Moltiplicando la prima equazione per cos t e la seconda per sin t quindi sommando, otteniamo che una soluzione è C1 (t) = t, C2 (t) = ln | cos t|, da cui ricavia¯ mo u(t) = t sin t + cos t ln | cos t|, che sarà una soluzione dell’equazione di partenza su un intervallo del tipo (−π/2 + kπ, π/2 + kπ). (b) Si procede in modo analogo e si trova la soluzione particolare 6et /t; le soluzioni dell’equazione sono della forma C1 et + C2 tet + 6et /t e risolvono l’equazione su (−∞, 0) oppure su (0, +∞).
31 L’integrale generale è y(t) = t − et 2 primitiva di et /2 .
2 /2
/1(t), con 1
32 (a) y = C1 + C2 e4x . (b) y = C1 ex/2 + C2 e−x . (c) y = C1 ex + C2 e3x . (d) y = C1 e−2x + C2 xe−2x . (e) y = √ e−3x (C1 √ cos x + C2 sin x). (f) y = ex/2 [C1 cos( 3x/2) + C2 sin( 3x/2)]. (g) y = e−x (C1 cos x + C2 sin x). x′′1
33 Sottraendo membro a membro le equazioni + bx′1 +cx1 = f e x′′2 +bx′2 +cx2 = f , grazie alla linearità della derivata otteniamo (x1 − x2 )′′ + b(x1 − x2 )′ + c(x1 − x2 ) = 0. 34
Se sia x che xp risolvono l’equazione non omoge-
C′1 (t) cos t + C′2 (t) sin t = 1/cos t C′1 (t) sin t + C′2 (t) cos t = 0.
39 Derivando la prima equazione del sistema e sostituendo la seconda otteniamo l’equazione lineare di secondo ordine nell’incognita i(t) 1 Li′′ (t) + Ri′ (t) + i(t) = E′ (t). C 40 Per ricondursi ad un’equazione di second’ordine si deriva una delle due equazioni (ad esempio la prima) e si sostituisce l’altra: x′′ = ax′ + by′ = ax′ + b(cx + dy). A questo punto si ricava la quantità by dalla seconda
Soluzioni degli esercizi – Capitolo II
equazione e si sostituisce; otteniamo alla fine x′′ = ax′ + bcx + d(x′ − ax).
quindi se x e y sono soluzioni del sistema allora entrambe soddisfano l’equazione u′′ = (a + d)u′ + (bc − ad)u.
Nel caso particolare in cui a = d = 2 e b = c = 1, si ottiene l’equazione di secondo ordine u′′ − 4u′ + 3u = 0, che deve essere soddisfatta da entrambe le componenti del sistema. Quindi x(t) = C1 e3t + C2 et e y(t) = C3 e3t + C4 et . Sostituendo le espressioni nel sistema otteniamo C1 = C3 e C2 = −C4 . 42 Affinché la funzione αu sia soluzione dell’equazione non omogenea ay′′ + by′ + cy = f è necessario che a(αu)′′ + b(αu)′ + c(αu) = f , ovvero aα′′ u + α′ (2au′ + bu) + α(au′′ + bu′ + cu) = f essendo au′′ + bu′ + cu = 0 otteniamo la relazione cercata. 43 (a) α deve soddisfare la relazione t(1 − t2 )α′′ + (2 − 4t2 )α′ = 0,
che (moltiplichiamo entrambi i termini dell’equazione per t) risulta essere equivalente a (α′ µ)′ = 0, dove µ = t2 − t4 . Otteniamo così α′ = C/t2 (1 − t2 ), da cui (si usa la scomposizione 1/[t2 (1 − t2 )] = 1/t2 + 1/[2(1 + t)] + 1/[2(1 − t)]) integrando 1 1 1 α(t) = C1 − + ln |1 + t| − ln |1 − t| + C2 . t 2 2 Quindi le funzioni α(t)t = C1 t(ln |1 + t| − ln |1 − t|) + C2 sono soluzioni dell’equazione di√partenza. (b) α deve soddisfare la relazione tα′′ + (2 2 √+ 1)α′ = 0, da cui si ottiene facilmente α(t) = C1 + C2 t−2 2 , definita per t > 0.
Capitolo II 1 (a) Centro x0 = 0, coefficienti cn = 1, raggio di convergenza R = limn→∞ n/(n P + 1) = 1 La serie converge in (−1, 1). In x = −1 si ha (−1)n , non converge perché P il termine n-esimo non tende a zero. In x = 1 si ha 1, diverge. (b) Centro x0 = 0, coefficienti cn = 1/n e raggio di convergenza R = limn→∞ (n P + 1)/n = 1 La serie converge in (−1, 1). In x = −1 si ha P(−1)n /n, converge per il Criterio di Leibniz. In x = 1 si ha 1/n, diverge in quanto serie armonica. (c) Centro x0 = 0, coefficienti cn = 1/n2 2 2 e raggio di convergenza R = limn→∞ (n + P1) /nn =2 1 La serie converge in (−1, 1). In x = −1 si ha (−1) P /n , converge per il Criterio di Leibniz. In x = 1 si ha 1/n2 , converge perché serie armonica generalizzata di esponente maggiore di 1.
575
2 Per semplicità supponiamo che la serie sia centrata |c xn+1 | → |x| in x0 = 0; allora per ogni x , 0 fissato si ha n+1 |cn xn | R per n → +∞. Per il Criterio del rapporto P delle serie numeriche, se il limite è minore di 1 la serie |cn xn | converge assolutamente, ovvero se |x| < R. Se invece x è tale che |x| > R, lo stesso criterio permette di concludere la serie non converge assolutamente. Se dunque |x| < R, la serie converge assolutamente: quindi la serie converge in tutti i punti in cui |x| < R. Per concludere che R è proprio il raggio di convergenza, cioè l’estremo superiore dei numeri r > 0 per cui la serie di termine cn xn converge, dobbiamo verificare che la serie non converge in alcun x tale che |x| > R. Supponiamo allora per assurdo che esista |a| > R per cui la serie di termine cn an : grazie alla Proposizione nell’approfondimento a pagina 39, sappiamo che la serie di termine cn xn converge assolutamente in ogni x tale che |x| < a, in particolare per x¯ = R + R−a (punto medio tra 2 R e a). Questo valore è maggiore di R: la convergenza di della serie in x¯ è in contrasto con quanto osservato in precedenza. 3 Per semplicità supponiamo che la serie sia centrata in x0 = 0; allora per ogni x , 0 fissato si ha p |x| n lim |cn xn | = . n→+∞ R Per il Criterio della radice delle P serie numeriche, se il limite è minore di 1 la serie |cn xn | converge. Se invece x è tale che |x| > R, lo stesso criterio permette di concludere la serie non converge assolutamente. Per concludere che R è proprio il raggio di convergenza, si ragiona esattamente come nello svolgimento dell’Esercizio 2 . 4 (a) Centro in x0 = 0, coefficienti cn = 2n /n2 e raggio R = limn→∞ (n + 1)2 /(2n2 ) = 1/2. La serie nell’inP converge tervallo (−1/2, 1/2). In x = −1/2 si ha (−1)nP /n2 , converge per il Criterio di Leibniz. In x = 1/2 si ha 1/n2 , converge perché serie armonica generalizzata di esponente maggiore di 1.PQuindi E = [−1/2, 1/2]. (b) Riscriviamo la serie come 3n (x−1/3)n Centro in x0 = 1/3, coefficienti cn = 3n e raggio R = 1/3.PLa serie converge nell’intervallo (0, 2/3). In x = 0 si ha (−1)n , non converge perché il Ptermine n-esimo non tendente a zero. In x = 2/3 si ha 1, diverge. Quindi E = (0, 2/3). (c) Centro in x0 = 0, coefficienti cn = 3n /n! e raggio R = limn→∞ (n+1)/3 = +∞. Quindi E = R. (d) Centro in x0 = 0, coefficienti cn = n/(2n (n + 4)) e raggio R = 2. La P serie converge nell’intervallo (−2, 2). In x = −2 si ha (−1)n n/(n + 4), non converge perché il termine n-esimo non tendente a zero. In x = 2 la serie diverge. Quindi E = (−2, 2). (e) Dato che le potenze dispari sono nulle, per studiare il carattere della bisogna ricorrere al Criterio del rapporto. Fissato x, si definisce an = (2n + 1)/[n(n − 1)]x2n . Risul-
576
ta limn→∞ |an+1 /an | = x2 La P serie converge nell’intervallo (−1, 1). In x = ±1 si ha (2n + 1)/[n(n + 1)], diverge in quanto asintotica alla serie armonica. Quindi E = (−1, 1). (f) Centro in x0 = −3, coefficienti cn = (n − 1)/(n + 1) e raggio R = limn→∞ [(n − 1)(n + 2)]/[n(n + 1)] = 1. La serie converge nell’intervallo (−4, −2). In x = −4 si ha P (−1)n (n − 1)/(n + 1), non converge in quanto il termine P n-esimo non tende a zero. In x = −2 si ha (n−1)/(n+1), diverge. Quindi E = (−4, √ −2). (g) Centro in x0 = −3, coefficienti cn = (−2)n / n e raggioPR =√1/2. Converge in (−7/2, −5/2). In √ si ha 1/ n, diverge. In P x = −7/2 x = −5/2 si ha (−1)n / n converge per il Criterio di Leibniz. Quindi E = (−7/2, −5/2]. (h) Centro in x = 2, coefficienti cn = n/(n + 1)2 e raggio P R = 1. Converge nell’intervallo (1, 3). In x = 1 si ha (−1)n n/(n +P1)2 , converge per il Criterio di Leibniz. In x = 3 si ha n/(n + 1)2 , diverge in quanto asintotica alla serie armonica. Quindi E = [1, 3). (i) Centro in x0 = 0, coefficienti cn = (−1)n /(n2 − 1) e raggio R = 1. Converge nell’intervallo P (−1, 1). In x = −1 diventa una serie asintotica a 1/n2 , quindi convergente; In x = 1 converge per il criterio di Leibniz. Quindi E = [−1, 1]. (j) Centro in x = −1, coef2 ficienti cn = 1/(n e R = 1. Converge in (−2, 0). In P ln n) 2 x = −2 si ha (−1)n /(n ln per il Criterio P n), converge 2 di Leibniz. In x = 0 si ha 1/(n R +∞ln n), la2 serie converge per confronto con l’integrale 1 dx/x ln x. Quindi converge in [−2, 0]. (k) Centro in x = 0, coefficienti cn = (−2)n /(n4 + 3n ) e raggio R = 3/2. Converge in (−3/2, 3/2). P In x = −3/2 si ha 3n /(n4 + 3n ), diverge in quanto a segno costante e con P termine n-esimo non tendente a zero. In x = 3/2 si ha (−1)n 3n /(n4 + 3n ), non converge in quanto a segno alternato e con termine n-esimo non tendente a zero. P Quindi E = (−3/2, 3/2). (l) Riscriviamo la serie come n3 2n (x − 1/2)n ; centro in x = 1/2, coefficienti cnP= n3 2n . e raggio R = 1/2. Converge (0,P 1). In x = 0 si ha (−1)n n3 , non converge. In x = 1 si ha n3 , diverge. Quindi E = (0, 1). (m) Centro in x = −3, coefficienti cn = n/2n+1 e raggio di convergenza R = 2. Converge in P (−5, −1). In x = −5 si ha (−1)n n/2, diverge in quanto a segno alternato e con P termine n-esimo non tendente a zero. In x = −1 si ha n/2, diverge. Quindi E = (−5, −1). (n) Centro in x = 0, coefficienti cn = (n/2n + 1)2n−1 eP raggio R = 4. Converge in (−4, 4). In x = −4 si ha n 2n (−1) P (2n + 1)/n(2n/(2n + 1)) 2n, non converge. In x = 4 si ha ∞ (2n + 1)/n(2n/(2n + 1)) . (o) Mancano le potenn=0 ze pari, quindi come nella serie (e), si applica il Criterio del rapporto. Fissato x, si definisce an = (x + 5)2n−1 /(n3n ). 2 Risulta quindi laPserie converge √ |an+1 /an√| → (x + 5) /3; √ √ in (−5− 3, −5+ 3). In x = −5− 3 si ha −(1)2n−1 1/( 3n) e la serie converge √per il Criterio di Leibniz. In x = √ P −5 + 3 si ha 1/( 3n) che diverge in quanto serie ar-
Soluzioni degli esercizi – Capitolo II √ √ monica. Quindi E = [−5 − 3, −5 + 3). (p) Centro in n x = −2, cn = n!/(n + 1) e raggio R = +∞. Converge su 2 tutto R. (q) Centro in x = 1, coefficienti cn = (1 + 1/n)n 1 −n e raggio R = limn √n |c |n = limn (1 + 1/n) = 1/e. Converge n P 2 in (1−1/e, 1+1/e). In x = 1−1/e si ha (−1)n (1+1/n)n 1/en 2 che non converge in quanto (1 + 1/n)n 1/en non tende a 0 quando n tende a +∞; infatti dallo sviluppo di Taylor di log(1 + x) per x → 0 abbiamo n log(1 + 1/n) − 1 ∼ −1/(2n) + o(1/n), n → +∞
e quindi
2 √ (1 + 1/n)n = lim en [n log(1 + 1/n) − 1] = e. n→+∞ n→+∞ en Analogamente la serie diverge quando x = 1/e.
lim
5 (a) Centro z0 = 0 e raggio R = 1. Converge in {z ∈ C : |z| < 1}. Nei in cui |z| = 1, ovvero z = eiϑ , P n punti inϑ ϑ ∈ [0, 2π] si ha i e , che non converge in quanto il termine n-esimo non tende a zero. Quindi C = {z ∈ C : |z| < 1}. (b) Centro z0 = 0 e raggio R = P 1. Converge in {z ∈ C : |z| < 1}. Nei punti z = eiϑ si ha (1 + ni)einϑ che non converge in quanto il termine n-esimo non tende a zero. Quindi C = {z ∈ C : |z| < 1}. (c) Le potenze dispari sono nulle,√quindi fissato z, si definisce an = z2n /2n e n si ha limn→∞ √|an | = |z2 /2|. La serie√converge nel P cerchio {z ∈ C : |z| < 2}. Nei punti z = 2eiϑ si ha ei2nϑ che non converge in quanto il termine n-esimo non tende a √ zero. Quindi C = {z ∈ C : |z| < 2}. (d) Centro in z0 = 2i e raggio R = 3. Converge in {z ∈ C : |z − 2i| < 3}. Nei punP ti z = 2i + 3eiϑ si ha einϑ /n che converge in tutti i punti della circonferenza per il Criterio di Dirichlet (pagina 429 del primo volume), tranne quando ϑ = 0, ovvero nel punto (3, 2i), dove diverge in quanto serie armonica. Quindi C = {z ∈ C : |z − 2i| ≤ 3 ∧ z , 3 + 2i}. (e) Centro in z0 = 0 e, osservando che [(1 + 2ni)/(n + 2i)]n ∼ (2i)n , il raggio di convergenza è R = 1/2. Converge in {z ∈ C : |z| < 1/2}. Nei punti in cui |z| = 1/2, ovvero z = eiϑ /2 si ha una serie con termine generale ∼ in enϑi che non tende a zero, dunque la serie non converge. Quindi C = {z ∈ C : |z| < 1/2}. 6 Poniamo an = cn /4n , cioè il termine della serie quando x = 1/4. Essendo cn ≤ 2n (per ricorrenza) abbiamo an < 1/2n , quindi la serie converge. Il raggio di convergenza è quindi maggiore di 1/4 e pertanto non è nullo. Scriviamo, all’interno dell’intervallo di convergenza, f (x) = x f (x) = x2 f (x) =
c0
+
c1 x c0 x
+ +
c2 x2 c1 x2 c0 x2
+ + +
c3 x3 c2 x3 c1 x3
+ + +
··· ··· ···
Soluzioni degli esercizi – Capitolo II
In questo modo, sottraendo, troviamo ∞ X f (x)(1 − x − x2 ) = c0 + (c1 − c0 )x + (cn − cn−1 − cn−2 )xn n=2
quindi f (x)(1 − x − x2 ) = x (i termini della somma sono tutti nulli). Dunque, che x2 + x − 1 ha √ √ dopo aver osservato radici a = (−1 + 5)/2 e b = (−1 − 5)/2, dalla seconda formula dell’Esercizio (II.1) ricaviamo ∞ 1 X 1 1 −x = √ − n xn . f (x) = n (x − a)(x − b) b 5 n=1 a Dal Principio di identità delle serie di potenze ricaviamo l’espressione di cn richiesta. Essendo cn /cn+1 = (1/b)[1 − (a/b)n ]/[1 − (a/b)n+1 ] possiamo calcolare il raggio di convergenza: R = limn→+∞ cn /cn+1 = 1/b = a. P P P 7 Poniamo An = nk=0 ak , Bn = nk=0 bk , Cn = nk=0 ck , A = limn→+∞ An e analogamente B. Vogliamo dimostrare che Cn → AB. Sia poi βn = Bn − B. Allora si ha Cn = a0 b0 + (a0 b1 + a1 b0 )
+ · · · + (a0 an + a1 bn−1 + · · · + an b0 ) = a0 Bn + a1 Bn−1 + · · · + an B0
= a0 (B + βn ) + a1 (B + βn−1 ) + · · · + an (B + β0 ) = An B + (a0 βn + a1 βn−1 + · · · + an β0 ).
Per dimostrare che Cn → AB, poiché An B → AB, basta mostrare che P γn = a0 βn + a1 βn−1 + · · · + an β0 tende a 0. Sia ora α = ∞ n=0 |an |, che è finito perché la serie di an è assolutamente convergente; fissato ε > 0 scegliamo N in modo che |βn | ≤ ε per n > N (usiamo la convergenza della serie dei bn ). Maggioriamo così |γn | ≤ |β0 an + · · · + βN an−N | + |βN+1 an−N−1 + · · · + βn a0 | ≤ |β0 an + · · · + βN an−N | + εα.
Tenendo fisso N, per n tendente all’infinito si ottiene lim sup |γn | ≤ εα, poiché ak → 0 per k → +∞. Dall’arbitrarietà di ε, segue che il limite di γn è zero. 8 Per l’Esercizio 7 , il termine n-esimo della serie prodotto è wn−1 z2 wn−2 zk wn−k zn wn +z· + +· · ·+ +· · ·+ n! (n − 1)! 2! (n − 2)! k! (n − k)! n!
che, ricordando la formula del binomio di Newton, diventa ! n n X 1 X n k n−k (z + w)n zk wn−k = . zw = k!(n − k)! n! k n! k=0
k=0
Se k = 1 l’identità è banalmente verificata, essendo R10 π sin2 dx = π/2. Supponiamo (passo induttivo) quindi 0 che sia vera per k e verifichiamola per k + 1. Integriamo
577
per parti Z π
Z 2k+1
sin 0
π
(2k + 1) sin2k x cos2 x dx
x sin x dx = 0
Sostituendo cos2 x = 1 − sin2 x otteniamo la relazione di ricorrenza suggerita da cui segue facilmente la tesi (utilizzando il passo induttivo).
11 Scriviamo, utilizzando lo sviluppo in serie di Taylor del coseno (19) di pagina 76 ed integrando termine a termine, Z π Z πX ∞ (−1)k (x sin t)2k dt cos(x sin t) dt = 0 0 k=0 (2k)! Z ∞ ∞ X X (−1)k 2k π (−1)k 2k = sin2k t dt = π x x (2k)! 22k (k!)2 0 k=0 k=0 che, per Esercizio 10 , è uguale a πJ0 (x). Per verificare la seconda identità scriviamo cos(x sin t − t) = cos(x sin t) cos t + sin(x sin t) sin t.
L’integrale del primo addendo è nullo, infatti si tratta di un integrale quasi immediato se si osserva che cos(x sin t) cos t = x1 dtd [sin(x sin t)]. Per calcolare il secondo integrale, sviluppiamo in serie il seno e usiamo l’Esercizio 10 : Z π sin(x sin t) sin t dt 0
Z
∞ πX
(−1)k (x sin t)2k+1 sin t dt 0 k=0 (2k + 1)! Z ∞ X (−1)k 2k+1 π = sin2k+2 t dt x (2k + 1)! 0 k=0
=
=π
∞ X k=0
(−1)k x2k+1 = πJ1 (x). + 1)!k!
22k+1 (k
12 (a) Si ragioni esattamente come nell’Esempio (II.12). (b) Abbiamo già studiato nel § 3 il caso ν = 0, 1. Possiamo dunque supporre ν ≥ 2. Abbiamo, utilizzando la formula (2), ∞ X (−1)n Jν′ (x) = (2n + ν) 2n+ν x2n+ν−1 , 2 n!(ν + n)! n=0 Jν′′ (x) =
∞ X (2n + ν)(2n + ν − 1) n=0
(−1)n x2n+ν−2 , + n)!
22n+ν n!(ν
578
Soluzioni degli esercizi – Capitolo II
x2 Jν (x) =
∞ X n=0
=−
∞ X
4n(n + ν)
n=0
22n+ν n!(ν
P∞ n+2 ; quindi, D’altra parte abbiamo x2 y(x) = n=0 cn x sostituendo nell’equazione di Bessel, troviamo ∞ h X i n2 − ν2 cn + cn−2 xn = 0. −ν2 c0 + (1 − ν2 )c1 x +
x2 Jν′′ (x) + xJν′ (x) + (x2 − ν2 )Jν (x) =
Dunque abbiamo trovato le relazioni (possiamo supporre ν ≥ 1)
(−1)n x2n+ν+2 22n+ν n!(ν + n)! (−1)n x2n+ν , + n)!
n=2
e dunque ∞ X [(2n + ν)(2n + ν − 1) + (2n + ν) − ν2 − 4n(n + ν)] n=0
!
×
(−1)n x2n+ν−2 = 0 + n)!
22n+ν n!(ν
(c) Abbiamo xν Jν (x) =
∞ X n=0
(−1)n x2n+2ν , 22n+ν n!(ν + n)!
che ha ancora raggio di convergenza infinito. Per il Teorema di derivazione delle serie di potenze abbiamo ∞ X (−1)n d ν [x Jν (x)] = (2n + 2ν) 2n+ν x2n+2ν−1 dx 2 n!(ν + n)! n=0 ∞ X
c0 = 0
2
(ν − 1)c1 = 0 n2 − ν2 cn = −cn−2 ,
se n ≥ 2. .
Da tali relazioni otteniamo che tutti i termini fino a ν−1 si devono annullare. Per la relazione di ricorrenza, inoltre, tutti i termini della stessa parità di ν − 1 sono necessariamente nulli, cioè c2n+ν−1 = 0, per ogni n ≥ 0. Il termine di posto ν può essere scelto arbitrariamente. Gli altri termini devono soddisfare la relazione di ricorrenza cn−2 cn = − 2 , n − ν2 che scriviamo ancora come c2n+ν , c2n+2+ν = − (2n + 2 − ν)(2n + 2 + ν)
(−1)n x2n+2ν−1 = xν Jν−1 (x) . che è la stessa relazione che intercorre fra i termini − 1 + n)! n=0 (−1)n cν . 22n+ν n!(ν + n)! 13 Posto ρ = 2πrR/λ f , dall’Esercizio 11 si ha Z 2π cos(ρ sin ϑ) dϑ = 2πJ0 (ρ). 15 Il resto n-esimo in forma di Lagrange dello svilup0 po di Taylor di f in x0 (si veda l’Esempio (II.21)) risulta Dunque, poiché r = ρλ f /2πR, possiamo scrivere maggiorato nel modo seguente !2 Z πdR/λ f λf f (n+1) (y) |x − x0 | n+1 Ψ(R) = 2π ρJ0 (ρ)dρ. . (x − x0 )n+1 | ≤ M |Rn (x)| = | 2πR (n + 1)! r 0 =
22n+ν−1 n!(ν
D’altra parte abbiamo imparato nell’Esercizio 12 (c) che xJ0 (x) = [xJ1 (x)]′ e dunque !2 ! ! λf πdR πdR Ψ(R) = 2π J1 2πR λf λf ! 2 λfd πd J1 (ξ/2) πdR = J1 , = 2R λf ξ dove ξ = λ f /(Rdπ). 14 Ragioniamo come in § 3. determinare i P Vogliamo n coefficienti della serie: y(x) = ∞ n=0 cn x . Calcoliamo: ∞ X xy′ (x) = (n + 1)cn+1 xn+1 = c1 x + 2c2 x2 + 3c3 x3 + . . . , n=0 ∞ X x2 y′′ (x) = (n+2)(n+1)cn+2 xn+2 = c2 x2 +3·2c3 x3 +. . . . n=0
(dove y è compreso tra x0 e x0 + r — oppure tra x0 − r e x0 ). Essendo |x − x0 |/r < 1, il resto Rn tende a zero per n che tende a infinito. 16 Abbiamo già visto nell’Esercizio (II.8) che il problema è quello di mostrare che la somma della serie di Taylor di f è proprio f per ogni x ∈ (−1, 1). Il Criterio (II.22) risulta di difficile, se non impossibile, applicazione per p generale; ricorriamo ad un argomento indiretto che poggia sul Teorema di derivazione per serie (II.14); se chiamiamo s(x) la somma della serie abbiamo ! ∞ X p n−1 ′ s (x) = n x , ∀x ∈ (−1, 1). n n=1 Mostriamo ora che vale la seguente relazione (•)
(1 + x)s′ (x) = ps(x)
∀x ∈ (−1, 1).
Soluzioni degli esercizi – Capitolo II
Da questa si ricava facilmente che (1 + x)s′ (x) − ps(x) = 0, [s(x)(1 + x)−p ]′ = (1 + x)p+1 ePperciò s(x)(1 + x)−p è costante in (−1, 1): essendo s(0) = ∞ p n p n=0 n 0 = 1 si trova s(x) = (1 + x) , ∀x ∈ (−1, 1). Quindi p (1 + x) è uguale in ogni punto di (−1, 1) alla sua serie di Taylor. Ora dimostriamo (•): ! ! ∞ ∞ X X p p (1 + x)s′ (x) = n xn−1 + n xn n n n=1 n=1 ! ! ∞ ∞ X X p p xn + = (n + 1) n xn n n + 1 n=0 n=1 !# ! ∞ " X p p n +n x =p+ (n + 1) n n+1 n=1 ! ∞ X p p xn = ps(x), =p+ n n=1 p infatti (n + 1) n+1 + n np = p np . 17 Cerchiamo una soluzione della forma y = P P∞ ∞ n ′ n−1 a = na e y′′ = n (x − 1) , con y n (x − 1) n=0 n=1 P∞ n−2 n(n − 1)a (x − 1) che riscriviamo come y′′ = n Pn=2 ∞ n (n + 2)(n + 1)an+2 (x − 1) . Il termine (x − 1)2 y è n=0P n+2 y= ∞ . Scrivendo i primi termini di y′′ si ha n=0 an (x − 1) P∞ ′′ y = 2a2 + 6a3 (x − 1) + n=2 (n + 2)(n + 1)an+2 (x − 1)n . Sostituiamo queste espressioni nell’equazione differenziale e annullando i coefficienti di ogni potenza di x si trova an−4 per n = 4, 5, ... Per determinare a2 = 0, a3 = 0 e an = n(n−1) una soluzione, bisogna fissare in modo arbitrario a0 e a1 . Tutti i coefficienti di indice 2 + 4k e 3 + 4k con k = 0, 1, . . . sono nulli. 18 P ∞
Cerchiamo unaP soluzione della forma P∞ y = ∞ n−1 an xn , con y′ = eP y′′ = n=1 nan x n=2 n(n − n 1)an xn−2 . Il termine xy′′ si scrive xy′′ = ∞ n(n+1)a n+1 x . n=1 Se sostituiamo queste espressioni nell’equazione differenziale e annulliamo i coefficienti di ogni potenza di an x troviamo 2a1 + a0 = 0, e an+1 = − (3n+2)(n+1) per n = 1, 2, ... Per determinare una soluzione, basta fissare un qualunque valore per a0 . n=0
19 P ∞
Cerchiamo P una soluzione della = P∞ forma y n−2 n−1 ′′ an xn , con y′ = ∞ n=1 nan xP e y = n=2 n(n−1)an x n che riscriviamo come y′′ = ∞ n=0 (n + 2)(n + 1)an+2 x . Sostituiamo queste espressioni nell’equazione differenziale e otteniamo ∞ X 2a2 + νa0 + [(n + 2)(n + 1)an+2 − (2n − ν)an ]xn = 0. n=0
n=1
Annullando i coefficienti di ogni potenza di x si trova (2n−ν)an a2 = −νa0 /2, e an+2 = (n+2)(n+1) per n = 1, 2, ... Si può
579
prendere qualunque valore per a0 e a1 , ad esempio a0 = 1 e a1 = 0: dalla relazione per ricorrenza si trova che sono nulli tutti i coefficienti di indice dispari e si trova ν(4−ν)(8−ν)...(4n−4−ν) . Una soluzione dell’equazione di a2n = − (2n)! Hermite è dunque ∞ X ν(4 − ν)(8 − ν) . . . (4n − 4 − ν) 2n x . y1 (x) = 1 + − (2n)! n=1 Osserviamo che se ν = 4n per qualche intero non negativo n, allora y1 è un polinomio pari di grado 2n, in quanto a2n+2 = 0 e quindi si annullano anche tutti i successivi coefficienti pari. Una seconda soluzione, linearmente indipendente, si trova scegliendo a0 = 0 e a1 = 1. Risulta ∞ X ν(2 − ν)(6 − ν) . . . (4n − 2 − ν) 2n+1 y2 (x) = x + − x , (2n + 1)! n=1 che diventa un polinomio dispari di grado 2n + 1 se ν = 4n + 2. 20 La convergenza si ottiene applicando il Criterio di Weierstrass, infatti |sin(nx)/n2 | ≤ 1/n2 e la serie di termine 1/n2 è convergente. Il termine n-esimo della serie delle derivate è fn′ (x) = (cos nx)/n. Se x = 2kπ, si ha che fn′ = 1/n termine n-esimo della serie armonica, quindi divergente. 21 La serie di potenze di partenza ha raggio 1; possiamo quindi derivare termine a termine (per due volP∞ (n−1) n−2 P xn−1 ′′ , te) e ottenere f ′ (x) = ∞ n=1 n x n=1 n e f (x) = entrambe con raggio di convergenza uguale a 1. Studio agli estremi dell’intervallo: le serie f ed f ′ convergono in x = −1 per il Criterio di Leibniz. In x = 1 f converge in quanto serie armonica generalizzata di esponente maggiore di 1, f ′ diverge in quanto serie armonica. La serie f ′′ non converge in x = −1 (serie a segno alternato con termine n-esimo non tendente a zero) e diverge in x = 1 (serie a segno costante con termine n-esimo non tendente a zero). 22 Dimostriamo l’ultima; l’idea è di integrare per parti due volte per ritrovare lo stesso integrale: Z π I= sin nx cos mx dx −π Z π π cos nx cos nx cos mx · (m sin mx) dx − = − n n −π −π ) ( Z π π m sin nx sin nx = sin mx m cos mx dx − + n n n −π −π m2 I n2 da cui si ricava immediatamente RI = 0 per ogni m , n. π D’altra parte se n = m si ha 2I = −π sin 2nx dx = 0. Con =
580
Soluzioni degli esercizi – Capitolo II
la stessa idea si dimostrano le altre due formule. 23
Poniamo
Z π 2 sin2k t cos(2mt) dt π 0 Z π 2 sin2k+1 t sin[(2m + 1)t], dt β(k, m) = π 0
α(k, m) =
Ora mostriamo che valgono le relazioni: k+1−m α(k, m) = −2 β(k, m − 1) 2k + 1 k+1−m β(k, m) = α(k + 1, m), k+1 dalle quali segue, fra l’altro, l’annullarsi di α e β se m ≥ k+1. Dalle formule di addizione del coseno possiamo scrivere, con una integrazione per parti, Z π Z π sin2k t cos(2mt) dt = sin2k t cos[t + (2m − 1)t] dt = 0 0 Z π sin2k t cos t cos[(2m − 1)t] − sin2k+1 t sin[(2m − 1)t] dt | {z } 0 [sin2k+1 t]′ /(2k+1) Z π
= 0
2m − 1 − 1 sin2k+1 t sin[(2m − 1)t] dt. 2k + 1
Da qui la prima relazione. La seconda si dimostra in del tutto analogo, ricordando questa volta che sin[(2m + 1)t] = sin t cos(2mt) + cos t sin(2mt) e integrando per parti. Dalle due relazioni fra α e β ricaviamo ancora una importante relazione di ricorrenza: k+1−m k+2−m α(k, m) = −2 α(k + 1, m − 1). 2k + 1 k+1 Ora, sappiamo già dall’Esercizio 10 che la prima formula è vera per m = 0 ed ogni k. Possiamo ragionare per induzione sull’indice m. Così, supponendo che la relazione sia vera per m − 1 ed ogni intero k, avremo k+1−m k+2−m α(k + 1, m − 1) α(k, m) = −2 2k + 1 k+1 k + 1 − m k + 2 − m 2π(−1)m−1 (2k + 1)! = −2 2k + 1 k + 1 22k+1 (k + 2 − m)!(k + m)! m 2π(−1) (2k)! . = 2k 2 (k − m)!(k + m)! Dunque la prima delle due formule è verificata anche per m ed ogni intero k. Infine, ricordando la relazione fra α(k, m) e β(k, m) otteniamo facilmente la seconda formula.
24 Osserviamo che la funzione sink t è pari oppure dispari a seconda della parità o disparità di k. Gli sviluppi corrispondenti saranno dunque costituiti da soli coseni oppure da soli seni. Inoltre, la funzione sink t è simmetri-
ca, per k pari, anche rispetto a π/2 mentre è antisimmetrica rispetto a π/2 per k dispari. Quindi gli unici coefficienti di Fourier non nulli sono Z π 2 sin2k t cos(2mt) dt α(k, m) = π 0 Z π 2 sin2k+1 t sin[(2m + 1)t] dt β(k, m) = π 0 Concludiamo utilizzando le formule di calcolo di α e β.
25 Osserviamo preliminarmente che f è una funzione pari mentre 1 è dispari. I loro sviluppi conterranno quindi soltanto coseni e seni rispettivamente. Inoltre, f e 1 sono entrambe simmetriche rispetto alla retta x = π/2. Conseguentemente i loro sviluppi conterranno soltanto i multipli pari del coseno e dispari del seno. Per calcolare Z π 1 a2n = cos(e sin t) cos(2nt) dt π −π utilizziamo lo sviluppo in serie di Taylor del coseno: Z πX ∞ e2k sin2k (t) 1 a2n = cos(2nt) dt. π −π (2k)! k=0
Integrando per serie, dalla prima delle formule dell’Esercizio 23 ricaviamo facilmente ∞ ∞ X X e2k (−1)n e2k+2n (−1)k a2n = 2 = 2 . 22k (k − n)!(k + n)! 22k+2n k!(k + 2n)! k=n k=0 Nell’ultimo passaggio abbiamo cambiato indice di sommazione k 7→ k − n. Ricordando la definizione dell’Esercizio 12 , troviamo una relazione fra il coefficiente a2n e la funzione di Bessel J2n (e). Precisamente, osservando che le funzioni di Bessel sono pari per indice pari e dispari per indici dispari, possiamo scrivere (anche per n = 0): Z π 1 cos(e sin t) cos(nt) dt = Jn (e) + Jn (−e). an = π −π Di conseguenza abbiamo trovato che ∞ X cos(e sin t) = [Jn (e) + Jn (−e)] cos(nt) . n=0
Ragionando in modo del tutto simile si trova ∞ X sin(e sin t) = [Jn (e) − Jn (−e)] sin(nt) . n=0
26 Poiché f (t) = cos(µt) cos(e sin(t)) − sin(µt) sin(e sin(t)), conoscendo gli sviluppi in serie di Fourier ottenuti nello svolgimento dell’Esercizio
Soluzioni degli esercizi – Capitolo II
581
precedente, il secondo membro diventa ∞ X cos(µt) (Jn (e) + Jn (−e)) cos(nt)
forma di serie di Fourier: ∞ X 2Jn (nε) sin(nωt). f (t) = ωt + n n=1
n=0
− sin(µt)
∞ X n=0
(Jn (e) − Jn (−e)) sin(nt)
=
∞ X cos((µ + n)t) + cos((µ − n)t) (Jn (e) + Jn (−e)) 2 n=0
+
∞ X cos((µ − n)t) − cos((µ + n)t) (Jn (e) − Jn (−e)) 2 n=0
da cui la tesi. 27 Integriamo la serie ottenuta nell’Esercizio 26 fra [−π, π]: tutti i termini si annullano tranne quello per cui n = µ. Abbiamo quindi Z π Z π ∞ X cos(µt + x sin t) dt = Jn (x) cos((µ − n)t) −π
Z
n=0
π
+ Jn (−x)
−π
cos((µ + n)t) dt = 2πJn (x). −π
La tesi segue facilmente tenendo conto del fatto che la funzione cos(µt + x sin(t)) è pari. 28 Supponiamo che f (t) − ωt sia una funzione dispari e scriviamo una serie di Fourier ∞ X f (t) = ωt + bn sin(nωt) n=1
dove, indicato con T = 2π/ω il periodo, si dovrà avere Z 2ω T/2 ( f (t) − ωt) sin(nωt) dt . bn = π 0 Integrando per parti ricaviamo Z T/2 2 bn = ( f ′ (t) − ω) cos(nωt) dt nπ 0 Z T/2 2 = f ′ (t) cos(nωt) dt. nπ 0 Operiamo ora la sostituzione y = f (t), di modo che dy = f ′ (t) dt, con 0 ≤ y ≤ π e imponiamo la relazione ωt = f (t) − ε sin( f (t)), cioè ωt = y − ε sin(y): Z π 2 (cos(ny − nε sin(y)) dy. bn = nπ 0 Usufruendo delle relazioni dell’Esercizio 27 , possiamo scrivere infine bn = 2Jn (nε)/n, dove Jn è la n-esima funzione di Bessel. In conclusione abbiamo la soluzione in
29 (a) Essendo f definita a tratti nel periodo T = 2π, per calcolare i coefficienti dovremo “spezzare” gli integrali nella somma di integrali su (−π, 0] e su (0, π]: R0 Rπ 1 1 a0 = 2π dx − 2π 2 dx = − 21 −π 0 R0 Rπ an = π1 −π cos(nx) dx − π2 0 cos(nx) dx = 0 R0 Rπ 3 bn = π1 −π sin(nx) dx − π2 0 sin(nx) dx = nπ [(−1)n − 1].
Quindi bn = 0 se n è pari, bn = −6/nπ se n è dispari. La serie di Fourier di f è perciò ∞ 1 6X 1 sin((2k + 1)π). − − 2 π 2k + 1 k=0
f è costante a tratti, quindi la serie converge a f (x) quando x non è un punto di discontinuità cioè se x , −π, 0, π; in questi punti invece la somma della serie è −1/2. (b) I coefficienti di Fourier sono R0 Rπ 1 1 a0 = 2π x/2 dx − 2π 2x dx = 83 π −π 0 R0 Rπ 3((−1)n −1) 1 an = 2π −π x cos(nx) dx + π2 0 x cos(nx) dx = 2πn2 R0 1 x sin(nx) dx bn =R 2π −π π 2 3 + π 0 x sin(nx) dx = (−1)n+1 2n . Quindi se n è pari, an = 0; se n è dispari an = − πn3 2 . La serie di Fourier di f è perciò ∞ X (−1)k+1 1 3 π−3 cos((2k + 1)x) + sin(kx). 2 8 (2k + 1) π 2k k=0
la serie converge puntualmente a f (x) per ogni x ∈ (−π, π) (in particolare f è continua in x = 0). In x = ±π, la somma della serie [ f (π) + f (−π)]/2 = 3π/4. (c) In (−π, 0], la funzione f ≡ 0, quindi gli integrali sono su (0, π]. Integrando per parti otteniamo Rπ 1 a0 = 2π sin x dx = π1 , R π0 (−1)n +1 1 an = π 0 sin x cos(nx) dx = π(1−n2 ) Rπ bn = π1 0 sin x sin(nx) dx = 0. 2 Quindi se n è pari, an = π(1−n 2 ) ; se n è dispari an = 0. La serie di Fourier di f è perciò ∞ X 1 1 [1 + 2 cos(2kx)]. π 1 − (2k)2 k=1
La funzione f è continua su tutto R quindi la serie converge ad f per ogni x ∈ R. (d) f è una funzione dispari
582
Soluzioni degli esercizi – Capitolo II
nel periodo (0, 2π]: quindi an = 0 per ogni n. Z 2π 1 1 (π − x) sin(nx) dx = . bn = 2π 0 n P La serie di Fourier di f è perciò ∞ sin(nx)/n. f è una n=1 funzione soddisfacente la condizione (D) della Definizione (II.30) : quindi vale il teorema di convergenza puntuale in ogni punto; la serie converge a f (x), quando x , 2kπ, k ∈ Z; invece f (2kπ) = 0. (e) f è pari nel periodo (−π, π]: quindi bn = 0, ∀n ≥ 1. Rπ 1 1 a0 = 2π R π−π cosh(x) dx = π sinh(π) 1 an = π −π cosh(x) cos(nx) dx = π(n22 +1) (−1)n sinh(π). La serie di Fourier di f è perciò ∞ X (−1)n sinh(π) [1 + 2 cos(nx)]. π n2 + 1 n=1
La funzione f è continua su tutto R, quindi la serie converge in ogni x ∈ R al valore f (x). (f) Calcoliamo R0 Rπ 1 1 a0 = − 2π dx + dx = 21 π 0 R 0−π Rπ 1 an = − π −π cos(nx) dx + π2 0 cos(nx) dx = 0 R0 Rπ 3 (1 − (−1)n ). bn = − π1 −π sin(nx) dx + π2 0 sin(nx) dx = nπ Quindi se n è pari, bn = 0; se n è dispari bn = di Fourier di f è ∞ 1 6X 1 + sin((2k + 1)x). 2 π (2k + 1)
6 . nπ
cienti di i a partire da quelli di E. Dall’Esempio (II.32) e dalla formula di derivazione per le serie di Fourier dell’Esercizio (II.11) sappiamo che ∞ ∞ 1 2 X sin(2k + 1)t 2X E(t) = + e E′ (t) = cos(2k+1)t. 2 π k=0 2k + 1 π k=0 D’altra parte le serie di i′ e i′′ sono ∞ ∞ X X −nan sin nt+nbn cos nt e −n2 an cos nt−n2bn sin nt. n=1
Imponendo che sia verificata l’equazione differenziale otteniamo una uguaglianza di due serie di Fourier ∞ X 1 an a0 + (−Ln2 an + Rnbn + ) cos nt C C n=1 + (−Ln2 bn − Rnan +
k=0
(abbiamo integrato per parti due volte). La serie di Fourier di f è ∞ X (−1)n 1+2 cos(nx). 1 − n2 n=1
La funzione f è continua su tutto R,la somma della serie è f (x), ∀x ∈ R. 30 Abbiamo visto nell’Esercizio 39 a pagina 32 che l’intensità di corrente, i(t), che attraversa il circuito soddisfa l’equazione lineare di secondo ordine Li′′ (t)+Ri′ (t)+ 1 i(t) = E′ (t). Supponiamo diPsviluppare E(t) ed i(t) in C serie di Fourier: E(t) = α0 + ∞ n=1 αn cos nt + βn sin nt e P∞ i(t) = a0 + n=1 an cos nt + bn sin nt. Ricaviamo ora i coeffi-
2X bn ) sin nt = cos(2k + 1)t. C π ∞
k=0
Avremo quindi a0 = 0 e a2k = b2k = 0, mentre −L(2k + a 1)2 a2k+1 + R(2k + 1)b2k+1 + 2k+1 = 2/π e −L(2k + 1)2 b2k+1 − C b2k+1 R(2k + 1)a2k+1 + C = 0, per k = 0, 1, . . . . Possiamo ricavare i coefficienti an di posto dispari in funzione dei corrispondenti bn
La serie
f è una regolare (costante) a tratti, quindi vale il teorema di convergenza puntuale in ogni punto. I punti di discontinuità sono x = 0, x = π e x = −π: in tutti i tre casi la serie ha somma 1/2. (g) f è pari nel periodo (−π, π]: quindi bn = 0, ∀n ≥ 1. Calcoliamo Rπ 1 a0 = 2π x sin(x) dx = 1 −π Rπ 2 n an = π1 −π x sin(x) cos(nx) dx = 1−n 2 (−1)
n=1
a2k+1 = −
(LC(2k + 1)2 − 1)b2k+1 CR(2k + 1)
e ricaviamo infine: ! (LC(2k + 1)2 − 1)2 + R(2k + 1) b2k+1 = 2/π. − C2 R(2k + 1) da cui 2C2 R(2k + 1) −π((LC(2k + 1)2 − 1)2 + C2 R2 (2k + 1)2 ) 2C(LC(2k + 1)2 − 1) . =− −π((LC(2k + 1)2 − 1)2 + C2 R2 (2k + 1)2 )
b2k+1 = a2k+1
31 (a) Il prolungamento di f all’asse reale è la funzione costante uguale a 1, dunque la sua serie di Fourier coincide con f . Calcolando i coefficienti si trova infatti an = bn = 0, ∀n ≥ 1 e a0 = 1; (b) I coefficienti della serie sono R2 R2 a0 = 21 0 x dx = 1; an = 0 x cos(πnx) dx = 0; R2 2 . bn = 0 x sin(πnx) dx = − nπ La serie di Fourier di f è ∞ 2X1 1− sin(πnx). π n=1 n
Soluzioni degli esercizi – Capitolo II
(c) I coefficienti della serie sono R 2π 2 1 x2 dx = 4π3 ; a0 = 2π 0 R 2π R 2π 2 an = π1 0 x2 cos(nx) dx = − nπ x sin(nx) dx = 0 R 2π 4π 1 2 bn = π 0 x sin(nx) dx = − n .
583
4 ; n2
La serie di Fourier di f è perciò ∞ X 1 4π2 +4 (cos(nx) − nπ sin(nx)). 2 3 n n=1 (d) f è pari nell’intervallo (−1, 1]: quindi bn = 0 per ogni n ≥ 1. Rimangono da calcolare a0 e an . R1 R2 a0 = 21 0 x dx + 21 1 (2 − x) dx = 1; R1 R2 an = 0 x cos(πnx) dx + 1 (2 − x) = cos(πnx) dx n −1] . = 2[(−1) (nπ)2 Quindi se n è pari an = 0 per n ≥ 1; se n è dispari, an = −4/(nπ)2 . La serie di Fourier di f è ∞ 1 4 X 1 − 2 sin[(2k + 1)πx]. 2 π (2k + 1)2
Ancora integrando per parti due volte otteniamo R π/2 8n bn = π2 −π/2 sin(x) sin(2nx) dx = (−1)n π(1−4n 2)
La serie di Fourier di f è ∞ 8 X (−1)n n sin(2nx). π n=1 1 − 4n2
32 f R è pari dunque bn = 0 mentre a0 = π4 /5 e π 2 an = π 0 x4 cos nx dx si ottiene integrando per parti 4 volte: 8π2 (−1)n 48(−1)n − . an = n2 n4 La serie converge puntualmente su tutto R, in particolare se x = π ∞ ∞ X X π4 = π4 /5 + 8π2 1/n2 − 48 1/n4 . n=1
n=1
Per concludere si ricorre alla somma nell’Esercizio (II.9) a pagina 81.
P∞
n=1
1/n2 ottenuta
k=0
(e) Integrando per parti due volte nel caso n ≥ 1 si trova R1 a0 = 21 −1 ex dx = sinh(1); R1 2 an = −1 ex cos(πnx) dx = (−1)n sinh(1) 1+(nπ) 2 R1 2πn x n+1 bn = −1 e sin(πnx) dx = (−1) sinh(1) 1+(nπ)2 .
La serie di Fourier di f è perció ∞ X (−1)n 1 . (cos(πnx) 2 sinh(1) + − πn sin(πnx)) 2 1 + (nπ)2 n=1
(f) f è pari in (−2, 2]: quindi bn = 0 per ogni n ≥ 1. R2 a0 = 21 0 x dx = 1; R2 4 ) dx = ((−1)n − 1) (nπ) an = 0 x cos( πnx 2. 2 La serie di Fourier di f ∞ (2k + 1)πx 1 8 X cos . 1− 2 π (2k + 1)2 2 k=0
(g) f è dispari in (−1, 1]: quindi an = 0 per ogni n. Integrando per parti R0 R1 bn = −1 (x + 1) sin(πnx) dx + 0 (x − 1) sin(πnx) dx 2 . = − nπ
La serie di Fourier di f è ∞ 2X1 − sin πnx. π n=1 n (h)
f è dispari in (−π/2, π/2]: quindi an = 0, ∀n ≥ 0.
33
La funzione f è pari, per cui bn = 0 per ogni n ≥ 1. R3 R3 a0 = 16 −3 |x| dx = 31 0 x dx = 23 R3 R3 6[(−1)n −1] dx = 23 0 x cos πnx dx = (πn)2 an = 26 −3 |x| cos πnx 3 3
Quindi se n è pari, an = 0; se n è dispari an = −12/(πn)2 . La serie di Fourier associata a f è ∞ (2k − 1)πx 1 3 12 X − 2 cos . 2 π (2k − 1)2 3 k=1
La prima uguaglianza segue dalla convergenza puntuale della serie in x = 0. Per la seconda uguaglianza osserviamo che R3 P P∞ 9 1 1 2 2 |x|2 dx = 2a20 + ∞ da n=1 (an + bn ) = 2 + k=1 (2k−1)4 ; 3 −3 cui si ricava che ∞ X π4 1 . = 96 (2k − 1)4 k=1
34 f è pari, per cui bn = 0 per ogni n ≥ 1. Inoltre, per parti due volte, Rπ a0 = π1 R0 sin x dx = π2 ; π 4 an = π2 0 sin x cos(2nx) dx = π(1−4n 2) . La serie di Fourier associata a f è perció ∞ X 1 2 cos(2nx) . 1 + 2 2 π 1 − 4n n=1 La somma della prima serie numerica si ottiene dalla P 1 convergenza puntuale in 0: 0 = f (0) = 1 + 2 ∞ n=1 1−4n2 .
584
Soluzioni degli esercizi – Capitolo II
Dall’uguaglianza di Bessel–Parseval abbiamo inoltre Z π ∞ X 8 16 1 sin(x)2 dx = 2 + . 2 (1 − 4n2 )2 π 0 π π n=1 Rπ Dato che π1 0 sin2 x dx = 1/2 possiamo ricavare la somma della seconda serie. 35
La serie di Fourier associata a f è ∞ X (−1)n 2 cos(2nx) . 1 + 2 π 1 − 4n2 n=1
Dato che la funzione f verifica le ipotesi del teorema di convergenza puntuale, per x = 0, si ha i h P (−1)n f (0) = 1 = π2 1 + 2 ∞ n=1 1−4n2 da cui la somma richiesta. 36 La serie di Fourier di è stata calcolata nell’Esempio (II.10): sappiamo quindi che m X sin nx Fm (x) = 2 (−1)n+1 . n n=1 Valutando questa somma in x = π − mπ si ha Fm (π − P P π 1 n+1 sin(nπ−(nπ)/m ) = 2 m = 2 m n=1 (−1) n=1 n sin((nπ)/m) = n n Pm π sin((nπ)/m) 2 n=1 m (nπ)/m) Riconosciamo nell’ultima espressione una somma di Riemann su (0, π) per la funzione 2 sinx x : infatti i punti 0, π/m, (2π)/m),. . . ,π costituiscono una partizione di [0, π] in intervalli di ampiezza π/m. Ma allora, per definizione di integrale di Riemann si ha che Fm tende, per m → +∞, all’integrale di 2 sinx x su [0, π], che è la tesi. Il secondo limite si calcola in modo del tutto analogo. 39 La formula per n = 0 si riduce all’identità 1/2 = 1/2; supponiamoP ora vera la formula per n − 1 e dimostriamosin(n−1/2)x la per n: 12 + n−1 k=1 cos kx+cos nx = 2 sin(x/2) +cos nx. Dalle formule di addizione per il seno si ha sin(n − 1/2)x = sin nx cos(x/2) − cos nx sin(x/2)
da cui il numeratore dell’ultima espressione è pari a sin(n + 1/2)x, come volevamo. Per dimostrare la formula relativa a Fm basta esplicitare l’espressione dei coefficienti di Fourier. Si trova allora che Fm (x) è uguale a Z π m 1 X 1 f (t) + (cos nt cos nx + sin nt sin nx) dt π −π 2 n=1 Z π m 1 X 1 = f (t) + cos n(t − x) dt. π −π 2 n=1 Basta ora la sostituzione t − x = y nell’integrale per avere Z π−x m 1 X 1 f (x + y) + cos ny dy. π 2 −π−x
n=1
Ricordando che l’integrale di una funzione periodica
è lo stesso su ogni intervallo che ha ampiezza uguale al periodo e la formula di Dirichlet si ha il risultato desiderato. 40 Si deve valutare la differenza dn (x) = Fm (x) − [ f (x+) + f (x− )]/2. Utilizziamo la formula nell’esercizio precedente per scrivere il polinomio di Fourier come integrale; dalla formula di Dirichlet, integrando entrambi i membri tra 0 e π otteniamo che Z π sin(n + 1/2)x dx = π/2, 2 sin(x/2) 0 e lo stesso vale integrando tra −π e 0. Sfruttiamo questo fatto per scrivere Z 0 f (x + t) − f (x+ ) sin(n + 1/2)t dt πdn (x) = 2 sin(t/2) −π Z π − f (x + t) − f (x ) sin(n + 1/2)t dt. + 2 sin(t/2) 0 La funzione F(t) definita come f (x+t)− f (x+ ) 2 sin(t/2)
f (x+t)− f (x− ) 2 sin(t/2)
per −π ≤ t < 0,
per 0 < t ≤ π e F(0) = 0, risulta continua in [−π, π] tranne al più un numero finito di punti (t = 0 e gli eventuali punti di discontinuità di f , che, per ipotesi, verifica la condizione (D) della Definizione (II.30) ). In particolare in t = 0 si ha f (x + t) − f (x+ ) t/2 · = f ′ (x+ ) lim+ F(t) = lim+ t→0 t→0 2 sin(t/2) t/2 e analogamente esiste finito limt→0+ F(t) = f ′ (x− ). Dunque F è integrabile e possiamo scrivere (dalle formule di prostaferesi) Rπ πdn (x) = −π F(t) sin(n + 1/2)t dt Rπ Rπ = −π F(t) sin(t/2) cos nt dt + −π F(t) cos(t/2) sin nt dt.
Grazie al lemma di Riemann–Lebesgue dell’Esercizio 38 , passando al limite per n → +∞ si conclude dn (x) → 0, che è la tesi.
41 (a) Sia fn (x) = n1x . Notiamo che, affinché sia limn→∞ fn (x) = 0, deve essere x ≥ 0. Quindi l’insieme di convergenza I è P un sottoinsieme di [0, ∞). Inoltre, fissato 1 x ≥ 0, la serie ∞ n=1 nx è una serie armonica generalizzata: quindi converge solo per x > 1, ovvero I = (1, ∞). Nell’insieme I la serie converge anche uniformemente: infatti si ha che, per x ≥ α > 1, | n1x | ≤ n1α . Dato che P ∞ 1 n=1 nα è una serie P numerica convergente, per il Criterio di Weierstrass, ∞ n=1 fn (x) converge uniformemente su I. (b) Sia fn (x) = 2n sin( 3xn ). Notiamo che, per x ∈ R fissato, limn→∞ fn (x) = 0. Tuttavia per | sin( 3xn )| = 1, ovn vero per x = ± 3 2π , la serie non converge in quanto serie n geometrica di ragione 2 > 1. D’altra per x , ± 3 2π P∞ parte, 2 n fissato, la serie è maggiorata da n=0 x( 3 ) che converge in quanto serie geometrica di ragione 23 . Quindi l’insieme
Soluzioni degli esercizi – Capitolo II
585
n
di convergenza I è R r {± 3 2π }. La serie converge anche uniformemente su tutti gli intervalli del tipo [a, b] di I con infatti se x ≤ b, si ha | fn (x)| ≤ b( 32 )n . Dato che P∞ b <2 ∞: n geometrica convergente, per il Crin=0 b( 3 ) è una serieP terio di Weierstrass, ∞ n=1 fn (x) converge uniformemente cos(nx) su I. (c) Sia fn (x) = enx . Notiamo che, affinché sia limn→∞ fn (x) = 0, deve P essere x ≥ 0. Per x > 0 fissato, la 1 n serie è maggiorata da ∞ n=1 ( ex ) che converge in quanto 1 serie geometrica di ragione ex < 1. Per x = 0 la serie chiaramente non converge. Quindi l’insieme di convergenza I è (0, ∞). Nell’insieme I la serie converge anche uniformecos(nx) mente: infatti si P ha che, per x ≥ α > 0, | enx | ≤ ( e1x )n ≤ ∞ 1 n 1 ( α ) . Dato che n=1 αn è una serie P geometrica convergente, per il Criterio di Weierstrass, ∞ fn (x) converge n=1 √ n uniformemente su I. (d) Sia fn (x) = (x−2)n . Per x , 2 fissato, applichiamo il Criterio delqrapporto: per la conver fn+1 (x) 1 n+1 1 genza si deve avere = → < 1, fn (x)
n
(x−2)
(x−2)
ovvero x > 3 oppure x < 1. L’insieme di convergenza I è (−∞, 1) ∪ (3, ∞). In ogni intervallo di tipo [3 + ε, ∞) la serie converge anche uniformemente: infatti per √x ≥ 3 + ε, √n n si ha che (x − 2) ≥ 1 + ε e quindi (x−2)n ≤ (1+ε)n . Dato P∞ 1 che n=1 (1+ε)n è una serie convergente (per il Criterio del P rapporto), per il Criterio di Weierstrass, ∞ n=1 fn (x) converge uniformemente per x ≥ 3 + ε. Analogamente si dimostra la convergenza uniforme in (−∞, 1 − ε] per ogni ε. (e) Sia fn (x) = (−1)n+1 e−n sin(x) . Per x fissato, applichiamo il Criterio del rapporto: per la convergenza si deve avefn+1 (x) re fn (x) → e− sin(x) < 1, ovvero sin(x) > 0. L’insieme di convergenza I è l’unione degli intervalli (2kπ, (2k + 1)π) al variare di k intero. La serie converge uniformemente in ogni [a, b] contenuto in I: infatti per x ∈ [a, b] insieme si ha fn (x) = |e−n sin(x) | ≤ e−nα dove α è il minimo tra i P 1 nα valori positivi sin a e sin b. Dato che ∞ è una sen=1 ( e ) rie geometrica convergente, per il Criterio di Weierstrass, P∞ n=1 fn (x) converge uniformemente in [a, b]. P 42 Per x ∈ R fissato, la serie è di tipo (−1)n an con sin x+n an = n2 positivo e tale che an+1 < an per ogni n. Dunque converge per il Criterio di Leibniz per ogni x ∈ R. Per valutare la convergenza uniforme, chiamata s(x) la somma della serie e sm (x) la somma parziale arrestata all’indice m, si ha Rm (x) = |s(x) − sm (x)| ≤ am+1
dunque
sin x + (m + 1) m+2 ≤ →0 (m + 1)2 (m + 1)2 Il Criterio di Weierstrass non si può applicare perché la maggiorazione migliore possibile del termine generale Rm (x) ≤ am+1 ≤
della serie sin x + n n + 1 ≤ n2 n2 P ma la serie numerica n+1 non converge. n2
P 43 Per x ∈ R fissato, la serie è di tipo (an − an+1 xn con an = n Grazie alla formula ricordata nel testo dell’esercizio si ha m X xm+1 sm (x) = (an − an+1 ) = a1 − am+1 = x − . m+1 n=1 m+1
La serie dunque converge se e solo se xm+1 tende a 0, ovvero se e solo se x ∈ [−1, 1], e la sua somma è f (x) = x. Per valutare la convergenza uniforme si osserva che |x|m+1 m+1 1 per ogni x ∈ [−1, 1]. Poiché e dunque Rm (x) ≤ m+1 1/(m + 1) tende a 0, la convergenza è uniforme. La serie delle derivate ancora una serie telescopica: ∞ X (xn − xn+1 ). Rm (x) = | f (x) − sm (x)| =
n=0
P n n+1 Risulta m ) = 1−xm+1 : la serie converge se e son=0 (x −x lo se x ∈ (−1, 1] e ha somma 1(x) = 1 se x ∈ (−1, 1), mentre 1(1) = 0. Essendo la somma una funzione non continua, la convergenza non può essere uniforme in (−1, 1]. La serie di partenza non è derivabile per serie perché 0 = 1(1) , f ′ (1) = 1 44 fn (x) è sempre positiva; inoltre per x ≥ 0 si ha fn (x) ≤ n1 e per x < 0 invece fn (x) ≤ e−n|x| . Dunque il limite puntuale è f (x) = 0 su tutto R. Dalle prima delle maggiorazioni si ricava poi che sup[0,+∞) | fn (x) − f (x)| ≤ n1 che tende a 0, e la convergenza in [0, +∞] è uniforme. Invece su [−1, 1] fn raggiunge il suo massimo in xn = − lnnn , come si trova dallo studio della derivata fn′ , e fn (xn ) = 21 . Si ha quindi sup[−1,+1] | fn (x)− f (x)| = 21 e dunque la convergenza non è uniforme in [−1, 1] 45 Il limite puntuale è f (x) = 0 per ogni x ∈ R. Calco1−nx2 √1 lando fn′ si trova fn′ (x) = (1+nx 2 )2 che si annulla in x = ± n . √ 1 Si ha supx∈R | fn (x) − f (x)| = fn (1/ n) = 2 √n che tende a 0, dunque la convergenza è uniforme in R. Dall’espressione di fn′ si ricava che il limite puntuale di f ′ è la funzione nulla per x , 0 mentre in x = 0 si ha fn′ (0) = 1 → 1. Poiché le funzioni fn′ sono continue in R e il limite puntuale è una funzione non continua in x = 0, la convergenza non può essere uniforme in alcun intervallo che contiene l’origine. 46
Posto 1n (x)
=
√ nx 1+n2 x2
si ha sfruttando la
586
Soluzioni degli esercizi – Capitolo III
disuguaglianza 2ab ≤ a2 + b2 1 2|nx| 1 ≤ √ . |1n (x)| ≤ √ 2 n 1 + |nx|2 2 n
Di conseguenza 1n converge uniformemente in R alla funzione nulla e quindi fn (x) converge uniformemente in R r {0} alla funzione f (x) = |x|x .
47 Il limite puntuale è la funzione f (x) = 1 se x = 0 e f (x) = 0 se x , 0. Poiché le fn sono continue mentre f ha una discontinuità in x = 0, la convergenza non può essere uniforme in [−1, 1]. Per x ≥ 1 si ha | fn (x) − f (x)| ≤ 1+(n2 2x2 −1)2 = 1n (x). Si verifica, calcolando le derivate 1′n (x) che 1n raggiunge il suo massimo in x = ±1/n, e è decrescente in [1, +∞). Questo implica che sup[1,+∞) | fn (x) − f (x)| ≤ sup [1, +∞)1n (x) = 1n (1) = 2 che tende a 0 per n → +∞. Di conseguenza 1n 1+(n2 −1)2 converge uniformemente in [1, +∞). 48 Fissato x ∈ R per ogni n > x − 1 si ha fn (x) = 0, quindi fn (x) → 0. Però supR | fn (x) − f (x)| = 1 e la convergenza non è uniforme su R. Fissato ora a, per ogni n > a si ha sup(−∞,a] | fn (x) − f (x)| = 0, quindi la convergenza è uniforme su tutte le semirette (−∞, a]. 49 Fissato x > 0, si ha fn (x) = 0 per ogni n > 2/x, dunque fn (x) → 0. Dati a < 0 < b, per ogni n > 1/b si ha sup[a,b] fn (x) = fn (1/n) = 1, dunque la convergenza non è uniforme. La serie è convergente in quanto per ogni x > 0 fissato fn (x) = 0 per ogni n > 2/x, mentre per x ≤ 0 fn (x) = 0 per ogni n. D’altra parte supx∈R fn (x) = 1 e la convergenza non è uniforme.
Capitolo III 1 (a) (3, 5, −1); (b) (d) (−1, −1, 7).
(2, 4, 6); (c)
(9, 15, −3);
3 (a) (a, b, c) = (2, 1, 3); (b) (x, y, z) = (t, t, 0) per t ∈ R. (c) (u, v, a, b) = (1/2, 0, 1/2, −1) + t(1, 1, 1, 1), con t ∈ R. (d) x = y = k = h = 1. (e) (x, y, h, k) = (−s + 2t, −t + s, s, t) con s, t ∈ R. Altro modo di scrivere la soluzione: x = 2k − h, y = h − k (come se h e k fossero parametri).
4 Usiamo il Teorema (III.29). Basta calcolare il determinante dei tre vettori (matrice) 3 2 + k 1 2 1 3 = k2 − 6k + 18. det 3−k 2 1
Ora, dato che il determinante non è mai nullo, per ogni k esiste una e una unica soluzione al sistema proposto. Se qualcuno vuole trovare una soluzione, prenda un CAS e digiti qualcosa del genere > solve( x +3*y +(2+k)*z = 1, 2*x > + y+3*z = k, (3-k)*x+2* y+z = 3*k);
Ed ecco pronto il risultato: y = 2
5 k2 +7−5 k+k3 18−6 k+k2
k +5−22 k . x = − 18−6 k+k2
2
k −1+7 k , z = − 318−6 , k+k2
5 Si tratta del sistema ( c + 2d = x 2c + d = y, da risolvere in c e d (con x e y parametri fissati). Procediamo eliminando c e sostituendo c = x − 2d: 2(x − 2d) + d = y ⇐⇒ 3d = 2x − y.
1 2 (2x − y) e c = x − 2d = x − (2x − y) = 3 3 −1/3x + 2/3y.
Quindi d =
6 Dobbiamo risolvere il sistema u + 2v + 3w = x 2u + 3v + w = y 3u + v + 2w = z,
considerando u, v, w incognite e x, y, z parametri dati. Eliminando u con la prima
2 Con la terza eliminiamo z:
(*)
(*)
si ottiene il sistema di due equazioni nelle due incognite v, w ( ( 2(x − 2v − 3w) + 3v + w = y −v − 5w = y − 2x ⇐⇒ 3(x − 2v − 3w) + v + 2w = z −5v − 7w = z − 3x.
z = 3 + y, ( x + y + (3 + y) = 1 ⇐⇒ x + 2y = −2
2x − y − (3 + y) = 2 ⇐⇒ 2x − 2y = 5. Con la prima eliminiamo x:
La prima equazione consente di eliminare v:
(**) x = −2y − 2 2(−2y − 2) − 2y = 5 ⇐⇒ −6y = 9 ⇐⇒ y = −3/2 Sostituzione all’indietro con (**) e (*): x = −2(−3/2) − 2 = 1 z = 3 + (−3/2) = 3/2
u = x − 2v − 3w
per (**) per (*).
La soluzione è unica: (x, y, z) = (1, −3/2, 3/2).
(**) v = 2x − y − 5w,
e l’unica equazione rimasta è −5(2x − y − 5w) − 7w = z − 3x ⇐⇒ 18w = 7x − 5y + z.
Sostituendo in (**) si ottiene
18v = 18(2x − y) − 5(7x − 5y + z) = x + 7y − 5z.
Soluzioni degli esercizi – Capitolo III
Sostituendo in (*) infine 18u = 18x − 2(x + 7y − 5z) − 3(7x − 5y + z) = −5x + y + 7z.
L’unica soluzione è perciò −5x + y + 7z u 1 v x + 7y − 5z = 18 7x − 5y + z w
(C’è una sorta di simmetria in tutto questo, che solo il Lettore più accorto avrà saputo utilizzare per svolgere meno calcoli di quelli qui indicati.)
7 Due vettori non nulli sono paralleli quando sono linearmente dipendenti. Ma se αa + βb = 0 per certi coefficienti α, β non entrambi nulli, allora né α né β può essere zero (visto che i vettori a e b non sono nulli). Quindi a e b sono paralleli se e solo se c’è c ∈ R tale che b = ca. Lo stesso per b e c, e per a e c. Ora, se ci sono c1 ∈ R tale che b = c1 a e c2 ∈ R tale che c = c2 b, allora c = c2 b = c2 c1 a,
e quindi a e c sono paralleli (il fattore è c1 c2 ). 8 Per il Corollario (III.37), se le due equazioni si scrivono come P = A + tv e P = A + sw (cioè se B = A), allora v e w sono paralleli. Altrimenti, se A , B, dato che B è sulla retta, deve esistere tB tale che B = A + tB v, cioè B − A = tB v. Analogamente deve esistere sA tale che A = B + sA w, cio+ A − B = sA w. Né sA né tB possono essere nulli (giacché A , B), dunque tB v = B − A = −(A − B) = −sA w,
cioè v e w sono linearmente dipendenti (paralleli). 9 Per la definizione a pagina 130 del § 7, due rette sono sghembe se e solo se non sono né incidenti né parallele. Possiamo quindi dimostrare che due rette non sono sghembe (cioè sono incidenti oppure parallele) se e solo se sono complanari. Supponiamo che l e l′ siano complanari. Allora, per l’Esercizio (III.5), se non sono incidenti sono parallele (e viceversa). O l’una o l’altra, o sono incidenti oppure parallele. Viceversa, se non sono sghembe, abbiamo due casi. Se sono incidenti, allora esiste (unico) un punto A in comune a l e l′ . Esistono certamente due altri punti B ∈ l e C ∈ l′ , diversi da A, dove l è l’unica retta per A e B, e l′ l’unica retta per A e C. I tre punti A, B e C non possono essere allineati (altrimenti risulterebbe l = l′ , e non sarebbero incidenti in un sol punto), e dunque individuano un unico piano p che li contiene. Ora, in generale se un piano contiene due punti di una retta, allora contiene tutti i punti di questa retta, come dimostrato nell’Esercizio (III.7). Segue che l e l′ sono contenute nel piano p.
587
Abbiamo mostrato che se l e l′ sono incidenti, allora sono complanari. Non rimane che il caso in cui l e l′ sono parallele. Prendiamo due punti distinti A, B su l e un punto C su l′ . Se A, B, C sono allineati, significa che l = l′ , ed è chiaro che sono complanari. Altrimenti, consideriamo il piano p per A, B e C, di equazione #» #» P = A + sAB + tAC, che certamente contiene la retta l, visto che passa per A e #» B. La retta l può essere scritta con equazione P = A+tAB, la retta l′ con equazione P = C + sw per un certo vettore #» w parallelo a AB. Allora se P = C + sw è un qualsiasi ′ punto di l , allora P − C = sw sarà un vettore parallelo a #» #» AB, cioè P − C = cAB per un certo c ∈ R. Ma allora #» #» #» P = C + cAB = A + AC + cAB, #» #» che è della forma A + sAB + tAC per s = c e t = 1. Quindi ′ anche l sta in p. 10 La prima affermazione è vera sia per il piano che per lo spazio: è la Proprietà (III.41) a pagina 130. La seconda è vera per quanto riguarda il piano: si tratta dell’Esercizio (III.16). In R3 è vera se A < r, come conseguenza della Proposizione (III.49). Infatti, dato se esiste un unico punto A′ ∈ R tale che il vettore A′ − A sia ortogonale a r, allora esiste una unica retta per A e A′ , che è l’unica retta per A ortogonale a r. Invece è falsa se A appartiene alla retta r, perché in questo caso esiste il piano ortogonale a r e passante per A, e qualsiasi retta per A contenuta in questo piano (ce ne sono infinite) è ortogonale a r. L’ultima affermazione è vera in nel piano (si tratta dell’Esercizio (III.5)) ma non nello spazio (a meno che le rette siano complanari): possono esserci rette sghembe, che per definizione non si intersecano e non sono parallele. 11 Se A, B, C e D sono quattro punti di un parallelogramma (supponiamo che il lati siano AB, BC, CD #» # » e DA), allora AB e AD sono linearmente indipenden#» # » ti, e A + AB + AD = C, dato che (per definizione di parallelogramma) #» # » # » #» a = AB = DC, b = AD = BC. Siano i punti della diagonale AC parametrizzati da un parametro s ∈ [0, 1]: A + s(C − A). Analogamente, punti della diagonale BD saranno parametrizzati da un parametro t ∈ [0, 1]: B + t(D − B). Le due diagonali si incontreranno in un punto M per cui esistono s e t tali che cioè
A + s(C − A) = B + t(D − B), s(a + b) − t(b − a) = a,
(s + t − 1)a + (s − t)b = 0.
Dato che a e b sono linearmente indipendenti, (s, t) deve
588
Soluzioni degli esercizi – Capitolo III
essere una soluzione del sistema ( s+t=1 s − t = 0,
che ha per unica soluzione (s, t) = (1/2, 1/2). Quindi M è 1 1 M = A + (C − A) = B + (D − B), 2 2 cioè è punto medio di entrambe le diagonali. 12 (a) 8; (b) Non è definito: a · b = 4, e non abbiamo definito somma di scalare e vettore (solo prodotto di scalare e vettore); (c) 0; (d) 8. 13 Se per ogni x ∈ Rn , a · x = b · x allora in particolare se x = ei (dove ei sono i vettori della base standard di Rn ) si ha a · ei = b · ei
per ogni i = 1, . . . , n. Ma a · ei = ai , b · ei = bi (cioè le componenti), e quindi a e b hanno le stesse componenti, cioè a = b. Ora, è certamente possibile trovare a, b e x tali che a · x = b · x ma a , b Basta per esempio prendere a e b due vettori diversi ed entrambi ortogonali a x: per esempio x = (1, 0), a = (0, 1) e b = (0, −1). 14 Deve essere ( xa · b + yb · b = 0
xa · c + yb · c = 0,
( cioè
x + 2y = 0 0 = 0,
dato che c è ortogonale sia ad a che a b. Basta prendere (x, y) = (2, −1). √ √ 2 2 15 √(a) ka √ + bk√ = √ + bk = 21 + (2 + 2 2) 3; (b) √ ka 7 − 2 2 + 2 3; (c) ka + b − ck2 = 22 + (2 + 2 2) 3 − 2 2. 16 Il vettore (x, y) è ortogonale a (1, 2) se e solo se " # " # x 1 =0 ⇐⇒ x + 2y = 0. · y 2
Ma i punti di R2 le cui coordinate soddisfano questa equazione sono proprio una retta (che passa per l’origine). 17 Si deve avere x = xb = (3x, 4x) per un certo x ∈ R; gli altri vincoli da soddisfare sono quindi a = xb + y e, dato che y deve essere ortogonale a x, y · b = 0. Occorre quindi risolvere il sistema 3y + 4z = 0 ( y·b =0 3x + y = 1 ⇐⇒ xb + y = a 4x + z = 2, ponendo y = (y, z). Il risultato è x = 11/25, y = −8/25, e z = 6/25. I due vettori sono quindi " # " # −8 33 . , 25y = 25x = 6 44
18 ka + bk2 − ka − bk2 + (a + b) · (a + b) − (a − b) · (a − b) = a · a + 2a · b + b · b − a · a + 2a · b − b · b = 4a · b. Quindi a · b se e solo se ka + bk2 = ka − bk2 , e questo è vero se e solo se ka + bk = ka − bk. Proseguiamo nello stesso modo: ka + bk2 + ka − bk2 = (a + b) · (a + b) + (a − b) · (a − b) = a · a + 2a · b + b · b + a · a − 2a · b + b · b
= 2kak2 + 2kbk2 .
Cosa sono a + b e a − b? Le diagonali del parallelogramma con vertici O, O + a, O + b e O + a + b. Possiamo quindi dedurre che la somma dei quadrati delle lunghezze delle diagonali è uguale alla somma dei quadrati delle lunghezze dei lati del parallelogramma. #» #» # » # » 19 Siano a = AB, b = BC, c = CD e d = DA. Risulta quindi a + b + c + d = 0. #» #» I vettori delle diagonali sono AC = a + b e BD = b + c. La somma dei quadrati dei lati AB, BC, CD, DA meno la somma dei quadrati delle diagonali AC, BD è uguale a (per comodità scriviamo a2 = a · a invece di kak2 ) a2 + b2 + c2 + d2 − (a + b)2 − (b + c)2 = d2 − 2a · b − b2 − 2b · c
= (a + b + c)2 − 2a · b − b2 − 2b · c = a2 + b2 + c2 + 2a · b+
+ 2a · c + 2b · c − 2a · b − b2 − 2b · c
= a2 + c2 + 2a · c = (a + c)2 .
#» #» I punti medi delle diagonali sono A + AC/2, B + BD/2, e quindi il segmento che ha per estremi i punti medi delle diagonali si rappresenta con il vettore 1# » 1# » B + BD − A − AC, 2 2 cioè 1 1 (B − A) + (b + c) − (a + b) 2 2 1 1 = a + (b + c − a − b) = (a + c) 2 2 La norma al quadrato di questo vettore è 1 1 k (a + c)k2 = (a + c)2 , 2 4 e quattro volte questa lunghezza al quadrato dà l’espressione trovata poco sopra. 20 Il prodotto scalare a · b = −4, quindi −4 a·b b= b = −b. projb a = kbk2 4
Soluzioni degli esercizi – Capitolo III
Verifichiamo che a − projb a è ortogonale a b:
589
e quindi
b · (a − (−b)) = b · a + b2 = −4 + 4 = 0.
21 Se v e e sono vettori unitari e γ è l’angolo tra v e e, allora v · e = kvkkek cos γ = cos γ.
Se si prendono e = i, j, k, si deduce che v · i = 1/2v · j = 1/3v · k = 1/4.
lim cos γn ≤ lim
n→∞
da cui possiamo dedurre che l’unico vettore unitario con questi coseni direttori dovrebbe essere 1/2 v = 1/3 , 1/4 che però non è unitario, dato che la sua norma al quadrato è 61/144! E quindi . . . 22 Per l’angolo α in A, sappiamo che (B − A) · (C − A) , cos α = kB − AkkC − Ak che risulta essere r 35 35 cos α = √ √ = 41 41 35 √ Analogamente cos β = 6/41, cos γ = 0. Si tratta di un triangolo rettangolo in C. a·b a·c = , allora (a · b)kck = kakkbk kakkck (a · c)kbk. Segue che 23 Se risulta
(kbkc − kckb) · a = (a · c)kbk − (a · b)kck = 0.
1 + log n = 0. √ n
Ma dato cos γn ≥ 0 per ogni n, si ha che il limite di cos γn è 0. Possibile stabilire qualcosa sul limite di γn ? 25 (Ma la definizione di rombo comprende o no il fatto di essere parallelogramma?) Se A, B, C e D sono i vertici #» #» # » # » del rombo e a = AB, b = BC, c = CD e d = DA, allora risulta che a+b+c+d= 0
Ma se v = xi + yj + zk, risulterà quindi v · i = xv · j = yv · k = z,
n→∞
2
e a = b2 = c2 = d2 . Qui per far prima scriviamo a2 invece di kak2 . Le diagonali AC e BD sono perpendicolari se e solo se #» #» AC · BD = 0. #» #» Ma AC = a + b e BD = b + c, e se per il momento supponiamo vero che ogni rombo sia un parallelogramma, si ha c = −a, e quindi #» #» AC · BD = (a + b) · (b − a) = b2 − a2 = 0.
Vediamo perché se i lati hanno tutti le lunghezze uguali devono essere paralleli a due a due (quelli opposti), cioè perché un rombo è anche parallelogramma. Mostriamo un fatto più generale: se i lati opposti di un quadrilatero sono uguali a due a due, allora sono anche paralleli. Come prima, se A, B, C e D sono i vertici del quadrilatero e #» #» # » # » a = AB, b = BC, c = CD e d = DA, allora risulta che a + b + c + d = 0. Supponiamo quindi che a2 = c2 e b2 = d2 . Osserviamo che se a + b e b + c sono le due diagonali del quadrilatero, e supponiamo (ragionevolmente) che sono linearmente indipendenti. Allora a2 = c2 e b2 = d2 = a2 + b2 + c2 + 2a · b + 2a · c + 2b · c
=⇒ 0 = a2 + c2 + 2a · b + 2a · c + 2b · c.
Se si pone a2 = c2 , si ha 24 Usando la definizione otteniamo Pn 1/k an · bn = √k=1 cos γn = . kan kkbn k nkbn k P Essendo kbn k2 = nk=1 1/k2 ≥ 1 per ogni n (dal momento che è una serie a termini positivi) si ha Pn 1 k=1 lim cos γn ≤ lim √ k . n→∞ n→∞ n Ora, ricordiamo dal primo volume che Z n n X dx 1 ≤1+ = 1 + log n, k x 1 k=1
0 = a2 + a · b + a · c + b · c = a · (a + b) + c · (a + b) = (a + c) · (a + b).
Se si pone invece c2 = a2 si ottiene 0 = c2 + a · b + a · c + b · c = c · (c + b) + a · (c + b) = (a + c) · (c + b).
Ma a + c non può essere ortogonale ad entrambi i vettori linearmente indipendenti a + b e b + c, e quindi a + c = 0. Analogamente, b + d = 0. Segue che ABCD è un parallelogramma. Ma come possiamo supporre che le diagonali sono linearmente indipendenti? Occorre supporre che ABCD siano i vertici, percorsi nell’ordine indicato, di
590
Soluzioni degli esercizi – Capitolo III
un quadrilatero convesso e non allineati. Ma questo è un esercizio che lasciamo al Lettore molto volonteroso. 26 Abbiamo che kak2 = cos2 α + sin2 α = 1, e parimenti kbk2 = 1. L’angolo (orientato) tra (1, 0) e a è α, l’angolo (orientato) tra (1, 0) e b è β, quindi l’angolo tra a e b è β − α. Quindi a·b =a·b kakkbk = cos α cos β + sin α sin β.
cos(α − β) = cos(β − α) =
27 Osserviamo che queste proprietà possono essere scritte come proprietà della norma kxk, (e possono essere derivate da quelle del prodotto scalare) nel modo seguente: ① d(x, y) = kx − yk = k−(x − y)k = d(y, x). ② d(x, y) = 0 = kx − yk ⇐⇒ x = y ⇐⇒ x − y = 0. ③ d(x, z) = kx−zk ≤ kx− yk+ky−zk = d(x, y)+d(y+z).
Ora se valgono le seguenti proprietà della norma, allora seguono quelle della distanza. ① kxk = k−xk. ② kxk = 0 ⇐⇒ x = 0. ③ kx + yk ≤ kxk + kyk.
Ma la prima e la seconda sono immediate, mentre la terza (la disuguaglianza triangolare) è stata dimostrata nella Proposizione (III.19) a pagina 111. 28 (La soluzione è molto semplice, quindi la si scrive in inglese sennò risulta troppo facile per il Lettore) Suppose that a, b and c are dependent, that is, that there is (x, y, z) , (0, 0, 0) such that (*)
xa + yb + zc = 0.
By multiplying by c we can deduce that xc · a + yc · b + zkck2 = 0,
and hence, since c · a = c · b = 0, that zkck2 = 0. But c , 0, and therefore kck > 0 and z = 0. But then (*) can be read as xa + yb = 0, which implies that (x, y) = (0, 0), since a and b are linearly independent. We can finally conclude that x = y = z = 0 as claimed. 29 L’equazione della retta parametrica per A e B è P = A + t(B − A),
e quindi ponendo A = (1, 1) e B = (2, −2) si ottiene " # " # " # −1 1 x , +t = 3 1 y o anche (
x = 1−t
y = 1 + 3t.
Se eliminiamo t ponendo t = 1 − x (la prima) nella seconda otteniamo y = 1 + 3(1 − x) ovvero y + 3x = 4. 30 L’equazione del piano per tre punti A, B e C è P = A + s(B − A) + t(C − A),
e quindi ponendo A = (1, 1, 0), B = (1, 0, 1) e C = (0, 0, 1) si ha x 1 −1 0 y 1 −1 P = = + s + t −1 , z 1 1 0 ovvero x= 1−t y= 1−s−t z = s + t. Eliminiamo t, ponendo con la prima t = 1 − x: ( y = 1 − s − (1 − x) = −s + x z = s + (1 − x) = s + 1 − x.
Eliminiamo s, ponendo con la prima s = x − y: z = (x − y) + 1 − x = 1 − y.
Quindi l’equazione cercata è z + y = 1. 31 Le due rette si intersecano se e solo se esistono due valori dei parametri s e t tali che 1 1 0 1 0 + t k = 1 + s 1 , k 0 1 0 cioè
1+t=s kt = 1 + s t = ks.
Eliminiamo s con la prima: ( (k − 1)t = 2 (k − 1)t = −k.
C’è una soluzione se e soltanto se k = −2. 32 La retta per A ortogonale al piano ha equazione parametrica 1 1 x 0 y = A + tn = + t 1 , 1 −1 z
dato che n = (1, 1, 1) è un vettore ortogonale a p. Il punto di intersezione della retta con il piano è quello corrispondente al valore t tale che (1 + t) + (t) + (−1 + t) = 1
⇐⇒
3t = 1,
Soluzioni degli esercizi – Capitolo III
cioè è il punto B di coordinate x 1 1 1 4/3 y = 0 + 1 = 1/3 . 3 −2/3 1 −1 z La sua distanza da A al quadrato è 1 kB − Ak2 = ktnk2 = 3t2 = . 3
33 La distanza tra le due rette 1 x 0 1 x 1 y = 0 + t k e y = 1 + s 1 k 0 z 1 0 z è realizzata per quei due punti P (sulla prima retta) e Q (sulla seconda retta) tali che P − Q è ortogonale ai due vettori direzione (1, k, 1)
e
(1, 1, k).
Si devono trovare due valori s e t tali che 1 1 1 0 1 + s 1 − 0 − t k 1 0 k 0 è ortogonale a (1, k, 1) e a (1, 1, k), cioè −1 + s − t 1 −1 + s − t 1 1 + s − kt 1 1 + s − kt k · . · = 0 = k ks − t 1 ks − t Le equazioni sono quindi ( −1 + s − t + k(1 + s − kt) + ks − t = 0
−1 + s − t + 1 + s − kt + k(ks − t) = 0,
che diventa 2 s(1 + 2k) − t(2 + k ) = 1 − k s(2 + k2 ) − t(1 + 2k) = 0.
Con la seconda eliminiamo s, tenendo conto del fatto che 2 + k2 > 0 per ogni k: (1 + 2k)2 t − (2 + k2 )t = 1 − k. 2 + k2 Risolvendo rispetto a t, quindi sostituendo nell’equazione precedente otteniamo 1 + 2k 2 + k2 s= 3 . k3 + k2 + k − 3 k + k2 + k − 3 I punti corrispondenti sono 1 0 1 1 2 + k2 1 + 2k 0 1 k 1 P = + 3 + , Q = . . . k + k2 + k − 3 k3 + k2 + k − 3 0 0 1 k t=
Con qualche conto in più arriviamo a calcolare la norma
591
al quadrato: (k + 2)2 k2 + 4k + 4 = . k2 + 2k + 3 k2 + 2k + 3 Risulta uguale a zero solo se k = −2 (ma lo sappiamo dall’Esercizio 31 , dato che si intersecano per tale valore), e questo naturalmente è il valore minimo. kP − Qk2 =
34 Se i tre vettori 0 2 3 2 , 1 , −1 7 3 1 sono linearmente indipendenti, allora per il Teorema (III.29) si tratta di tutto R3 . Osserviamo che 3 2 0 det 2 , 1 , −1 = . . . = 0, 7 1 3 e quindi non sono linearmente indipendenti. Cerchiamo di capire se è possibile scrivere il terzo come combinazione lineare dei primi due, cioè di determinare x e y tali che 2 3 0 −1 = x 2 + y 1 . 3 1 7 Il sistema corrispondente è 3x + 2y = 0 2x + y = −1 x + 3y = 7. Eliminiamo y con la seconda (*)
y = −1 − 2x, ( 3x − 2(1 + 2x) = 0 ⇐⇒ x = −2
x − 3(1 + 2x) = 7 ⇐⇒ 5x = −10. Entrambe le equazioni hanno soluzione x = −2, da cui ricaviamo con la (*) y = −1 − 2x = −1 − 2(−2) = 3.
Allora possiamo riscrivere le equazioni parametriche con 2 3 2 3 x 1 2 1 2 y 2 = + t1 + t2 + t3 −2 + 3 1 , 3 1 3 1 3 z o equivalentemente x 1 3 2 y = 2 + (t1 − 2t3 ) 2 + (t2 + 3t3 ) 1 . z 3 1 3 Allora in realtà i parametri t1 , t2 e t3 non sono liberi, perché possono sì assumere tutti i valori in modo arbitrario,
592
Soluzioni degli esercizi – Capitolo III
ma non ci sarà una corrispondenza biunivoca con i punti: se poniamo s = t1 − 2t3 e t = t2 + 3t3 , tutte le terne t1 , t2 e t3 cui corrisponde una coppia (s, t) fissata producono lo stesso punto di R3 . Dato che (3, 2, 1) e (2, 1, 3) sono due vettori linearmente indipendenti, l’insieme di punti cercato è un piano. 35√ (a) Si√ha (i+ j)×k = i− j, e quindi il vettore cercato è 2/2i − 2/2j. (b) Si ha (i + j + k) × k = (i + j) × k, e quindi √ per il√punto precedente il vettore cercato è ancora 2/2i − 2/2j. (c) Il prodotto vettoriale (esterno) è (i − k) × (j√+ k) = i − j + k. Il vettore unitario cercato è quindi 3/3(i − j + k). (d) Il prodotto vettoriale è (i + 2j + 3k) √ × (j + 2k + 3i) = i + 7j − 5k. Il vettore unitario è quindi 3/15(i + 7j − 5k). 36 Se xa + yb + zc = 0 e a, b e c sono ortogonali, allora moltiplicando per a, b e c l’equazione si ottiene xkak2 = ykbk2 = zkck2 = 0, e quindi x = y = z = 0. Però chi è venuto a controllare questa soluzione forse non ricorda che questo esercizio era già stato svolto a pagina 156! 37 Per l’identità di Lagrange (si veda la Proposizione (III.31)) ka × bk2 = kak2 kbk2 − (a · b)2 . Se a e b sono ortogonali, allora ka × bk2 = kak2 kbk2 , ed estraendo le radici quadrate, la tesi. 38 Per le proprietà dimostrate nella Proposizione (III.31) e l’esercizio precedente si vede che a × b è ortogonale a a e a b ed è unitario. Quindi, per il Teorema (III.29), ogni vettore di R3 si scrive in modo unico come xa + yb + za × b,
dato che a, b e a × b sono ortogonali (Esercizio (III.20) a pagina 156). In particolare, esistono certamente x, y e z tali che (a × b) × a = xa + yb + za × b.
Dato che (a × b) × a è ortogonale sia a a che a a × b, deve essere x = 0 e z = 0. Visto che è unitario, y = ±1. Ora, se a, b e a × b sono una terna destrorsa, lo è anche a × b, a, b, che si ottiene ruotando (permutazione ciclica) i tre vettori lungo l’asse a + b + a × b, e quindi (a × b) × a = b. Da questa identità deduciamo la seconda, dato che (a × b) × b = −(b × a) × b = −a. 39 Poniamo v = x − y. Allora
a × v = a × x − a × y = 0,
a · v = a · x − a · y = 0.
Ma dalla prima deduciamo che v e a sono linearmente dipendenti (si veda il Corollario (III.32)), cioè v = ca per un certo c ∈ R. Sostituendo nella seconda a · ca = 0 =⇒
ckak2 = 0, e quindi c = 0 dato che a , 0. Segue che v = 0, e dunque x = y. 40 I tre punti sono allineati se P sta sulla retta per A e B, cioè se esiste t tale che P = A + t(B − A), il che succede #» #» se e solo se P − A = t(B − A), cioè se e solo se AP e AB sono paralleli (linearmente dipendenti). Ma per il Corol#» #» lario (III.32) questo succede se e soltanto se AP× AB = 0. √ 3 (1, −1, 1). (b) Per la formula (38) di pagi41 (a) 3 √ √ na 138 la distanza è 4/ 3 = 4 3/3. (c) Sono le tre rette di equazioni x − y + z + 4 = 0, x = 0, x − y + z + 4 = y = 0, e x − y + z + 4 = z = 0. (d) I punti sono le soluzioni dei sistemi x − y + z + 4 = x = y = 0, x − y + z + 4 = y = z = 0, x − y + z + 4 = z = x = 0, e dunque A = (0, 0, −4), B = (−4, 0, 0) e C = (0, 4, 0). Si ha kB − Ak2 = kB − Ck2 = kC − Ak2 = 32, e quindi è un equilatero. La sua √ triangolo √ area sarà quindi uguale a 3 32/4 = 8 3. #» #» 42 Se n è parallelo al vettore AB × AC, allora il piano ha equazione cartesiana Ora,
n · (P − A) = 0. i #» #» AB × AC = det 2 −2
j 2 2
k 3 = . . . = −8i − 4j + 8k, −1
e quindi si può prendere n = (2, 1, −2), e l’equazione diventa 2(x − 1) + (y − 1) − 2(z + 1) = 0 ⇒ 2x + y − 2z = 5.
La sua distanza dall’origine, per la formula (38) di pagina √ 138 è 5/ 9 = 5/3. 43 Si consideri il parallelepipedo con vertici A, B, C e P: il suo volume è #» #» #» |det(AP, AB, AC)| #» D’altro canto il volume è uguale all’area della base kAB × #» ACk per l’altezza h, e l’altezza è proprio la distanza tra P e il piano, dunque #» #» #» #» #» |det(AP, AB, AC)| = hkAB × ACk, da cui la tesi.
44 Dobbiamo mostrare che se V(a, a, c) V(a, b, b) = V(a, b, a) allora
=
0
=
V(a, b, c) = −V(b, a, c) = V(b, c, a) = −V(c, b, a) = V(c, a, b) = −V(a, c, b),
e viceversa. Come abbiamo visto nell’equazione (16) a pagina 114, prese due delle tre variabili della funzione V, si ha che (fissato c arbitrario) V(a, a, c) = 0 per ogni
Soluzioni degli esercizi – Capitolo III
a se e soltanto se V(a, b, c) = −V(b, a, c) per ogni a e b. Quindi V(a, a, c) = 0 = V(a, b, b) = V(a, b, a) se e soltanto se ogni volta che si scambiano due variabili il valore di V cambia di segno. Non è difficile vedere che tutti i modi possibili di permutare le variabili a, b e c scambiandone due alla volta sono quelle indicate nell’elenco.
593
“determinante”): j i a × b = a1 a2 b1 b2 c c × d = i 2 d2
k a a3 a1 a3 a a2 − j + k 1 a3 = i 2 b2 b3 b1 b3 b1 b2 b3 c c2 c c3 c3 + k 1 − j 1 d1 d2 d1 d3 d3 a3 c2 c3 a1 a3 c1 c3 a + (a × b) · (c × d) = 2 b2 b3 d2 d3 b1 b3 d1 d3 X a2 c1 c2 a = (ai b j − a j bi )(ci d j − c j di ) + 1 b1 b2 d1 d2 1≤i<j≤3 X (ai b j ci d j − ai b j c j di − a j bi ci d j + a j bi c j di ) =
45 Mostriamo che i × (b × c) = c1 b − b1 c. Se e è uno dei vettori i, j, k, allora [i × (b × c)] · e = (e × i) · (b × c),
e quindi le componenti di i × (b × c) sono 0, − det(k, b, c), det(j, b, c) , ossia (0, b2 c1 − b1 c2 , c1 b3 − b1 c3 ), che può essere scritto come b1 c1 b c1 2 − b1 c2 . b3 c3 Allo stesso modo si mostra che j × (b × c) = c2 b − b2 c e k × (b × c) = c3 b − b3 c. Quindi e × (b × c) = (e · c)b − (e · b)c,
non appena e è i, j oppure k. Ora, se a = a1 i + a2 j + a3 k, abbiamo a × (b × c) = a1 i × (b × c) + a2 j × (b × c) + a3 k × (b × c) = a1 (i · c)b − a1 (i · b)c + a2 (j · c)b − a2 (j · b)c+
+ a3 (k · c)b − a3 (k · b)c = (a · c)b − (a · b)c.
1≤i<j≤3
X
= 1≤i,j≤3
ai b j ci d j −
X
ai b j c j di .
1≤i,j≤3
D’altro canto (b · d)(a · c) − (b · c)(a · d) 3 3 3 3 X X X X = b j d j ai ci − b j c j ai di j=1 i=1 j=1 i=1 X X = ai b j ci d j − ai b j c j di . X
1≤i,j≤3
i≤i,j≤3
X
ai b j ci d j +
=
1≤i=j≤3
1≤i,j≤3
|
ai b j ci d j −
{z
}
X ai b j c j di i≤i,j≤3
P3
46 Per l’Esercizio 45 , per ogni x, c e d si ha x × (c × d) = (x · d)c − (x · c)d.
Sostituendo x = a × b si ha l’identità (a) . Per mostrare la (b) , osserviamo che (applicando l’Esercizio 45 alle tre permutazioni cicliche) a × (b × c) = (a · c)b − (a · b)c
b × (c × a) = (b · a)c − (b · c)a
c × (a × b) = (c · b)a − (c · a)b.
Sommando queste tre equazioni si ottiene la (b) . La (c) segue immediatamente, dato che a × (b × c) = (a × b) × c se e solo se a × (b × c) + c × (a × b) = 0, ma per la ② questa è uguale a −b × (c × a). 47 Occorre vincere la sensazione di tedio e fastidio, porre a = (a1 , a2 , a3 ), b = (b1 , b2 , b3 ), c = (c1 , c2 , c3 ), d = (d1 , d2 , d3 ), e svolgere tutti i calcoli (per semplificare la notazione, invece di scrivere det(a, b, c), formeremo una matrice con i coefficienti dei vettori a, b, c racchiusa tra due barre verticali — che significa appunto
−
abcd i=1 i i i i
X
X
ai b j c j di = i≤i=j≤3
|
{z
}
1≤i,j≤3
ai b j ci d j −
X
ai b j c j di .
i≤i,j≤3
P3
abcd i=1 i i i i
Dato che le due espressioni coincidono, l’identità è dimostrata. L’identità di Lagrange della Proposizione (III.31) si ottiene semplicemente ponendo c = a e d = b: (a × b) · (a × b) = (b · b)(a · a) − (b · a)(a · b). 48 Si veda l’Esercizio (III.21) a pagina 157. All work and no play makes Jack a dull boy. #» 49 Siano A, B e C i vertici del triangolo, e a = CB, #» #» b = CA, c = AB = a − b. Allora 4S2 = ka × bk2 = kak2 kbk2 − (a · b)2 . Ma ka − bk2 = (a − b) · (a − b) = kak2 + kbk2 − 2a · b, 1 e quindi −a · b = (c2 − a2 − b2 ), da cui 2 1 1 (2ab)2 − (c2 − a2 − b2 )2 4S2 = a2 b2 − (c2 − a2 − b2 )2 = 4 4 1 2 2 2 = (2ab − c + a + b )(2ab + c2 − a2 − b2 ). 4
594
Soluzioni degli esercizi – Capitolo III
Ma 2ab − c2 + a2 + b2 = (a + b)2 − c2 = (a + b − c)(a + b + c), mentre 2ab + c2 − a2 − b2 = c2 − (a − b)2 = (c − a + b)(c + a − b). Ora a + b + c = 2s, a + b − c = 2s − 2c, −a + b + c = 2s − 2a e a − b + c = 2s − 2b, da cui segue che 1 4S2 = 2(s − c)2s2(s − a)2(s − b) = 4s(s − a)(s − b)(s − c), 4 e immediatamente la tesi. 50 Siano A e B due punti distinti su l. Allora esiste un unico piano per A, B e P. Dato che contiene A e B, contiene anche la retta per A e B, per l’esercizio(III.7). Se un altro piano contenesse P e l, dovrebbe contenere A, B e P, dunque non ci sono altri piani con questa proprietà. (Si osservi che se P ∈ l, di piani ce ne sono infiniti!)
51 Supponiamo che A, B e C siano allineati. Se A = B, allora basta porre (a, b, c) = (1, −1, 0) per ottenere l’uguaglianza aA + bB + cC = 0. Altrimenti, se A , B, C sta sulla retta per A e B, e quindi esiste t tale che C = A + t(B − A). Ma allora (1 − t)A + tB − C = 0,
e l’identità aA + bB + cC vale per (a, b, c) = (1 − t, t, −1). Viceversa, se aA + bB + cC = 0, e (a, b, c) , (0, 0, 0), almeno uno dei tre coefficienti a, b, c è diverso da zero. Senza perdere in generalità possiamo supporre che sia c , 0. Dividendo per c otteniamo C = a′ A + b′ B con a′ = −a/c, b′ = −b/c. Ora, se a + b + c = 0, a′ + b′ = 1,
e quindi ponendo t = b′ C = tB + (1 − t)A = A + t(B − A),
cioè A, B e C sono allineati.
52 La dimostrazione è come quella dell’Esercizio 43 , # » #» #» tenuto conto che det(PA, PB, PC) è uguale (in modulo) all’area di ABC per la distanza dal piano, e # » #» # » det(QA, QB, QC) è uguale (in modulo) all’area di ABC per 1. Ora, se P e Q stanno dalla stessa parte del piano, i determinanti hanno lo stesso segno e quindi la distanza è proprio il quoziente. Altrimenti, hanno segni diversi e la distanza è l’opposto del quoziente. 53 Se a = 0 o b = 0, allora l’identità è vera. Supponiamo quindi che né a né b siano zero: se sono paralleli allora esiste c ∈ R tale che bi = cai per ogni i (osserviamo che si ha c , 0 altrimenti b = 0). Comunque per ogni i, j ai b j = ai ca j = cai a j = bi a j . Viceversa, supponiamo che per ogni i, j ai b j = a j bi . Se tutti gli ai sono nulli, allora non c’è niente da dimostrare. Altrimenti, supponiamo che per un certo indice ¯i, a¯i , 0.
Dividendo per a¯i otteniamo per ogni j b¯i aj, a¯i e quindi basta porre c = b¯i /a¯i . a¯i b j = a j b¯i =⇒ b j =
54 Per l’Esercizio 51 , i tre punti sono allineati se esistono tre coefficienti (a, b, c) non tutti nulli tali che aA+bB+cC = 0 e a+b+c = 0, cioè se esiste una soluzione (a, b, c) , (0, 0, 0) del sistema " # " # " # " # a1 b1 c 0 a +b +c 1 = 0 a2 b2 c2 a + b + c = 0, che può essere scritto anche come a1 b1 c1 0 a b a 2 + b 2 + c c2 = 0 , 1 1 0 1 oppure aa1 + bb1 + cc1 = 0 aa2 + bb2 + cc2 = 0 a+b+c =0 Ma per il Teorema (III.29), quest’ultimo sistema ha soluzioni non nulle (cioè i tre vettori sono linearmente dipendenti) se e solo se a1 b1 c1 a det 2 b2 c2 = 0. 1 1 1 Ora, per la linearità del determinante rispetto alle colonne si ha sempre a1 b1 − a1 c1 − a1 a1 b1 c1 det a2 b2 c2 = det a2 b2 − a2 c2 − a2 , 1 0 0 1 1 1 che è uguale a " b − a1 det 1 b2 − a2
c1 − a1 c2 − a2
#! ,
che sappiamo essere l’area del parallelogramma generato dai vettori B − A e B − C, cioè il doppio dell’area del triangolo.
55 Se (x1 , x2 ) e (y1 , y2 ) fossero dipendenti, esisterebbero c1 e c2 non entrambi nulli tali che ( " # " # " # c1 x1 + c2 y1 = 0 x1 y1 0 c1 ovvero + c2 = x2 0 y2 c1 x2 + c2 y2 = 0.
Soluzioni degli esercizi – Capitolo III
Ma allora c1 x + c2 y = c1 (x1 e1 + x2 e2 ) + c2 (y1 e1 + y2 e2 ) = (c1 x1 + c2 y1 )e1 + (c1 x2 + c2 y2 )e2 = 0e1 + 0e2 , e dunque x e y sarebbero linearmente dipendenti. Se analizziamo bene la dimostrazione, ci rendiamo conto che possiamo anche andare a ritroso, sui nostri stessi passi: se x e y sono linearmente dipendenti, allora lo sono anche (x1 , x2 ) e (y1 , y2 ). 56 Se a, b e c non fossero linearmente indipendenti, allora esisterebbe (x0 , y0 , z0 ) , (0, 0, 0) tale che ax0 + by0 + cz0 = 0. Quindi l’equazione ax + by + cz = 0 (cioè l’equazione che risulta per d = 0 ∈ R3 ) ha almeno due soluzioni distinte, e non una sola soluzione. 57 Siano tA , tB e tC i tre parametri tali che #» #» #» PAB = A + tA ABPBC = B + tB BCPCA = C + tC CA. Allora APAB
tB CPCA tC tA BPBC = = . 1 − t 1 − t 1 − tC A B PAB B PBC C PCA A I tre punti PAB , PBC e PCA sono allineati se e soltanto se l’area del triangolo formato da essi è zero, cioè se e soltanto se 0 = det(PAB − PBC , PCA − PBC ) =
= det (A + tA (B − A) − (B + tB (C − B)), C + tC (A − C) − (B + tB (C − B)))
= det ((1 − tA )(A − B) + tB (B − C),
(1 − tB − tC )(C − B) + tC (A − B)))
= (1 − tA )(1 − tB − tC ) det (A − B, C − B) + tB tC det (B − C, A − B)
= [(1 − tA )(1 − tB − tC ) + tB tC ] det (B − C, A − B) ⇐⇒
1 − tA − tB − tC + tA tB + tA tC + tB tC = 0.
D’altro canto tA tB tC = −1 1 − tA 1 − tB 1 − tC se e soltanto se 0 = (1 − tA )(1 − tB )(1 − tC ) + tA tB tC
= 1 − tA − tB − tC + tA tB + tA tC + tB tC ,
e quindi la tesi.
58 Siano A, B e C dati, e PAB , PBC e PCA sui lati corrispondenti ai nomi. Si consideri il triangolo A′ , B′ e C′ con vertici A′ = A, B′ = B, C′ = PBC ; sui suoi lati si scelgano PA′ B′ = PAB , PB′ C′ = C e PC′ A′ = l’intersezione tra APBC e BPCA . I tre punti PA′ B′ , PB′ C′ e PC′ A′ sono allineati se e
595
solo se A′ PA′ B′ B′ PB′ C′ C′ PC′ A′ PA′ B′ B′ PB′ C′ C′ PC′ A′ A′
= −1,
per il Teorema di Menelao (Esercizio 57 ). Ma sono allineati se e solo se PC′ A′ sta sul segmento PB′ C′ PA′ B′ = CPAB . Ma per costruzione PC′ A′ è intersezione di APBC e BPCA , quindi sono allineati se e soltanto se le tre rette in questione si incontrano in un punto. Ora, siano tA′ , tB′ e tC′ i coefficienti, come nell’Esercizio 57 , per cui tB′ tC′ t A′ = −1. 1 − tA′ 1 − tB′ 1 − tC′ Ora, tA′ = tA , e 1 PBC = B + tB (C − B) =⇒ C = B + (PBC − B), tB e dunque t′B = 1/tB . Per quanto riguarda la relazione tra t′C e tC , non è così immediata. Con un po’ di calcoli (non troppo difficili) si trova che ′ 1 − tC tC . tB = tC 1 − t′C Ne possiamo dedurre che t A′ tB′ tC′ tA 1/tB tC′ −1 = = 1 − tA′ 1 − tB′ 1 − tC′ 1 − tA 1 − 1/tB 1 − tC′ tA 1 tB tC′ = 1 − tA tB − 1 tB 1 − tC′ tB tC 1 − tC′ tC′ tA =− 1 − tA 1 − tB 1 − tC tC′ 1 − tC′ tA tB tC =− . 1 − tA 1 − tB 1 − tC
59 Se n = 1, non ci possono essere due vettori linearmente indipendenti. Se n = 2, per (III.23) ogni v si può scrivere come v = xa + yb, e quindi non può essere linearmente indipendente da a e b. Quindi necessariamente deve essere n ≥ 3. Abbiamo mostrato la parte “solo se”. Ora cerchiamo di dimostrare la parte “se”. Supponiamo quindi che n ≥ 3. Dobbiamo trovare un vettore v = (v1 , v2 , . . . , vn ) ortogonale a a e a b, cioè risolvere il sistema di equazioni ( a1 v1 + a2 v2 + . . . + an vn = 0 b1 v1 + b2 v2 + . . . + bn vn = 0. Si tratta di un sistema di due equazioni nelle n incognite v1 , . . . , vn . Almeno uno dei coefficienti bi deve essere diverso da zero: dividendo per questo coefficiente e scambiando le variabili possiamo quindi supporre che il
596
Soluzioni degli esercizi – Capitolo III
sistema sia ( a1 v1 + a2 v2 + . . . + an vn = 0 v1 + b2 v2 + . . . + bn vn = 0. Sostituendo nella prima si ottiene una equazione (omogenea) nelle restanti variabili, −a1 (b2 v2 + . . . + bn vn ) + a2 v2 + . . . + an vn = 0
(a2 − a1 b2 )v2 + . . . (an − a1 bn )vn = 0.
che avrà certamente soluzioni se n ≥ 3.
# » #» # » 60 Abbiamo A′ = Q+cQA, B′ = Q+cQB, C′ = Q+cQC, # » ′ e D = Q + cQD. Quindi # » A′ B′ = B′ − A′ = c(B − A) # » A′ C′ = C′ − A′ = c(C − A) # » A′ D′ = D′ − A′ = c(D − A). # » Quindi il volume del parallelepipedo P con spigoli A′ B′ , # ′ »′ # ′ »′ A C e A D è uguale a # » # » # » #» #» # » det(A′ B′ , A′ C′ , A′ D′ ) = det(cAB, cAC, cAD) #» #» # » = c3 det(AB, AC, AD), come volevasi dimostrare.
61 Per l’Esercizio (III.21) a pagina 157, questa formula vale per una piramide a base triangolare (tetraedro). Allora basta decomporre il poligono che costituisce la base come unione di triangoli, e si ha una decomposizione della piramide in tetraedri, tutti con la medesima altezza h, uguale all’altezza della piramide. Il volume cercato V è la somma dei volumi Vi dei tetraedri, cioè n n X X 1 h 1 V= Ai h = ( Ai ) = Ah, 3 3 3 i=1 i=1 dato che l’area A è la somma delle aree Ai dei triangoli in cui la base è decomposta.
62 Per la Proposizione (III.28) a1 a2 a3 a1 b1 c1 det b1 , b2 , b3 = det a2 , b2 , c2 , c1 c2 c3 a3 b3 c3 e per l’equazione (23) det(a, b, c) = a1 det " # " #! a c −b1 det 2 , 2 + c1 det a3 c3
" # " #! b2 c2 , − b3 c3 " # " #! a2 b2 , , a3 b3
e quindi se indichiamo con " # " #! b c α = det 2 , 2 , β b3 c3 " # " #! a b γ = det 2 , 2 , a3 b3
" # " #! a c = det 2 , 2 , a3 c3
si ha a1 α − b1 β + c1 γ = det(a, b, c) = 0.
D’altro canto, per (23)
" # " #! " # " #! b2 c2 a c , − b2 det 2 , 2 b3 c3 a3 c3 " # " #! a2 b2 c2 a2 b2 + c2 det , = det a2 , b2 , c2 a3 b3 a3 b3 c3 a2 a2 a3 = det b2 , b2 , b3 = 0, c2 c2 c3
a2 α − b2 β + c2 γ = a2 det
dato che l’ultimo è il determinante di tre vettori di cui i primi due coincidono. Analogamente, " # " #! " # " #! c b2 c2 a , − b3 det 2 , 2 a3 α − b3 β + c3 γ = a3 det a3 c3 b3 c3 " # " #! a3 b3 c3 a2 b2 + c3 det , = det a2 , b2 , c2 a3 b3 a3 b3 c3 a3 a2 a3 = det b3 , b2 , b3 = 0, c3 c2 c3 visto che il primo e il terzo vettore coincidono. Ma allora a1 α − b1 β + c1 γ = 0 a2 α − b2 β + c2 γ = 0 cioè αa − βb + γc = 0. a3 α − b3 β + c3 γ = 0
Quindi abbiamo mostrato che a, b e c sono linearmente dipendenti con i coefficienti α, β, γ, se (α, β, γ) , 0. Se, invece, α = β = γ = 0, dobbiamo procedere in altro modo. Dobbiamo provare a rifare il ragionamento con i vettori a2 b2 c2 a b ′ ′ ′ a = 3 , b = 3 , c = c3 a1 b1 c1 " # " #! b c ′ con i corrispondenti α = det 3 , 3 . . . Se b1 c1 ′ ′ ′ (α , β , γ ) , (0, 0, 0), allora abbiamo finito, dato che α′ a′ − β′ b′ + γ′ c′ = 0 ′
′
′
⇐⇒
α′ a − β′ b + γ′ c = 0.
Se invece (α , β , γ ) = (0, 0, 0), riproviamo a permutare le
Soluzioni degli esercizi – Capitolo III
597
variabili prendendo a3 b3 a ′′ ′′ a = 1 , b = b1 , a2 b2
c3 ′′ c = c1 c2 " # " #! b c con i corrispondenti α′′ = det 1 , 1 . . . Se nemmeb2 c2 no questa volta (α′′ , β′′ , γ′′ ) , (0, 0, 0), significa che, in particolare, per esempio γ = γ′ = γ′′ = 0, cioè " # " #! a b γ = det 2 , 2 = a2 b3 − a3 b2 = 0 a3 b3 " # " #! a b γ′ = det 3 , 3 = a3 b1 − a1 b3 = 0 a1 b1 " # " #! a b γ′′ = det 1 , 1 = a1 b2 − a2 b1 = 0. a2 b2 Ora, se a = b = 0, allora basta prendere (α, β, γ) = (1, 1, 0). Altrimenti, esiste almeno una coppia (a1 , b1 ), (a2 , b2 ) o (a3 , b3 ) diversa da (0, 0) (per esempio, (a3 , b3 )), per cui dall’uguaglianza a1 b1 a1 b3 − a3 b1 0 a b a b − a b 0 b3 2 − a3 2 = 2 3 3 2 = a3 b3 0 0 segue che (α, β, γ) = (b3 , −a3 , 0) è la soluzione cercata. 63 Il cubo inscritto è quello raffigurato in figura.
B r H 2 C
D
2π 2π #» , s = sin e r = kCBk, 5 5 si ha che 2rs = 2 e quindi r = 1/s. Ne segue che |CH| = rc = c/s e che l’area del pentagono è 5 5 A = r2 s = . 2 2s La lunghezza del lato del pentagono risulta √ 2√ 2π 1 − c. l = 2r sin = 10 s Consideriamo il triangolo OCH: è rettangolo in C (perché?) e quindi Se indichiamo con c = cos
|OC|2 + |CH|2 = |OH|2 = 2
che implica
p |OC| = 2 − |CH|2 =
C B D
Cominciamo a mettere un sistema di riferimento (ortogonale) con l’origine O nel centro del cubo e assi perpendicolari alle facce che passino per i centri delle facce. Prendiamo una unità di misura in modo tale che i vertici del cubo abbiano coordinate √ (±1, ±1, ±1). Il raggio della sfera circoscritta al cubo è 3, i centri delle facce hanno coordinate (±1, 0, 0), (0, ±1, 0), (0, 0, ±1), e lo spigolo ha lunghezza 2. Il punto medio (che chiamiamo H) del segmento con √ estremi B = (1, 1, 1) e D = (1, −1, 1) è (1, 0, 1) dista 2 dall’origine. Ora, consideriamo una faccia pentagonale del dodecaedro, come nella figura seguente.
A
r
c2 . s2 Il volume della piramide con il pentagono per base e vertice in O è r c2 1 1 5 2− 2. A|OC| = 3 3 2s s Dato che le piramidi sono 12, il volume di questo dodecaedro (che non è quello inscritto nella sfera √ di raggio 1, ma quello inscritto nella sfera di raggio 3) è r 10 c2 ′ V = 2− 2. s s Per l’omogeneità del volume rispetto alle dilatazioni, il volume cercato è legato a V′ dalla relazione r √ c2 ′ 3 −3/2 10 2− 2. V = ( 3) V =⇒ V = 3 s s Con un minimo impegno si può semplificare in √ √ 2 3 √ 5+5 . V = 3−3/2 2( 5 + 5) = 9 Per quanto riguarda l’icosaedro, come in figura si può costruire con i centri delle facce del dodecaedro un icosaedro inscritto in una sfera di raggio |OC|. 2−
598
Soluzioni degli esercizi – Capitolo IV
Capitolo IV 1 Raccogliendo si ottiene (2x + y − 1)i + (x + y + 1)j = 0 =⇒
(
2x + y = 1
che ha unica soluzione (x, y) = (2, −3).
Confrontandolo con il cubo inscritto nel dodecaedro, si vede che per ogni spigolo dell’icosaedro ce n’è uno parallelo, simmetrico rispetto all’origine, e che questi due spigoli paralleli formano un rettangolo. Sia l1 la lunghezza dello spigolo dell’icosaedro: allora (si osservi che i centri delle facce del dodecaedro che toccano una faccia fissata costituiscono un pentagono regolare) l’altro lato del rettangolo misura 2l1 4|OC|2 8 2 − 3c2 e l21 + l22 = 4|OC|2 =⇒ l21 = . l 1 + 4/l2 5 1 + c √ 3 2 l , mentre la L’area di ogni triangolo equilatero è 4 1 distanza da O del triangolo è q |OC|2 − l21 /3. l2 =
Il volume della somma delle 20 piramidi costruite corrispondenti ad ogni faccia è quindi √ q 20 3 2 l |OC|2 − l21 /3, 3 4 1 che dopo il duro lavoro di semplificazione può essere scritto come q √ 2 10 + 2 5. |OC|3 3 L’icosaedro inscritto nella sfera di raggio uno ha quindi volume q √ 2 10 + 2 5. 3 Strano a dirsi, il dodecaedro ha volume maggiore: √ q √ 2 2 3 √ 5 + 5 2.78 > 2.53 10 + 2 5. 9 3 Lo stesso vale per l’area dei due poliedri. Un buon esercizio (lasciato al volonteroso Lettore) è verificare che il rapporto tra le aree coincide con il rapporto tra i volumi dei due solidi.
x + y = −1,
2 Sono linearmente dipendenti se e solo se esiste una soluzione non nulla del sistema xa+yb+zc = 0. Si ottiene: 2x + y + 2z = 0 −3 x −x + 2y − 11z = 0 ⇐⇒ y = t 4 , 1 z x − y + 7z = 0
cioè −3a + 4b + c = 0 =⇒ c = 3a − 4b. Altro metodo (che però non consente di scriverne uno in funzione degli altri due) è mostrare che il determinante della matrice che ha per colonne i vettori a, b, c è nullo. 3 I due vettori (t, t2 ) = t(1, t) e (1, t) sono sempre paralleli. Se t = 0, si ha (0, 0) e (1, 0), che sono paralleli in senso lato.
4 I tre vettori a, b e c sono linearmente dipendenti se e solo se esiste (x, y, z) , (0, 0, 0) tale che xa + yb + zc = 0, mentre a, b+a, e c sono linearmente indipendenti se e soˆ y, ˆ zˆ) , (0, 0, 0) tale che xa+ ˆ ˆ lo se esiste (x, y(a+b)+ zˆ c = 0, ˆ + yb ˆ + zˆc = 0. Basta quindi porre xˆ + yˆ = x, cioè (xˆ + y)a yˆ = y, zˆ = z, e osservare che esistono (x, y, z) non nulli se ˆ y, ˆ zˆ). Cioè, se si somma a (uno dei e solo se esistono (x, tre vettori) ad un altro, la terna di vettori è indipendente se e solo se lo era la prima. Sommando quindi a a b si ottiene a, a + b, c. Sommando a + b al terzo, si ottiene a, a + b, a + b + c. Altro modo: det(a, a + b, a + b + c) = det(a, a, a + b + c) + det(a, b, a + b + c) = det(a, b, a) + det(a, b, b) + det(a, b, c) = det(a, b, c). Quindi i due determinanti coincidono. Per i tre vettori a + b, b + c, c + a, osserviamo che det(a + b, b + c, c + a) = det(a, b + c, c + a) + det(b, b + c, c + a) = det(a, c, c + a) + det(a, b, c + a) + det(b, c, c + a) = 0 + det(a, b, c) + det(b, c, a) = 2 det(a, b, c). Quindi sono linearmente indipendenti se e solo se lo sono a, b e c. 5 Basta mostrare che sono linearmente indipendenti, cioè che det(b1 , b2 , . . . , bn ) , 0. Ma sottraendo e1 dalle restanti colonne, e2 dalle colonne i = 3, . . . , n, e così via fino
Soluzioni degli esercizi – Capitolo IV
alla n-esima, si ha det(e1 , e1 + e2 , e1 + e2 + e3 , . . . , e1 + e2 + . . . + en ) = det(e1 , e2 , e2 + e3 , . . . , e2 + . . . + en ) = . . . = det(e1 , e2 , e3 , . . . , en ) = 1, e quindi sono linearmente indipendenti. Le coordinate di x = (x1 , x2 , . . . , xn ) in questa base sono y = (y1 , y2 , . . . , yn ), con y1 b1 + y2 b2 + . . . + yn bn = x1 e1 + x2 e2 + . . . + xn en , e quindi y1 = x1 − x2 x1 = y1 + y2 + . . . + yn y x = y + y + . . . + y 2 = x2 − x3 2 2 3 n ··· ··· =⇒ y = xn−1 − xn x = y + y n−1 n−1 n−1 n yn = xn . xn = yn , 6 Il determinante della matrice che ha come colonne i tre vettori vale −(1 + t3 ), sono quindi linearmente dipendenti se e solo se t = −1.
7 Per dimostrare (a) , se x ∈ Span(S1 ), allora x = c1 s1 + c2 s2 +. . .+cn sn con si ∈ S1 , e quindi x = c1 s1 +c2 s2 +. . .+cn sn con si ∈ S2 . Per dimostrare (b) , osserviamo che S1 ∩ S2 ⊆ S1 , e quindi per il punto precedente Span(S1 ∩ S2 ) ⊆ Span(S1 ). Analogamente, S1 ∩ S2 ⊆ S2 e quindi Span(S1 ∩ S2 ) ⊆ Span(S2 ), da cui Span(S1 ∩ S2 ) ⊆ Span(S1 ) ∩ Span(S2 ). Infine, per (c) , consideriamo lo spazio vettoriale R, e S1 = {1}, S2 = {2}. Allora S1 ∩ S2 = ∅, e quindi Span(S1 ∩ S2 ) = 0, mentre Span(S1 ) = Span(S2 ) = R, per cui Span(S1 ) ∩ Span(S2 ) = R.
8 (a) Se a , b, a , 0, b , 0, la dimensione è 3 (si veda la soluzione dell’Esercizio (IV.1) a pagina 211). Se a = 0 o b = 0, ovviamente la corrispondente funzione è uguale a 1, e se a = b, le due funzioni eax e ebx coincidono. (b) Supponiamo che esistano quattro coefficienti a, b, c, d tali che a sin x + b cos x + c sin2 x + d cos2 x = 0. Siccome sin2 x + cos2 x = 1, è equivalente che (*)
a sin x + b cos x + (c − d) sin2 x + d = 0.
Deriviamo rispetto a x:
a cos x − b sin x + 2(c − d) sin x cos x = 0
− a sin x − b cos x + 2(c − d)(2 cos2 x − 1) = 0
− a cos x + b sin x + 2(c − d)(−4 sin x cos x) = 0.
Sommiamo la prima e la terza: c − d = 0. Sommiamo la (*) alla seconda: d = 0. Rimane a sin x + b cos x = 0, che implica a = 0 (sostituendo x = π/2) e b = 0 (sostituendo x = 0). Quindi sono linearmente indipendenti e
599
la dimensione è 4. (c) Mostriamo che sono linearmente indipendenti, cioè che la dimensione è 4. Infatti c1 + c2 eax + c3 xeax . c1 +c2 eax +c3 xeax +c4 x2 eax = 0 ⇒ −c4 = x2 eax Prendendo il limite per x → +∞ (se a ≥ 0) o per x → −∞ (se a < 0), si ha c4 = 0. Allo stesso modo, c1 + c2 eax −c3 = xeax e prendendo il limite si ha c3 = 0. Continuando così, anche c2 = 0, e quindi c1 = 0. (d) Si ha cos 2x = cos2 x − sin2 x = 1 − 2 sin2 x. Quindi 2 sin2 x = 1 − cos 2x, e sin2 x è combinazione lineare di 1 e cos 2x. La dimensione non è maggiore di 2. Ma 1 e cos 2x sono linearmente indipendenti (dato che cos 2x non è costante), e quindi la dimensione cercata è esattamente 2. 9 Basta dimostrare che le operazioni di somma e di prodotto per uno scalare sono definite anche sul nucleo. Infatti, se v, w ∈ Nucleo(L), cioè se L(v) = L(w) = 0, allora per linearità L(v + w) = L(v) + L(w) = 0 e L(cv) = cL(v) = c0 = 0 per ogni c ∈ R. 10 (a) dim Nucleo( f ) = 0, dim Immagine( f ) = 2; (b) dim Nucleo( f ) = 0, dim Immagine( f ) = 2; (c) Nucleo = {(x, y) ∈ R2 : x = 0} =⇒ dim Nucleo( f ) = 1, dim Immagine( f ) = 1; (d) Non è lineare: f (2, 2) = (4, 2) , 2 f (1, 1) = 2(1, 0); (e) Nucleo = {(x, y) ∈ R2 : x+y = 0} =⇒ dim Nucleo( f ) = 1, dim Immagine( f ) = 1. 11 (a) Il nucleo è {0}, l’immagine è R2 . (b) Il nucleo è {0}, l’immagine è R2 . (c) Non è lineare: lo 0 non va nello 0. (d) Non è lineare: lo 0 non va nello 0. (e) Non è lineare: lo 0 non va nello 0. 12 (a) rango = 3, nullità = 0; (b) rango = 3, nullità = 0. Infatti x + y = y + z = z + x = 0 =⇒ x − z = z + x = 0 =⇒ x = z = 0; (c) Non è lineare: f (0, 0, 0) , (0, 0, 0); (d) Non è lineare: f (0, 0, 0) , (0, 0, 0); (e) Non è lineare: f (0, 2, 0) , 2 f (0, 1, 0). 13 (a) Se p1 , p2 ∈ V, allora T(p1 + p2 )(x) = (p1 + p2 )(x + 1) = p1 (x + 1) + p2 (x + 1) = T(p1 ) + T(p2 ). Se c ∈ R, allora T(cp)(x) = cp(x + 1) = cT(p). =⇒ è lineare. p(x + 1) ≡ 0 se e soltanto se p ≡ 0, cioè il nucleo è banale. (b) È lineare, con nucleo i polinomi di grado zero. (c) È lineare, con nucleo i polinomi di grado zero. (d) Lineare. Il nucleo: 0. Infatti, se p(x) è un polinomio di grado k per cui p′′ (x) + 2p′ (x) + p(x) = 0, allora p′′ (x) (di grado k − 2) deve essere uguale a −2p′ (x)−p(x), che ha grado k. (e) Lineare. Il nucleo: se un polinomio p(x) = a0 + a1 x + a2 x2 + a3 x3 + . . .
600
Soluzioni degli esercizi – Capitolo IV
soddisfa l’equazione x2 p′′ (x) − 2xp′ (x) + p(x) = 0, allora (a0 + a1 x + a2 x2 + a3 x3 + . . . + an xn )
−2x(a1 + 2a2 x + 3a3 x2 + . . . + nan xn−1 )
+x2 (2a2 + 6a3 x + . . . + n(n − 1)an xn−2 ),
e quindi
a0 + (−a1 )x + (−a2 )x2 + . . . + (1 − 2n + n(n − 1))anxn = 0.
Ma allora a0 = a1 = . . . = an = 0, ossia p = 0. 14 È lineare: T({xn } + {yn }) = T({xn + yn }) =
= {xn + yn − lim (xn + yn )} = {xn + yn − lim xn − lim yn } n→∞
n→∞
n→∞
= {xn − lim xn } + {yn − lim yn } = T({xn }) + T({yn }). n→∞
n→∞
T(c{xn }) = {cxn − lim cxn } = cT({xn }). n→∞
Il nucleo: le successioni per cui per ogni n
0 0 . 3 0 # " 4 6 22 28 8 10 , AC = 18 B + C = , AB = −22 −28 6 8 # " −1 −2 −3 16 22 , BA = CA = −1 −2 −3, A(B + C) = −16 −22 −1 −2 −3 # " 38 50 . −38 −50 # " 0 2 . Per dimostrare la seconda affer19 AB − BA = 2 0 mazione, osserviamo che se Z commuta con ogni matrice B, allora in particolare commuta con le quattro matrici elencate. Viceversa, se ZEi j = Ei j Z per ogni i, j, allora se B è una matrice arbitraria, 0 0 (d) 0 0
1 0 0 0
0 2 0 0
B = b11 E11 + b12 E12 + b21 E21 + b22 E22
xn − lim xn = 0, n→∞
=⇒ ZB = Z(b11 E11 + b12 E12 + b21 E21 + b22 E22 )
cioè le successioni costanti.
= b11 ZE11 + b12 ZE12 + b21 ZE21 + b22 ZE22 15 Si ha, per il teorema fondamentale del calcolo integrale, ! Z x d p(t) dt = p(x), dx 0 e dunque DI(p) = p. Invece Z x ID(p)(x) = p′ (t) dt = p(x) − p(0), 0
che è uguale a p(x) se e solo se p(0) = 0. −a3 a2 0 2 0 0 a 0 2 0 0 −a1 ; 16 (a) ; (b) 3 0 0 2 −a2 a1 0 h i (c) a1 a2 a3 ; (d) L’inversa di f : R3 → R3 ha matrice 1/2 −1/2 1/2 0 1 1 1/2 −1/2 1/2 1 0 1 −1 f = . =⇒ f = 1/2 1/2 −1/2 1 1 0 Infatti, se poniamo i′ = f (i), j′ = f (j) e k′ = f (k), abbiamo i′ + j′ = k, j′ + k′ = i, k′ + i′ = j =⇒ i′ + j′ = k,
i′ − j′ = j − i =⇒ 2i′ = −i + j + k,
e analogamente per j′ e k′ . " 17
(a)
0 −1
# 1 ; (b) 0
0 0 0
0 1 0
0 1; (c) 1
"
1 −1
# 1 ; 1
= b11 E11 Z + b12 E12 Z + b21 E21 Z + b22 E22 Z = (b11 E11 + b12 E12 + b21 E21 + b22 E22 )Z = BZ. Risolvendo il sistema di equazioni Ei j Z = ZEi j (per tutti gli i, j), si trova che le matrici Z con proprietà # " questa c 0 , per qualche sono tutte e sole quelle del tipo cI = 0 c c ∈ R. # " 1 n , per ogni 20 Mostriamo per induzione che An = 0 1 n ∈ Z. Se n = 0, è vera (supposto di porre A0 = I. Per n = 1, anche. Supponiamo che sia vera per n − 1: allora # # " #" " 1 n 1 n−1 1 1 . = An = An−1 A = 0 1 0 1 0 1 # " 1 −1 e analogamente, per Ora, l’inversa A−1 è proprio 0 1 n > 0, # # " #" " 1 −n 1 −(n − 1) 1 −1 . = (A−1 )n = (A−1 )n−1 A−1 = 0 1 0 1 0 1 21 Invece di fare una dimostrazione trigonometrica (che il Lettore può svolgere autonomamente) identifichiamo R2 con il piano complesso C. Come sappiamo dal primo volume, la rotazione di angolo ϑ corrisponde allora al prodotto per l’esponenziale complesso eiϑ = cos ϑ + i sin ϑ. Posto (x, y) = x + iy = z otteniamo subito eiϑ z = (x cos ϑ − y sin ϑ) + i(x sin ϑ + y cos ϑ), da cui la tesi.
Soluzioni degli esercizi – Capitolo IV
22 Si ha #" " # cos ϑ − sin ϑ cos ϑ′ − sin ϑ′ R ϑ R ϑ′ = sin ϑ cos ϑ sin ϑ′ cos ϑ′ # " cos ϑ cos ϑ′ − sin ϑ sin ϑ′ − cos ϑ sin ϑ′ − sin ϑ cos ϑ′ = sin ϑ cos ϑ′ + cos ϑ sin ϑ′ − sin ϑ sin ϑ′ + cos ϑ cos ϑ′ # " cos(ϑ + ϑ′ ) − sin(ϑ + ϑ′ ) . = ′ ′ sin(ϑ + ϑ ) cos(ϑ + ϑ ) # " cos nϑ − sin nϑ . Si ha quindi Rnϑ = sin nϑ cos nϑ " # a a12 23 Se A = 11 , ci sono 24 = 16 modi di avere a21 a22 elementi ai j = ±1. Siano a1 e a2 le due colonne. a1 = (1, 1) =⇒ a2 = (−1, 1) oppure a2 = (1, −1)
a1 = (−1, −1) =⇒ a2 = (−1, 1) oppure a2 = (1, −1)
a1 = (−1, 1) =⇒ a2 = (1, 1) oppure a2 = (−1, −1)
a1 = (1, −1) =⇒ a2 = (1, 1) oppure a2 = (−1, −1).
In totale, sono otto. Ora, se x, y e z sono tre vettori ortogonali, si ha (x + y) · (x + z) = x · x + x · z + y · x + y · z = kxk2 .
Se quindi sono colonne di dimensione n con termini ±1, kxk2 = n. Per ogni i = 1, . . . , n, xi + yi e xi +zi possono essere solo uguali a 0 oppure a ±2 (basta enumerare i quattro casi possibili), e quindi il loro prodotto può essere uguale a 0 o a ±4. Ma allora si ha n X n = (x + y) · (x + z) = (xi + yi )(xi + zi ), i=1
cioè n è uguale alla somma di n termini uguali a 0 o a ±4, e quindi deve essere divisibile per 4. 24 Per mostrare (a) , le proprietà commutativa, distributiva e omogenea sono semplici e omettiamo i dettagli per non occupare troppo spazio. Rimane invece da mostrare che è definito positivo, cioè che h f, f i ≥ 0 e f , 0 =⇒ h f, f i > 0. È chiaro che h f, f i ≥ 0. Supponiamo quindi che f (x) è un polinomio di grado ≤ n tale che n X i i f 2 ( ) = 0 e quindi che f ( ) = 0 per i = 0, . . . , n. n n i=0 Quindi f è un polinomio di grado n che si annulla negli n + 1 punti i/n: deve essere il polinomio nullo. Calcoliamo h1, xi, per rispondere a (b) : n n X i 1X 1 n(n + 1) n + 1 h1, xi = = = . i= n n n 2 2 i=0 i=1
601
25 Se f (x) e 1(x) sono polinomi, allora il prodotto è un polinomio p(x), e Z ∞ −x e p(x) dx < ∞. 0
L’unica proprietà non banalmente verificabile è che è definito positivo: se Z ∞ e−x f 2 (x) dx, 0 = h f, f i = 0
allora l’integranda deve essere nulla (perché positiva), e quindi f (x) ≡ 0. Calcoliamo il prodotto scalare hxn , xm i. Z ∞ Z ∞ −x n+m ∞ −x n m e x x dx = −e x (n + m)e−x xn+m−1 dx 0 + 0 0 Z ∞ = (n + m) e−x xn+m−1 dx 0 Z ∞ = · · · = (n + m)! e−x dx = (n + m)! 0
e quindi hxn , xm i = (n + m)!. Un polinomio di primo grado ax + b è ortogonale a 1 + x se e soltanto se Z ∞ 0= e−x (ax + b)(1 + x) dx = . . . = 2b + 3a. 0
Quindi i polinomi di primo grado ortogonali a 1 + x sono quelli del tipo p(x) = a(x − 3/2). 26 Se e1 , . . . , ek è una base ortonormale di W, per il Teorema (IV.45) la proiezione si scrive projW (v) =
k X hv, ei iei , i=1
da cui segue che projW (v + w) =
k k X X hv, ei iei + hw, ei iei i=1
i=1
k X = hv + w, ei iei = projW (v) + projW (w) i=1
k k X X projW (cv) = hcv, ei iei = c hv, ei iei = c projW (v) i=1
i=1
27 Per la disuguaglianza di Cauchy–Schwarz, per ogni N si ha N 2 N N X X X 2 2 ≤ , x y y x n n n n n=1
n=1
n=1
602
Soluzioni degli esercizi – Capitolo IV
e per la disuguaglianza triangolare v 2 v t t N N N X X X x2n + y2n . (xn + yn )2 ≤ n=1 n=1 n=1 Allora se {xn } e {yn } hanno quadrati sommabili, anche la somma {xn + yn } haP quadrato sommabile, ed è definito il prodotto scalare ∞ n=1 xn yn definito sopra. Per finire di 2 mostrare che l è uno vettoriale, basta osservare P P∞ spazio 2 2 2 che ∞ n=1 (cxn ) = c n=1 xn , e quindi anche il prodotto per uno scalare è ben definito. Per mostrare che è il prodotto scalare definito sopra è ben definito, dobbiamo mostrare le proprietà commutativa (ovvia), distributiva (ovvia) e omogenea (ovvia) e che è definito positivo (ovvia). Le ovvietà, com’è ovvio, sono lasciate al Lettore. L’angolo γ tra le due successioni xn = 1/n e yn = 1/(n + 1): ∞ ∞ X X 1 1 1 h{xn }, {yn }i = = − = 1; n(n + 1) n n + 1 n=1 n=1 ∞ ∞ X X π2 π2 1 1 = k{yn }k2 = = − 1, k{xn }k2 = 2 2 n 6 (n + 1) 6 n=1 n=1
e quindi h{xn }, {yn }i 1 = , √ √ k{xn }kk{yn }k π/ 6 π2 /6 − 1 da cui γ 0.2418. La distanza tra le due successioni è ∞ X π2 − 3. k{xn − yn }k2 = (1/n − 1/n + 1)2 = 3 n=1 cos γ =
1 28 a 2 a
1 b b2
1−1 1 − 1 b−a c − a 2 2 2 2 b −a c −a c−a 1 = (b − a)(c − a) c2 − a2 b+a
1 1 c = a 2 2 a c
b−a = 2 b − a2
1 c + a
= (b − a)(c − a)(c + a − b − a) = (b − a)(c − a)(c − b). Per la (b) , sottraiamo alla seconda riga a volte la prima, alla terza riga a volte la seconda e alla quarta a volte la terza; otteniamo 1 1 1 1 a − a b−a c−a d − a a2 − a2 b2 − ab c2 − ac 2 d − ad 3 3 3 2 3 2 a − a b − ab c − ac d3 − ad2 c−a d − a b − a c(c − a) d(d − a) = (b − a)(c − a)(d − a) = b(b − a) 2 b (b − a) c2 (c − a) d2 (d − a)
1 1 1 b c d = (b − a)(c − a)(d − a)(c − b)(d − b)(d − c). 2 b c2 d2 Queste matrici sono dette matrici di Vandermonde. Passiamo alla (c) : x 1 0 0 x 1 0 1 x 1 0 x 1 0 1 x 1 = x 1 x 1 − 1 x 0 1 x 0 0 1 x = x2 (x2 − 2) − (x2 − 1) = x4 − 3x2 + 1. Il determinante della matrice (d) vale invece 1. 29 Nella matrice di esempio i blocchi sono " # " # " # a a12 b b12 c c12 A = 11 B = 11 C = 11 a21 a22 b21 b22 c21 c22 e quindi M=
"
A B
# 0k×k . C
Supponiamo inizialmente che B = 0. Allora " # " #" # A 0k×k A 0k×k Ik 0k×k M= = , B C 0k×k Ik 0k×k C e quindi per il Teorema di Binet " # " A 0k×k I det(M) = det det k 0k×k Ik 0k×k
# 0k×k . C
Ora, sia per l’unicità del determinante che per lo sviluppo di Laplace, si ha " # " # A 0k×k I 0k×k det = det A, det k = det C, 0k×k Ik 0k×k C e quindi se B = 0 det M = det A det C. Supponiamo invece che B , 0, e scriviamo M come " #" #" # A 0k×k Ik 0k×k Ik 0k×k M= . 0k×k Ik B Ik 0k×k C Allora la tesi segue se riusciamo a mostrare che 0 0 1 0 1 0 Ik 0k×k = 1 che se k = 2 è B Ik b11 b12 1 b21 b22 0
0 0 = 1. 0 1
Ma questa è una matrice triangolare (inferiore), il cui determinante è uguale al prodotto degli elementi sulla diagonale (dimostrarlo!), che è uno. # # " " 0 1 0 −2 1 1 −1 1 0 0 ; (c) ; (b) 30 (a) 1/2 . 3/2 −1/2 1 1 0 0 1 31 Supponiamo che esistano α, β ∈ R non entrambi
Soluzioni degli esercizi – Capitolo IV
nulli per cui αa(x) + βb(x) ≡ 0. Allora, derivando una volta otteniamo αa′ (x) + βb′ (x) ≡ 0, e quindi # " # # " " 0 b(x) a(x) , = +β ′ α ′ 0 b (x) a (x) per cui W(a, b; x) = 0. Analogamente, per a, b, c, si deriva due volte e si ottiene il sistema αa(x) + βb(x) + γc(x) = 0 ′
′
′
αa (x) + βb (x) + γc (x) = 0 αa′′ (x) + βb′′ (x) + γc′′ (x) = 0, e quindi i tre vettori b(x) a(x) ′ ′ a (x) , b (x) , ′′ ′′ b (x) a (x)
c(x) ′ c (x) ′′ c (x)
sono linearmente dipendenti. Il determinante della matrice W(a, b, c; x) è quindi identicamente nullo. Consideriamo le funzioni suggerite a(x) = x3 b(x) = |x|3 , per cui il determinante della matrice wronskiana è 3 3 x x 3x2 3x2 = 0 se x ≥ 0, det(W(a, b; x)) = 3 −x3 x 3x2 −3x2 = 0 se x < 0, cioè è identicamente nullo. Ma a(x) e b(x) non sono linearmente dipendenti: se esistessero α, β tali che αa(x) + βb(x) = 0, deve essere αx3 + β|x|3 = 0, e quindi se x = 1 si ha α + β = 0, mentre per x = −1 si ha β − α = 0: segue che α = β = 0. 32 Se Lv = λ1 v e Lv = λ2 v, per v , 0 e λ1 , λ2 ∈ R, allora λ1 v = λ2 v, e quindi (λ1 − λ2 )v = 0. Dato che v , 0, deve quindi essere λ1 − λ2 = 0. 33 Il polinomio caratteristico di A è −3 3 6 − t 4−t 3 4−t 3 = (6 − t) det(A − tI) = 1 1 2 − t −1 1 2 − t 3 −3 3 −3 = 60 − 47t + 12t2 − t3 . − − 1 2 − t 4 − t 3
Come si trovano le radici dei polinomi di terzo grado? Sappiamo che ci deve essere almeno una radice, e per tentativi arriviamo alle tre soluzioni t = 3, 4, 5 (non è vero che le abbiamo trovate per tentativi: ci sono molti metodi, tra cui anche una formula risolutiva, analoga a quella per l’equazione di secondo grado). Quindi ci sono tre autovalori distinti λ1 = 3, λ2 = 4 e λ3 = 5. Risolviamo i tre
603
sistemi per trovare gli autovettori corrispondenti: 3 2 1 (A − 3I)x = 0 ⇔ x1 = , (A − 4I)x = 0 ⇔ x2 = 1 −1 −1 3 (A − 5I)x = 0 ⇔ x3 = 0 . −1 La matrice diagonalizzante è quindi 3 3 2 1 0 con inversa S = 1 −1 −1 −1
−1 1 0
Il Lettore è invitato a controllare che: 3 0 0 S−1 AS = . . . = 0 4 0 . 0 0 5
0 1 −1
−3 3 −1
In modo analogo si trovano gli autovalori e gli autovettori di B: il polinomio caratteristico è det(B − tI) = −t3 + 2t2 + t − 2 = (1 − t)(t2 − t − 2) da cui si trovano gli autovalori λ1 = −1, λ2 = 1, λ3 = 2 e gli autovettori x1 = (0, 1, 1), x2 = (1, 1, 1), x3 = (1, 0, 1). Quindi −1 0 0 0 1 1 −1 S = 1 1 0 e S BS = 0 1 0 . 0 0 2 1 1 1 34 Si ha D( f (x)) = λ f (x) se e soltanto se f ′ (x) = λ f (x) ⇔
f ′ (x) d d =λ ⇔ log| f (x)| = λx, f (x) dx dx
e quindi gli autovettori corrispondenti agli autovalori λ , 0 sono fλ (x) = ceλx per qualche c ∈ R, mentre quelli corrispondenti all’autovalore λ = 0 sono gli elementi del nucleo di D, cioè le funzioni costanti. Gli autovettori di T sono le funzioni f (x) tali che x f ′ (x) = λ f (x), cioè per λ , 0 f ′ (x) λ d log = =⇒ f (x) = c|x|λ . dx | f (x)| x
I valori di λ per cui sono funzioni derivabili infinite volte su R sono solo gli interi, per cui gli autovalori sono λn = n, con n ∈ N,e gli autovettori corrispondenti sono i monomi xn . 35 Sia M una matrice n × n. Mostriamo per induzione che il determinante è un polinomio di grado n nei coefficienti mi j di M. Se n = 1, allora M = (m11 ) e det M = m11 ,
604
Soluzioni degli esercizi – Capitolo IV
quindi l’affermazione è vera. Supponiamo che sia vero per n − 1. Allora, sviluppando il determinante di M nella prima colonna come in (IV.56), a pagina 189, si ha det M = m1,1 M1,1 − m2,1 M2,1 + . . . + (−1)n−1 mn,1 Mn,1 ,
dove i Mi,1 sono i minori (cioè i determinanti delle sottomatrici n−1×n−1) ottenuti cancellando la prima colonna e la i-esima riga. Per ipotesi induttiva ogni minore Mi,1 è un polinomio di grado n − 1 nei coefficienti della matrice, e quindi det M è un polinomio di grado n. In altre parole, è somma di prodotti dei mi j e non ci sono più di n termini mi j in ogni addendo. Con la stessa tecnica è possibile vedere che è un polinomio omogeneo di grado n nelle variabili mi j , cioè tutti i monomi hanno grado n. Ora, il polinomio caratteristico si ottiene sostituendo a m11 il polinomio di primo grado m11 −λ, a m22 il polinomio m22 −λ, . . . . La composizione di due polinomi è ancora un polinomio, e quindi il det(M − λI) è un polinomio di λ. Il suo grado non può superare n, naturalmente. Ora, il suo grado sarà n se nell’espressione del determinante compare il prodotto m11 m22 . . . mnn . Come sopra, è possibile dimostrarlo per induzione utilizzando lo sviluppo sulla prima colonna. 36 Sappiamo che det M = det tM, e quindi pA (λ) = det(A−λI) = det(tA−λtI) = det(tA−λI) = ptA (λ). 37 Uno scalare λ ∈ R è autovalore se e soltanto se esiste un autovettore, cioè se e soltanto se l’equazione Mx = λx ha una soluzione non nulla. Se la riscriviamo come (M − λI)x = 0, allora λ è un autovalore se e soltanto se la matrice M − λI ha determinante zero (si applichi il Teorema (IV.59)), cioè se e soltanto se λ annulla il polinomio caratteristico pM (λ) = det(M − λI). Ora, se M1 e M2 sono simili (cioè se esiste una matrice non singolare B tale che M2 = B−1 M1 B), allora −1
det(M2 − λI) = det(B M1 B − λI) = det(B−1 M1 B − B−1 λIB) −1
−1
cità) di pA (λ). Le radici di pA (λ) sono gli n autovalori (complessi) di A, quindi i λi sono gli autovalori di A. Mostriamo ora per induzione che n X n−1 pA (λ) = det(A) + . . . + (−1) aii λn−1 + (−1)n λn , i=1
n
cioè pM1 (λ) = pM2 (λ).
38 Valutando pA (λ) in λ = 0 si ha subito c0 = pA (0) = det(A). Per procedere, ricordiamo che in C ogni polinomio di grado n si fattorizza in n fattori lineari. Per l’Esercizio 35 il polinomio pA (λ) ha grado esattamente n, e quindi si fattorizza come (+)
pA (λ) = cn (λ − λ1 )(λ − λ2 ) . . . (λ − λn ),
dove i λi sono le n radici (contate con la loro moltepli-
Pn
cioè che cn = (−1) e cn−1 = (−1) i=1 aii . Se n = 2, allora det(A − λI) = (a11 a22 − a12 a21 ) − (a11 + a22 )λ + λ2 , e quindi la proposizione è vera. Supponiamola vera per n − 1, e sviluppiamo lungo la prima colonna il determinante det(A − λI) (Proposizione (IV.56)): a12 ··· a1n a11 − λ a21 a22 − λ · · · a2n = . . . .. .. .. .. . an1 an2 · · · ann − λ a2n a22 − λ · · · a32 ··· a3n (a11 − λ) . .. .. .. . . an2 · · · ann − λ a1n a12 · · · a32 · · · a3n −a2,1 . .. + . . . , .. .. . . an2 · · · ann − λ cioè
pA (λ) = (a11 − λ)pAˆ (λ) + R(λ), dove Aˆ è la sottomatrice quadrata ottenuta cancellando la prima riga e la prima colonna da A, mentre il resto R(λ) è un polinomio di grado n − 2. Per ipotesi di induzione n−1 X n−2 pAˆ (λ) = cˆ0 + . . . + (−1) aˆii λn−2 + (−1)n−1 λn−1 ,
(*)
i=1
dove aˆii = ai+1,i+1 per ogni i, e quindi per la (*) pA (λ) = (a11 − λ)pAˆ (λ) + R(λ)
= (a11 − λ)(. . . + cˆn−2 λn−2 + cˆn−1 λn−1 ) + R(λ)
= det(B (M1 − λI)B) = det(B ) det(M1 − λI) det(B) = det(B)−1 det(B) det(M1 − λI) = det(M1 − λI),
n−1
= . . . + (a11 cˆn−1 − cˆn−2 )λn−1 − cˆn−1 λn .
Quindi cn = −ˆcn−1 = −(−1)n−1 = (−1)n e cn−1
n−1 X n−1 n−2 ˆ ˆ ˆ = a11 cn−1 − cn−2 = (−1) a11 − (−1) aii n−1 n X X aˆii = (−1)n−1 = (−1)n−1 a11 + aii . i=1
i=1
i=1
Ora, se A e B sono matrici simili, allora i polinomi caratteristici coincidono pA (λ) = pB (λ), per cui i coefficienti dei
Soluzioni degli esercizi – Capitolo IV
605
polinomi sono uguali, e in particolare le tracce tr A e tr B (che compaiono come coefficienti di λn−1 ) sono uguali. Inoltre, dalla (+) deduciamo che pA (λ) = (−1)n (λ − λ1 )(λ − λ2 ) . . . (λ − λn ) = (−1)n λn − (λ1 + λ2 + . . . + λn )λn−1 + . . . . . . + (−1)n λ1 λ2 . . . λn ) ,
da cui possiamo finalmente dedurre che ① La Pn traccia è la somma degli autovalori tr A = i=1 λi . ② Il determinante è il prodotto degli autovalori Q det A = ni=1 λi . 39 Siano ai j e bi j i coefficienti delle matrici A e B. Allora n n n X X X (aii + bii ) = aii + bii = tr(A) + tr(B).
tr(A + B) =
i=1
i=1
caii = c
tr(cA) = i=1
tr(tA) =
i=1
−1
i=1
i=1 n X n X
n X n X
aik bki =
bki aik = tr(BA). k=1 i=1
40 La traccia di una matrice quadrata coincide con la traccia della sua trasposta, per cui si ha t
hA, Bi = tr (tAB) = tr ( (tAB)) = tr (tBA) = hB, Ai.
Si ha inoltre tr (cA) = c tr (A), per cui si vede facilmente che hcA, Bi = hA, cBi = chA, Bi.
Si conclude osservando che se A , 0, allora A , 0 =⇒ hA, Ai > 0. Infatti, se A = (a1 , a2 , . . . , am ) e B = (b1 , b2 , . . . , bm ) (dove ai , bi ∈ Rn ), l’elemento al posto (i, j) della matrice m × m C = tAB è il prodotto scalare standard e dunque se A , 0
hA, Ai = tr AA =
# −s2 , 1+s
42 Il polinomio caratteristico di A è pA (λ) = −t3 + t2 + t − 1 = −(t − 1)2 (t + 1).
Gli autovalori sono 1 e −1. Cerchiamo una base di autovettori: l’autovettore dell’autovalore −1 risolve (A + I)x = 0 =⇒ x−1 = (−1, 0, 1).
Cerchiamo gli autovettori relativi all’autovalore 1: (A − I)x = 0 =⇒ x1 = (0, 1, 0), x1′ = (1, 0, 1).
Abbiamo trovato due autovalori, ma tre autovettori linearmente indipendenti, e quindi la matrice è diagonalizzabile (la base diagonalizzante è la terna di autovettori). La matrice B ha due autovalori distinti (1 e 3), e quindi per il Corollario (IV.81) è diagonalizzabile. La matrice C invece ha un solo autovalore λ = 2. Cerchiamone gli autovettori:
ci j = ai · b j = tai b j , t
"
e quindi per s = 0 si ha proprio S−1 AS = C, cioè A e C sono simili.
aii = tr(A).
i=1 k=1
L’unico autovettore di C è xC = (0, 1). Quindi sicuramente B non è simile né ad A né a C, e A e C potrebbero essere simili. Cerchiamo un cambio di coordinate, cioè una matrice invertibile S tale che S−1 AS = C. La trasformazione S dovrebbe mandare l’autovettore di A in quello di C, per cui proviamo con una matrice del tipo # # " " −s 1 0 1 =⇒ S−1 = S= 1 0 1 s 1−s S AS = . . . = 1
aii = c tr(A).
n X
tr(AB) =
L’unico autovettore di A è (a meno di multipli scalari) xA = (1, 0). ( 0=0 (C − I)x = 0 ⇐⇒ x1 = 0.
Si vede che
n X
n X
matrice identica. Controlliamo, comunque: ( x2 = 0 (A − I)x = 0 ⇐⇒ 0 = 0.
m X
m X
cii = i=1
i=1
m X ai · ai = kai k2 > 0. i=1
41 Hanno tutte solo l’autovalore 1, dato che i polinomi caratteristici sono tutti uguali a (1 − λ)2 . Calcoliamo gli autovettori corrispondenti. Sappiamo che per B tutti i vettori sono autovettori relativi all’autovalore 1. Non può essere la stessa cosa per A e C, dato che non sono la
(C − 2I)x = 0 =⇒ x2 = (1, 0).
Ne abbiamo trovato uno solo, e per fare una base ne servono due: niente da fare, non è diagonalizzabile. Il polinomio caratteristico di D è t2 −2t+5, che non ha radici reali. Quindi D non ha autovalori, né tantomeno può avere autovettori (reali), e quindi non è diagonalizzabile. 43 Se si pone x = ei e y = e j (dove gli ei sono i vettori
606
Soluzioni degli esercizi – Capitolo IV
della base standard), allora hL∗ ei , e j i = tei tL∗ e j = l∗ji ,
hei , Le j i = tei Le j = li j .
44 La matrice di adiacenza del grafo è 0 1 0 0 0 1 1 0 1 0 0 1 0 1 0 1 1 1 . A = 0 0 1 0 1 0 0 0 1 1 0 1 1 1 1 0 1 0 Supponiamo per induzione che il coefficiente a′i j di An−1 sia il numero di percorsi diversi che vanno in n − 1 passi dal vertice i al vertice j: allora il coefficiente (i, j)-esimo del prodotto An = An−1 A è uguale a 6 X
a′ik akj ,
k=1
e dato che akj è uno quando k è collegato a j e 0 altrimenti, il numero di percorsi diversi di n passi è la somma di quelli in n − 1 passi fino a k1 , quello in n − 1 passi fino a k2 , . . . , quello in n − 1 passi fino a kl , dove l è il numero di vertici collegati con j. Per esempio, si può calcolare A10 (con un piccolo algoritmo da programmarsi o con un CAS), e vedere che ci sono 8759 modi diversi di partire e arrivare a 1 in 10 passi. 45 Si ha a1 b1 a A = 2 B = b2 quindi AtB = (Ab1 , Ab2 , Ab3 ) , a3 b3 t
e quindi i tre vettori colonna di A B sono b1 a, b2 a, b3 a, che chiaramente sono linearmente dipendenti. 47 Osserviamo innanzitutto che, in generale, la dimensione di Span(v1 , v2 , . . . , vk ) è il massimo numero dei vettori vi linearmente indipendenti. Infatti, supponiamo che i primi d vettori siano linearmente indipendenti ma se ne aggiungiamo uno non sono più linearmente indipendenti: quest’ultimo non può che essere combinazione lineare dei precedenti. Ragionando così con tutti i vettori che mancano, mostriamo che si può generare Span(v1 , v2 , . . . , vk ) con i summenzionati primi d, cioè che questi costituiscono una base. Se k colonne di Aˆ sono linearmente indipendenti, allora le corrispondenti k colonne di A (che le estendono) devono essere linearmente indipendenti, e quindi il massimo numero di colonne di Aˆ linearmente indipendenti non può superare il massimo numero di colonne linearmente indipendenti di A, da cui la tesi.
48 Mostriamo per prima cosa il corrispondente dell’Esercizio 51 di pagina 161, cioè che quattro punti A, B, C, D di Rn sono complanari se e solo se esistono a, b, c, d non tutti nulli tali che a + b + c + d = 0 e aA + bB + cC + dD = 0. Infatti, supponiamo che siano complanari. Se ce ne sono tre allineati (per esempio, A, B e C), allora esistono (a, b, c) , (0, 0, 0) tali che a + b + c = 0 e aA + bB + cC = 0, e quindi ponendo d = 0 si ha a + b + c + d = 0 e aA + bB + cC + dD = 0. Quindi supponiamo che non ce ne siano tre allineati: esiste un unico piano per A, B e C. Il quarto punto appartiene a tale piano se e solo se esistono (s, t) tali che D = A + s(B − A) + t(C − A), cioè (1 − s − t)A + sB + tC − D = 0,
che è aA+bB+cC+dD = 0 con (a, b, c, d) = (1−s−t, s, t, −1). Viceversa, se aA + bB + cC + dD = 0 e a + b + c + d = 0, ma uno dei coefficienti a, b, c o d è zero (per esempio d) allora gli altri tre punti sono allineati (in questo esempio, A, B, e C) e dunque esiste un piano che contiene i quattro punti. Se nessuno dei coefficienti a, b, c e d è zero, allora per esempio dividendo per −d si ha D = a′ A + b′ B + c′ C. con a′ = −a/d, b′ = −b/d e c′ = −c/d, e a′ + b′ + c′ = 1. Ma allora ponendo s = b′ , t = c′ si ha a′ = 1 − b′ − c′ = 1 − s − t e D = (1 − s − t)A + sB + tC = A + s(B − A) + t(C − A),
cioè i quattro punti sono complanari. Ora, in R3 esiste una soluzione (a, b, c, d) , (0, 0, 0, 0) del sistema a1 b1 c1 d1 0 a b c a 2 + b 2 + c 2 + d d2 = 0 a3 b3 0 c3 d3 a + b + c + d = 0, che può essere scritto anche come d1 0 c1 b1 a1 d 0 c b a 2 2 2 a + b + c + d 2 = , d3 0 c3 b3 a3 0 1 1 1 1 oppure aa1 + bb1 + cc1 + dd1 = 0 aa2 + bb2 + cc2 + dd2 = 0 aa3 + bb3 + cc3 + dd3 = 0 a+b+c+d=0 Ma per il Teorema (IV.59), questo sistema ha soluzioni non nulle se e solo se a1 b1 c1 d1 a b c2 d2 2 det 2 = 0. a3 b3 c3 d3 1 1 1 1
Soluzioni degli esercizi – Capitolo IV
Oppure, potremmo usare il fatto che i quattro punti sono complanari se e solo se il volume del parallelepipedo che generano i vettori differenza B − A, C − A, D − A è nullo (perché?) e sottrarre la prima colonna alle altre colonne della matrice, per ottenere un determinante 3x3 che sappiamo essere il volume con segno di un parallelepipedo. 49 Per induzione: se n = 1, allora l’unico polinomio è x21 . Supponiamo quindi che ci siano (n − 1)n/2 monomi di grado due in n − 1 variabili x1 , . . . , xn−1 . I monomi di grado due nelle n variabili x1 , . . . , xn sono quindi (n − 1)n/2 (quelli in cui xn non compare) più quelli in cui compare xn , che sono esattamente n (xn per una delle n variabili), cioè (n − 1)n/2 + n = n(n + 1)/2. 50 Se ui j = 0 quando i > j e vi j = 0 quando i > j, allora ui j + vi j = 0 quando i > j, cioè U + V è triangolare superiore se lo sono U e V. Per il prodotto, il coefficiente al posto (i, j) di UV è n X (*) uik vkj . k=1
Sia i > j: il termine uik è nullo quando k < i, il termine vkj è nullo quando k > j. Ma se k ≤ j < i sicuramente k < i, quindi almeno uno dei due termini uik e vkj è zero, per cui il prodotto è zero. Supponiamo ora che esista l’inversa U−1 , tale che U−1 U = UU−1 = I. Siano vi j i coefficienti di U−1 Per ogni j = 1, . . . , n − 1 si deve avere n n X X (*) unk vkj = unn vn j = 0 e unk vkn = unn vnn = 1, k=1
k=1
dato che unk = 0 se k < n. Dunque unn , 0 e vnn = 1/unn , 0, e per la (*) vn j = 0 se j = 1, . . . , n − 1. Ora, scriviamo U e V a blocchi _ _ _ _ _ _ _ _ u11 u12 · · · u1,n−1 u1n 0 u22 · · · u2,n−1 u2n . .. .. . . U = .. . . . . . . 0 0 · · · un−1,n−1 un−1,n _ _ _ _ _ _ _ _ unn 0 0 ··· 0 _ _ _ _ _ _ _ _ _ _ v12 · · · v1,n−1 v1n v11 v21 v22 · · · v2,n−1 v2n . .. .. .. U−1 = V = .. , . . . . . . v n−1,1 vn−1,2 · · · vn−1,n−1 vn−1,n _ _ _ _ _ _ _ _ _ _ ··· vnn 0 0 0
607
ossia
_ _ U ˆ uˆ , _ _ U = t 0 unn
U
−1
_ _ Vˆ vˆ , _ _ = V = t 0 vnn
ˆ e Vˆ sono le sottomatrici n − 1 × n − 1 nel riquadro, dove U uˆ e vˆ i vettori colonna di dimensione n−1, e t0 la riga zero di dimensione n − 1. Non è difficile vedere che il prodotto può essere eseguito a blocchi, cioè U ˆ uˆ Vˆ vˆ UV = t t 0 vnn 0 unn # # " " ˆ Vˆ + uˆ t0 ˆ vˆ + uv ˆ Vˆ U ˆ vˆ + uv U U ˆ nn U ˆ nn . = = t ˆ t 0 unn vnn 0V + unn t0 t0vˆ + unn vnn ˆ Vˆ è uguale a In−1 , e quindi Vˆ è l’inDato che UV = In , U ˆ versa di U (che è triangolare superiore). Se supponiamo per induzione che Vˆ è triangolare superiore, segue subito che anche V è triangolare superiore. 51 Abbiamo visto nell’Esercizio 50 che l’inversa di una matrice triangolare superiore, se esiste, è triangolare superiore. Il prodotto a blocchi che abbiamo usato nella dimostrazione, se U è unitriangolare, si scrive " # ˆ ˆ ˆ U ˆ uˆ Vˆ vˆ ˆ nn = Ut V Uvˆ + uv , UV = t v t 0 vnn 0 nn 0 1 da cui (ancora per induzione) si può dedurre che U è invertibile e vii = 1, cioè l’inversa è a sua volta unitriangolare. 52 Supponiamo che Q sia unitriangolare superiore e A una matrice. Allora, per definizione, 1 q12 q13 · · · q1n 0 1 q23 · · · q2n 1 · · · q3n Q = 0 0 . .. .. .. .. .. . . . . 0 0 0 ··· 1 e se a1 , a2 , . . . , an indicano le colonne di A si ha
AQ = (a1 , q12 a1 + a2 , q13 a1 + q23 a2 + a3 , . . . . . . , q1n a1 + q2n a2 + . . . + an ). Ma allora, quando qi j , 0, è possibile sommare il vettore −qi j ai alla j-esima colonna di AQ, ed eliminare il termine qi j ai . Utilizziamo questo procedimento (e il fatto che il determinante non cambia se si somma un multiplo di una colonna ad un’altra colonna). Per i minori di ordine uno, è facile: le prime colonne di A e di AQ coincidono (sono uguali a a1 ), e quindi i minori principali di ordine 1 coincidono. Per i minori di ordine due, si elimina q12 a1 dalla seconda colonna, e quindi i minori principali di ordine 2 coincidono. Si procede eliminando
608
Soluzioni degli esercizi – Capitolo IV
q13 a1 + q23 a2 dalla terza colonna, e quindi i minori principali di ordine 3 coincidono. Si procede in questo modo, per arrivare all’eliminazione di tutti i qi j ai , e ottenere che i determinanti det(A) e det(AQ) coincidono (ma questo era facile: det(A) = det(A) det(Q), e det(Q) = 1). Abbiamo così mostrato che tutti i minori principali di A e di AQ coincidono, per ogni matrice A, se Q è unitriangolare. Ora, i minori principali di una matrice coincidono con quelli della sua trasposta, e quindi i minori principali delle trasposte tB e tQtB coincidono. Se poniamo B = tA, otteniamo che i minori principali di tQA coincidono con quelli di A. Ma allora moltiplicando ancora a destra per Q otteniamo una matrice tQAQ che, per quanto visto sopra, ha minori principali uguali a quelli di tQA, che li ha uguali a A. 53 Sia A = (ai j ) la matrice simmetrica associata alla forma quadratica q(x). Cominciamo a mostrare che det A > 0. Per la Legge di Inerzia di Sylvester (IV.71), visto che una forma definita positiva ha indice di positività ip = n, esiste un cambio di coordinate x = By tale che nelle y la forma è diagonale e tutti i coefficienti uguali a uno, cioè y21 + y22 + . . . + y2n . Ma allora t
BAB = In =⇒ det(tBAB) = det(In ) = 1,
e dato che 1 = det(tBAB) = det tB det A det B = = det B det A det B = (det B)2 det A, si ha che det A > 0. Ora, i minori principali non sono altro che le matrici associate alle forme quadratiche definite sulle prime k coordinate ottenute annullando le restanti n − k coordinate q(x1 , 0, . . . , 0), q(x1 , x2 , 0, . . . , 0), . . . q(x1 , x2 , . . . , xn − 1, 0),
b j = −a1 j /a11 . La matrice corrispondente (per cui x = By) è 1 b2 b3 · · · bn 0 1 0 · · · 0 B = 0 0 1 · · · 0 . . .. .. . . .. .. . . . . 0 0 0 ··· 1
Ma questa è una matrice unitriangolare superiore! Allora per l’Esercizio 52 la matrice tBAB ha gli stessi minori principali di A, che quindi sono tutti positivi. Ma tBAB è la matrice ottenuta dopo il cambio di variabili, come nella dimostrazione del Teorema (IV.70), e quindi non ha termini diversi da zero nella prima riga e nella prima colonna, salvo a11 > 0, a11 _ 0_ _0 _ · ·_· _0 _ 0 aˆ22 aˆ23 · · · aˆ2n ˆ ˆ · · · aˆ3n t BAB = 0 a32 a33 . . . . . . .. .. .. . . .. 0 aˆn2 aˆn3 · · · aˆnn
_ _ _ _ _ _ _
Ora, siano dˆ1 , dˆ2 , . . . , dˆn−1 , i minori principali della matrice Aˆ di ordine n − 1 indicata dal tratteggio. I minori principali di tBAB (che coincidono con quelli di A e sono tutti positivi per ipotesi) sono a11 , a11 dˆ1 , a11 dˆ2 , . . . , a11 dˆn−1 . Ma allora, visto che a11 > 0, tutti i dˆj sono positivi, e per l’ipotesi di induzione la forma quadratica qˆAˆ (y2 , . . . , yn ) associata alla matrice Aˆ è definita positiva. È chiaro quindi che anche q(x) è definita positiva, poiché nelle coordinate y si scrive come somma delle due forme definite positive q(y) = a11 y21 + qˆAˆ (y2 , . . . , yn ).
che naturalmente sono definite positive. Dunque tutti i minori principali sono strettamente positivi. 54 Sia A = ai,j la matrice simmetrica associata alla forma quadratica q(x). Vogliamo mostrare per induzione su n che se i minori principali sono positivi allora la forma quadratica definita da A è definita positiva. Se n = 1, allora a11 > 0 in quanto unico minore principale, e quindi q(x) = a11 x21 è definita positiva. Supponiamo, come ipotesi di induzione, che ogni matrice simmetrica di ordine k (con k < n) e minori principali tutti positivi produca una forma quadratica definita positiva. Allora procediamo come nella dimostrazione del Teorema (IV.70), osservando che per ipotesi a11 > 0 (è uno dei minori). L’eliminazione di tutti i termini x1 x j con j = 2, . . . , n viene ottenuta componendo sostituzioni del tipo x1 7→ x1 + b j x j per opportuno b j , e quindi possiamo considerare il cambio di coordinate risultante x1 = y1 + b2 y2 + . . . + bn yn , con
55 Per la linearità di F sulla prima colonna, si ha 1 a12 · · · a1n a11 a12 · · · a1n 0 a · · · a2n 0 a22 · · · a2n 22 = a F F . .. .. . .. .. 11 .. .. .. . .. . . . . . . 0 an2 · · · ann 0 an2 · · · ann
Se sottraiamo alla seconda colonna a12 per la prima, alla terza a13 per la prima, etc. etc. si ha per la linearità 1 a12 − a12 · · · a1n − a1n 1 a12 · · · a1n 0 a a22 ··· a2n · · · a2n 0 22 F . .. .. .. .. = F .. .. .. . .. . . . . . . 0 an2 ··· ann 0 an2 · · · ann
Soluzioni degli esercizi – Capitolo IV 1 _ 0 _ · _· · _ 0 _ 0 a22 · · · a2n .. . .. .. . . . . . . a · · · a 0 _ n2_ _ _ nn_ Ma quest’ultima, come funzione della matrice evidenziata, è lineare nelle colonne, cambia di segno allo scambiare le colonne, e vale 1 sulla matrice identica: deve quindi essere il determinante, come volevasi dimostrare. La dimostrazione per le righe è esattamente la stessa, e la lasciamo al Lettore. = F
56 La matrice si ottiene cancellando la i-esima riga e la j-esima colonna, e la tesi si riscrive come (−1)i+k F(A) = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ a12 · · · a1,j−1 0 a1,j+1 · · · a1n a11 a21 a22 · · · a2,j−1 0 a2,j+1 · · · a2n . . . .. .. .. . . . .. .. .. .. . . . . a i−1,1 ai−1,2 · · · ai−1,j−1 0 ai−1,j+1 · · · ai−1,n _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ det ai,j−1 1 ai,j+1 · · · ain ai1 a · · · i2 _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ a i+1,1 ai+1,2 · · · ai+1,j−1 0 ai+1,j+1 · · · ai+1,n . .. .. .. .. .. .. .. .. . . . . . . . a a ··· a a _ _ _· · ·_ _ann_ _ n1 _ _ _n2 _ _ _ n,j−1 _ _ 0 _ n,j+1
Dopo i − 1 scambi di righe (e ogni volta si moltiplica per (−1)) e j − 1 scambi di colonne (e ogni volta si moltiplica per (−1)), si arriva alla forma * ··· * 1 _ _ _ _ _ 0 a11 · · · a1n . . . , . . . . . .. . . a · · · a 0 _ n1_ _ _ nn_
il cui valore di F per l’Esercizio 55 (con a11 = 1) è uguale al determinante, moltiplicato per (−1)i−1 (−1) j−1 = (−1)i+j−2 = (−1)i+j . 57 (a) a · b = a1 b¯ 1 + a2 b¯ 2 = i + 1; (b) a · b = 1 − i; (c) 1 − i + 2 + i = 3; (d) 2i. 58 Per ①, ricordando le proprietà formali di un prodotto scalare hermitiano (pagina 211) si ha ka + bk2 = (a + b) · (a + b) = a · a + a · b
+ b · a + b · b = kak2 + kbk2 + a · b + a · b.
Segue che
ka + bk2 − ka − bk2 = kak2 + kbk2 + a · b + a · b − kak2 − kbk2 + a · b + a · b = 2(a · b + a · b)
609
e anche ka + bk2 + ka − bk2 = kak2 + kbk2 + a · b + a · b
+ kak2 + kbk2 − a · b − a · b = 2kak2 + 2kbk2 .
Per l’ultima, se z è un numero complesso z ∈ C, si ha z + z ∈ R, e quindi a · b + b · a = a · b + a · b ∈ R ⊂ C. 59 Scriviamo a = x + iy e b = u + iv, dove x, y, u e v sono vettori di Rn . Allora a · b = (x + iy) · (u + iv) = x · u + y · v + i(−x · v + y · u)
e quindi
a · b + b · a = x · u + y · v + i(−x · v + y · u)
+ u · x + v · y + i(−u · y + v · x) = 2(u · x + v · y).
Ma anche, kak2 = kxk2 + kyk2 , kbk2 = kuk2 + kvk2 . Allora se consideriamo i due vettori X e Y di dimensione 2n con componenti x1 , x2 , . . . , xn , y1 , y2 , . . . , yn e u1 , u2 , . . . , un , v1 , v2 , . . . , vn , si ha a·b+b·a kak2 = kXk2 , kbk2 = kYk2 , = X · Y, 2 e quindi la tesi segue dalla disuguaglianza di Cauchy– Schwarz. 60 La matrice P1 ha autovalori 1 e −1, cui corrispondono gli autovettori x1 = (1, 1) e x−1 = (−1, 1). Anche P2 ha autovalori 1 e −1, con autovettori x1 = (−i, 1) e x−1 = (i, 1). Così come P3 , i cui autovalori sono sempre 1 e −1, con autovettori x1 = (1, 0) e x−1 = (0, 1).
❊❊❊ Tra le moltitudini di linguaggi adatti a fare qualche esempio di algoritmi per l’algebra lineare, abbiamo scelto il python,(23) come per i pochi esempi del primo volume. Qui sotto c’è una possibile classe per rappresentare le matrici, e rendere il codice nelle soluzioni degli esercizi sufficientemente leggibile. Non si tratta assolutamente di programmi scritti bene, ma solo di esempi che abbiamo ritenuto di qualche valore didascalico. Soluzioni degne e analoghe possono essere prodotte in qualsiasi altro linguaggio di programmazione non troppo limitato. class Matrice: def __init__(self,data,uno=1.0): """Inizializzazione di una matrice, in cui le righe vengono completate da zeri se necessario. Il parametro opzionale uno=1.0 oppure uno=1 è per avere interi, oppure float, oppure... Esempio: Matrice([[1,2],[1]]) """ if type(data) != type([]): data=[[data]] self.ismatrix=True self.data=data self.uno=uno self.num_righe=len(data) self.num_colonne=max([len(r) for r in data]) for d in self.data: if len(d) < self.num_colonne: d += ([0] * (self.num_colonne-len(d)))
610
Soluzioni degli esercizi – Capitolo IV
] for i in range(self.num_righe) ]) def __repr__(self): res="[\n"+("\n".join([str(riga) for riga in self.data]))+"\n]" return str(res) def __str__(self): return self.__repr__() def __getitem__(self,key): "per avere A[i,j]" return self.data[key[0]][key[1]] def __setitem__(self,key,value): "quando A[i,j] = 2" self.data[key[0]][key[1]]=value def colonna(self,j): return [ self[i,j] for i in range(self.num_righe) ] def riga(self,i): return [ self[i,j] for j in range(self.num_colonne) ] def sottomatrice(self,ii,jj): """sottomatrice (ii,jj)-esimo""" return Matrice ( [ [ self.data[i][j] for j in range(self.num_colonne) if j != jj ] for i in range(self.num_righe) if i != ii ]) def __or__(self,other): """ A|B : matrice a blocchi aumentata """ if self.num_righe != other.num_righe: raise Exception ("numero righe non coincide") return Matrice ( [self.data[i] + other.data[i] for i in range(self.num_righe)]) def __div__(self,other): """ A/B: matrice a blocchi uno sopra l’altro""" if self.num_colonne != other.num_colonne: raise Exception("numero di colonne non coincide") return Matrice (self.data + other.data) def t(self): """trasposta""" return Matrice ( [ [ self.data[i][j] for i in range(self.num_righe) ] for j in range(self.num_colonne) ]) def __add__(self,other): return Matrice ( [ [ (self.data[i][j] + other.data[i][j]) for j in range (self.num_colonne) ] for i in range(self.num_righe) ]) def __sub__(self,other): """A-B""" return Matrice ([ [ (self.data[i][j] - other.data[i][j]) for j in range (self.num_colonne) ] for i in range(self.num_righe) ]) def __mul__(self,other): """ self * other : prodotto di matrici, righe per colonne """ return Matrice ( [ [ sum ([self.data[i][k] * other.data[k][j] for k in range(self.num_colonne) ]) for j in range(other.num_colonne) ] for i in range(self.num_righe) ]) def __rmul__(self,other): """numero * matrice """ return Matrice( [ [ self.data[i][j] * other for j in range(self.num_colonne) ] for i in range(self.num_righe) ]) def __neg__(self): """- matrice """ return Matrice( [ [ - self.data[i][j] for j in range(self.num_colonne)
def inversa(self): """inversa""" if self.num_colonne==1: return self.uno / self[1,1] else: return self.uno/det(self) * \ trasposta( Matrice( [ [(-1)**(i+j) * det(self.sottomatrice(i,j)) for j in range(self.num_colonne) ] for i in range(self.num_righe) ] ))
def __pow__(self,other): """ A ** n potenza. """ result= MatriceIdentica(self.num_righe) if other >= 0: for i in range(other): result = self * result return result else: invself=self.inversa() for i in range(-other): result = invself * result return result def __xor__(self,other): """ A ^ n : potenza (sinonimo di A^n ) """ print "attenzione alle precedenze su ^!" return self.__pow__(other)
def MatriceIdentica(n): x=MatriceNulla(n,n) for i in range(x.num_colonne): x.data[i][i] = 1 return x def MatriceNulla(n,m): return Matrice([[0 for j in range(m)] for i in range(n)]) def MatriceDiagonale(l): le=len(l) x=MatriceNulla(le,le) for i in range(le): x.data[i][i] = l[i] return x def trasposta(m): return m.t() def det(x): """determinante di x""" if x.num_colonne!=x.num_righe: raise Exception("Matrice non quadrata") if x.num_colonne==1: return x.data[0][0] return sum ([(-1)**i * x.data[0][i]*det(x.sottomatrice(0,i)) for i in range(x.num_colonne) ]) def Estendi(m): return ( Matrice([ [1] ]) | MatriceNulla(1,m.num_colonne) ) / ( MatriceNulla(m.num_righe,1) | m )
61 from matrice import * def MatricePermutazione( nupla ): n=len(nupla) m=MatriceNulla(n,n) m.uno=1 for i in range(n): m[i,nupla[i]] = 1 return m
62 La funzione che riportiamo è ricorsiva, così come il tipo di eliminazione di Gauss che abbiamo introdotto: from matrice import *
Soluzioni degli esercizi – Capitolo IV
611
from permutazione import * # def Estendi(m): # return ( Matrice([ [1] ]) | MatriceNulla(1,m.num_colonne) # ) / ( MatriceNulla(m.num_righe,1) | m ) def LUdec(m): n=m.num_righe if n==1: return MatriceIdentica(1), MatriceIdentica(1), m else: slice_prima_colonna=[x**2 for x in m.colonna(0)[1:] ] max_entry=max(slice_prima_colonna) if max_entry >0: posizione_pivot=slice_prima_colonna.index(max_entry )+1 perm=range(n) perm[0]=posizione_pivot perm[posizione_pivot]=0 P=MatricePermutazione(perm) Pm = P * m pivot=Pm[0,0] L=MatriceIdentica(n) for i in range(1,n): L[i,0] = Pm[i,0] * m.uno / pivot else: L=MatriceIdentica(n) P=MatricePermutazione(range(n)) Pm = m U = L**(-1) * Pm AA=U.sottomatrice(0,0) PP,LL,UU = LUdec(AA) PP= Estendi(PP) LL= Estendi(LL) U= Matrice( [Pm.riga(0)]) / ( MatriceNulla(n-1,1) | UU ) P=PP * P L=PP * L * (PP **(-1) ) * LL return P,L,U
63 Abbiamo implementato le formule di pagina 183, come indicato nella nota a margine. Per prima cosa ci serve una piccola classe per le operazioni sui vettori (vettore.py). from math import sqrt class Vettore: def __init__(self,data): if type(data) != type([]): data=[[data]] self.isvector=True self.data=data self.dim=len(data) def __getitem__(self,key): return self.data[key] def __setitem__(self,key,value): self.data[key]=value def __repr__(self): return str(self) def __str__(self): return str(self.data) def __add__(self,other): return Vettore([ (self.data[i] + for i in range(self.dim) ]) def __sub__(self,other): return Vettore([ (self.data[i] for i in range(self.dim) ]) def __rmul__(self,other): return Vettore([ (self.data[i] * for i in range(self.dim) ]) def __neg__(self): return Vettore([(- self.data[i]) def __len__(self): return self.dim
other.data[i])
other.data[i])
other)
for i in range(self.dim)] )
def dotprod(u,v): return sum ( [ u[i] * v[i] for i in range(u.dim) ])
def norma(u): return sqrt(dotprod(u,u)) def normalizzato(u): n=norma(u) return (1.0 / n ) * u
Ed ecco l’ortogonalizzazione di Gram–Schmidt e la decomposizione QR. from vettore import * from matrice import * def GramSchmidt(kupla): n=kupla[0].dim q=[ normalizzato( kupla[0] ) ] R=MatriceIdentica(len(kupla) ) R[0,0]=norma(kupla[0]) for i in range(1,len(kupla)): u = kupla[i] for j in range(i): u = u - dotprod( kupla[i], q[j]) * q[j] q += [ normalizzato (u) ] R[i,i]= norma(u) for i in range(len(kupla) ): for j in range(i+1,len(kupla)): R[i,j] = dotprod(kupla[j],q[i]) return q,R def QRdec(A): Qs,R=GramSchmidt([ Vettore(A.colonna(i)) for i in range(A.num_colonne) ] ) return Matrice([Qs[i].data \ for i in range(len(Qs)) ]).t(), R
\
64 Una possibile implementazione è la seguente (attenzione alla nota (IV.73): se gli elementi sulla diagonale sono nulli l’algoritmo non funziona). from matrice import * def tBAB(A): n=A.num_righe if n==1: return Matrice([[1]]) B= MatriceIdentica(n) for j in range(1,n): B[0,j] = -A[0,j] * A.uno / A[0,0] Ahat=(B.t() * A * B ).sottomatrice(0,0) Bhat = tBAB( Ahat ) return B * Estendi(Bhat)
65 La matrice tBB è definita positiva perché txtBBx non è altro che la norma al quadrato kBxk2 , che è > 0 se e solo se x , 0. Sia P la matrice unitriangolare superiore tale che D = tPAP è diagonale. La matrice D ha coefficienti tutti positivi sulla √ √diagonale, e quindi esiste una matrice √ D tale che D D = D (basta prendere le radici quadrate degli elementi sulla diagonale di D). Ma allora se √ si pone U = DP−1 si ha √ √ t√ √ A = tP−1 DP−1 = tP−1 D DP−1 = tP−1 D DP−1 = tUU. Dato che P è unitriangolare superiore, anche P−1 lo è. Un piccolo programmino che esegue questi semplici calcoli è il seguente. from matrice import * from lagrange import * from math import sqrt
612
Soluzioni degli esercizi – Capitolo V
def cholesky(A): n=A.num_righe P=tBAB(A) D=P.t() * A * P for i in range(n): D[i,i] = sqrt(D[i,i]) return (D * (P^(-1)))
66 Sia A = QR la decomposizione QR. Allora se poniamo y = Rx, si ha Ax = Qy ePla formula (8) del Teorema (IV.45) dice che projW b = ni=1 (b · qi )qi , dove i qi sono le colonne di Q, e dunque yi = b · qi per ogni i. In forma matriciale si scrive y = tQb =⇒ x = R−1 tQb. Ecco la brevissima implementazione. from matrice import * from QRdec import * def minimi_quadrati(A,b): """A Matrice, b n-upla """ Q,R=QRdec(A) return (R^(-1)) * Q.t() * Matrice([b]).t()
Capitolo V 1 (a) r(t) = t i + (t2 − 2t) j, t ∈√[0, 2]. (b) r(t)√= (et − t) i + t j, t ∈ [0, 1]. (c) Posto x = 5 cos t e y = 5 sin t, √ da √ y ≥ x si ottiene sin t ≥ cos t, perciò r(t) = 5 cos t i + 5 sin t j, t ∈ [π/4, 5π/4]. (d) r(t) = (cos t)/3 i+(sin t)/2 j, t ∈ [π/2, 3π/2]. (e) r(t) = 2(cos t + 1) i + sin t j, t ∈ [0, 2π]. (f) r(t) =√ 2(cos t + 1) i + sin t j, t ∈ [π, 2π],√ oppure r(t) = t√ i − √4t − t2 /2 j, t ∈ [0, 4]. (g) r(t) = t i + t2 + 1 j, t ∈ [− 3, 3], oppure (usando le√funzioni iperboliche) √ r(t) = sinh t i + cosh t j, t ∈ [ln(2 − 3), ln(2 + 3)]. 2 (a) Da x = r cos ϑ, y = r sin ϑ otteniamo ϑ = arctan 2. (b) r = sin ϑ/ cos2 ϑ, con 0 < ϑ < π (la condizione si ottiene ponendo r ≥ 0). (c) r = 5/(sin ϑ − cos ϑ), con π/4 < ϑ < 5π/4. (d) r = 2 cos ϑ, con −π/2 ≤ ϑ ≤ π/2. (e) r = 2 sin ϑ, con 0 ≤ ϑ ≤ π. (f) r = 2(cos ϑ + sin ϑ), con −π/4 ≤ ϑ ≤ 3π/4.
3 (a) Moltiplicando per r si ottiene r2 − 2ar cos ϑ = 0 cioè x2 + y2 − 2ax = 0. (b) Moltiplicando per r2 si otp tiene r3 = r2 cos2 ϑ − r2 sin2 ϑ cioè (x2 + y2 )3 = x2 − y2 . (c) Moltiplicando per r si ottiene r2 − r sin ϑ = r cioè p x2 + y2 − y = x2 + y2 .
4 Facendo il denominatore comune si ottiene r = p 1 + εr sin ϑ, cioè x2 + y2 = 1 + εy. Se ε = 0 si tratta della circonferenza di centro l’origine e raggio 1. Se ε , 0, dopo aver posto y ≥ −(1/ε) si può elevare al quadrato ottenendo x2 + (1 − ε2 )y2 − 2εy − 1 = 0,
che risulta essere un’ellisse per 0 < ε < 1, una parabola per ε = 1 ed una iperbole per ε > 1.
5 (a) r(t) = (1 − t2 ) i + t j + (1 − t2 ) k, t ∈ [−1, 1]. (b) r(t) = cos t i + sin t j + 2 cos t k, t ∈ [0, 2π]. (c) Si ottiene 2x = x2 + y2 , perciò (x, y) si muove sulla circonferenza di centro (1, 0) e raggio 1, parametrizzata da (1 + cos t, sin t). Perciò r(t) = (1 + cos t) i + sin t j + 2(1 + cos t) k, t ∈ [0, 2π]. (d) Si ottiene 2x2 + √ z2 = 1, ellisse nel piano xz parametrizzata √ da (cos t, 2 sin t). Perciò r(t) = cos t i − cos t j + 2 sin t k, t ∈ [−π/2, π/2]. (e) Posti x = p1 + cos t e y = sin t si ricava z = √ 2 − 2 cos t = 2 (1 − cos t)/2 = 2 sin(t/2), perciò r(t) = (1 + cos t) i + sin t j + 2 sin(t/2) k, t ∈ [0, 2π]. (f) Sottraendo si ottiene y2 − z2 = 0, cioè z = ±y. Si tratta quindi di due curve: r1 (t) = cos t i + sin t j + sin t k, t ∈ [0, 2π] e r2 (t) = cos t i + sin t j − sin t k, t ∈ [0, 2π]. (g) Dall’esercizio precedente otteniamo r(t) = cos t i + sin t j + | sin t| k, t ∈ [0, 2π]. 7 (a) Si ha r′ (t) = et i + j + cos t k, da cui r′ (0) = i + j + k , 0 perciò la parametrizzazione è regolare (è banalmente di classe C1 ). Poiché inoltre r(0) = i, la retta tangente ha equazione parametrica p(t) = (1+t) i+t j+t k. (b) p(t) = (π + 2t) i + (3 + 4t) j + t k. (c) p(t) = (2 + t/4) i + (−3 + 3t) j + k. (d) p(t) = −t i + j + (π + 2t) k. 8 Indichiamo con x, y, z ed u le coordinate di R4 (rispetto alla base canonica). Gli iper4 npiani tridimensionali di R sono oinsiemi del tipo 4 (x, y, z, u) ∈ R : ax + by + cz + du = f , dove a, b, c, d ed f sono costanti, le prime quattro non tutte nulle. Quindi la curva data è tridimensionale se possiamo trovare a, b, c e d, non tutti nulli, tali che a cos t + b sin t + c cos 2t + d sin 2t = f per ogni t. Questo non è possibile (basta dare a t 5 valori diversi e vedere che il sistema non ha soluzione, oppure ricordare che si tratta di quattro funzioni ortogonali nello spazio delle funzioni continue, Esempio (IV.50) a pagi′ na 185). Abbiamo √ r (t) = (− sin t, cos t, −2 sin 2t, 2 cos 2t), perciò kr′ (t)k = 5 e la lunghezza è data da Z 2π √ √ 5 dt = 2π 5. 0
9 Dalla disuguaglianza triangolare in R3 applicata alle somme di Riemann otteniamo
n n
X
X ∗
(ti+1 − ti )r(ξi )
≤ (ti+1 − ti )kr(ξ∗i )k.
i=0
i=0
Se r e krk sono continui possiamo passare al limite nelle somme di Riemann ottenendo la prima disuguaglianza richiesta. Se ora applichiamo la disuguaglianza appena dimostrata ad r′ (t), dove r(t), t ∈ [a, b], è una
Soluzioni degli esercizi – Capitolo V
613
R1 √ parametrizzazione regolare di γ, abbiamo ta dalla formula 0 1 + e2x dx. col cambio di variabi
Z b
Z b R √1+e2 2 √ s
1 + e2x si trova √2 le s = ds, come nel pun′ ′ s2 −1 r (t) dt ≤ kr(b)−r(a)k = kr (t)k dt = Lunghezza(γ),
a i √1+e2 h a to (b). La lunghezza è s + 12 ln(s − 1) − 12 ln(1 + s) √ . 2 che è la seconda disuguaglianza richiesta. (e) La lunghezza si ottiene con la formula vista nelR √ 2 10 (a) Siano γ1 e γ2 due curve di estremi A e B, B e l’Esercizio svolto (V.5), ed è pari a 0 ϑ4 + 4ϑ2 dϑ = C rispettivamente, e γ la loro giustapposizione. La lun- R 2 √ R2 √ √ ϑ ϑ2 + 4 dϑ = 163 2 − 38 . (f) 0 e2ϑ + e2ϑ dϑ = ghezza di ciascuna curva è definita come l’estremo supe0 R 4π √ √ riore delle lunghezze delle spezzate inscritte. Da un lato, 2(e2 − 1). (g) π sin2 ϑ + cos2 ϑ dϑ = 3π. la giustapposizione di due spezzate inscritte in γ1 e γ2 è q Rt una spezzata inscritta in γ, perciò 5 + 4 sin2 y + 4 cos2 ydy = 3t, e la para12 (a) s = Lunghezza(γ) ≥ Lunghezza(γ1 ) + Lunghezza(γ2 ).
D’altra parte sia σ una spezzata inscritta in γ. Questa non contiene necessariamente il punto B, ma possiamo considerare la spezzata che contiene tutti i punti di σ e il punto B; quest’ultima è la giustapposizione di due spezzate inscritte in γ1 e γ2 che, per la disuguaglianza triangolare in R3 , hanno lunghezza totale maggiore o uguale a σ. Ne segue che Lunghezza(γ) ≤ Lunghezza(γ1 ) + Lunghezza(γ2 ).
(b) Siano r(t) : [a, b] → R3 , una parametrizzazione regolare di γ, f : [c, d] → [a, b] una funzione biunivoca e continua di classe C1 (quindi f ′ è sempre positiva oppure sempre negativa, si veda il commento alla Definizione (V.5), pagina 229), ed infine r˜(τ) = r( f (τ)) : [c, d] → R3 la nuova parametrizzazione di γ. Abbiamo Z d Z d k˜r′ (τ)k dτ = kr′ ( f (τ))k| f ′ (τ)| dτ c
c
Z
d
= segno ( f ′ (τ)) c
Z = segno ( f ′ (τ))
kr′ ( f (τ))k f ′ (τ) dτ f −1 (d)
f −1 (c)
kr′ (t)k dt.
Se f è crescente, allora segno ( f ′ (τ)) = 1, f (c) = a, f (d) = b ed otteniamo la formula desiderata. Se invece f è decrescente, allora segno ( f ′ (τ)) = −1, f (c) = d, f (d) = a e per ottenere la formula desiderata basta scambiare gli estremi di integrazione. √ √ 11 (a) r′ (t) = (et , −e−t , 2),kr′ (t)k = 2 + e2t + e−2t = R1 et + e−t . La lunghezza è 0 (et + e−t ) dt = e − e−1 . √ 2 + 1/t2 , la lun(b) r′ (t) = (1, 1t , 1) e kr′ (t)k = R2 √ 1 ghezza è 1 t 2t2 + 1 dt. L’integrale si calcola ponendo R3 R3 2 √ 1 1 − 2(s+1) )ds 2t2 + 1 = s e diventa √3 s2s−1 ds = √3 (1 + 2(s−1) √ 1 s−1 3 1 La lunghezza è quindi [s + 2 ln s+1 ] √ = 2 ln(1 + 3) − 3 √ √ 3 − 12 ln(−1 + 3) − 12 ln(2) + 3. (c) Risulta kr′ (t)k = 1 R 8π e la lunghezza è 0 dt = 8π. (d) La lunghezza è da-
0
√
metrizzazione secondo s è r(t) = 35 s i+2 cos 3s j+2 sin 3s k. Rt √ (b) s = 0 1 + 16 + 8dy = 5t dunque t = s/5 e la nuova √ parametrizzazione è r(s) = (1 + 5s ) i + (3 − 4s5 ) j + 8 5s k. Rt √ √ √ (c) s = 0 2e2y dy = 2(et −1), da cui t = ln(1+s/ 2). La √ √ parametrizzazione è r(s) = (1 + s √2) cos(ln(1 + s 2)) i + √ √ √ √ 2 (1 + s 2) sin(ln(1 + s 2)) j + 22 (1 + s 2) sin(ln(1 + 2 Rt √ s 2)) k. (d) s = 0 (ey + e−y )dy = et − e−t . Invertendo la √ funzione si trova t = ln 21 (s+ s2 + 4). La parametrizzazio√ ne secondo l’ascissa curvilinea è r(s) = 21 (s + s2 + 4) i + √ √ √2 j + 2 ln 12 (s + s2 + 4) k. 2 s+ s +4
13 Dato che la curva è piana, esiste un vettore (costante e non nullo) n = (a, b, c) ed un numero d tali che ¯ + b y(s) ¯ + c¯z(s) = d, cioè r¯(s) · n = d. Derivando otax(s) teniamo T(s) · n = 0, e derivando di nuovo T ′ (s) · n = 0. Ora, i vettori normale e binormale sono definiti se e solo se T ′ (s) , 0 per ogni s, e in tal caso N è parallelo a T ′ . Ne segue che n è perpendicolare sia a T che a N, perciò il versore binormale è parallelo a n ed il piano osculatore è perpendicolare a n. Infine, B′ (s) = 0 e la torsione è nulla. 14 Cominciamo supponendo che r sia parametrizzata secondo l’ascissa curvilinea s. Si ha allora T(s) = r′ (s) e N(s) = r′′ (s)/kr′′ (s)k. Essendo B = T × N si ha B′ = T ′ × N + T × N ′ : sfruttiamo la formula data con f = r′ per valutare N ′ : ′′′ dB r′′ r′′ · r′′′ ′′ r . = r′′ × ′′ + r′ × − r ds kr k kr′′ k kr′′ k3 Possiamo ora calcolare la curvatura come τ = − dB · ds r′′ (s)/kr′′ (s)k: si ha (r′ × r′′′ ) · r′′ (r′ × r′′ ) · r′′′ τ=− = . kr′′ k2 kr′′ k2 Ora consideriamo il caso di parametrizzazione generale r(t). Si ha allora B = (r′ × r′′ )/kr′ × r′′ k, che deriviamo sfruttando la formula data: (r′ × r′′′ ) [(r′ × r′′ ) · (r′ × r′′′ )] ′ − (r × r′′ ). B′ = ′ kr × r′′ k kr′ × r′′ k3
614
Soluzioni degli esercizi – Capitolo V
calcoliamo anche N: r′ × r′′ kr′ k (r′′ − ). N= ′ ′′ kr × r k kr′ k2 Possiamo ora ricavare τ grazie alla formula di derivazione delle funzioni composte: dB(s(t)) (r′ (t) × r′′ (t)) · r′′′ (t) −1 τ=− ·N(s(t)) = ′ B′ ·N = . ds s (t) kr′ (t) × r′′ (t)k2 15 (a) Risulta r′ (t) = 2 i + 2t j + 1t k, r′′ (t) = 2 j − t12 k, r′ (2) = 2 i + 4 j + 21 k, r′′ (2) = 2 j − 14 k e kr′ (2)k = 92 . Abbiamo allora T(2) = r′ (2)/kr′ (2)k = 49 i + 89 j + 91 k. Per calcolare B(2) possiamo usare la formula: B(2) = r′ (2) × r′′ (2)/kr′ (2) × r′′ (2)k. Calcoliamo r′ (2) × r′′ (2)= k i j 1 2 4 1/2 det = −2 i + j + 4 k 2 0 2 −1/4 con kr′ (2) × r′′ (2)k = 9/2 Troviamo B(2) = − 94 i + 91 j + 89 k; le formule per la curvatura viste nell’Esercizio (V.9) e la torsione vista in 14 danno infine κ(2) = kr′ (2) × r′′ (2)k/kr′ (2)k3 = 4/81,
τ(2) = [(r′ (2) × r′′ (2)) · r′′′ (2)]/kr′ (2) × r′′ (2)k2 . Dobbiamo ancora calcolare r′′′ (t) = −2t−3 k da cui r′′′ (2) = − 41 k e il numeratore è uguale a −1. Si ha allora τ(2) = −4/81. (b) Una parametrizzazione √ è r(t) = 1 + 9x4 e x i + x3 j, con r′ (t) = i + 3x2 j, kr′ (t)k = r′′ (x) = 6x j. Inoltre r′ (x) × r′′ (x) vale j k i 1 3x2 0 det = 6x k. 0 6x 0 T(1) = r′ (1)/kr′ (1)k = √110 ( i + 3 j), B(1) = r′ (1) × r′′ (1)/kr′ (1) × r′′ (1)k = k, N(1) = B(1) × T(1) = j k i 3 1 0 1 = − √ i + √ j. det 0 √1 10 10 √3 x 0 10 10 κ(1) = kr′ (1) × r′′ (1)k/kr′ (1)k3 = 6/(10)3/2 e infine τ(1) = τ(x) = 0 per ogni x, in accordo con l’Esercizio 13 . 16 (a) r′ (t) = (cos t, − sin t, cos t) e r′′ (t) = (− sin t, − cos t, − sin t) da cui r′ (π) = (−1, 0, −1), r′′ (π) = (0, 1, 0). Risulta r′ (π) × r′′ (π) = i − k. Il piano osculatore è il piano passante per r(π) = (0, −1, 0), che ha per vettore normale B(π). Poiché B = r′ ×r′′ /kr′ ×r′′ k, l’equazione del piano osculatore è (x − 0) · 1 + (y + 1) · 0 + (z − 0) · (−1) = 0, cioè z = x. Il piano normale invece ha per vettore normale T(1) dunque basta conoscere r′ (π): (x − 0) · (−1) + (y + 1) · 0 + (z − 0) · (−1) = 0, cioè z = −x. (b) r′ (t) = (3t2 , 3, 4t3 ), r′′ (t) = (6t, 0, 12t2 ) da cui r′ (1) = (3, 3, 4), r′′ (1) = (6, 0, 12),
r(1) = (1, 3, 1), e r′ (1) × r′′ (1) = (36, −12, −18) Per scrivere l’equazione del piano osculatore scegliamo per comodità un altro vettore parallelo a B, (6, −2, −3) e troviamo (x − 1) · 6 + (y − 3) · (−2) + (z − 1) · (−3) = 0. Il piano normale è (x − 1) · 3 + (y − 3) · 3 + (z − 1) · 4 = 0.
17 Dalla discussione a margine dell’Esercizio (V.9), pagina 264, aT (t) = v′ dove v è la velocità scalare v = kr′ (t)k. Basta allora derivare la norma di r′ per avere il risultato. D’altra parte aC (t) = κv2 dove κ è la curvatura: basta allora ricordare la sua espressione trovata nell’esercizio citato. 18 r′ (t) = 2t i + 3t2 j + k, r′′ (t) = 2 i + 6t j, e kr′ (t)k = √ 4t2 + 9t4 + 1. Applicando le formule viste nell’esercizio precedente si ha r′ (t) · r′′ (t) 4t + 18t2 = √ . ′ kr (t)k 4t2 + 9t4 + 1 Inoltre r′ × r′′ = −6t i + 2 j + 6t2 k la cui norma è √ 2 4 √36t + 4 + 36t . √L’accelerazione centripeta è aC (t) = 2 36t + 4 + 36t4 / 4t2 + 9t4 + 1. Rb 19 (a) Integrando per parti si ha a x(t)y′ (t) dt = Rb x(t)y(t)|ba − a x′ (t)y(t) dt, e la prima parte della tesi segue dal fatto che x(a) = x(b), y(a) = y(b) (la curva è chiusa). Per l’indipendenza dalla parametrizzazione si procede come nella soluzione della seconda parte dell’Esercizio 10 (l’unica differenza è che non compare il segno di f ′ , perciò se si cambia verso di percorrenza l’integrale cambia segno). (b) È sufficiente svolgere i quadrati nelle funzioni integrande e semplificare. aT (t) =
20 Dato che non conosciamo il verso di percorrenza Rb Rπ vale Area = | a x(t)y′ (t) dt| = | −π u · v cos2 t dt = π|u · v|. 21
Scriviamo l’area come nell’Esercizio 19 Z π Z 1 π [x(t) + y′ (t)]2 dt − [x(t) − y′ (t)]2 dt . A = 4 −π
−π
Derivando la serie di Fourier di y(t) termine a termine (questo è possibile non appena γ è di classe C2 a tratti, si vedano i Teoremi (II.46) e (II.48)) otteniamo ∞ X (−ncn sin nt + ndn cos nt) . y′ (t) = n=1
Possiamo perciò scrivere ∞ X x(t)+ y′ (t) = a0 + [(an + ndn ) cos nt + (bn − ncn ) sin nt] n=1
da cui, utilizzando l’uguaglianza di Parseval, otteniamo Z π ∞ X 1 [x(t)+ y′ (t)]2 dt = 2a20 + (an +ndn )2 +(bn −ncn )2 . π −π n=1
Soluzioni degli esercizi – Capitolo V
615
Analogamente Z π ∞ X 1 [x(t)− y′ (t)]2 dt = 2a20 + (an −ndn )2 +(bn +ncn )2 . π −π n=1
Notiamo che, per la disuguaglianza triangolare, ∞ ∞ X πX 2 n(an + b2n + c2n + d2n ), A≤π n |an dn − bn cn | ≤ 2 n=1 n=1
Sottraendo le due equazioni a primo membro otteniamo, a meno del segno, 4A/π mentre il secondo membro è ∞ h X i (an + ndn )2 − (an − ndn )2 + (bn − ncn )2 − (bn + ncn )2 .
valendo l’uguaglianza soltanto quando an = ±dn e bn = ∓cn ; quindi ∞ X L2 − 2A ≥ π n(n − 1) a2n + b2n + c2n + d2n ≥ 0. 2π n=1
Tenendo conto che A2 − B2 = (A + B)(A − B) si ricava facilmente la tesi.
Per avere uguaglianza a zero, occorre che, per ogni intero, si abbia an = ±dn e bn = ±cn ; inoltre anche la quantità n(n − 1)(a2n + b2n + c2n + d2n ) deve annullarsi per ogni intero. L2 − 2A = 0 se e solo se a1 = ±d1 , In definitiva si ha 2π b1 = ∓c1 , con 2|a1 d1 − b1 c1 | = a21 + b21 + c21 + d21 , e, per ogni intero n ≥ 2, an = bn = cn = dn = 0. Dunque ( x(u) = a0 + a1 cos u ∓ c1 sin u y(u) = c0 + c1 cos u ± a1 sin u
n=1
22
Sappiamo che la lunghezza della curva è: Z πq (x′ )2 + y′ 2 dt L= −π
Perciò possiamo calcolare il modulo della velocità in funzione della lunghezza: q 2 L kr′ k = (x′ )2 + y′ = . 2π Quindi abbiamo Z π L2 ((x′ )2 + (y′ )2 ) dt. = 2π −π
Derivando termine a termine la serie di Fourier e utilizzando l’uguaglianza di Parseval possiamo esprimere l’integrale qui sopra come serie, come già fatto nello svolgimento dell’Esercizio 21 . In questo modo si ottiene la seconda parte dell’uguaglianza desiderata. 23 Mostriamo innanzitutto come si può scegliere una siffatta parametrizzazione della curva di velocità costante in modulo. Consideriamo l’ascissa curvilinea Z t q s(t) = (x′ (u))2 + (y′ (u))2 du,
u ∈ [−π, π]. Perciò la curva è una circonferenza con q 2 centro in (a0 , c0 ) e raggio a1 + c21 .
24 L’argomento della radice deve essere ≥ 0; inoltre il denominatore deve essere , 0. In totale bisogna richiedere cos2 y − 1 ≥ 0 y − x2 + 2π > 0 La prima disequazione è verificata solo se cos2 y − 1 = 0, cioè per cos y = 1 oppure cos y = −1: dunque per y = kπ al variare di k ∈ Z. La seconda invece è soddisfatta per i punti sopra la parabola di equazione y = x2 − 2π. Il dominio è rappresentato in Figura 3.
−π
di modo che L = s(π). Definiamo la nuova variabile 2πs(t) . Se riparametrizziamo la curva utilizu = −π + L zando u di modo che r˜(u) = r(t(u)),di nuovo r˜ sarà una funzione periodica di periodo 2π la cui velocità è costante in modulo e vale L2 (x˜′ )2 + y˜ ′ 2 = . 4π2 Dagli Esercizi 21 e 22 sappiamo allora che ∞ X A = π n [an dn − bn cn ] n=1 e ∞ X L2 =π n2 a2n + b2n + c2n + d2n . 2π n=1
F 3 25 (a) D = {(x, y) : x2 + y2 ≤ 1}: i punti del cerchio di raggio 1 centrato in (0, 0), bordo compreso. (b) D = {(x, y) : y > −x}: i punti del semipiano superiore generato dalla retta y = −x (esclusa). (c) D = {(x, y) : x2 ≤ 1, y2 ≤ 1}: i punti del quadrato che ha
616
per vertici (1, 1), (1, −1) (−1, −1) e (−1, 1), lati compresi. (d) D = R2 . (e) D = R2 . (f) D = {(x, y) : x , 1, y , 0}: tutti i punti del piano, tranne l’asse x e la retta x = 1. (g) D = {(x, y) : kπ ≤ x2 + y2 ≤ 2kπ}: i punti di tutte le corone circolari di centro l’origine circonferenza inter√ √ na di raggio kπ e esterna di raggio 2kπ, al variare di k. (h) D = {(x, y) : xy > 0}: i punti del primo e terzo quadrante, assi esclusi. (i) D = {(x, y) : y ≤ 5 − 2x2 }: i punti che si trovano sotto alla parabola y = 5 − 2x2 . √ x}: i punti del pri(j) D = {(x, y) : x ≥ 0, y > √ mo quadrante che si trovano sopra alla curva y = x (esclusa). 26 Per la prima funzione, fissato k ∈ R dobbiamo disegnare l’insieme delle soluzioni dell’equazione 1 + x − y = k ⇐⇒ y = x + (1 − k). Si tratta di un fascio di rette parallele alla retta y = x, che rappresenta l’insieme di livello k = 1. L’insieme di livello Ek è dunque la retta che interseca l’asse y nel punto (0, 1 − k): questo è a quota negativa se k > 1 e diminuisce al crescere di k„ mentre è a quota positiva k < 1, e cresce al diminuire di k. Per la seconda, fissato k ∈ R dobbiamo disegnare l’insieme delle soluzioni dell’equazione x2 − y2 = k. Per k = 0 l’equazione diventa (x − y)(x + y) = 0, e descrive l’insieme formato dalle due rette y = ±x. Per k , 0 riconosciamo l’equazione dell’iperbole equilatera che ha per asintoti le rette y = ±x; se k > 0 l’iperbole interseca l’asse x nei pun√ √ ti (− k, 0) e ( k, 0); se invece k < 0 l’iperbole si trova nel cono verticale formato dagli asintoti e interseca l’asse y √ √ nei punti (0, k) e (0, − k). 27 (a) Gli insiemi di livello sono il fascio di rette parallele a y = −x/2. (b) L’insieme di livello 0 è formato dagli assi, l’ insieme di livello k con k > 0 è l’iperbole equilatera di equazione xy = k2 . (c) L’insieme di livello 0 è la retta y = −x − 1 l’ insieme di livello k con k > 0 √ è formato dalle√due rette parallele y = −x − 1 − k e y = −x − 1 + k. (d) L’insieme di livello 0 è l’asse x (privato dell’origine); per k > 0 è la parabola con concavità verso l’alto y = kx2 privata del vertice, per k < 0 è la parabola y = kx2 con concavità verso il basso, privata dell’origine. (e) La funzione non è definita in (0, 0); l’insieme di livello 0 è l’asse y, per k , 0 l’insieme è descritto da 2x = k(x2 + y2 ), ovvero (x − 1k )2 + y2 = k12 . Si tratta della circonferenza di centro ( 1k , 0) e raggio |k|1 . (f) La funzione non è definita per x < y2 ; l’insieme di livello k ∈ R è la parabola x + y2 = ek . (g) La funzione non è definita per y = 0. L’insieme di livello k > 0 è l’iperbole xy = ln k. (h) La funzione è definita per x > 0. L’insieme di livello k ∈ R è y = ln x + k. (i) L’insieme di livello k > 0 è l’ellisse x2 + 9y2 = k, è ridotta al solo punto (0, 0) per k = 0. (j) La
Soluzioni degli esercizi – Capitolo V
funzione non è definita nell’origine. L’insieme di livello k ∈ R è la circonferenza x2 + y2 = ek . 28 (a) B e III. (b) F e V. (c) D e IV. (d) A e VI. (e) E e I. (f) C e II. 29 Seguono entrambi dal fatto che se (x, y) → (x0 , y0 ) allora x → x0 , y → y0 e dalla continuità di h e 1. 31 (a) In polari: f (r, ϑ) = r cos3 ϑ, e | f (r, ϑ)| ≤ r. Dunque limr→0 f (r, ϑ) = 0 uniformemente in ϑ. Il limite richiesto esiste e è 0. (b) In polari intorno a (2, 0), x = 2 + r cos ϑ, y = r sin ϑ. f (r, ϑ) = cos ϑ sin ϑ e limr→0 f (r, ϑ) = cos ϑ sin ϑ: il limite dipende da ϑ. Dunque il limite richiesto non esiste. In alternativa si valuti il limite lungo la retta y = 0 e lungo y = x − 2, per trovare due valori diversi e concludere grazie alla Proposizione (V.39) che il limite non esiste. (c) In polari intorno a (1, 2), x = 1 + r cos ϑ, y = 2 + r sin ϑ. f (r, ϑ) = sin(r cos ϑ) sin ϑ/r cos2 ϑ e limr→0 f (r, ϑ) = sin ϑ/ cos ϑ: questo limite dipende da ϑ, dunque il limite richiesto non 2 esiste. (d) In polari, f (r, ϑ) = √ 2r . Sfruttando lo svir +1−1 luppo√di Taylor del denominatore centrato in r = 0, ovvero r2 + 1 − 1 = 12 r2 + o(r2 ) si trova limr→0 f (r, ϑ) = 2. Il limite è uniforme in ϑ (perché f (r, ϑ) è funzione solo di r) dunque il limite richiesto è 2. (e) Non esiste: ristretta a x = 0 la funzione è costante uguale a 1/5 mentre su y = 0 vale 2, e la Proposizione (V.39) permette di concludere. (f) Non esiste per la Proposizione (V.39); infatti lungo y = −x la funzione è nulla, mentre su y = x è costante uguale a 2. (g) Il limite esiste e è 0; infatti cos2 ϑ sin2 (r sin ϑ) passando in polari f (r, ϑ) = . Sfruttando il 1+2 sin2 ϑ fatto che | sin x| ≤ |x| per ogni x ∈ R, si ha | f (r, ϑ)| ≤ r2 . Dunque limr→0 f (r, ϑ) = 0 uniformemente in ϑ. (h) Il limite non esiste per la Proposizione (V.39): valutato lunsin(x2 ) go y = 0 porta a limx→0 x2 = 1, mentre per x = 0 si trova limy→0
− sin(y2 ) y2
= −1. (i) Non esiste per la Proposi-
zione (V.39); infatti lungo y = 0 si ha limx→0 invece lungo y = x si trova
2 limx→0 arctan(2x) x2
arctan x2 x2
= 1;
= 4.
32 (a) D = {(x, y) : y , x2 }; f è continua in D. (b) D = {(x, y) : x2 + y2 , 1}; f è continua in D. (c) D = {(x, y) : y , x}; f è continua in D. (d) D = {(x, y) : x , 0, y , 0}; f è continua in D. (e) D = {(x, y) : x2 + y2 > 1}; f è continua in D. (f) D = {(x, y) : y ≥ 0}; f è continua in D. (g) D = R2 . (h) f è continua in ogni punto diverso dall’origine, perché si tratta di una funzione razionale. Per stabilire se f è continua anche in (0, 0) occorre valutare x2 − y2 . (x,y)→(0,0) x2 + y2 lim
Soluzioni degli esercizi – Capitolo VI
Passando in coordinate polari intorno all’origine si ha x2 − y2 r2 (cos2 ϑ − sin2 ϑ) = lim = cos2 ϑ−sin2 ϑ. lim r→0 r2 (cos2 ϑ + sin2 ϑ) (x,y)→(0,0) x2 + y2 Poiché il limite in polari dipende da ϑ, concludiamo che il limite da calcolare non esiste e dunque la funzione f non è continua nell’origine. (i) f è continua in ogni punto diverso dall’origine; calcoliamo il limite per (x, y) → (0, 0) 2 ϑ sin3 ϑ in polari ponendo f (r, ϑ) = r3 cos1+cos 2 ϑ . Poiché | f (r, ϑ)| ≤ 3 3 2 3 r cos ϑ| sin ϑ| ≤ r risulta limr→0 f (r, ϑ) = 0 uniformemente in ϑ. Essendo lim(x,y)→(0,0) f (x, y) = 0 = f (0, 0) la funzione è continua nell’origine. (j) f è continua in ogni punto diverso dall’origine; se calcoliamo il limite per 2 (x, y) → (0, 0) lungo y = x troviamo limx→0 sin2x2x2 = 1, che è diverso dal valore di f (0, 0) = 0 e f non è continua in (0, 0).
617
Capitolo VI 1 Si usa la regola di derivazione di un rapporto; tenendo y costante e derivando rispetto a x si ha fx (x, y) = 2
y(x2 + y2 ) − xy · 2x y2 − x2 = 2y 2 . 2 2 2 (x + y ) (x + y2 )2
Analogamente, derivando il quoziente rispetto a y: fy (x, y) = 2
x2 − y2 x(x2 + y2 ) − xy · 2y = 2x . (x2 + y2 )2 (x2 + y2 )2
Valutiamo ora in (1, 0): fx (1, 0) = 0 e f y (1, 0) = 2. 2
Usiamo la Definizione (VI.2). Risulta: lim h→0
f (h, 0) − f (0, 0) = lim h→0 h
f (0, h) − f (0, 0) = lim h→0 h→0 h Quindi fx (0, 0) = 1 e f y (0, 0) = 3. lim
33 Come abbiamo visto nell’Esempio (V.41) a pagina 254 restringendo la funzione a x = y2 risulta f1 (y2 , y) = 12 . Invece, essendo |y| ≤ x, possiamo maggiorare | f2 (x, y)| ≤ 3 |x|3 ≤ |x|x2 ≤ |x| e risulta così lim(x,y)→(0,0) | f (x, y)| ≤ x2 +y4 lim(x,y)→(0,0) |x| = 0. La funzione f2 quindi è continua in (0, 0).
34 (a) Completando i quadrati, si trova l’equazione (x − 2)2 + y2 + (z + 2)2 = 16. Si tratta della sfera di raggio 4 centrata in (2, 0, −2). Pensando alla parametrizzazione vista nell’Esempio (V.48), si trova r(u, v) = (4 cos u sin v+2) i+4 sin u sin v j+(4 cos v−2) k con (u, v) ∈ [0, 2π] × [0, π]. (b) Ponendo x = r cos u e y = r sin u si trova r2 − z2 = 1. Conviene allora porre r = cosh v e z = sinh v (che verificano cosh2 − sinh2 = 1). Si trova r(u, v) = 2 cos u cosh v i + 2 sin u cosh v j + 2 sinh v k per (u, v) ∈ [0, 2π] × R. (c) Sfruttando le coordinate sferiche dell’Esempio (V.48) poniamo r(u, v) = 4 cos u sin v i + 4 sin u sin v j+4 cos v k con u ∈ [0, 2π]. Ora però z dobbiamo imporre z ∈ [−2, 2] cioè −1/2 ≤ cos v ≤ 1/2.Questo si verifica per v ∈ [π/6, 5π/6]. (d) r(u, v) = 31 cos u sin v i + 1 sin u sin v j + cos v k con v ∈ [0, π] e (per avere x > 0) 2 √ u ∈ [−π/2, π/2]. (e) r(u, v) = u i + v j + 2 − u3 − 3uv k, (u, v) ∈ D = {(x, y) ∈ R2 : 2 − x3 − 3xy ≥ 0}. (f) r(u, v) = u i + v j + (2u + 4) k, (u, v) ∈ T = {(x, y) ∈ R2 ; x ≥ 0, y ≥ 0, x+ y ≤ 1}. (g) r(u, v)) = cos v i+u j+sin v k, u ∈ [−2, 4] e v ∈ [0, 2π]. √ (h) r(u, v) = u cos v i + 3 j + u sin v k, (u, v) ∈ [0, 3] × [0, 2π].
h2 −3·02 h−0
h 02 −3·h2 0−h
h
−0
= lim
h2 = 1. h2
= lim
3h2 = 3. h2
h→0
−0
h→0
3 (a) fx = 3y + 5x4 − 4xy, f y = 3x + 3y2 − 2x2 . (b) fx = (x + y)−1 − (x − y)/(x + y)2 , fy = −(x + y)−1 − (x − y)/(x + y)2 . (c) fx = exy (1 + xy), f y = x2 exy . (d) fy = x/y, fx = ln y. p p p (e) fx = 1/ x2 + y2 , fy = y/[(x + x2 + y2 ) x2 + y2 ]. y y (f) fx = x y/x, fy = x ln x. (g) fx = 1/[y(1 + x2 /y2 )], fy = −x/[y2 (1 + x2 /y2 )]. (h) fx = 2 cos(x2 + 3y)x, f y = 2 2 2 2 3 cos(x2 + 3y). (i) fx = e−x −y (1 − 2x2 ), fy = −2xye−x −y . p 3 2 (j) fx = 1/ x + y2 − (2/3) (x + y)x/(x2 + y2 )4/3 , fy = p 1/ 3 x2 + y2 − (2/3) (x + y)y/(x2 + y2 )4/3 . 4
Fissato v = (a, b), abbiamo
f (x + ha, y + hb) − f (x, y) 3ha − 2hb = = 3a − 2b, h h quindi Dv f (x, y) = 3a − 2b. lim h→0
5 Introduciamo 1(h) = f (ah, bh): risulta, per 1(h) = ab se h , 0, 1(0) = 0 se h = 0. Quindi se a , 0 e b , 0 (cioè se la direzione è diversa da quelle degli assi coordinati) la funzione 1 è discontinua in 0 e non è quindi derivabile. Concludiamo che non esistono le derivate direzionali di f in (0, 0) per tutte le direzioni diverse dagli assi. Se invece v = (0, 1), la funzione 1(h) corrispondente è identicamente nulla, dunque derivabile e 1′ (0) = 0: quindi fx (0, 0) = 0. Analogamente si ottiene fy (0, 0), scegliendo v = (0, 1). 6 Se x , 0, f è quoziente di funzioni di classe C∞ : mantiene dunque la stessa regolarità e possiamo subito affermare che f è continua, derivabile e differenziabile (grazie al Teorema (VI.15)). Se x = 0: f non è continua in (0, 0) perché ristretta a y = x2 si ha f (x, x2 ) = 1, invece se ci muoviamo lungo l’asse y si ha per definizione
618
Soluzioni degli esercizi – Capitolo VI
valore di f (0, 0). (b) Fissato v = (cos α, sin α) per α , 0
f (0, y) = 0 lim f (x, x2 ) = 1 , 0 = lim f (0, y). x→0
y→0
Grazie alla Proposizione (V.39), il limite non esiste. Dunque f non è nemmeno differenziabile in (0, 0), grazie al Teorema (VI.17). Per stabilire se le derivate parziali esistono in (0, 0), osserviamo che f (x, 0) = f (0, y) = f (0, 0) = 0, quindi entrambe le derivate parziali esistono in (0, 0) e sono nulle. Nei punti (0, y0 ) con y0 , 0, la funzione non è mai continua (dunque nemmeno differenziabile). Infatti y 1 lim = y0 lim 2 = ∞. x→0 x (x,y)→(0,y0 ) x2 In tali punti la derivata parziale rispetto a y esiste e è nulla, mentre non esiste la derivata rispetto a x, perché y0
f (0 + h, y0 ) − f (0, y0 ) 1 2 − 0 = lim h = y0 lim 3 = ∞. lim h→0 h→0 h h→0 h h Consideriamo ora la funzione 1; in tutti i punti diversi dall’origine, essendo di classe C1 è differenziabile, continua e derivabile. Concentriamoci dunque sull’origine e calcoliamo il limite di f per (x, y) che tende a (0, 0) passando a coordinate polari (e usando sin x ∼ x se x → 0) r sin ϑ sin(r cos ϑ) lim = lim sin ϑ · r cos ϑ = 0 r→0 r→0 r uniformemente in ϑ, in quanto | sin ϑ · r cos ϑ| ≤ r → 0. Dunque 1 è continua. Come nel caso precedente, essendo 1(x, 0) = 1(0, y) = 0 per ogni x, y ∈ R: si deduce che le derivate parziali in (0, 0) sono nulle. Per la differenziabilità occorre dimostrare che esiste e vale 0 il limite f (h, k) − f (0, 0) − fx (0, 0)h − f y (0, 0)k lim √ (h,k)→(0,0) h2 + k2 √k sin h h2 +k2
k sin h . = lim √ 2 + k2 (h,k)→(0,0) 2 2 h h +k Scegliendo k = h (cioè avvicinandosi all’origine lungo la retta y = x) si trova però il valore 1/2, si conclude che 1 non è differenziabile in (0, 0). p 2 2 7 Si ha fx = ex−y + x/ 1 + x2 + y4 e fy = −2yex−y + √ p 2y3 / 1 + x2 + y4 da cui ∇ f (1, 0) = (e + 1/ 2, 0). Inoltre √ √ f (1, 0) = e + 2. Il piano tangente è z = e + 2 + (e + √ 1/ 2)(x − 1). Il versore √ che√indica la direzione della retta y = −x è v = (−1/ 2, 1/ 2); poiché f è di classe C1 in tutto R2 è differenziabile in ogni punto e le derivate direzionali si possono √ calcolare con la formula del gradiente: Dv f (1, 0) = −e/ 2 − 1/2. 8 (a) Basta osservare che | f (x, y)| ≤ x1/3 e si trova subito che il limite per (x, y) → (0, 0) di f è 0, uguale al =
lim
(h,k)→(0,0)
2 − cos α
f (t cos α,t sin α)− f (0,0)
si ha = t−2/3 (cos α)1/3 e t2 sin4 α il limite per t t → 0 è 0. Inoltre fx (0, 0) = 0 essendo f (x, 0) = 0 per ogni x: quindi tutte le derivate direzionali esistono e sono nulle. (c) La formula Dv f (0, 0) = ·∇ f (0, 0), v è banalmente verificata. (d) Basta calcolare il limite del rapporto √ 3 −1 f (x,y)− f (0,0)− fx (0,0)− f y (0,0) xe √ lungo la linea x = y2 . Si trova √ 2 x +x
x2 +y2
che tende a ∞ se x → 0.
9 (a) f è continua in tutti i punti che non si trovano sugli assi perché sono continue le leggi che la esprimono; √ f (x0 , 0) = x0 e (essendo sin xy)2 = xy se xy → 0) √ 2 (sin xy) lim = x0 , (x,y)→(x0 ,0) y Si ha poi f (0, y0 ) = 0 e similmente √ (sin xy)2 = 0. lim (x,y)→(0,y0 ) y La funzione è continua su R2 . (b) Per le derivate di f in (0, 0) si osserva che f y (0, 0) = 0 perché f (0, y) = 0, mentre fx (0, 0) = 1. Per la differenziabilità occorre mostrare che è nullo il limite per (h, k) → (0, 0) di √ −(hk)2 /3 (sin hk)2 − hk ≡ √ √ k h2 + k2 k h2 + k2 e si conclude passando in coordinate polari. 10 Basta studiare f sugli assi perché negli altri punti è continua. Conviene scrivere r x ln(1 + y) y √ ln(1 + y) =x y . √ y x+y x+y Si vede facilmente che nei punti (0, y0 ) con y0 > 0 il limite è 0 dunque f non è continua perché f (0, y0 ) = y0 . In (x0 , 0) con x0 ≥ 0 ancora il limite è nullo ed essendo f (x0 , 0) = 0 f è continua. f non è differenziabile in (0, 1) perché non è continua in quel punto; in (1, 0) non ammette fy mentre si ha fx (0, 0) = fy (0, 0) = 0 e f risulta differenziabile in (0, 0). 11 1′ (x0 ) = lim
x→x0
1 [ f (x, y0 + m(x − x0 )) − f (x0 , y0 )] x − x0
sostituendo x = x0 + lim h→0
12 (b) (c)
√ h 1+m2
si ottiene Dv f (x0 , y0 ), ovvero
i h mh 1h − f (x0 , y0 ) . f x0 + √ , y0 + √ 2 2 h 1+m 1+m
(a) fxx = 12x2 − 6y3 , fxy = −18xy2 , fyy = −18x2 y. fxx = ex sin y, fxy = ex cos y, fyy = −ex sin y. 2xy fxx = (x2 +y2 )2 = − fyy , fxy = (y2 − x2 )/(x2 +
Soluzioni degli esercizi – Capitolo VI p y2 )2 . (d) fxx = −9x2 /(3x2 + 5y2 )3/2 + 3/ 3x2 + 5y2 , 2 2 3/2 2 2 fxy = −15xy/(3x + 5y ) , fyy = −25y /(3x + 5y2 )3/2 + p 5/ 3x2 + 5y2 . (e) fxx = 2(x2 + y)−1 − 4x2 /(x2 + y)2 , fxy = −2x/(x2 + y)2 , fyy = −(x2 + y)−2 . (f) fxx = p √ −1/[4(x − y)3/2 1 − x + y] + 1/[4 x − y(1 − x + y)3/2 ], p √ fxy = 1/[4(x − y)3/2 1 − x + y] − 1/[4 x − y(1 − x + y)3/2 ], p √ fyy = −1/[4(x− y)3/2 1 − x + y]+1/[4 x − y(1−x+ y)3/2 ]. 13 (a) fx = cos x cos y, f y = − sin x sin y, xt = π, xs = 0, yt = 1/t, ys = 0; Ft = cos(πt) cos(ln t)π − [sin(πt) sin(ln t)]/t, Fs = 0. (b) fx = ex sin y, fy = ex cos y, xt = cos t, xs = 0, yt = 2t + 1, ys = 0; Ft = esin t sin(t2 + t) cos t + esin t cos(t2 + t)(2t + 1), Fs = 0. (c) fx = −yx−2 (1 + y2 /x2 )−1 , fy = x−1 (1 + y2 /x2 )−1 , xt = s, xs = t, yt = 2, ys = 3; Ft = −(3s + 2t)(st)−2 [1 + (3s + 2t)2 /(st)2 ]−1 s + (st)−1 [1 + (3s + 2t)2 /(st)2 ]−1 2, Fs = −(3s + 2t)(st)−2 [1+(3s+2t)2 /(st)2 ]−1 t+(st)−1 [1+(3s+2t)2 /(st)2 ]−1 3. √ √ (d) fx = 2xy + 1/(2 x − y), f y = x2 − 1/(2 x − y, √ √ xt = −s/t2 , xs = 1/t, yt = t/ s2 + t2 , ys = s/ s2 + t2 ; √ √ Fs = A/t + Bs/ s2 + t2 , Ft q = −As/t2 + Bt/ s2 + t2 , do√ √ ve A = 2s s2 + t2 /t + 1/(2 s/t − s2 + t2 ), B = s2 /t2 − q √ 1/(2 s/t − s2 + t2 ). 16 fx (x, y) = 1+ y+2xy3 +5x4 , fy (x, y) = x+3y2 +3x2 y2 + 5y4 . Osservando che fxy = fyx per il Teorema di Schwarz, abbiamo fxx (x, y) = 2y3 + 20x3 , fxy (x, y) = 1 + 6xy2 , fyy (x, y) = 6y+6x2 y+20y3 . Grazie al Corollario del Teorema di Schwarz si ha fxxx = 60x2 (si deriva fxx rispetto a x); fxxy = fxyx = fyxx = 6y2 (si deriva ad esempio fxx rispetto a y); fyxy = fyyx = fxyy = 12xy (si deriva ad esempio f yy rispetto a x); fyyy = 6 + 6x2 + 60y2 (si deriva fyy rispetto a y). Infine le derivate di ordine 4: fxxxx = 120x (si deriva fxxx rispetto a x); fxxxy = fxxyx = fxyxx = fyxxx = 0 (si deriva fxxx rispetto a y); fxxyy = fxyxy = fxyyx = fyxxy = fyxyx = fyxxy = 12y (si deriva fxxy rispetto a y); fxyyy = fyyxy = fyxyy = fyyyx = 12x (si deriva fxyy rispetto a y); fyyyy = 120y (si deriva f yyy rispetto a y). 17 Per calcolare fxy (0, 0) si deve valutare il limite per f (0,k)− f (0,0) k → 0 del quoziente x k x . Poiché f è nulla sugli assi, fx (0, 0) = f y (0, 0) = 0 mentre fx (0, k) si ottiene derivando l’espressione razionale che definisce f . Si trova x2 −y2
4xy2
fx (x, y) = y x2 +y2 + xy (x2 +y2 )2 e dunque fx (0, k) = −k, da cui il fatto che fxy (0, 0) = −1. Calcoli analoghi portano a fy (h, 0) = h e dunque fyx (0, 0) = 1 = lim h→0
18
fy (h, 0) − f y (0, 0) = 1. h
Poiché f è differenziabile in A, grazie al Teo-
619
rema (VI.24) di derivazione della funzione composta scopriamo che F è derivabile e la derivata vale F′ (t) = fx (x0 +th, y0 +tk)h+ f y (x0 +th, y0 +tk)k,
t ∈ [0, 1].
Entrambe le derivate parziali sono differenziabili a loro volta in A, e esiste la derivata seconda di F: F′′ (t) = fxx (x0 + th, y0 + tk)h2 + fxy (x0 + th, y0 + tk)hk + fyx (x0 + th, y0 + tk)kh + f yy (x0 + th, y0 + tk)k2 . Applicando il Teorema di Schwarz si ha (per ipotesi le derivate seconde di f sono continue in A): F′′ (t) = fxx (x0 + th, y0 + tk)h2 + 2 fxy (x0 + th, y0 + tk)hk + f yy (x0 + th, y0 + tk)k2 . 19 Ricordiamo ora la Formula di Taylor con resto di Lagrange per la funzione F 1 F(t) = F(0) + F′ (0)t + F′′ (ξ)t2 2 per qualche ξ che appartiene all’intervallo di estremi 0 e t. Si ottiene la tesi sostituendo t = 1 e a F, F′ e F′′ i loro valori. 20
Dobbiamo dimostrare che fxx (x + ξh, y + ξk)h2 + 2 fxy (x + ξh, x + ξk)hk + fyy (x + ξh, x + ξk)k2 = fxx (x, y)h2 + 2 fxy (x, y)hk + f yy (x, y)k2 + o(h2 + k2 ).
Ma questo fatto segue dal limite [ fxx (x + ξh, y + ξk) − fxx (x, y)]h2 = 0. (h,k)→(0,0) h2 + k2 lim
Infatti il quoziente h2 /(h2 + k2 ) è positivo e inferiore a 1; inoltre fxx è continua nel punto (x, y), dunque per h e k che tendono a 0, la quantità in parentesi quadra tende a zero anch’essa. Con ragionamenti analoghi si controllano i pezzi con fxy e con fyy , e la dimostrazione è conclusa. 21 Vogliamo valutare il segno della differenza ∆z = f (x0 + h, y0 + k) − f (x0 , y0 ) quando (h, k) è prossimo a zero. Poiché (x0 , y0 ) è un punto critico sappiamo che, per un opportuno ξ ∈ (0, 1), 1 ∆z = [ fxx (x0 + ξh, y0 + ξk)h2 2 + 2 fxy (x0 + ξh, y0 + ξk)hk + f yy (x0 + ξh, y0 + ξk)k2 ]. Poiché le derivate seconde sono continue, è possibile scegliere un disco aperto centrato in (x0 , y0 ), nel quale il segno del determinante fxx fyy − ( fxy )2 sia lo stesso di D, e ugualmente per il segno di fxx . Prenderemo allora (h, k) , (0, 0) sufficientemente piccoli perché il punto (x0 +h, y0 +k) stia in tale disco. Si dimostra facilmente che,
620
se D > 0 e fxx (x0 , y0 ) > 0 si ha ∆z > 0, e dunque siamo in presenza di un minimo locale. Se D > 0 e fxx (x0 , y0 ) < 0 si ha ∆z < 0, e dunque siamo in presenza di un massimo locale. Se invece D < 0 avremo una sella. 28 x = r cos ϑ, y = r sin ϑ, xr = cos ϑ, xϑ = −r sin ϑ, yr = sin ϑ, yϑ = r cos ϑ; zr = cos ϑ fx + sin ϑ fy , zϑ = −r sin ϑ fx + r cos ϑ f y ; zrϑ = −r sin ϑ(cos ϑ fxx + sin ϑ fxy ) − sin ϑ fx + r cos ϑ(cos ϑ f yx + sin ϑ fyy ) + cos ϑ f y . 32 La funzione ha derivate di ogni ordine su tutto R2 . I punti critici si trovano risolvendo il sistema ( fx (x, y) = 4x3 − 4(x − y) = 0 fy (x, y) = 4y3 + 4(x − y) = 0
Sommando le due equazioni si ricava x3 +y3 = 0, le cui soluzioni sono i punti della retta y = −x. Sostituendo questa informazione nella prima equazione si ha x3 − 2x = 0 2 da cui segue √ x =√0 oppure x √= 2. √ Si ottengono i punti (0, 0), A = ( 2, − 2) e B = (− 2, 2). Le derivate seconde di f sono fxx (x, y) = 12x2 − 4, fxy = fyx = 4, fyy (x, y) = 12y2 − 4. Il determinante della matrice hessiana i (0, 0) è nullo, quindi il Test dell’hessiana non permette di stabilire la natura del punto. In A e B invece il determinante è positivo, ed essendo fxx > 0 entrambi i punti sono di minimo locale. Per capire la natura dell’origine studiamo il segno della variazione ∆ f (x, y) = f (x, y)− f (0, 0) = f (x, y). Nei punti dell’asse x si ha ∆ f (x, 0) = x4√−2x2 √= −x2 (2−x2 ), che è negativo per x compreso tra − 2 e 2. Se invece osserviamo cosa succede lungo la retta y = x, scopriamo che ∆ f (x, x) = 2x4 è positivo per ogni x , 0. Dunque ∆ f cambia di segno vicino all’origine, che risulta essere una sella. 33 (a) fx = 2(x − 1), f y = 4y. L’unico punto critico è (1, 0). fxx = 2, fxy = 0, fyy = 4. Il determinante dell’hessiana è 8, fxx > 0: (1, 0) è un minimo locale. (b) fx = 2x + y − 2, f y = x + 2y − 1. L’unico punto critico è (1, 0). fxx = 2, fxy = 1, fyy = 2. Il determinante dell’hessiana è 3, fxx > 0: (1, 0) è un mi nimo locale. (c) fx = 3 x2 y2 6 − x − y − x3 y2 , fy = 2 x3 y 6 − x − y − x3 y2 . Tutti i punti degli assi sono critici come anche il punto P = (3, 2). fxx = 6xy2 (6−x−y)−6x2 y2 , fxy = 6x2 y(6−x−y)−3x2 y2 −2x3 y, fyy = 2x3 (6−x−y)−4x3 y. Il Test dell’hessiana non si può applicare ai punti sugli assi; in P il determinante dell’hessiana è positivo, fxx < 0: dunque P è un massimo locale. In un generico punto sugli assi si ha ∆ f (x, y) = f (x, y). Quindi i punti dell’asse y sono tutti punti di sella; i punti (x, 0) con x < 0 oppure x > 6 sono massimi locali, mentre per 0 < x < 6 sono minimi locali. Il punto (6, 0) è una sella. (d) fx = 4(x3 − x + y), f y = 4(y3 + x − y). I pun√ √ √ √ ti critici sono A = ( 2, − 2), B = (− 2, 2) e (0, 0).
Soluzioni degli esercizi – Capitolo VI
fxx = 4(3x2 − 1), fxy = 4, fyy = 4(3y2 − 1). La matrice hessiana in A e B è identica, il suo determinante è positivo, fxx > 0: sono punti di minimo locale. L’origine è una sella; il determinante dell’hessiana è nullo ma è facile studiare il segno della variazione ∆ f (x, y) = f (x, y) − f (0, 0) vicino all’origine: risulta negativa lungo y = 0 e posi2 2 tiva lungo y = x. (e) fx = 2xe−x −y (1 − (x2 + y2 )), 2 2 fy = 2ye−x −y (1 − (x2 + y2 )). I punti critici sono (0, 0) e quelli della circonferenza x2 + y2 = 1. Dal segno di f si scopre subito che (0, 0) è un minimo, mentre i punti della circonferenza sono massimi locali. Il Test dell’hessiana porta a conti molto lunghi;si può anche seguire il ragionamento seguente. Si considera 1(t) = te−t , per cui f (x, y) = 1(x2 + y2 ): le curve di livello di f sono circonferenza centrate nell’origine. Si ha 1′ (t) = e−t (1 − t), positiva per 0 < t < 1. La funzione 1 ha un massimo in t√0 = 1: questo significa che la circonferenza di raggio t0 = 1 è costituita da punti di massimo locale per f . (f) fx = ex−y (x2 − 2y2 + 2x), fy = ex−y (−x2 + 2y2 − 4y). I punti critici sono (0, 0) e (−4, −2). Con il Test dell’hessiana si trova che l’origine è una sella, il punto (−4, −2) y un massimo locale. (g) fx = √ 2 2 (1 − y2 − 2x2 ), fy = √
x
1−x2 −y
1−x −y
(1 − x2 − 2y2 ). La funzione non è derivabile 2
nei punti tali che x2 + y2 = 1. I punti critici sono (0, 0), √ ), C = ( −1 √ , √1 ), D = ( −1 √ , −1 √ ). Il A = ( √13 , √13 ), B = ( √13 , −1 3 3 3 3 3 Test dell’hessiana permette di concludere che A e D sono massimi, mentre C e D sono minimi locali. L’origine e i punti della circonferenza sono tutti a quota 0 e si classificano facilmente grazie allo studio del segno della funzione, nulla sugli assi e sulla circonferenza, positiva nel primo e terzo quadrante, e negativa nel secondo e quarto. (0, 0), (1, 0), (0, 1), (−1, 0), (0, −1) sono punti di sella; i punti della circonferenza del primo e terzo quadrante sono minimi locali, quelli del secondo e quarto sono massimi locali. (h) fx = −8/x2 + 1/y, f y = −x/y2 + 1. L’unico punto critico è (4, 2) ed è un minimo locale. 35 Occorre disegnare il vincolo e una famiglia di curve di livello della funzione da ottimizzare; i candidati si trovano dove si ha tangenza tra una curva di livello e il vincolo. Guardando le figure corrispondenti si evince per i primi due problemi che i punti di tangenza si trovano sulla retta y = x. Intersecando la retta col vincolo si trova nel primo caso x2 = 1 cioè i punti (−1, −1) e (1, 1). Confrontando f (−1, −1) = −3 e f (1, 1) = 1 il primo punto è di minimo assoluto e il secondo è di massimo assoluto. Per il secondo si trova l’unica soluzione (1/2, 1/2); osservando che i livelli corrispondenti alle iperboli decrescono mentre le iperboli si schiacciano verso gli assi, si scopre che (1/2, 1/2) è un punto di massimo assoluto (si noti
Soluzioni degli esercizi – Capitolo VI
che questo problema non ha minimo). Per il terzo, i punti di tangenza sono sulla retta passante per l’origine che è perpendicolare alle rette x − 2y = k. Tale retta è y = −2x: intersecando col vincolo si trova 5x2 = 5, ovvero i punti (−1, 2) e (1, −2) (il primo è minimo, il secondo massimo). Per l’ultimo problema si ha un solo candidato che si trova sulla retta passante per l’origine che è perpendicolare al vincolo 2x + 3y = 1, cioè y = 3x/2, ovvero il punto (2/13, 3/13): si tratta di un minimo assoluto poiché i livelli si fanno più alti al crescere del raggio delle circonferenze.
F 4 36 Osserviamo innanzitutto che l’insieme è chiuso e limitato, e che la funzione è continua: il teorema di Weierstrass assicura l’esistenza dei valori richiesti. Seguendo la procedura esposta nel commento a pagina 317, cerchiamo i punti critici di f : si ha fx (x, y) = 2x − y e fy (x, y) = −x + 1 da cui l’unico punto critico è A = (1, 2). A appartiene al dominio D, poiché 1 + 2 ≤ 4 e entrambe le coordinate sono positive, inoltre f (A) = 12 − 2 + 2 = 1. Studiamo f su ∂D, formato dai tre segmenti L1 , L2 e L3 .
f ristretta a L1 è f (x, 0) = x2 con 0 ≤ x ≤ 4. Si tratta di una funzione nella sola variabile x, sempre crescente: dunque è massima in x = 4 (in corrispondenza al punto C = (4, 0)) e il suo valore minimo in x = 0 (in corri-
621
spondenza a O = (0, 0)). I valori di f che ci interessano sono f (C) = 16, f (O) = 0. Guardiamo ora f ristretta a L2 : f (0, y) = y con 0 ≤ y ≤ 4. Si tratta di una funzione nella sola variabile y con derivata uguale a 1 e dunque crescente: assume il valore di massimo in y = 4 e di minimo in y = 0. Dunque dobbiamo aggiungere ai candidati il punto B = (0, 4) (l’origine è già stata considerata) dove si ha f (B) = 4. Infine dobbiamo studiare f sul segmento di estremi B e C che appartiene alla retta di equazione y = −x + 4; l’equazione di f ristretta a tale segmento è h(x) = f (x, −x + 4) = 2x2 − 5x + 4 con 0 ≤ x ≤ 4. La derivata di questa funzione della sola variabile x è 4x − 5 che si annulla nel punto x = 5/4: è questo l’unico punto di estremo libero per h(x) sull’intervallo 0 ≤ x ≤ 4. Dunque aggiungiamo ai candidati il punto D = (5/4, 11/4) dove f ha valore f (D) = 87 . Confrontando i valori ottenuti, possiamo concludere che il valore minimo di f sul triangolo D è 0 mentre il valore massimo è 16, realizzati rispettivamente nell’origine e nel punto B = (4, 0). 37 Cerchiamo i candidati col metodo dei moltiplicatori da Lagrange. Bisogna innanzitutto considerare eventuali punti singolari del vincolo; essendo 1(x, y) = x2 − 2xy + y2 si ha 1x = 2x − 2y, 1y = 2y − 2x e imponendo 1x = 1y = 0 si trova che (0, 0) è un punto singolare. Cerchiamo ora i punti critici della funzione Lagrangiana L(x, y, λ) = x2 + y2 + 2 − λ(x2 − 2xy + y2 ). Si ha Lx = 2x − 2λx + 2λy, L y = 2y − 2λy + 2λx e infine Lλ = −(x2 − 2xy + y2 ). Sommando Lx = 0 con L y = 0 si trova x + y = 0 che sostituito in Lλ = 0 implica x = 0, da cui y = 0. L’unico candidato è quindi (0, 0), dove si ha f (0, 0) = 2. Poiché f (x, y) ≥ 2 in ogni punto, 2 è il valore di minimo assoluto della funzione. Non esiste punto di massimo assoluto: questo non è in contrasto col Teorema di Weierstrass perché il vincolo è x2 − 2xy + y2 = (x − y)2 = 0, cioè la retta y = x, che è un insieme chiuso ma non limitato. Si osservi che f (x, x) = 2x2 + 2 → +∞ per x → +∞: l’estremo superiore di f ristretta al vincolo è +∞. 38 Esistono massimo e minimo assoluto grazie al Teorema di Weierstrass. Basta studiare la funzione ristretta al segmento di estremi A = (1, −1), B = (1, 1) e al segmento di estremi C = (−1, 1), B, e estendere i risultati per 2 simmetria. f ristretta su AB è 1(t) = e1−t per t ∈ [−1, 1], 2 1′ (t) = −2te1−t dunque per t = 0 si ha un candidato, il 2 punto (1, 0). f ristretta su CB è 1(t) = et −1 per t ∈ [−1, 1] e ancora si trova t = 0, che corrisponde al punto (0, 1). In totale i punti da considerare sono i vertici del quadrato e le intersezioni con gli assi. Nei vertici la funzione vale 1, f (1, 0) = f (−1, 0) = e, f (0, 1) = f (0, −1) = 1/e. Il massimo è e, il minimo 1/e. 39
Conviene usare il metodo geometrico delle curve
622
di livello: il vincolo è la circonferenza unitaria, le curve di livello di f sono rette parallele a y = x, che appartengono al semipiano 4 + x > y. Data la simmetria delle curve in gioco, la tangenza tra vincolo e curve di livello si ha lungo la retta y = −x, in corrisponden√ √ √ √ B = (− 2/2, 2/2). za ai punti √ A = ( √2/2, − 2/2) e √ √ f (A) = 2 ln(4 + 2) e f (B) = − 2 ln(4 − 2): il primo è il valore di massimo e il secondo quello di minimo. Aggiungendo le condizioni x ≤ 0 e y ≥ 0, il vincolo è la porzione di circonferenza appartenente al secondo quadrante, punti (0, 1) e (−1, 0) compresi. La curva di livello massimo che interseca il vincolo è la retta passante per (−1, 0) e (0, 1) a quota f (−1, 0) = f (0, 1) = − ln 3, quella √di livello √minimo è tangente al vincolo in B a quota − 2 ln(4 − 2). 40 L’insieme E è chiuso ma non è limitato; restringendo f ai punti di E di tipo (x, 0) si ha f (x, 0) = x2 , che tende a +∞ al crescere di x: dunque f non ha massimo assoluto in E. Consideriamo ora i rettangoli Ea = {(x, y) : −a ≤ x ≤ a, 0 ≤ y ≤ 3} con a > 0: al crescere di a Ea tende a coprire la striscia E: studiamo gli estremi di f in Ea per un generico a che pensiamo grande. Per il Teorema di Weierstrass f ha massimo e minimo in Ea . L’unico punto critico di f è l’origine, sulla frontiera di Ea si trovano: 11 (x) = f (x, 0) = x2 , 12 (x) = f (x, 3) = x2 − 3x − 9 in [−a, a] con 1′2 (x) = 2x − 3 da cui x = 3/2 in corrispondenza al punto A = (3/2, 3); 13 (y) = f (a, y) = a2 − ay − y2 in [0, 3] con 1′3 (y) < 0 in tutto l’intervallo; 14 (y) = f (−a, y) = a2 + ay − y2 in [0, 3] con 1′4 (y) = 0 in y = a/2 in corrispondenza a C = (−a, a/2). I candidati in Ea sono quindi i 4 vertici del rettangolo a quota f (−a, 0) = f (a, 0) = a2 , f (−a, 3) = a2 + 3a − 9, f (a, 3) = a2 − 3a − 9, i punti A e C a quote e f (A) = −45/4, f (C) = 5a2 /4. Il minimo di f è sempre realizzato dal punto A ∈ E. Facendo variare a, al limite per a → +∞, M(a) tende a +∞. Si deduce che f ha minimo assoluto in E, realizzato dal punto A, mentre l’estremo superiore è +∞. 41 La regione E è limitata ma non è chiusa. Studiamo f nell’insieme chiuso E = {(x, y) : xy ≥ 1, 0 ≤ x ≤ 1, 0 ≤ y ≤ 3}. Punti critici interni a E: fx = y(2x + y) e fy = x(2y + x) si annullano contemporaneamente solo in (0, 0) < E. Restringendo f ai tre pezzi di frontiera di E si ha 11 (x) = f (x, 1/x) = x + 1/x con x ∈ [1/3, 1], 1′1 (x) = 1 − 1/x2 che è sempre negativa in (1/3, 1): nessun candidato; 12 (x) = f (x, 3) = 3x2 + 9x con x ∈ [1/3, 1], 1′2 (x) = 6x + 9 sempre positiva nell’intervallo richiesto; 13 (y) = f (1, y) = y + y2 con y ∈ [1, 3], 1′3 (y) = 2y + 1 sempre positiva nell’intervallo. I candidati sono solo gli “angoli” del dominio a quote f (1/3, 3) = 103 , f (1, 3) = 12, f (1, 1) = 2. Massimo in (1, 3) e minimo in (1, 1): entrambi
Soluzioni degli esercizi – Capitolo VI
i punti non appartengono a E, dunque la funzione non ha valore massimo né valore minimo in E. 42 (a) Il valore maggiore è 2 realizzato in (1, 0) (frontiera), il minimo è −1 e si ha in (0, −1). (b) Il valore masq
simo è 3 √2 3 realizzato sulla frontiera dai punti x = ± 23 q e y = 13 il valore minimo si ha nei punti simmetrici ri-
spetto all’asse x e è − 3 √2 3 . (c) Il valore massimo di f è √ 3 3/2 realizzato nel punto critico interno (π/3, π/3), il valore minimo è 0, realizzato sulla frontiera nell’origine. (d) Il valore massimo di f è 13 realizzato nel punto di frontiera (2, −1), il valore minimo è −1, realizzato sia dal punto (1, 1) che dal punto (0, −1).
43 Si tratta di massimizzare f (x, y, z) = xyz col vincolo x + y + z = S, x ≥ 0, y ≥ 0 e z ≥ 0. Sostituendo z = S − x − y si tratta di trovare il massimo assoluto di 1(x, y) = xy(S−x− y) nell’insieme descritto da x ≥ 0, y ≥ 0 e S − x − y ≥ 0: triangolo di vertici (0, 0), (S, 0), (0, S). Il massimo si ha nel punto critico interno (S/3, S/3) e vale √ x+y+z S3 . Dunque 3 xyz ≤ S3 = 3 . 33 44 Chiamando x, y e z le dimensioni del parallelepipedo si deve trovare il minimo di f (x, y, z) = 2xy + 2yz + 2xz (superficie), ristretta al vincolo 1(x, y, z) = xyz − V = 0. Conviene usando il Metodo dei moltiplicatori, come nell’Esempio (VI.13) a pagina 320. Risolvendo il sistema dei punti critici della Lagrangiana, si trova come unica soluzione (con x > 0, y > 0, z > 0) il cubo di dimensioni √ 3 x = y = z = V, che corrisponde alla superficie totale minima. Invece la superficie totale può diventare arbitrariamente grande scegliendo x = y = l con l → +∞ e z = V/l2 → 0. 45 Denotando x,y e z le lunghezze dei lati del triangolo e ricorrendo alla formula di Erone per il calcolo dell’area noto il semiperimetro p, A(x, y, z) = p p(p − x)(p − y)(p − z) il problema è quello di trovare il massimo di A(x, y, z), ristretta al vincolo 1(x, y, z) = x + y + z − 2p = 0. La geometria elementare garantisce che esiste un triangolo di area massima, con tutti i lati minori di p. Conviene ora usare il Metodo dei moltiplicatori di Lagrange, con L(x, y, z, λ) = A(x, y, z) − λ(x + y + −p(p−x)(p−z) −p(p−y)(p−z) z − 2p). Si ha Lx = 2A(x,y,z) − λ, L y = 2A(x,y,z) − λ −p(p−y)(p−x)
e Lz = 2A(x,y,z) − λ, e dovendo essere Lx = L y = 0, si ricava 0 = Lx (p − x) − L y (p − y) = λ(x − y): ovvero x = y (per λ = 0 si trova il triangolo degenere che un lato di lunghezza nulla). Analogamente dal confronto 0 = Lx (p − x) − Lz (p − z) = λ(x − z) si ricava x = z. Si è così dimostrato che la soluzione si trova per x = y = z, ovvero si tratta di un triangolo equilatero.
Soluzioni degli esercizi – Capitolo VI
46 Suddividiamo il triangolo nell’unione di tre triangoli più piccoli con un vertice nel centro della circonferenza e denotiamo x,y e z gli angoli al centro di tali triangoli. L’area totale del triangolo è la somma delle aree dei triangolini e vale A(x, y, z) = (sin x + sin y + sin z)/2. Osserviamo che tale espressione vale anche per i triangoli scaleni, in cui uno dei seni è negativo. Ci siamo dunque ricondotti a massimizzare A con il vincolo x + y + z = 2π. Utilizziamo il Metodo dei moltiplicatori di Lagrange, otteniamo x = ± arccos(λ), y = ± arccos(λ) e z = ± arccos(λ). Esaminando tutte le combinazioni di casi possibili si ricava facilmente che la configurazione massima si ottiene con gli angoli uguali fra loro. 47
Si tratta di trovare il minimo assoluto della funzio(x−y+1)2
al variare di (x, y) in R2 . ne f (x, y) = x2 + y2 + 2 Data la posizione della rette, incidenti a due a due a formare il triangolo di vertici (0, 0), (−1, 0) e (0, 1), il minimo richiesto esiste e è un valore strettamente positivo, che si troverà in corrispondenza a un punto critico di f . Il sistema fx = fy = 0 ha una unica soluzione nel punto (−1/4, 1/4). √ 48 La distanza minima è 3. 49 50
(0, 0, 1) e (0, 0, −1).
√ Il massimo volume è 2/ 3.
51 Si tratta di minimizzare la funzione tempo # » # » T(x, y) = kPP1 k/v1 + kPP2 k/v2 con il vincolo 1(x, y) = 0. Si ha # » # » PP2 PP1 ∇T(x, y) = # » + # » . v1 kPP1 k v2 kPP2 k # » # » P0 P1 P0 P2 # » + # » = λ0 ∇1(x0 , y0 ). v1 kP0 P1 k v2 kP0 P2 k Detti ϑi l’angolo tra P0 P1 e la retta tangente al vincolo in P0 e ϑr l’angolo tra P0 P1 e la stessa retta (rispettivamente l’angolo di incidenza e l’angolo di rifrazione) la precedente relazione diviene la nota legge di Snell v1 sin ϑi = . sin ϑr v2 52 Il canale deve unire il punto (1/2, 1/4) della parabola col punto (11/8, −5/8) della retta, ed è lungo √ 7 2/8. 53 Per il punto (xi , yi ) lo scarto verticale rispetto alla retta è di = yi − (mxi + q). Si tratta di trovare il minimo della funzione di 2 variabili (m e q) n n X X f (m, q) = d2i = [yi − (mxi + q)]2 . i=1
i=1
623 Pn Imponendo P fm2 = 0Psi trova P i=1 −xi [yi − (mxi + q)] = 0 ovvero m i xi + q i xi = i xP i yi . P La relazione fq = 0 diventa m i xi + qn = i yi . 54 Usiamo l’induzione matematica. L’affermazione è vera per k = 1 grazie al Teorema di Dini; supponendo vero il caso k − 1, dimostriamolo per k. Se 1 è di classe Ck allora è anche di classe Ck−1 e l’ipotesi di induzione garantisce che ϕ definita implicitamente è a sua volta di classe Ck−1 . Ma ora la formula a pagina 308 per il calcolo di ϕ′ garantisce che ϕ′ ∈ Ck−1 e dunque ϕ ∈ Ck .
55 Definiamo h(x) = 1(x, ϕ(x)) che è identicamente nulla in I e di classe C2 (per l’esercizio precedente). Allora sono identicamente nulle le sue derivate: se le calcoliamo con le regole di derivazione delle funzione composte, troviamo 0 = h′ (x) = 1x (x, ϕ(x)) + 1y (x, ϕ(x)) · ϕ′ (x) e 0 = h′′ (x) = 1xx (x, ϕ(x)) + 1xy (x, ϕ(x)) · ϕ′ (x) + 1yx (x, ϕ(x))·ϕ′ (x)+1yy (x, ϕ(x))·[ϕ′ (x)]2 +1y (x, ϕ(x))·ϕ′′ (x). Si ha così ϕ′′ (x) = −[1xx (x, ϕ(x)) + 21xy (x, ϕ(x)) · ϕ′ (x) + 1yy (x, ϕ(x)) · [ϕ′ (x)]2 ][1y (x, ϕ(x))]−1 . Dalle prima identità si ricava ϕ′ (x) = −1x (x, ϕ(x))[1y (x, ϕ(x))]−1 e sostituendo questo valore nell’ultima si ha la formula richiesta. √ 56 La lagrangiana è L(x, y, λ) = (4 − 3x − y)/2 − √ λ(x2 + y2 − 1), con derivate parziali Lx = − 3/2 − 2λx, L y = −1/2 − 2λy e Lλ = −x2 − y2 + 1. Da Lx = 0 = L y √ si ricava la relazione x = 3y, che sostituito in Lλ = 0 √ permette di determinare i punti A = ( 3/2, 1/2) e B = √ (− 3/2, −1/2)). Valutando f nei due punti si trova che il minimo valore è assunto in A. 57 Il punto di minima distanza da (−1, 0) è (0, 0). Il problema si formula chiedendo di minimizzare la funzione f (x, y) = (x + 1)2 + y2 col vincolo 1(x, y) = y2 − x3 = 0 e il Teorema dei moltiplicatori affermerebbe l’esistenza di λ ∈ R tale che ∇ f (0, 0) = λ1(0, 0), ovvero 2(x + 1) + 3λx2 = 0, 2y − 2λy = 0
per (x, y) = (0, 0). Ma sostituendo x = 0 e y = 0 nella prima relazione si arriva all’assurdo 2 = 0. 59 fx (x, y) = −y e f y (x, y) = cos y − x; f y (1, π) = −2 e si può applicare il teorema di Dini (VI.50) a pagina 308. Per il calcolo delle derivate si ha y(x) fx (x, y(x)) = ∀x ∈ I. y′ (x) = − fy (x, y(x)) cos y(x) − x
In particolare sostituendo x = 1 e y(1) = π si trova y′ (1) = −π/2; derivando l’espressione di y′ (x) si ha y′′ (x): y′ (x)(cos y(x) − x) − y(x)(− sin y(x)y′ (x) − 1) , (cos y(x) − x)2
da cui, sostituendo x = 1, y(1) = π e y′ (1) = −π/2, si ha y′′ (1) = −(−π/2 · (−2) + π)/4 = π/2. Lo sviluppo di Taylor
624
Soluzioni degli esercizi – Capitolo VII
è y(x) = π −
π π (x − 1) + (x − 1)2 + o((x − 1)2 ). 2 4
60 Il calcolo di f ′′ (0) si esegue come nell’Esercizio 59 , oppure sfruttando la formula nell’Esercizio 55 . x = 0 è punto di massimo relativo. 61
La funzione 1 è di classe C∞ (R2 ) e risulta 1(0, 0) = 0,
1x (x, y) = 2xy+1+y cos xy,
1y (x, y) = x2 +x cos xy+3ey
da cui 1x (0, 0) = 1. Il Teorema di Dini asserisce in questo case che l’equazione 1(x, y) = 0 definisce implicitamente, in un rettangolo di centro (0, 0), una funzione x = ψ(y) di classe C∞ tale che ψ(0) = 0. Osserviamo ora che il limite richiesto è una forma di indeterminazione di tipo 0/0 (poiché ψ(0) = 0). Possiamo applicare la Regola di de l’Hôpital: ψ(y) + 3y lim = lim ψ′ (y) + 3 = ψ′ (0) + 3. y→0 y→0 y Il Teorema di Dini fornisce il valore 1y (0, 0) ψ′ (0) = − = −3 1x (0, 0) per cui il limite richiesto vale 0. 62 No perché il teorema fornisce solo una condizione sufficiente. 63 La funzione 1 ha derivata 1y = 5y4 + 1 > 0; inoltre 1(x, y0 ) è negativa non appena y50 + y0 < −1/e perché la funzione x → xex ha un minimo assoluto in x = −1, pari a −1/e. Si osserva poi che, per ogni x0 fissato, esiste y1 tale che 1(x0 , y) > 0 per ogni y > y1 . Poiché la funzione y → 1(x0 , y) è crescente, negativa per ogni y < y0 e positiva per y > y1 , deduciamo che esiste un unico y = y(x0 ) ∈ (y0 , y1 ) tale che 1(x0 , y(x0 )) = 0. Abbiamo così dimostrato che esiste una funzione y = ϕ(x) definita su R tale che 1(x, y) = 0 se e solo se y = ϕ(x). Per tracciare un grafico qualitativo di ϕ troviamo le sue derivate derivando implicitamente l’equazione 1(x, ϕ(x)) = 0. Come nel caso del Teorema di Dini, troviamo ϕ′ (x) = −1x (x, ϕ(x))/1y (x, ϕ(x)) = ex (1 + x)/(5ϕ4 (x) + 1). Si ha ϕ′ (x) < 0 per x < −1 e ϕ′ (x) > 0 per x > −1, per cui x = −1 è punto di minimo locale. Segno di ϕ: si nota che se x < 0 per avere 1(x, ϕ(x)) = 0 si deve avere necessariamente ϕ(x) < 0; analoghe considerazioni danno ϕ(x) > 0 per x > 0. Limiti all’infinito: per x → −∞ si ha xex → 0. Per avere limx→−∞ 1(x, ϕ(x)) = 0 deve essere limx→−∞ φ5 (x) + ϕ(x) = 0 dunque ϕ(x) tende a 0. Analogamente si trova limx→+∞ ϕ(x) = +∞. Un grafico di ϕ si trova in figura.
64 Sia z = f (x, y) la funzione il cui grafico è la nostra superficie, e prendiamo un versore del suo piano tangente, di componenti (h, k, fx (x0 , y0 )h + fy (x0 , y0 )k); pensiamo dunque che h2 + k2 + ( fx (x0 , y0 )h + fy (x0 , y0 )k)2 = 1. Il piano parallelo al vettore normale e a tale vettore tangente si proietta sul piano xy su una retta parallela al vettore v = (h, k). La sezione può essere dunque parametrizzata da r(t) = (x0 + ht, y0 + kt, f (x0 + ht, y0 + kt)). Calcoliamo le derivate prime e seconde di r: r′ (t) = (h, k, ∇ f (x0 + ht, y0 + kt) · v), r′′ (t) = (0, 0, H f (x0 + ht, y0 + kt)v · v); in particolare kr′ (0)k = 1, r′ (0) = (h, k, ∇ f (x0 , y0 ) · v), r′′ (t) = (0, 0, H f (x0 , y0 )v · v), e r′ (0) × r′′ (0) = H f (x0 , y0 )v · v (k, −h, 0). Otteniamo nuovamente k(0) = H f (x0 , y0 )v · v .
ma ora il vettore v = (h, k) deve soddisfare il vincolo h2 + k2 + ( fx (x0 , y0 )h + f y (x0 , y0 )k)2 = 1. Le curvature principali, quindi non saranno più gli autovalori della matrice hessiana ma soddisferanno un’equazione agli autovalori modificata: H f (x0 , y0 )v = λ(v + ∇ f (0) · vv) .
Capitolo VII 1 La verifica delle proprietà della distanza segue direttamente dalle proprietà del valore assoluto. Rispetto alla distanza d1 n o Br (0) = (x, y) ∈ R2 : |x| + |y| < r ovvero il quadrato di vertici (±r, 0) e (0, ±r). Rispetto a d∞ invece n o Br (0) = (x, y) ∈ R2 : max(|x|, |y|) < r ovvero il quadrato di vertici (r, r), (−r, r), (−r, −r) e (r, −r). In Figura 5 sono rappresentate le palle di raggio r rispetto alle metriche d1 , d∞ ed euclidea di R2 (rispettivamente il quadrato interno, il cerchio e il quadrato esterno).
Soluzioni degli esercizi – Capitolo VII
mo un altro minorante maggiore di inf(D). D’altra parte, ogni suo intorno sinistro è esterno a D. Dunque inf(D) è un punto di frontiera per D (per sup(D) si ragiona analogamente).
r
-r
625
r
-r
F 5 4 La verifica è lasciata al Lettore; si osservi che due punti in B possono avere distanza al più pari a 2 (quando si trovano entrambi sulla circonferenza di raggio 1 e non coincidono), quindi le palle aperte con raggio superiore a 2 sono tutto B. Fissato ora x ∈ B, la palla di raggio r > 0 centrata in x è l’unione di due insiemi. Il primo composto dai punti y allineati con x e con 0 tali che d(x, y) < r (ovvero l’intersezione della palla euclidea di raggio r con il segmento passante per x e 0 contenuto in B); il secondo da quelli non allineati con x e 0 che hanno distanza euclidea dall’origine inferiore a r − d(x, 0). Se r < d(x, 0) questo secondo insieme è vuoto. dR non è invariante per traslazioni, non è quindi possibile definire una norma a partire da dR . 5 (a) La frontiera è Z × Z stesso e tutti i suoi punti sono isolati, non ha punti di accumulazione; l’insieme è chiuso. (b) 0 è sia di accumulazione che di frontiera; tutti i punti dell’insieme sono inoltre punti di frontiera e isolati; l’insieme non è né aperto, né chiuso. (c) Riscriviamo l’insieme come unione {1 − 1/(2k + 1) : k ∈ N} ∪ {1/(2k + 2) − 1 : k ∈ N}. I punti −1 e 1 sono sia di accumulazione che di frontiera; tutti i punti dell’insieme sono di frontiera; l’insieme non è né aperto, né chiuso. (d) Tutti i punti di R sono sia di frontiera che di accumulazione, Q non è né aperto, né chiuso. (e) Tutti i punti dell’insieme sono di accumulazione; i punti x ∈ R2 tali che kxk = 1 oppure kxk = 2 sono sia punti di frontiera che di accumulazione; l’insieme è aperto. (f) Tutti i punti dell’insieme sono di accumulazione, i punti tali che x1 = 2 sono sia di frontiera che di accumulazione; l’insieme è aperto. (g) Se n = 1 l’insieme si riduce ad un solo punto, ovvero ad un insieme chiuso, coincidente con la sua frontiera, ma senza punti di accumulazione. Se n ≥ 2 l’insieme è chiuso e coincide sia con la sua frontiera che con i suoi punti di accumulazione. 6 Per definizione l’estremo inferiore è il più grande dei minoranti: pertanto in ogni suo intorno destro ci dev’essere almeno un elemento di D, altrimenti troverem-
9 Segue dalla definizione di successione convergen¯ con ε piccolo a piacere, esiste te. Infatti, fissato Bε (x) ¯ N = N(ε) tale che per ogni n > N, xn appartiene a Bε (x), ¯ quindi al più N elementi non appartengono a Bε (x). 10 Se x¯ è limite di una successione xn di elementi di D allora, per l’Esercizio 9 , in ogni suo intorno cadono in¯ quindi x¯ è di accumulafiniti elementi di D distinti da x, zione per D. Viceversa, se x¯ è di accumulazione allora per ¯ ogni n esiste un elemento xn ∈ D tale che xn ∈ B1/n (x)∩D. ¯ La successione xn converge quindi a x. 11 Il dominio è l’insieme {(x, y) : x2 + y2 ≤ 1 e y > −x − 1}, ovvero i punti interni alla circonferenza di raggio 1, centrata nell’origine che si trovano sopra la retta y = −x−1 (i punti della retta non sono inclusi (nemmeno (−1, 0) e (0, −1)), quelli del cerchio invece sì).
12 Supponiamo che f non sia continua in un punto ¯ allora esiste ε > 0 tale che per ogni n (stiamo scex, ¯ xn ) < 1/n, ma gliendo δ = 1/n) esiste xn tale che dX (x, ¯ f (xn )) ≥ ε. Abbiamo così costruito una successiodY ( f (x), ¯ tale che f (xn ) non converge a f (x). ¯ ne xn convergente a x, f non è dunque sequenzialmente continua. Se viceversa ¯ in corrispondenza di ε > 0 si può trof è continua in x, ¯ < δ implica dY ( f (x), f (x)) ¯ < ε. vare δ > 0 tale che dX (x, x) ¯ in corrispondenza di δ esiste un intero N Se xn → x, ¯ < δ per ogni n > N. Dunque si avrà per cui dX (xn , x) ¯ < ε per tali indici n > N. In definitiva, dY ( f (xn ), f (x)) per ogni ε > 0 esiste N > 0 tale che n > N =⇒ ¯ < ε, ovvero f (xn ) → f (x)). ¯ dY ( f (xn ), f (x)) 14 Dimostriamo che è continua nella prima. Vogliamo che ∀ε > 0, ∃δ tale che se d(x1 , x2 ) < δ allora |d(x1 , y) − d(x2 , y)| < ε, indipendentemente da y ∈ X. Questo fatto segue immediatamente dalla disuguaglianza triangolare scegliendo ε = δ. |d(x1 , y) − d(x2 , y)| ≤ |d(x1 , x2 ) + d(x2 , y) − d(x2 , y)| = d(x1 , x2 ) < δ.
15 Utilizziamo la nozione di continuità per successioni ¯ ne con(Esercizio 12 ). Se f è continua in x¯ e xn → x, ¯ D’altra parte, se 1 è segue che yn = f (xn ) → y¯ = f (x). ¯ = 1 ◦ f (x). ¯ continua in y¯ avremo 1(yn ) = 1 ◦ f (xn ) → 1( y) ¯ Dunque 1 ◦ f è continua in x. 17 Usiamo il risultato dimostrato nell’Esercizio 16 . Infatti, se S è un sottoinsieme di K allora S è anch’esso limitato. Quindi esiste un punto di accumulazione per l’insieme S, s¯ ∈ Rn . Dall’inclusione S ⊂ K, segue che s¯ è
626
Soluzioni degli esercizi – Capitolo VII
un punto di accumulazione anche per K (infatti essendo s¯ un punto di accumulazione anche per K, allora o s¯ è un punto interno o è di frontiera per K. Poiché K è chiuso, contiene la sua frontiera, dunque s¯ ∈ K). Ma K è chiuso, quindi s¯ ∈ K. 18 Se K è chiuso e limitato e xn è una successione contenuta in K, allora, per l’Esercizio 17 , esiste una sottosuccessione convergente a x¯ ∈ K, quindi K è sequenzialmente compatto. Supponiamo ora che ogni successione contenuta in K ammetta una sottosuccessione convergente ad un punto di K. Vogliamo dimostrare che K è sia chiuso che limitato. Ragioniamo per assurdo. Se K non fosse chiuso, esisterebbe x¯ ∈ ∂K r K e quindi una ¯ Essensuccessione xn di elementi di K tale che xn → x. do xn convergente, anche tutte le sue sottosuccessioni lo sono e convergono a x¯ < K, quindi K non può essere sequenzialmente compatto (nessuna sottosuccessione di xn converge ad un elemento di K). Se invece K non fosse limitato, allora per ogni n ∈ N esisterebbe xn ∈ K tale che kxn k ≥ n. Tale successione non ammette un’estratta convergente, infatti la norma degli elementi di qualsiasi sottosuccessione diverge a +∞ (si veda anche l’Esercizio 13 ). 19 Sia Bi un ricoprimento aperto di f (X), allora le controimmagini di Bi , Ai = {x ∈ X : f (x) ∈ Bi }, sono un ricoprimento aperto di X (infatti f è continua e le controimmagini di aperti sono insiemi aperti, si veda l’Esercizio (VII.3), svolto a pagina 372). Essendo X compatto, esistono un numero finito di insiemi Ai , che ricoprono X; i corrispondenti Bi formano dunque un sottoricoprimento finito di f (X). 20 Vogliamo dimostrare che per ogni ε > 0 esiste δ > 0, dipendente solo da ε, tale che per ogni x, x′ ∈ X 0 < dX (x, x′ ) < δ =⇒ dX ( f (x), f (x′ )) < ε.
f è continua in X, quindi per ogni ε > 0 e x ∈ X esiste δx , dipendente dal punto x, tale che per ogni x′ ∈ X 0 < dX (x, x′ ) < δx =⇒ dY ( f (x), f (x′ )) < ε/2.
Le palle aperte Bδx /2 (x), al variare di x ∈ X, formano un ricoprimento aperto di X, da cui è possibile estrarre un sottoricoprimento finito: Bδx1 /2 , . . . , BδxN /2 . Definiamo la quantità δ = min{δx1 /2, . . . , δxN /2}. Se ora scegliamo x, x′ tali che 0 < dX (x, x′ ) < δ osserviamo che certamente esiste i ∈ {1, . . . , N} tale che x ∈ Bδxi /2 ; si ha inoltre dX (x′ , xi ) ≤ dX (x′ , x) + dX (x, xi ) < δ + δxi /2 ≤ δxi
quindi anche x′ appartiene a Bδxi /2 . Possiamo quindi concludere che dY ( f (x′ ), f (x)) ≤ dY ( f (x′ ), f (xi )) + dY ( f (xi ), f (x)) < ε. 21 Se xn è una successione di Cauchy contenuta in un sottoinsieme chiuso C di uno spazio metrico X, allora xn → x¯ ∈ X per la completezza di X. Essendo C chiuso e x¯ limite di una successione contenuta in C, dev’essere x¯ ∈ C. Dunque ogni successione di Cauchy in C è convergente in C. 22 Sia xnk l’estratta convergente a x¯ ∈ X. Ora, per ogni ε > 0 esiste N tale che se n, nk > N abbiamo che dX (xn − xnk ) < ε (essendo la successione di Cau¯ < ε (essendo xnk convergente). chy) e anche dX (xnk − x) Quindi, grazie alla disuguaglianza triangolare, se n > N scegliamo nk > n e abbiamo ¯ ≤ dX (xnk − xn ) + dX (xnk − x) ¯ < 2ε. dX (xn − x)
Se xn è una successione di Cauchy, allora, per la compattezza di X, ammette un’estratta convergente, e dunque, per quanto dimostrato è convergente. 24 (a) Facciamo la verifica per d1 , si procede in modo analogo per d2 . Se m > n abbiamo Z 1 Z 1 n m − →0 | fm (x)− fn (x)| = x1/m −x1/n dx = m + 1 n + 1 0 0 se m, n → +∞. (b) La successione converge puntualmente alla funzione non continua f (0) = 0, f (x) = 1 se x , 0. Con un conto analogo al precedente si ottiene che fn converge ad f anche rispetto alle metriche integrali. La successione di Cauchy quindi non converge in C([0, 1]).
25 T decresce sull’intervallo [1, +∞) e la sua derivata è minima (massima in valore assoluto) in 1. Quindi abbiamo, per ogni x1 < x2 ∈ [1, +∞) T(x2 ) − T(x1 ) 1 ≥ T ′ (1) = − x2 − x1 4 da cui 1 |T(x2 ) − T(x1 )| ≤ |x2 − x1 |. 4 T è quindi una contrazione con α = 1/4. Si osservi che, grazie all’Esercizio 21 , l’intervallo chiuso [1, +∞) è completo, e il Teorema delle Contrazioni assicura l’esistenza ¯ ∈ [1, +∞) tale di un unico punto fisso per T, ovvero x√ ¯ Tale punto è x¯ = 2 (è sufficiente che x¯ = 1 + 1/(1 + x). risolvere l’equazione in [1, +∞)) e procediamo come nella dimostrazione del Teorema delle Contrazioni per determinarne un’approssimazione. Prendiamo ad esempio come punto di partenza x0 = 1 e consideriamo la successione xn = T(xn−1 ), per ogni n ≥ 1. Essendo x1 = 3/2,
Soluzioni degli esercizi – Capitolo VII
d(x0 , x1 ) = 1/2, dall’Osservazione (VII.37) a pagina 347 abbiamo la stima dell’errore √ 4 1 1 . |xn − 2| ≤ 3 4n 2 affinché questa quantità sia inferiore a 10−3 dobbiamo scegliere n > log4 (2000/3) ≈ 4.7. 26 Se f ammettesse due punti fissi, x¯1 , x¯2 allora dX (x¯1 , x¯2 ) = dX ( f (x¯1 ), f (x¯2 )) < dX (x¯1 , x¯2 ), assurdo. 27 La mappa F è continua, in quanto composizione di funzioni continue; quindi l’immagine di X è un insieme compatto di R, ovvero un insieme chiuso e limitato (si veda l’Esercizio 19 ). Ragionando ora come nella dimostrazione del Teorema di Weierstrass vista a pagina 301, essendo F(x) ≥ 0 per ogni x ∈ X, abbiamo che F assume il sua valore minimo α ≥ 0 per qualche x¯ ∈ X. ¯ = dX (x, ¯ f (x)) ¯ = 0, Se α = 0, abbiamo finito, infatti F(x) ¯ = x¯ è il punto fisso cercato; se invece α > 0 quindi f (x) otteniamo, dall’ipotesi su f , ¯ = dX ( f (x), ¯ f 2 (x)) ¯ < dX (x, ¯ f (x)) ¯ = F(x) ¯ = α, F( f (x))
627
¯ = F′ (0), calcoliamo ed essendo Dv f (x) F′ (t) = 2x¯ · v + 2tkvk2
¯ = F′ (0) = 2x¯ · v. da cui Dv f (x) cos x cos y − sin x sin y . x 31 J f (x, y) = 2x + y 2 2 y y e 2xye 32 Le derivate parziali di 1 sono ∂xi 1(x) = αkxkα−2 xi , quindi 1 è differenziabile in quanto le derivate parziali sono tutte continue in ogni punto di Rn . Inoltre ∇1(x) = αkxkα−2 x e la relazione (⋆) segue moltiplicando scalarmente entrambi i membri per x. Per dimostrare il Teorema di Eulero, fissato x ∈ A, consideriamo la funzione (derivabile nel suo insieme di definizione) f (λ) = 1(λx) = λα 1(x); la derivata di f quindi è f ′ (λ) = ∇1(λx) · x = αλα−1 1(x) e con la sostituzione y = λx si ottiene la tesi. 35 Applicando il corollario suggerito a ciascuna componente f j di f possiamo scrivere
in contraddizione con il fatto che α è il minimo di F. Quindi α = 0 e f ha un punto fisso, unico per l’esercizio precedente. 28 Vogliamo dimostrare che, fissato ε > 0, esiste δ tale ¯ 1 ), x(s ¯ 2 )) < ε. Abbiamo che se dS (s1 , s2 ) < δ allora dX (x(s ¯ 1 ), x(s ¯ 2 )) = dX (T(x(s ¯ 1 ), s1 ), T(x(s ¯ 2 ), s2 )) dX (x(s ¯ 1 ), s1 ), T(x(s ¯ 2 ), s1 )) + dX (T(x(s ¯ 2 ), s1 ), T(x(s ¯ 2 ), s2 )) ≤ dX (T(x(s
Se ora scegliamo δ tale che se dS (s1 , s2 ) < δ, allora ¯ 2 ), s1 ), T(x(s ¯ 2 ), s2 )) < ε˜ = ε(1 − α) (tale δ esiste dX (T(x(s per continuità di T nella seconda variabile), otteniamo ¯ 1 ), x(s ¯ 2 )) ≤ αdX (x(s ¯ 1 ), x(s ¯ 2 )) + ε, dX (x(s ˜
e quindi
ε˜ ¯ 1 ), x(s ¯ 2 )) ≤ dX (x(s = ε. 1−α 29 Dato che r è regolare, in particolare è differenziabile, e la sua matrice jacobiana è data dal vettore (colonna) r′ (t0 ). Quindi la definizione di differenziabilità per r in t0 si scrive come r(t0 + t) = r(t0 ) + r′ (t0 )t + o(t). Quindi la retta tangente al grafico di r è definita come il grafico della miglior approssimazione lineare di r. 30
Introduciamo la mappa F(t) = f (x¯ + tv) = kx¯ + tvk2
= (x¯ + tv) · (x¯ + tv) = kxk ¯ 2 + 2tx¯ · v + t2 kvk2
| fi (x + h) − fi (x)| = |∇ fi (ξi ) · h|
≤ k∇ fi (ξi )kkhk ≤ αi khk
(dove ξi è un opportuno punto del segmento [x, x + h]). Sommando su i otteniamo q k f (x + h) − f (x)k ≤ α21 + · · · + α2n khk da cui la tesi. 36
(a) I punti critici risolvono il sistema −1/x2 + 16yz = 0 −1/y2 + 16xz = 0 −1/z2 + 16xy = 0
di cui le soluzioni sono (1/2, 1/2, 1/2) e (−1/2, −1/2, −1/2). Essendo f (−x, −y, −z) = − f (x, y, z), possiamo limitarci a studiare la natura del primo, quella del secondo la dedurremo di conseguenza. La matrice hessiana di f è 3 16z 16y 2/x 3 16x H f (x, y, z) = 16z 2/y 3 16y 16x 2/z quindi 2 H f (1/2, 1/2, 1/2) = 8 1 1
1 2 1
1 1 2
i cui minori sono d1 = 16 > 0, d2 = 82 · 3 > 0 e d3 = 83 · 4 > 0. Dunque (1/2, 1/2, 1/2) è un minimo locale stretto, mentre (−1/2, −1/2, −1/2) è un massimo locale
628
Soluzioni degli esercizi – Capitolo VII
stretto. (b) L’unico punto critico è l’origine e 0 1 1 1 0 1 H1 (0, 0, 0) = . 1 1 0 Questa volta il metodo di Sylvester non dice nulla sulla natura di (0, 0, 0), ma la presenza del minore d2 = −1 < 0 suggerisce di studiare l’incremento di f in un intorno dell’origine sul piano z = 0; abbiamo f (x, y, 0) = xy che può assumere sia valori positivi che valori negativi vicino a (0, 0, 0). L’origine è quindi un punto di sella. (c) Anche in questo caso l’unico punto critico è l’origine e 1 0 1 1 0 −1 Hh (0, 0, 0) = . 1 −1 0 In modo del tutto analogo si conclude che è una sella.
38 (a) Moltiplicare e dividere il termine Q−1 o kx − x0 k + kϕ(x) − ϕ(x0 )k /kx − x0 k per kx − x0 k + kϕ(x) − ϕ(x0 )k. Quindi grazie alla linearità di Q−1 , si ha che tale rapporto è infinitesimo per x → x0 se e solo se il rapporto kx − x0 k + kϕ(x) − ϕ(x0 )k kϕ(x) − ϕ(x0 )k =1+ kx − x0 k kx − x0 k si mantiene limitato al tendere di x ad x0 . (b) Dalla (11) a pagina 368 maggioriamo kϕ(x) − ϕ(x0 )k/kx − x0 k con ! kϕ(x) − ϕ(x0 )k k−Q−1 P(x − x0 )k −1 +kQ η(x, ϕ(x))k 1 + . kx − x0 k kx − x0 k
Essendo
dove M = max{ξ: kξk=1} k−Q−1 Pξk.
39 Sostituendo si ottiene f (1, 0, −2, 2, −1/2) = (0, 0); inoltre # " y1 2x2 Dx f (x, y) = cos x2 −x1 sin x2 − 1 quindi
" −2 Dx f (1, 0, −2, 2, −1/2) = 1
0 −1
−1 0
x1 1
otteniamo
0 −2
#
# " " 1 −1 0 1 −1 · Dϕ(−2, 2, −1/2) = − 2 −1 −2 1 0 # " 1/2 −1/2 0 . = 3/2 −1/2 −2 2
D = lim Mk = lim Mk j k→∞
j→∞
= lim P−1 k j MPk j j→∞ ! ! −1 = lim Pk j M lim Pk j j→∞
j→∞
¯ = P¯ −1 MP, come volevasi dimostrare. 42 (a) f è una funzione di classe C∞ , e dobbiamo trovarne il minimo sul sottoinsieme n Y n x ∈ R : E= x = 1 i . i=1
La lagrangiana del problema è
#
il cui determinante è non nullo. La funzione implicita ϕ è dunque ben definita. La sua matrice jacobiana in (−2, 2, −1/2) è #−1 " −2 0 ·Dy f (1, 0, −2, 2, −1/2). Dϕ(−2, 2, −1/2) = − 1 −1
# 0 −2
41 Consideriamo lo spazio metrico Rn di tutte le matrici n×n, Pcon la metrica indotta dalla norma di Frobenius kAk2 = i,j A2i j (si veda l’esercizio (IV.7) a pagina 216). L’insieme di tutte le matrici ortogonali O(n) è un sotto2 spazio limitato di Rn , visto che la norma di una matrice ortogonale Q è uguale a kQk2 = n, ed è un sottospazio 2 chiuso di Rn , visto che è la controimmagine del punto 2 2 In mediante la funzione continua Rn → Rn definita da t A 7→ AA; quindi per il Teorema di Heine-Borel (VII.25) a pagina 339 O(n) è compatto. La successione Pk di matrici ortogonali ammette quindi una sottosuccessione convergente Pk j → P¯ in O(n), cioè Pk j converge ad una matrice ¯ Visto che P−1 è la trasposta di Pk , anche P−1 ortogonale P. j kj kj converge a P¯ −1 . Ma, dato che la successione Mk è convergente e il prodotto di matrici è una funzione continua nei coefficienti,
Pur di scegliere x sufficientemente vicino ad x0 (ancora una volta grazie alla linearità di Q−1 ) possiamo supporre kQ−1 η(x, ϕ(x))k ≤ 1/2 e ottenere la stima richiesta. A questo punto deduciamo la limitatezza del punto (a) kϕ(x) − ϕ(x0 )k k−Q−1 P(x − x0 )k ≤2 + 1 ≤ 2M + 1 kx − x0 k kx − x0 k
"
Dy f (x, y) =
L(x, λ) = x1 + x2 + ... + xn − λ(
n Y i=1
xi − 1).
I suoi punti critici sono soluzioni del sistema di n + 1 equazioni 0=
∂L (x, λ) = 1 − λx1 · · · xi−1 · xi+1 · · · xn ∂xi 0 = x1 · x2 · · · xn − 1
Soluzioni degli esercizi – Capitolo VIII
Sostituendo l’ultima in
∂L ∂xi
(per ogni i) si ottiene
λ ⇐⇒ xi = λ xi per ogni i; risostituendo nell’ultima si ha λn = 1 da cui λ = 1: ogni xi vale 1. L’unico punto critico dl L è perciò (1, ..., 1). Mostriamo ora è un minimo, cioè che f (x) ≥ f (1, ..., 1) per ogni x ∈ E tale che xi > 0. Procediamo per induzione a partire da n = 1, caso per cui l’affermazione è ovvia. Supponiamo vera la tesi per n (ovvero la somma di n numeri positivi che hanno prodotto 1 è sempre maggiore o uguale a n) e dimostriamolo per n + 1. Si considerino allora n + 1 numeri positivi xi che hanno prodotto 1. Se ogni xi = 1, la loro somma è n + 1 e la tesi è vera. Possiamo quindi supporre che ci sia un numero minore di 1, che chiamiamo xn e un altro maggiore di 1, ovvero xn+1 > 1. Chiamiamo y = xn · xn+1 : il prodotto degli n numeri x1 ,x2 ,...y è uguale a 1 e dunque per ipotesi induttiva la loro somma è maggiore di n 0=1−
x1 + x2 + ... + xn−1 + xn · xn+1 ≥ n.
Sfruttando questa si può scrivere
x1 + x2 + ... + xn + xn+1 = x1 + x2 + ... + xn−1 + + xn · xn+1 − xn · xn+1 + xn + xn+1 ≥ n + 1 + xn − 1 + xn+1 (1 − xn )
= n + 1 + (xn+1 − 1)(1 − xn ) ≥ n + 1.
(b) In modo del tutto analogo possiamo ora minimizzare la funzione f sotto la condizione x1 · x2 · · · xn = k > 0 e ottenere che il minimo si verifica quando √ √ n xi = k = n x1 · x2 · · · xn .
Quindi
√ min{x1 + x2 + · · ·+ xn : x1 · x2 · · · xn = k} = n n x1 · x2 · · · xn
e dunque, per ogni x1 , . . . , xn > 0 abbiamo √ x1 + x2 + · · · + xn ≥ n n x1 · x2 · · · xn .
Capitolo VIII 1 Dividendo per m, e posto v = x′ , l’equazione si può ricondurre al sistema ( ′ x (t) = v(t) γ v′ (t) = − mk sin(x(t)) − m v(t) + 1(t). Qui abbiamo y = (x, v) e f (t, y) = v, −
! γ k sin(x) − v + 1(t) . m m
629
Imporre una condizione iniziale ξ = (x0 , v0 ) significa assegnare la posizione e la velocità iniziali del pendolo. Il Teorema (VIII.9) si può applicare se la forzante 1 è continua. In tal caso, infatti, si ha f continua insieme alle sue derivate parziali rispetto a x e a v: infatti si ha ∂x f1 (t, x, v) = 0,
∂v f1 (t, x, v) = 1,
∂x f2 (t, x, v) = −k/m cos x,
∂v f2 (t, x, v) = −γ/m.
2 Si tratta evidentemente di una famiglia di soluzioni. Il problema è dimostrare che non ve ne sono altre. Come visto nell’esercizio precedente, l’equazione si può ricondurre al sistema ( ′ x (t) = v(t) v′ (t) = −ω2 x(t),
e già sappiamo che per ogni dato iniziale ξ = (x0 , v0 ) vi è esistenza ed unicità della soluzione del problema di Cauchy, per il Teorema (VIII.9). Osserviamo che le soluzioni della famiglia C1 sin(ωt) + C2 cos(ωt) esauriscono, al variare di C1 e C2 in R, tutte le possibili condizioni iniziali con t0 = 0: x0 = C2 e v0 = x′ (0) = C1 ω. L’unicità della soluzione del problema di Cauchy assicura quindi che non vi siano altre soluzioni dell’equazione: infatti se x¯ è una soluzione, essa condivide con la funzione x′ (0) sin(ωt)/ω + x(0) cos(ωt) la posizione e la velocità al tempo t0 = 0. Le due funzioni sono dunque uguali per ogni t. 3
Ponendo y1 (t) = y(t), y2 (t) = y′ (t), y3 (t) = y′′ (t), y4 (t) = y′′′ (t).
otteniamo il sistema ′ y1 = y2 y′ = y 2 3 y′ = y 4 3 y′ = −2y (t) − y (t) 3 1 4 di cui la matrice dei coefficienti è 0 1 0 0 0 0 1 0 A = . 0 0 0 1 0 0 −2 −1 4 (a) Derivando due volte si ottiene y′′ = y. (b) Derivando due volte si ottiene y′′ = 0. (c) Derivando abbiamo y′ = c2 ex + y e y′′ = 2c2 ex + y = 2(y′ − y) + y = 2y′ − y.
5 Si procede per induzione. Per k = 0, φ è continua per definizione (è derivabile) e quindi anche φ′ = f (t, φ(t)) lo è, cioè φ è di classe C1 ; supponiamo (passo induttivo) che se f ∈ Ck−1 (I) allora φ ∈ Ck (I) e consideriamo
630
Soluzioni degli esercizi – Capitolo VIII
f ∈ Ck (I). Allora di nuovo dall’equazione φ′ ∈ Ck (I), cioè φ è in Ck+1 . 6 Abbiamo y0 = 1 e t0 = 0; il primo elemento della successione quindi è y0 (t) ≡ 1 mentre i successivi sono Rt 2 y1 (t) = 1 + 0 1 + s ds = 1 + t + t2 Rt 2 3 y2 (t) = 1 + 0 1 + 2s + s2 ds = 1 + t + t2 + t3! Rt 3 y3 (t) = 1 + 0 1 + 2s + s2 + s3! ds 4 3 = 1 + t + t2 + t3 + t4! Rt 3 4 y4 (t) = 1 + 0 1 + 2s + s2 + s3 + s4! ds 4 5 3 t + t5! = 1 + t + t2 + t3 + 3·4 ... Rt 3 n sn−1 yn (t) = 1 + 0 1 + 2s + s2 + s3 + · · · + 2 (n−1)! + sn! ds Pn tk n+1 t . = 1 + t + 2 k=2 k! + (n+1)! Quindi la successione yn converge uniformemente su ogni intervallo chiuso e limitato di R alla funzione ∞ X tn 1 t − − = 2et − 1 − t. 2 n! 2 2 n=0
7
ˆ ˆ Sia v(t) = − y(−t). Allora v(0) = − y(0) =0e
ˆ v′ (t) = − yˆ ′ (−t)(−1) = yˆ ′ (−t) = f (−t, y(−t)) = f (−t, −v(t)) = f (t, v(t)).
intero p ≥ 1
[L(b − t0 )]p d∞ ψ1 , ψ2 d∞ T p (ψ1 ), T p (ψ2 ) ≤ p!
ed essendo [L(b − t0 )]p /p! il termine p-esimo della serie esponenziale convergente a eL(b−t0 ) , questa quantità è certamente più piccola di 1 se si sceglie p sufficientemente grande. L’operatore T p è dunque una contrazione, dunque, grazie all’Esercizio (VII.5), T ammette un punto fisso. 9 Sia T(φ)(t) definito da (9) (a pagina 398): osserviamo che Z t Z t ψ′ (s) ds, f (s, ψ(s)) ds−ψ(t0 )− T(ψ)(t)−ψ(t) = y0 + t0
t0
e dunque
Z
kT(ψ)(t)−ψ(t)k ≤ ky0 −ψ(t0 )k+
t t0
k f (s, ψ(s))−ψ′ (s)k ds,
di modo che kT(ψ)(t) − ψ(t)k ≤ 2ε(b − a). Prendiamo ora l’iterata p–esima dell’operatore integrale che è una contrazione, secondo quando provato nell’Esercizio 8 , e chiamiamo α la sua costante di Lipschitz. Osserviamo che, ragionandoPcome nell’esercizio precedente, si ha p kT p (ψ)(t) − ψ(t)k ≤ j=1 kT j (ψ)(t) − T j−1 ψ(t)k e dunque d∞ (T p (ψ), ψ) ≤ ε
p X
L j (b − a) j .
Quindi v soddisfa lo stesso problema di Cauchy soddisfatˆ Data l’unicità delle soluzioni, v(t) coincide con to da y. ˆ y(−t), ne segue che, per ogni t nell’intervallo massimale ˆ = − y(−t), ˆ di y si ha y(t) quindi l’intervallo massimale è simmetrico rispetto a 0 e yˆ è dispari. In modo del tutto analogo si dimostra che se è soddisfatto (**) allora yˆ è pari.
Possiamo ora applicare la stima dell’errore (3) a pagina 347 per concludere che se y è l’unico punto fisso di T p , allora p 1 X j d∞ (ψ, y) ≤ ε L (b − a) j . 1 − α j=1
8 Vogliamo dimostrare l’esistenza di un punto fisso per l’operatore T definito da (9) (a pagina 398). Utilizziamo la stima Passo 1 del Teorema (VIII.10) per ottenere: d∞ T 2 (ψ1 ), T 2 (ψ2 ) = maxkT(T(ψ1 ))(t) − T(T(ψ2 ))(t)k
10 Supponiamo che φ1 e φ2 siano due soluzioni distinte su un certo intervallo (t0 , t0 + α), α > 0, in cui entrambe sono definite e che φ2 (t0 + α) > φ1 (t0 + α). Sia ora n o t1 = inf t¯ ∈ (t0 , t0 + α) : φ2 (t) > φ1 (t), ∀t ∈ (t¯, t0 + α) ,
Z
≤ max t∈I0
≤ L max t∈I0
≤ L max t∈I0
t∈I0
t
t0
Z
k f (s, T(ψ1 )(s)) − f (s, T(ψ2 )(s))k ds t
t0
Z
kT(ψ1 )(s) − T(ψ2 )(s)k ds
t
t0
Lkψ1 (s) − ψ2 (s)k(s − t0 ) ds
(t − t0 )2 (b − t0 )2 ≤ L2 d∞ ψ1 , ψ2 max = L2 d∞ ψ1 , ψ2 . t∈I0 2 2 Iterando questo procedimento si ha, per un qualsiasi
j=1
allora φ2 (t) > φ1 (t), per ogni t ∈ (t1 , t0 + α]. Grazie all’ipotesi fatta su f otteniamo che f (t, φ2 (t)) ≤ f (t, φ1 (t)),
∀t ∈ (t1 , t0 + α]
e quindi, sullo stesso intervallo φ′2 (t) ≤ φ′1 (t). Dunque la funzione (di classe C1 ) u(t) = (φ2 − φ1 )(t) è tale che u(t1 ) = 0 u′ (t) ≤ 0 ∀t ∈ (t1 , t0 + α],
quindi u(t) ≤ 0 in (t1 , t0 + α], in contrasto col fatto che φ2 (t) > φ1 (t) in (t1 , t0 + α]. R t 11 Sia w(t) = c + t L f (s) ds , allora per ipotesi f (t) ≤ 0
Soluzioni degli esercizi – Capitolo VIII
631
Rt w(t). Se t ≥ t0 , w(t) = c + t L f (s) ds (infatti t ≥ t0 ed f 0 è non negativa); dal Teorema fondamentale del calcolo integrale w è derivabile e w′ (t) = L f (t) ≤ Lw(t) (infatti L > 0). Di conseguenza per ogni t ≥ t0 si ha d [w(t)e−Lt ] = w′ (t)e−Lt −Lw(t)e−Lt = e−Lt (w′ (t)−Lw(t)) ≤ 0. dt Allora w(t)e−Lt è decrescente perciò, essendo t ≥ t0 , w(t)e−Lt ≤ w(t0 )e−Lt0 = ce−Lt0 ,
da cui
w(t) ≤ ceL(t−t0 ) ,
che implica la tesi per t ≥ t0R. t0 Se t ≤ t0 abbiamo w(t) = c+ t L f (s) ds e w′ (t) = −L f (t) ≥ −Lw(t), da cui d [w(t)eLt ] = w′ (t)eLt + Lw(t)eLt = eLt (w′ (t) + Lw(t)) ≥ 0. dt In questo caso w(t)eLt è crescente e w(t)eLt ≤ w(a)eLt0 = ceLt0 ,
da cui
w(t) ≤ ceL(t0 −t) .
12 Poniamo f (t) = kΦ(t, y1 ; t0 ) − Φ(t, y2 ; t0 )k e osserviamo che, per come Φ è definita, si ha Φ(t, y1 ; t0 ) − Φ(t, y2 ; t0 ) Z t f (s, Φ(s, y1 ; t0 )) − f (s, Φ(s, y2 ; t0 )) ds. =y1 − y2 + t0
Pertanto abbiamo, utilizzando la disuguaglianza triangolare e l’equazione (10),
In particolare, per t ∈ I risulta w′ (t) ≤ Lw(t) e il Lemma di Gronwall dell’Esercizio 11 permette di concludere che w(t) ≤ w(ξ)eL(t−ξ) = 0,
∀t ∈ [ξ, c],
in contrasto col fatto che w(c) > 0. 14
Posto x = y′ si ottiene il sistema t ′ x = 1 + y2 + x2 y′ = x
con condizioni iniziali y(0) = 1 e x(0) = 2. Se chiamiamo ! t f (t, x, y) = ( f1 (t, x, y), f2 (t, x, y)) = , x 1 + y2 + x2 abbiamo ∂x f1 = −2tx/(1 + y2 + x2 )2 , ∂y f1 = −2ty/(1 + y2 + x2 )2 , ∂x f2 = 1, ∂y f2 = 0; dunque f ∈ C1 (R3 ) e il problema ammette una unica soluzione definita in un intorno del dato iniziale. In realtà le derivate di f sono limitate in ogni striscia di tipo [a, b] × R2 , con a e b fissati dunque il teorema di esistenza e unicità globale si può applicare e garantisce che il problema dato ha una unica soluzione prolungabile in un qualsiasi intervallo [a, b]: questo significa che la soluzione del problema in realtà è definita in tutto R. Per il polinomio di Taylor servono dunque i valori di y, y′ e y′′ in t = 0. I primi due sono forniti dalle condizioni iniziali; la derivata seconda si legge nell’equazione differenziale per t = 0, infatti 0 y′′ (0) = = 0. 1 + y2 (0) + (y′ (0))2
f (t) =kΦ(t, y1 ; t0 ) − Φ(t, y2 ; t0 )k Z t Si trova dunque il polinomio 1 + 2t. k f (s, Φ(s, y1 ; t0 )) − f (s, Φ(s, y2 ; t0 ))k ds. ≤ky1 − y2 k + 15 Essendo f continua t0 Z t lim yˆ ′ (t) = f (l) ∈ R. ≤ky1 − y2 k + LkΦ(s, y1 ; t0 ) − Φ(s, y2 ; t0 )k ds t→+∞ t0 Se per assurdo f (l) , 0, allora fissato ε > 0 esiste T1 Z t tale che se t > T1 allora | yˆ ′ (t)| > ε; per ipotesi è però ≤ky1 − y2 k + L f (s) ds anche possibile determinare T2 tale che se t > T2 si ha t0 ˆ + 1) − y(t)| ˆ | y(t < ε. Se ora si definisce T = max(T1 , T2 ), apLa tesi segue dal Lemma di Gronwall. plicando il Teorema del Valor Medio a un qualsiasi inter13 Sia M = max[a,b] {|y1 |+|y2 |} e L la costante di Lipschi- vallo [t, t + 1] con t > T si ottiene l’esistenza di t˜ ∈ (t, t + 1) ′ tz di f2 (x, y) rispetto a y nel rettangolo [a, b] × [−M, M]. tale che | yˆ (t˜)| < ε, in contraddizione con quanto detto. Chiamiamo w(t) = y1 (t) − y2 (t): vogliamo dimostrare che 16 f soddisfa le ipotesi del Teorema di esistenza e w(t) ≤ 0 in [t0 , b]. Per assurdo supponiamo che esista unicità locale (VIII.9) nella striscia R × (a, b) e y ≡ l1 , c ≥ x0 tale che w(c) > 0; necessariamente c > t0 perché y ≡ l2 sono soluzioni. Quindi la soluzione con dato w(t0 ) ≤ 0 per ipotesi Chiamiamo ˆ iniziale y(0) = y0 ∈ (l1 , l2 ) è tale che y(t) ∈ (l1 , l2 ), ∀t ∈ Imax . Inoltre, essendo f > 0 in (l1 , l2 ), yˆ è stretξ = sup{x ≤ c : w(x) ≤ 0}. tamente monotona e dunque ammette limite agli estreOsserviamo che w(ξ) = 0 e w > 0 in I = (ξ, c]. Inoltre si mi del suo intervallo massimale di definizione; ricordanha, per ogni t, do la descrizione fatta a pagina 403, (ad esempio) Tmax w′ (x) = y′1 (t) − y′2 (t) = f1 (t, y1 (t)) − f2 (t, y2 (t)) non può essere limitato, perché il punto (Tmax , l) non si ≤ f2 (t, y1 (t)) − f2 (t, y2 (t)) ≤ L|y1 (t) − y2 (t)| = L|w(t)|. trova sul bordo del dominio di definizione di f . Quindi
632
Soluzioni degli esercizi – Capitolo VIII
Tmax = +∞ e concludiamo applicando l’Esercizio 15 (inˆ fatti limt→+∞ y(t) = l ∈ (l1 , l2 ] e non essendoci altri zeri di f in (l1 , l2 ) necessariamente l = l2 ). In Tmin si ragiona analogamente.
tutte le soluzioni sono prolungabili su R: se y0 > 0 da un certo valore di t in poi si trovano necessariamente sotto al grafico di y = et /3, se invece y0 < 0 sono crescenti e superiormente limitate.
17 Seguiamo lo schema proposto nell’Esercizio (VIII.6). Per l’esistenza e unicità della soluzione, osserviamo che le ipotesi del Teorema (VIII.9) di esistenza e unicità locale sono verificate: infatti f (t, y) = (y2 − 1)3 ,è di classe C1 in R × R. Quindi per ogni punto del piano ty passa una e una sola soluzione dell’equazione differenziale. Non sono invece verificate le ipotesi del Teorema (VIII.10) di esistenza globale; infatti f (t, y) ∼ y6 per y → ∞ e non è sublineare. Non possiamo quindi sapere a priori quale sarà il massimo intervallo di esistenza di ciascuna soluzione. Le soluzioni costanti sono y(t) = 1 e y(t) = −1: quando a = ±1 otteniamo quindi una soluzione costante, definita su tutto R. Anche quando a ∈ (−1, 1) la soluzione, ya è definita su tutto R, grazie al risultato contenuto nell’Esercizio 16 ; avremo inoltre limt→−∞ ya (t) = 1 e limt→+∞ ya (t) = −1. Osserviamo inoltre che ya (t) ∈ (−1, 1) per ogni t ∈ R, quindi y′a (t) < 0 per ogni t ∈ R. Possiamo studiare y′′ derivando l’equazione differenziale:
21 Si osserva che l’equazione soddisfa il Teorema di esistenza e unicità locale in tutti i punti del piano e che y = 0 è soluzione. La prolungabilità segue da ragionamenti analoghi a quelli fatti per la risoluzione dell’Esercizio 20 attraverso lo studio di y′ .
y′′ (t) = 2y(t)y′ (t)(y2 (t) − 1)2 = 2y(t)(y2 (t) − 1)5 .
Quindi y′′ ≥ 0 se −1 < y ≤ 0, y′′ < 0 se 0 ≤ y < 1 e tutte le soluzioni presentano un punto di flesso (discendente), che si trova sull’asse delle t. 18 Il Teorema (VIII.9) è applicabile per ogni valore di a, mentre il Teorema (VIII.10) per nessuno. Se a ∈ [0, 5] le soluzioni sono definite su R (costanti oppure ragionando come nell’Esercizio 16 ), come anche se a > 5 (monotone crescenti e inferiormente limitate su (−∞, 0), decrescenti e inferiormente limitate su (0, +∞)). Non si può invece dire nulla quando a < 0. 19 Se a ∈ [−1, +1] è tutto R (soluzioni costanti se a = ±1, si usa il risultato dell’Esercizio 16 ). Se a > 1 oppure a < −1 abbiamo y′ > 0, quindi l’intervallo massimale sarà, nel primo caso del tipo (−∞, α), con α > 0, nel secondo (β, ∞) con β < 0. α èR finito grazie alla +∞ convergenza dell’integrale improprio a dy/[ey (y2 − 1)]; analogamente si ottiene che β è finito. 20 ∀y0 ∈ R esiste una unica soluzione locale; il teorema di esistenza globale è applicabile su intervalli del tipo [−a, 0], quindi è garantita la prolungabilità delle soluzioni su (−∞, 0] per ogni valore di y0 . y ≡ 0 è l’unica soluzione costante; nei punti dell’asse y e in quelli del grafico di y = et /3 le soluzioni hanno tangente orizzontale. Dallo studio del segno di y′ deduciamo inoltre che
22 Supponiamo che esistano costanti non tutte nulle tali che c1 w1 (t) + · · · ck wk (t) = 0, per ogni t, cioè c1 w1 (t) + · · · ck wk (t) 0 c1 w′1 (t) + · · · + ck w′k (t) 0 = . . .. .. . (n−1) (n−1) 0 c1 w1 (t) + · · · ck wk (t)
La prima riga ci dice che c1 w1 (t) + · · · ck wk (t) = 0, per ogni t. D’altra parte, se c1 w1 (t) + · · · ck wk (t) = 0, per ogni t, allora, derivando, abbiamo c1 w′1 (t) + · · · ck w′k (t) = 0 e ugualmente per le derivate successive. Dunque c1 w1 +· · · ck wk = 0.
24 La mappa A : R → X (X spazio di matrici a cui A e B appartengono) è continua in t0 se ∀ε > 0, ∃δ > 0 : (|t − t0 | < δ ⇒ dX (A(t) − A(t0 )) < ε) qP 2 ed essendo d(A(t) − A(t0 )) = i,j (ai j (t) − ai j (t0 )) (si ve-
da a pagina 416) questo implica che le |ai j (t) − ai j (t0 )| < ε per ogni coppia di indici (i, j), ovvero la continuità delle componenti di A(t). Viceversa, se le componenti sono continue, allora scegliamo δ in modo tale che per ogni coppia di indici (i, j) si abbia |ai j (t) − ai j (t0 )| < ε/(nm) e otteniamo la continuità di A. ② e ③ seguono da ragionamenti del tutto analoghi. Vediamo quindi ④. Questa segue facilmente dalla definizione di prodotto tra due matrici (vista a pagina 172). Scegliamo per semplicità A(t) e B(t) funzioni matriciali a valori nelle matrici quadrate di ordine n. Abbiamo (con b1 (t), . . . , bn (t) indichiamo le colonne di B(t)) A(t)B(t) = (A(t)b1 (t) . . . A(t)bn (t)) quindi, derivando per componenti, [A(t)B(t)]′ = ([A(t)b1 (t)]′ . . . [A(t)bn (t)]′ ) . P j Essendo, per ogni i = 1, . . . , n, A(t)bi (t) = nj=1 a j (t)bi (t), P j j n ′ ′ otteniamo [A(t)bi (t)]′ = j=1 [a j (t)bi (t) + a j (t)(bi ) (t)] = ′ ′ A (t)bi (t) + A(t)bi (t) da cui la tesi.
25 Il polinomio caratteristico associato alla matrice A è di secondo grado, quindi può avere due radici reali e distinte, oppure una unica radice reale di molteplici-
Soluzioni degli esercizi – Capitolo VIII
tà doppia, oppure due radici complesse e coniugate. Tali valori sono gli autovalori di A. Nel primo caso A è diagonalizzabile ed S è la matrice degli autovettori, siamo quindi nella situazione descritta in ① (si veda il Corollario (IV.81) a pagina 207). Il caso di autovalori complessi coniugati è già stato preso in considerazione nella Proposizione (VIII.50) e nel Corollario (VIII.54) e siamo quindi nella situazione ③. Infine se A ha un unico autovalore, allora l’autospazio può avere dimensione 2 (nel qual caso A deve già essere diagonale, come mostrato nell’Esempio (VIII.49) a pagina 419 e quindi siamo nella situazione ①) oppure può ammettere una unica autodirezione. In quest’ultimo caso chiamiamo λ l’autovalore (reale) di A e (v, 1) la sua autodirezione. Scegliamo ora w , v e consideriamo la matrice invertibile # " # " 1 v w 1 −w −1 , S = S= 1 1 v v − w −1 Otteniamo, sfruttando le relazioni a11 v + a12 = λv e a21 v + a22 = λ, 2 λ a11 w + a12 − a21 w − a22 w v−w S−1 AS = w(−a11 + a21 v) − a12 + a22 v . 0 v−w Vogliamo quindi trovare un valore di w tale che w(−a11 + a21 v) − a12 + a22 v = λ(v − w) a w + a − a w2 − a w = v − w; 11
12
21
22
2
sostituendo a11 w + a12 = a21 w + a22 w + v − w nella prima equazione si ottiene (supponendo a21 , 0, altrimenti A è già nella forma ②) w = (λ + 1 − a22 )/a21 valore certamente diverso da v = (λ − a22 )/a21 . 26 Si ha ( ′ y1 = ay1 + by2 y′2 = cy1 + dy2 .
( =⇒
y′′1 = ay′1 + by′2 y′′2 = cy′1 + dy′2 .
Si tratta in totale di quattro equazioni nelle sei variabili yi , y′i , y′′i (i = 1, 2). Eliminiamo y′2 dalla prima e otteniamo y′′1 = ay′1 + b(cy1 + dy2 ) = ay′1 + bcy1 + bdy2 e sostituendo by2 = y′1 − ay1 otteniamo y′′1 = ay′1 + bcy1 + d(y′1 − ay1 ),
da cui segue
y′′1 − (a + d)y′1 + (ad − bc)y1 = 0.
27 L’asserto è stato provato nel caso n = 2 nell’Esempio (VIII.37). Procediamo per induzione, supponendo di
633
aver dimostrato che 1 0 ··· 0 −λ −λ 1 ··· 0 0 . .. .. .. .. det .. = . . . . 0 0 0 ··· 1 −a1 −a2 −a3 · · · −an−1 − λ i h (−1)n−1 λn−1 + an−1 λn−2 + . . . + a2 λ + a1 . Se sviluppiamo det (A − λIn ) lungo la prima colonna otteniamo p(λ) = −λ(−1)n−1 (λn−1 + an−1 λn−2 + . . . + a1 ) h i + (−1)1+n (−a0 ) · 1 = (−1)n λn + an−1 λn−1 + . . . + a1 λ + a0 . 28 I primi termini della successione sono Z t Y1 (t) = I0 + f (s)AY0 (s) ds = I0 + AI0 F(t), Z
0 t
f (s)AY1 (s) ds = I0 + AI0 F(t) + A2 I0 F(t)2 /2
Y2 (t) = I0 + 0
= (In + AF(t) + A2 F(t)2 /2)I0 . Procedendo per induzione abbiamo che se supponiamo Yk (t) = (In + AF(t)t + A2 F(t)2 /2 + . . . + Ak+1 F(t)k /k!)I0 otteniamo Yk+1 (t) = (In +AF(t)+A2F(t)2 /2+. . .+Ak+1 F(t)k+1 /(k+ 1)!)I0 e quindi, grazie alla Definizione (VIII.42), per k → +∞, abbiamo la tesi. 29 (a) Autovalori: λ = −1, 3; autovettori corrispondenti (1, −2) e (1, 2); la soluzione è " # " # # " y1 (t) 3t 1 −t 1 . + c2 e = c1 e 2 −2 y2 (t) (b) √ λ = 2, −2; autovettori corrispondenti √ Autovalori: ( 3, 1) e (1, − 3); la soluzione è "√ # # " " # 1√ y1 (t) 3 2t −2t = c1 e + c2 e . y2 (t) − 3 1
(c) Autovalori: λ = 2, −1; autovettori corrispondenti (2, 1) e (1, 2); la soluzione è " # " # # " y1 (t) −t 1 2t 2 . + c2 e = c1 e 2 1 y2 (t)
(d) Abbiamo già calcolato autovalori (λ = 3, 4, 5) e autovettori (rispettivamente (2, 1, −1), (3, 1, −1) e (3, 0, −1)) nell’Esercizio 33 a pagina 223; la soluzione generale quindi è 3 3 2 y1 (t) y (t) 2 = c1 e3t 1 + c2 e4t 1 + c3 e5t 0 . −1 −1 −1 y3 (t) (e)
Anche per questa matrice abbiamo già calcolato
634
autovalori (λ = −1, 1, 2) e autovettori (rispettivamente (0, 1, 1), (1, 1, 1) e (1, 0, 1)) nell’Esercizio 33 a pagina 223; la soluzione generale quindi è 1 1 0 y1 (t) y (t) 2 = c1 e−t 1 + c2 et 1 + c3 e2t 0 . 1 1 1 y3 (t) (f) La matrice è simmetrica, quindi ammette una base di autovettori; i suoi autovalori sono λ = 2 con autodirezione (1, 1, 1) e λ = −1, di molteplicità 2 e autodirezioni (linearmente indipendenti) (1, 0, −1) e (0, 1, −1); la soluzione generale quindi è 0 1 1 y1 (t) y (t) −t −t 2t 2 = c1 e 1 + c2 e 0 + c3 e 1 . −1 −1 1 y3 (t) (g) Gli autovalori sono λ1 = 3 e λ2 = λ3 = 1 con autovettori (0, 1, 1), (1, 0, 0) e (0, 1, −1). La soluzione è 0 1 0 y1 (t) y2 (t) = c1 e3t 1 + c2 et 0 + c3 et 1 . −1 0 1 y3 (t)
30 (a) Gli autovalori della matrice associata al sistema sono λ = 2, 4; le autodirezioni corrispondenti (1, 3) e (1, 1); la soluzione generale del sistema è " # " # # " x(t) 4t 1 2t 1 , + c2 e = c1 e 1 3 y(t) e imponendo la condizione iniziale si trova c1 = −3/2 e c2 = 7/2. (b) Gli autovalori sono λ = 3, −1, le autodirezioni corrispondenti (1, 5) e (1, 1); la soluzione generale del sistema è " # " # −t 1 3t 1 , + c2 e y = c1 e 1 5 e imponendo la condizione iniziale si trova c1 = c2 = 1/2. (c) Gli autovalori sono λ = 1, 2, 3, le autodirezioni corrispondenti (0, −2, 1), (1, 1, 0) e (2, 2, 1); la soluzione generale del sistema è 2 1 0 y = c1 et −2 + c2 e2t 1 + c3 e3t 2 1 0 1 e imponendo la condizione iniziale si trova c1 = 1, c2 = 2 e c3 = 0. (d) Gli autovalori della matrice associata al secondo sistema sono 1, −2, 3 e la soluzione generale è x(t) = 3c2 e3t − 2c3 e−2t , y(t) = c2 e3t + c3 e−2t , z(t) = c1 et + (3/2)c2 e3t − c3 e−2t ; imponendo la condizione iniziale otteniamo: c1 = 0, c2 = 2/5 e c3 = 3/5. (e) Gli autovalori sono λ = −1, 1, 4, le autodirezioni corrispondenti (1, −2, 1), (1, 2, −1) e (2, 1, −8); la soluzione generale del
Soluzioni degli esercizi – Capitolo VIII
sistema è
2 1 1 y = c1 e−t −2 + c2 et 2 + c3 e4t 1 −8 −1 1
e imponendo la condizione iniziale si trova c1 = 3, c2 = 6 e c3 = −1. 31 (a) y0 (t) = A sin(λt) + B cos(λt) sono, al variare di A, B ∈ R, le soluzioni dell’equazione omogenea. Per determinare una soluzione particolare dell’equazione completa è necessario considerare separatamente il caso in cui λ , 1 oppure λ = 1. Nel primo la cerchiamo del tipo α cos t (deve essere pari!), quindi sostituendo troviamo α = 1/(λ2 − 1) e l’integrale generale è: y(t) = A sin(λt) + B cos(λt) + 1/(λ2 − 1) cos t.
Se imponiamo le condizioni ai limiti otteniamo: y(0) = B + 1/(λ2 − 1) = 0 y(π) = A sin(λπ) + B cos(λπ) − 1/(λ2 − 1)
ovvero B = 1/(1 − λ2 ) e A sin(λπ) = [1 + cos(λπ)]/(λ2 − 1). A seconda del valore di λ, la seconda equazione ammetterà una unica, nessuna oppure infinite soluzioni: precisamente abbiamo che se sin(λπ) , 0, ovvero se λ < N allora ricaviamo un unico valore di A, quindi una unica soluzione; se invece λ = n ∈ N r {1} allora la seconda equazione diventa 0 = [1+cos(nπ)]/(n2 −1) ed è soddisfatta per ogni valore di A se e solo se cos(nπ) = −1, ovvero se e solo se n è dispari. Rimane da considerare il caso λ = 1: la soluzione particolare è del tipo αt sin t e sostituendo si ottiene α = 1/2; quindi imponendo le condizioni ai limiti abbiamo questa volta le condizioni y(0) = B = 0 e y(π) = −B = 0. Essendo entrambe soddisfatte per ogni valore di A, in questo caso abbiamo infinite soluzioni: y(t) = (A + t/2) sin t,
A ∈ R.
Riassumendo: λ < N il problema ai limiti ammette una unica soluzione, se invece λ ∈ N ed è dispari allora ci sono infinite soluzioni (diverse a seconda che λ sia 1 oppure no); quando invece λ ∈ N ed è pari non esistono soluzioni. (b) L’integrale generale dell’equazione differenziale è y(t) = e−2t [C1 cos(λt)+C2 sin(λt)], C1 , C2 ∈ R. Le condizioni ai limiti dell’intervallo (0, 1) sono 2C1 − 2C1 + λC2 = 0 e
e−2 [C1 cos λ + C2 sin λ] = 0
ovvero C2 = 0 e C1 cos λ = 0. Quindi se λ = π/2 + nπ, n ∈ Z, il problema ammette infinite soluzioni, altrimenti esiste solamente la soluzione nulla. 32 Gli autovalori della matrice associata al sistema sono 1 e 3. Le autodirezioni corrispondenti sono (1, −1) e
Soluzioni degli esercizi – Capitolo VIII
635
(1, 1), quindi una matrice wronskiana è " t # e e3t W(t) = −et e3t e la risolvente
Φ(t) = W(t)[W(0)]
−1
" 1 et + e3t = 2 −et + e3t
# −et + e3t . et + e3t
La soluzione con dato iniziale y0 = (1, 2) è " # 1 −et + 3e3t . y(t) = Φ(t)y0 = 2 et + 3e3t √ 33 (a) Gli autovalori sono 1 ± i 2, quindi l’origine è un √ fuoco instabile. Gli autovettori (complessi) sono (1, ±i 2); due soluzioni √ linearmente √ indipendent ti sono y√ 1 (t) = e (v cos( 2t) + u sin( 2t)) e y2 (t) = √ √ et (−v sin( 2t)+u cos( 2t)) dove u = (1, 0) e v = (0, − 2). (b) Gli autovalori sono ±i, quindi l’origine è un centro. Gli autovettori sono (1, −1/2 ∓ i/2) quindi due soluzioni linearmente indipendenti sono y1 (t) = (v cos t + u sin t) e y2 (t) = (−v sin t + u cos t) dove u = (1, −1/2) e v = (0, −1). (c) Gli autovalori sono −1 ± 2i, quindi l’origine è un fuoco stabile. Gli autovettori sono (1, ±2i) quindi due soluzioni linearmente indipendenti sono y1 (t) = e−t (v cos 2t + u sin 2t) e y2 (t) = e−t (−v sin 2t + u cos 2t) dove u = (1, 0) e v = (0, 2). 34 Gli autovalori di A sono ±i; l’autovettore (complesso) corrispondente a i è (i − 1, 1) = (−1, 1) + i(1, 0); quindi # # " # " " cos t − sin t 0 −1 1 −1 ˆ , etA = , Aˆ = Sˆ = sin t cos t 1 0 0 1 Quindi la matrice risolvente è " cos t − sin t tA tAˆ ˆ −1 ˆ e = Se S = sin t
−2 sin t sin t + cos t
#
e la soluzione con dato iniziale (3, 2) si ottiene moltiplicando la risolvente per il vettore (3, 2): y(t) = (3 cos t − 7 sin t, 5 sin t + 2 cos t). 35 (a) λ = 1 è autovalore doppio, con autospazio di dimensione 1, generato dal vettore v = (−1, 1). L’origine è quindi un nodo improprio. Consideriamo ora il vettore w = (1, 1), linearmente indipendente da (−1, 1) e la matrice Sˆ = (v, w). Otteniamo # " 1 −2 −1 ˆ ˆ ˆ S AS = A = 0 1 quindi la matrice risolvente del sistema è # " " ˆ tAˆ Sˆ −1 = Se ˆ t 1 −2t Sˆ −1 = et t + 1 etA = Se 0 1 −t
# t . 1−t
Quindi l’integrale generale è x(t) = et [C1 (1 + t) + C2 t] y(t) = et [−C1 t + (1 − t)C2 ]; in particolare se C1 = −1 e C2 = 1 troviamo la semiretta y = −x, con x < 0; se invece C1 = 1 e C2 = −1 troviamo la semiretta y = −x, con x > 0. (b) λ = 0 è autovalore doppio, ma l’autospazio corrispondente è di dimensione 1 ed è generato da (1, 0). Possiamo determinare l’integrale generale direttamente dalle equazioni del sistema; infatti integrando la seconda, y′ = 0, quindi sostituendo nella prima, x′ = 2y, e integrando nuovamente si ottiene: x(t) = 2C1 t + C2 e y(t) = C1 . I punti dell’asse delle x sono di equilibrio (instabile), tutte le altre traiettorie sono rette parallele all’asse x. 36 (a) Gli autovalori della matrice sono a + 1 e a − 1, sono quindi sempre reali; per a < −1, (0, 0) un nodo stabile a due tangenti, per −1 < a < 1 è una sella, per a > 1 un nodo instabile a due tangenti. Per a = 1 e a = −1 uno dei due autovalori è nullo, mentre l’altro è 2 (se a = 1) o -2 (se a = −1); in entrambi i casi si ha una retta di punti di equilibrio, y = −x = oppure y = x e tutte le traiettorie sono contenute nelle rette ortogonali alla retta di punti di √ equilibrio. (b) Gli autovalori della matrice sono −1 ± a + 2; se a < −2 l’origine è un fuoco stabile; se a = −2 abbiamo due radici uguali a -1 e l’origine è un nodo improprio stabile; se a ∈ (−2, −1) entrambe le radici sono reali e negative e l’origine è un nodo a due tangenti stabile; se a > −1 l’origine è una sella, quando invece a = −1 abbiamo una retta di punti di equilibrio, y = −x e tutte le traiettorie sono contenute nel fascio rette con coefficiente angolare −1/3. (c) Gli autovalori della ma√ trice sono 1 ± a + 1; se a > 0 l’origine è una sella; se a = 0 le traiettorie sono contenute nel fascio di rette con coeff. angolare 2 e l’asse x è composto da punti di equilibrio; se a ∈ (−1, 0) abbiamo un nodo instabile; se a < −1 un fuoco instabile, mentre se a = −1 un nodo improprio. 37 (a) Gli autovalori della matrice associata al sistema sono ±1; gli autovettori (1, 1) e (1, 3), quindi una matrice wronskiana ha in colonna i vettori w1 = et (1, 1) w2 = e−t (1, 3). Vogliamo quindi determinare due funzioni c1,2 (t) tali che " # " " ′ # # 2t c1 (t) (3t + t2 /2)e−t = W −1 (t) 2 = ′ 2 t −t c2 (t) (−t − t /2)e da cui si ricava ad esempio c1 (t) = −(t2 /2 + 4t + 4)e−t e c2 (t) = −tet /2. Una soluzione particolare quindi è # # " 2 " t + 4t + 4 c (t) . =− 2 yp (t) = W(t) 1 2t + 4t + 4 c2 (t)
(b) Autovalori: 0, −2; autovettori: (3, 4), (1, 2). Una matrice wronskiana, W(t), ha in colonna i vettori (3, 4) e
636
(e−2t , 2e−2t ); vogliamo trovare c1,2 (t) tali che # " # " " ′ # sin t + 1/2 cos t sin t c1 (t) = = W −1 (t) 2t 2t . ′ −2 sin te − 3/2 cos te − cos t c2 (t) Integrando si ottiene # # " " 2/5 sin t − 16/5 cos t c (t) . = yp (t) = W(t) 1 −1/5 sin t − 22/5 cos t c2 (t)
38 La matrice risolvente, W(t) corrispondente a tale scelta di f e 1 ha determinante ω. Pertanto otteniaRt mo da (23) c(t) = aω−1 0 − sin ωs cos φs ds e d(t) = Rt aω−1 0 cos ωs cos φs ds. Possiamo calcolare questi integrali utilizzando le formule di Werner (cfr. pag. 55): Rt −a c(t) = 2ω [sin(ω + φ)s + sin(ω − φ)s] ds e d(t) = 0 Rt a [cos(ω + φ)s + cos(ω − φ)s] ds. Se ω , ±φ otteniamo 2ω 0 h i 1 1 a (cos(ω + φ)t − 1) + ω−φ (cos(ω − φ)t − 1) e c(t) = 2ω ω+φ h i a 1 1 d(t) = 2ω sin(ω + φ)t + ω−φ sin(ω − φ)t) . Una soluω+φ zione particolare è pertanto (si utilizzino nuovamente le formule di Werner nell’ultimo passaggio) yp (t) = c(t) cos ωt + d(t) sin ωt " # a cos(ω + φ)t − 1 cos(ω − φ)t − 1 = + cos ωt 2ω ω+φ ω−φ # " 1 1 a sin(ω + φ)t + sin(ω − φ)t) sin ωt + 2ω ω + φ ω−φ cos φt cos ωt −a 2 . =a 2 ω − φ2 ω − φ2
Se invece, per esempio, ω = φ perveniamo a c(t) = Rt Rt −a a sin 2ωs ds = 4ωa 2 (cos 2ωt − 1) e d(t) = 2ω [cos 2ωs + 2ω 0 0 at 1] ds = 4ωa 2 sin 2ωt + 2ω . Una soluzione particolare è pertanto (si utilizzino nuovamente le formule di Werner nell’ultimo passaggio)
Soluzioni degli esercizi – Capitolo VIII √ h √ √ i 2 te (a). (b) y = e 2 x C1 cos 22 x + C2 sin 22 x + √ √ i h √ 2 e− 2 x C3 cos 22 x + C4 sin 22 x + 12 sin x. (c) y = C1 cos x + C2 sin x + C3 x cos x + C4 x sin x + x2 + x − 3.
41
Poiché x(0) = x(T) e y(0) = y(T) si ha Z T ′ x dt = [ln x(t)]T0 = ln x(T) − ln x(0) = 0 x 0 R T y′ e analogamente 0 y dt = 0. Integrando ambo i membri del sistema di equazioni differenziali si ottiene Z T Z T Z T ′ x dt = (a − by) dt = aT − b y(t) dt 0= x 0 0 0 RT e analogamente 0 = −cT + d 0 x(t) dt. 42 Il rapporto fra il numero medio delle prede e quello dei predatori è, secondo quanto provato nell’Esercizio 41 il quoziente q = bc/ad. Ricordiamo che a è il tasso di crescita delle prede in assenza di predatori, così come −c è quello di decrescita dei predatori in assenza di prede. Un prelievo indiscriminato fa diminuire in ugual modo tali tassi a 7→ a − ε e −c 7→ −c − ε, mentre lascia invariate le quantità b e d legate all’interazione fra le due specie. Poiché la funzione ε 7→ (c + ε)/(a − ε) è una funzione crescente, anche il rapporto q cresce con ε > 0. 43
(a) Il sistema in coordinate polari è ( ′ r = r(cos r2 − 1) ϑ′ = −1;
quindi, r′ < 0 quando r è prossimo a r = 0 e l’origine è un punto di equilibrio asintoticamente √ stabile. Osserviamo inoltre che r′ = 0 quando r = rk = 2kπ, k ∈ N, quindi le circonferenze di raggio rk sono delle orbite; inoltre r′ < 0 per ogni r , rk . (b) Il sistema in coordinate polari è ( ′ r = −2r(r2 − 1)/(4 + r2 )
yp (t) = c(t) cos ωt + d(t) sin ωt ϑ′ = 1; a a at sin ωt = (cos 2ωt − 1) cos ωt + sin 2ωt sin ωt + quindi, r′ > 0 quando r è prossimo a r = 0 e l’origine è un 4ω2 4ω2 2ω punto di equilibrio instabile. Inoltre r′ > 0 in (0, 1), r′ = 0 at sin ωt se r = 1 e r′ < 0 in (1, +∞), quindi il cerchio di raggio 1 è . = 2ω una orbita. 39 (a) y(t) = C1 + C2 ex + C3 e−x . (b) y(x) = C1 + C2 x + C3 e−x + C4 ex . (c) y(x) = C1 ex + C2 xex + C3 e−x + C4 xe−x . (d) y(x) = C1 ex + C2 e−x + C3 sin x + C4 cos x. 40 (a) λ = 1 è uno zero del polinomio caratteristico dell’equazione quindi cerchiamo una soluzione del tipo Axex ; sostituendo nell’equazione si ottiene A = 1/2; si ottiene l’integrale generale sommando la soluzione particolare appena trovata alla soluzione dell’equazione omogenea dell’esercizio preceden-
44 (a)√L’energia potenziale è x√− x3 , che ha un minimo in − 3/3 e un √ massimo in 3/3; quindi nel piano ′ (x, √x ) il punto (− 3/3, 0) è un equilibrio √ stabile, mentre √ essendo −U(− 3/3) = −2 √ 3/9 e ( 3/3, √ 0) è instabile; √ −U( √3/3) = 2 3/9, esistono orbite chiuse se −2 3/9 ≤ h ≤ 2 3/9. (b) L’energia potenziale è x4 /4 − x2 /2, ha due minimi (assoluti) in ±1, in cui vale −1/4 e un massimo in 0 in cui si annulla; quindi nel piano (x, x′ ) i punti (±1, 0) sono equilibri stabili, mentre (0, 0) è instabile; tutte le or-
Soluzioni degli esercizi – Capitolo IX
bite sono chiuse e non sono vuote non appena h ≥ −1/4, a parte per h = 0. 45 Le coordinate polari sono individuate dalle relazioni x = r cos ϑ, y = r sin ϑ, dove, come al solito, tutte e quattro le variabili sono pensate come dipendenti da t. Deriviamo nuovamente le formule (26), ottenendo r¨r + r˙2 = x˙ 2 + y˙ 2 + xx¨ + y y¨ 2rr˙ ϑ˙ + r2 ϑ¨ = x˙ y˙ + x y¨ − x˙ y˙ − xy. ¨ Se la forza è centrale la seconda equazione dà zero, essendo nullo il prodotto scalare fra la forza (centrale) e il vettore (−y, x), che è ortogonale a r = (x, y), ciò che è equivalente alla conservazione del momento angolare. In questo modo troviamo la seconda delle equazioni in (P). Possiamo ancora semplificare la prima equazione, tenendo conto che, poiché x˙ = r˙ cos ϑ − rϑ˙ sin ϑ e y˙ = r˙ sin ϑ + rϑ˙ cos ϑ, vale la relazione x˙ 2 + y˙ 2 = r˙2 + r2 ϑ˙ 2 . È facile ora dedurre la prima delle equazioni in (P), visto che xx¨ + y y¨ = r · r¨ = −GM/r.
Capitolo IX
637 √
R √2 R 1 f (x, y) dy dx+ f (x, y) dy dx+ 0 0 1/2 0 √ R 1 R π−arcsin y 3−x2 √ f (x, y) dy dx. (h) 0 arcsin y f (x, y) dx dy. 2 0 R 1 R x2 R1 y=x2 8 (a) x cos y dy dx = 0 x sin y]y=0 dx = 0 0 R 1R y p R1 x sin x2 dx = 21 [1 − cos 1]. (b) 0 0 x y2 − x2 dx dy = 0 R1 R 1 y3 x=y = dy = 1/12. − 31 0 (y2 − x2 )3/2 ]x=0 dy R1Rx 2 R 1 2 y=x0 3 R1 2 x x x (c) e dy dx = e y] dx = xe dx = y=0 0 0 0 0 R1 R 1 R √x 2 y= √x y 1 (e − 1). (d) 0 x2 (x + y) dy dx = 0 [xy + 2 ]y=x2 = 2 R1 R 2 R 4−y 4 (x3/2 + 2x − x3 − x2 ) dx = 3/10. (e) 0 y xey dx dy = 0 R2 R 2 2 x=4−y x ] ey dy = 21 0 ey (16 − 8y) dy = 4e2 − 12. (f) I = 0 2 √x=y R 2 R 2y−y2 R2 x dx dy = 1 (y − y2 /2 − (2 − y)2 /2) dy = 1/6. 1 2−y R 1 R y2 R1 R1 y2 (g) I = 0 0 ex/y dx dy = 0 [yex/y ]0 = 0 (yey − y) dy = R2Rx x [−y2 /2 + yey − ey ]10 = 1/2. (h) I = 0 x2 /2 X2 +y 2 dy dx = R2 R2 (π/4 − arctan(x/2)) dx = 0 [−x arctan(x/2) + ln(1 + 0 R2Rx 2 2 x /4) + πx/4]20 = ln 2. (i) I = 1 1/x xy2 dy dx = R2 R2 [−x2 /y]x1/x = 1 (−x + x3 ) dx = 9/4. 1 (g) R √3 R
R 1/2 R
2x
13 Siano M e m gli estremi superiore ed inferiore di f su tutto il rettangolo. Fissato ε > 0, in base alla caratte6 (a) I = 0 xdx 0 yey dy = [x2 /2]10 [(y − 1)ey ]20 = rizzazione data nell’Esercizio 10 , possiamo ricoprire l’inR3R1 R 3 x4 y2 (e2 + 1)/2. (b) I = 0 0 (x3 y2 − 4x2 y) dx dy = 0 [ 4 − sieme delle discontinuità di f con l’unione di un numero finito di rettangoli, un plurirettangolo Ωε , la cui area R 3 y2 4y y3 2y2 4x3 y 1 ] dy = 0 ( 4 − 3 )dy = [ 12 − 3 ]30 = −15/4. totale sia inferiore a ε/2(M − m). D’altra parte, per l’u3 0 R π/3 R π R π/3 (c) I = 0 sin(x + 3y) dx dy = 0 [− cos(x + niforme continuità della funzione sul rettangolo privato 0 R π/3 del plurirettangolo Ωε , esiste δ > 0 per cui l’oscillazione 3y)]π0 dy = 2 cos(3y)dy = 32 sin(3y)]π0 = 0. Mi j − mi j = max f − min f su ogni rettangolo Ri j di amR 1 R 0π/4 R1 (d) I = 0 −π/4 y cos(xy) dx dy = 0 [sin(xy)]π/4 = piezza inferiore a δ (e che sia contenuto in Ω r Ωε ) sia −π/4 R1 R1 R4 √ πy inferiore a ε/(2 Area(R)). A questo punto è facile costruiy 2x 2 sin( 4 ) dy = 4(2− 2)/π. (e) I = 0 e dy 2 e dx = 0 re una partizione del rettangolo di ampiezza inferiore a R1 R √3 1 (e − 1)(e8 − e4 )/2. (f) I = −1 (1 + x2 ) dx 0 1+y δ per cui ogni rettangolino è completamente contenuto o 2 dy = √ R in Ωε oppure nel suo complementare. Per tale partizione, 3 2 2 3 1 [x + x /3]−1 [arctan y]0 = 8π/9. (g) I = 3 0 ((y + si avrà che la differenza fra la somma inferiore e quella 4 2)3/2 − y3/2 ) dy = 15 [(y + 2)5/2 − y5/2 ]20 = 154 (25 − 25/2 ). superiore è minore di ε. Grazie all’Esercizio 5 possiamo R2 R2 (h) I = −2 [x2 y + y3 /3]1−1 dx = −2 (2x2 + 2/3) dx = 40/3. concludere che f è integrabile. √ 15 D è un quadrato di area 1, l’integrale è R 2 R y/2 R 48 R y/3 7 (a) 0 y/12 f (x, y) dx dy. (b) 0 y/3 f (x, y) dx dy+ R 1 R 1 2 xy dx dy = 1/6. Il valore medio è quindi 1/6. 0 0 R 3R 1 R 1 R √4−y2 √ f (x, y) dx dy+ 16 Si tratta di calcolare il valore medio di f (x, y) = f (x, y) dx dy. (c) 2 y/3 0 4−4y √ x2 + y2 (distanza al quadrato di un punto dall’origine) √ R 2 R 4−y2 R 3R2 al variare di (x, y) nel dominio D costituito dal cerchio di f (x, y) dx dy. (d) f (x, y) dx dy+ 1 0 0 1 2 raggio R e centro R2 R2 R 2 R 2− √4−y2 ! in (a, 0). L’area di D è πR , l’integrale da √ √ 2 2 f (x, y) dx dy+ f (x, y) dx dy. (e) calcolare è I = D (x + y ) dx dy. Ponendo x = a + r cos ϑ, 3 2− 4−y2 0 y2 /8 R 2R 4 R 4 √2 R 4 y = r sin ϑ (coordinate polari intorno a (a, 0)) si trova √ R 2π R R f (x, y) dx dy. f (x, y) dx dy + 2 y2 /8 0 2+ 4−y2 I = 0 0 (a2 + r2 + 2ar cos ϑ)r drdϑ = π(R4 /2 + R2 a2 ). Il √ R 1 R 1−x R 0 R 1−x2 f (x, y) dy dx+ (f) f (x, y) dy dx. valore medio è a2 + R2 /2. 0 0 −1 0 R1
R2
638
Soluzioni degli esercizi – Capitolo IX
!
(x2 + y2 ) dx dy dove D = {(x, y) : R 1 R √x √ 0 ≤ x ≤ 1, x2 ≤ y ≤ x}. V = 0 x2 (x2 + y2 ) dy dx = √ R1 R1 3/2 6 y3 y= x [x2 y + 3 ]y=x2 dx = 0 (x5/2 + x 3 − x4 − x3 ) dx = 6/35. 0 ! (b) V = D xy dx dy dove il triangolo D è descritto da D = {(x, y) : 1 ≤ x ≤ 4, 1 ≤ y ≤ 7/3 − x/3}. R 4 R 7/3−x/3 ! V = 1 1 xy dy dx = 31/8. (c) V = D (9 − x − R2R y R2 2 y) dx dy = 0 y2 −y (9 − x − y) dx dy = 0 [9x − x2 − ! x=y xy]x=y2 −y dy = 148/15. (d) V = D (1 − x − y) dx dy = R 1 R 1−x ! (1 − x − y) dy dx = 1/6. (e) V = D y dx dy = 0 0√ R 1 R 1−x2 ! p y dy dx = 2/3. (f) V = D 2 4 − y2 dx dy do−1 0 ve D è il cerchio di centro (0, 0) e raggio 2 nel piano R 2 R √4−y2 p R2 xy. Risulta V = 2 −2 √ 2 4 − y2 dx dy = 4 −2 (4 − 17
(a) V =
y2 ) dy = 8[4y −
y3 2 ] 3 0
D
−
4−y
= 128/3. R1 y 18 (a) I = 23 0 [x3/2 ]ey dy = 32 (2e3/2 /3 − 16/15). (b) Occorre cambiare l’ordine di integrazioR 3 R x/3 2 R3 2 ne: I = 0 0 ex dy dx = 31 0 xex dx = 16 (e9 − 1). (c) Occorre cambiare l’ordine di integrazione I = R1 R1 R √y 1 3 3 x dx dy = 41 0 y2 sin(y3 ) dy = 12 (1−cos 1). sin(y ) 0 0 (d) Occorre cambiare l’ordine di integrazione I = R9 R √x R 1 9 2 2 y dy dx = cos(x ) x cos(x ) dy = sin(81)/4. 2 0 0 0 19 Sia D1 = D ∩ {(x, y)! : y ≥ !0} e D2 = D ∩ f (x, y) dx dy + {(x, y) : y ≤ 0}. Allora D f = D1 ! f (x, y) dx dy. Consideriamo la trasformazione D2 2 T : R2 → R ! x = u, y = −v! tale che T(D1 ) = f (u, −v) du dv = D2 : risulta D f (x, y) dx dy = D1 2 ! ! − f (u, v) du dv = − D f (u, v) du dv e quindi l’inteD1 1 grale su D è nullo. Analogamente si dimostra la seconda proprietà. 20 (a) D = D1 ∪ D2 dove D1 = {(x, y) : −1 ≤ y ≤ 1, −1 + y2 ≤ x ≤ 0} e D2 = {(x, y) : 0 ≤ x ≤ 2, −x/2 + 1 ≤ y ≤ x/2 − 1}. L’integrale vale 0 perché il dominio è simmetrico rispetto all’asse x e f (x, −y) = − f (x, y); (b) D = D1 ∪ D2 ∪ D3 ∪ D4 dove D1 = {(x, y) : 0 ≤ x ≤ 1, −x+1 ≤ y ≤ 1}, D2 = {(x, y) : −1 ≤ x ≤ 0, x+1 ≤ y ≤ 1}, D3 = {(x, y) : −1 ≤ x ≤ 0, −1 ≤ y ≤ x − 1}, D4 = {(x, y) : 0 ≤ x ≤ 1, −1 ≤ y ≤ x − 1}. L’integrale su D è 0, essendo D simmetrico (ad esempio rispetto all’asse x); (c) D = D1 ∪ D2 dove D1 = {(x, y) : −1 ≤ y ≤ 1, −1 ≤ x ≤ y2 }, D2 = {(x, y) : −1 ≤ x ≤ 1, 1 ≤ y ≤ 2}. L’integrale si calcola come somma dell’integrale su D1 e dell’integrale su D2 : il primo è nullo perché D1 è simmetrico rispetto all’asse x. Anche il secondo integrale è nullo perché il rettangolo D2 è simmetrico rispetto all’asse y e la funzione
verifica f (−x, y) = − f (x, y); (d) D = D1 ∪ D2 ∪ D3 dove D1 = {(x, y) : 1 ≤ y ≤ 2, −1 + y/2 ≤ x ≤ 1 − y/2}, p D2 = {(x, y) : 0 ≤ y ≤ 1, −1 + y/2 ≤ x ≤ − 1 − y/2}, p D3 = {(x, y) : 0 ≤ y ≤ 1, 1 − y/2 ≤ x ≤ 1 − y/2}. L’integrale è nullo perché f è dispari rispetto all’asse y e il dominio è simmetrico. R 2π R 3 21 (a) 0 0 r3 cos ϑ sin ϑ dr dϑ = 0. (b) La regione è il rettangolo polare [1, 2] × [0, 2π], e risulta R 2π R 2 r2 dr dϑ = 14π/3. (c) D è il semicerchio centra0 1 to in (0, 0) e raggio 2 contenuto nel semipiano x ≥ 0; R π/2 R 2 2 l’integrale è −π/2 0 e−r r dr dϑ = π(1 − e−4 )/2. (d) D è la regione dentro al cerchio D1 centrato in (0, 0) e raggio 2 e fuori dal cerchio D2 di centro (1, 0) e raggio 1; sfruttando ! l’additività dell’integrale rispetto ai domini ! ! x dx dy. Il primo integrax dx dy − x dx dy = D2 D1 D le è 0 perché f (−x, y) = − f (x, y) e il dominio è simmetrico rispetto a y. Il secondo si calcola usando le coordinate polari centrate in (1, 0), ovvero x = 1 + r cos ϑ e y = R 2π R 1 ! r sin ϑ. Si ha D x dx dy = 0 0 (1 + r cos ϑ)r dr dϑ = π. 2 (e) In polari la circonferenza è r = 6 cos ϑ. L’integrale è R π/2 R 6 cos ϑ R π/2 r2 sin ϑ dr dϑ = 72 0 cos3 ϑ sin ϑ dϑ = 18. 0 0 ! p 22 (a) V = 2 D R2 − x2 − y2 dove D è il cerchio cenR 2π R t √ trato in (0, 0) e raggio t. V = 2 0 0 R2 − r2 r dr dϑ = ! − 4π (R2 − r2 )3/2 ]t0 = 4π (R3 − (R2 − t2 )3/2 ). (b) V = D (x2 + 3 3 y2 ) dx dy dove D è il cerchio di centro (0, 0) e raggio R 2π R 3 3. In polari V = 0 0 r3 dr dϑ = 81π/2. (c) V = ! p 2 D 64 − 4x2 − 4y2 dx dy dove D è il cerchio di centro R 2π R 1 √ (0, 0) e raggio 1; in polari V = 2 0 0 64 − 4r2 r dr dϑ = ! 4π(−10 · 151/2 + 128/3). (d) V = D (4 − x2 − y2 − 1 + x + y) dx dy dove D è la regione del piano interna alla circonferenza di equazione 4 − x2 − y2 = 1 −qx − y, cioè la circonferenza di centro ( 21 , 21 ) e raggio
7 ; passan2 1 + r cos ϑ, 2
do a coordinate polari rispetto al centro x = R 2π R √ 7 y = 12 + r sin ϑ si ha V = 0 0 2 ( 52 − r2 )r dr dϑ = 21π/8. ! p (e) V = 2 D 16 − x2 − y2 dx dy dove D è la corona circolare compresa tra le circonferenze centrate in (0, 0) e R 2π R 4 √ √ raggi 2 e 4; si ha V = 2 0 2 16 − r2 r dr dϑ = 32π 3. 23 Eseguiamo un passaggio in coordinate polari, sia sul piano dell’immagine x = R cos ϕ, y = R sin ϕ, che nella parametrizzazione dell’apertura, s = r cos ϑ, t = r sin ϑ, di modo che Ψ(x, y) = R R 2iπ (xs+yt) R d/2 R 2π e λf ds dt = 0 cos(ϑ − ϕ) + r cos 2πrR λf D 0 ir sin 2πrR cos(ϑ − ϕ) dϑ dr . Osserviamo che, sostituenλf do ϑ − ϕ = ϑ′ − π/2, la parte immaginaria ha integrale
Soluzioni degli esercizi – Capitolo IX
nullo, trattandosi di una funzione dispari, mentre quella R d/2 R 2π sin(ϑ′ ) )dϑ′ dr reale si esprime come: 0 r cos 2πrR λf 0 e, in effetti, non dipende da ϕ ma soltanto da R. Per calcolare l’integrale qui sopra occorre fare ricorso alle funzioni di Bessel, come abbiamo visto nell’Esercizio 13 a pagina 93. 24 Lo jacobiano della trasformazione è abr, i limiti di integrazione 0 ≤ ϑ ≤ 2π, 0 ≤ r ≤ 1. L’integrale diventa R 2π R 1 √ 1 − r2 abr dr dϑ = 23 πab. 0 0 R 4 R 3 25 L’integrale richiesto è 14 dv 0 1−v f (u(1 − v), uv)udu. 2
Risulta infatti x = u(1 − v) e y = uv, con jacobiano u. Si determinano i limiti di u come funzione di v: u(1 − v) = 0 4 . Limiti per x = 0, da cui u = 0; se x = 4 si ricava u = 1−v di variazione per v: poiché y = x, uv = u(1 − v) da cui v = 1/2; per y = 3x si trova v = 3/4.
26 Il primo integrale si riferisce alla parte di piano che si trova sopra la parabola y = x2 e sotto la retta y = x + 2, la sua area è il valore dell’integrale 9/2; la seconda è la parte di piano dentro al cerchio x2 + y2 = 1 e sopra la retta y = −x + 1. L’area è π4 − 21 . ! 27 Chiamata D l’ellisse, l’area è A = D dx dy. Conviene usare il cambiamento di coordinate u = y − x e v = x. ∂(x,y) −1 1 = Lo jacobiano della trasformazione è ∂(u,v) = 1 0 ′ 1 e il dominio D viene trasformato ! nel cerchio D di equazione u2 + v2 ≤ 1. Risulta A = D′ dudv = π.
28 Si osserva che la regione è simmetrica rispetto agli assi, dunque basta restringere l’attenzione al primo quadrante e moltiplicare poi l’area ! per 4. Detta D questa regione, l’area sarà quindi 4 D dx dy. Conviene ora passare a coordinate ellittiche, ponendo x = 2r cos ϑ e y = 3r sin ϑ. Lo jacobiano della trasformazione è 6r, e la frontiera della regione è descritta dall’equazione r2 = 1 − 2 √ sin2 ϑ, per ϑ ∈ [0, π/4]. Si troR π/4 R 1−2 sin2 ϑ ! va D dx dy = 6 0 r dr dϑ = 3/2. In totale 0 l’area della regione è 6.
29 Usando la trasformazione di coordinate T −1 definita da u = x2 /y e v = y2 /x il dominio viene trasformato nel rettangolo del piano uv R = [a, b] × [c, d]. Lo jacobiano della trasformazione T è 1/3 dunque l’area richiesta ! risulta essere R 31 du dv = 13 (b − a)(d − c).
30 (a) Lo jacobiano di T è 1/3. Essendo u = y − x e v = y + 2x, il dominio viene trasformato nel piano ! uv nel rettangolo [−2, 0] × [0, 3]. L’integrale diventa 1 [(v − u) + 34 (v + 2u)] du dv e vale 11/3. (b) Con queR 3 sta trasformazione il dominio corrisponde al cerchio C di equazione u2 + v2 = 1 nel piano uv. Lo jacobiano del-
639
! la trasformazione è 6, l’integrale diventa C 24u2 du dv. Passando a coordinate polari nel piano uv si trova facilmente il valore dell’integrale 6π. (c) Lo jacobiano della trasformazione è 1/v. La retta y = x viene trasforma√ √ ta nella curva v = u e y = 3x in v = 3u (attenzione al fatto che v = y > 0), , mentre le iperboli diventano u = 1 e u = 3. √ La regione √D si trasforma in ′ D = {(u, v) : 1 ≤ u ≤ 3, u ≤ v ≤ 3u}. L’integrale è ! u du dv = 2 ln 3. ′ D v 31 Dopo avere tracciato la figura, conviene usare coordinate polari centrate in (1, 0). L’equazione di x2 + y2 = 1 diventa r = −2 cos ϑ; il punto A di intersezione tra le due √ circonferenze è A = ( 12 , 23 ) mentre il punto di intersezione tra√la retta e la circonferenza centrata in (1, 0) è R π/2 R 1 B = ( 23 , 23 ). Si trova così che l’area è π/3 0 r dr dϑ + √ R 2π/3 R 1 r dr dϑ = 43 . π/2 −2 cos ϑ
32 (a) Si pone u = 2x − y e v = 3x + y e il dominio diventa il rettangolo R = [−3, 1]×[−2, 1]. La trasformazione inversa è x = 51 (u + v) e y = 51 (2v − 3u), con jacobiano R1 R1 1 1/5 e l’integrale diventa 51 −3 −2 25 (u + v)(2v − 3u)dudv = −66/125. (b) Ponendo u = x + y e v = y − x il dominio si trasforma nel quadrato [−1, 1] × [−1, 1] del piano uv. La trasformazione T corrispondente è x = 21 (u + v) e y = 21 (u − v) con jacobiano 1/2. L’integrale diventa R R1 1 1 eu dudv = e − 1e . (c) Sfruttiamo ancora la trasfor2 −1 −1 mazione del punto precedente u = x + y e v = y − x. Le rette y = −x + 2 e y = −x + 1 diventano u = 1 e u = 2, il segmento y = 0 per x ∈ [1, 2] diventa la retta u + v = 0 con u ∈ [1, 2] e x = 0 per x ∈ [1, 2] diventa u − v = 0 con u ∈ [1, 2]. L’integrale diventa R R 1 2 u cos(v/u)dvdu = 23 sin 1. 2 1 −u ! p 33 La massa è m = D Rδ x2 + y2 dx dy essendo D il cerchio di raggio R centrato nell’origine. In polari m = R 2π R R δ r2 dr dϑ = 32 πδR2 . R 0 0 34 (a) La massa del triangolo è M = kab/2, e Mx¯ = R a R b− b x R a R b− b x 2 2 k 0 0 a x dy dx = ka6 b e M y¯ = k 0 0 a y dy dx = kab6 , da cui x¯ = a/3 e y¯ = b/3. (b) Posizioniamo il settore con vertice in (0, 0) e −α ≤ ϑ ≤ α, con simmetria rispetto all’asse x. Posta 1 la densità, la massa è Rα RR M = αR2 , Mx¯ = −α 0 r2 cos ϑ dr dϑ = 2 sin(α)R3 /3, sin α , 0). (c) Disegnando la da cui il baricentro è ( 2R3α regione si verifica che essa è simmetrica rispetto alR 2 R 2−y2 /2 l’asse x; la sua area è −2 y2 /4−1 dx dy = 8. Inoltre R 2 R 2−y2 /2 ! x dx dy = −2 y2 /4−1 x dx dy = 16/5. Il baricentro è D R1 R1 ( 52 , 0). (d) L’area della regione è −1 y2 dx dy = 4/3.
640
Soluzioni degli esercizi – Capitolo IX
Inoltre ( 53 , 0).
!
x dx dy D
R1 R1 −1
y2
x dx dy = 4/5. Il baricentro è
35 (a) L’area della regione è l’area del triangolo A1 = 2 più l’area del segmento di parabola A2 = R1 R0 dx dy = 4/3, cioè A = 10/3. Il baricentro si tro−1 −1+y2 va sull’asse della lamina. R R x, data la simmetria L’ascissa è R 2 R −x/2+1 1 0 3 1 (− 158 + x¯ = A −1 −1+y2 x dx dy + 0 x/2−1 x dy dx = 10 4 ) 3
6 ; 25
(b) il baricentro si trova nell’origine, data la simR 1 R y2 metria della lamina; (c) L’area è A = 2 + −1 −1 dx dy = R 1 R y2 R 2R 1 2 + 8/3 = 14/3. Si ha Ax¯ = −1 −1 x dx dy + 1 −1 x dx dy, da cui dove il secondo integrale è nullo per simmetria. R 1 R y2 R 2R1 3 4 x¯ = − 14 = −6/35. A y¯ = −1 −1 y dx dy+ 1 −1 y dx dy = 5 3, dove il primo integrale è nullo per simmetria. In totale y¯ = 149 . (d) Si ha x¯ = 0 data la simmetria della lamina. L’area è l’area del triangolo meno l’area del segR 1/2 mento A = 2 − −1/2 ( 21 − 2x2 ) dx = 2 − 1/3 = 5/3. A y¯ = R 2 R −y/2+1 R 1/2 R 1 −2x2 19 y dx dy − −1/2 0 2 y dy dx = 34 − 151 = 15 . In 0 y/2−1 totale y¯ = 19/25. ! 36 L’area è D dx dy. Conviene passare a coordinaR 2π R 1+cos ϑ ! te polari: D dx dy = 0 0 r dr dϑ = 3π/2. x¯ = R 2π R 1+cos ϑ 2 2 5π 2 r cos ϑ dr dϑ = 3π 4 = 65 . Risulta poi, 3π 0 0 anche da considerazioni di simmetria, y¯ = 0. =
37 Si sceglie un sistema di riferimento in cui A è l’origine, e gli assi sono orientati come i lati del quadrato. Il problema è ridotto al calcolo del momento d’inerzia del quadrato rispetto all’asse x, sapendo che la densità è δ(x,!y) = k(x2 + y2 ), ovvero, Rchiamato D il quadrato aR a Ix = D ky2 (x2 + y2 ) dx dy = k 0 0 (x2 y2 + y4 ) dx dy = 14ka6 /45. 38 Scegliendo un sistema di riferimento come nel! l’Esercizio 37 , si deve calcolare I = D (x2 + y2 ) dx dy dove D è il quadrato di lato 3 e vertice nell’origine. R 3R 3 I = 0 0 (x2 + y2 ) dy dx = 54. ! 39 I0 = D (x2 + y2 ) dx dy. In polari ponendo x = t cos ϑ R 2π R R e y = t sin ϑ I0 = 0 r t3 dt dϑ = π2 (R4 − r4 ), Ix = R 2π R R ! x2 dx dy = 0 r t3 cos2 ϑdt dϑ = π4 (R4 − r4 ). D
40 La corona corrisponde al rettangolo 1 ≤ r ≤ 2, 0 ≤ ϑ ≤ 2π. Ricordiamo i calcoli fatti nell’Esercizio (IX.12) h 4 ir=2 R 2π R 2π R 2 sin2 ϑ dϑ = si ha Ix = ρ 0 1 r3 sin2 ϑ dr dϑ = r4 h 4 ir=2 r=1 0 R 2π R 2 15 = 152 π. Il valore di π e I0 = ρ 0 1 r3 dr dϑ = 2π r4 4 r=1 Iy si ricava ad esempio per differenza, Iy = I0 − Ix , dunque Iy = 15 π. 4
41 I= 42
0
!
y2 dx dy dove D è il triangolo dato. Risulta R2 y dx dy = 0 y3 dy = 4. 2−y
Ix = R2R2
D 2
sin φ cos ϑ J = sin φ sin ϑ cos φ
r cos φ cos ϑ r cos φ sin ϑ −r sin φ
−r sin φ sin ϑ r sin φ cos ϑ 0
Dal calcolo del determinante di una matrice 3 × 3 si ha r cos φ cos ϑ −r sin φ sin ϑ J = cos φ r cos φ sin ϑ r sin φ cos ϑ sin φ cos ϑ −r sin φ sin ϑ + r sin φ sin φ sin ϑ r sin φ cos ϑ In totale, ricordando l’identità trigonometrica cos2 x + sin2 x = 1, prima per x = ϑ e poi per x = φ si trova J = r2 cos2 φ sin φ(cos2 ϑ + sin2 ϑ) + r2 sin3 φ(cos2 ϑ + sin2 ϑ) = r2 sin φ. Rx ! 43 (a) I = D x2 ( 0 dz) dx dy dove D = {(x, y) : 0 ≤ R 2 R 2x Rx x ≤ 2, 0 ≤ y ≤ 2x}. Risulta I = 0 x2 0 dy 0 dz = R 4−x−3y R2 ! dz) dx dy dove 2x4 dx = 64/5. (b) I = D y( 0 0 ! D = {(x, y) : x ≥ 0, y ≥ 0, x + 3y ≤ 4}. Risulta I = D y(4 − R 4 R 4−x x−3y) dx dy = 0 0 3 3 y(4−x−3y) dy dx = 32/27. (c) I = R 1−y2 −z2 ! ! z2 ( 0 dx) dy dz = D (1 − y2 − z2 ) dy dz dove D = D {(y, z) : y2 + z2 ≤ 1}. Calcolano l’integrale doppio in po! R √3−x2 −y2 lari si trova I = π/2. (d) I = D ( 1 x2 + 1 y2 z dz) dx dy = 2 2 ! 1 [(3 − x2 − y2 ) − 41 (x2 + y2 )2 ] dx dy dove D = {(x, y) : 2 D x2 + y2 ≤ 2}. Conviene ora passare a coordinate polari, e si trova I = 35 π. (e) Le superfici si intersecano in x2 + y2 = 1 per z = 1; passando a coordinate cilindriche R 2π R 1 R 1+ √1−r2 si ha I = 0 0 r r dz dr dϑ = π. (f) Si ha I = R 1 R x R xz R1Rx 2 3 ( 0 ( 0 3y xz dy) dz) dx = 0 0 x4 z6 dz dx = 1/84. 0 ! R 1−y2 −z2 # dx) dy dz = dx dy dz = D ( −3 44 (a) V = E ! 2 2 2 4 − y − z dy dz dove D = {(y, z) : y + z2 ≤ 4}. PasD sando a polari si trova V = 8π. (b) Il piano passante per i tre punti ha equazione x + y − z − 2 = 0; si ha ! ! R0 V = D ( x+y−2 dz) dx dy = D (−x − y + 2) dx dy dove D = {(x, y) : x ≥ 0, y ≥ 0, x + y ≤ 1}. Si trova V = 2/3. (c) Per ! ! R 3y simmetria si ha V = 2 D ( y dz) dx dy = 4 D y dx dy dove D è la semicirconferenza unitaria in z = 0 con y ≥ 0. In polari si trova V = 8/3. (d) Conviene operare la trasformazione x = 2r cos t, y = r sin t, z = z, con jacobiano R 2π R 1 R 2r 2r. Si ha V = 0 0 −2r 2r dz dr dϑ = 8π. R 1 R 1−x R 1−x−y 45 Risulta I = 0 0 f (x, y, z) dz dy dx, in0
Soluzioni degli esercizi – Capitolo IX
tegrando per fili paralleli all’asse z. In maniera equiR 1 R 1−y R 1−x−y valente I = 0 0 f (x, y, z) dz dx dy Sezionando 0 invece la regione per piano paralleli a xy si ha I = R1 ! ( D f (x, y, z) dx dy) dz dove Dz è il triangolo Dz = 0 z {(x, y) : 0 ≤ x ≤ 1 − z, 0 ≤ y ≤ (1 − z) − x}. Quindi R 1 R 1−z R 1−x−z I= 0 0 f (x, y, z) dy dx dz 0 # f dove E = {(x, y, z) : 46 si tratta dell’integrale √ E −1 ≤ x ≤ 1, 0 ≤ y ≤ 1 − x2 , −2 ≤ z ≤ y + 1}, regione delimitata dal semi cilindro x2 + y2 ≤ 1 con y ≥ 0, e dai √ piani z = −2, z = y + 1. I è equiR 1 R 1−y2 R y+1 valente a 0 √ 2 −2 f (x, y, z) dz dx dy, ma anche − 1−y R2 ! R1 ! a −2 ( D f (x, y, z) dx dy) dz + 1 ( D f (x, y, z) dx dy) dz, z z dove Dz = {(x, y) : −1 ≤ x ≤ 1, 0 ≤ y ≤ √ 1 − x2 } se z ∈ [−2, 1] mentre è Dz = {(x, y) : −1 ≤ √ 1 − x2 } se z ∈ [1, 2] (otx ≤ 1, z − 1 ≤ y ≤ tenuto sezionando il solido per piani paralleli al piano xy). Esplicitando come integrale iterato l’integrale R 1 R 1 R √1−x2 doppio interno risulta −2 −1 0 f (x, y, z) dy dx dz + R 2 R 1 R √1−x2 f (x, y, z) dy dx dz. 1 −1 z−1 47
4 πabc. 3
48
1083 × 1012 Km3 .
49 La proiezione del tetraedro T sul piano xy è l’insieme D = {(x, y) : x ≥ 0, y ≥ 0, x + y ≤ 1}. La frontiera inferiore è il piano z = 0 e quella # superiore è dx dy dz = z = −x − y + 1. Di conseguenza si ha T R 1 R 1−x R 1−x−y dz dy dx = 1/6. 0 0 0 # 50 Il volume del cilindroide è dato da V = E dx dy dz dove E = {(x, y, z) : x2 +y2 ≤ 1, x2 +y2 −2 ≤ z ≤ 4−x−y}. Essendo E semplice rispetto all’asse z, grazie alla (12) si ha R R R 4−x−y V = D x2 +y2 −2 dz dx dy = D [4−x−y−(x2 +y2 −2)] dx dy, R dove D = {(x, y) : x2 + y2 ≤ 1}. Risulta V = D [−x2 − y2 − R 2π R 1 x− y+6] dx dy = 0 0 [−r2 −r(cos ϑ+sin ϑ)+6]r dr dϑ = h 4 ir=1 R 2π dϑ[−r3 + 6r] dr = 2π − r4 + 3r2 = 112 π. 0 r=0
51 T è un sottoinsieme del piano yz; supponiamo che sia y–semplice cioè di tipo {(y, z) : z ∈ [a, b], 11 (z) ≤ y ≤ 12 (z)}. Il suo baricentro, secondo le formule (6), ! ! y dy dz T e Area(T) R b R 12 (z)
z dy T . Area(T)
z¯ = In particolaha coordinate y¯ = ! R 1 b re si ha T y dy dz = a 1 (z) y dy dz = 2 a [12 (z)]2 − 1 Rb 1 [12 (z)]2 − [11 (z)]2 dz. [11 (z)]2 dz, da cui y¯ = 2 Area(T) a Consideriamo ora il solido E ottenuto dalla rotazione di T intorno all’asse z. Osserviamo che se sezioniamo E con
641
piano ortogonali a z di tipo z = h, le sezioni risultano essere corone circolari Dh = {(x, y, h) : [11 (h)]2 ≤ x2 + y2 ≤ [12 (h)]2 }. Per calcolare il volume di E conviene # allora integrare per strati, e si trova Volume(E) = E dx dy dz = Rb Rb 2 2 Area(D ) dz = π [1 (z)] − [1 (z)] dz. Confrontanz 2 1 a a do con il valore di y¯ calcolato all’inizio, si otteniamo la formula cercata. 52 (a) Osserviamo che D è simmetrica rispetto all’asse y. Scriviamo la parte di D1 che si trova nel primo quadrante come regione y–semplice troviamo che R 1 R 2−x ! l’area di D è Area(D) = D dx dy = 2 0 x2 dy dx = R1 2 0 (2 − x − x2 ) dx = 2(2 − 21 − 13 ) = 73 . (b) Le coordinate del baricentro della lamina si calcolano con le formule (6), per le ! ! quali occorre calcolare D x dx dy e D y dx dy. Il primo integrale è nullo, perché si tratta dell’integrale di una funzione dispari rispetto alla variabile x, su un insieme simmetrico rispetto all’asse x: dunque x¯ = 0. CalcoliaR 1 R 2−x ! mo il secondo integrale: D y dx dy = 2 0 x2 y dy dx = R1 1 32 (2 − x)2 − x4 dx = −(2 − x)3 /3 − x5 /5 0 = 15 . Abbia0 ¯ y) ¯ = 0, 32 . mo quindi che il baricentro ha coordinate (x, 35 (c) Il solido Sx è ottenuto ruotando D intorno all’asse x: per il calcolo del suo volume possiamo sfruttare il Teorema di Pappo visto nell’Esercizio 51 , nella versione relativa a rotazioni intorno all’asse x di regioni contenute in z = 0. Si avrà così Volume(Sx ) = 2π y¯ Area(D), dove y¯ è la coordinata rispetto all’asse y del centroide di D. Per definizione, il centroide di una figura piana coincide col baricentro della lamina di densità δ(x, y) = 1 che occupa la regione piana: abbiamo già calcolato le coordinate del centroide nella seconda parte dell’esercizio, e possiamo concludere che Volume(Sx ) = 2π y¯ Area(D) = 32 7 2π 35 = 64 π. Analogamente, il volume di S y si trove3 15 rà con il Teorema di Pappo per rotazioni intorno all’asse y, ovvero: Volume(S y ) = 2πx1 Area(D1 ), dove questa volta x1 è la coordinata rispetto all’asse x del centroide della parte di D che si trova nel primo quadrante. Dobbiamo calcolareR x1 , che risulta esseR 1 Rancora 2−x 1 1 re x1 = Area(D1 ) 0 x2 x dy dx = 0 x(2 − x − x2 ) dx = h i1 5 1 . In totale quindi il volume x2 − x3 /3 − x4 /4 = Area(D ) 12 di S y è 56 π.
0
1
53 Il solido si puo’ descrivere come regione z-semplice: E = {(x, y, z) : (x, y) ∈ D, 0 ≤ z ≤ x} dove D è la regione del piano xy D = {(x, y) : −1 ≤ y ≤ 1, y2 ≤ x ≤ 1}. La massa R 1 R 1 R x densità co# del solido, assumendo δ dx dy dz = δ dz dx dy = stante δ, è m = E −1 y2 0
642
Soluzioni degli esercizi – Capitolo IX
4δ/5. La regione è simmetrica rispetto al piano xz dunque il baricentro ha coordinata y¯ = 0. Si ha poi x¯ = R1 R1Rx # 1 δx dx dy dz = δ −1 y2 0 x dz dx dy = m1 4δ = 75 , m 7 E R1 R1Rx # δz dx dy dz = δ −1 y2 0 z dz dx dy = mentre z¯ = m1 E 1 2δ m 7
=
5 . 14
54 Il baricentro del cono gelato ha coordinate x¯ = y¯ = 0. Conviene passare a coordinate cilindriche e calcolare separatamente gli integrali sul cono C e sulla semisfera S. R 2π R 1/2 R 1/2 π La massa del cono è m1 = δ 0 0 r dz dr dϑ = δ 24 r 1 (in accordo con la formula geometrica V = 3 Ah dove A = π4 è l’area della base e h = 12 l’altezza); la massa della π . Si ha quindi m = δ π8 . Calcosfera m2 = δV = 23 π 81 = δ 12 R 2π R 1/2 R 1/2 # δz dx dy dz = δ 0 0 liamo ora rz dz dr dϑ = C r π δ 64 e, in coordinate sferiche centrate in (0, 0, 1/2) R 2π R π/2 R 1/2 # δz dx dy dz = δ 0 0 r( 21 + r cos φ) drdφ dϑ = S 0 8 π δ2π(1/24 + π/32). In totale z¯ = π [2π(1/24 + π/32) + 64 ]= 19 π + . 24 2 55 Per il primo solido conviene passare a coordinate ciR π/2 R 3 R 2 lindriche rispetto all’asse z: m = δ 0 r dz dr dϑ = 0 0 9 πδ. Data la simmetria del solido il baricentro avrà 2 coordinate x¯ = y¯ e z¯ = 1. Basta calcolare x¯ = # R π/2 R 3 R 2 1 δx dx dy dz = mδ 0 r2 cos ϑ dz dr dϑ = π4 . m E 0 0 Infine, il momento di inerzia rispetto all’asse y è definito R π/2 R 3 R 2 # da I = E δ(x2 + z2 ) dx dy dz = δ 0 r3 dz dr dϑ = 0 0 δ81π. La seconda regione è scrivibile come y-semplice E = {(x, y, z) : (x, z) ∈ D, x2 + z2 ≤ y ≤ 4} con D = ! R4 {(x, z) : x2 + z2 ≤ 4}. Si ha così m = δ D x2 +z2 dy dx dz = ! δ D (4 − x2 − z2 ) dx dz. Conviene passare a coordinate po! lari x = r cos ϑ e z = r sin ϑ: D (4 − x2 − z2 ) dx dz = R 2π R 2 (4 − r2 )r dr dϑ = 8π. Si ha quindi m = 8πδ. 0 0 ¯ ¯ Per simmetria si deve #si ha x = z = 0; ! R 4 ancora calcoδ lare y¯ = m1 δy dx dy dz = y dy dx dz = m E D x2 +z2 ! 1 128π 8 1 2 2 2 (16 − (x + z ) ) dx dz = = . il momento di 16π 16π 3 D #3 2 2 δ(x + z ) dx dy dz = inerzia rispetto all’asse y è I = R 2π R 2 E ! R4 2 2 . (x + z ) dy dx dz = (4 − r2 )r3 dr dϑ = δ 32π 3 D x2 +z2 0 0
56 Chiamiamo P il punto medio dell’ago, X la sua distanza dalla retta più vicina, ϑ l’angolo tra l’ago e il segmento per P ortogonale alla retta più vicina. Si osservi che X assume valori in [0, d/2] e ϑ in [−π/2, π/2]. L’ago interseca la retta più vicina se e solo se cosX ϑ ≤ 2l . Ragionevolmente assumiamo che X e ϑ siano due variabili aleatorie indipendenti con distribuzione uniforme, cioè con densità di probabilità costante, rispettivamente fX (x) = 2/d e fϑ (y) = 1/π Sia ! T = {(x, y) : x ≤ l cos y/2}; risulta: P( cosX ϑ ≤ 2l ) = T fX (x) fϑ (y) dx dy =
2 dπ
R π R l cos y/2 0
0
dx dy =
l dπ
R π/2 −π/2
cos y dy =
2l . dπ
57 Le funzioni densità sono rispettivamente per le due lampadine separatamente fr (t) = e−t/r /r per t ≥ 0 e fr (t) = 0 se t < 0, mentre fb (t) = e−t/b /b per t ≥ 0 e fb (t) = 0 se t < 0. Essendo X e Y indipendenti la funzione densità congiunta è il loro prodotto f (x, y) = fr (x) fb (y) = e−x/r−y/b /rb se x ≥ 0 e contemporaneamente y ≥ 0, mentre f (x, y) = 0 altrimenti. La probabilità richiesta è quella dell’insieme X < Y, cioè P(X < Y) = ! −x/r−y/b e /rb dx dy dove D è la regione illimitata D = D {(x, y) : 0 ≤ x ≤ y}. Si tratta di un integrale improprio: secondo la definizione data nell’Esercizio svolto (IX.13), ! dovremo calcolare limT→+∞ D e−x/r−y/b /rb dx dy, dove T DT è il triangolo DT = {(x, y) : 0 ≤ x ≤ y ≤ T}. RTRT ! Si ha: D e−x/r−y/b /rb dx dy = 0 y rb1 e−x/r−y/b dx dy = T RT RT −T/r 1 −y/b −x/r x=T e [−e ]x=y dy = 0 1b e−y(b+r)/rb − e b e−y/b dy = b 0 r [−e−y(b+r)/rb ]T0 . Passando ora al limite −e−T/r [−e−y/b ]T0 + b+r r . per T → ∞ si ottiene P(X < Y) = b+r 58 Ricordiamo R +∞da pagina 476 che il valore atteso è definito come −∞ t fX (t) dx e la probabilità di X > x è R +∞ R +∞ P(X > x) = x fX (t) dt. Ma allora x P(X > x) dx = R +∞ R ∞ R +∞ R t R +∞ fX (t) dt dx = 0 f (t) dx dt = 0 t fX (t) dt, 0 x 0 X cioè proprio E[X]. 59 (a) c si determina imponendo che l’integrale di f in R2 valga 1. La funzione f è nulla tranne che sul triangolo T = {(x, y) : x ≥ 0, y ≥ 0, x + y ≤ 1} dunque deve essere " Z 1 Z 1−y c 1= cx(x + y) dx dy = c (x2 + xy) dxdy = , 8 T 0 0 da ! cui c = 8. (b) La probabilità richiesta è P(X ≤ 1/2) = 8x(x+y) dx dy, dove T = {(x, y) : 0 ≤ x ≤ 1/2, y ≥ 0, x+ D R 1/2 R 1−x 7 . y ≤ 1}. Si ha: P(X ≤ 1/2) = 8 0 (x2 +xy) dy dx = 16 0 60 La densità di ciascuna variabile aleatoria è f (x) = 1 per x ∈ [0, 1], f (x) = 0 altrimenti. Essendo le tre variabili indipendenti, la funzione densità congiunta è il prodotto delle rispettive densità, ovvero f(X,Y,Z) (x, y, z) = 1 se (x, y, z) ∈ E (dove E è il cubo con vertice nell’origine e lato di lunghezza 1), mentre è nulla fuori dal cubo. Si ha: R 1R 1R1 R 1R 1 P(X ≥ YZ) = 0 0 yz dx dy dz = 0 0 (1 − yz) dy dz = R1 (1 − 2z ) dz = 34 . 0
Soluzioni degli esercizi – Capitolo X
643
Capitolo X √ √ 1 (a) I = 5 5 − 2 2. (b) (c) I = 2 sin 2. (d) I = −2.
2 (a) I = 729/2. (b) I √= −2 ln 2 + 5 ln 5 − 3. (d) I = 2π 2.
√ I = (5 5 − 1)/12. √
2(1 + eπ ). (c)
I = 2π2 + 2π. (c)
3 (a) I = 1/6. (b) (d) e − 2 − π4 + 25 ln 2.
I = I=0.
4 Siano r(t) : [a, b] → R3 una parametrizzazione regolare di γ, f : [c, d] → [a, b] una funzione biunivoca di classe C1 ed r˜(τ) = r( f (τ)) : [c, d] → R3 la nuova parametrizzazione di γ. Abbiamo Z d Z d F(˜r(τ)) · r˜′ (τ) dτ = F(r( f (τ))) · r′ ( f (τ)) f ′ (τ) dτ c
Z
c
f −1 (d)
= f −1 (c)
F(r(t)) · r′ (t) dt.
Se f mantiene l’orientazione allora è crescente, f (c) = a, f (d) = b e l’ultimo integrale è calcolato tra a e b. Se invece f inverte l’orientazione allora è decrescente, perciò f (c) = d, f (d) = a e per ottenere un integrale tra a e b nell’ultimo membro è necessario scambiare gli estremi di integrazione cambiando di segno. 6 Indichiamo con L(γ) il lavoro compiuto da F lungo la generica curva γ. Se γ1 e γ2 sono due curve in A con gli stessi estremi (nell’ordine), e indichiamo con γ1 la giustapposizione di γ1 (con la sua orientazione) e γ2 (con l’orientazione invertita) otteniamo L(γ1 ) = L(γ1 ) − L(γ2 ) (il lavoro cambia segno invertendo l’orientazione). Viceversa, è sempre possibile vedere una curva chiusa γ1 come giustapposizione di due curve γ1 e γ2 . Ne segue che L(γ1 ) = 0 se e solo se L(γ1 ) = L(γ2 ), cioè la circuitazione è nulla lungo ogni curva chiusa se e solo se il lavoro dipende solo dagli estremi. Ma allora la caratterizzazione segue dall’equivalenza ① ⇐⇒ ② nel Teorema (X.13). A questo punto le due proposizioni seguono da questa caratterizzazione, applicando i Teoremi di Gauss–Green e di Stokes rispettivamente. 7 (a) ∂y F1 = 2y , ∂x F2 = 2xy dunque il campo non è irrotazionale e non può essere conservativo per la proposizione (X.16). (b) ∂y F1 = 2y − 3x3 y2 = ∂x F2 e il campo è irrotazionale. Il dominio è tutto R2 dunque vale la condizione sufficiente contenuta nella Proposizione (X.20) e il campo risulta conservativo. Funzione potenziale: col metodo di ispezione diretta si ha, integrando parzialmente rispetto a x la componente F1 che U(x, y) = xy2 − 14 x4 y3 + f (y). Derivando U rispetto a y: Uy = 2xy − 43 x4 y2 + f ′ (y) = F2 da cui f ′ (y) = 0 e f (y) = c costante. I potenziali sono U(x, y) = xy2 − 41 x4 y3 + c, per
ogni c ∈ R. (c) ∂y F1 = −2x sin y = ∂x F2 e si dimostra che il campo è conservativo come nel punto precedente. Funzione potenziale: U(x, y) = x2 cos y + f (y), Uy (x, y) = −x2 sin y+ f ′ (y) = F2 da cui f ′ (y) = 4y3 , cioè f (y) = y4 +c. I potenziali sono U(x, y) = x2 cos y+y4 +c. (d) Si dimostra che è conservativo argomentando come nel punto precedente. Funzione potenziale: U(x, y) = 21 x2 + xey + f (y), Uy (x, y) = xey + f ′ (y) = F2 da cui f ′ (y) = 2y e f (y) = y2 +c. (e) Il campo è irrotazionale perché ∂y F1 = 2x = ∂x F2 . Il y2 dominio è R2 privato dei punti dell’asse x. In ciascuno dei due semipiani y > 0 e y < 0 il campo è conservativo per la Proposizione (X.20); per ispezione diretta si trova 3 2 il potenziale U(x, y) = − xy + x3 + c. 8 (a) rot f = (∂y F3 − ∂z F2 )) i + (∂z F1 − ∂x F3 ) j + (∂x F2 − ∂y F1 ) k = (0 − 0) i + (0 − 0) j + (ey − ey ) j: il campo è irrotazionale e grazie alla proposizione (X.44) (il dominio è R3 ) anche conservativo. Funzione potenziale: U(x, y, z) = xey + f (y, z), Uy = xey + fy (y, z) = F2 da cui fy (y, z) = 0 e f (y, z) = 1(z). Tornando al candidato U si ha Uz = 1′ (z) = F3 da cui 1′ (z) = z + ez e 1(z) = 21 z2 + ez + c. In totale U(x, y, z) = xey + 21 z2 + ez + c. (b) ∂y F3 = ∂z F2 = x2 cos z, ∂z F1 = ∂x F3 = 2xy cos z, ∂y F1 = ∂x F2 = 2x sin z, il campo è irrotazionale e conservativo perché il dominio è R3 . Potenziale: U(x, y, z) = x2 y sin z + c. (c) Definito nel primo ottante, è irrotazionale e dunque conservativo per la proposizione (X.44). Un potenziale è U(x, y) = x ln x − x + y ln y − y + z ln z − z. (d) Non è irrotazionale perché ∂y F1 = ex cos y , ∂x F2 = ex sin z, dunque non è conservativo perché viola la condizione necessaria Proposizione (X.16). (e) Non è irrotazionale quindi non è conservativo. 10
[(0,0,2/3);0.]
11 Il dominio D è tutto il piano privato dell’origine, il −4xy campo è irrotazionale perché ∂y F1 = ∂x F2 = (x2 +y2 )2 . Si osserva che non vale la condizione sufficiente per essere conservativo proposizione (X.20). Per ispezione diretta si trova pero’ che la funzione U(x, y) = ln(x2 + y2 ) + 3y, definita in R2 r {(0, 0)}, è un potenziale di F e dunque il campo risulta essere conservativo. 12 Il rotore di F è (−2xy sin z + αxy sin z) i + (−y2 sin z + y2 sin z) j + (αy cos z − 2y cos z) k e il campo risulta irrotazionale se e solo se α = 2. Col metodo di ispezione diretta si trova subito che i potenziali hanno la forma U(x, y, z) = xy2 cos z + c, e imponendo U(1, 1, 0) = 0 si determina c = −1. Il lavoro in questo caso è la differenza U(B) − U(A) = −8 − (−1) = −7. In generale, si ricorre alla definizione: una parametrizzazione del segmento è r(t) = (1+t, 1+t, π) per t ∈ [0, 1], F(r(t)) = (−(1+t)2 , −α(1+t)2 , 0). R1 Il lavoro quindi è (−1 − α) 0 (1 + t)2 dt = 37 (−1 − α).
644
Soluzioni degli esercizi – Capitolo X
2
+ 2xex = ∂x F2 e il campo è 13 Risulta ∂y F1 = (x2−2x +y)2 irrotazionale. Il dominio di F è il piano privato dei punti della parabola y = −x2 . La regione E = {(x, y) : y < −x2 } contiene il punto A è verifica la condizione topologica per la validità della condizione sufficiente affinché un campo sia conservativo, proposizione (X.20). Il potenziale che si annulla in A si può trovare come il lavoro di F lungo i segmenti da A a (0, y) e Rpoi da (0, y) aR(x, y) (notare che si y x 2 rimane in E): U(x, y) = −1 [ 1t +1] dt+ 0 [ t22t+y +2tyet ] dt = 2
2
[ln |y|+y+1]+ln |x2 +y|+yex −ln |y|−y = ln |x2 +y|+yex +1. Il lavoro è U(B) − U(A) = [ln 5 − 5 + 1] − 0 = ln 5 − 4. 14
4xy
Il rotore è (0 − 0) i + ( f ′ (z) − 2z) j + ( (x2 +y2 +1)2 −
4xy )k (x2 +y2 +1)2
e risulta nullo se e solo se f ′ (z) = 2z, ovvero f (z) = z2 + c. Per queste f il campo è conservativo grazie alla condizione sufficiente (X.44), essendo il dominio R3 . Un potenziale è, per ispezione diretta, U(x, y, z) = ln(x2 + y2 + 1) + z2 x. Essendo γ chiusa e il campo conservativo, il lavoro richiesto è nullo. 15 r(t) = (t, 1/t, t2 ), r′ (t) = (1, −1/t2 , 2t) e l’integrale è R2 e 1 [(α + t + 1) · 1 + (t2 + t3 ) · (−t−2 ) + 2t] dt = e(α + 3). Il rotore di F è exy [(x − x) i + (−y + y) j + (x2 y + xyz + 2x + z − (xyz + x2 y + αx + z + x) k] e il campo risulta irrotazionale se e solo se α = 1. In corrispondenza, col metodo di ispezione diretta si trova il potenziale: U(x, y, z) = zexy + f (x, y), Ux = yzexy + fx = exy (yz + xy + α) da cui fx = exy (xy + 1) che, integrato rispetto a x, restituisce f (x, y) = xexy + 1(y). Derivando ora rispetto a y Uy = xzexy +x2 exy +1′ (y) = (x2 +xz)exy e si trova 1(y) = cost. Un potenziale è quindi U(x, y, z) = (x + z)exy . Osserviamo che la curva va da A(1, 1, 1) a B(2, 1/2, 4) e l’integrale è U(B) − U(A) = e(6 − 2) = 4e.
16 Il dominio è costituito dai due semipiani y > x e −x−y y < x; il campo è irrotazionale essendo ∂y F1 = (x−y)3 = ∂x F2 . Nel quarto quadrante vale la condizione sufficiente (X.44) affinché il campo sia conservativo, dunque un potenziale esiste e si trova, ad esempio per ispezione y diretta, U(x, y) = x−y + y2 . 17
Il campo è irrotazionale perché ∂y F1 = ∂x F2 =
y2 −x2 −4xy . x2 +y2
Il campo è conservativo perché nel semipiano y > 0 vale la condizione sufficiente (X.20), dunque è possibile trovare un potenziale. Usiamo il metodo di ispezione diretta visto a pagina 529; integrando parzialmente F1 rispetto a x troviamo U(x, y) = ln(x2 + y2 )−arctan xy + f (y). Poniamo poi F2 = ∂y U da cui f ′ (y) = 0, cioè f costante e un potenziale è U(x, y) = ln(x2 + y2 ) − arctan xy . Condizione necessaria affinché un campo sia conservativo è che la circuitazione lungo ogni curva chiusa sia nulla.
Ma se calcoliamo la circuitazione lungo la circonferenza x2 + y2 = 1 di parametrizzazione r(t) = cos t i + sin t j H e sostegno γ troviamo γ F · Tds = 2π. Dunque il campo non è conservativo. 18
l’integrale richiesto è della forma
R γ
F1 dx + F2 dy
3
con F1! = 0 e F2 = x ; per la ! formula di Green questo è D (∂x F2 − ∂y F1 ) dx dy = D 3x2 dx dy. Passando R 2π R 2 a coordinate polari si ha 0 1 3r3 cos2 ϑ dr dϑ = 45 π. 4 Usando la definizione, dopo aver parametrizzato le circonferenze r1 (t) = cos t i + sin t j e r2 (t) = 2 cos t i + R 2π R 2 sin t j per t ∈ [0, 2π], si trova γ x3 dy = 0 (2 cos t)3 t · R 2π R 2π (2 cos t) dt − 0 cos3 t · cos t dt. Risultando 0 cos4 t dt = 3 π, l’integrale curvilineo è 45 π. 4 4 19 Dato il campo F = 2(x2 + y2 ) i + (x + y)2 j si ha ∂x F2 − ∂y F1 = 2(x + ! y) − 4y = 2x − 2y. Per la formula di Green l’integrale è 2 D (x− y) dx dy dove D è il triangolo. R 2 R −x+4 Risulta pari a 2 1 x (x − y) dy dx = −4/3. 20!
L’ascissa del baricentro è data dalla formula x dx dy e ricorriamo alla formula di Green per calcolare l’integrale doppio. Occorre trovare un campo piano tale che x = ∂x F2 − ∂y F1 , ad esempio F2 = x2 /2 e F1 = 0: questa scelta dà l’integrale curvilineo desiderato. ¯ Allo stesso modo si ragiona per y. 1 A
D
R (a) Conviene usare la formula A = 12 γ x dy − R 2π y dx = 3a2 0 cos2 t sin2 t(cos2 t + sin2 t) dt = R 2 3 2 2π 3 2 a 0 sin (2t) cos 2t dt = 4 a π; il baricentro è nel4 l’origine, data la simmetria del dominio. (b) 2A = R1 R 3π (t · 0 − 0 · 1) dt − π2 [(1 + cos t) · cos t − (1 + sin t) · −1 R −1 (− sin t)] dt + 0 [t · (−2t) − (1 − t2 ) · 1] dt = [− π2 + 2] + 34 , ovvero A = 32 + 1 − π4 (verificare calcolando direttamente l’area!). 21
22 L’equazione dell’epicicloide è di tipo x = (R + r) cos t − r cos R+r t, y = (R + r) sin t − r sin R+r t dove t mir r sura l’angolo di rotazione della congiungente tra il punto di tangenza delle due circonferenze e il centro della circonferenza fissa. Applicando la formula di Green si trova l’area pari a π = (R + r)(R + 2r). 23 Costruiamo una circonferenza γ1 centrata nell’origine e di raggio r abbastanza piccolo da essere contenuta nella regione delimitata da γ, come in Figura 6.
Soluzioni degli esercizi – Capitolo X
645
e otteniamo ) " ( ∂ ∂ 1 xyv − yxv − xyu − yxu du dv . 2 ∂v C ∂u
F 6 Chiamiamo D la regione delimitata da γ e γ1 , con frontiera orientata positivamente percorrendo γ in senso antiorario e γ1 in senso orario (opposto a quello disegnato in Figura). Applicando il Teorema H su D al H di Green −y x campo F = x2 +y2 i + x2 +y 2 j troviamo γ F · T − γ F · T = 1 ! y2 −x2 ! y2 −x2 (∂ F − ∂ F ) dx dy = − dx dy = y 1 2 2 2 (x2 +y2 )2 D x 2 H D (x +y ) H 0. Quindi γ F · T = γ F · T e quest’ultimo si cal1 cola facilmente parametrizzando la circonferenza come H r(t) = (r cos t, r sin t) per t ∈ [0, 2π]. Si trova γ F · T = 1 R 2π 1 [(−r sin t)(−r sin t) + (r cos t)(r cos t)] dt = 2π. r2 0 24 ! Conviene utilizzare la formula di Green nella forR ∂ ma D ∂x f dx dy = ∂+ D f dy. Dobbiamo trovare quindi ∂ f = y: ad esempioRla funziouna funzione f tale che ∂x ne f (x, y) = xy. L’integrale richiesto è pari a ∂+ D xy dy, e osservando che f è nulla lungo gli assi l’integrale si R riduce a γ xy dy con γ percorsa da B a A. Si trova R0 R0 x(t)y(t)y′ (t) dt = −2 −1 (t3 + t4 ) dt = 1/10. −1
Svolgendo le derivate parziali osserviamo che tutti i termini contenenti derivate seconde si elidono (per il Teorema di Schwarz). Rimane dunque infine: " " xu yv − xv yu du dv. dx dy = D
C
28 (a) Σ si parametrizza con r(u, v) = (u2 + v2 ) i + 2 2 u j + v k, (u, v) ∈ D = {(u, v) √ : u + v ≤ 2}. ru × rv = 2 i − 2u√j − 2v k e kru × rv k = 1 + 4u + 4v2 . L’integrale è ! v 1 + 4u2 + 4v2 du dv che si calcola agevolmente in D R 2π R √2 √ 1 + 4r2 r2 sin r dr dϑ = 0. (b) La supolari come 0 0 perficie si parametrizza come r(u, v) = u cos v i+u sin v j+ √ √ 4 − u2 k per (u, v) ∈ D = [0, 2] × [0, 2π] (ottenuto facendo l’intersezione tra sfera e cono). ru × rv = 2 u√2 cos v i + u√ sin 2v j + u k e kru × rv k = √ 2u 2 . L’integrale è 4−u 4−u !4−u2 2u3 cos2 v du dv = 2π. (c) r(u, v) = u i + v j + (3 − u) k D √ con u2 +v2 ≤ 1, r√ kru ×rv k = 2. L’integrale è u ×rv = i+ k e √ ! u(3 − u) 2 du dv = − 2π/4 (integrando in polau2 +v2 ≤1 ri). (d) Il piano passante per i tre punti è 2x+ y+z−2 = 0, con r(u, v) = u i + v j + (2 − 2u − v) k per (u, v) appartenenti al triangolo piano di vertici (1, 0), (0, 2), (0, 0), cioè la regione D = {(u, v) : u ≥ 0, v √≥ 0, v ≤ −2u + 2}. r × rv = 2 i + j + k e kru × rv k = 6, da cui l’integrale R 1 R 2−2u !u u du dv = 0 0 u dv du = 1/3. D
29 Data la simmetria della lamina rispetto all’asse z ! possiamo affermare che x¯ = y¯ = 0. Si ha z¯ = 1 zdσ dove Σ è la superficie sferica di parametriz25 Sia (u(t), v(t)) una parametrizzazione della curva A Σ zazione r(u, v) = 2 cos u sin v i + 2 sin u sin v j + 2 cos v k ′ + Γ = ∂ C nel piano uv e x(t) = x((u(t), v(t))), y(t) = per u ∈ [0, 2π]. L’intersezione tra la sfera e il piano y((u(t), v(t))) la corrispondente parametrizzazione della z = 1 si ha per 2 cos v = 1, ovvero v = π/3. Dunque + sua immagine Γ = ∂ D nel piano xy. Abbiamo allora, v ∈ [π/3, rv kR = 4 sin v. L’area è data dall’inR 2π ! π] e kru × applicando il Teorema di Gauss–Green π " Z tegrale Σ dσ = 4 0 π/3 sin v dv du = 12π. Si ha poi 1 R R 2π π dx dy = x dy − y dx 3π¯z = 4 0 π/3 2 cos v sin v dv du = −6π da cui z¯ = −1/2. 2 Γ D ! Z b 1 30 Il momento è dato dall’integrale I = Σ (x2 + y2 )dσ = x(t)y′ (t) − y(t)x′ (t) dt dove una parametrizzazione per Σ è r(u, v) 2 a √ = u cos v i + Z b 2]. ru × rv = u sin v j − u k, con v ∈ [0, 2π] e u ∈ [1, √ 1 x(t) yu u′ (t) + yv v′ (t) − y(t) [xu u′ (t) + xv v′ (t)] dt −u cos v i − u sin v j + u k, kru × rv k = 2u. Risulta I = = 2 a √ R 2π R √2 √ Z b 2 0 1 u3 du dv = 3 2π/2. ′ ′ 1 R = x(t)yu − y(t)xu u (t) + x(t)yv − y(t)xv v (t) dt 2 a 31 (a) L’integrale richiesto è uguale I = γ F · T ds doZ 2 1 ve γ è la circonferenza di equazione x√ + z2 = 15 con xyu − yxu du + xyv − yxv dv . = 2 Γ′ y = −1, parametrizzata come r(t) = 15 cos t i − j + √ Ora applichiamo nuovamente il Teorema di Gauss–Green 15 sin t k, con t ∈ [0, 2π], percorsa nel verso opposto.
646 R 2π √ I = − 0 [−15 sin2 t − 15 cos t] dt = 15π. (b) DobbiaR mo calcolare I = γ F · T ds dove γ è la circonferenza √ di equazione x2 + y2 = 1 a quota z = 3, parametriz√ zata come r(t) = cos t i + sin t j + 3 k, con t ∈ [0, 2π]. R 2π √ I = 0 [− 3 sin t + cos2 ] dt = π. (c) Dobbiamo cal! colare I = Σ rot F · dσ dove rot F = i + j + k. Σ è il triangolo passante per i tre punti, sul piano di equazione x + y − 2 = 0, con versore normale √12 (1, 1, 0). Si ha r(u, v) = u i + (2 − u) j + v k, con (u, v) nel triangolo (1, 0), (2, 2) e (0, 1), ovvero nel dominio!D = {(u, v) : v ≥ 1−u, v ≤ 1 u + 1, v ≤ 2u − 2} . Risulta I = D 2 du dv = 3. (d) Dob2 ! biamo calcolare I = Σ rot F · N dσ dove rot F = i + j + k e Σ è la parte di piano x + y + z = 1 che si proietta sul disco x2 + y2 = 1 in z = 0, con versore normale √13 (1, 1, 1). ! Risulta I = x2 +y2 ≤1 3 dx dy = 3π. ! 32 (a) Per il Teorema del rotore I = Σ rot F · N dσ dove rot F = − i + 3xy j − (1 + 3xz) k e Σ è la porzione di piano 3x + 3y + 2z = 0 che ha per bordo γ, r(u, v) = u i + v j − 32 (u + v) k con u2 + v2 ≤ 1. Si ha N = √122 (3, 3, 2) e dunque rot F·N = √122 (−3+9xy−2−6xz). ! I = u2 +v2 ≤1 (−5+9uv−9u(u+v)) du dv che si calcola facilmente in coordinate!polari e vale −29π/4. (b) Per il Teorema del rotore I = Σ rot F · N dσ dove rot F = x2 j + y2 k e Σ è la porzione di piano x + y + z = 1 che ha per bordo γ, r(u, v) = u i + v j + (1 − u − v) k con u2 + v2 ≤ 9. Si ha N = √13 (1, 1, 1) e dunque rot F · N = √13 (x2 + y2 ). ! I = u2 +v2 ≤9 (u2 + v2 ) du dv che, in polari, vale 81π/2. 33 La curva è la circonferenza di parametrizzazione r(t) = cos t i + √25 sin t j + √15 sin t k per t ∈
[0, 2π], r′ (t) = − sin t i + √25 cos t j + √15 cos t k. DunR 2π que I = 0 ( √15 sin t − √45 sin t)(− sin t) + ( √15 sin t − 2 cos t)( √25 cos t) + (cos t + √65 sin t + 45 sin2 t)( √15 cos t) dt = R 2π 2 √3 (− cos2 + sin t) dt = 0. Per il Teorema del rotore 0 !5 I = Σ rot F · N dσ dove rot F = (2 + 2y) i e Σ è la porzione di piano y = 2z che ha per bordo γ, r(u, v) = u i + v j + 2v k con u2 + 5v2 ≤ 1. Si ha N = √15 (0, −1, 2) e dunque rot F · N = 0. L’integrale di superficie è dunque nullo. 34 Il bordo della superficie Σ è la circonferenza (x − 1)2 + y2 = 4 che si trova nel piano orizzontale z = 1, percorsa in senso antiorario Questa circonferenza è
Soluzioni degli esercizi – Capitolo X
bordo anche della superficie piana D costituita dal disco (x − 1)2 + y2 ≤ 4 che si trova in z = 1, orientata ! sappiamo che ! verso l’alto. DalH Teorema del rotore rot F · k dσ = F · T ds = rot F · N dσ = + D ∂ Σ !Σ rot F · k dx dy. Basta allora calcolare l’ul(x−1)2 +y2 ≤4 z=1
timo integrale, dove rot F · k = 3x2 ez − 3y2 cos z. L’integraR 2π R 2 ! le è (x−1)2 +y2 ≤4 (3x2 e − 3y2 cos 1) dx dy = 0 0 (3er(1 +
r cos ϑ)2 − 3 cos 1r3 sin2 ϑ) dr dϑ = 24eπ − 12π cos 1. # # 35 (a) I = E div F dx dy dz = E (1 + y) dx dy dz = R 2π R 1 R1 ! ( x2 +y2 ≤1 (1 + y) dx dy) dz = 2 0 0 (r2 sin ϑ + r) dr dϑ. −1 (b) La divergenza di F è div F = 3, dunque l’integrale è 3 volte il volume del cubo di lato 2, ovvero I # = 24. (c) Risulta div F = 2(x + y + z) e I = 2 C (x + y + z) dx dy dz. In coordinate sferiche R1 R 2π R π si ha I = 2 0 r3 dr 0 0 (sin2 φ cos ϑ + sin2 φ sin ϑ + sin φ cos φ) dr dϑφ = 0. (d) Risulta div F = 1 e I = ! R1 ! 1 dz dx dy = 12 x2 +y2 ≤1 [1 − x2 − y2 ] dx dy = 2 x2 +y2 ≤1 x2 +y2 R R 1 2π 1 (1 − r2 )r dr dϑ = π2 . 2 0 0 # 36 Il flusso è pari all’integrale E div F dx dy dz, dove E = {(x, y, z) : x2 + y2 + z2 ≤ 1}. La divergenza di F è 3x2 y, funzione dispari rispetto a y. Il dominio di integrazione è simmetrico rispetto al piano xz: il flusso è quindi nullo. 37 Una parametrizzazione naturale √ di Σ e r(u, v) = u cos v i + u sin v j + u k per u ∈ [1, 3] e 0 ≤ u sin v ≤ u2 cos v, ovvero arctan u ≥ v ≥ 0. Calcolando il prodotto vettoriale tra ru e rv si trova che un vettore normale alla superficie è N = (u cos v, u sin v, −u) mentre F(r(u, v)) = (u sin v, u − u cos v, u sin v) per cui F · N = 0: in particolare il flusso di F attraverso Σ è nullo. R 39 Sia F = f 1 j: allora da Green ∂+ D f 1 dy = ! ∂ ∂ ∂ ∂ f 1 ed essendo ∂x f 1 = 1 ∂x f + f ∂x 1 si ricava subiD ∂x to la prima formula. La seconda si ottiene analogamente considerando il campo F = − f 1 i. 40 Dalle formula di integrazione per parti si ha ! R ! f 1 dx dy dove l’integraf 1 dy− 1 f dx dy = x x x xx + D ∂ D D le curvilineo è nullo ! perché 1 = 0 su ∂D.!Applicando la seconda formula a D 1 fyy dx dy si trova D 1∆ f dx dy = ! − D (1x fx +1y fy ) dx dy. Scambiano i ruoli tra f e 1 e sfruttando su ∂D si trova con gli stessi calcoli ! il fatto che f = 0 ! che D f ∆1 dx dy = − D (1x fx + 1y fy ) dx dy, e dunque i due integrali sono uguali.
Note
(1) En écartant avec soin toutes les constructions géométriques, j’ai voulu faire sentir au Lecteur qu’il existoit une maniére d’envisager la Géométrie, qu’on pourroit appeler “Géométrie analytique”, et qui consisteroit à déduire les propriétés de l’étendue du plus petit nombre possible de principes, par des méthodes purement analytiques, comme Lagrange l’a fait dans sa Méchanique à l’égard des propriétés de l’équilibre et du mouvement. Traduzione libera da [Lacroix(1797)], pagina XXV. Si noti che il termine “analitico” è qui usato in un senso un po’ diverso dal senso attuale. Sarebbe interessante uno studio storico–analitico sull’evoluzione semantica dell’aggettivo “analitico”, ma questa nota non è la sede più adatta per un approfondimento in questo senso. Si veda [Boyer(2004)]. La scoperta dell’algebra simbolica nel ’500 (Pacioli, Cardano, Tartaglia, Bombelli, . . . ) e dei sistemi di coordinate nel ’600 (Fermat, Cartesio, . . . ) fu il preludio della ben più profonda trasformazione ed evoluzione dei metodi e delle prospettive che accompagnò le rivoluzioni del pensiero europeo del ’700 (Newton, Leibniz, Eulero, Lagrange, . . . ). L’età d’oro fu poi l’Ottocento di Gauss, Hamilton, Riemann, Klein, . . . Vale la pena di ricordare alcune date significative per la cronologia: Luca Pacioli (1445–1514), Gerolamo Cardano (1501–1576), Nicolò Tartaglia (∼1500–1557), Raffaele Bombelli (∼1526–1573), Pierre de Fermat (1601– 1665), René Descartes (Cartesio, 1596–1650), Girard Desargues (1591–1661), Blaise Pascal (1623–1662), Gottfried Wilhelm Leibniz (1646–1716), Isaac Newton (1643-1727), Leonhard Euler (1707–1783) Joseph Louis Lagrange (1736–1813), Gaspard Monge (1746–1818), Carl Friedrich Gauss (1777– 1855), A.F. Möbius (1790–1860), Julius Plücker (1801–1868), William Rowan Hamilton (1805–1865), Hermann Grassmann (1809–1877), Arthur Cayley (1821–1895), Georg Friedrich Bernhard Riemann (1826–1866), Sophus Lie (1842–1899), Felix Klein (1849–1925). (2) Erwin Rudolf Josef Alexander Schrödinger (1887–1961) Science and Humanism; Physics in our time. Cambridge University Press, 1951. «Our burning question as to the whence and whither all we can ourselves observe about it is the present environment. That is why we are eager to find out about it as much as we can. That is science, learning, knowledge; it is the true source of every spiritual endeavour of man. We try to find out as much as we can about the spatial and temporal surroundings of the place in which we find ourselves put by birth. . . » (3) Questa frase è stralciata quasi letteralmente dal Calcolo Geo-
metrico di G. Peano [Peano(1888)]. Il primo capitolo (Formazioni geometriche: linee, superficie e volumi) inizia così: «Il calcolo geometrico consiste in un sistema di operazioni analoghe a quelle del calcolo algebrico, ma in cui gli enti sui quali si eseguiscono i calcoli, invece che numeri, sono enti geometrici, che definiremo». (4) Questa è il testo greco degli Elementi pubblicato da J.L. Heiberg nel 1883 (con traduzione in latino a fronte). Chi ha letto con attenzione Analisi matematica — Dal calcolo all’analisi, il primo volume di quest’opera, ricorderà che J.L. Heiberg era lo studioso che scoprì gli antichi manoscritti di Archimede, a Costantinopoli (Istanbul). Forse vale la pena di raccontare la seconda parte della storia. Fonte di alcuni degli scritti di Archimede (Il Metodo, Stomachion e Sui corpi galleggianti, più altri trattati di archimede) fu il palinsesto, un preziosissimo manoscritto ritrovato da Heiberg nel 1906. Compilato da un anonimo copista del decimo secolo a Costantinopoli, fu poi trasformato in un libro di preghiere nel 1229 da un altrettanto anonimo monaco, che ne ripulì le pagine raschiando via con pietra pomice o una lama le inutili parole archimedee, per poi riciclare la pergamena. Questa tecnica, assai comune al tempo, è il motivo del nome palinsesto: da palmyhsto , composizione di plin (nuovamente) e y sto (raschiato, da yw, raschiare, grattare, stropicciare). Il libro di preghiere fu utilizzato per secoli, per poi approdare nel monastero di Mar Saba, ed essere ritrovato da Heiberg nel 1906 nella Biblioteca della Chiesa del Santo Sepolcro a Istanbul. Analizzando e fotografando tutte le pagine, fu comunque possibile per Heiberg riportare alla luce gli antichi testi di Archimede, ma misteriosamente il manoscritto scomparve nel 1907, si dice rubato. Passa per le mani di collezionisti a Parigi, per poi ricomparire misteriosamente ad una asta nel 1998, anno in cui viene acquistato per almeno due milioni di dollari da un anonimo miliardario. Una ultima nota etimologica: il termine AÊt mata, che è comunemente tradotto come «postulati», letteralmente significa «richieste», dal verbo aÊtèw (domandare, chiedere, pregare, desiderare). Il senso filosofico (aristotelico) di «postulati» per tale sostantivo forse non è esattamente quello inteso da Euclide. Il primo “postulato” inizia poi con l’imperativo dello stesso verbo aÊtèw, quasi a rafforzare questo senso di “richiesta” (infatti lo stesso non accade per le definizioni e per le “nozioni comuni”). (6) Abbiamo utilizzato la trascrizione inglese, una delle piú comuni. Le traslitterazioni (che non sono da confondere con le trascrizioni) piú usate sono le seguenti. Nikolaj Ivanoviˇc Lobaˇcev-
648
skij; per la ISO 9 (International Organization for Standardization) e la DIN (Deutsches Institut für Normung & Deutsche Bibliothek); Nikolaj Ivanovich Lobachevskij, per il sistema GOST (Gosstandart Rossii); infine Nikola˘i Ivanovich Lobachevski˘i, per il BSI (British Standards Institution). (7) Citando alla lettera lo scritto di David Hilbert: Gauss (Werke, Bd. 8, S. 241 und 244) spricht in zwei Briefen an Gerling sein Bedauern darüber aus, daß gewisse Sätze der Stereometrie von der Exhaustionsmethode, d.h. in der modernen Ausdrucksweise von dem Stetigkeitsaxiom (oder von dem Archimedischen Axiome) abhängig sind. Gauss nennt besonders den Satz von Euklid, daß dreiseitige Pyramiden von gleicher Höhe sich wie ihre Grundflächen verhalten. Nun ist die analoge Aufgabe in der Ebene vollkommen erledigt worden (vgl. außer der früheren Litteratur, Hilbert, Grundlagen der Geometrie, Leipzig 1899, Kapitel IV); auch ist es Gerling (Gauss’s Werke, Bd. 8, S.242) gelungen, die Volumengleichheit symmetrischer Polyeder durch Zerlegung in congruente Teile zu beweisen. Dennoch erscheint mir der Beweis des eben genannten Satzes von Euklid auf diese Weise im allgemeinen wohl nicht als möglich und es würde sich also um den strengen Unmöglichkeitsbeweis handeln. Ein solcher wäre erbracht, sobald es gelingt, zwei Tetraeder mit gleicher Grundfläche und von gleicher Höhe anzugeben, die sich auf keine Weise in congruente Tetraeder zerlegen lassen und die sich auch durch Hinzufügung congruenter Tetraeder nicht zu solchen Polyedern ergänzen lassen, für die ihrerseits eine Zerlegung in congruente Tetraeder möglich ist. (Die Volumengleichheit zweier Tetraeder von gleicher Grundfläche und Höhe. Göttinger Nachrichten Akad. Wiss. Göttingen 1900, 266-267). (8) Possiamo identificare il piano euclideo con R2 , solo dopo aver scelto un sistema di riferimento. (9) Come per il piano, possiamo identificare lo spazio tridimensionale con R3 , solo dopo aver scelto un sistema di riferimento. (10) Liberamente tratto dall’incipit di Death in the afternoon, di Ernest Hemingway. «At the first bullfight I ever went to I expected to be horrified and perhaps sickened by what I had been told would happen to the horses. Everything I had read about the bull ring insisted on that point; most people who wrote of it condemned bullfighting outright as a stupid brutal business, but even those what spoke well of it as an exhibition of skill and as a spectacle deplored the use of the horses and were apologetic about the whole thing . . . was to put down that really happened in action; what the actual things were which produced the emotion that you experienced.» Ci si potrebbe domandare, non senza una ragione, cosa c’entra questo stralcio ermetico con le matrici. Il motivo di questo omaggio ad uno dei più grandi scrittori del Novecento in un capitolo di un mediocre manuale universitario è la strana analogia tra l’arte del combattimento con i tori (argomento di cui Death in the afternoon è considerato uno dei migliori libri mai scritti) e molti aspetti della matematica, tra cui l’algebra lineare. Oltre ad una certa repulsione che sembra essere suscitata in alcuni o molti da entrambe le discipline, in entrambe altri (molti o alcuni) dicono di trovarvi una componente estetica accessibile solo a chi ne conosce bene i particolari, la storia e il contesto culturale. Forse, come la tauromachia, anche l’algebra lineare o la matematica non possono essere per tutti, ma solo per chi ha intenzione di dedicarvi una certa quantità di tempo, di impegno o di passione, non sempre misurabili in CFU. Forse, nonostante tutto, semplicemente non è possibile combat-
Note
tere con i tori senza spargere sangue nell’arena, né è possibile fare della matematica senza vedere mai le dimostrazioni. Chi pensa che ci possa essere corrida de toros senza sangue e morte, o di poter fare matematica saltando le dimostrazioni e l’esercizio del pensiero, certamente si sbaglia. Ora, se l’una (non dico quale) può essere tranquillamente abolita, l’altra può esserlo solo a condizione di abolire la scienza stessa. Quest’abolizione (di una, l’altra o di entrambe), nel corso dei secoli è stata molte volte auspicata, invocata, attesa ed effettuata. Fino ad oggi. (11) Il Lettore dovrebbe provare comunque a dimostrarle, e non fidarsi mai dei “segue facilmente che. . . ”, “è ora semplice dimostrare che. . . ”. Mai fidarsi. (12) «Hanc marginis exiguitas non caperet», come disse Fermat. Citazione a sproposito, già utilizzata, sempre a sproposito, nel primo volume. (13) Josef-Maria Hoëné de Wronski, nato a Wolsztyn in Polonia, all’inizio dell’800 progettò una serie di invenzioni fantastiche: veicoli cingolati che competessero con la ferrovia, una macchina per prevedere il futuro, il moto perpetuo, dando prova di poco realismo. Quasi tutti i suoi risultati, anche in matematica, erano sbagliati, ma per qualche oscura ragione viene tuttora ricordato e rispettato. (14) Psychological Types, paragrafo 691, pagina 417. (15) Dato uno spazio metrico (X, d), il diametro di un sottoinsieme E è l’estremo superiore delle distanze delle coppie di suoi punti. Fissato δ > 0, andiamo a considerare tutti i ricoprimenti (infiniti) di E con insiemi di diametro inferiore a δ: (X ) ∞ Hδs (E) = inf diam(Ai )s . i=1
Questa quantità cresce rispetto a δ. La misura (esterna) di Hausdorff s-dimensionale è definita come Hs (E) = lim Hδs (E). δ→0
Si dimostra facilmente che la funzione s 7→ Hs (E) è decrescente rispetto a s. La dimensione di Hausdorff è definita come quel valore s per cui la misura di Hausdorff passa dall’essere infinita ad essere nulla: dimH (E) = inf{s : Hs (E) = 0} = sup{s : Hs (E) = ∞}.
(16) Ecco come egli enuncia la legge delle aree: Quanto longior est αε quam αδ, tanto diutius moratur Planeta in certo aliquo arcui excentrici apud δ, quantum in aequali arcu excentrici apud ε. [Astronomia Nova, cap. 32, p. 167] (Qui α è il centro del mondo, β quello dell’eccentrico e γ l’equante, δ è l’apogeo, ε il perigeo. Keplero considera degli archi infinitesimi sull’orbita, che denomina δψ e εω.) (17) «Si fa inutilmente con molto ciò che si può fare con poco». Questa frase, insieme ad altre pressoché equivalenti (Entia non sunt multiplicanda praeter necessitatem, Numquam ponenda est pluralitas sine necessitate), è nota come il rasoio di Occam: bisogna cercare la spiegazione piú semplice, con una forma di “economia” di pensiero. Una conseguenza di questo principio può essere il piú recente rasoio di Hanlon: «Never attribute to malice that which can be adequately explained by stupidity», visto e considerato che la stupidità è significativamente piú frequente della malvagità (un vecchio adagio, attribuito a A. Einstein, recita «Only two things are infinite, the universe and human stupidity, and
Note
I’m not sure about the former»). Una versione del rasoio di Hanlon in cui alla parola «stupidità» si sostituisce «incompetenza» è attribuito a Napoleone; è ragionevole dedurre che nei secoli una quantità significativa di incompetenza si sia trasformata in stupidità. (18) «L’arte astratta, in realtà, non esiste. Si deve sempre iniziare da qualcosa di reale. Dopo si può rimuovere da questo “qualcosa” la somiglianza che può avere con la realtà. Quando si ottiene questo, non c’è pericolo alcuno, dato che l’oggetto ha segnato nell’artista un marchio indelebile.» Probabilmente lo stesso accade con i fondamenti teorici e le parti astratte della scienza, in particolare della matematica. (19) Il binomio di Newton è bello come la venere di Milo./ Peccato che pochi se ne accorgano./ óóóó—óóóóóó óóó—óóóóóóó óóóóóóóó / (Il vento là fuori.) (20) Può anche essere trovata in letteratura con le traslitterazioni Sof’ja Kovalevskaja, Sof’â Kovalevskaâ (ISO 9), Sof’ja Kovalevskaja (DIN, GOST), Sof’ya Kovalevskaya (BSI) o con alcune trascrizioni differenti. Le sigle si riferiscono ai sistemi già citati nella nota (6). (21) Sia X un insieme non vuoto, e sia F una famiglia di sottoinsiemi di X. F è detta σ-algebra su X se: ① L’insieme vuoto ∅ appartiene a F;
② se E ∈ F, allora il suo complementare X r E è in F;
③ se tutti gli elementi Ei di una successione di insiemi sono in F , allora la loro unione è in F.
649
(22) Il professore: una vita da cani. / La frustrazione su diversi piani. / La sensazione di fastidio ai denti / che si prova allo stridere del gesso. (23) I motivi di questa scelta sono diversi: è conciso ed elegante, interpretato, utilizzabile in ambienti interattivi, documentato bene e sviluppato da molti, estendibile e potente, è disponibile gratuitamente su tutte le piattaforme. Perché non i sistemi di computer algebra o calcolo tecnico (matlab, maple, mathematica, . . . ) che abbiamo spesso nominato? Perché sono ottimi per fare quello che fanno, cioè fare da interfaccia con kernel di calcolo numerico e simbolico, ma non valgono la spesa se devono essere usati solo per implementare qualche algoritmo (pagare quelle cifre per l’interprete del linguaggio è eccessivo). Perché non linguaggi più spendibili sul mercato (java,C++,. . . )? Perché sono un po’ prolissi e si leggono male sulle pagine di un libro, e difficilmente li si usa in un ambiente interattivo.
❊❊❊ Un’ultima nota conclusiva: forse non tutti sanno che l’illustrazione di copertina rappresenta la Torre di Tatlin, progettata nel 1920 dall’architetto e artista russo Vladimir Tatlin (1885–1953) e mai realizzata. Avrebbe dovuto essere alta 400 metri (la Torre Eiffel è alta 300 metri) ed essere il monumento alla Terza Internazionale, cioè al da poco nato Comintern. La guerra civile, seguita alla rivoluzione di Ottobre, ne impedí la costruzione prevista a Pietrogrado (città che poi cambiò il nome in Leningrado e infine, recentemente, in San Pietroburgo). Pare che allo stesso modo molti altri progetti non siano stati realizzati.
Riferimenti bibliografici
[Abate(1996)] M. A BATE. Geometria. McGraw–Hill, Milano, 1996. [Adams(2003)] R. A. A DAMS. Calcolo Differenziale, vol.1 e vol.2. CEA, Milano, 2003. [Aigner e Ziegler(2004)] M. A IGNER E G. M. Z IEGLER . Proofs from The Book. Springer-Verlag, Berlin, 2004. [Ambrosetti e Prodi(1995)] A. A MBROSETTI E G. P RO DI. A primer of nonlinear analysis, volume 34. Cambridge University Press, Cambridge, 1995. [Andronov et al.(1973)] A. A. A NDRONOV, E. A. L EON TOVICH , I. I. G ORDON , E A. G. M A˘IER . Qualitative theory of second-order dynamic systems. Halsted Press, 1973. [Apostol(1967)] T. M. A POSTOL. Calculus. Vol. I: Onevariable calculus, with an introduction to linear algebra. Blaisdell Publishing Co., 1967. [Apostol(1969)] ———. Calculus. Vol. II: Multi-variable calculus and linear algebra, with applications to differential equations and probability. Blaisdell Publishing Co., 1969. [Apostol(1977)] ———. Calcolo – volume secondo, geometria. Bollati Boringhieri, Torino, 1977. [Apostol(1978)] ———. Calcolo – volume terzo, Analisi 2. Bollati Boringhieri, Torino, 1978. [Arnold(2006)] V. I. A RNOLD. Ordinary differential equations. Springer-Verlag, Berlin, 2006. [Axler(1997)] S. A XLER . Linear algebra done right. Springer, Paris, 1997. [Banach(1922)] S. B ANACH. Sur les opérations dans les ensembles abstraits et leur application aux équations intégrales,. Fund. Math., 3:133–181, 1922. [Berger(1987)] M. B ERGER . Geometry I, II. Springer, Berlin–Heidelberg–New York, 1987. [Birkhoff e Rota(1989)] G. B IRKHOFF E G.-C. R OTA. Ordinary differential equations. John Wiley & Sons
Inc., New York, 1989. [Boyce e DiPrima(2001)] W. E. B OYCE E R. C. D I P RI MA . Elementary differential equations and boundary value problems. John Wiley & Sons Inc., New York, 2001. [Boyer(2004)] C. B. B OYER . History of Analytic Geometry. Dover, New York, 2004. [Bramanti et al.(2000)] M. B RAMANTI , C. PAGANI , E S. S ALSA. Matematica. Calcolo infinitesimale e algebra lineare. Zanichelli, Bologna, 2000. [Caccioppoli(1930)] R. C ACCIOPPOLI. Un teorema generale sull esistenza di elementi uniti in una trasformazione funzionale. Rend. Accad. dei Lincei, 11:794–799, 1930. [Carrier e Pearson(1991)] G. F. C ARRIER E C. E. P EAR SON . Ordinary differential equations, volume 6 di Classics in Applied Mathematics. SIAM, 1991. [Coddington(1961)] E. A. C ODDINGTON . An introduction to ordinary differential equations. Prentice-Hall Inc., 1961. [Conti(1993)] F. C ONTI. Calcolo. Teoria e applicazioni. McGraw–Hill, Milano, 1993. [Courant e Hilbert(1953)] R. C OURANT E D. H ILBERT . Methods of mathematical physics. Vol. I. Interscience Publishers, Inc., New York, N.Y., 1953. [Crowe(1967)] M. J. C ROWE. History of Vector Analysis. University of Notre Dame Press, London, 1967. [De Marco(1992)] G. D E M ARCO . Analisi due: secondo corso di analisi matematica per l’università. Zanichelli (Decibel), Bologna Padova, 1992. [Devaney(2003)] R. L. D EVANEY. An introduction to chaotic dynamical systems. Westview Press, Boulder, CO, 2003. [Dolcher(1978)] M. D OLCHER . Algebra lineare. Zanichelli, Bologna, 1978. [Fox(1987)] C. F OX. An introduction to the calculus of variations. Dover Publications Inc., New York,
652
1987. [Guggenheimer(1967)] H. G UGGENHEIMER . Plane Geometry and its Groups. Holden Day, San Francisco, 1967. [Hilbert e Cohn-Vossen(1972)] D. H ILBERT E S. C OHN V OSSEN . Geometria intuitiva. Bollati Boringhieri, Torino, 1972. [Hirsch e Smale(1974)] M. W. H IRSCH E S. S MALE. Differential equations, dynamical systems, and linear algebra. Academic Press, 1974. [Hirsch et al.(2004)] M. W. H IRSCH , S. S MALE , E R. L. D EVANEY. Differential equations, dynamical systems, and an introduction to chaos, volume 60. Elsevier/Academic Press, Amsterdam, 2004. [Klein(1956)] F. K LEIN . Lectures on the Icosahedron. Dover, New York, 1956. [Kolmogorov e Fom¯ın(1975)] A. N. K OLMOGOROV E S. V. F OM¯IN . Introductory real analysis. Dover Publications Inc., New York, 1975. Translated from the second Russian edition and edited by Richard A. Silverman, Corrected reprinting. [Lacroix(1797)] S. F. L ACROIX. Traité du Calcul Différentiel et du Calcul Intégral. Paris, 1797. [Lang(1970)] S. L ANG. Algebra lineare. Boringhieri, Torino, 1970. Ottava edizione. [Lyndon(1985)] R. LYNDON . Groups and Geometry. Cambridge University Press, Cambridge, 1985. [Maderna e Soardi(1987)] C. M ADERNA E P. M. S OAR DI. Lezioni di analisi matematica. CLUP, Milano, 1987. [Marcellini e Sbordone(2004)] P. M ARCELLINI E C. S BORDONE. Elementi di calcolo : [versione semplificata per i nuovi corsi di laurea]. Liguori, Napoli, 2004. [Marsden e Tromba(1976)] J. E. M ARSDEN E A. J. T ROMBA. Vector Calculus. W.H. Freeman and Company, New York, 1976. [Messer(1994)] R. M ESSER . Linear algebra, Gateway to Mathematics. Harper Collins, New York, 1994. [Pagani e Salsa(1990)] C. D. PAGANI E S. S ALSA. Analisi matematica - Vol I. Zanichelli, Bologna, 1990.
Riferimenti bibliografici
[Pagani e Salsa(1991)] ———. Analisi matematica - Vol II. Zanichelli, Bologna, 1991. [Peano(1888)] G. P EANO . Calcolo Geometrico, secondo l’Ausdehnungslehre di H. Grassmann, preceduto dalle Operazioni della Logica Deduttiva. F.lli Bocca Editori, Torino, 1888. [Piccinini et al.(1978)] L. P ICCININI , G. S TAMPACCHIA , E G. V IDOSSICH . Equazioni differenziali ordinarie in Rn . Liguori Editore, Napoli, 1978. [Pontryagin(1962)] L. S. P ONTRYAGIN . Ordinary differential equations. Addison-Wesley, 1962. [Riccardi(2004)] G. R ICCARDI. Calcolo differenziale ed integrale. Springer Italia, Milano, 2004. [Robbiano(2007)] L. R OBBIANO . Algebra lineare per tutti. Springer, Milano, 2007. [Royden(1988)] H. L. R OYDEN . Real analysis. Macmillan Publishing Company, New York, 1988. [Rudin(1976)] W. R UDIN . Principles of mathematical analysis. McGraw-Hill Book Co., New York, 1976. International Series in Pure and Applied Mathematics. [Rudin(1987)] ———. Real and complex analysis. McGraw-Hill Book Co., New York, 1987. [Salsa e Squellati(2004)] S. S ALSA E A. S QUELLATI. Calcolo infinitesimale e algebra lineare. Zanichelli, Bologna, 2004. [Sernesi(1991,1994,2000)] E. S ERNESI. Geometria, vol. I–II. Bollati Boringhieri, Torino, 1991,1994,2000. [Shahriari(2006)] S. S HAHRIARI. Approximately calculus. American Mathematical Society, Providence, RI, 2006. [Simmons(1972)] G. F. S IMMONS. Differential equations with applications and historical notes. McGraw-Hill, New York, 1972. [Stewart(2002)] J. S TEWART . Calcolo – Funzioni di più variabili. Apogeo, Milano, 2002. [Tricomi(1965)] F. G. T RICOMI. Lezioni di analisi matematica. CEDAM, Padova, 1965. [Weyl(1952)] H. W EYL. Symmetry. Princeton University Press, Princeton, 1952.
Indice analitico
Simboli (u1 , u2 , . . . , un ), 98 Br (x0 , y0 ), 250, 333 Dv f , 279 H f , 292
a · b, 110 fx , ∂x f,
∂2 f fxx , ∂x2
∂f , Dx ∂x
f , 276
, 292
n-upla, 98
base, 167 canonica, 167 diagonalizzante, 204 ortogonale/ortonormale, 180 Bessel, Friedrich Wilhelm, 36 funzioni di, 36, 42
J f , D f , 350
A
∆φ, 293
accelerazione, 231, 265
C
det, 115, 186 ∂(x, y) , 480 ∂(u, v)
aggiunto, 224
Caccioppoli, Renato, 345
Airy, George Biddell, 79
cambio di base/coordinate, 176
allineati/collineari (punti), 132
campo di direzioni, 392 di velocità, 355 elettrico, 355, 484, 491, 542 gradiente (o conservativo), 303, 315, 522 gravitazionale, 528 irrotazionale, 525 vettoriale, 355
∂(x, y, z) , 493 ∂(u, v, w) diag(λ1 , λ2 , . . . , λn ), 413 ! , 461, 465 D ! , 537, 541 Σ div, 356 R , 516, 520 γ
aperto, 252 Archimede, principio di, 567 area di un parallelogramma, 112 di una regione piana, 466, 472 di una superficie cartesiana, 485 elemento di, 537 interna/esterna, 472 racchiusa da una curva, 262
n
R , 99, 165 C, 255, 337
C1 , Ck , 284, 294, 359
∇ f , 277
k·k, 108, 178 H , 520 γ
ascissa curvilinea, 242 auto-aggiunto, 210, 220, 224 autovalore/autovettore, 204
cardioide, 260 Cauchy problema di, 393 successione di, 343 Cavalieri, principio di, 462 Cayley, Arthur, 172
rot, 356
B
centro, 423, 432
tr, 223
Banach, Stefan, 345 spazio di, 345 teorema di, 345
centro di curvatura, 244
baricentro, 238, 316, 474, 517, 539
Cholesky, decomposizione di, 226
projb a, 112 × o ∧, 123 # , 487, 489 E
centroide, 475 chiuso, 252
654
Indice analitico
ciclo limite, 451
curve integrali, 388
cicloide, 550
D
cilindroide, 458
d’Alambert, metodo di, 33 decomposizione di Cholesky, 226 LU, 226 QR, 183, 226
circuito RLC, 33 combinazione lineare, 99, 100, 166 compattezza, 339, 342 sequenziale, 339, 342 completezza, 345 condizione (D), 61 connessione, 343 per archi, 343 continuità, 337, 338 sequenziale, 337 uniforme, 341 controimmagine, 338 convergenza di una serie, 68 di una successione, 335 in media quadratica, 63, 335 insieme di (per una serie), 36 puntuale, 64 uniforme, 335 convessità, 300 coordinate cartesiane, 107 cilindriche, 138, 257, 493 polari, 138, 268, 483, 500 sferiche, 139, 141, 258, 494 coseni direttori, 160 curva, 228 chiusa, 229 continua, 228 lunghezza di, 240, 517 orientazione di, 231 parametrizzazione di, 228 regolare (a tratti), 234 retta secante, 233 retta tangente a, 234 semplice, 229 sostegno di, 228 curvatura, 243, 264
derivata direzionale, 279, 285 parziale, 276, 278, 292 determinante, 115, 118 diagonalizzare, 203, 217 diametro di un insieme, 648 differenziabilità, 281, 348 differenziale, 348 dimensione, 106, 169, 648 Dini, Ulisse, 308 distanza, 160, 332 banale, 371 dell’estremo superiore, 332 euclidea, 332 indotta dalla norma, 334 integrale, 333 disuguaglianza isoperimetrica, 272 divergenza, 356 teorema della, 547
E elemento d’area, 537 elica circolare, 240, 241, 246, 519 energia cinetica, 315 conservazione della, 315 potenziale, 315, 435 totale, 315 equazione cartesiana, 131, 135 del moto, 3 lineare, 99, 100 logistica, 3, 18 polare, 260 polare di una curva, 264 scalare, 131 secolare, 454
equazione differenziale, 7 a variabili separabili, 7 autonoma, 388 di Bernoulli, 22 di Riccati, 31 dipendente dal tempo, 388 lineare del primo ordine, 10 lineare di secondo ordine, 13 omogenea, 20 soluzione di, 7, 388 equazioni di Cauchy–Riemann, 352 di continuità, 549 di Maxwell, 549 parametriche, 127 simmetriche, 128 Erone, formula di, 161 estratta, 338 Euclide di Alessandria, 127 Eulero, teorema di, 385
F faccia (di una superficie), 532 fattore integrante, 11 Fermat principio di, 307 teorema di, 363 flusso, 541 forma canonica, 201 forma quadratica, 197, 364 definita, 202 diagonale, 199 indefinita, 202 semidefinita, 202 formula di Taylor, 360 con resto di Lagrange, 361 con resto di Peano, 295, 361 formule di riduzione, 468, 488 Fourier, Jean Baptiste Joseph, 54 serie di, 54 Fubini, Guido, 477
Indice analitico
funzione, 247 a valori vettoriali, 127 composta, 290, 291, 353 continua, 255, 337 convessa, 300 derivabile, 277, 350 differenziabile, 281, 348 dominio di, 247 grafico di, 248 immagine di, 247 implicita, 307, 365 integrabile, 461 matriciale, 405 olomorfa, 352 traccia/insieme di livello di, 248 fuoco, 423, 432
655
insieme di livello, 249, 310 integrale cambiamento di variabili, 477 curvilineo di prima specie, 516 di seconda specie, 520 di superficie, 537, 541 dipendente da parametro, 373 doppio, 461 improprio, 558 iterato, 462 parziale, 461 triplo, 487 per fili, 488 per strati, 488
J Jacobi, metodo di diagonalizzazione, 217 jacobiano, 480, 493
K
grafo, 224
Kepler, Johannes, leggi di, 235
Gram–Schmidt,ortogonalizzazione di, 182
Kovalevskaja, Sofja Vasilyevna, 401
Grassmann, Hermann Günter, 166
L
Gronwall, lemma di, 452
Lagrange identità di, 161 moltiplicatori di, 369 resto di, 360
Hausdorff, misura/dimensione di, 648 Hessiana, 360 hessiana, 292 test della, 298, 364 Hilbert, David, spazio di, 181
I
massa, 473, 516, 538 massimo globale (o assoluto), 296, 301 locale, 296, 363 vincolato, 304
metrica, 332
intorno, 250, 333, 338
Hamilton, William Rowan, 144
Malthus,Thomas R., 5
limitatezza, 301, 334
Gauss–Green, teorema di, 529
H
M
metodo di Cramer, 123, 192, 213 di d’Alambert, 33 di eliminazione di Gauss, 102
intervallo massimale, 403
gradiente, 277 formula del, 285, 353 significato geometrico, 286
Lotka–Volterra, modello di, 437
Lemma di Gronwall, 452 di Riemann –Lebesgue, 95
Gauss, teorema di, 547
giustapposizione, 231
Lobachevsky, Nikolai Ivanovich, 141
lavoro, 520
integrale primo, 435
geometrie non euclidee, 137
linearizzazione, 282
matrice, 171 associata, 175, 197 componenti/coefficienti di, 171 congruente, 198 di adiacenza, 224 di Hadamard, 222 di permutazione, 226 di transizione, 410 diagonale, 203 diagonalizzabile, 203 diagonalizzante, 203 esponenziale, 417 fondamentale, 409 Hessiana, 360 hessiana, 292 inversa, 176 jacobiana, 350 ortogonale, 180 quadrata, 171 risolvente, 410 simile, 177 trasposta, 188 wronskiana, 223, 409
integrale generale, 388
G
generatori, 167
limite, 252 di una funzione, 336 di una successione, 250, 335 in coordinate polari, 267
laplaciano, 293, 358
656
Indice analitico
minimo globale (o assoluto), 296, 301 locale, 296, 363 vincolato, 304
oscillatore armonico, 24, 391 con forzante, 25
minori principali, 202, 203, 225, 365
palla (disco) aperta/chiusa, 250, 333
misura di Peano–Jordan, 466, 472
paralleli, 133
misurabile, 466
parallelogramma, regola del, 108
Moebius, nastro di, 535
parametri, 105
moltiplicatori di Lagrange, 305, 320, 369
parametrizzazione, 105
momento angolare, 238 d’inerzia, 316, 475, 508, 519
Peano curva di, 230 resto di, 361
P
Pauli, matrici di, 226
punto, 107 critico, 297, 363 di accumulazione, 250 di equilibrio (per un sistema di equazioni differenziali), 427 di frontiera, 251 di massimo, 296 di minimo, 296 di sella, 297 esterno, 251 estremale, 296 fisso, 345 problema di, 345 teorema del, 345 interno, 251 stazionario, 297
nastro di Moebius, 535
piano, 131 parallelo, 131, 133 vettore direttore di, 131
Newton, Isaac, leggi di, 232
piano tangente, 282, 289
quantità di moto, 237
nodo, 415, 431 a due tangenti, 415 a stella, 415 improprio/a una tangente, 420
Picard, iterate di, 401
quaternioni, 144
polinomio caratteristico, 13, 207, 223 di Legendre, 186 di Taylor, 38 trigonometrico, 55, 186
quoziente di Rayleigh, 220
potenziale, 303, 435, 484, 491
Rayleigh, quoziente di, 220
O
Principio di Archimede, 567 di Cavalieri, 462, 491 di Fermat, 307 di sovrapposizione, 32
retta, 127 ortogonale, 130 parallela, 127 sghemba, 130
omotetia (o dilatazione), 157
probabilità congiunta, 477
operatore, 174 orbita, 390
problema di Cauchy (ai valori iniziali), 393
orientazione del bordo di un insieme piano, 530 del bordo di una superficie, 543 di una curva, 231 di una superficie, 536
prodotto di serie, 92 esterno (o vettoriale), 123 righe per colonne, 172, 175 scalare, 110, 178 hermitiano, 211
ortogonalità, 179
proiezione, 112, 158, 180, 181, 184
ortogonalizzazione, 182
proiezione ortogonale, 136
N
norma, 108, 178, 179, 334, 381, 590 di Frobenius, 216 equivalente, 381 normale esterna, 546 nucleo, 175 nullità, 175
Q
R raggio di curvatura, 243 rango, 170, 193, 201
Riemann –Lebesgue lemma di, 95 funzione zeta di, 35 somme di, 236, 459, 487 riferimento cartesiano, 106 riflessione, 158 riscalamento, 107 ritratto di fase, 390 rotore, 356 teorema del, 544
S
Indice analitico
657
segmento, 130
spettro, 204
sella, 431
spigolo (di una superficie), 532
semiretta, 130
spirale esponenziale, 261
semplice, 262, 467, 489
stabilità, 404, 429
semplicemente connesso, 546
Steklov, Andreevich, 212
semplicemente decomponibile, 470 serie di funzioni, 35 di potenze, 37 centro di, 37 coefficienti di, 37 raggio di convergenza, 38 di Taylor, 47 trigonometriche (di Fourier), 54 sistema di equazioni, 100 compatibile, 100 omogeneo, 100 equivalente, 101 soluzione di un problema di Cauchy, 393 di un’equazione differenziale, 7, 388 somma di Riemann, 459 di vettori, 108 inferiore/superiore, 460 sottomatrice, 193 principale (nord-ovest), 202 sottospazio affine, 135 lineare, 135 vettoriale, 166 sottosuccessione, 338 span, 166 spazio di Banach, 345 di Hilbert, 187 funzionale, 398 hermitiano (o unitario), 211 metrico, 332 normato, 334 topologico, 338 vettoriale, 164
Stokes, teorema di, 544 successione convergente, 250, 335 di Cauchy (fondamentale), 343
di inversione locale, 367 di Schwarz, 294, 359 di Weierstrass, 301, 341 spettrale, 207 terna, 98 destrorsa, 107, 123 intrinseca, 245 topologia, 338 toro, 270
superficie, 257 frontiera di una, 258 orientabile, 536 parametrizzazione di una, 257 regolare, 289 a pezzi, 532 fino al bordo, 535 semplice, 258
torsione, 246, 271
T
V
Taylor formula di, 295, 360, 361 polinomio di, 38 serie di, 47
Vandermonde, matrici di, 602
Teorema di Fubini–Tonelli, 463 del coseno (o di Carnot), 109 del rotore (Stokes), 544 della divergenza (Gauss), 547 della permanenza del segno, 273 delle contrazioni (o del punto fisso), 345 delle forze vive, 522 di Bolzano–Weierstrass, 339 di Dini, 308, 324 di Dini per sistemi, 366 di esistenza e unicità globale, 395 di esistenza e unicità locale, 394 di Eulero, 385 di Fermat, 363 di Gauss–Green, 529 di Heine–Borel, 339
traccia, 207, 223 traiettoria, 390, 427 trasformazione elementare, 196 lineare, 175 traslazione, 108
velocità, 231, 390 Verhulst,Pierre-François, 5 versore, 112 binormale, 245 normale principale, 243 tangente, 242 vertice (di una superficie), 532 vettore, 99 (in)dipendenza lineare, 104, 166 componenti di, 112, 168 direzione, 127 ortogonale, 110 parallelo, 104 proeiezioni, 182 spostamento, 107 Volterra, Vito, 6, 437, 455 volume, 461, 488
W wronskiano, 424, 426