Collana di Fisica e Astronomia
A cura di: Giorgio Parisi Michele Cini Stefano Forte Massimo Inguscio Guido Montagna Oreste Nicrosini Franco Pacini Luca Peliti Alberto Rotondi
A mia moglie Anna e a mio figlio Massimo
Michele Cini
Elementi di Fisica Teorica
13
MlCHELE ClNI
Dipartimento di Fisica Universita di Roma Tor Vergata
Springer-Verlag fa parte di Springer Science+Business Media springer.com © Springer-Verlag Italia, Milano 2006 ISBN 10 88-470-0424-1 ISBN 13 978-88-470-0424-5
Quest'opera e protetta dalla legge sul diritto d'autore. Tutti i diritti, in particolare quelli relativi alia traduzione, alia ristampa, all'uso di figure e tabelle, alia citazione orale, alia trasmissione radiofonica o televisiva, alia riproduzione su microfilm o in database, alia diversa riproduzione in qualsiasi altra forma (stampa o elettronica) rimangono riservati anche nel caso di utilizzo parziale. Una riproduzione di quest'opera, oppure di parte di questa, e anche nel caso specifico solo ammessa nei limiti stabiliti dalla legge sul diritto d'autore, ed e soggetta all'autorizzazione delPEditore. La violazione delle norme comporta sanzioni previste dalla legge. L'utilizzo di denominazioni generiche, nomi commerciali, marchi registrati, ecc, in quest'opera, anche in assenza di particolare indicazione, non consente di considerare tali denominazioni o marchi liberamente utilizzabili da chiunque ai sensi della legge sul marchio. Riprodotto da copia camera-ready fornita dall'Autore Progetto grafico della copertina: Simona Colombo, Milano Stampato in Italia: Signum, Bollate (Mi)
Prefazione
Questo manuale contiene il corso di Elementi di Fisica Teorica che ho svolto per la Laurea triennale in Scienza dei Materiali, fin dalla sua istituzione all’Universit` a di Roma Tor Vergata. Si tratta di un corso introduttivo di Fisica Teorica che richiede una buona conoscenza a livello universitario di calcolo, meccanica ed elettromagnetismo. Per gli argomenti svolti (meccanica analitica, meccanica statistica, relativit` a ristretta, meccanica quantistica non Relativistica) il corso corrisponde grosso modo al vecchio esame di istituzioni di fisica teorica per fisici, ma ci sono anche differenze tali da giustificare un testo ad hoc. Prima di tutto ho cercato di adattare la tecnica espositiva. Ho preferito evitare (nei limiti del possibile) o di spiegare meglio certi calcoli particolarmente onerosi. Talora `e utile sostituirli con descrizioni di esperimenti pensati o fatti; in tal modo l’esposizione risulta pi` u agevole rispetto a quella tipica di un corso per fisici, non importa se del vecchio o del nuovo ordinamento. Per esempio, presento diversi esempi di interferenza quantistica discutendoli dal punto di vita fisico pur non avendo lo spazio per introdurre formalmente l’integrale sui cammini. Ci` o `e utile perch´e gli studenti non hanno lo stesso curriculum di Fisica classica e nemmeno gli stessi obiettivi di chi vuole fare il fisico puro. Ecco anzi uno degli scopi chiave che mi sono prefisso: motivare e stimolare costantemente l’interesse degli studenti. Gli studenti di Scienza dei Materiali sono particolarmente sensibili al valore pratico della conoscenza; quindi il docente ha buon gioco a mettere in risalto alcune delle numerose applicazioni gi` a in uso e quelle che stanno nascendo dai concetti quantistici, come ad esempio l’entanglement; si convinceranno che non stiamo facendo assolutamente alcuno sfoggio di formalismo fine a se stesso. Senza appesantire l’algebra, vengono presentati certi sviluppi recenti o futuribili delle ricerche in relativit`a e meccanica quantistica, come ad esempio la criptografia, il computer quantistico, il transistor a elettrone singolo e il microscopio a tunnel, che hanno importanza concettuale e grande interesse attuale e potenziale nelle applicazioni.
VIII
Prefazione
Anche se la trattazione `e meno formale rispetto ai tradizionali corsi di Istituzioni di Fisica Teorica, lo scopo `e comunque quello di raggiungere una reale comprensione dei concetti fisici ed una working knowledge, cio`e una capacit`a di risolvere autonomamente problemi. Per raggiungere lo scopo, pur con minore sforzo da parte degli studenti, occorrono degli accorgimenti che agevolano il lettore. Prima di tutto, i passaggi intermedi sono riportati in modo notevolmente pi` u esteso di quanto non si faccia normalmente nei libri; non ci sono sviluppi teorici lasciati come esercizio ma tutto quello che `e importante per la costruzione della teoria `e spiegato esplicitamente; gli esercizi sono tutti svolti in dettaglio; inoltre ho avuto cura di porre in primo piano il significato fisico delle varie quantit` a e la motivazione che sta dietro alle varie trasformazioni matematiche. Ho incluso una appendice con richiami di risultati del’analisi matematica che gli studenti hanno gi` a incontrato, ma probabilmente desiderano consultare per rinfrescare la memoria. Le appendici contengono anche alcuni dei calcoli pi` u lunghi, che potrebbero spezzare il filo logico dell’argomento; gli studenti per` o sono invitati a considerarle parte integrante del testo. Certi strumenti matematici necessari sono sviluppati ed illustrati con esempi di grande interesse per la Fisica. Ho incluso problemi didattici, la maggior parte per quanto ne so originali; sono problemi semplici, che servono a verificare la comprensione della teoria senza soverchi calcoli. Lo studio di questo manuale render` a pi` u accessibili ai nostri studenti interessati i molti ottimi testi pi` u avanzati che sono disponibili per approfondire questa affascinante materia. Per esempio, come ulteriore lettura per la parte quantistica, sar` a utile consultare anche il libro David J. Griffiths, Introduzione alla meccanica quantistica, Casa Editrice Ambrosiana (2005); questo libro contiene anche aspetti pi` u avanzati ed argomenti specifici che gli studenti incontreranno in corsi successivi. Ringrazio il collega Massimo Bianchi, che insegna meccanica quantistica nel Corso di laurea in Fisica, ed il Dr. Stefano Bellucci dei LNF-INFN per aver letto la bozza di questo manuale dandomi molti consigli preziosi.
Michele Cini
Roma Settembre 2005
Indice
1
Teorie fisiche, costanti empiriche e formulazioni matematiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
Parte I Complementi di Fisica Classica 2
Meccanica analitica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 La F = ma di Galileo e Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Formalismo lagrangiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Integrale di azione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Principio di Minima Azione . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Trasformazioni di Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Formulazione Hamiltoniana della meccanica . . . . . . . . . . . . . . . . . 2.4.1 Trasformazioni Canoniche . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2 Carica puntiforme in un campo elettromagnetico . . . . . 2.4.3 Parentesi di Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7 7 10 17 18 20 21 24 27 29
3
La delta di Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Definizione della δ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Ancora sulla δ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Volume dell’ipersfera in N dimensioni . . . . . . . . . . . . . .
33 33 36 38
4
Complementi di elettromagnetismo . . . . . . . . . . . . . . . . . . . . . . . 4.1 Campi e potenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Calcolo di ∇2 ( 1r ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Funzione di Green dell’equazione delle onde . . . . . . . . . . . . . . . . . 4.3.1 Potenziali ritardati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4 Potenziali di Lienard-Wiechert . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41 41 42 42 43 43
X
Indice
5
Meccanica statistica ed equilibrio termodinamico . . . . . . . . . . 5.1 Richiami di termodinamica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.1 Il corpo nero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Scopo della meccanica statistica . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Medie di Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Ensemble Microcanonico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.1 Entropia del Gas perfetto e paradosso di Gibbs . . . . . . . 5.5 Ensemble Canonico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5.1 Temperatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6 Distribuzione canonica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6.1 Distribuzione di Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . 5.6.2 Gas perfetto e statistica di Boltzmann . . . . . . . . . . . . . . . 5.6.3 Grandezze termodinamiche nell’insieme canonico . . . . . 5.6.4 Teorema di equipartizione dell’energia . . . . . . . . . . . . . . . 5.7 Insieme grancanonico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45 45 52 57 58 60 63 65 65 66 68 68 71 72 76
6
Teoria della Relativit` a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 6.1 Il navilio di Galileo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 6.2 Le equazioni di Maxwell e l’interferometro di Michelson . . . . . . 80 6.3 La teoria di Einstein: esperimenti pensati . . . . . . . . . . . . . . . . . . . 83 6.3.1 Trasformazione di Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . 90 6.3.2 Composizione delle velocit` a . . . . . . . . . . . . . . . . . . . . . . . . 92 6.3.3 Tensori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 6.3.4 Effetto Doppler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 6.3.5 Meccanica relativistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 6.4 Principio di equivalenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 6.5 Una scoperta recente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
Parte II Meccanica Quantistica 7
Meccanica quantistica: Perch´ e? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 7.1 Corpuscoli ed onde in Fisica classica . . . . . . . . . . . . . . . . . . . . . . . 106 7.2 Dualismo onda-corpuscolo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 7.3 Da dove passa la particella? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 7.3.1 Onda piana e principio di sovrapposizione . . . . . . . . . . . 112 7.3.2 Principio di indeterminazione . . . . . . . . . . . . . . . . . . . . . . 113 7.4 Operatori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 7.5 Interpretazione di Copenhagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
8
Equazione di Schr¨ odinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 8.1 Equazione per gli stati stazionari . . . . . . . . . . . . . . . . . . . . . . . . . . 120 8.2 Equazione di continuit` a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 8.3 Cenno alle formulazioni di Schr¨ odinger, Heisenberg e Feynman 122
Indice
9
XI
Soluzioni in una dimensione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 9.1 Buca di potenziale a pareti infinite . . . . . . . . . . . . . . . . . . . . . . . . . 125 9.2 Particella libera e stati del continuo . . . . . . . . . . . . . . . . . . . . . . . . 126 9.2.1 La normalizzazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 9.2.2 Velocit` a di fase di un pacchetto d’onde . . . . . . . . . . . . . . 127 9.2.3 Velocit` a di gruppo di un pacchetto d’onde . . . . . . . . . . . 128 9.3 Gradino di potenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 9.3.1 Energia sotto soglia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 9.3.2 Energia sopra soglia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 9.3.3 Buca di potenziale finita . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 9.3.4 Stati del continuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 9.4 Potenziale stretto e profondo a δ . . . . . . . . . . . . . . . . . . . . . . . . . . 134 9.5 Barriera di potenziale: effetto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 9.5.1 Energia sotto soglia: superamento della barriera . . . . . . 134 9.5.2 Effetto tunnel: fenomeni ed applicazioni . . . . . . . . . . . . . 136 9.6 Oscillatore Armonico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 9.7 Metodo operatoriale per l’oscillatore armonico . . . . . . . . . . . . . . . 143
10 Sui quattro postulati della meccanica quantistica . . . . . . . . . . 147 10.1 Postulato 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 10.1.1 Funzione d’onda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 10.1.2 Disuguaglianza di Schwarz . . . . . . . . . . . . . . . . . . . . . . . . . 148 10.1.3 Spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 10.2 Postulato 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 10.2.1 Matrici, operatori e spazi di funzioni . . . . . . . . . . . . . . . . 149 10.2.2 Operatori Hermitiani e valori medi reali . . . . . . . . . . . . . 149 10.2.3 Spazi ortogonali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 10.2.4 Completezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 10.2.5 Commutatori: angolo e momento angolare . . . . . . . . . . . 151 10.2.6 Commutatori: principio di indeterminazione generalizzato . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 10.2.7 Commutatori: grandezze compatibili . . . . . . . . . . . . . . . . 155 10.2.8 Commutatori: trasformazioni canoniche in meccanica quantistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 10.2.9 Commutatori. 5-Espedienti di calcolo . . . . . . . . . . . . . . . 156 10.2.10 Matrici per l’oscillatore armonico . . . . . . . . . . . . . . . . . . . 157 10.2.11 Matrici e modellazioni. LCAO . . . . . . . . . . . . . . . . . . . . . . 158 10.3 Postulato 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 10.3.1 Ragioni per cui il set deve essere completo . . . . . . . . . . . 158 10.3.2 Formalismo discreto e formalismo continuo . . . . . . . . . . . 159 10.3.3 Esempio: il momento angolare . . . . . . . . . . . . . . . . . . . . . . 159 10.4 Postulato 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 10.4.1 Dipendenza dal tempo e derivata di un operatore . . . . . 160 10.4.2 Principio di indeterminazione energia-tempo . . . . . . . . . 160
XII
Indice
11 Problemi a tre dimensioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 11.1 Separazione delle variabili in coordinate cartesiane . . . . . . . . . . . 163 11.2 Separazione delle variabili in coordinate sferiche . . . . . . . . . . . . . 165 11.3 Momento angolare in 3 dimensioni . . . . . . . . . . . . . . . . . . . . . . . . . 166 11.3.1 Algebra del momento angolare . . . . . . . . . . . . . . . . . . . . . 166 11.3.2 Matrici del momento angolare . . . . . . . . . . . . . . . . . . . . . . 167 11.3.3 Momento angolare in coordinate sferiche . . . . . . . . . . . . . 168 11.3.4 Armoniche Sferiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 11.4 Campo centrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 11.5 Stati legati dell’atomo Idrogenoide . . . . . . . . . . . . . . . . . . . . . . . . . 172 11.5.1 Effetto Zeeman normale . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 11.6 Generatori di Traslazioni e Rotazioni e operatori unitari . . . . . . 179 12 Spin e campo magnetico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 12.1 Momenti magnetico e angolare in Fisica classica . . . . . . . . . . . . . 181 12.2 Esperimento di Stern-Gerlach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 12.3 Matrici del momento angolare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 12.3.1 Ogni direzione va bene . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 12.3.2 Rotazioni di spin e momento angolare . . . . . . . . . . . . . . . 188 12.3.3 Momento magnetico di spin ed equazione di Pauli . . . . 189 12.4 Somma di momenti angolari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192 12.5 Applicazione alla criptografia quantistica . . . . . . . . . . . . . . . . . . . 197 12.6 Fase di Pancharatnam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 13 Sistemi di particelle: entanglement . . . . . . . . . . . . . . . . . . . . . . . . . 201 13.1 Sistemi di due particelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 13.1.1 Atomo di H e Massa Ridotta . . . . . . . . . . . . . . . . . . . . . . . 202 13.2 Particelle ingarbugliate e pararadosso EPR . . . . . . . . . . . . . . . . . 203 13.3 Bosoni e Fermioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 13.3.1 Principio di Pauli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 13.4 Statistiche Quantistiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 13.4.1 Statistica di Boltzmann con degenerazione . . . . . . . . . . . 210 13.5 Statistica di Bose-Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 13.5.1 Corpo nero e fotoni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 13.5.2 Funzione di partizione canonica . . . . . . . . . . . . . . . . . . . . 213 13.5.3 Applicazioni a He liquido e Calori specifici dei solidi . . 214 13.6 Statistica di Fermi-Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 13.6.1 Gas di Fermi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 13.7 Cenno al calcolatore quantistico . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 14 Teoria delle perturbazioni indipendenti dal tempo . . . . . . . . . 221 14.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 14.1.1 Spettro discreto non degenere . . . . . . . . . . . . . . . . . . . . . . 222 14.1.2 Caso degenere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 14.2 Perturbazioni dipendenti dal tempo . . . . . . . . . . . . . . . . . . . . . . . . 228
Indice
XIII
15 Metodo variazionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 15.1 Il principio variazionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 15.2 Approssimazioni variazionali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
Parte III Appendici 16 Richiamo di risultati utili di Analisi Matematica . . . . . . . . . . . 241 16.1 Numeri complessi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241 16.2 Derivazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241 16.2.1 Moltiplicatori di Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . 242 16.2.2 Laplaciano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 16.3 Integrazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 16.3.1 Integrazione per parti . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 16.3.2 Derivata sotto il segno di integrale . . . . . . . . . . . . . . . . . . 243 16.3.3 Formula di Stirling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 16.3.4 Trasformate di Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244 16.4 Equazioni differenziali ordinarie lineari . . . . . . . . . . . . . . . . . . . . 244 16.4.1 Equazioni differenziali ordinarie lineari omogenee . . . . . 244 16.4.2 Equazioni differenziali ordinarie lineari non omogenee . 245 17 Funzione di Green dell’equazione delle onde . . . . . . . . . . . . . . . 247 18 Una verifica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 19 Trasformazioni a coordinate sferiche . . . . . . . . . . . . . . . . . . . . . . . 251 20 Sistema internazionale e sistema di Gauss . . . . . . . . . . . . . . . . . 255 Indice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
1 Teorie fisiche, costanti empiriche e formulazioni matematiche
Salv. ` vero che’l sistema Copernicano mette perturbazione nell’universo d’AristoE tile: ma noi trattiamo dell’universo nostro, vero e reale. Quando poi la disparit` a d’essenza tra la Terra e i corpi celesti la vuol quest’autore inferire dall’incorruttibilit` a di quelli e corruttibilit` a di questa,in via d’Aristotile, dalla qual disparit` a concluda il moto dover esser del sole e delle fisse e l’immobilit` a della Terra, va vagando nel paralogismo, supponendo quel che `e in quistione: perch´e Aristotile inferisce l’incorruttibilit` a dei corpi celesti dal moto, del quale si disputa se sia loro o della Terra. Della vanit` a poi di queste retoriche illazioni, se n’`e parlato a bastanza. Da G. Galilei, Dialogo sopra i due massimi sistemi tolemaico e copernicano.
Seguendo il metodo di Galileo, la Fisica Teorica usa la Matematica come linguaggio naturale ed indispensabile per descrivere la realt` a. Sovente i fisici hanno sviluppato in proprio i metodi matematici necessari. Come la Matematica, la Fisica ha una profondit` a di pensiero che `e sconosciuta a filosofi e retori; qui non si tratta di giochi di parole, ma di fatti verificabili, che nessuno pu` o aggiustare a piacimento. Per` o la Fisica Teorica non `e Matematica: ha un suo autonomo metodo di indagine ed `e ad un tempo sottile e concreta. Ci` o che distingue la Fisica `e il fatto che l’esperimento non solo ha sempre l’ultima parola sulle questioni controverse, ma d`a senso a tutto quello che la teoria dice. Anche gli aspetti della teoria che sembrano pi` u astratti hanno un pieno significato operativo ed alla fine comportano delle conseguenze che ognuno pu`o toccare con mano. Cominciamo questo corso con alcune costanti, perch´e la Fisica `e una Scien-
2
1 Teorie fisiche, costanti empiriche e formulazioni matematiche
za quantitativa.1 La tabella ci servir` a per consultazione, ma anche da ulteriore monito per distinguere bene la Fisica Teorica dalla Matematica. Nelle nostre teorie, questi valori entrano come costanti empiriche, e nessuno ancora capisce perch´e abbiano questi valori; tuttavia, cambiandoli, otterremmo mondi del tutto diversi da quello in cui viviamo. Nome
Simbolo
numero di Avogadro NA costante gravitazionale G costante di Boltzmann KB costante Stefan-Boltzmann σ velocit` a della luce c e2 raggio classico dell’ elettrone re = 2mc 2 massa elettrone me massa protone mp massa neutrone mn massa Terra MT costante di Planck h costante di struttura fine costante di struttura fine quanto di flusso elettronvolt momento magnetico protone
e2 h ¯c 2 = 2e0 hc hc e
α= α
eV µp
` UNITA
Valore 23
mol−1 N m2 /Kg 2 J/0 K W/m2 ×0 K 4 m/s m Kg Kg Kg Kg Js
6,022169 10 6,6732 10−11 1,380622 10−23 5,66961 10−8 2,99792458 108 2,819489 10−15 9,109558 10−31 1,672614 10−27 1,674920 10−27 5.976 1024 6,626196 10−34 1 137,03602 1 137,03602 −7
numero puro, sistema Gauss numero puro, sistema SI
4 × 10 1,6 10−19 1,4106203 10−26
Gausscm2 J J/T
Tabella 1.1. Alcune costanti della Fisica
La prima costante scoperta (da Newton) e misurata (da Cavendish, nel ’700) `e stata G; poi l’introduzione della velocit`a della luce c durante lo sviluppo dell’elettromagnetismo (equazioni di Maxwell) ha portato dopo un lungo travaglio alla relativit` a; l’introduzione della costante di Boltzmann ha dato l’avvio alla Meccanica Statistica, ed alla comprensione microscopica delle leggi termodinamiche; l’introduzione della costante di Planck ha condotto in 25 anni alla Meccanica Quantistica. L’introduzione di queste grandezze ha segnato le grandi conquiste concettuali che talora vengono chiamate rivoluzioni scientifiche da chi vuol drammatizzare ed anche da chi pretende che la Scienza si contraddica come fanno altri che dibattono di fatti opinabili. Ma la teoria di Einstein non ha affatto confutato Galileo, e la Meccanica Quantistica non ha 1
Qui ed altrove uso sia le unit` a SI (Sistema Internazionale) che quelle di Gauss; il motivo `e che bisogna prendere atto che il pur nobile tentativo di convincere tutti ad usare il Sistema Internazionale `e fallito, e la gente usa questi (ed altri) sistemi in modo intercambiabile; gli studenti non vanno lontano se non imparano ad usarli entrambi ed a fare le conversioni necessarie. L’ultima Appendice contiene le regole principali per farlo.
1 Teorie fisiche, costanti empiriche e formulazioni matematiche
3
confutato la Fisica Classica. La Meccanica di Galileo resta in uso tanto nella vita quotidiana che per descrivere i moti di pianeti e stelle, ed `e corretta; ci`o che `e sbagliata `e una sua arbitraria estrapolazione a fenomeni che avvengono in un ambito diversissimo da quello in cui `e stata formulata: i fenomeni di altissima energia, in cui entra la velocit` a della luce c. Altrettanto, la Fisica Classica funziona per moltissime cose, ma non pu`o essere estrapolata a fenomeni in cui entra la costante di Planck. Quindi alcune delle costanti della tabella segnano i criteri di applicabilit` a delle teorie speciali rispetto a quelle ` notevole il fatto che le teorie pi` pi` u generali che le contengono. E u estese non sono delle semplici modificazioni di quelle di cui sono la generalizzazione, ma richiedono un loro formalismo matematico ed un ambito concettuale anch’esso generalizzato. Le teorie speciali restano valide come caso limite di quelle generali, e mantengono un loro ambito di validit` a. La conoscenza del mondo fisico `e fatta di strati successivi, o, se preferiamo, di successive generalizzazioni.2 Come vedremo, nelle innovazioni c’`e sempre una parte profonda della teoria che prosegue senza discontinuit`a. Alcune altre grandezze notevoli, come ad esempio il quanto di flusso magnetico, sono combinazioni delle costanti fondamentali. Certe altre grandezze, come la massa della Terra, non hanno nessun significato fondamentale ma sono importati per altre ovvie ragioni. Paradossalmente, la scienza ha ancora oggi detrattori ed avversari molto attivi. Rimane per` o la massima opera dell’intelligenza umana; l’intelligenza d’altra parte `e di gran lunga la risorsa pi` u preziosa della nostra specie. Gli studenti troveranno alcune notizie storiche di una successione di persone geniali che hanno cambiato la fisica; la fisica poi ha cambiato la nostra visione del mondo ed il mondo stesso in meglio, risolvendo anche un gran numero di problemi concreti ed importanti. Il tutto `e stato fatto essenzialmente col pensiero. Le intuizioni dei grandi sono sconosciute al grosso pubblico, ma danno vera gioia a chi le capisce.
2
Purtroppo in questo piccolo libro che comincia con F = ma non c’`e spazio per gli strati pi` u recenti e complicati (a cominciare dalla meccanica quantistica relativistica e dalla teoria dei campi con le sue innumerevoli applicazioni ai vari domini della fisica dalla teoria dei nuclei e dei solidi alle particelle elementari). Per`o la strada `e quella.
Parte I
Complementi di Fisica Classica
2 Meccanica analitica
Nella formulazione matematica teoria classica troveremo concetti chiave che sono necessari per le sue generalizzazioni (relativit` a, meccanica quantistica, etc.). La Fisica Teorica `e una disciplina vastissima ma profondamente unitaria, e indubbiamente comincia da qui.
2.1 La F = ma di Galileo e Newton Rivoluzionando le dottrine degli antichi, Galileo1 stabil`ı verso l’anno 1600 la legge fondamentale → − − m→ a = F, − che determina l’accelerazione → a di un punto materiale di massa m soggetto → − 2 o nella nota equazione differenziale, ad una forza F . Newton poi la formalizz` l’equazione del moto. In una dimensione, l’equazione di Newton `e 1
2
Galileo Galilei (Pisa 1564- Arcetri 1642) fu il padre della Scienza moderna; professore di Matematica a Pisa dal 1589, si trasfer`ı a Padova e di nuovo a Pisa nel 1611. Costruito il primo telescopio, fu anche il padre dell’Astronomia moderna e scrisse il Sidereus Nuncius nel 1610. L’osservazione dei Pianeti Medicei e delle macchie solari lo mise in odore di eresia. Fond` o la meccanica nei Discorsi e dimostrazioni matematiche intorno a due nuove scienze, attinenti alla meccanica ed ai meccanismi locali, Leiden (1636). La pubblicazione all’estero fu dovuta alle persecuzioni che pat`ı in patria da parte della Chiesa; non fin`ı sul rogo, ma agli arresti di Arcetri perch´e fu prudente, accett` o di abiurare, ed ebbe buone conoscenze nella gerarchia cattolica, in primis Papa Urbano VIII Barberini. Isaac Newton (Woolsthorpe 1642-London 1727) fu professore a Cambridge dal 1669 quando aveva gi` a inventato il calcolo, anche se il suo De Methodis Serierum et Fluxionum `e del 1671. L’opera fondamentale per la meccanica `e Philosophiae naturalis principia mathematica, Iussu societatis regiae, London (1687). Successivamente scopr`ı la Legge di Gravitazione Universale, fece ricerche in ottica, e
8
2 Meccanica analitica
m
d2 x(t) = Fx dt2
(2.1)
˙ ovvero m¨ x = Fx . In termini dell’impulso px = mx, p˙x = Fx .
(2.2)
Se F `e nota, l’equazione determina la legge oraria x(t) in termini delle condizioni iniziali x(0), x(0). ˙ A quel punto il moto `e esattamente noto in eterno. Le leggi fondamentali della meccanica classica sono queste; il lettore a questo punto pu`o sospettare che il resto del Capitolo sia una serie di esempi di soluzione; invece c’`e una teoria da costruire. Considerevole importanza ha il caso delle forze conservative, che derivano da un potenziale V (x): con ci` o si intende che (sempre in 1 dimensione) Fx = −
dV (x) . dx
(2.3)
Ad esempio, V potrebbe essere il potenziale gravitazionale di Newton, quello elettrostatico, quello di una forza elastica. Lungo una traiettoria x(t), il potenziale diventa una funzione del tempo V (x(t)), con derivata V˙ = dV ˙ dx x. dE Allora, moltiplicando (2.1) per x, ˙ troviamo xm¨ ˙ x − xF ˙ x = dt , la legge di conservazione dell’energia E, che stabilisce che nel corso del tempo E =T +V
(2.4)
rimane costante; in effetti V (x) varia continuamente, lungo la traiettoria, ma ci` o viene compensato dalla variazione dell’energia cinetica T =
m 2 x˙ . 2
L’equazione (2.4) fornisce l’integrale primo del moto E=
m 2 x˙ + V (x); 2
infatti contiene la derivata prima x˙ e la costante E, ed `e molto pi` u trattabile della (2.1). Per un punto materiale in 3 dimensioni, ci sono 3 equazioni per le 3 com→ − − → − − ponenti, F (→ r ) = − ∇V (→ r ), e l’equazione di Newton `e una uguaglianza fra vettori. Per un sistema di N punti materiali ci saranno 3N equazioni da risolvere; queste sono accoppiate per particelle in interazione. Inoltre le equazioni si modificano in modo ovvio, ad esempio l’energia cinetica diventa una somma T =
N 3 mi i
α
2
x˙ 2i,α
invent` o il calcolo delle variazioni. A differenza di Galileo non fu perseguitato, ma altamente onorato nel suo Paese, ricevendo prestigiosi incarichi dal governo.
2.1 La F = ma di Galileo e Newton
9
− con i che corre sulle particelle e α sulle componenti di → r i. Per` o per specificare la posizione di un punto materiale possiamo usare ad esempio 3 lunghezze, 2 lunghezze e un angolo o una lunghezza e 2 angoli; allora le equazioni da scrivere saranno differenti. Pi` u in generale, c’`e una equazione per ogni grado di libert` a: si chiamano cos`ı tutte le grandezze che sono necessarie per specificare lo stato istantaneo di un sistema. Poich´e c’`e molto di arbitrario nella scelta del sistema di riferimento ed del tipo di coordinate (cartesiane, sferiche, etc.) esiste una notevole libert` a nell’impostazione del problema. Questa libert`a di scelta ha radici profonde nella struttura matematica della teoria, che la meccanica analitica rivela ed utilizza in modo mirabile, generando potenti metodi di soluzione, come vedremo. Oltre all’energia E, altri integrali del moto possono venire dalla conservazione del momento, e del momento angolare. Possiamo immaginare un sistema con 70 gradi di libert` a, che ha 70 integrali del moto. Un tale sistema `e integrabile, e la soluzione `e ridotta alle quadrature. Per` o ci sono anche sistemi di 70 gradi di libert` a che conservano solo E; quelli semplici sono solo casi limite. Quindi in generale la soluzione non `e facile; i metodi della meccanica analitica sono stati inventati come ausili matematici per scrivere le equazioni in forma tale che fosse poi possibile risolverle. La meccanica analitica consente di applicare con efficacia ed eleganza le leggi di Galileo e Newton a una variet` a di problemi; soprattutto, rivela una struttura matematica sottostante alle equazioni del moto che risulta molto pi` u generale della stessa meccanica classica. Cos`ı la meccanica analitica, a sorpresa, da scienza ausiliaria si `e trasformata in Scienza Fondamentale. La teoria della Relativit`a e la meccanica quantistica sono generalizzazioni della meccanica classica fondate sulla meccanica analitica. I problemi dove compaiono vincoli hanno una difficolt`a extra: le forze non sono tutte note a priori. Per N = 1 punto materiale, ci vogliono 3 equazioni del moto. Ma se il punto compie con velocit`a v un’orbita circolare di raggio R noto, basta un angolo per stabilire dov’`e; le coordinate cartesiane sono inadatte per tale problema, che quindi va riformulato in termini dell’angolo. 2 L’accelerazione centripeta vR `e nota dai corsi elementari perch´e questo `e un caso estremamente semplice. Se un punto `e appeso ad un filo (pendolo sferico) bastano 2 angoli per localizzarlo, e per un pendolo piano basta un angolo solo; in compenso, il problema non assegna la tensione del filo, e quindi parte delle forze `e incognita. Per N = 2 punti indipendenti ci vogliono 6 equazioni del moto. Supponiamo ora di avere un sistema di due masse m1 , m2 vincolate a rimanere a distanza r0 agli estremi di un bastone rigido, ma di massa trascurabile, incernierato all’origine delle coordinate nel baricentro. Un siffatto sistema si chiama rotatore rigido in 3 dimensioni. Si ricorder` a che il baricentro di due masse `e il punto − − r 1 + m2 → r2 → − m1 → . R m1 + m 2
10
2 Meccanica analitica
→ − → − − − 1→ In questo problema, R = 0 e quindi → r 1 = −m m2 r 2 . Indicando con r1 , r2 le 1 distanze immutabili delle due masse dall’origine, r1 = m m2 r2 . Inoltre r1 + r2 = m1 r 0 2 r0 r0 , e risulta che r1 = mm1 +m , r = . 2 m1 +m2 2 Come si trovano le equazioni del moto del rotatore rigido? Il sistema ha due gradi di libert` a, e possiamo scegliere gli angoli θ e φ che individuano la massa 1 in coordinate polari. Quindi non occorrono 6 equazioni, ne bastano 2. D’altra parte, per scrivere le 6 equazioni ci vorrebbero le forze agenti sulle due particelle, ma queste sono reazioni vincolari, non note a priori. Prendiamo quindi θ e φ come nuove coordinate ed impariamo a scrivere le equazioni del moto in questi termini. Il metodo generale per scrivere le equazioni del moto `e dovuto a Giuseppe Luigi Lagrange (Torino 1736 - Parigi 1813), grande matematico italo-francese, e (indipendentemente) al grande Euler.3 Ora affronteremo la teoria di EulerLagrange, supponendo che i vincoli siano lisci, cio`e che non facciano lavoro durante il moto.
2.2 Formalismo lagrangiano Vincoli e coordinate lagrangiane N punti materiali in 3 dimensioni sono descritti dalle coordinate cartesiane {x1 , y1 , z1 , x2 . . . zN } ≡ {xiα }, 0 < i ≤ N, 1 ≤ α ≤ 3. Consideriamo il caso importante in cui ci sono dei vincoli, come per esempio quelli che obbligano i punti a muoversi su certe superfici, o a mantenere fisse certe distanze; esempi ovvi sono il piano inclinato ed il pendolo. La forza sulla particella i si pu` o scomporre: → − → − appl → − vinc Fi = Fi + Fi , dove il primo termine applicato `e noto (possiamo pensare a molle, forze gravitazionali, campi elettrici, etc. assegnati dal problema), la reazione vincolare a priori no. Supponiamo che le forze applicate siano conservative, cio`e che derivino da una energia potenziale V {x1 , y1 , z1 , x2 . . . zN } secondo la legge appl Fi,α =−
∂V . ∂xi,α
(2.5)
Il segno − dice che la forza tende a far diminuire l’energia potenziale. Quanto ai vincoli, supponiamo che siano lisci. Questo significa che dato uno → − spostamento infinitesimo della particella i-esima δ R i permesso dai vincoli 3
Leonhard Euler (Basel ( Svizzera) 1707- S.Pietroburgo (Russia) 1783) fu probabilmente il pi` u grande matematico della storia contribuendo a tutti i campi dall’analisi alla geometria. Fra l’altro scrisse il libro Mechanica in cui sono illustrati i suoi risultati sull’argomento qui esposto.
2.2 Formalismo lagrangiano
11
− → − vinc → · δ R i = 0, Fi cio`e la reazione vincolare `e sempre perpendicolare allo spostamento della particella i e non fa mai lavoro. Il lavoro infinitesimo δL compiuto dalle forze applicate `e dato da → → → − − − − appl → F i · δ Ri ≡ F i · δ R i,
−δV = δL =
i
(2.6)
i
dove la somma `e sui punti materiali; cos`ı appl Fi,α δxi,α . −δV
(2.7)
i,α
Ma in generale lo spostamento cartesiano {δx1 , δy1 , δz1 , δx2 . . .} ≡ {δxiα } non `e permesso dai vincoli e quindi le coordinate cartesiane non sono le pi` u adatte → − a esprimere lo spostamento infinitesimo δ R i . Conviene passare a coordinate lagrangiane qβ , 1 ≤ β ≤ s adatte ai vincoli, tali cio`e che ogni δqβ sia consentito. Cos`ı potremo ridurci a s < 3N gradi di libert` a indipendenti. Uno spostamento consentito dai vincoli ha componenti cartesiane date da: δxi,α
∂xi,α β
∂qβ
δqβ .
(2.8)
Dalla (2.7) dividendo per δqβ otteniamo: −
∂V appl ∂xi,α Fi,α . ∂qβ ∂qβ
(2.9)
i,α
Per ottenere il lavoro infinitesimo basta esprimere V nelle nuove variabili e differenziare: δV
∂V δqβ . ∂qβ
(2.10)
β
In analogia con la (2.5) Qβ = −
∂V ∂qβ
(2.11)
si chiama forza generalizzata. Possiamo esprimere la forza generalizzata Q in termini della forza applicata F appl usando la (2.9): Qβ
i,α
appl Fi,α
∂xi,α . ∂qβ
(2.12)
12
2 Meccanica analitica
Equazioni di Eulero-Lagrange Vogliamo ora riscrivere le equazioni del moto in termini di coordinate lagrangiane, in modo da avere solo s gradi di libert` a e tener conto automaticamente dei vincoli. Le q come variabili indipendenti Moltiplicando scalarmente
− d→ pi → − (2.13) Fi = dt → − per uno spostamento infinitesimo δ R compatibile coi vincoli, troviamo: −δV =
− → pi → − → − d→ − · δ R i =⇒ −δV = p˙ i,α δxi,α . F i · δ Ri dt i i i,α
(2.14)
Il primo membro `e dato dalla (2.10); cambiamo le variabili anche nel secondo termine, usando la (2.8). Viene
p˙ i,α δxiα =
i,α
∂xiα
p˙ i,α
i,α
β
∂qβ
δqβ =
mi x¨i,α
i,α
∂xiα β
∂qβ
δqβ ;
scambiando le somme in modo da mettere in evidenza δqβ troviamo −δV =
β
δqβ
mi x ¨i,α
i,α
∂xiα , ∂qβ
da cui −
∂xiα ∂V = mi x ¨i,α . ∂qβ ∂qβ i,α
Ora, le derivate sono rispetto alle variabili lagrangiane, ed il primo membro `e una forza generalizzata. A secondo membro riusciremo a fare la somma sulle componenti cartesiane delle particelle facendo comparire l’energia cinetica. Il termine cinetico x ¨i,α
∂xiα d ∂xi,α ∂xiα d = (x˙ i,α ) − x˙ i,α , ∂qβ dt ∂qβ dt ∂qβ
ovvero, scambiando le derivate nell’ultimo termine, x ¨i,α Cos`ı,
∂xiα d ∂xiα ∂ x˙ i,α (x˙ i,α ) − x˙ i,α . ∂qβ dt ∂qβ ∂qβ
2.2 Formalismo lagrangiano
i,α
mi [
13
∂xia ∂ d ∂V (xiα ˙ ) − x˙ iα x˙ iα ] = − . dt ∂qβ ∂qβ ∂qβ
Il secondo termine a primo membro `e −
mi x˙ iα
i,α
∂ ∂T x˙ iα = − , ∂qβ ∂qβ
dove T `e l’energia cinetica, e l’equazione del moto si riduce a ∂xia ∂ d mi (xiα ˙ )=− (T − V ). dt i,α ∂qβ ∂qβ
(2.15)
Il termine in derivata temporale d ia ˙ ∂x Per mettere in forma adatta il primo termine dt i,α mi (xiα ∂qβ ), non basta essere abili nei passaggi, ma ci vuole una trovata veramente teorica. La derivata temporale `e presa lungo la traiettoria, quindi, dividendo i due membri della (2.8) per dt, x˙ iα =
∂xiα β
∂qβ
q˙β ;
ebbene, derivando x˙ iα rispetto alla variabile q˙β si trova che ∂ x˙ iα ∂xiα = . ∂ q˙β ∂qβ Questo permette di far comparire ancora T , perch´e il primo termine a sinistra della (2.15) diventa d ∂ x˙ia d ∂T mi (x˙iα )= . dt i,α ∂ q˙β dt ∂ q˙β
(2.16)
Bisogna notare che anche le velocit` a sono trattate come variabili indipendenti. dq Questo `e un punto non banale: q˙β = dtβ `e noto se conosciamo qβ ad ogni t, ma va ugualmente trattata come una variabile indipendente da cui dipende T. Sostituendo in (2.15), si ottiene ora ∂T ∂V d ∂T = − . dt ∂ q˙β ∂qβ ∂qβ Allora definendo la lagrangiana L(q, q, ˙ t) = T − V,
14
2 Meccanica analitica
dove abbiamo scritto q per denotare l’insieme delle coordinate, etc.; le equazioni del moto lagrangiane, valide in ogni sistema di coordinate, sono d ∂L ∂L = . dt ∂ q˙β ∂qβ
(2.17)
I momenti generalizzati di un sistema sono definiti da pi =
∂L ∂ q˙i
(2.18)
e sono funzioni delle stesse variabili indipendenti da cui dipende L, quindi pi = pi (q, q, ˙ t),
(2.19)
dove al solito scrivo q, q˙ per indicare la collezione di tutte le coordinate e velocit`a. Se per una coordinata q si verifica ∂L ∂q = 0, la variabile q si dice ciclica e la (2.17) assicura che il momento coniugato si conserva. Se un angolo `e ciclico, si conserva una componente del momento angolare; se x `e ciclico si conserva px e cos`ı via. Se L non dipende esplicitamente dal tempo, `e l’energia che si conserva. Infatti, ∂L dL ∂L = q˙α + q¨α dt ∂qα ∂ q˙α α α e viene dL d ∂L ∂L d ∂L = q˙α + q¨α = q˙α , dt dt ∂ q˙β ∂ q˙α dt α ∂ q˙α α α da cui segue la conservazione di ∂L q˙α − L = pα q˙α − L = E. ∂ q˙α α α
(2.20)
Abbiamo una grande libert` a di scelta delle coordinate lagrangiane q, e comunque le scegliamo abbiamo la certezza che le equazioni del moto sono corrette. In altri termini, la teoria `e invariante per trasformazioni puntuali a nuove coordinate Q = Q(q, t). Se uno ha una L(q, q, ˙ t) e vuole passare ad una ˙ t), tutto quello che occorre `e esprimere le vecchie variabili in termini L(Q, Q, delle nuove, cio`e, fare un cambiamento di variabili. Problema 1. Trovare la lagrangiana e le equazioni del moto per un oscillatore armonico unidimensionale di massa m e costante k, cio`e, F = −kx.
2.2 Formalismo lagrangiano
15
Soluzione 1.
1 1 mx˙ 2 − kx2 . 2 2 Problema 2. Un pendolo piano ha massa m e lunghezza l; l’accelerazione di gravit` a parallela all’asse verticale z `e g. Scrivere la lagrangiana e l’equazione del moto. L=
˙ l’energia cinetica `e T = 1 ml2 φ˙ 2 . Il lettoSoluzione 2. La velocit` a `e l φ, 2 re pu` o esercitarsi a passare dalla forma cartesiana a questa. Poich´e V = = ml2 φ˙ , mgz = −mgl cos(φ), viene L = 12 ml2 φ˙ 2 + mgl cos(φ). Quindi ∂L ∂ φ˙ ∂L = −mgl sin(φ) e l’equazione del moto `e l φ¨ = −g sin(φ). ∂φ
Problema 3. Un pendolo piano di massa m2 e lunghezza l ha nel punto di sospensione una massa m1 , che pu` o muoversi sull’asse orizzontale x. L’accelerazione di gravit`a parallela all’asse verticale z `e g. Scrivere la lagrangiana. Soluzione 3. Poich´e x2 = x + l sin(φ), z2 = −l cos(φ) e quindi x˙ 2 = x˙ + ˙ z˙2 = l sin(φ)φ, ˙ sostituendo nell’energia cinetica T = 1 [m1 x˙ 2 + l cos(φ)φ, 2 2 2 m2 (x˙ 2 + z˙2 )] si trova T = 12 (m1 + m2 )x˙ 2 + m22 (l2 φ˙ 2 + 2lx˙ φ˙ cos(φ)) e quindi 1 m2 2 ˙ 2 (m1 + m2 )x˙ 2 + (l φ + 2lx˙ φ˙ cos(φ)) + m2 gl cos(φ). 2 2 Da qui si ottengono immediatamente le equazioni del moto. L=
z m1
x
φ m2 Fig. 2.1. Pendolo sospeso ad una massa mobile
Problema 4. Oscillatore in caduta libera. In un ascensore in caduta libera (l’accelerazione di gravit`a `e g) c’`e un sistema di coordinate cartesiano (x,y,z) ed un oscillatore armonico unidimensionale di massa m e costante k, cio`e, F = −kz. L’oscillatore parte da z = 0 per t = 0. In quell’istante il sistema cartesiano coincide con uno stazionario (XY Z) ed ha velocit` a nulla. Scrivere lagrangiana, equazione del moto e suo integrale generale nel sistema di riferimento stazionario.
16
2 Meccanica analitica
Soluzione 4. La lagrangiana nel sistema dell’ascensore la conosciamo ed `e L = 21 mz˙ 2 − 12 kz 2 La coordinata verticale dell’origine del sistema in caduta `e − 21 gt2 e quella dell’oscillatore nel sistema stazionario `e Z = z − 12 gt2 . Facendo il cambiamento di coordinate, 1 1 1 1 1 mz˙ 2 − kz 2 = m(Z˙ + gt)2 − k(Z + gt2 )2 , 2 2 2 2 2 l’equazione del moto viene L=
1 m(Z¨ + g) = −k(Z + gt2 ). 2 La soluzione generale `e Z(t)A sin(ωt + ϕ) − 12 gt2 , come `e facile verificare. Problema 5. Il rotatore rigido. Tornando all’esempio del rotatore, ricavare le equazioni del moto. Soluzione 5. la trasformazione di coordinate `e x1 = r1 sin θ cos φ, y1 = r1 sin θ sin φ, z1 = r1 cos θ, m1 x1 e cos`ı via. La lagrangiana coincide con l’energia con x2 = − rr12 x1 = − m 2 cinetica (in notazione ovvia)
T =
1 − − (m1 → v 21 + m2 → v 22 ). 2
Calcoliamo quindi ˙ x˙ 1 = r1 (cos θ cos φθ˙ − sin θ sin φ φ), ˙ ˙ y˙ 1 = r1 (cos θ sin φθ + sin θ cos φφ), ˙ z˙1 = −r1 sin θ θ, − − e troviamo → v 21 = x˙ 21 + y˙ 12 + z˙12 r12 (θ˙2 + sin2 θφ˙ 2 ), → v 22 r22 (θ˙2 + sin2 θφ˙ 2 ). Quindi, T =
1 ˙2 I(θ + sin2 θφ˙ 2 ), 2
dove I = m1 r12 + m2 r22 , prende il nome di momento di inerzia del rotatore. Posto pθ = pφ =
∂L ∂ θ˙ ∂L ∂ φ˙
˙ = I θ, ˙ = I sin2 θφ,
le equazioni del moto sono p˙ θ = Isinθ cos θ φ˙ 2 , p˙ φ = 0.
2.2 Formalismo lagrangiano
17
Problema 6. Un punto materiale di massa m `e vincolato a muoversi lungo x la curva y(x) = L sin( L ) sul piano xy, in assenza di attriti e di gravit` a. Si scrivano lagrangiana L(x, x) ˙ e momento cinetico px . x x Soluzione 6. y˙ = cos( L )x, ˙ quindi posto c ≡ cos( L ),
1 mx˙ 2 1 + c2 = L 2 da cui il momento cinetico px = ∂L mx˙ 1 + c2 . Poich´e la curva `e ∂ x˙ = sinusoidale, la massa cambia di 1 + c(x)2 . T =
2.2.1 Integrale di azione Prendiamo un sistema meccanico che nell’intervallo di tempo (t1 , t2 ) va4 da q(t1 ) a q(t2 ). Nella maggior parte dei problemi la conoscenza delle due istantanee q(t1 ) e q(t2 ) permette di ricostruire quello che `e successo. Non sempre `e cos`ı: se le due istantanee mostrano un pendolo in posizione di equilibrio pu` o darsi che ci sia sempre rimasto o che sia passato di l`ı pi` u volte. In genere le condizioni agli estremi t1 e t2 individuano una classe di soluzioni possibili. Tuttavia i moti che non sono compatibili con le equazioni di Eulero-Lagrange sono impossibili.5 A priori, cio`e prima di risolvere il problema del moto, si sa solo che la legge q(t) fisica appartiene ad un insieme E di funzioni q(t) che soddisfano alle stesse condizioni agli estremi; queste leggi orarie si chiamano cammini virtuali. Risolvere le equazioni del moto significa scegliere fra i cammini virtuali q(t) ∈ E quelli fisicamente realizzabili. Ammettiamo ora per comodit` a che ce ne sia uno. La soluzione occupa un posto speciale in E, davvero sorprendente. Per ogni traiettoria q(t), L(q(t), q(t), ˙ t) `e una funzione solo del tempo. A q(t) `e assegnata l’azione S definita da
t2
dtL(q(t), q(t), ˙ t)
S= t1
ed ha le dimensioni di energia × tempo. L’azione `e un funzionale della legge oraria; questo significa che dipende da tutti gli infiniti valori che q(t) assume. Possiamo considerarla come una funzione con una infinit`a continua di variabili. Ad esempio per un punto materiale libero che si muove con velocit`a costante t2 (xb −xa )2 m (xb −xa )2 a eS= m e v = xt2b −x −t1 da xa a xb , l’azione fisica ` 2 t1 dt (t2 −t1)2 2 t2 −t1 . Ma c’` una infinit` a di altre leggi orarie x(t), x(t1 ) = xa , x(t2 ) = xb che uno si pu` o inventare, ed a tutte corrisponde un ben definito integrale d’azione. Si noti che: 4 5
Al solito indichiamo con una sola variabile q quella che in genere `e una collezione di s variabili. Vedremo a suo tempo che le cose vanno diversamente in meccanica quantistica.
18
2 Meccanica analitica
- S non dipende dalla scelta delle coordinate lagrangiane usate per descrivere il cammino ma solo dal cammino. Infatti il valore che L assume ad un tempo t non cambia se facciamo una trasformazione puntuale. - Se cambiamo la lagrangiana con la trasformazione L(q, q, ˙ t) → L(q, q, ˙ t) +
d F (q(t), t), dt
cio`e aggiungiamo un a derivata totale, S → S + F (q, t)|tt21 ed il cambiamento dipende dagli estremi di integrazione, ma non dalla traiettoria. Problema 7. Per un oscillatore armonico con massa m e costante di forza k, k L = m ˙ 2 − ω 2 x2 ), dove ω 2 = m . Calcolare S su una traiettoria fisica che 2 (x parte da 0 al tempo 0 ed arriva a X al tempo T . Soluzione 7. Posto x = A sin(ωt), X = A sin(ωT ), L = viene immediatamente: S=
m 2 2 2A ω
cos(2ωt),
m 2 m A ω sin(ωT ) cos(ωT ) = X 2 ωcotg(ωT ). 2 2
2.2.2 Principio di Minima Azione L’azione dipende dalla traiettoria qi (t). Che succede se la cambiamo un po’, senza modificare gli estremi? Potremmo definire vicine due leggi orarie stabilendo che qi (t) e q˙i (t) differiscono di meno dell’un per cento, o dell’un per mille. Insomma, nello spazio a infinite dimensioni delle traiettorie si pu`o pensare di stabilire una metrica. Questo comporta un concetto di continuit`a: pi` u vicine le traiettorie, pi` u S sar` a vicino. Inoltre possiamo definire il concetto di estremo, come ad esempio un massimo o un minimo locale. Un minimo si ha se ogni piccola variazione porta un aumento di S, etc.. Il problema tecnico `e quello di definire rigorosamente una piccola variazione di una data traiettoria. Potremmo variarla definendo una funzione arbitraria (purch´e non troppo cattiva) ηi (t) e ponendo qi (t) → qi (t) + ηi (t), e quindi, in una notazione che mette in evidenza qi , L(qi (t), q˙i (t), t) → L(qi (t) + ηi (t), q˙i (t) + η˙ i (t), t). Siamo interessati anche a variazioni piccole, anche se di forma arbitraria; il modo pi` u semplice di realizzarle `e porre invece qi (t) → qi (t) + αi ηi (t), dove αi `e un parametro che ci permette di regolare la grandezza della variazione. Potremo sempre (purch´e ηi (t) non sia troppo cattiva) prendere αi abbastanza piccolo da tenere piccola la variazione di S. Data una generica q(t), per αi 1 ci si aspetta
2.2 Formalismo lagrangiano
19
S(αi ) − S(0) = δS (1) αi + δS (2) α2i + . . . ; dire che q(t) soddisfa le equazioni del moto equivale al principio variazionale δS (1) =
∂S dαi = 0. ∂αi
Questo significa che se al tempo t1 il sistema ha la configurazione {qi (t1 } e al tempo t2 ha la configurazione {qi (t2 } il cammino che segue per andare dall’una all’altra rende stazionaria l’azione; la correzione di primo ordine si annulla. Si noti che: - vengono confrontati i valori di S lungo tutti i cammini che hanno le configurazioni iniziali e finali prescritte. Il generico cammino pu` o essere rappresentato dalle funzioni qi (t, αi ) = qi (t, 0) + αi ηi (t), dove qi (t, 0) descrive il cammino effettivo, gli αi sono parametri e le ηi (t) sono funzioni arbitrarie che si annullano agli estremi dell’intervallo. - Un principio variazionale `e analogo alla ricerca di un punto stazionario per una funzione di pi` u variabili; la differenza `e che il numero di variabili `e infinito, perch´e S dipende da tutti i valori che L assume lungo la traiettoria. Tutta la Fisica Teorica `e ricca di principi variazionali; ad esempio, l’equazione di Poisson si ottiene imponendo che l’energia del campo elettrico sia stazionaria. - Se cambiamo la lagrangiana con la trasformazione L(q, q, ˙ t) → L(q, q, ˙ t) + d F (q, t), cio` e aggiungiamo una derivata totale, la variazione δS non dt cambia; due lagrangiane che differiscono per una derivata totale sono equivalenti; il valore di F agli estremi non dipende dal cammino. - Abbiamo visto che le q˙ figurano in L come variabili indipendenti. Questo vuol dire che, cambiando cammino, L cambia sia perch´e cambiano le coordinate, sia perch´e cambiano le velocit` a. Tuttavia nel fare la variazione se prendiamo qi (t, αi ) = qi (t) + αi ηi (t), allora prendiamo anche q˙i (t, αi ) = q˙i (t) + αi η˙ i (t). - Il punto stazionario pu` o essere un minimo, ma non sempre `e cos`ı. Prendiamo un punto materiale vincolato a muoversi lungo una circonferenza, con una legge oraria θ(t) e con L = 21 mθ˙2 , tale che θ(0) = θ(1) = 0. L’angolo θ `e ciclico e le equazioni del moto dicono che θ˙ =costante. La legge oraria θ(t) ≡ 0 (particella ferma) rappresenta il minimo di S ed `e certamente un moto fisicamente possibile; ci sono per`o infiniti altri punti stazionari (la particella nel tempo 1 pu` o fare un numero intero di giri). Dimostriamo il principio variazionale. Poich´e t2 S(αi ) dtL(qi (t) + αi ηi (t), q˙i (t) + αi η˙i (t), t)dt, t1
la condizione di estremo `e
20
2 Meccanica analitica
∂S |α →0 = 0 = ∂αi i
t2
dt( t1
∂L ∂L ηi (t) + η˙i (t)). ∂qi ∂ q˙i
Per far sparire l’incomodo η, ˙ sul quale non abbiamo ipotesi agli estremi, in favore di η, integriamo per parti: t2 t2 ∂L ∂L d ∂L dt η˙i (t)[ ηi (t)]tt21 − dtηi (t) , ∂ q˙i ∂ q˙i dt ∂ q˙i t1 t1 e cos`ı viene ∂S ∂L =0=[ ηi (t)]tt21 + ∂αi ∂ q˙i
t2
t1
d ∂L ∂L . ηi (t) − ηi (t) dt ∂qi dt ∂ q˙i
(2.21)
Noi stiamo considerando variazioni a estremi fissi, ηi (t) si annulla in t1 e t2 , e quindi t2 ∂L d ∂L dtηi (t) − = 0. ∂qi dt ∂ q˙i t1 Per l’arbitrariet` a delle ηi seguono le equazioni di Lagrange. I principi variazionali hanno un grande appeal estetico ma sono anche importanti in pratica, come vedremo. Osservazione 1. Se non ci fossimo preoccupati di formulare le equazioni di Newton in modo invariante per cambiamenti di coordinate non avemmo trovato questo risultato, che `e anch’esso indipendente dalla scelta delle q. Osservazione 2. Tornando alla (2.21), notiamo che essa contiene anche un altro risultato, se consideriamo - anzich´e cammini arbitrari con estremi fissi - solo traiettorie fisiche, ma senza fissare l’estremo superiore. Cos`ı troviamo ∂qi |0 . Allora l’integrale si annulla per come dipende S al variare di ηi (t2 ) = ∂α 1 le equazioni del moto, ma δS no (perch´ e la variazione `e nulla solo fra estremi δq (t ) ovvero, fissi). Possiamo scrivere δS = i ∂∂L i 2 q˙i ∂S = pi . ∂qi
(2.22)
La derivata dell’azione rispetto alla q dell’estremo superiore fornisce la p corrispondente.
2.3 Trasformazioni di Legendre Dobbiamo fare una digressione matematica sulle trasformazioni di Legendre6 che ci saranno utili per capire la formulazione di Hamilton ed in varie altre occasioni. Sia data nel piano una funzione di due variabili f (x, y) che rappresenta qualche grandezza fisica; per un piccolo spostamento nel piano, 6
Adrien Marie Legendre (Parigi 1752, Parigi 1833) accademico delle Scienze e uno dei pi` u grandi matematici della sua epoca; ha studiato funzioni speciali delle quali avremo bisogno.
2.4 Formulazione Hamiltoniana della meccanica
df = udx + vdy, u =
∂f ∂f ,v = . ∂x ∂y
21
(2.23)
Talvolta u `e una grandezza fisica che sappiamo misurare meglio di x, o che ha particolare importanza per qualche motivo (ad esempio, `e conservata durante l’evoluzione del sistema). In tali casi conviene passare ad una nuova descrizione in termini di u eliminando x. Questo `e un cambiamento di variabile indipendente. Uno pu` o pensare di esprimere x in funzione della nuova variabile per mezzo di una funzione x = x(u) e scrivere g(u, y)f (x(u), y). Questa non `e una buona idea, perch´e la dipendenza da x non `e eliminata, ma solo nascosta; inoltre x = x(u) non `e noto a priori e dobbiamo inventare una trasformazione diversa per ogni problema. Legendre ha trovato un metodo semplice e generale, che comporta una modificazione anche della grandezza da studiare. Dobbiamo introdurre una nuova funzione g(u, y) = f (x, y) − ux.
(2.24)
Ora, g `e legata semplicemente a f , ma non dipende affatto da x; infatti, dgdf − udx − xdu = vdy − xdu.
(2.25)
Quindi, abbiamo le relazioni ∂g ∂g = −x, = v. ∂u ∂y
(2.26)
Abbiamo eliminato x come variabile senza perdere nessuna delle informazioni contenute in (2.23)
2.4 Formulazione Hamiltoniana della meccanica La formulazione di William Rowan Hamilton7 (Dublin 1805 - Dublin 1865) fornisce un metodo nuovo di soluzione dei problemi, permette di capire meglio la struttura matematica della teoria e gioca un ruolo essenziale in Relativit` a e meccanica quantistica. Noi qui dovremo tralasciare per semplicit` a alcune delle sue conseguenze pi` u importanti. Possiamo partire da una semplice osservazione. Nei problemi pi` u semplici, → − − a, in coordinate cartesiane, c’`e una relazione → p = m ddtx fra impulso e velocit` ma in genere, cambiando coordinate lagrangiane o introducendo un potenziale vettore (vedi Sezione 2.4.2) la relazione cambia; momento e velocit`a sono 7
Questo precoce genio Irlandese and` o a 22 anni al Trinity College a spiegare la sua riformulazione della meccanica, e ottenne subito la cattedra. Continu` o per tutta la vita a produrre risultati di altissimo livello; negli ultimi anni lavor` o sui quaternioni, che poi sono in sostanza le matrici dello spin di cui parleremo pi` u avanti.
22
2 Meccanica analitica
grandezze indipendenti, che non hanno una relazione funzionale fissa. Nella formulazione Hamiltoniana si passa a nuove variabili indipendenti, cio`e qi e pi = ∂∂L ˙ L’hamiltoniana del sistema `e definita da q˙i invece di q, q. H(p, q, t) =
pi q˙i − L(q, q, ˙ t).
(2.27)
i
Matematicamente, si tratta di una trasformazione di Legendre (vedi Sezione 2.3), che ha lo scopo di cambiare le variabili indipendenti. Infatti, dalla (2.27) si ha ∂L ∂H = pk − =0 ∂ q˙k ∂ q˙k e la dipendenza dalle velocit`a non c’`e pi` u. Se L non dipende dal tempo esplicitamente, sappiamo dalla (2.20) che H = E lungo una traiettoria effettiva del sistema `e l’energia. In questo senso possiamo affermare che l’hamiltoniana `e l’energia pensata come funzione di q e p. Il principio variazionale di Hamilton pu` o anch’esso esprimersi con p, q variabili indipendenti, ed `e δS = 0, con S nelle nuove variabili, t2 t2 dt[ pi q˙i − H(p, q, t)]. (2.28) dtL(q, q, ˙ t) S= t1
t1
i
Tuttavia nel fare la variazione c’`e una sottigliezza: q e p si variano indipendentemente (mentre nel formalismo lagrangiano q˙ `e fissato da q). Consideriamo funzioni ηi (t), ξi (t) arbitrarie e indipendenti, ma con estremi fissi ηi (t1 ) = ηi (t2 ) = 0, ξi (t1 ) = ξi (t2 ) = 0,
(2.29)
e variamo con qi (t, αi ) = qi (t, 0) + αi ηi (t), pi (t, αi ) = pi (t, 0) + αi ξi (t). Cos`ı (2.28) diventa
t2 S= dt [pi + αi ξi ] [q˙i + αi η˙ i ] − H(pi + αi ξi , qi + αi ηi , t) . t1
i
Svolgiamo il prodotto trascurando i termini in α2i . Viene: dS = dαi
t2
t1
∂H ∂H dt(pi η˙ i + q˙i ξi − ηi − ξi ) = ∂qi ∂pi
t2 t1
dt(pi η˙ i −
∂H ∂H ηi + ξi [q˙i − ]). ∂qi ∂pi
Possiamo eliminare η˙ con la solita interazione per parti, utilizzando il fatto che gli estremi sono fissi,
2.4 Formulazione Hamiltoniana della meccanica
t2
dtpi η˙ i pi ηi |tt21 −
t1
ed otteniamo
t2 t1
dt[ηi (−p˙ i −
t2
dtp˙i ηi = −
t1
23
t2
dtp˙i ηi t1
∂H ∂H ) + ξi (q˙i − )] = 0, ∂qi ∂pi
da cui vengono le equazioni di Hamilton (o equazioni canoniche) p˙ i = −
q˙i =
∂H , ∂qi
∂H . ∂pi
(2.30)
(2.31)
Variabili p, q che soddisfano le (2.30), (2.31) si dicono canonicamente coniugate. Le equazioni canoniche conseguono anche dalle equazioni di Lagrange, tenuto conto della definizione (2.27) dell’Hamiltoniana, purch´e si faccia attenzione a quali sono le variabili indipendenti! Per L sono q, q, ˙ ma, quando definiamo H con H(p, q, t) = i pi q˙i − L(q, q, ˙ t), nel secondo membro q˙ va pensato riespresso nelle variabili Hamiltoniane che sono p e q, con p che non dipende da q; quindi otteniamo, derivando la (2.27) ∂ q˙i ∂L ∂L ∂ q˙i ∂H pi = − − . ∂qk ∂qk ∂qk ∂ q˙i ∂qk i i Il primo termine si elide col terzo, per la definizione di p; resta ∂L d ∂L ∂H − =− = −p˙ k , ∂qk ∂qk dt ∂ q˙k usando le equazioni di Lagrange. Questo verifica la (2.30). D’altra parte, sempre derivando la (2.27), ∂ q˙i ∂L ∂ q˙i ∂H = q˙k + pi − , ∂pk ∂pk ∂ q˙i ∂pk i i ma gli ultimi due termini si elidono e resta la (2.31). Lungo una traiettoria fisica, H = H(p(t), q(t), t) dipende dal tempo in modo che dH ∂H = . dt ∂t Infatti, dH ∂H ∂H ∂H = + ( q˙i + p˙ i ), dt ∂t ∂q ∂pi i i ma la somma `e nulla per le equazioni canoniche. Quindi se H non dipende esplicitamente dal tempo, allora H = E `e una costante del moto.
24
2 Meccanica analitica
2.4.1 Trasformazioni Canoniche Il formalismo lagrangiano permette di scrivere le equazioni con qualsiasi scelta di coordinate q, e questo `e di aiuto nella impostazione e nella soluzione delle equazioni. Si dice che esso gode dell’invarianza per trasformazioni puntuali; per` o una volta scelte le q, le velocit`a sono le derivate e non aggiungono nulla. Il formalismo hamiltoniano sostituisce le s equazioni lagrangiane del secondo ordine con 2s equazioni del primo ordine. Coordinate e momenti sono canonicamente coniugati, e la teoria gode dell’invarianza per trasformazioni canoniche dalle variabili p, q a nuove variabili indipendenti P (p, q, t) e ˜ Q(p, q, t). C’`e una hamiltoniana trasformata H(P, Q, t) e le nuove variabili ˜ Una soludevono anche loro essere canonicamente coniugate, rispetto ad H. zione {q(t), p(t)} delle equazioni del moto viene mandata dalla trasformazione in una traiettoria {Q(t), P (t)} nelle nuove variabili, anch’essa soluzione del` lo stesso moto fisico descritto in due modi le nuove equazioni del moto. E matematicamente diversi. Questa classe di trasformazioni `e ben pi` u generale delle trasformazioni puntuali, ed `e quindi pi` u efficace sia per risolvere le equazioni del moto che per comprendere la struttura della teoria. Questo `e un vantaggio evidente del formalismo hamiltoniano. Dato H(p, q, t), si pone il problema preliminare di come ottenere la trasformazione a nuove variabili {Q(t), P (t)} che descrivano lo stesso cammino fisico o virtuale in modo equivalente. Se chiedessimo che la lagrangiana fosse la stessa, cio`e che fosse ˙ ˜ i pi q˙i − H(p, q, t) ≡ i Pi Qi − H(P, Q, t), l’azione lungo ogni cammino virtuale sarebbe la stessa; quindi i cammini virtuali con δS = 0 dovrebbero in ambedue le descrizioni obbedire le equazioni del moto che esprimono la condizione variazionale. Questa condizione per`o `e troppo restrittiva. Ci basta che sia, per variazioni ad estremi fissi di ogni cammino virtuale, t2 t2 ˜ pi q˙i − H]δ dt[ Pi Q˙ i − H]. (2.32) δS = δ dt[ t1
t1
i
i
Infatti noi siamo interessati solo alle variazioni che sono nulle agli estremi di integrazione, per le quali la condizione δS = 0 individua i moti fisicamente possibili. Per queste variazioni, la condizione (2.32) `e automaticamente soddisfatta se i due integrandi differiscono di una derivata totale dF dt , dove F = F (p, q, P, Q, t) prende il nome di funzione generatrice della trasformazione canonica, ed ha le dimensioni di un’azione. Infatti, t2 dF = δ[F (t2 ) − F (t1 )] = 0. δ dt dt t1 La condizione di canonicit` a `e quindi i
pi q˙i − H
i
˜ + dF . Pi Q˙ i − H dt
(2.33)
2.4 Formulazione Hamiltoniana della meccanica
25
In (2.33) l’unica variabile indipendente `e t; p, q sono pensate come funzioni di t lungo un certo cammino, e Q(t), P (t) sono lo stesso cammino nella nuova rappresentazione. Molte scelte di F saranno inutili, ma a volte una scelta astuta pu` o risolvere un problema altrimenti intrattabile. Non `e detto che F = F (p, q, P, Q, t) dipenda effettivamente da tutte quelle variabili. Per esempio, `e utile anche la scelta particolare F = F (q, Q, t) che conduce a
pi q˙i − H
i
i
∂F ∂F ˙ ˜ + ∂F + Qi ]. Pi Q˙ i − H [ q˙i + ∂t ∂q ∂Q i i i
(2.34)
Proviamo a soddisfare questa condizione di canonicit`a identicamente; eguagliamo i coefficienti di q˙i con pi =
∂F (q, Q, t) ∂qi
(2.35)
e quelli di di Q˙ i con Pi = −
∂F (q, Q, t) . ∂Qi
(2.36)
La condizione si riduce a ˜ = H + ∂F (q, Q, t) . H ∂t
(2.37)
˜ generalmente non si ottiene da H con un semplice cambiaCome si vede, H ˜ = H solo se la F non mento di variabili, come nel caso della lagrangiana; H dipende dal tempo. Se le equazioni (2.35), (2.36) possono essere risolte per P e Q in termini di p, q, allora possiamo determinare la trasformazione P (p, q, t) e Q(p, q, t) e ˜ quindi anche H. Esempio 1. La funzione generatrice λi qi Qi F = i
fornisce pi = λi Qi , Pi = −λi qi . Come si vede, non c’`e motivo di continuare a parlare di momenti e coordinate, `e meglio parlare di variabili canonicamente coniugate. (Dimensionalmente pq deve essere una azione, e questo rimane vero; le dimensioni delle coordinate e dei momenti possono cambiare.) Per esempio, un oscillatore armonico viene mandato dalla trasformazione in un oscillatore armonico.
26
2 Meccanica analitica
Problema 8. Sia data l’hamiltoniana 1 H(p, q, t) = αpt + µ(q − αt2 )2 , 2
(2.38)
con α, µ costanti; consideriamola trasformazione canonica che ha la funzione generatrice 1 F (q, Q, t) = Q(q − αt2 ). (2.39) 2 Soluzione 8. Abbiamo 1 ∂F p = Q, P = −(q − αt2 ), = −αtQ, 2 ∂t da cui si trova ˜ H(P, Q, t) = µP 2 . Ogni moto descritto dalla (2.38) `e coniugato ad un moto libero. Esempio 2. Consideriamo F = S(q, P, t) −
Pi Qi .
i
In questo caso `e S che tradizionalmente prende il nome di funzione generatrice. Allora la (2.33) diventa i
˜ + ∂S Pi Q˙ i − H ∂t i ∂S ∂S ˙ ˙ ˙ + Pi − Pi Qi − Qi Pi . q˙i + ∂qi ∂Pi i
pi q˙i −H
(2.40)
Eguagliando i coefficienti di q˙i si ottiene: pi =
∂S ∂qi
e questa `e la (2.22); S `e l’azione pensata come funzione delle vecchie coordinate e dei nuovi impulsi nell’estremo superiore. Eguagliando i coefficienti di P˙i ∂S , ∂Pi ˜ = H + ∂S . H ∂t
Qi =
Esempio 3. La S = zione identica.
k qk Pk ,
F = S(q, P, t) −
i
Pi Qi genera la trasforma-
2.4 Formulazione Hamiltoniana della meccanica
27
` data l’hamiltoniana classica Problema 9. E 2 A + B 2 p4 (q − vt)2 , H(p, q) = vp + p dove A, B, v sono costanti. Se ne interpreti il significato fisico con l’ausilio di una trasformazione canonica di funzione generatrice F (q, Q, t) = Soluzione 9. Poich´e p =
∂F ∂q
=
1 Q,
q − vt . Q
∂F P = − ∂Q =
q−vt ∂F Q2 , ∂t
v = −Q , si trova
∂F ˜ = A2 Q2 + B 2 P 2 H(P, Q) = H + ∂t che descrive un oscillatore armonico di pulsazione ω = A e massa m =
1 2B 2 .
2.4.2 Carica puntiforme in un campo elettromagnetico → − Classicamente, l’elettrone in un campo elettrico E e un campo di induzione → − magnetica B `e descritto come un punto materiale di massa m dotato di carica q = −|e|, soggetto alla forza di Lorentz. Nel Sistema Internazionale questa `e → − → − − → − F = q[ E + → v ∧ B ],
(2.41)
dove la notazione `e ovvia; ad esempio, F1 = q[E1 +(v2 B3 −v3 B2 )]. Nel sistema di Gauss8 si scrive → − v → − → − → − ∧ B ]. F = q[ E + c In questa sezione facciamo i calcoli nel Sistema Internazionale. Invece di lavorare con 2 campi (6 componenti) `e meglio esprimere tutto in termini dei → − potenziali A e φ (4 componenti in tutto); il campo magnetico `e → − → − → − B = ∇ ∧ A = (∂2 A3 − ∂3 A2 , ∂3 A1 − ∂1 A3 , ∂1 A2 − ∂2 A1 ), e quello elettrico da → − ∂A → − → − ; E = − ∇φ − ∂t
(2.42)
cos`ı l’equazione del moto diventa 8
questo `e un sistema molto usato nei lavori scientifici, vedi John D. JacksonElettrodinamica Classica, Zanichelli Bologna 1984. Per la conversione al sistema internazionale vedi Appendice 20.
28
2 Meccanica analitica
→ − ∂A → − − − − ¨r = −q → + q→ r˙ ∧ B . m→ ∇φ − q ∂t
(2.43)
Abbiamo dedotto le equazioni lagrangiane sotto l’ipotesi che la forza fosse il gradiente di un potenziale. La forza di Lorentz dipende dalla velocit`a, ma vedremo subito che una lagrangiana esiste anche in questo caso; le (2.43) si ottengono dalla lagrangiana9 1 → − − − − − L(→ r ,→ v , t) = mv 2 − qφ + q → v · A (→ r , t). 2 Stabilito un sistema cartesiano si ottiene ∂Aj ∂L ∂φ = −q +q x˙ j , ∂xi ∂xi ∂xi j
(2.44)
(2.45)
mentre pi =
∂L = mx˙ i + qAi . ∂ x˙ i
(2.46)
Ora, la derivata temporale del potenziale va presa lungo la traiettoria della particella, e ∂ ∂ ∂ ∂ → → −˙ − A = ( + x˙ 1 + x˙ 2 + x˙ 3 )A. ∂t ∂x1 ∂x2 ∂x3 Sostituendo nelle equazioni di Lagrange, si trova m
∂Aj d2 xi ∂Ai ∂Ai ∂φ + + q[ x˙ j ] = −q +q x˙ j , 2 dt ∂t ∂xj ∂xi ∂xi j j
e quindi ⎡
⎤ ∂φ ∂A ∂A ∂A i j i m¨ xi = q ⎣− + − x˙ j ( − )⎦ . ∂xi ∂t ∂x ∂x i j j Si pu` o verificare che espandendo le (2.43) in componenti si ottiene lo stesso risultato. Il fatto che la forza dipenda dalla velocit` a comporta solo che L = T − U , con T = 21 mv 2 e U = U (q, q, ˙ t), e la forza generalizzata, che include tutti i termini che derivano da U Qi = −
∂U d ∂U + ∂qi dt ∂ q˙i
`e quella di Lorentz. Il momento canonicamente coniugato a xi `e 9
Anche se un’altra che differisca da quella di una derivata totale ugualmente valida.
− dF (→ r ,t) dt
`e
2.4 Formulazione Hamiltoniana della meccanica
pi =
29
∂L = mx˙ i + qAi , ∂ q˙i
`e diverso dal momento meccanico pmec ≡ mx˙ i e non `e osservabile, come non lo `e il potenziale. Quindi, l’energia E = i pi q˙i − L (2.47) = i [(mx˙ i + qAi )x˙ i − ( 12 mx˙ 2i + q x˙ i · Ai )] + qφ 12 mr˙ 2 + qφ non dipende dal potenziale vettore; l’origine delle energie dipende da quella di φ. Per avere l’hamiltoniana bisogna esprimere questo in termini del momento − canonico → p: H=
1 → → − (− p − q A )2 + qφ. 2m
(2.48)
Questa espressione contiene il potenziale e il momento canonico, che non sono misurabili; per` o l’energia (2.47) `e ben definita (a meno di una costante arbitraria). Dunque, per includere un campo elettromagnetico, la regola `e: → − − − E → E + qφ , → p →→ p − qA. Questa regola (minimal coupling) resta vera in teoria relativistica, quantistica, e quantistica relativistica. Insomma, `e vera sempre. Osservazione 3. Nel sistema di Gauss questa regola diventa q→ − − − E → E + qφ, → p →→ p − A. c 2.4.3 Parentesi di Poisson Data una funzione arbitraria F delle variabili canoniche e del tempo, ∂F ∂F ∂F F˙ = + q˙i + p˙ i . ∂t ∂qi ∂pi i Se il moto `e canonico, sostituendovi q˙ = ∂F F˙ = + ∂t i
∂H ∂p , p˙
∂F ∂H ∂F ∂H − ∂qi ∂pi ∂pi ∂qi
= − ∂H ∂q si trova
=
∂F + {F, H} . ∂t
Qui compare la parentesi di Poisson definita da ∂A ∂B ∂A ∂B − {A, B} ≡ = − {B, A} . ∂qk ∂pk ∂pk ∂qk k
(2.49)
30
2 Meccanica analitica
Se F non dipende esplicitamente dal tempo e {F, H} = 0, allora F `e una costante del moto. Si verificano facilmente alcune regole la cui importanza sar` a pi` u chiara nella parte del libro nella quale ci occuperemo di meccanica quantistica: {A, costante} = 0;
(2.50)
{A, B + C} = {A, B} + {A, C} ;
(2.51)
{A, BC} = {A, B} C + {A, C} B.
(2.52)
Inoltre, poich´e le p e e q sono variabili indipendenti, e ∂pi = δi,k , ∂pk
∂qi = δi,k , ∂qk
∂pi = 0, ∂qk
`e immediato verificare le cosiddette parentesi fondamentali {qi , pj } = δi,j ,
{qi , qj } = 0,
{pi , pj } = 0.
(2.53)
Supponiamo di fare una trasformazione canonica a nuove variabili P, Q con ˜ Anche P, Q hanno le parentesi fondamentali una hamiltoniana trasformata H. {Qi , Pj }P,Q = δi,j , dove {}P,Q significa che le derivate sono rispetto alle nuove variabili. Si pu` o anzi dimostrare10 che {Qi , Pj }p,q = δi,j , cio`e le parentesi di Poisson sono invarianti per trasformazioni canoniche; quindi le parentesi fondamentali si possono controllare anche usando le vecchie variabili. Questo `e molto importante perch´e permette di controllare agevolmente se una data trasformazione `e canonica, anche senza dover trovare una funzione generatrice. ˜ Nei problemi indipendenti dal tempo si ottiene in tal modo anche H. Esempio 4. Dato l’oscillatore armonico di hamiltoniana H(p, q) =
1 p2 + mω 2 q 2 , 2m 2
una soluzione delle equazioni del moto `e data da √ 2A sin(ωt), p = mq˙ = 2Amω cos(ωt). q(t) = mω Qui, A `e un parametro che misura l’ampiezza di oscillazione. L’energia `e E = H(p, q) = Aω. Con una trasformazione canonica si pu` o descrivere il sistema con la nuova ˜ hamiltoniana H(A, φ) = Aω, dove φ = ωt; cos`ı le nuove variabili canoniche sono φ, A, con 10
L.D. Landau e E.M. Lif˘ sits, Meccanica (Bollati Boringhieri) Cap.7.
2.4 Formulazione Hamiltoniana della meccanica
31
1 p2 + mωq 2 . 2mω 2 Si verifica che la trasformazione `e canonica con le parentesi di Poisson. tenendo conto che mqω . (2.54) tan(φ) = p A=
Infatti, ∂A = mωq, ∂q
∂A p = , ∂p mω
∂A p = , ∂p mω
∂φ mω/p −mωq/p2 ∂φ = = , 2 ∂q 1 + (mωq/p) ∂p 1 + (mωq/p)2 e risulta {φ, A} =
∂φ ∂A ∂φ ∂A − = 1, ∂q ∂p ∂p ∂q
(2.55)
da cui si capisce che la coordinata `e φ. Le equazioni canoniche sono A˙ = 0, φ˙ = ω.
3 La delta di Dirac
Questo capitolo `e dedicato alla δ di Dirac, che `e il prototipo di funzione generalizzata o distribuzione. Le distribuzioni svolgeranno un ruolo importante in tutto il resto del corso.
3.1 Definizione della δ Cominciamo introducendo la θ di Heavyside ⎧ 1 se x > 0, ⎪ ⎪ ⎪ ⎨ θ(x) = 12 se x = 0, ⎪ ⎪ ⎪ ⎩ 0 se x < 0, che `e una funzione nel senso usuale anche ne `e discontinua, la funzione a gradino. Con essa possiamo definire una funzione con un picco largo 2α, δα (x) =
tale che
θ(α2 − x2 ) 2α
∞
−∞
δα (x)dx = 1.
(3.1)
Se adesso dobbiamo calcolare un integrale con una funzione analitica1 φ possiamo affermare che ∞ lim δα (x)φ(x)dx = φ(0). α→0
1
−∞
Una funzione `e analitica in 0 se si pu` o rappresentare in un intorno dello 0 in serie di Taylor.
34
3 La delta di Dirac
Viene spontaneo scambiare il limite con l’integrazione,e scrivere: ∞ δ(x)φ(x)dx = φ(0),
(3.2)
−∞
dove
?
δ(x) = lim δα (x), α→0
(3.3)
ma questo `e problematico perch´e non c’`e una funzione ordinaria che possa fungere da limite. C’`e un altro modo equivalente per definire la δ di Dirac,2 cio`e δ(x) ≡
d θ(x), ∀x dx
(3.4)
la δ(x) di nuovo non esiste come funzione ordinaria. Consideriamo una funzione infinitamente derivabile φ(x) e l’integrale x0 ∞ dxφ(x)θ(x0 − x) = dxφ(x). −∞
−∞
Allora, derivando rispetto all’estremo superiore, ∞ d dxφ(x)θ(x0 − x) = φ(x0 ). dx0 −∞ Scambiando formalmente derivazione ed integrazione, troviamo che lo scambio `e possibile se ∞ dxφ(x)δ(x − x0 ) ≡ φ(x0 ). (3.5) −∞
Questo `e un modo alternativo e meno ingenuo di arrivare alla (3.2), partendo dalla definizione (3.4), ed implica x duδ(u − x0 ) = θ(x − x0 ). −∞
Evidentemente, δ(x−x0 ) = 0 per x = x0 , mentre in x0 diverge. Occorre notare che xδ(x) = 0. ` noto per` E o che scambiare due limiti pu`o indurre in errore. Per esempio, 2
P.A.M. Dirac Born: (Bristol 1902 - 1984 in Tallahassee, Florida, USA) fisico inglese con padre svizzero, scrisse l’equazione relativistica dell’elettrone. Dirac diede contributi fondamentali alla Fisica, ma sempre motivati dal gusto per la bellezza matematica. Fra l’altro, formul` o la teoria del monopolo magnetico, predisse l’esistenza dell’antimateria, propose la funzione δ, la notazione braket, e fece lavori fondamentali sui Gruppi. Vinse il premio Nobel nel 1933.
3.1 Definizione della δ
limξ→0 limλ→0
λ λ2 +ξ 2
= 0,
limλ→0 limξ→0
λ λ2 +ξ 2
= ∞.
35
In particolare non si possono scambiare spensieratamente derivazioni e integrazioni (o pi` u in genere passaggi al limite ed integrazioni). Tuttavia scambiare i limiti pu` o essere molto comodo, e per poterlo fare impunemente si introducono le distribuzioni, che sono funzioni generalizzate.3 Tutte le funzioni ordinarie sono distribuzioni, ma l’inverso non vale. In un senso ben definito, la δ pu` o essere rappresentata come limite di successioni di funzioni δα per α → 0. Il senso `e ∞ dxφ(x)δα (x − x0 ) = φ(x0 ). lim α→0
−∞
Ci sono molte funzioni semplici, tutte con la propriet`a (3.1) che vengono impiegate come δα alternative a quella gi` a definita ed interscambiabili con essa. Eccone alcune: δα (x) =
α 1 , π x2 + α2
ovvero δα (x) =
1 −1 Im ; π x + iα
anche 1 x2 √ δα (x) = exp − 2 ; α α π inoltre δα (x) =
δα (x) =
sin2 ( αx ) 2
π( xα )
;
(3.6)
sin( αx ) ; πx
da quest’ultimo esempio possiamo ricavare anche un’importante rappresentazione integrale della δ. In effetti,
1 α
1 −α
3
eiqx dq = 2
sin( αx ) = 2πδα (x), x
Questo tipo di generalizzazione produce risultati importanti. Non potendo estrarre le radici di numeri negativi si allarga il campo dei numeri. Per fare operazioni proibite con le funzioni si introducono funzioni generalizzate.
36
3 La delta di Dirac
da cui viene δ(x) =
1 2π
∞
eiqx dq.
(3.7)
−∞
Questo comporta che data una funzione f = f (x) arbitraria e la componente di Fourier ∞ dx ikx e f (x), F (k) = −∞ 2π consegue ∞ ∞ ∞ dy iky e f (y) dkF (k)e−ikx = dke−ikx 2π −∞ −∞ −∞ ∞ dy = f (y)2πδ(x − y) = f (x). 2π −∞ Questo `e appunto il teorema di Fourier. Osservazione 4. La δ `e la trasformata di Fourier di 1; la trasformata inversa `e 1. Poich´e la δ `e diversa da 0 solo in un punto, dato un intervallo (a, b), b 1, a < x0 < b, dxδ(x − x0 ) = / (a, b). 0, x0 ∈ a
3.2 Ancora sulla δ Dalla rappresentazione (3.7) e dal fatto che la δ `e reale `e chiaro che δ(−x) = δ(x)∗ = δ(x) e la δ `e pari, e quindi se a `e reale, δ(ax) = δ(|a|x); ∞ 1 dxφ(x)δ(ax) = |a| d(|a|x)φ(x)δ(|a|x) = −∞ −∞
∞
ne consegue che quindi
δ(ax) =
φ(0) |a| ,
e
δ(x) . |a|
Sia ora g(x) una funzione con uno zero in x = x0 , rappresentabile in un dg (x − x0 ). In quell’intorno, non ci sono altri zeri, e intorno con g(x) ≈ dx possiamo scrivere
x0
δ(g(x)) = δ
dg δ (x − x0 ) , (x − x0 ) = dg dx x0 dx
3.2 Ancora sulla δ
37
espressione che perde senso se la derivata si annulla. Se g(x) ha un insieme dg numerabile di zeri in x = xα , con g(x) ≈ dx (x − xα ) nell’intorno di ogni xα
zero, purch´e il secondo membro esista, δ (x − xα ) . δ(g(x)) = α dg dx
(3.8)
Nello spazio delle distribuzioni occorre generalizzare alcune relazioni che sono familiari per le funzioni ordinarie. Consideriamo l’equazione xf (x) = 1. Se f `e una distribuzione, dal momento che xδ(x) = 0, la soluzione generale `e f (x) = P
1 + Cδ(x), x
C = costante,
dove P prende la parte principale dell’integrale.4 Definiamo anche le derivate della δ. L’effetto di δ (x) = − si trova integrando per parti ∞ dxδ (x)φ(x) = − −∞
d δ(x) dx
∞
−∞
dxδ(x)φ (x) = −φ (0).
Iterando si trova l’azione della derivata n-sima, ∞ dxδ (n) (x)φ(x) = (−1)n φ(n) −∞
. x=0
La definizione della δ si estende naturalmente allo spazio ordinario con → 1, − r 0 ∈ Ω, − − d3 rδ (3) (→ r −→ r 0) = → − 0, r0∈ / Ω. Ω In coordinate cartesiane, − − − − δ (3) (→ r −→ r 0 ) ≡ δ(→ r −→ r 0 ) = δ(x − x0 )δ(y − y0 )δ(x − z0 ). 4
La parte principale `e definita da
∞
P −∞
1 φ(x)dx ≡ lim →0 x
−
+ −∞
∞
1 φ(x)dx x
e permette di controllare certi tipi di non convergenze in 0.
38
3 La delta di Dirac
Si possono eseguire trasformazioni introducendo il determinante di coordinate ∂(x,y,z) 3 Jacobiano, cos`ı, mentre d x → ∂(ξ,η,ζ) dξdηdζ, la δ va divisa per lo stesso Jacobiano: → − − − − φ( r 0 ) = φ(x0 , y0 , z0 ) = φ(→ r )δ(→ r −→ r 0 )dxdydz diventa − φ(→ r 0 ) = φ(ξ0 , η0 , ζ0 ) ⎫ ⎧ ⎨ δ(ξ − ξ )δ(η − η )δ(ζ − ζ ) ⎬ ∂(x, y, z) 0 0 0 − dξdηdζ. = φ(→ r) ∂(x,y,z) ⎭ ∂(ξ, η, ζ) ⎩ ∂(ξ,η,ζ)
Per esempio, in coordinate sferiche si trova δ(r − r0 )δ [cos(θ) − cos(θ0 )] δ(φ − φ0 ) − − δ(→ r −→ r 0) = . r2 Usando la δ `e facile definire la misura di una ipersuperficie in uno spazio a N dimensioni. Consideriamo per esempio il caso N = 2, cio`e il piano xy e supponiamo che una famiglia di curve chiuse sia definita dall’equazione f (x, y) = C. Definiamo allora la misura invariante ω(C) di un membro della famiglia con d ω(C) = dxdyδ(C − f (x, y)) = Ω(C), (3.9) dC
dove
dxdyθ(C − f (x, y))
Ω(C) =
(3.10)
`e l’area racchiusa da f = C; in genere ω(C) non coincide con la lunghezza, ma `e comunque una misura, indipendente dal sistema di coordinate. 3.2.1 Volume dell’ipersfera in N dimensioni N Poniamo i x2i = r2 . Per ragioni dimensionali, il volume ΩN (R) = N dx1 dx2 . . . dxN = dN xθ(R − r) = cN RN i
x2i
`e noto a meno di cN . Il trucco per trovarlo `e il seguente.
∞
I= −∞
dx1
∞
−∞
dx2 . . .
∞ −∞
dxN e−
N i
x2i
∞
= −∞
dxe−x
2
N N
=π2.
3.2 Ancora sulla δ
D’altra parte, ponendo
2
Ma e−r =
∞ 0
x2i = r2 , possiamo scrivere 2 I = dN xe−r .
i
2
dRe−R δ(R − r), quindi
I=
N
39
∞
N
d x
dRe
−R2
∞
δ(R − r) =
dRe
0
−R2
0
Quindi
I=
∞
dRe−R
2
0
d dR
dN xθ(R − r).
d ΩN (R). dR
Ora il calcolo `e elementare: ∞ ∞ 2 N −1 −R2 I = N cN dRR e = N cN RdRRN −2 e−R 0
N cN = 2
0
∞ N −2 N cN N −1 ! dtt 2 e−t = 2 2 0
Qui compare la funzione fattoriale x! =
∞
tx e−t dt
0
n che vale n! = k k se n `e intero; ( 12 )! = questo a π N/2 , si ottiene
√ π 2 ,
( 32 )! =
√ 3 π 4 ,
π N/2 ΩN (R) = N RN . 2 ! Cos`ı,Ω1 = 2R, Ω2 = πR2 , Ω3 = 43 πR3 , Ω4 = d ΩN (R). superficie dell’ipersfera `e ωN (R) = dR
etc.. Uguagliando
(3.11) 1 2 4 2π R ,
etc.. La misura della
4 Complementi di elettromagnetismo
Utilizzando la δ appena introdotta, otteremo dei risultati che servono ottimamente per illustrarne l’utilit` a. Sono risultati importanti per la teoria elettromagnetica, perch´e consentono di descrivere il campo di una carica puntiforme in moto arbitrario.
4.1 Campi e potenziali I campi elettromagnetici che soddisfano condizioni al contorno assegnate si possono calcolare dalle equazioni di Maxwell, che scriveremo usando il sistema di unit` a di Gauss → − → − ∇ · E = 4πρ, → − → − ∇ · B = 0, → − (4.1) → − → − B, ∇ ∧ E = − 1c ∂∂t → − → − → − − E + 4π → ∇ ∧ B = 1c ∂∂t c j , → − dove j e ρ sono le densit` a di corrente e di carica. I campi possono essere calcolati e misurati; nei calcoli per`o si pu` o fare una notevole economia lavorando con 4 quantit` a invece di 6, e questo si ottiene introducendo il potenziale → − scalare φ e quello vettore A tali che → − → − B = ∇ ∧ A, → − → − E = − ∇φ −
→ −
1 ∂A c ∂t
.
La conoscenza dei potenziali basta per fissare i campi, ma i potenziali sono inosservabili ed anzi largamente arbitrari. La scelta dei potenziali si chiama → − gauge. Si rammenter` a che nella gauge di Lorentz div A + 1c ∂φ ∂t = 0, le equazioni di Maxwell forniscono:
42
4 Complementi di elettromagnetismo
[∇2 −
− 1 ∂2 → c2 ∂t2 ] A
[∇2 −
1 ∂2 c2 ∂t2 ]φ
→ − = − 4π c J,
= −4π.ρ
Calcoleremo i potenziali risolvendo queste equazioni con il metodo delle funzioni di Green.
4.2 Calcolo di ∇2 ( 1r ) Per ogni r = 0 abbiamo ∇2 ( 1r ) = 0; infatti, per funzioni sfericosimmetriche, 1 ∂2 φ(r), possiamo scrivere1 ∇2 φ(r) = r1 ∂r 2 (rφ(r)), e con φ = r si trova 0. Presa per` o una sfera di raggio arbitrario centrata sull’origine, 1 1 1 − 3 3 2 d r∇ n dS grad · → = d rdiv grad = r r r S → − − → − e poich´e grad( r1 ) = − rr3 , → n = rr , dS = r2 dΩ, viene 1 d3 r∇2 ( ) = −4π. r − In conclusione, ∇2 ( 1r ) = −4πδ(→ r ). Si dice che g(r) = dell’equazione di Poisson
1 r
`e la funzione di Green
− − ∇2 V (→ x ) = −4πρ(→ x ). La soluzione `e − V (→ x)=
− − − d3 x g(→ x −→ x )ρ(→ x ),
come `e immediato verificare.
4.3 Funzione di Green dell’equazione delle onde In modo del tutto analogo si trova (Appendice 1) 1 ∂2 2 − − r , t) = −4πδ(→ r )δ(t). ∇ − 2 2 G(→ c ∂t − Cos`ı G(→ r , t) =
1
δ(t− rc ) r
`e la funzione di Green dell’equazione delle onde.
Spesso si usa anche la forma equivalente ∇2 φ(r) r12
∂ ∂ (r 2 ∂r φ(r)). ∂r
4.4 Potenziali di Lienard-Wiechert
43
4.3.1 Potenziali ritardati δ(t− r ) − − − − − − Usiamo G(→ r , t) = r c con → r =→ x −→ x , con → x punto di osservazione, → x posizione della sorgente: 3 → − − − − φ( x , t) = d x dt G(→ x −→ x , t − t )ρ(→ x , t )
=
3
d x
− − x −→ x | ) |→ δ(t − t + c − ρ(→ x , t ), dt − − |→ x −→ x |
(4.2)
ovvero, integrando su t , il potenziale ritardato − φ(→ x , t) =
− − |→ x −→ x | ) → − ρ( x , t − c d3 x ; − − |→ x −→ x |
(4.3)
→ − → − → − → j (− x , t − | x −c x | ) d x . − − |→ x −→ x |
(4.4)
analogamente, → − → A (− x , t) =
3
→ − R (τ )
→ − r
→ − x O
→ − Fig.4.1 La carica puntiforme si muove seguendo una traiettoria R (τ ) − assegnata, riferita all’origine O. Il punto di osservazione `e → x mentre il raggio − vettore → r indica il percorso dalla radiazione emessa ad un particolare τ e − diretta verso l’osservatore. Quella radiazione arriver` a in → x al tempo t = τ + rc
4.4 Potenziali di Lienard-Wiechert L’uso della δ di Dirac semplifica considerevolmente anche il problema di − calcolare i potenziali e i campi nel punto di osservazione → x dovuti ad
44
4 Complementi di elettromagnetismo
→ − una carica puntiforme che compie una traiettoria prefissata R (t). Di nuovo esemplifichiamo il procedimento nel caso di φ. Dalla (4.2) con → − − − ρ(→ x , t ) = eδ(→ x − R (t )), − si ottiene, integrando ora prima su → x , e scrivendo per comodit`a τ invece di t, − φ(→ x , t) = e
dτ
δ(τ − t + r(τ )
r(τ ) c )
→ − − − , → r (τ ) = → x − R (τ ),
espressione che dice che il potenziale `e ancora Coulombiano, ma `e ritardato: la luce `e ricevuta al tempo t, uguale al tempo di emissione τ sommato a quello r(τ ) al c necessario per la trasmissione, che dipende dalla posizione della carica ∗ tempo della emissione. Indichiamo con τ ∗ la soluzione di τ ∗ = t − r(τc ) . Allora r(τ ) δ(τ − τ ∗ ) δ(τ − τ ∗ ) . δ τ −t+ = ) 1 + 1 dr d c τ − t + r(τ dτ c dτ c dr Qui il modulo `e pleonastico, poich´e fisicamente | dτ | < c. Inoltre, la velocit`a → − − della carica `e → v = d R , mentre quello che conta per il potenziale `e dτ
− d→ r 1 → − → − − 2 r · ; r (τ ) · → r (τ ) √→ − dτ r ·→ r 2 −
dr(τ ) d dτ dτ ma
− r d→ dτ
− = −→ v e viene
Di conseguenza
→ − − r ·→ v dr(τ ) =− . dτ r r(τ ) δ(τ − τ ∗ ) δ τ −t+ = − , → − → c 1 − r rc· v
e il potenziale `e − φ(→ x , t) e analogamente, con
e ; → − → − r [r − c· v ]τ ∗
(4.5)
→ − → − − − j = e→ v δ(→ x − R ),
si trova il potenziale vettore
→ − v e → − → . A (− x , t) = − − v r ·→ c r− → c τ∗ Senza le distribuzioni, questo sarebbe un problema difficile.
(4.6)
5 Meccanica statistica ed equilibrio termodinamico
I sistemi macroscopici hanno tante particelle che non potremmo mai assegnare loro condizioni iniziali, nemmeno mettendo insieme tutti i calcolatori del mondo. Come si pu` o sperare di descrivere quantitativamente il comportamento di sistemi cos`ı complicati? Ebbene, ora vedremo che in molti casi si pu` o.
5.1 Richiami di termodinamica Gli studenti hanno gi` a incontrato la termodinamica, e sanno che `e una scienza empirica fenomenologica formulata in modo assiomatico per mezzo di principi; non si investiga in termodinamica il meccanismo per cui le cose vanno in un certo modo, ma si danno delle linee guida che non sono mai state contraddette ` utile per` dall’esperimento, almeno su corpi macroscopici. E o rinfrescare la memoria. Principio zero Il principio zero della termodinamica stabilisce che esiste un equilibrio termico ed `e transitivo: se due corpi A e B sono in equilibrio e B `e in equilibrio con un corpo C allora anche A `e in equilibrio con C. Questo permette di introdurre la nozione di temperatura, perch´e un termometro pu` o essere un gas perfetto in equilibrio con gli altri corpi e pu` o essere letto osservando ad esempio la sua pressione. La temperatura ha un senso ben definito solo in equilibrio. Primo principio Il primo principio della termodinamica sancisce la conservazione dell’energia nelle trasformazioni: se si fornisce calore ad un sistema, questo pu`o incrementare l’energia interna e fare del lavoro. In formula,
46
5 Meccanica statistica ed equilibrio termodinamico
δQ = dU + P dV,
(5.1)
dove δQ `e il calore assorbito, dU l’aumento di energia interna, P la pressione e V il volume, cosicch´eP dV `e il lavoro fatto dal sistema. Ogni tanto spunta fuori qualche inventore del moto perpetuo, che per` o `e impossibile perch´e qualunque macchina produce calore e lo deve fare a spese della sua energia meccanica. Secondo principio Il secondo principio dice (enunciato di Kelvin-Planck) che non si pu` o costruire una macchina che realizza il moto perpetuo di seconda specie (che consisterebbe nel fare lavoro estraendo calore da una sola sorgente). Ancora pi` u semplice `e l’enunciato di Clausius: il calore spontaneamente va da un corpo pi` u caldo ad uno pi` u freddo, ed il contrario pu` o avvenire solo se si fa del lavoro. I due enunciati sono equivalenti, ma questo lo vedremo pi` u avanti. Per il secondo principio `e importante la nozione di trasformazione reversibile. Un tale processo avviene in modo cos`ı lento e graduale che in ogni istante il sistema ha valori di pressione, volume, temperatura, etc. praticamente uguali a quelli di equilibrio. Si tratta di una idealizzazione che supponiamo per semplicit` a di poter fare per andare da uno stato di equilibrio ad un altro con un percorso lento ma peraltro arbitrario. Fra le trasformazioni termoP (P1 , V1 , T1 ) (P2 , V2 , T1 ) T1 (P4 , V4 , T2 )
T2
(P3 , V3 , T2 )
V Fig. 5.1. Il ciclo di Carnot di una macchina termica
dinamiche pi` u importanti c’`e il ciclo (per vederne l’utilit` a basta pensare ad un motore). Un ciclo `e un processo che riporta il sistema allo stato iniziale; una macchina termica pu` o fare un ciclo reversibile, e tornare nello stato di partenza (∆U = 0) avendo assorbito calore e prodotto lavoro (o viceversa). Questo fatto, fondamentale per le applicazioni, comporta per` o che calore e lavoro possono trasformarsi l’uno nell’altro ed il contenuto termico preciso di un corpo che si trova in equilibrio in un dato stato dipende da come ci `e arrivato. In termini matematici, δQ non `e il differenziale di una funzione di ! stato, ed in un ciclo ∆Q δQ pu` o essere non nullo. Consideriamo un fluido
5.1 Richiami di termodinamica
47
il cui stato sia caratterizzato assegnando (P, V, T ), cio`e pressione, volume e temperatura. Un ciclo di Carnot `e definito dalle trasformazioni reversibili in Figura 5.1, di cui due isoterme a temperatura T1 e T2 e due adiabatiche. la macchina `e reversibile e pu`o essere usata come motore e come refrigeratore (condizionatore o frigorifero). In Figura 5.1 vediamo l’uso come macchina termica, che assorbe calore Q1 a temperatura T1 e cede calore Q2 a temperatura pi` u bassa T2 . Dal primo principio, il lavoro fatto nel ciclo `e W = Q1 − Q2 ; il rendimento `e per definizione η=
W Q2 =1− . Q1 Q1
Il rendimento di un ciclo di Carnot dipende solo dalle temperature delle sorgenti, perch´e se esistessero due cicli di Carnot C1 e C2 di rendimenti η1 e η2 con η1 > η2 fra le stesse temperature potremmo combinarli in modo da contravvenire al secondo principio. Problema 10. Come? Soluzione 10. C1 sarebbe usato come motore e produrrebbe un lavoro W1 . Con il lavoro W2 < W1 si azionerebbe C2 come frigorifero, per restituire alla sorgente calda il calore sottratto dall’altro. Resterebbe ancora del lavoro W1 − W2 , prodotto in definitiva col calore della sorgente fredda. Poich´e η dipende solo dalle temperature possiamo usare misure di η per definire una scala termometrica; pi` u precisamente possiamo definire la temperatura assoluta T in modo che sia T2 Q2 = ; T1 Q1 questa legge fissa tutte le temperature in termini di una di riferimento. Ma allora in un ciclo o in ogni combinazione di cicli " Q2 Q1 δQ . − =0= T2 T1 T Cos`ı secondo principio della termodinamica dice che in una trasformazione reversibile infinitesima a temperatura T δQ = dS T
(5.2)
`e il differenziale della funzione di stato Entropia. Precisamente, `e un differenziale esatto; ci`o significa che in ogni ciclo reversibile " dS. Mettendo insieme i due principi, possiamo scrivere che un passaggio fra due stati di equilibrio comporta:
48
5 Meccanica statistica ed equilibrio termodinamico
T dS = dU + P dV.
(5.3)
Ne consegue che S = S(T, V ). Dalla (5.2), δQ = T dS, si ricava la quantit` a di calore assorbita nella trasformazione reversibile da uno stato ad un altro variando T e V: ∂S ∂S dT + dV . (5.4) δQ = T ∂T ∂V In particolare, δQ < 0 vuol dire che il calore |δQ| `e ceduto. L’enunciato di Kelvin-Planck implica quello di Clausius, perch´e se fosse possibile scaldare un corpo caldo con uno freddo poi potremmo produrre lavoro con un ciclo di Carnot riportando il calore nel corpo freddo; quindi l’enunciato di Clausius deve essere vero perch´e lo sia quello di Kelvin-Planck. D’altra parte se fosse possible produrre lavoro da una sola sorgente nulla proibirebbe di usarlo per riscaldarne una pi` u calda, quindi l’enunciato di Kelvin-Planck deve essere vero perch´e lo sia quello di Clausius. Potenziali termodinamici La (5.3) che riscriviamo come dU = T dS − P dV
(5.5)
esprime la funzione di stato U = U (S, V ) che dipende da S e V . Questo non `e conveniente perch´e S `e estensiva come U (cio`e proporzionale alla grandezza del sistema) e non `e di facile misura. Dalla (5.3) ricaviamo per` o la temperatura T =(
∂U )V , ∂S
(5.6)
che cos`ı `e opportunamente espressa in termini di funzioni di stato. Diversamente da S, la temperatura T `e intensiva e si misura con un termometro, e conviene molto pi` u spesso averla come variabile indipendente. Per cambiare variabile indipendente introduciamo i potenziali chimici attraverso una trasformazione di Legendre. La funzione della temperatura che fa al caso nostro `e l’energia libera F = U − TS (5.7) il cui differenziale viene, usando la (5.3), dF = dU − T dS − SdT = −P dV − SdT.
(5.8)
Da qui ricaviamo ∂F ∂F )T = −P, ( )V = −S. (5.9) ∂V ∂T Quindi F = F (V, T ) `e particolarmente utile per descrivere i processi a volume costante, perch´e rimane la dipendenza solo da T. Un altro potenziale chimico utile per descrivere i processi a pressione costante `e l’entalpia H(S, P ) definita da (
5.1 Richiami di termodinamica
H ≡ U + P V.
49
(5.10)
Si trova dH = T dS + V dP. L’energia libera di Gibbs `e G = U + PV − TS ed il suo differenziale viene dG = −SdT + V dP. Confrontiamo la (5.5) con dU = (
∂U ∂U )V dS + ( )S dV. ∂S ∂V
Si conclude che
∂U ∂U )V , P = −( )S . ∂S ∂V Poich´e le derivate miste di U (S, V ) devono essere uguali, si ottiene la relazione di Maxwell ∂P ∂T )S = −( )V . ( ∂V ∂S Altre relazioni di Maxwell si ottengono in modo simile. Per esempio, dal differenziale dellentalpia possiamo dedurre che T(
T =(
∂H ∂H )P , V = −( )S . ∂S ∂P
Problema 11. Che relazione di Maxwell ne consegue? Soluzione 11. (
∂V ∂T )S = −( )P . ∂P ∂S
Spesso `e conveniente lavorare con un sistema termodinamico immerso in un ambiente (o bagno termico) con cui pu`o scambiare non solo calore, ma anche molecole. Quando il numero N di particelle `e variabile, si introduce il potenziale chimico µ generalizzando la (5.3): dU = T dS − P dV + µdN.
50
5 Meccanica statistica ed equilibrio termodinamico
Gas perfetto Si ricorder` a che per il gas perfetto con f gradi di libert` a per molecola la teoria cinetica dei gas fornisce per l’energia interna1 U=
f N KB T. 2
(5.11)
− Qui, per un gas monoatomico, 32 KB T = 12 m→ v 2 `e l’energia cinetica media per molecola (si introduce qui una media statistica sulla quale ritorneremo). Il gas ha l’equazione di stato di Clapeyron P V = N KB T = nRT,
(5.12)
e la costante di Boltzmann, n il numero di dove KB = 1, 381 × 10−16 0erg K ` moli, R = NA KB `e la costante dei gas. In una espansione adiabatica (δQ = 0) di un gas perfetto, sostituendo la (5.11) in dU + P dV = 0, si ottiene (1 + f2 )P dV + f2 V dP = 0. Integrando, si trova che P V γ =costante, dove γ = f +2 e la capacit` a termica di una mole (N = NA ); il f . Il calore specifico ` calore specifico a volume costante `e definito da δQ CV = dT V (la notazione significa che la derivata `e a V costante) e viene ∂S CV = T . dT V dS Quello a pressione costante `e dato da CP = T dT . P Problema 12. Calcolare i calori specifici per il gas perfetto. Soluzione 12. Si ha CV = f2 NA KB , CP = (1 + f2 )NA KB . Spesso si usa la costante dei gas R = NA KB . Nel primo caso il termine P dV non contribuisce, nel secondo V si elemina con l’equazione di stato. Da questo risultato si ha che per il gas perfetto
CP CV
= γ.
Crescita dell’entropia La grande importanza del concetto di entropia `e dovuta al fatto che essa `e massima in uno stato di equilibrio. Prendiamo un recipiente di volume VA che fa parte di uno pi` u grande di volume VB , ma `e separato dal resto del recipiente da una partizione P e mettiamoci N molecole di gas perfetto. Supponiamo tutte le pareti isolanti termiche. Dopo un po’ il gas sar` a in equilibrio a temperatura TA . Ad un certo istante togliamo la partizione. 1
Per il gas monoatomico f = 3.
5.1 Richiami di termodinamica
#
%$51
&
contenitore B
gas A
P Fig. 5.2. Un gas perfetto `e contenuto in A; una partizione P lo separa dal resto del contenitore B
Presto il gas occuper`a tutto il volume e dopo un po’ si metter`a in equilibrio ad una temperatura T B. Ora, nel processo δQ = 0 perch´e le pareti sono isolanti e il lavoro fatto sul gas `e nullo, quindi ∆U = 0. Per un gas perfetto U = U (T ), quindi TB = TA . Il processo `e irreversibile ed il secondo principio comporta che c’`e una variazione di entropia B δQ = 0. SB − S A > T A Per calcolarla dobbiamo considerare una espansione reversibile isoterma ottenuta per esempio muovendo lentamente un pistone; questo per` o bisogna che faccia passare il calore necessario, dato che dU = 0 ⇒ δQ = P dV , dove P dV = −dw `e lavoro che il gas compie sul pistone quando il volume aumenta di dV . Pertanto, B P dV SB − S A = T A e sostituendovi P dalla (5.12) si ottiene SB − SA = N KB log(
VB ). VA
Il processo opposto non avviene nonostante il fatto che il moto di ogni molecola `e meccanicamente reversibile. Il futuro si distingue dal passato per il segno di SB − SA di un sistema si evolve spontaneamente in modo da massimizzare la sua entropia. La variazione di entropia per una generica trasformazione reversibile di una mole di gas perfetto si ottiene da dSCV dT + P dV = CV dT + R
dV V
dalla quale si ottiene, introducendo costanti di integrazione S = CV ln(
T V ) + R ln( ). T0 V0
(5.13)
52
5 Meccanica statistica ed equilibrio termodinamico
Terzo principio Il terzo principio della termodinamica dice che S → 0 per T → 0. Si pu` o dimostrare che questo richiede che il calore specifico C di tutti i corpi vada a CδT 0 allo zero assoluto, affinch´e δQ T = T rimanga piccolo per qualsiasi processo con T → 0. Questo fatto a sua volta conduce all’impossibilit`a di raggiungere lo zero assoluto. 5.1.1 Il corpo nero Normalmente noi vediamo oggetti colorati a seconda della loro natura: `e solo una profonda riflessione che ha portato alla scoperta che questa variabilit`a cos`ı necessaria alla vita `e dovuta non solo alla natura del corpo ma anche al colore della luce e soprattutto alla mancanza di un equilibrio termico fra la radiazione e la materia. (La stessa vita `e un fenomeno lontano dell’equilibrio.) Osservato in luce bianca, un corpo appare blu se assorbe in prevalenza la luce rossa e rosso se assorbe meglio la luce blu, bianco se riflette tutto il visibile. Pu`o riflettere anche senza essere uno specchio ideale: basta che l’energia sia tutta riemessa, anche senza conservare la direzionalit`a necessaria alle immagini. Un ` la luce che il corpo che riflette ed assorbe poco `e trasparente ed incolore. E corpo riflette che noi vediamo e gli conferisce un colore. Se riflette poca luce appare nero; ma anche il carbone riflette un po’. Un corpo nero ideale assorbe tutte le radiazioni completamente. Un tale corpo `e una idealizzazione di grande importanza nello sviluppo storico della Fisica Teorica dovuta a Kirchhoff. 2 Gli antichi non immaginavano nemmeno lontanamente che le cose stessero cos`ı. Per` o sapevano che un pezzo di ferro se viene riscaldato comincia ad emettere luce che vira dal rosso bruno al rosso all’arancione al giallo al bianco aumentando la temperatura, mentre diventa molto pi` u brillante. Sapevano anche che tutti i corpi si comportano essenzialmente nello stesso modo, e la grande variet`a dei colori osservati in riflessione diventa una sostanziale uniformit` a. Naturalmente la cosa `e complicata dal fatto che il nostro occhio vede solo lunghezze d’onda fra 4000 e 8000 Angstrom, ma esperimenti fatti nell’800 hanno portato alla legge di Wien νmax ∝ T che dice che la frequenza ν a cui `e emessa pi` u radiazione `e proporzionale alla temperatura. La potenza emessa cresce come ν 4 , come vedremo. In una cavit` a chiusa in equilibrio a temperatura T c’`e quindi radiazione che viene emessa dalle pareti. In equilibrio, altrettanta deve essere assorbita. Praticando un forellino nelle pareti possiamo osservare la radiazione in equilibrio nella cavit`a. Questa `e una realizzazione sperimentale del corpo nero.
2
Gustav Kirchhoff, fisico tedesco nato a K¨ onigsberg (Kaliningrad, Russia), nel 1824, e morto a Berlino, nel 1887, ha stabilito anche le note leggi sui circuiti elettrici e insieme con Bunsen ha inventato lo spettroscopio; ha scoperto il Cesio ed il Rubidio. Scrisse Vorlesungen u ¨ber mathematische Physik.
5.1 Richiami di termodinamica
53
Lo studio del corpo nero fu segnato da brillanti successi della teoria classica, prima della termodinamica e poi della meccanica statistica, ma poi, repentinamente, nell’anno 1900 condusse alla catastrofe ultravioletta che port` o Planck ad introdurre i quanti. Leggi di Kirchhoff Prendiamo una cavit` a mantenuta a temperatura T . Essa `e piena di radiazione isotropa in equilibrio termico con le pareti. Sia u(ν, T ) l’energia per unit` a difrequenza e di volume ([u(ν, T )] = erg.sec a di energia `e cm3 ). La densit` ∞ u(T ) = 0 u(ν, T )dν, ma possiamo svolgere le nostre considerazioni separatamente per ogni componente spettrale. Gustav Kirchhoff (1959) ha mostrato che u(ν, T ) non dipende dalla natura delle pareti della cavit` a. Date due cavit` a diverse alla stessa temperatura, se la distribuzione spettrale fosse diversa basterebbe metterle in contatto attraverso un filtro di colore opportuno per fare fluire energia dall’una all’altra; cos`ı si creerebbe spontaneamente una differenza di temperatura. Ottenendo lavoro da un sistema in equilibrio si potrebbe fare un moto perpetuo di seconda specie, in contrasto col secondo principio. La stessa radiazione `e in equilibrio con tutti i corpi di tutti i colori. Per capire come ci` o accada, a dispetto delle diverse propriet`a dei corpi, occorre considerare il bilancio di energia di un elemento dS della parete in equilibrio con la radiazione. L’energia emessa nell’unit` a di tempo in un intervallo dν intorno alla frequenza ν `e e(ν, T )dS ed il potere emissivo e dipende dalla natura del corpo. D’altra parte, quando sul corpo incide radiazione isoenergia assorbita tropa a frequenza ν il potere assorbente a(ν, T ) = energia incidente dipende anch’esso dalla natura del corpo. Un corpo con a ≡ 1 si chiama corpo nero. e(ν,T ) e indipendente dalla natura Tuttavia Kirchhoff stabil`ı che il rapporto a(ν,T ) ` del corpo. Infatti, occorre tener conto che la radiazione di equilibrio `e isotropa e nell’unit` a di tempo e in un dν la stessa quantit` a di energia dE(ν, T ) incide su tutti i dS delle pareti e dei corpi contenuti nella cavit` a; una parte a(ν, T ).dE verr` a assorbita, ma l’energia assorbita deve essere pari a quella emessa e(ν, T ).dS. La cosa notevole `e che per ogni frequenza possiamo scrivere una condizione di equilibrio. Se ad in un certo intervallo ∆ν un corpo nella cavit` a emettesse pi` u radiazione di quella assorbita lo spettro nella cavit` a ne risulterebbe inquinato e la legge di Kirchhoff sarebbe violata. Introduciamo allora due corpi etichettati 1 e 2 diversamente colorati: le condizioni di equilibrio sono ' e1 (ν, T )dS = a1 (ν, T )dE(ν, T ), e2 (ν, T )dS = a2 (ν, T )dE(ν, T ), e concludiamo che e1 (ν, T ) e2 (ν, T ) dE(ν, T ) = = a1 (ν, T ) a2 (ν, T ) dS
54
5 Meccanica statistica ed equilibrio termodinamico
) e che la funzione universale dE(ν,T `e il potere emissivo del corpo nero; il dS potere emissivo `e l’energia emessa per unit`a di tempo e di frequenza dall’unit` a di superficie del corpo nero. Sperimentalmente, il corpo nero si pu` o realizzare praticando un forellino in una grande cavit` a mantenuta a temperatura T . Se la cavit` a viene riscaldata a qualche centinaio di gradi il forellino appare ad un osservatore esterno come una macchia brillante. Il suo potere di assorbimento `e ∼ 1 (tutta la radiazione incidente rimbalza sulle pareti tante volte che viene totalmente assorbita) ed `e pi` u alto di quello della superficie esterna della cavit`a, quindi anche il potere emissivo `e pi` u alto. Semplici considerazioni geometriche portano alla conclusione che
c dE(ν, T ) = u(ν, T ). dS 4
(5.14)
Ricaviamo la (5.14) Mettiamoci in coordinate sferiche con origine nell’elemento dS della superficie e consideriamo un elemento di volume nel punto (r, θ, φ) della cavit`a, dV = r2 drdΩ = r2 drdφ sin(θ)dθ; ad un dato istante (diciamo, al tempo 0) l’elemento dV contiene l’energia u(ν, T )dνdV nell’intervallo di frequenze dν. Tale radiazione `e isotropa, cio`e `e fatta di onde che viaggiano con uguale intensit`a in tutte le direzioni. Una frazione di quell’energia arriver`a in dS ad un tempo t = rc . Visto da dV, l’elemento di superficie `e ridotto di un fattore cos(θ) e cos`ı occupa una frazione cos(θ) f dS = dS4πr della superficie sferica di raggio r. Nell’intervallo di tempo da 2 t = 0 a t = rc arrivano i contributi di tutti gli elementi dV fino a distanza r; per sommarli bisogna integrare: π2 2π ct drr2 dφ dθ sin(θ)f, dE = dS 0
0
0
con l’integrale su θ che copre il sottospazio sopra la superficie da cui proviene la radiazione. Poi bisogna dividere per t per avere l’energia che arriva in dS nell’unit` a di tempo. Viene in effetti 1 u(ν, T )dS c dE(ν, T ) = c 2π d cos(θ) cos(θ) = u(ν, T )dS. 4π 4 0 Il corpo nero ha svolto un ruolo cruciale nella crisi della fisica classica e nella scoperta dei quanti, come vedremo. Inoltre ha applicazioni nella misura della temperatura di forni (pirometro ottico) e di corpi celesti (il sole `e quasi nero; poi ci sono i buchi neri e il fondo di radiazione cosmica). Legge di Stefan - Boltzmann Consideriamo una cavit` a vuota di volume V con le pareti in equilibrio termico a temperatura T . La cavit` a non `e veramente vuota: non contiene atomi ma
5.1 Richiami di termodinamica
55
contiene radiazione elettromagnetica. Per la legge di Kirchoff le componenti spettrali della densit` a di energia u(ν, T ) sono legate al potere emissivo del corpo nero; quindi l’energia interna totale della radiazione contenuta in una cavit`a di volume V `e data da U = V u(T );
(5.15)
U = U (V, T ) non dipende unicamente dalla temperatura, come accade per il gas perfetto, ma anche dal volume. Tuttavia, la radiazione preme sulle pareti come farebbe un gas. Dall’elettromagnetismo `e noto che la pressione di radiazione P `e legata alla densit` a di energia u da P =
u . 3
(5.16)
Possiamo fare un esperimento in cui la cavit`a `e munita di un pistone senza attrito a contatto con la sorgente a temperatura T e la radiazione viene usata come un fluido per fare un ciclo di Carnot reversibile. Le quattro fasi sono: - espansione isoterma V → V + ∆V a temperatura T . L’energia interna aumenta di u∆V e viene fatto il lavoro P ∆V ; pertanto dalla sorgente a temperatura T viene estratto il calore Q = (P + u)∆V ; - espansione adiabatica ( cavit` a e pistone vengono termicamente isolati) V + ∆V → V + ∆V + dV con dV infinitesimo. Il sistema compie lavoro a spese della sua energia interna e la temperatura scende a T − dT e la pressione a P − dP con dP = dP dT dT ; - compressione isoterma con cavit`a e pistone a contatto con la sorgente a temperatura T − dT . Il volume scende da V + ∆V + dV fino a incrociare l’adiabatica che passa per lo stato iniziale; a meno di infinitesimi la diminuzione di volume `e ∆V . Pertanto alla sorgente a temperatura T − dT viene ceduto il calore Q = [(P − dP ) + u] ∆V ; - compressione adiabatica infinitesima fino a chiudere il ciclo. A meno di infinitesimi di ordine superiore il lavoro fatto nel ciclo `e dW = dP ∆V dP dT dP ∆V ; il rendimento `e η dW Q = (P +u)∆V = dT P +u . Ma il secondo principio dice che il rendimento deve essere dT T . Quindi, dP P +u = . dT T Combinando con la (5.16) ed integrando, si trova u = aT 4 , che `e la legge di Stefan-Boltzmann. Un corpo caldo `e in equilibrio con una densit` a di energia raggiante che cresce con la quarta potenza della temperatura; questo `e anche l’andamento della potenza irraggiata in assenza di equilibrio,
56
5 Meccanica statistica ed equilibrio termodinamico
quando il corpo si raffredda per irraggiamento. Stefan ha ottenuto il risultato sperimentalmente. La teoria `e stata formulata da Boltzmann3 nel 1884; la costante a `e rimasta a lungo un parametro empirico. Finalmente `e stato possibile determinare anche a con l’avvento della meccanica quantistica. ` ovvio che pi` Le stelle emettono la loro energia per irraggiamento. E u sono calde e pi` u energia irraggiano per unit` a di tempo; ma l’aumento `e velocissimo: raddoppiando T , l’energia irraggiata cresce di un fattore 16. Problema 13. La radiazione di corpo nero possiede anche entropia. Calcolare ∂S ∂2S ∂S )T e ( ∂T )V e calcolare le derivate seconde miste ( ∂T ( ∂V ∂V ). Soluzione 13. Poich´e S `e una funzione di stato, dS =
δQ dU + P dV = . T T
Dalla (5.15), ∂u dT. ∂T Inserendo anche la (5.16), si ottiene la variazione di entropia dU = u(T )dV + V
4 3 udV
dS =
+V T
∂u ∂T dT
.
(5.17)
∂S ∂S Dalla (5.17), dS = ( ∂V )dV + ( ∂T )dT dove
(
∂S 4u )= , ∂V 3T
mentre
V ∂u ∂S )= . ∂T T ∂T Per il secondo principio, dS deve essere esatto, quindi le derivate miste sono uguali: ∂ ∂S ∂ ∂S ( ) ( ). ∂T ∂V ∂V ∂T Viene 4 ∂u 4 u 1 ∂u − , = 2 3T ∂T 3T T ∂T cio`e u ∂u =4 , ∂T T da cui si pu` o ricavare di nuovo la legge di Stefan-Boltzmann. (
3
Nato 1844 a Vienna, Austria, morto suicida nel 1906 a Duino (vicino Trieste), Austria (ora Italia) fu insieme a Gibbs l’artefice della meccanica statistica.
5.2 Scopo della meccanica statistica
57
5.2 Scopo della meccanica statistica L’esito di molti esperimenti compiuti su corpi macroscopici dipende dallo stato termico. L’interpretazione teorica di questi esperimenti in termini microscopici `e oggetto della meccanica statistica, che, a differenza della Termodinamica, presuppone la conoscenza delle interazioni fra i componenti microscopici del sistema e quindi dell’Hamiltoniana H(p, q). Oltre a questa, si suppone di conoscere certi parametri che determinano il sistema dal punto di vista macroscopico, quali pressione, temperatura, numero di molecole per ogni specie, etc.. Quanto al genere di misure considerato, esse sono le pi` u varie. Possono essere misure macroscopiche, come quella della pressione di un gas in funzione della temperatura o il suo calore specifico, ma tutte le spettroscopie, comprese quelle atte a determinare propriet` a microscopiche dei solidi, risentono degli effetti termici e vanno interpretate con la meccanica statistica. Ad esempio, Zartmann in un famoso esperimento misur`o la distribuzione di velocit` a delle molecole di un gas. Il gas `e contenuto in un tubo; un forellino in fondo al tubo viene aperto per un tempo brevissimo e le molecole fuoriescono con la velocit` a che avevano nel gas. Il fascio molecolare cos`ı prodotto viene fatto incidere su una ruota che gira velocemente, e le molecole arrivano in punto diversi a seconda del tempo di volo. Cos`ı si misura la distribuzione in velocit`a, che si pu` o convertire in distribuzione in energia; risulta una distribuzione a campana asimmetrica il cui massimo si sposta a energie pi` u alte aumentando la temperatura. In questo modo Zartmann verific`o la legge stabilita teoricamente da Maxwell4 (in notazione ovvia) 2 1 − √ dN = N √ e KB T d. 3/2 π (KB T )
(5.18)
Ricaveremo questa legge nella Sezione 5.5. Qui la sorte della singola molecola non interessa, dato che in una mole ce ne sono ben NA ∼ 6 ∗ 1023 . Evidentemente il grosso delle molecole ha u energia cinetica dell’ordine di KB T anche se ce ne sono anche di molto pi` lente e di molto pi` u veloci. Qualsiasi misura macroscopica di una grandezza funzione f (p, q) di tutte le coordinate da cui dipende H determina in realt` a un suo valor medio f¯; lo stato microscopico del sistema non `e n`e misurabile n`e interessante. Di conseguenza, non si pu`o seriamente pensare di calcolare l’evoluzione del sistema risolvendo le equazioni canoniche. A cosa pu` o servire, allora l’hamiltoniana? A questo ci ha pensato Gibbs.5
4 5
√ ∞ √ −x Notare che 0 xe dx = 2π e quindi dN = N . Il grande teorico Josiah Willard Gibbs nacque a New Haven, Connecticut, 1839 e mor`ı a Yale nel 1903. Fu il primo professore di fisica matematica negli U.S.A.
58
5 Meccanica statistica ed equilibrio termodinamico
xe−x
5.3 Medie di Gibbs Uno pu` o schematizzare un sistema macroscopico come un sistema meccanico; lo spazio delle fasi o spazio Γ ha come coordinate l’insieme delle s coordinate e degli s momenti q1 , q2 , . . . , qs , p1 , p2 , . . . , ps che entrano nell’hamiltoniana. Uno stato microscopico del sistema `e rappresentato da un punto dello spazio delle fasi. Anche se s `e grande, uno pu` o immaginare la traiettoria dei questo punto, descritta dalle equazioni di Hamilton. Un fatto empirico importantissimo `e che il risultato dell’esperimento non dipende affatto dallo stato microscopico che il sistema ha in un dato istante. Ci sono solo delle piccole fluttuazioni caotiche su un comportamento medio regolare. Si consideri una misura fatta in condizioni di equilibrio. Dopo la misura, uno pu` o perturbare il sistema in qualsiasi modo e poi lasciarlo tornare all’equilibrio termico. Se poi si ripete la misura, si ritrovano i risultati di prima della perturbazione. Determinare ∼ NA condizioni iniziali sarebbe impossibile e poi non potremmo mai risolvere le equazioni del moto. Ma anche se disponessimo di sovrumane capacit` a di misura e di calcolo non dovremmo sprecarle in quella maniera. Risolte le equazioni del moto a partire da certe condizioni iniziali supposte note, si dovrebbe procedere al calcolo di una media temporale f (p, q) =
1 T
T
f (p, q)dpdq, T → ∞ 0
arrivando cos`ı alla conclusione che f¯ `e indipendente dalle condizioni iniziali. Con la media temporale perderemmo quasi tutta l’informazione ottenuta con un formidabile lavoro di misure e calcoli, che si rivelerebbero irrilevanti per il problema.
5.3 Medie di Gibbs
59
` evidente quindi che in meccanica statistica non si deve fare uso di condiE zioni iniziali, visto che il sistema si evolve spontaneamente verso l’equilibrio 6 con certi suoi tempi caratteristici. Basta quindi che i tempi dell’esperimento siano lunghi rispetto a quelli caratteristici perch´e il sistema sia osservato in equilibrio. L’approccio fondamentale della meccanica statistica `e dovuto al fisico americano J.W. Gibbs, ed il principio base `e semplicissimo: L’ipotesi fondamentale della meccanica statistica `e: se un sistema in equilibrio termico ha energia E, tutti gli stati microscopici di energia E sono ugualmente probabili. Quello che interessa non `e l’evoluzione temporale del sistema, ma la probabilit` a a priori dP che un sistema caratterizzato da H e dagli altri parametri macroscopici si trovi in un certo stato microscopico, e cio`e dP = ρ(p, q)dΓ,
(5.19)
s
dove dΓ = i dpi dqi `e l’elemento di volume dello spazio delle fasi o spazio Γ del sistema e ρ si chiama funzione di distribuzione. Trattandosi di una probabilit` a, deve essere normalizzata a 1, cio`e ρ(p, q)dΓ = 1. spazio Γ
Allora,
f¯ =
f (p, q)ρ(p, q)dΓ.
Tutti gli stati microscopici sono equiprobabili a priori e che tutte le regioni dello spazio delle fasi compatibili con i parametri macroscopici devono essere trattate in ugual modo; il ruolo di H(p, q) `e quello di determinare ρ(p, q) che stabilisce la probabilit` a di ogni elemento di volume dello spazio Γ. Questa schematizzazione della realt`a fisica `e cos`ı valida da essere considerata oggi il fondamento della meccanica statistica. Un altro modo di dire la stessa cosa `e che uno considera un insieme o ensemble di sistemi caratterizzati da H e dagli stessi parametri macroscopici di quello in studio; questi sono distribuiti nello spazio delle fasi con densit`a ρ(p, q); la media statistica si fa su questo ensemble. Corrisponde effettivamente la probabilit` a a priori nell’ensemble con la frazione del tempo che un dato sistema passa nell’intorno di un dato stato microscopico? Questo `e il famoso problema ergodico. Da un punto di vista fisico, va benissimo considerare questo come un postulato che conduce all’accordo con l’esperimento, da un punto di vista formale si tratta di una questione delicatissima. 6
Se il sistema `e l’Universo intero `e chiaro che non si trova in equilibrio termico; in questo caso chi pu` o dire se evolver` a verso l’equilibrio?
60
5 Meccanica statistica ed equilibrio termodinamico
Cenno ai teoremi di Liouville La teoria di Gibbs ha le carte in regola dal punto di vista matematico e resta valida se si cambiano coordinate lagrangiane (trasformazione puntuale (p, q) → (P, Q)), altrimenti non staremmo a parlarne. In altri termini, f¯ =
f (P, Q)ρ(P, Q)
s (
dPi dQi =
f (p, q)ρ(p, q)
i
s (
dpi dqi .
i
Questo richiede che il Jacobiano sia 1, cio`e ∂(Q, P ) ∂(q, p) =1= . ∂(q, p) ∂(Q, P ) Nel caso di un solo grado di libert` a, ⎛ ∂Q ∂q ∂(Q, P ) = Det ⎝ ∂P ∂(q, p) ∂q
∂Q ∂p ∂P ∂p
⎞ ⎠ = {Q, P } = 1
per l’invarianza delle parentesi di Poisson. Liouville ha dimostrato che questo resta vero in presenza di molti gradi di libert` a; il teorema ha la conseguenza che dqdp = dQdP, cio`e l’estensione di qualsiasi volume dello spazio delle fasi si conserva nell’evoluzione. Inoltre lungo il moto dρ = 0, dt cio`e ρ dipende solo dalle costanti del moto, e un ensemble si comporta come un fluido incompressibile. Tralascio la dimostrazione, che si trova sui testi di Istituzioni di Fisica Teorica.
5.4 Ensemble Microcanonico Determiniamo la funzione di distribuzione ρ(p, q) (densit` a di probabilit` a nello spazio Γ ) per un sistema isolato. Le medie si prenderanno su un insieme di sistemi aventi tutti gli stessi parametri macroscopici, ma resta allo sperimentatore (ed al teorico) la libert` a di scegliere le condizioni dell’esperimento. Dato che l’energia `e una costante del moto, possiamo caratterizzare il sistema con la sua energia E0 ed `e concettualmente semplice considerare un ensemble tutto a quella energia. Si tratta di una energia macroscopica che, come la massa e tutte le altre grandezze, non pu`o essere definita con precisione microscopica, a causa degli errori sperimentali e delle fluttuazioni. L’energia `e definita con una
5.4 Ensemble Microcanonico
61
incertezza δE; certo questa deve essere cos`ı piccola che aggiungerla o toglierla non modifica apprezzabilmente l’esperimento. Poich´e i risultati che cerchiamo non dipendono da δE, non occorre specificare oltre quanto vale. Le medie statistiche devono essere fatte su un ensemble o insieme microcanonico i cui punti rappresentativi sono distribuiti uniformenente nell’intercapedine dΩ fra le ipersuperfici H = E0 e H = E0 + δE. Perveniamo cos`ı alla distribuzione microcanonica δ(H(p, q) − E0 ) ρmicro (p, q) = , ω(E0 ) = dΓ δ(H(p, q) − E0 ). ω(E0 ) Qui ω(E0 ) `e la misura della superficie isoenergetica: ρ(p, q) `e normalizzata a 1. Tutte le parti della ipersuperficie dello spazio delle fasi con E = E0 hanno uguale propriet` a a priori. Torniamo all’espansione irreversibile di un gas studiata nella Sezione 5.1 dal punto di vista termodinamico. Nello spazio delle fasi del gas vi sono punti rappesentativi che corrispondono ad avere tutte le molecole in A, e questi punti formeranno una regione dello spazio Γ . Noi non discriminiamo questa regione in nessun modo a priori. Immaginiamo per` o con Boltzmann di mettere le molecole nel gas una alla volta, a caso. La probabilit` a che la prima capiti in A A N , e cos`ı per la seconda; la probabilit` a che tutte finiscano in A `e ( VVB ) . A `e VVB VA 1 23 a `e data da 10 elevato a circa −3 ∗ 10 22 Cos`ı se VB 2 e N = 10 la probabilit` e quindi `e 0 a tutti gli effetti fisici. Boltzmann generalizz` o questo concetto pensando lo spazio Γ diviso in cellette di volume δΓ . Ogni celletta fissa una complessione del sistema, cio`e assegna tutti i q ed i p con una piccola incertezza; infatti, le cellette sono finite ma cos`ı piccole che in ciascuna di loro q e p possono essere considerate costanti.7 Poich´e q × p ha le dimensioni di una azione, una volta scelto un certo quanto di azione h il volume della celletta `e hs , dove s `e il numero dei gradi di libert` a. Tenere le celle finite ha uno scopo ben preciso: `e un artificio per assegnare a ogni volume dello spazio Γ un numero, cio`e una misura. Sia Ωtot (E) il volume del dominio dello spazio Γ dove l’energia del sistema `e compresa fra 0 ed E; dividendolo per hs si trover`a un numero enorme ma finito di complessioni, Ωtot (E) Wtot (E) = hs che costituisce la misura di Ωtot (E). Tuttavia gli stati microscopici in Ωtot (E) corrispondono ad un gran numero di stati molto diversi anche macroscopicamente. In realt`a ci interessa contare quanti stati microscopici diversi (qui schematizzati dalle complessioni) corrispondono ad un solo stato macroscopico ` come se avessimo diviso del sistema con data pressione, temperatura, etc.. E 7
Oggi `e normale discretizzare i problemi per fare approssimazioni numeriche. Inoltre, sappiamo che il quanto d’azione `e la costante di Planck. Boltzmann era molto in anticipo sui tempi quando inventava questa schematizzazione, che forzava lo schema classico.
62
5 Meccanica statistica ed equilibrio termodinamico
idealmente la Terra in mm3 ma fossimo interessati a misurare non il volume della Terra ma l’area della superficie terrestre. Basterebbe contare di quanto aumenta il volume incrementando il raggio di 1 mm. Anche nello spazio delle fasi, ad un piccolo incremento δE dell’energia corrisponde una intercapedine di volume δΩtot (E0 ) che contiene un certo numero W (E0 ) di cellette. W `e il numero di complessioni microscopiche che corrispondono tutte ad un solo stato macroscopico del sistema, di energia E. Notiamo che W `e legato alla misura della superficie isoenergetica da ∂Ωtot s W (E0 )h = δΩtot = (5.20) δE = ω(E0 )δE. ∂E Il succo della questione `e che il numero W di complessioni microscopiche che corrispondono ad uno stato macroscopico `e proporzionale alla misura della ipersuperficie isoenergetica e si ottiene da W =
∂Wtot δE. ∂E
(5.21)
Notare che δE non `e infinitesimo, ed anzi W `e un numero grande: δE deve essere piccolo solo nel senso che dΩ ∼ ωδE e nel senso che non deve alterare apprezzabilmente le condizioni macroscopiche. In questo modo, W `e definito a meno di una costante moltiplicativa δE che non deve avere significato fisico. D’altra parte cambiando il valore di h la possiamo modificare a piacimento. (In realt` a la Natura stabilisce una scala per h, la costante di Planck, che Boltzmann ignorava e che incontreremo pi` u avanti.) Ora possiamo confrontare due ipotetici stati macroscopici di un sistema, ambedue compatibili coi parametri macroscopici assegnati (ad esempio energia e volume); per esempio, lo stato con il gas che occupa tutto il volume disponibile e lo stato in cui il gas sta solo da una parte della partizione. Se calcoliamo W nei due casi avremo risultati diversi. W `e il numero di modi in cui uno stato macroscopico si pu` o realizzare; pi` u modi ci sono pi` u lo stato `e probabile. Ci si deve aspettare che gli stati di maggior W siano stati pi` u vicini all’equilibrio, perch´e `e irragionevole che il sistema abbandoni definitivamente una situazione probabile per una improbabile. Ma gli stati di equilibrio sono quelli con S massimo. Questo sugger`ı a Boltzmann che dovesse esserci un legame funzionale del tipo S = f (W ). Ma l’entropia `e estensiva: se un sistema `e composto da due parti indipendenti, la sua entropia `e la somma delle entropie S = S1 + S2 , mentre W = W1 W2 . Cos`ı, f si determina imponendo che un sistema composto di due parti indipendenti abbia la somma delle loro entropie, mentre W deve essere il prodotto dei loro numeri di complessioni; pertanto, f (xy) = f (x) + f (y).
5.4 Ensemble Microcanonico
63
Questa equazione `e risolta dal logaritmo, e cos`ı Boltzmann propose la celebre equazione S = KB log W (5.22) che fornisce una interpretazione statistica all’entropia e ne `e anche la definizione microcanonica. Si noti che se si cambiano h o δE, log W cambia solo per una costante additiva, come in termodinamica, ma S `e una funzione di stato. L’entropia misura la nostra ignoranza dello stato microscopico del sistema. Solo allo zero assoluto il sistema dovr`a trovarsi nello stato di energia pi` u bassa, ed allora S = 0, in accordo col terzo principio. Possiamo anche affermare che S misura il grado di disordine. 5.4.1 Entropia del Gas perfetto e paradosso di Gibbs Per un gas di N atomi di massa m, H=
N p2i . 2m i
Per calcolare S con le (5.22), (5.20) bisogna prima calcolare il numero di cellette di volume h3N nel dominio nello spazio Γ dove l’energia del sistema va da 0 a E. Questo dominio ha una proiezione sullo spazio di coordinate q1 · · · q3N che possiamo prendere come un ipercubo di lato V 1/3 dove V `e il volume del gas; la proiezione sullo spazio di coordinate p1 · · · p3N `e una ipersfera, e quindi . ( N N 1 3 3 2 d pj d qj θ 2mE − pi . Wtot (E) = 3N h j i L’integrazione sui q fornisce V N e rimane Wtot (E) =
V h3
N
√ Ω3N ( 2mE),
dove Ω3N (R) `e il volume di una ipersfera di raggio R in 3N dimensioni, che abbiamo gi` a calcolato nella (3.11) π 3N/2 Ω3N (R) = 3N RN . 2 ! Di conseguenza, Wtot (E) viene 3N
Ωtot (E) π 2 Wtot (E) ≡ h3N ( 3N 2 )!
V h3
N (2mE)
3N 2
N V 1 3/2 = 3 (2πmE) . ( 2 N )! h3 (5.23)
64
5 Meccanica statistica ed equilibrio termodinamico
Quindi,
V 3N 3/2 log(Wtot (E)) = N log 3 (2πmE) )!] − log[( h 2
La formula di Stirling permette di approssimare il risultato: 4πm E 3 3 ln Wtot = N log V ( 2 ) 2 + N. 3h N 2
(5.24)
Secondo le (5.22), (5.20), (5.21) per calcolare S dobbiamo prendere il tot logaritmo di W = ∂W ∂E . La (5.23) dice che Wtot (E)costante × E
3N 2
⇒ W (E)
3N ∂Wtot = Wtot . ∂E 2E
Quindi log W (E) = log Wtot + log N + costante. Ricordando le (5.20,5.21), questa relazione ha il significato geometrico di esprimere in termini del volume dell’ipersfera Ω(E) la sua area iper-superficiale ω(E). Per la (5.24), il logaritmo di Wtot (E) per N grande `e dominato da termini in N ln N e termini lineari in N ; il fattore necessario per passare da Ω(E) a ω(E) invece d` a un contributo logaritmico. Il logaritmo diverge anche lui per N → ∞, ma molto pi` u lentamente dei termini dominanti; cos`ı nel limite termodinamico `e trascurabile, per non parlare di δE che `e solo una trascurabilissima costante. Insomma, log ω(E) e log Ωtot sono uguali nel limite termodinamico N → ∞. Tanto vale8 prendere Ω(E) invece di ω(E)δE Cos`ı, si arriva a 4πm E 3 3 S 2 ) + N. = log Wtot (E) = N log V ( 2 KB 3h N 2 Questo risultato `e apparentemente in accordo con la (5.13), se E ∝ N K B T, ma i problemi non sono finiti. Il paradosso Gibbs not` o che questo calcolo onesto, fatto secondo le regole note a quel tempo, d` a un risultato in realt` a paradossale ed inaccettabile. Infatti il risultato non `e estensivo, come dovrebbe. In altri termini, se prendiamo un gas omogeneo e lo dividiamo in 2 in modo che ogni met`a abbia N2 molecole nel volume V a. Questo problema nella 2 , S non viene la somma delle entropie delle due met` (5.13) `e per cos`ı dire nascosto dalle costanti di integrazione, ma semplicemente distrugge la possibilit`a di interpretare S come entropia. Non c’`e modo di 8
Questo pu` o apparire strano perch´e, in 3 dimensioni, corrisponde a prendere il volume della Terra come definizione del volume della crosta terrestre. Quando le dimensioni sono 3N 3, l’idea non `e pi` u cos`ı stravagante. Per N grande le ipersfere sono, per cos`ı dire, tutta ipersuperficie!
5.5 Ensemble Canonico
65
aggiustare i conti con una operazione solo cosmetica, ma occorre una nuova e rivoluzionaria idea fisica. Per evitare il disastro, Gibbs propose che lo spazio delle fasi da attribuire ad un sistema di N particelle identiche non fosse Ω(E), ma Ω(E) N ! . In questo modo,9 tutte le complessioni microscopiche che differiscono solo per lo scambio di due delle N particelle vengono identificate. Questo `e in contrasto con tutto l’impianto della teoria classica, in cui si supponeva sempre possibile almeno in linea di principio marcare due particelle e seguirle nelle loro evoluzioni. Secondo Gibbs vanno trattate come particelle identiche. Allora, S → S − log N ! ∼ S − (N log N − N ) = S − N log( Ne ) = S + N log( Ne ), dove e `e la base dei logaritmi naturali. Cos`ı si ottiene il risultato additivo eV 4πm E 3 3 S ( 2 ) 2 + N. = log Ω(E) = N log KB N 3h N 2 Quella di Gibbs fu una soluzione veramente geniale; ha anticipato la meccanica quantistica.
5.5 Ensemble Canonico L’insieme microcanonico `e semplice concettualmente ma non `e il pi` u conveniente, anche perch´e `e difficile che gli esperimenti si facciano su sistemi perfettamente isolati. Nell’Ensemble Canonico il sistema definito da H(p, q) `e in contatto con un grande bagno termico. Il sistema pu`o essere macroscopico ma pu` o anche essere una singola molecola di un gas. L’interazione col bagno `e necessaria per fissare T , ma deve essere abbastanza piccola da consentire al sistema di mantenere una sua individualit` a ed a noi di discuterlo in termini dei suoi (p, q). Come si vede la cosa `e un po’ delicata concettualmente; per` o la teoria funziona molto bene. 5.5.1 Temperatura Se un corpo in equilibrio con un bagno termico a temperatura T, la sue energia interna fluttua per piccoli scambi di energia termica dE = δQ col bagno, e fluttua anche l’entropia perch´e dS = δQ T . Questo suggerisce di definire la temperatura nell’insieme canonico ponendo ∂S 1 =( ); T ∂E
(5.25)
questa definizione `e coerente con la (5.6) e col secondo principio. Possiamo convincerci della (5.25) con un semplice argomento fisico. Supponiamo che un sistema sia costituito da due parti in equilibrio, grazie ad una debole interazione, che permette scambi di energia: 9
N ! `e il numero di permutazioni di N oggetti.
66
5 Meccanica statistica ed equilibrio termodinamico
H ∼ H1 + H2 , dΓ = dΓ1 dΓ2 . Esse non hanno energia definita e non possono essere descritte dall’insieme microcanonico, ma devono avere in comune la temperatura. L’entropia del sistema isolato complessivo (corpo + bagno) deve essere massima all’equilibrio; rispetto a piccoli scambi di energia, tali che dE1 + dE2 = 0, deve aversi dS = (
∂S1 ∂S2 )dE1 + ( )dE2 = 0; ∂E1 ∂E2
si conclude che la condizione di equilibrio `e (
∂S1 ∂S2 )=( ). ∂E1 ∂E2
Questo risultato indica che possiamo quindi definire la temperatura secondo la (5.25).
5.6 Distribuzione canonica Nell’Ensemble Canonico l’energia non `e fissata e dobbiamo cercare un’altra ` fisicamente evidente che le eventuali interazioni del distribuzione ρ(p, q). E bagno con altri sistemi non hanno importanza se il bagno `e grande. Possiamo schematizzare la situazione come segue: il sistema in studio S ed il bagno B formano un sistema complessivo C di hamiltioniana HC ∼ HS + HB ; consideriamo C isolato e gli assegnamo energia EC fissata in modo da fare le medie su C con l’insieme microcanonico. L’elemento del suo spazio delle fasi a di trovare C in dΓC `e `e dΓC = dΓS dΓB e la probabilit` dPC =
δ(HB + HS − EC ) dΓB dΓS . δ(HB + HS − EC )dΓC
Si noti che il denominatore dipende solo dall’energia costante EC e pu` o essere sostituito da una costante moltiplicativa Cost. Per ogni complessione di S ce a che S e sono molte di B tali che l’energia complessiva sia EC . La probabilit` sia in dΓS indipendentemente da dove si trova B nel suo spazio Γ si ottiene integrando su dΓB : dPS = Cost dΓS δ(HB + HS − EC )dΓB . L’integrale `e la misura della ipersuperficie dello spazio delle fasi che `e accessibile a B essendo l’energia di C fissata. Ma lo stesso integrale appare nella definizione dell’entropia microcanonica di B isolato: dΓB (5.26) SB (E) = KB log(WB (E)) = KB log[δE δ(HB − E) s(B) ], h
5.6 Distribuzione canonica
67
dove s(B) `e il numero di gradi di libert` a del bagno e E = EC − HS . Qui, δE aggiunge una costante all’entropia e pu` o essere ignorato. Esponenziando, dΓB SB (EKC −HS ) B . δ(HB − E) s(B) e h Poich´e il bagno `e enorme rispetto al sistema, possiamo espandere al primo ordine, ∂SB HS SB (EC − HS ) ∼ SB (EC ) − ∂E e tenendo conto della (5.25) SB (EC − HS ) ∼ SB (EC ) − Cos`ı si trova dPS = Ce
−
HS (p,q) KB T
HS . T
dΓS ≡ ρdΓS .
C’`e una nuova costante C che sar`a eliminata dalla condizione di normalizzazione (la condizione che la somma di tutte le probabilit` a `e 1); cos`ı potremo omettere i denominatori hs(B) che compaiono nella (5.26). −
HS (p,q)
La distribuzione canonica per S, cio`e per la molecola, `e ρ(p, q) = Ce KB T e non ha dimensioni; semplifichiamo la notazione con dΓ per dΓS (visto che B `e ormai eliminato) e con 1 . β= KB T Cos`ı ρ
e−βHS (p,q) . e−βHS (p,q) dΓ
(5.27)
Il denominatore ( necessario per assicurare che l’integrale di ρ sullo spazio Γ sia 1) `e la funzione di partizione, (5.28) Z = e−βHS (p,q) dΓ, che gioca un ruolo importante. La media canonica di una grandezza A(p, q) `e 1 e−βHS (p,q) A(p, q)dΓ, A= Z la media essendo fatta sulla singola molecola. Se il sistema descritto nell’ensemble canonico `e composto da due parti indipendenti, HS = H1 + H2 ,, allora ρρ1 ρ2 ed anche i sistemi parziali hanno la distribuzione canonica.
68
5 Meccanica statistica ed equilibrio termodinamico
5.6.1 Distribuzione di Maxwell Nel caso di un gas perfetto di volume V si pu` o prendere il gas come C mentre p2 un atomo `e S; allora H = 2m , dΓ = d3 xd3 p e quindi p2 dP = C exp − d3 xd3 p. 2mKB T 3 La probabilit` a che il sistema sia in d3 p si ottiene sostituendo d x con V . p2 3 Imponendo che la probabilit` a totale sia CV exp − 2mKB T d p = 1, dato ∞ 2 π che −∞ dxe−αx α,
CV =
1 . (2πmKB T )3/2
La distribuzione di velocit` a (pi → mvi ) viene quindi dP (v) = (
m 1 mv 2 )2/3 exp( )dvx dvy dvz . 2πKB T 2 KB T
Poniamo d3 v = v 2 dv sin θdθdφ ed integriamo sugli angoli: viene dP (v) = 4π(
1 mv 2 2 m )2/3 exp( )v dv. 2πKB T 2 KB T
La distribuzione in energia di Maxwell (5.18) si ottiene sostituendo 12 mv 2 = , / 1 d, moltiplicando per il numero N di molecole e semplificando: con dv = 2m risulta 2 1 − √ dN = N √ e KB T d. 3/2 π (KB T ) 5.6.2 Gas perfetto e statistica di Boltzmann ` utile ritrovare la distribuzione di Maxwell del gas perfetto per un’altra E via che permette di controllare direttamente che essa realizza il massimo della probabilit` a. Di nuovo, il gas `e il sistema C; otterremo la distribuzione canonica per la singola molecola (sistema S). Supponiamo di avere un sistema isolato (gas) di N >> 1 particelle indipendenti (gas perfetto) di energia totale E in equilibrio alla temperatura T . Possiamo misurare le energie delle singole particelle (o molecole) del gas e trovare che sono distribuite secondo una legge n(); il risultato dell’esperimento `e la distribuzione di Boltzmann. Teoricamente, noi possiamo ricavare la n() cercando la distribuzione pi` u probabile. L’ipotesi fondamentale della meccanica statistica `e: se un sistema di N particelle in equilibrio termico ha energia E, tutti gli stati microscopici di energia E sono ugualmente probabili. Quindi, la distribuzione di equilibrio `e quella che corrisponde al massimo numero di stati microscopici che la realizzano.
5.6 Distribuzione canonica
69
Preliminarmente ci dobbiamo chiedere quanti stati microscopici corrispondono ad un dato stato macroscopico. Per definire uno stato microscopico, discretizziamo l’energia della singola molecola dividendo l’asse in intervallini larghi ∆. Poich´e le molecole sono indipendenti fra loro, invece di pensare allo spazio Γ conviene lavorare nello spazio µ, cio`e nello spazio delle fasi della singola particella, le cui coordinate sono x, y, z, px , py , pz . Discretizziamo lo spazio µ dividendolo in celle di volume ∆x∆y∆z∆px ∆py ∆pz . Le celle devono essere cos`ı piccole da essere puntiformi da un punto di vista macroscopico; o considerare praticamente costante in una cella. Tuttavia le l’energia i si pu` celle devono essere pur sempre cos`ı grandi da contenere molte molecole. Dal momento che NA `e enorme le due esigenze sono verificate in molti casi. Come sono distribuite le molecole in queste celle? All’equilibrio regna la distribuzione ni = N ρ(i ), (5.29) normalizzata secondo la (5.19), cio`e ρ(i ) = 1.
(5.30)
i
Noi la cercheremo come la distribuzione pi` u probabile, nel senso seguente. Data una data distribuzione n1 , n2 , n3 . . ., con ni molecole nella cella iesima, ad essa corrisponder` a una probabilit` a proporzionale al numero di modi in cui si pu` o realizzare. Si tratta di trovare quanti sono gli stati microscopici distinti del gas che realizzano una data distribuzione, compatibilmente con le restrizioni ni = N e
i ni = E.
Le molecole sono considerate distinguibili, come se ognuna recasse una etichetta che la distingue dalle altre. Questa `e l’ipotesi naturale nella teoria classica, dato che a ben guardare non si vedono mai due oggetti assolutamente uguali. Nella teoria quantistica le cose andranno altrimenti; ma adesso lo scambio delle coordinate (p, q) due molecole nello spazio µ porta da una realizzazione della distribuzione ad un’altra distinta. Il numero dei modi10 in cui si possono scegliere n1 particelle da mettere nella prima cella `e N ; n1 fatto questo, rimangono N − n1 molecole da sistemare e dobbiamo sceglierne n2 per la seconda cella. Una distribuzione n1 , n2 , n3 . . . si realizza in 10
N N! = n!(N−n)! `e il numero di modi di scegliere n oggetti fra N , n senza riguardo all’ordine degli oggetti selezionati.
` noto che E
70
5 Meccanica statistica ed equilibrio termodinamico
W =
N n1
N − n1 n2
N − n1 − n2 n3
...
(5.31)
modi diversi; qui avviene una colossale semplificazione poich´e N − n1 N − n1 − n2 N n2 n3 n1 (N − n1 )! (N − n1 − n2 )! N! ...... n1 !(N − n1 )! n2 !(N − n1 − n2 )! n3 !(N − n1 − n2 − n3 )! N! = n1 !n2 !n3 ! . . .
=
e quindi N! W = . r nr !
(5.32)
Dal momento che il logaritmo `e monotono crescente, possiamo scegliere di massimizzare log(W ) utilizzando la formula di Stirling (vedi Appendice 1) ln W ≈ N ln N − %$ N − ni ln ni + ni = N ln N − ni ln ni . (5.33) % $ Ecco l’entropia del gas S = ln W ≈ N ln N − %$ N − ni ln ni + ni = N ln N − ni ln ni KB % $ (5.34) espressa in termini delle (ancora incognite) popolazioni delle celle. Applicando il metodo di Lagrange della Sezione 16.2.1 imponiamo l’annullarsi di ∂ − ni ln ni − γ ni − β i ni , ∂nr dove β, γ sono moltiplicatori; risulta − ln nr − 1 − γ − βr = 0, cio`e
nr = e−α e−βr .
con α = 1+γ, β = KB1 T . Cos`ı abbiamo ritrovato la distribuzione di Boltzmann comprendendone meglio il significato. Il parametro α `e fissato dalla (5.30). Quanto all’entropia, mettendo le (5.29), (5.30) nella (5.34): S = N log N − N ρ(r ) log(N ρ(r )) − N ρ(r ) log(ρ(r )). KB r r Cos`ı l’entropia per molecola `e pari a
5.6 Distribuzione canonica
71
Sm ρ(r ) log(ρ(r )). =− KB r Questo metodo di Boltzmann (lavorare suddividendo lo spazio Γ in celle discrete) pu` o essere usato in generale e suggerisce una notazione discreta pi` u snella, con cui scrivere le medie canoniche (ma il significato `e lo stesso di prima). La funzione di distribuzione per la molecola diventa ρ(r ) = la funzione di partizione `e Z=
e−βr ; Z e−βi ,
(5.35)
i
sommando sulle celle, e la media canonica di una grandezza A `e A=
1 −βi e A(i). Z i
Problema 14. Un mini-gas di 10 molecole ha a disposizione 4 stati (o celle) di energia 0, , 2., 3., rispettivamente, e la sua energia `e E = 14. Sia n k il numero di molecole nella cella di energia k. Qual’`e il valore pi` u probabile di n0 ? Soluzione 14. Ci sono le seguenti 18 possibilit` a, denotate dalle occupazioni delle singole celle: ((0, 6, 4, 0), (0, 7, 2, 1), (0, 8, 0, 2), (1, 4, 5, 0), (1, 5, 3, 1), (1, 6, 1, 2), (2, 2, 6, 0), (2, 3, 4, 1), (2, 4, 2, 2), (2, 5, 0, 3), (3, 0, 7, 0), (3, 1, 5, 1), (3, 2, 3, 2), (3, 3, 1, 3), (4, 0, 4, 2), (4, 1, 2, 3), (4, 2, 0, 4), (5, 0, 1, 4)). La massima probabilit` a si ha per n0 = 2 e per n0 = 3. 5.6.3 Grandezze termodinamiche nell’insieme canonico L’energia interna U della termodinamica viene identificata con la media dell’energia, quindi con U = N HS , dove il fattore N viene dalla somma sulle molecole, ma si ricava anche da Z, perch´e ∂ ln(Z) 1 ∂Z − . (5.36) H =− Z ∂β ∂β L’esempio del gas perfetto suggerisce di definire l’entropia per molecola Sm =− ρ(r ) log(ρ(r )), KB r
72
5 Meccanica statistica ed equilibrio termodinamico
mentre per il gas S = N Sm . La distribuzione canonica (5.27), nella notazione discreta, fornisce U Sm ρ(r )[−βr + log(Z)] = =− + log(Z). KB KB T r
(5.37)
In vista della (5.7) F = U − T S, bisogna allora porre F = −KB T ln(Z). Inoltre, combinando la (5.37) con la (5.36), si trova Sm = − e con la sostituzione
1 ∂ log(Z) + KB log(Z) T ∂β
1 ∂ ∂ =− , ∂β KB β 2 ∂T
viene Sm = K B T
∂ log(Z) + KB log(Z) ∂T
cio`e
∂ ∂F (V, T ) [KB T ln(Z)] = −( )V , (5.38) ∂T ∂T in accordo con la (5.8); richiamando la (5.9), `e ora facile ottenere la pressione Sm =
P = −(
∂F )T . ∂V
(5.39)
In conclusione, dalla funzione di partizione si calcolano tutte le grandezze termodinamiche. Problema 15. Per il gas perfetto monoatomico, calcolare la funzione di partizione e ricavare energia interna, entropia e pressione. p2 ]= Soluzione 15. Usando un integrale in Appendice 1, Z = h13 d3 pd3 exp[− 2mK BT 1 h3 V
3
∂ (2πmKB T ) 2 . Quindi l’energia interna del gas viene U = −N ∂β log Z =
3 2 N KB T .
Dalla (5.37)
Sm KB
3 2
bT ) = log( V (2πmK ), definita a meno di una coh3 3 2
BT ) stante additiva. F = −KB T log( V (2πmK . Infine, dalla (5.39), P = h3 KB T . V
5.6.4 Teorema di equipartizione dell’energia Se il sistema S `e un oscillatore armonico di hamiltoniana H(p, q) =
1 p2 + V (q), V (q) = mω 2 q 2 , 2m 2
5.6 Distribuzione canonica
73
`e immediato calcolare la media termica di V a temperatura T . Infatti, poich´e V (q) = si ha:
1 V = 2Z
1 ∂H q , 2 ∂q
∂H −βH 1 dqdpq e = ∂q 2Z
dqdp
q ∂ −βH e ; (−β) ∂q
integrando per parti su q, si trova −KB T ∂ V = dqdp{ (qe−βH ) − e−βH }; 2Z ∂q ma H → ∞ per q → ±∞ ed il primo contributo `e nullo; resta V =
KB T . 2
In modo del tutto analogo si ottiene per l’energia cinetica T =
KB T . 2
La cosa vale per ogni hamiltoniano che si possa scrivere come una somma di quadrati di coordinate e impulsi, come ad esempio sistemi di oscillatori; ogni q ed ogni p danno un contributo identico all’energia interna. Tradizionalmente a, cio`e per ogni si dice che c’`e un contributo KB2 T per ogni grado di libert` q e per ogni p. In questo modo si possono trattare vari sistemi interessanti come ad esempio le oscillazioni del campo elettromagnetico in una cavit`a o le vibrazioni di molecole e solidi. Esempio: gas perfetto monoatomico Ritroviamo automaticamente risultati gi`a noti. Essendo H=
N p2xi + p2yi + p2zi i
2m
l’energia interna vale U=
3 N KB T. 2
3 Il calore specifico a volume costante viene CV = ( ∂U ∂T )V = 2 N KB . Per una 3 mole di gas, N `e il numero di Avogadro e CV = 2 R, dove R = N KB `e la costante dei gas. Per quanto familiari, questi risultati non possono essere corretti a bassa temperatura; i calori specifici si annullano per T → 0 per il terzo principio della Termodinamica. In generale, la teoria classica fallisce alle basse temperature.
74
5 Meccanica statistica ed equilibrio termodinamico
Esempio: gas perfetto biatomico Nel caso di molecole biatomiche, se uno considera i soli gradi di libert` a traslazionali il risultato `e CV = 32 N KB . I gradi di libert` a rotazionali si possono descrivere aggiungendo ad H della singola molecola quella del rotatore rigido Hrot =
1 1 (P 2 + Pφ2 ). 2I θ sin2 θ
Data la dipendenza quadratica, il moto rotazionale fornisce un altro contributo uguale a R per una mole. Se poi si considera che il rotatore non `e rigido aggiungendo una hamiltoniana armonica si ha un altro contributo uguale a a non traslazionali sono R. Sperimentalmente, per H2 , tutti i gradi di libert` congelati a basse temperature. Riscaldando, si scongelano prima quelli rotazionali e poi quelli vibrazionali. La spiegazione `e possibile solo con la teoria quantistica. Legge di Dulong e Petit Einstein propose un modello delle vibrazioni di un solido in cui ognuno degli N atomi oscilla armonicamente intorno ad una posizione di equilibrio. Allora, H `e la somma di N oscillatori e classicamente uno si aspetta CV = 3R. Questo risultato `e in accordo con la legge di Dulong e Petit, che vale grosso modo intorno a temperatura di qualche centinaio di 0 K; a basse temperature CV crolla. La spiegazione `e possibile solo in termini quantistici, e fu data da Einstein per la prima volta (vedi Capitolo 13). Corpo nero e catastrofe ultravioletta Lo spettro u(ν) (densit` a di energia in funzione della frequenza) `e stato misurato sfruttando il legame con il potere emissivo. Ad ogni temperatura, i dati sperimentali forniscono un u(ν) a campana asimmetrica, che sale da 0 per ω = 0 ad un solo massimo e poi declina pi` u lentamente a 0 andando ad alta frequenza. Il massimo si sposta con la temperatura verso frequenze pi` u alte, cio`e nella direzione dall’infrarosso all’ultravioletto. La frequenza `e proporzionale a T (legge di Wien). Rayleigh e Jeans nel 1900 trattarono il problema come segue. In una grande cavit`a di volume V il numero di modi del campo elettromagnetico con data polarizzazione e vettore d’onda in d3 k `e dN = 2
V d3 k , (2π)3
→ − tenendo conto delle 2 polarizzazioni. Integriamo sugli angoli di k con Ω d3 k = 4πk 2 dk e sostituendoci |k| = ωc abbiamo d3 k = Ω
4πω 2 dω ; c3
5.6 Distribuzione canonica
75
in tutto, troviamo V k 2 dk ω 2 dw = V . π2 π 2 c3 Ogni modo `e un oscillatore armonico e secondo il teorema di equipartizione a di volume `e deve avere energia KB T . L’energia per unit` dN = 2
u(ω)dω
KB T ω 2 dω. π 2 c3
(5.40)
Questo risultato `e in ottimo accordo con l’esperimento nella regione delle basse frequenze (ben sotto il massimo) e questo `e un grande successo della teoria che abbiamo visto. Per`o al crescere di ω le cose vanno cos`ı disastrosamente che ogni fisico si riferisce a questo problema come alla catastrofe ultravioletta. Il teorema di equipartizione non si applica perch´e gli stati del campo non seguono la statistica di Boltzmann. Di nuovo, il problema `e profondo e la soluzione richiede la meccanica quantistica, che spiega in dettaglio la legge di Wien e fissa la costante di quella di Stefan-Boltzmann.
ex −1
Il lettore potrebbe chiedersi perch´e abbiamo dedicato tanta attenzione a questa teoria che poi si rivela sbagliata. La ragione `e che la sua formulazione si estende in modo naturale alla meccanica quantistica, ed a quel punto funziona perfettamente. Nel Capitolo 13 vedremo che la meccanica quantistica d` a la legge di Planck: 1 8π 2 hν 3 u(ν) = c3 e Khν BT − 1 dove h `e la costante di Planck e c `e la velocit`a della luce. Espandendo in serie 2 3 2πh2 ν 4 5 BT di potenze della frequenza, u(ν) = 8πν cK − 4πhν + 3c 3 3 K T + O(ν ) e la c3 B (5.40) `e il primo termine.
76
5 Meccanica statistica ed equilibrio termodinamico
5.7 Insieme grancanonico In molti problemi `e vantaggioso usare un ensemble pi` u generale di quello canonico in cui oltre all’energia il sistema S pu` o scambiare col bagno B anche particelle. Invece di fissare l’energia U = E come nel microcanonico, si fissa la temperatura T come nel canonico; invece di fissare il numero di particelle N come si fa sia nel microcanonico che nel canonico, si fissa il potenziale chimico µ. Ora tutti gli N sono posibili e lo spazio Γ `e l’unione di tutti quelli che ` questo spazio pi` descrivono il sistema con N definito. E u grande che va diviso in celle. Nella ricerca della distribuzione pi` u probabile si deve massimizzare W a parit` a di N e questo richiede un nuovo moltiplicatore di Lagrange che risulta essere µ. Si pu` o dimostrare che le cose funzionano come nel formalismo canonico, a con l’Hamiltoniana H(p, q) sostituita da H(p, q) − µN. Usando la notazione discreta, la funzione di partizione gran canonica `e e−β[i −µN ] . ZG = i
La media grancanonica di una grandezza A `e A=
1 −β[i −µN ] e A(i). ZG
L’energia interna si trova calcolando U−
∂ log ZG ∂β
in analogia con l’ensemble canonico, mentre il numero medio di molecole si ottiene da ∂ log ZG . N= ∂µβ
6 Teoria della Relativit` a
La teoria non dice affatto che tutto `e relativo. Infatti ogni osservatore pu` o fidarsi si quello che misura, senza tener conto di quello che misurano gli altri.
6.1 Il navilio di Galileo Galileo enunci` o per primo il principio di relativit` a usando il paragone di una nave con a bordo una stanza chiusa nella quale venivano fatti degli esperimenti. Con grande chiarezza ed efficacia egli rese evidente che senza guardare fuori non si poteva sapere se la nave era ferma o andava a velocit` a costante. Ecco un brano del Dialogo dei Massimi Sistemi, una immaginaria conversazione fra il veneziano Giovan Francesco Sagredo, il fiorentino Filippo Salviati, ` Salviati che parla, ilamici di Galileo, ed il filosofo aristotelico Simplicio. E lustrando quello che oggi si chiama un esperimento pensato (spesso indicato con gedankenexperiment, alla tedesca) che `e alla base del metodo galileiano come l’esperimento realizzato ed il calcolo.
. . . Riserratevi con qualche amico nella maggiore stanza che sia sotto coverta di alcun gran navilio, e quivi fate d’aver mosche, farfalle e simili animaletti volanti; siavi anco un gran vaso d’acqua, e dentrovi de’ pescetti; sospendasi anco in alto qualche secchiello, che a goccia a goccia vadia versando dell’acqua in un altro vaso di angusta bocca, che sia posto a basso: e stando ferma la nave, osservate diligentemente come quelli animaletti volanti con pari velocit` a vanno verso tutte le parti della stanza; i pesci si vedranno andar notando indifferentemente per tutti i versi; le stille cadenti entreranno tutte nel vaso sottoposto; e voi, gettando all’amico alcuna cosa, non pi` u gagliardamente la dovrete gettare verso quella parte che verso questa, quando le lontananze sieno eguali; e saltando voi, come si dice, a pi`e giunti, eguali spazii passerete verso
78
6 Teoria della Relativit` a
tutte le parti. Osservate che avrete diligentemente tutte queste cose, bench´e niun dubbio ci sia che mentre il vassello sta fermo non debbano succeder cos`ı, fate muover la nave con quanta si voglia velocit` a; ch´e (pur che il moto sia uniforme e non fluttuante in qua e in l` a) voi non riconoscerete una minima mutazione in tutti li nominati effetti, n`e da alcuno di quelli potrete comprender se la nave cammina o pure sta ferma: voi saltando passerete nel tavolato i medesimi spazii che prima, n`e, perch´e la nave si muova velocissimamente, farete maggior salti verso la poppa che verso la prua, bench´e, nel tempo che voi state in aria, il tavolato sottopostovi scorra verso la parte contraria al vostro salto; e gettando alcuna cosa al compagno, non con pi` u forza bisogner` a tirarla, per arrivarlo, se egli sar` a verso la prua e voi verso poppa, che se voi fuste situati per l’opposito; le gocciole cadranno come prima nel vaso inferiore, senza caderne pur una verso poppa, bench´e, mentre la gocciola `e per aria, la nave scorra molti palmi; i pesci nella lor acqua non con pi` u fatica noteranno verso la precedente che verso la sussequente parte del vaso, ma con pari agevolezza verranno al cibo posto su qualsivoglia luogo dell’orlo del vaso; e finalmente le farfalle e le mosche continueranno i lor voli indifferentemente verso tutte le parti, n`e mai accader` a che si riduchino verso la parete che riguarda la poppa, quasi che fussero stracche in tener dietro al veloce corso della nave, dalla quale per lungo tempo, trattenendosi per aria, saranno state separate; e se abbruciando alcuna lagrima d’incenso si far` a un poco di fumo, vedrassi ascender in alto ed a guisa di nugoletta trattenervisi, e indifferentemente muoversi non pi` u verso questa che quella parte. E di tutta questa corrispondenza d’effetti ne `e cagione l’esser il moto della nave comune a tutte le cose contenute in essa ed all’aria ancora, che per ci` o dissi io che si stesse sotto coverta; ch´e quando si stesse di sopra e nell’aria aperta e non seguace del corso della nave, differenze pi` u e men notabili si vedrebbero in alcuni de gli effetti nominati: e non `e dubbio che il fumo resterebbe in dietro, quanto l’aria stessa; le mosche parimente e le farfalle, impedite dall’aria, non potrebber seguir il moto della nave, quando da essa per spazio assai notabile si separassero; ma trattenendovisi vicine, perch´e la nave stessa, come di fabbrica anfrattuosa, porta seco parte dell’aria sua prossima, senza intoppo o fatica seguirebbon la nave, e per simil cagione veggiamo tal volta, nel correr la posta, le mosche importune e i tafani seguir i cavalli, volandogli ora in questa ed ora in quella parte del corpo; ma nelle gocciole cadenti pochissima sarebbe la differenza, e ne i salti e ne i proietti gravi, del tutto impercettibile.
Possiamo provare a riassumere, enunciando 3 principi: 1. esistono sistemi inerziali, tali cio`e che una particella libera si muove di moto rettilineo uniforme;
6.1 Il navilio di Galileo
79
2. dato un sistema inerziale, tutti i sistemi di riferimento che traslano rispetto ad esso con velocit` a costante senza ruotare sono anch’essi inerziali; 3. nessun esperimento pu` o distinguere un sistema inerziale da un altro, e le leggi della Fisica devono essere le stesse in tutti. Gli aristotelici da quasi 2000 anni insegnavano che esisteva uno stato di quiete assoluta, ma questi insegnamenti imposti con autorit`a non erano che opinioni sbagliate e fuorvianti. Consideriamo due sistemi di riferimento inerziali K e − r = (x, y, z) in K ed K ed un punto materiale P ; le coordinate di P siano → ` → − r = (x , y , z ) in K . E intuitivo che i due sistemi possono essere ambedue inerziali solo se il loro moto relativo `e una traslazione a velocit` a uniforme, − − u, → r senza rotazioni. Se l’origine di K viene vista da K viaggiare a velocit`a → → − `e legato ad r dalla semplice relazione → − − − r=→ r −→ u t;
(6.1)
− ponendovi ad esempio → r = 0 si individua l’origine di K , e la (6.1) conferma → − → − che r = u t. I tempi coincidono nei due sistemi, cio`e t = t. Le equazioni → − − di Newton F = m→ a della meccanica sono invarianti perch´e le accelerazioni, e quindi le forze, sono le stesse in tutti i sistemi inerziali. Se vi sono mutue interazioni fra le particelle e queste dipendono dalla distanza, le interazioni sono invarianti proprio perch´e le distanze lo sono. Se in S c’`e un potenziale esterno U (x , t), allora in S c’`e un potenziale U (x, t) legato al precedente dal cambiamento di variabili U (x, t) = U (x = x − ut, t). Per la meccanica classica, cambiare sistema di riferimento significa eseguire una trasformazione puntuale, del tipo Q = Q(q, t). Un cambiamento di variabili nella lagrangiana fa passare automaticamente da un riferimento all’altro. L’esempio pi` u banale `e quello di due sistemi di riferimento S e S tali che l’origine di S occupi → − → − − − la posizione d nel sistema S; allora la trasformazione `e → r = → r − d . Le → − → − → − accelerazioni e le forze sono indipendenti da d . Se poi d = d (t), questo fa poca differenza: la velocit`a diventa − − → − v −→ u (t), v=→ − d→ − d (t). Questa `e la legge galileiana di composizione delle velodove → u (t) = dt cit`a. Derivando ancora rispetto al tempo, si trova che le forze sono le stesse in S e S se e solo se questi senza mutua rotazione si muovono l’uno rispetto − all’altro con velocit` a → u costante. Questa `e la relativit` a galileiana. In luogo della nave di Galileo, useremo spesso un esempio familiare. Si consideri un − treno che si muove con velocit`a costante → u rispetto ad una stazione. Il treno rappresenta il sistema (xT , yT , xT , tT ), la stazione il sistema (xS , yS , zS , tS ). Il macchinista ed il capostazione concordano di eseguire delle misure e confrontare i risultati. Le lunghezze e gli intervalli di tempo sono invarianti, tempo e spazio sono assoluti. Lo spazio `e tridimensionale, e il tempo funge da parametro. KT e KS differiscono per i valori delle coordinate, ma si comportano come se usassero lo stesso orologio e lo stesso metro.
80
6 Teoria della Relativit` a zS
xS
zT
OT
xT
OS yS
yT
Fig. 6.1. Il sistema KT (OT xT yT zT ) viaggia con velocit` a u lungo l’asse x rispetto a KS (OS xS yS zS ); il treno passa dalla stazione per tT = tS = 0
Tutto quadra, anzi, tutto sembra del tutto inevitabile ed ovvio.1
6.2 Le equazioni di Maxwell e l’interferometro di Michelson Senonch´e, per i fenomeni elettromagnetici tutto questo non vale. Le equazioni di Maxwell nel vuoto → − → − ∇ · E = 0, → − → − ∇ · B = 0, → − 1 ∂B → − → − , ∇∧E =− c ∂t → − 1 ∂E → − → − , ∇∧B = c ∂t contengono il parametro c che ha le dimensioni di una velocit`a, senza indicare il sistema di riferimento in cui questa velocit` a va misurata. Ambedue i campi obbediscono all’equazione delle onde: 1 → − ∇2 E = 2 c 1 → − ∇2 B = 2 c
→ − ∂2 E , ∂t2 → − ∂2 B . ∂t2
se eseguiamo una trasformazione di Galileo, la velocit`a di un raggio di luce dovrebbe comporsi con la velocit`a relativa di S e S e le equazioni di Maxwell dovrebbero essere diverse nei due sistemi. La contraddizione era davanti agli occhi di tutti, da quando Maxwell pubblic` o le sue equazioni. Le trasformazioni 1
Si pu` o dimostrare che anche l’equazione di Schr¨ odinger conserva la sua forma per trasformazioni di Galileo.
6.2 Le equazioni di Maxwell e l’interferometro di Michelson
81
B
l2
L A
O S l1
C
Fig. 6.2. Schema dell’interferometro di Michelson. Un raggio di luce proveniente dalla sorgente S viene diviso in O da una lastra semiargentata L sotto un angolo di 45 gradi; i due raggi OA e OB vengono riflessi da specchi che li rimandano sulla lastra L. Qui il raggio BO si scinde in due raggi OC e OS mentre AO in OS e OC. In C c’`e un cannocchiale dove si pu` o osservare l’interferenza fra il raggio che ha percorso il cammini SOAOC e quello che ha percorso il cammino SOBOC
di Galileo apparivano a tutti un puro fatto geometrico, fuori dall’indagine fisica e fuori questione. Le onde elettromagnetiche, d’altro canto, sono state a lungo immaginate come propaganti nell’etere, un mezzo imponderabile che `e al riposo in un sistema privilegiato. L’ipotesi dell’etere era il male minore: ci pu` o essere un solo sistema di riferimento, quello dell’etere appunto, dove la velocit` a della luce `e uguale in tutte le direzioni e le equazioni di Maxwell sono corrette cos`ı come sono. La Terra percorre una orbita quasi circolare ad una velocit` a di quasi 30 Km/s, quindi la velocit` a della luce doveva dipendere dalla direzione e dalla stagione. Per misurare la velocit`a della Terra rispetto all’etere Maxwell propose un esperimento che fu realizzato da Michelson a pi` u riprese a partire dal 1879. L’interferometro di Michelson `e fondamentalmente un misuratore della differenza ∆t dei tempi di percorrenza lungo due cammini ortogonali. Infatti per il fascio monocromatico di pulsazione ω e lunghezza d’onda λ si misura una differenza di fase ∆φ = ω∆t = 2πν∆t. Per calcolare lo spostamento atteso secondo la trasformazione di Galileo mettiamoci nel sistema di riferimento dell’etere, dove la velocit` a della luce `e c in − tutte le direzioni e l’interferometro si muove con velocita → u , e supponiamo − OA orientato lungo → u . Sia τOA il tempo impiegato dalla luce per andare da O ad A. In questo tempo A si `e mosso in avanti di uτOA , quindi il vero percorso
82
6 Teoria della Relativit` a
`e l1 + uτOA . Allora, c =
l1 +uτOA τOA ,
ovvero
τOA =
l1 . c−u
Analogamente, il tempo impiegato per il cammino inverso `e τAO = e la somma `e τOAO =
l1 , c+u
l1 2l1 1 l1 + = . c+u c−u c 1 − uc22
(6.2)
B
l2 O’
O”
Fig. 6.3. Il percorso OBO in un sistema in cui l’asta si muove trasversalmente
Invece, il raggio OBO percorre nel sistema dell’etere i lati uguali di un triangolo isoscele che ha per base la lunghezza del percorso di O durante il tempo τOBO . Se O’ e O” sono le posizioni iniziale e finale di O, O O = uτOBO , e la lunghezza percorsa `e / uτOBO 2 O BO = 2 l22 + ( ) = 4l22 + (uτOBO )2 . 2 Nel sistema dell’etere la velocit`a `e c, quindi c=
O BO = τOBO
4l22 + (uτOBO )2 . τOBO
Risolvendo, τOBO =
1 2l2 / c 1−
u2 c2
.
(6.3)
Dalle (6.2)-(6.3), τOAO − τOBO =
1 2l1 1 2l2 / − c 1 − uc22 c 1−
u2 c2
.
6.3 La teoria di Einstein: esperimenti pensati
83
Questa differenza in s`e non `e interessante, perch´e i cammini ottici l1 ed l2 in pratica sono diversi. Per`o se c’`e una dipendenza della velocit`a della luce dalla direzione la possiamo ugualmente mettere in risalto. Infatti, ruotando l’interferometro di 900 , o aspettando tre mesi, si scambiano di ruolo l1 ed l2 ottenendo 1 2l1 2l2 1 / − τOBO = − . τOAO 2 c c 1 − uc22 1 − uc2 − τOBO ) La differenza di queste differenze ∆t = (τOAO − τOBO ) − (τOAO determina lo spostamento delle frange dal quale possiamo risalire a u. Risulta ⎡ ⎤ 1 2(l1 + l2 ) ⎣ 1 ⎦. ∆t = 2 − / 2 c 1 − uc2 1− u c2
Espandendo con
1 1−x
≈ 1 + x + x2 + . . ., ∆t ≈
√1 1−x
≈ 1 + 12 x + 38 x2 + . . . resta
(l1 + l2 ) u2 . c c2
Quindi il cambiamento di fase ∆φ ≈
2π(l1 + l2 ) u2 . λ c2
Km La Terra si muove intorno al sole a u ≈ 29 Km s , mentre c ≈ 299700 s , quindi 2 u −8 ; d’altra parte l λ e l’effetto dovrebbe essere ben apprezzabile. c2 ≈ 10 Il risultato sperimentale `e 0. La velocit` a della luce `e esattamente la stessa in tutte le direzioni e quindi in tutti i sistemi inerziali. L’ipotesi dell’etere `e contraddetta dall’esperimento e la Fisica classica `e in crisi. Oggi si sa che la Terra si muove con velocit` a di centinaia di chilometri al secondo rispetto al riferimento costituito dal fondo di radiazione cosmica 2.7 gradi Kelvin. Un interferometro di Michelson di dimensioni chilometriche, attualmente in costruzione in provincia di Pisa, permetter` a forse nei prossimi anni di scoprire le onde gravitazionali, che sarebbero avvertite come piccole oscillazioni delle lunghezze l1 e l2 .
6.3 La teoria di Einstein: esperimenti pensati Einstein2 interpret` o l’esito negativo dell’esperimento di Michelson nel modo pi` u semplice: le equazioni di Maxwell sono valide in ogni sistema di riferimento 2
Einstein (Ulm 1879 - Princeton 1955) `e il pi` u famoso fisico dai tempi di Newton; oltre a inventare la Relativit` a ristretta e generale, ha dato un contributo formidabile a vari campi della Fisica fra cui la meccanica quantistica.
84
6 Teoria della Relativit` a
inerziale: ogni misura di c restituisce c, indipendentemente anche dalla velocit` a della sorgente della luce. La trasformazione di Galileo con lunghezze e tempi assoluti `e ovvia nell’esperienza quotidiana, quando tutte le velocit`a sono infime rispetto a c. Einstein ribad`ı il Principio di relativit` a di Galileo, che chiam` o Principio di Relativit` a Ristretta3 : tutte le leggi della Fisica hanno la stessa forma in tutti i sistemi inerziali. Bisogna riesaminare criticamente il significato fisico, cio`e operativo, delle nozioni di distanza spaziale e di intervallo di tempo fra due eventi. In genere tutti i fenomeni fisici possono essere descritti come una successione di eventi, quali l’accensione di una lampada o l’arrivo di un raggio di luce in un punto; − ciascun evento `e caratterizzato dalle 4 coordinate (→ x , t). Lunghezza propria, tempo proprio Una lunghezza propria `e quella di un’asta in quiete, che pu` o essere misurata con un metro. Un tempo proprio `e quello che pu` o essere misurato per mezzo di un orologio. Nel riferimento in cui `e in quiete i due eventi che fanno partire ed arrestare l’orologio avvengono nel medesimo punto dello spazio. Ma la misura di lunghezze di aste in movimento non si fa col solo metro e la misura di intervalli di tempo fra eventi lontani non si fa col solo orologio. Dire come si fanno significa dire cosa sono. Faremo esperimenti pensati ricorrendo − all’esempio del treno che si muove con velocit`a costante → u rispetto ad una stazione. Il treno rappresenta il sistema (xT , yT , xT , tT ), la stazione il sistema (xS , yS , zS , tS ). Il macchinista ed il capostazione concordano di eseguire delle misure e confrontare i risultati ottenuti. Osservando gli stessi eventi da due sistemi di riferimento inerziali diversi i due concorderanno sulla velocit` a relativa, ma saranno spesso in disaccordo sui risultati delle misure; la relazione fra questi risultati `e fissata univocamente dal principio di relativit` a. Ciascuno dei due ha diritto di pensare di essere in quiete, e ciascuno interpreter`a l’esperimento solo sulla base delle misure che egli stesso pu` o eseguire. Carattere relativo della simultaneit` a Sia la velocit` a del treno parallela all’asse x. Il macchinista lancia dal punto O un segnale luminoso e misura il tempo che la luce impiega per arrivare agli specchi A e B solidali col treno ed equidistanti da O. La congiungente AOB `e lungo l’asse x. Poich´e la velocit`a della luce `e c in tutte le direzioni in tutti i riferimenti inerziali, il macchinista trova che gli specchi riflettono la luce contemporaneamente. Il capostazione, invece, trova che due eventi (la riflessione della luce da A e da B) non sono contemporanei. Poich´e la velocit`a della luce `e c in tutte le direzioni in tutti i riferimenti inerziali, e poich´e lo specchio B si allontana dal punto O da dove `e partita la luce mentre A va verso O, `e chiaro la luce arriver` a prima in A. 3
Il principio di Relativit` a Generale di Einstein sancisce che tutte le leggi della Fisica hanno la stessa forma in tutti i sistemi di riferimento, inerziali e non inerziali.
6.3 La teoria di Einstein: esperimenti pensati
A
85
B
capostazione
OS
u
Fig. 6.4. Esperimento con 2 specchi lungo la direzione del moto
Chi ha ragione? Tutti e due! Infatti l’esperimento ha sempre ragione. Non c’`e dubbio che il macchinista pu` o mettere un orologio vicino a ciascun specchio; dopo averli sincronizzati pu` o misurare i tempi di arrivo della luce e constatare che sono simultanei. Ma altrettanto valida `e la misura che pu`o fare il capostazione, se ha messo degli orologi fermi rispetto a lui nei punti in cui si trovano gli specchi all’arrivo della luce. Quindi non c’`e contraddizione: i due eventi sono veramente simultanei per il macchinista e non simultanei per il capostazione. Misure di distanze e intervalli di tempo Con un metro si misurano distanze fra punti fissi e con un orologio intervalli temporali in un dato punto. Per fare misure diverse, per`o uno pu` o sempre, in linea di principio, attrezzarsi. Immaginiamo un sistema cartesiano che consista o di tre aste materiali rigide connesse a 90◦ . Un osservatore con un metro pu` assegnare coordinate cartesiane ed individuare ad esempio tutte quelle che le hanno intere. In tutti questi punti pu` o sistemare un servo munito di un orologio, mentre lui stesso si mette all’origine. Di l` a egli emette un segnale al tempo 0 per sincronizzare gli orologi. Ogni servo ha istruzione di fare partire l’orologio in modo che segni il tempo t = rc , dove r `e la distanza dall’origine. Ora, se due eventi accadono in luoghi diversi, i loro tempi possono essere misurati con l’orologio dai due servi stazionati nei nodi pi` u vicini del reticolo e trasmessi per radio al padrone nell’origine. Per ogni evento, il padrone riceve 4 coordinate. Cos`ı `e possibile definire la lunghezza di un’asta in movimento. I servi prendono nota delle posizioni degli estremi dell’asta quando questi rientrano nel loro distretto di competenza e dei tempi; quindi, trasmettono l’informazione al padrone. Questi pu`o selezionare le determinazioni simultanee (per lui) della posizione degli estremi e calcolarsi la distanza col teorema di Pitagora.
86
6 Teoria della Relativit` a
Per` o la simultaneit` a di due eventi ha un carattere assoluto se essi accadono nello stesso punto (e quindi coincidono nello spazio e nel tempo). Se poi il macchinista decide di disporre gli specchi A e B equidistanti dalla sorgente O lungo una direzione ortogonale all’asse x, allora il capostazione concorda con lui che la luce perviene ai due specchi simultaneamente: il problema `e perfettamente simmetrico nei due specchi. Relativit` a dei tempi Sul treno c’`e, attaccata al soffitto ad altezza h, una lampada. Quando il macchinista accende la lampada, quanto ci vuole perch´e la luce arrivi al pavimento? Per il macchinista il tempo `e tT =
h . c
Per il capostazione, per` o, il raggio √di luce deve coprire la distanza quindi il tempo `e dato da ts =
h2 +(uts )2 . c
ts =
h c
h2 + (uts )2 ;
Risolvendo, si trova
1 . 1 − ( uc )2
Per il capostazione il tempo `e pi` u lungo perch´e la distanza percorsa dalla luce `e maggiore; il tempo misurato dal macchinista `e il pi` u corto possibile. Relativit` a delle lunghezze L’esperimento di Michelson, il cui esito `e stupefacente per la teoria ottocentesca, si comprende alla luce della Relativit` a. Inoltre, mostra che la lunghezza di un’asta dipende dal sistema di riferimento, a meno che l’asta non sia ortogonale alla direzione del moto. Poich´e non dobbiamo preoccuparci di dettagli pratici, supponiamo che l’interferometro di Michelson abbia bracci uguali di lunghezza (propria) l. Il macchinista dispone dell’interferometro, esegue l’esperimento e lo descrive come segue. Al tempo tT = tS = 0 le origini del treno e della stazione coincidono, OS = OT . Un segnale parte da OT al tempo 0 ed al tempo t = cl viene riflesso contemporaneamente dagli specchi A e B. L’evento di riflessione da A ha coordinate (xT , yT , xT , tT ) = (l, 0, 0, cl ) e l’evento di riflessione da B ha coordinate (xT , yT , xT , tT ) = (0, l, 0, cl ). Al tempo (tOBO )T = (tOAO )T = 2lc ≡ τ0 , i due raggi tornano contemporaneamente in O. Si noti che la simultaneit` a dei due ritorni `e assoluta perch´e ambedue avvengono nello stesso punto Ot ; inoltre, τ0 `e un tempo proprio, misurato da un orologio che il macchinista ha disposto in OT . La descrizione dell’esperimento che fa il capostazione `e altrettanto valida. Egli concorda che il segnale parte da OS = OT al tempo tS = 0 e che OB `e
6.3 La teoria di Einstein: esperimenti pensati
87
B l
L
A
OT S l OS C
Fig. 6.5. L’interferometro di Michelson si trova sul treno che viaggia con velocit` a u, e l’asse xT coincide con OA, l’asse yT coincide con OB. Anche l’asse xS coincide con OA, e O coincide con ambedue le origini all’inizio dell’esperimento
lungo l; vedremo che tutto `e consistente se supponiamo che la lunghezza di un’asta perpendicolare al moto non dipende da u. La lunghezza OA sar` a per` o lS = lS (u). Infatti, la velocit`a della luce `e c in tutte le direzioni e basta adattare il ragionamento fatto prima per il mitico sistema dell’etere.4 L’interferometro si muove con velocita u lungo l’asse x, e durante τOA A si `e mosso in avanti di uτOA , quindi il vero percorso `e lS + uτOA e τOA =
lS . c−u
τAO =
lS , c+u
Analogamente,
e la somma `e, come in (6.2) τOAO =
2lS 1 . c 1 − uc22
(6.4)
τOBO =
1 2l / c 1−
(6.5)
Esattamente come in (6.3),
4
u2 c2
.
Le formule matematiche sono quasi identiche a quelle usate da Michelson, ma u identificata con l il significato fisico `e profondamente poich´e lS non viene pi` diverso.
88
6 Teoria della Relativit` a
Il tempo `e pi` u lungo di quello misurato dal macchinista. Poich´e `e un fatto assoluto che τOAO = τOBO , 2lS 1 1 2l / 2 = u c 1 − c2 c 1−
u2 c2
,
cio`e
u2 . (6.6) c2 Per il capostazione, OA `e pi` u corta che per il macchinista. Notare bene che `e veramente, non sembra, pi` u corta. Si tratta del risultato reale di qualsiasi misura che il capostazione pu` o fare nel suo sistema di riferimento. Questa `e la contrazione relativistica. La lunghezza propria, misurata nel riferimento di quiete, `e la pi` u lunga. Perch´e diventi pi` u corta dell’1 per cento ci vuole una velocit`a di circa 0.15c ≈ 45000km/s. Un vero capostazione non nota nulla; alla velocit`a di 0.8c, l `e ancora il 60% della lunghezza originale. La (6.5) mostra di nuovo che il tempo proprio τ0 = (τOBO )T = 2l c misurato nel sistema di riferimento del treno in cui l’asta `e in quiete `e la pi` u breve determinazione possibile dell’intervallo si tempo, ed in un altro riferimento si trova invece τ0 . τ= / 2 1 − uc2 lS = l
1−
Questa time dilation ha una semplicissima ragione fisica nel fatto che in un sistema in cui l’asta si muove la luce per andare da un estremo all’altro deve fare un percorso pi` u lungo, come il percorso OBO discusso sopra. Infatti un Muone relativistico pu` o essere osservato per tempi molto pi` u lunghi della sua vita media di riposo. ` importante capire bene che questi sono effetti reali, non apparenti. Non si E deve pensare che in realt`a l’esperimento di Michelson del macchinista dura τ0 ma al capostazione sembra durare τ . Questo modo di pensare privilegerebbe un sistema rispetto all’altro. Inoltre per il capostazione l’esperimento dura τ a tutti gli effetti, ad esempio questo `e il tempo che egli ha effettivamente a disposizione per intervenire nell’esperimento. Il capostazione vede l’orologio del macchinista che segna τ0 quando il suo segna τ , e conclude che l’orologio del macchinista `e lento, va indietro. Molte persone sono fortemente tentate dalla stessa idea: allora il macchinista vede l’orologio del capostazione che va avanti. Se due amici si incontrano e si accorgono che uno di loro ha l’orologio che va pi` u lento, l’altro orologio deve andare pi` u veloce. L’analogia coi due amici `e falsa; una riflessione pi` u attenta mostra che per il Principio di Relativit`a anche l’orologio del capostazione va indietro, a giudizio del macchinista; infatti, anche il capostazione pu` o eseguire l’esperimento di Michelson, ed allora tutto l’esperimento si svolge con i ruoli invertiti. Il macchinista (che continua a sostenere, a buon diritto, di − stare fermo, mentre trova che il capostazione viaggia con velocit`a − → u ) vede
6.3 La teoria di Einstein: esperimenti pensati
89
/ 2 che l’asta del capostazione orientata lungo l’asse x `e lunga l 1 − uc2 e che il / 2 suo orologio va indietro, sempre di un fattore 1 − uc2 . Non c’`e contraddizione perch´e la differenza non sta n`e negli orologi n`e nei metri, ma nei sistemi di riferimento: ciascuno di loro in 1 Secondo riesce ad osservare solo quello / 2
che l’altro fa in 1 − uc2 Secondi. La differenza fisica `e fra lunghezze e tempi propri (cio`e misurati in quiete) e misure in moto. Paradosso dei Gemelli
Due gemelli identici, Antonio e Bartolomeo, nascono in un sistema inerziale S. Bartolomeo parte al tempo t1 con un’astronave raggiunge una stella a 12 anni luce viaggiando a 0.6c e subito torna a casa con la stessa velocit` a. Antonio resta a casa e festeggia il ritorno del fratello astronauta al tempo t 2 dopo 12 = 40 anni. Nel frattempo Bartolomeo sar` a invecchiato di t2 − t1 = 2 × 0.6 t2 a pi` u giovane t2 − t1 = t1 dt 1 − (0.6)2 = 40 × 0.8 = 32 anni, e quindi sar` del suo gemello. Il paradosso sta nel fatto che Bartolomeo dice di non essersi mai mosso, mentre Antonio con tutta la Terra ha compiuto un cammino curvo con velocit` a 0.6c. Inoltre durante il viaggio di andata e poi durante quello di ritorno aveva osservato pi` u volte che gli orologi terrestri andavano pi` u lenti del suo, quindi si sarebbe aspettato che Antonio fosse rimasto pi` u giovane di lui. La risoluzione del paradosso `e che Bartolomeo non ha diritto di considerarsi fermo, perch´e il suo sistema non `e inerziale. Egli deve aver sentito forze inerziali nella fase di accelerazione alla partenza, quando curvava per tornare a casa e durante la frenata all’arrivo. Quindi i due sistemi non sono equivalenti, ed i pi` u vecchio `e Antonio. L’esperimento `e stato fatto nel 1972 confrontando fra loro due orologi al Cesio, uno dei quali aveva fatto un giro del mondo in aereo. Nonostante la piccolezza della velocit`a dell’aereo rispetto a c, l’effetto relativistico fu trovato come Einstein l’aveva predetto. Relativit` a della sincronizzazione Due orologi in quiete relativa possono essere sincronizzati nel loro sistema di riferimento ma non negli altri. Per illustrare questo fatto useremo un esercizio. Problema 16. Il pilota di una astronave che viaggia a 0.6c passa vicino alla Terra e regola il proprio orologio con quello terrestre, diciamo alle ore 0,00 antimeridiane. Il pilota nota che alle ore 0,30’ del suo orologio l’astronave oltrepassa una stazione spaziale ferma rispetto a Terra e sincronizzata col tempo terrestre. a) Che ora `e alla stazione nel momento in cui passa l’astronave? b) Il pilota vede che gli orologi a terra vanno indietro e NON concorda sul fatto che gli orologi della Terra e della stazione spaziale sono sincronizzati. Di quanto non lo sono?
90
6 Teoria della Relativit` a
Soluzione 16. a) Il tempo misurato dall’astronauta `e un tempo proprio τ0 , τ0 30 30 mentre quello terrestre `e dilatato a τ = = 0.8 = 37.5 = √1−0.6 2 u2 1− c2
minuti. Sarebbe sbagliato determinare τ come se fosse un tempo proprio nel sistema dell’astronauta, perch´e τ `e determinato sulla stazione spaziale. b) Il pilota √ nota che gli orologi terrestri vanno ad un ritmo ridotto di un fattore 1 − 0.62 = 0.8 . Se l’orologio della stazione fosse sincronizzato (dice il pilota) segnerebbe 30 × 0.8 = 24 minuti dopo la mezzanotte. Per il Pilota l’orologio della stazione `e stato messo avanti di 13,5 minuti. La sincronizzazione `e relativa al sistema di riferimento. 6.3.1 Trasformazione di Lorentz Siamo in grado di stabilire la legge relativistica di trasformazione fra due sistemi inerziali, sempre con l’esperimento eseguito dal macchinista e dal capostazione. Arrangiamo l’esperimento in modo che le origini coincidano al tempo tS = tT = 0. Il macchinista nel sistema KT osserva un evento E di (E) (E) (E) (E) coordinate (xT , yT , zT , tT ), e misura la distanza (OS E)T di E rispetto alla stazione che si trova in OS . Intanto, (E)
= yT
(E)
= zT
yS
(E)
e zS
(E)
perch´e passando da un sistema all’altro nulla cambia nelle direzioni trasversali. (E) Lungo l’asse x, la distanza dell’evento da OT misurata dal macchinista `e xT . Per trovare la distanza da OS egli deve aggiungere la distanza OS OT = utT dalla stazione, sempre misurata dal macchinista usando il suo metro e il suo orologio; il risultato `e quindi (E)
(OS E)T = xT
(E)
+ utT .
Nella fisica ottocentesca non ci sarebbe stato bisogno di specificare chi faceva le misure; allora, identificando il primo membro con xS si sarebbe riscritta la trasformazione di Galileo. Invece, xS = (OS E)S `e misurato dal capostazione. Per il capostazione OS `e fermo e la misura di xS pu` o essere fatta col metro; basta guardare su quale tacca di un metro stazionario si verifica E. In altri termini, xS `e una lunghezza propria. Allora, a causa della contrazione relativistica u (OS E)T = xS 1 − ( )2 ; c pertanto, (sottointendendo i simboli
(E)
)
xT + utT xS = / ≡ γ[xT + utT ], 2 1 − uc2
(6.7)
6.3 La teoria di Einstein: esperimenti pensati
91
dove poniamo 1 γ= / 1−
u2 c2
.
Il principio di relativit` a dice subito che allora xS − utS xT = / ≡ γ[xS − utS ]. 2 1 − uc2
(6.8)
Usando le equazioni (8.5)-(6.8) `e facile trovare come si trasforma il tempo, cio`e esprimere tT in termini di quantit` a tutte misurate dal capostazione, eliminando xT . Si ottiene u tT = γ[tS − 2 xS ]. c Cos`ı abbiamo completato la trasformazione di Lorentz: la trasformazione `e simmetrica fra coordinate spaziali e il tempo moltiplicato per c, ed `e u u yT = y, xT = γ x − ct , zT = z, ctT = γ ct − x . c c (6.9) La trasformazione di Galileo (6.1) `e il limite per c → ∞. Le lunghezze trasversali sono conservate dalla trasformazione, ma ∆x = ∆x2 + ∆y 2 + ∆z 2 fra due punti non si ∆x , e quindi la distanza r = conserva. Per` o c2 t2T
−
x2T
=
c2 t2 − 2uxt + 1−
u2 c2
u2 x2 c2
−
x2 − 2uxt + u2 t2 = c2 t2 − x2 . 2 1 − uc2
Pertanto la quantit` a conservata, cio`e assoluta, `e l’intervallo s, il cui quadrato s 2 = r 2 − c 2 t2 pu` o essere positivo, nullo o negativo; se s2 = 0 l’intervallo si dice light-like. Due eventi sono separati da intervallo nullo se si pu` o andare dall’uno all’altro viaggiando a velocit`a c. Se s2 < 0 prevale la separazione nel tempo e l’intervallo `e time-like, se s2 > 0 l’intervallo `e space-like. La trasformazione inversa della (6.9) `e uxT . y = yT , z = zT , ct = γ ctT + x = γ [xT + utT ] , c ` naturale introdurre la quarta dimensione spaziale x0 = ct, e la notazione E β = uc ; scrivendo ora i sistemi K ≡ (OS , xS , yS , zS )≡ (O, x, y, z) per la stazione e K ≡ (OT , xT , yT , zT ) ≡ (O , x , y , z ) per il treno, la trasformazione diventa ⎧ x = γ(x1 − βx0 ), ⎪ ⎪ ⎨ 1 x2 = x2 (6.10) x = x3 , ⎪ ⎪ ⎩ 3 x0 = γ(x0 − βx1 ).
92
6 Teoria della Relativit` a
Problema 17. Le coordinate spazio-temporali di due eventi sono, per un osservatore O x1 = 6 ∗ 104 m, y1 = z1 = 0, t1 = 2 ∗ 10−4 s., x2 = 12 ∗ 104m, y2 = z2 = 0, t2 = 1 ∗ 10−4 s. L’osservatore O viaggia rispetto ad O con velocit` a v lungo l’asse x, e trova che i due eventi sono simultanei. Calcolare v usando c = 3 × 108 m s . Soluzione 17. Deve essere ct1 − uc x1 = ct2 − uc x2 e viene
v c
= − 21 .
a Problema 18. Il razzo O viaggia rispetto ad stazione spaziale O con velocit` v. Il pilota del razzo dice che l’obl` o da cui guarda la stazione `e lungo 4 m, e che ad un certo istante la sua lunghezza `e stata identica a quella di una finestra della stazione, parallela al moto. Il capostazione dice invece che la finestra `e lunga 5 m. Qual’`e la velocit`a v ? Soluzione 18. Risposta:5 = 4γ; risolvendo viene
v c
= 35 .
Contrazione delle lunghezze e trasformazione di Lorentz Dalla trasformazione di Lorentz si riottiene la contrazione delle lunghezze. Immaginiamo che il capostazione voglia misurare la lunghezza di un’asta di lunghezza propria L disposta sul treno parallelamente al moto. La misura si esegue facendo partire due segnali dagli estremi A e B dell’asta; gli eventi corrispondenti osservati sul treno hanno coordinate (x(T ) , t(T ) ) pari a (T ) (T ) (T ) (T ) (0, tA ), (L, tB ). Per il capostazione, le coordinate sono (γutA , γtA ), (γ(L+ (T ) (T ) (S) (S) (S) (S) utB ), γ(tB + cu2 L)). Si deve imporre tA = tB ; allora consegue xB −xA = / 2 L 1 − uc2 . 6.3.2 Composizione delle velocit` a Un corpo si muove a velocit` a W =
dxT dtT
nel sistema di riferimento del macchinista. Per il capostazione, la velocit` a `e u V = dx , dove dx = γ[dx + udt ], cdt = γ[ dx + cdt ]. Quindi, T T T T dt c V =
W +u . 1 + uW c2
Sommando velocit`a minori di c non si arriva mai a c. Problema 19. Un razzo R si allontana dalla terra T in linea retta lungo l’asse x positivo. Un UFO viene avvistato da terra e dal razzo, mentre si muove anch’ esso in linea retta lungo l’asse x. Visto da terra, questo UFO si muove a 0.5c, mentre visto dal razzo si muove a −0.5c. Qual’`e la velocit`a di R rispetto a T ? Soluzione 19. Usando la legge di composizione delle velocit`a viene
v c
= 0.8.
6.3 La teoria di Einstein: esperimenti pensati
93
Cronotopo di Minkowski (x0 , x1 , x2 , x3 ) sono le coordinate in uno spazio a 4 dimensioni dove inve ce della distanza pitagorica 4i x2i conta l’intervallo. Se c’`e da fare una trasformazione di Lorentz non c’`e problema; per`o per rendere pi` u compatte le formule `e utile conservare il teorema di Pitagora, e possiamo farlo se formalmente introduciamo uno spazio a 4 dimensioni (cronotopo di Minkowski) di coordinate x1 = x,
x2 = y,
x3 = z,
x4 = ix0 = ict.
L’uso di una componente 4 immaginaria in alternativa alla componente 0 reale `e il prezzo da pagare. Allora ∆s2 =
4 λ=1
(∆xλ )2 =
3
(∆xi )2 − ∆x20
i=1
`e la distanza pseudoeuclidea in questo spazio; usiamo indici greci per le 4 componenti, riservando quelli latini per quelle spaziali. La trasformazione diventa ⎧ x = γ(x1 + iβx4 ), ⎪ ⎪ ⎨ 1 x2 = x2 , (6.11) x = x3 , ⎪ ⎪ ⎩ 3 x4 = γ(x4 − iβx1 ). La trasformazione di Lorentz `e una trasformazione lineare che lascia invariante ∆s2 , come rotazioni5 e riflessioni nello spazio euclideo tridimensionale lasciano invariante r. Una trasformazione tale che le due origini coincidono all’istante iniziale `e della forma xµ = Λµν xν ; qui si `e introdotta la comoda convenzione di Einstein secondo cui si somma sugli indici ripetuti, e ⎛ ⎞ γ 0 0 iγβ ⎜ 0 10 0 ⎟ ⎟ Λ=⎜ ⎝ 0 0 1 0 ⎠. −iβγ 0 0 γ La condizione che esprime l’invarianza dell’intervallo `e xµ xµ = Λµν Λµχ xν xχ = xν xν `e evidentemente Λµν Λµχ = δ(ν, χ). La trasformazione inversa `e quindi la trasposta. 5
Si pu` o verificare che la (6.11) corrisponde ad una rotazione nel piano x1 − x4 di un angolo ξ tale che tanh(ξ) = β, definita da x1 = x1 cosh(ξ) + ix4 sinh(ξ) x4 = x4 cosh(ξ) − ix1 sinh(ξ).
94
6 Teoria della Relativit` a
6.3.3 Tensori Il tensore pi` u semplice `e lo scalare, o tensore di rango 0, che `e una grandezza invariante. L’intervallo fra due eventi `e uno scalare. Per un corpo in movimento, il tempo proprio fra due eventi vicini dτ = ds e scalare. c ed ` wµ , con µ = 1, . . . , 4 sono le componenti di un quadrivettore, o tensore di rango 1, se wµ = Λµν wν , cio`e se wµ si trasforma come xµ . Consideriamo un’onda elettromagnetica; la lunghezza d’onda `e data da λ = cT , dove T `e il periodo; ne segue che ω = ck, dove k = 2π e il modulo del λ ` → − → − → − vettore d’onda k , orientato lungo la direzione di propagazione vers( E ∧ H ). ` immediato vedere che una funzione arbitraria della forma E → − − f (ωt − k · → x) 2
∂ 2 soddisfa all’equazione delle onde c12 ∂t o misurare 2 f = ∇ f . Un osservatore pu` la differenza di fase della f fra due punti del suo sistema di riferimento separati da intervallo nullo contando quante creste l’onda ha fra di essi. La differenza di fase `e un invariante relativistico, perch´e i conteggi sono un fatto oggettivo. Quindi Φ = kµ xµ `e un invariante, e
ω → − kµ = ( k , k0 = ) c `e un quadrivettore. → − Si dimostra che sono quadrivettori la corrente jµ = ( J , i ρc ), dove ρ `e la → − densit` a, ed il quadripotenziale Aµ = ( A , i φc ). I campi elettrico e magnetico non lo sono. − Per un corpo in movimento, il vettore a 3 componenti → v ≡ (v1 , v2 , v3 ) = (x, ˙ y, ˙ z), ˙ cio`e la trivelocit`a, non `e adatto alla teoria relativistica, perch´e non esiste il tempo assoluto. Si usa quindi la quadrivelocit` a wµ =
− d→ r dxµ − =( , icγ) = γ(→ v , ic) dτ dτ
ed i tempi sono misurati da un orologio solidale col corpo.6 Dalla quadrivelocit`a si ottiene l’invariante wα wα = γ 2 (u2 − c2 ) = −c2 , α da cui si deduce che wα dw e che la quadriaccelerazione `e perpendidτ = 0, cio` colare alla quadrivelocit`a.
6
A prima vista pu` o sembrare strano derivare le componenti xα misurate nel sistema dell’osservatore per il tempo misurato nel sistema del punto materiale, ma in effetti cdτ = ds `e un intervallo e non dipende dal sistema.
6.3 La teoria di Einstein: esperimenti pensati
Analogamente, wµν ,
95
(µ = 1, . . . , 4, ν = 1, . . . , 4) `e un tensore di rango 2,
se
wµν = Λµρ Λνσ wρ wσ ,
cio`e se si trasforma come xµ xν , cio`e come il prodotto dellle componenti di due quadrivettori. Si pu` o verificare che un campo elettromagnetico `e un tensore a due indici Fµ,ν =
∂Aν ∂Aµ − . ∂xµ ∂xν
Le componenti non nulle sono quelle dei campi elettrico e magnetico. A questo punto sappiamo trasformarli relativisticamente. Einstein formul` o il principio di Relativit` a nel modo seguente: Le leggi della fisica possono essere scritte in forma covariante, cio`e come uguaglianze fra tensori. Problema 20. Verificare che la legge di composizione delle tri-velocit`a si ottiene anche componendo le quadri-velocit` a. Soluzione 20. Se nel sistema del treno KT un punto materiale si muove con − trivelocit` a→ v T = (v, 0, 0) il macchinista, tenendo conto della dilatazione dei tempi, gli attribuisce la quadrivelocit` a 1 wµ(T ) = / 1−
vT 2 c2
− (→ v T , ic).
(6.12)
Trasformando con Lorentz troviamo le componenti del quadrivettore in KS ; in particolare, essendo u la velocit`a del treno, (T )
(S)
w1 e sostituendo (S)
w1
=
1 =/ 1−
w1
vT 2 c2
(T )
− iu w / c 4 2 1 − uc2 1 / 1−
u2 c2
Coerenza con (6.12) richiede che ci`o sia / v
(v T + u).
S
, dove v S `e misurata nella
S2 1− v 2 c
stazione. Quindi (v S )2 1− da cui
S ( vc )2
= ϕ,
ϕ=
(u + v)2 (1 − − ( vc )2 ) ( uc )2 )(1
96
6 Teoria della Relativit` a
(v S )2 =
ϕ (u + v)2 ϕ = 1 + c2 (1 − ( uc )2 )(1 − ( vc )2 ) +
(u+v)2 c2
.
Il denominatore `e v uv u v uv uv u 1 − ( )2 − ( )2 + ( 2 )2 + ( )2 + ( )2 + 2 2 = (1 + 2 )2 . c c c c c c c Cos`ı risulta che vS =
vT + u 1+
vT u c2
e tale `e la legge relativistica di composizione delle velocit`a. Problema 21. Una astronave viaggia rispetto ad una stazione spaziale con velocit`a v. Il pilota piazza due specchi A e B, il primo in testa e l’altro in coda, a distanza AB = 2l0 fra loro; una sorgente di luce S in mezzo all’astronave emette un segnale che arriva simultaneamente in A e B dopo un tempo τ0 . Per un osservatore sulla stazione spaziale l arrivo del segnale in B precede l arrivo in A di un tempo ∆t. Se ∆t = τ0 , qual’`e la velocit`a v ? Soluzione 21. Nella stazione spaziale la lunghezza `e l = l0 γ; il tempo per l l e quello per andare in B `e τA = c+v ; viene vc = √15 . andare in A `e τA = c−v 6.3.4 Effetto Doppler Torniamo a fare un esperimento pensato con l’ausilio ormai familiare del treno che corre lungo l’asse x con velocit` a u. Il capostazione dispone di una sorgente luminosa monocromatica di pulsazione ωS che emette una onda elettromagne→ − tica di vettore d’onda k S . L’indice S qui sta anche per “sorgent`e. Egli nota → − che il modulo di k S `e kS = ωcS e la direzione fa un angolo θS con l’asse x, − quindi la componente lungo → u `e ωS → − cos θS . (kS ) = ( k S )x = kS cos θS = c La componente perpendicolare `e lunga (kS )⊥ = kS sin θS =
ωS sin θS . c
Che cosa vede invece il macchinista? Il rivelatore posto sul treno osserva una onda monocromatica di pulsazione ωT ; il vettore d’onda di modulo kT = ωcT fa un angolo θT con l’asse x, quindi le componenti sono: ωT → − (kT ) = ( k T )x = cos θT , c ωT sin θT . (kT )⊥ = c
6.3 La teoria di Einstein: esperimenti pensati
97
` facile ricavare il cambiamento di frequenza e angolo (effetto DopplerE Fizeau), perch´e sappiamo che Φ = kµ xµ `e un invariante, e ω → − kµ = ( k , k0 = ) c `e un quadrivettore. La trasformazione di Lorentz fra i due sistemi, scritta nella forma reale (6.10), `e7 ⎧ ⎨ (kT ) = γ (kS ) − β(kS )0 =⇒ ωT cos θT = γωS [cos θS − β] , (kT )⊥ = (kS )⊥ =⇒ ωT sin θT = ωS sin θS , (6.13) ⎩ → − ( k T )0 = γ((kS )0 − β(kS ) ) =⇒ ωT = γωS [1 − β cos θS ] . L’ultima delle (6.13) fornisce la frequenza, mentre dividendo membro a membro la seconda per la prima si trova tan(θT ) =
sin(θS ) . γ(cos(θS ) − β)
(6.14)
Per θS = 0, la sorgente si muove lungo la direzione di osservazione, e si ha l’effetto Doppler longitudinale. 2 1 − uc ωT = ωS ; 1 + uc qui u `e la velocit`a del treno, mentre di solito la legge si scrive in termini della velocit`a v della sorgente rispetto all’osservatore; allora si scriver` a 2 1 + vc ωT = ωS ; 1 − vc Se la sorgente si muove verso l’osservatore (v > 0), mentre una cresta viaggia la distanza si riduce; la cresta successiva ha meno da viaggiare ed arriva pi` u v ∼ ; tutto ci` o ` e conforme alla presto (blue shift); `e evidente a priori che ∆ω ω c Fisica ottocentesca. Questo effetto permette misure precise di velocit`a ed `e di grande importanza in astrofisica. Lo spostamento verso il rosso delle galassie lontane mostra che l’Universo `e in espansione. L’effetto Doppler trasversale (θ = π2 ) `e il cambiamento di frequenza che avviene ad esempio se il rivelatore ruota intorno alla sorgente. Questo non `e previsto dalla Fisica pre-relativistica; ma i fisici non si sono contentati della solidit` a degli argomenti teorici. Si sono fatte tutte le verifiche sperimentali possibili, usando tecniche sofisticate che impiegano anche l’effetto M¨ossbauer 8 e che hanno confermato la teoria di Einstein. 7 8
la relazione inversa si ottiene scambiando i sistemi e il segno della velocit` a. L’effetto M¨ ossbauer non `e in programma, ma consente di lavorare con frequenze molto ben definite. Per la conferma dell’effetto Doppler relativistico, vedere Hay et al., Phys.Rev. Letters 4, 165 (1960)
98
6 Teoria della Relativit` a
6.3.5 Meccanica relativistica Consideriamo un punto materiale libero di massa m0 ; questa `e la massa di riposo, misurata nel sistema in cui il corpo `e in quiete. Procediamo in modo induttivo, cercando una generalizzazione del principio variazionale classico di minima azione δS = 0. Prescelti due eventi a e b sulla traiettoria cronotopica della particella, S sar` a un qualche integrale fra a e b. Il principio che stabilisce quali siano i moti possibili deve essere lo stesso per tutti gli osservatori inerziali; pertanto `e logico aspettarsi S scalare. L’unica funzione scalare delle coordinate di cui si dispone `e il tempo proprio τ della particella, quindi S∝
b
dτ. a
Non possiamo inserire una f (τ ) nell’integrando, se non vogliamo una lagrangiana dipendente dal tempo nel sistema in cui la particella `e a riposo. Nel riferimento dell’osservatore che vede il corpo muoversi con velocit`a v(t) tb tb v S = −m0 c2 1 − ( )2 dt = dtL(q, q, ˙ t); c ta ta la costante −m0 c2 `e fissata in modo che per v c, L torni ad essere l’energia cinetica non relativistica, a meno di una costante inessenziale: L ≈ m0 c2 + 1 2 → − e 2 m0 v + . . .. Il momento cinetico coniugato con x ` ∂L → − p = → = ∂− v
− m0 → v − ≡ m→ v. 1 − ( vc )2
Questo si riduce all’impulso galileiano9 se ammettiamo che la massa m dipende dalla velocit`a: m ≈ m0 per piccole velocit`a, ma diverge per v → c; quindi c `e la velocit`a limite, irraggiungibile per i corpi dotati di massa. Quanto all’energia, − − essa `e data dalla (2.27), cio`e da E = → p ·→ v − L. Viene E=
m 0 c2 ≡ mc2 . 1 − ( vc )2
Questa formula celeberrima comporta che un corpo fermo ha l’energia di riposo E0 = m0 c2 ed un corpo che si muove a bassa velocit`a ha energia E ≈ m0 c2 + 21 m0 v 2 + . . . 9
per piccole velocit` a si pu` o usare lo sviluppo √
1
1−x2
≈ 1+
x2 2
+
3x4 . 8
6.3 La teoria di Einstein: esperimenti pensati
99
che coincide con quella di Galileo a meno dell’energia di riposo. In meccanica non relativistica l’origine delle energie `e arbitraria (cio`e non ha significato fisico) e quindi il limite vc 1 della formula relativistica coincide del tutto col risultato non relativistico. Nella Teoria della Relativit`a per` o questa arbitrariet` a scompare. Infatti, il quadriimpulso pµ = m0 wµ =
m0 E − (v, ic) = (→ p ,i ) v 2 c 1 − (c)
`e un quadrivettore, e tale propriet` a sarebbe distrutta aggiungendo una costante all’energia. Questo comporta che l’energia ha inerzia. → − → − Usando / la lagrangiana (2.44) con il termine cinetico modificato L( r , v , t) = 2 → − − − −m0 c2 1 − v2 − qφ + q → v · A (→ r , t) si trovano le equazioni relativistiche del c
moto di una carica in un campo elettromagnetico d→ → − − − − v, p = F, → p = m0 γ → dt
(6.15)
→ − dove F `e la forza di Lorentz (2.41). Quadriforza La (6.15) `e corretta ma non `e manifestamente covariante, cio`e non `e nella ` istruttivo mettercelo. forma di una uguaglianza fra tensori. E La derivata va fatta rispetto al tempo proprio invariante τ , e bisogna riconoscere che, come l’impulso, anche la forza `e un quadrivettore. La generalizzazione relativistica covariante delle equazioni della dinamica `e della forma d pµ = f µ . (6.16) dτ − v , ic) e ricordando che vµ vµ = −c2 si Moltiplicando per vµ = √ 1 v 2 (→ 1−( c )
trova m0 vµ quindi
d m0 d vµ = (vµ vµ ) = 0 = fµ vµ dτ 2 dτ → − → f ·− v + if4 c = 0, → − − if ·→ v . f4 = c
d d Poich´e τ `e un tempo proprio, dt = γdτ e dτ = γ dt la parte spaziale della (6.16) `e d→ d→ 1 1 → − → − − − F p = p = f = v 2 dt v 2 dτ 1 − (c) 1 − (c) → − e questo mette in relazione il trivettore modificato f con la forza di Lorentz → − F . Cos`ı
100
6 Teoria della Relativit` a
→ − → F ·− v , 1 − ( vc )2 → − → → − − e la quadriforza `e fµ = ( √ F v 2 , ci √F · vv 2 ). f4 =
i c
1−( c )
1−( c )
La quarta componente delle equazioni del moto `e d dt
m 0 c2 → − − = F ·→ v. 1 − ( vc )2
Con simili considerazioni uno pu` o relativizzare le leggi della Fisica.
6.4 Principio di equivalenza Torniamo allora sulla nave o naviglio descritta da Galileo, che rappresenta per noi un sistema inerziale, ed immaginiamo un nuovo esperimento. Sul ponte di detta nave viene dipinto un cerchio di raggio R = 1 m, poi ne viene misurata la circonferenza, che risulta essere lunga 2π m. La misura viene fatta approssimando la circonferenza con un ∞−gono, cio`e con un poligono di abbastanza lati, e sommando. Poi un marinaio si munisce di strumenti per misurare lunghezze di aste in movimento, corre velocemente lungo la circonferenza con velocit`a costante di modulo v e ripete la misura. Ogni lato dell’∞−gono risulta ora accorciato di un fattore 1 − v 2 /c2 mentre il raggio resta uguale. Il risultato sperimentale dice allora che la circonferenza `e lunga 2πR 1 − v 2 /c2 . Il marinaio veloce descrive i suoi dati con una geometria non euclidea in cui le circonferenze sono pi` u corte che in un piano euclideo. Anche un esquimese che dal polo scendesse a Roma lungo il meridiano e poi si mettesse a viaggiare lungo il parallelo lo troverebbe pi` u corto che 2π volte la distanza Roma-polo; l’esquimese spiegherebbe questo fatto con la sfericit`a della Terra. Quindi anche il risultato del marinaio pu` o essere descritto in termini di una geometria non euclidea. Per` o c’`e un effetto dinamico del suo moto lungo una circonferenza di raggio R con velocit`a v. Si tratta della forza centrifuga F = mv 2 /R, per cui il suo riferimento non `e inerziale. La relativit` a della geometria apre la strada verso l’inclusione di riferimenti accelerati. Noi potremmo ripetere l’esperimento nel vuoto interstellare, ed otterremmo lo stesso risultato con un ardimentoso astronauta invece del marinaio. Ma se al centro della circonferenza ci fosse una stella di massa M , la forza sentita dall’astronauta sarebbe F = mv 2 /R − GM/R2 . Scegliendo opportunamente i parametri la forza F pu` o annullarsi, cio`e il nostro astronauta pu`o ritrovarsi in caduta libera! Per` o per R un p` o minore prevarrebbe l’attrazione della stella, per R un p` o maggiore prevarrebbe la forza centrifuga. Rimane il fatto che localmente campo di gravit`a e sistema accelerato sono in fondo la stessa cosa. Questo `e il principio di equivalenza. Buttando dalla torre di Pisa due sfere dello stesso raggio, ma l’una di legno e l’altra di piombo, Galileo dimostr`o sperimentalmente che toccavano terra insieme. Aristotele aveva
6.4 Principio di equivalenza
101
detto che arrivava ben prima la massa pesante. Com’era arrivato Galileo ad un risultato che superava un millennario errore sostenuto dall’autorit` a e indovinava il risultato di esperimenti che i posteri avrebbero continuato a fare per secoli con accuratezza sempre migliore? Lui probabilmente immagin`o un esperimento: prendiamo due corpi leggeri, che secondo Aristotele devono cadere piano, e colleghiamoli con un filo tenue quanto vogliamo: avremo fatto un corpo pesante, che per Aristotele deve cadere rapidamente. Il fatto che un sistema accelerato `e localmente indistinguibile da uno in cui c’`e un campo di gravit` a `e ormai accertato con grande precisione. Einstein lo afferm` o come principio di equivalenza. La massa inerziale entra nella legge F = ma; quella gravitazionale `e sorgente della forza newtoniana. Il principio ` in fondo questa la ragione per cui gli di equivalenza dice che sono uguali. E astronauti in orbita galleggiano per aria. Molti esperimenti sempre pi` u raffinati sono stati fatti nei secoli per confermare o smentire questa identificazione; a chi lo smentisse `e garantito il premio Nobel. Il principio di Relativit` a Generale sancisce che le leggi della Fisica sono le stesse equazioni per tutti gli osservatori. La distinzione fra inerziali e non inerziali scompare nel senso che trasformando da un sistema ad un altro si pu` o tenere conto della differenza; quello che i diversi osservatori vedono pu` o differire in questa teoria anche pi` u drasticamente che in meccanica classica. La teoria della Relativit` a Generale fornisce una espressione matematica compiuta a questi principi e ne trae conseguenze di importanza astrofisica e cosmologica. Consideriamo un osservatore che si trova in una cabina di astronave; lasciando cadere dall’altezza di 1 metro una massa qualsiasi, la vedr` a accelerare verso il basso con accelerazione g, quella di gravit` a; lui stesso sta in piedi e non galleggia nell’aria perch´e c’`e la gravit` a. Lui conclude che probabilmente l’astronave `e a terra, o forse vola come un aereo, ma sente la gravit`a del pianeta. Per` o non `e detto: l’astronave potrebbe essere nello spazio profondo, dove la forza di gravit` a `e trascurabile, ma soggetta ad una accelerazione g verso l’alto. Secondo il principio di equivalenza, nessun esperimento condotto all’interno dell’astronave pu` o distinguere le due situazioni. Ma allora supponiamo che un raggio di luce entri orizzontalmente da un forellino in una parete dell’astronave. In un sistema inerziale, esso si propaga in linea retta. Nell’astronave accelerata verso l’alto il raggio dovrebbe incurvarsi e colpire la parete opposta pi` u in basso, perch´e nel tempo in cui traversa l’astronave questa si `e mossa. Ma allora, secondo Einstein, in un campo di gravit` a la luce pesa e cade. Un’altra conseguenza importante, e sperimentalmente osservata, `e il red shift gravitazionale. La luce che proviene dalle stelle `e arrossata dal campo di graa prodotto da tali grandi masse. Per capirlo, possiamo nuovamente usare vit` l’astronave accelerata verso l’alto con accelerazione g. Supponiamo che una sorgente sia ad altezza h rispetto al rivelatore; durante il percorso che dura un tempo ∆t ∼ hc l’astronave cambia la sua velocit` a di ∆v ∼ gh c ; per effetto Doppler, la luce nel rivelatore avr`a uno spostamento relativo verso il violetto
102
6 Teoria della Relativit` a
gh ∆v di ∆ν a, gh = ∆Φ viene interpretato come ν ∼ c ∼ c2 . In un campo di gravit` una differenza di potenziale gravitazionale. Quindi in un campo di gravit` a ∆ν ∆Φ . La luce cadendo verso la stella si sposta verso il blu, ma risalendo ∼ ν c2 dalla stella verso di noi si arrossa. Il rapporto a secondo membro pu` o essere scritto come rapporto fra due ; energia acquistata cadendo diviso energia di riposo. Che accaenergie, m∆Φ mc2 drebbe se un campo fosse cos`ı importante da dare come rapporto 1? La luce si fermerebbe, e non potrebbe pi` u uscire. In questi casi si parla di buco nero. Ad ogni massa M `e associato il raggio di Schwarzschild r = 2GM c2 (1,5 km per il sole, 0.44 cm per la terra); sotto queste dimensioni lineari qualsiasi corpo collassa. L’apparato matematico necessario per trattare campi forti richiede uno studio speciale che `e fuori dal programma del corso.
6.5 Una scoperta recente Le ricerche in questo campo sono in pieno sviluppo. Per esempio, da un lancio di agenzia di Venerd`ı 22 Ottobre 2004, si apprende che `e stata ottenuta la prova sperimentale del fatto, previsto da Einstein, che corpi rotanti distorcono lo Spazio-Tempo. In altri termini, i corpi dotati di moto di rotazione attorno al proprio asse trascinano e deformano lo spazio-tempo in cui sono inseriti. Cos`ı la rotazione della terra modifica le orbite dei satelliti. La prova `e arrivata dai satelliti artificiali Lageos I, una sonda della NASA, ed un satellite prodotto congiuntamente da NASA e dall’Agenzia Spaziale Italiana, ed i risultati sono stati pubblicati su Nature. Il fenomeno `e stato misurato da fisici della NASA ed dell’Universit` a del Maryland diretti da Erricos Pavlis, del Centro Comune per la Tecnologia del Sistema Terra. Pavlis ha detto che per mettere in evidenza questo effetto `e stato mecessario misurare la distanza dalla Terra alla Luna con una precisione millimetrica.
Parte II
Meccanica Quantistica
7 Meccanica quantistica: Perch´ e?
Questa teoria ha molti aspetti contrari all’intuizione classica, ma forse il pi` u strano di tutti `e che la descrizione della natura debba essere fatta in termini di numeri complessi, quelli che un tempo si chiamavano numeri impossibili. Fra le costanti fondamentali della natura quella di Planck1 h ha le dimensioni di un’azione, [h = energia × tempo], o anche [h = momento angolare]. h = 1.05410−34Js. I h ∼ 6, 62619610−34Js. Spesso si usa la notazione ¯h = 2π fenomeni in cui h `e importante sono quantistici, mentre quelli in cui le azioni in gioco sono grandi ed h si pu` o trascurare sono classici. Molti fenomeni macroscopici possono essere descritti classicamente, ma la teoria fondamentale `e quantistica. La crisi della fisica classica all’inizio del 900 deriv` o dalla manifesta incapacit`a di spiegare relativamente pochi fatti che allora si conoscevano. Senza h non si pu` o capire come gli atomi possano essere stabili, mentre la teoria classica predice che cariche accelerate irraggino una potenza W =
2 e2 2 a , 3 c3
dove e `e la carica, e a l’accelerazione; eppure questa legge spiega benissimo il funzionamento di un’antenna. Ancor meno si spiega il legame chimico. Le teorie di molecole, atomi, nuclei e particelle sono quantistiche. Ma quando si prese confidenza col formalismo quantistico si riconobbe che esso era capace di spiegare anche i fenomeni macroscopici. Classicamente, i metalli non dovrebbero avere coesione, quindi dovrebbero esplodere; i comuni fenomeni magnetici, noti gi` a agli antichi, non dovrebbero esistere. Teorema di Bohr-van Leeuwen Per un elettrone classico in campo magnetico nell’insieme canonico, 1
Max Planck (Kiel nello Schleswig-Holstein 1858-Gottinga 1947) fisico tedesco, Nobel nel 1918.
106
7 Meccanica quantistica: Perch´e?
Z=
d3 x
d3 p exp[−
(px − eHy/c)2 + p2y + p2z ], 2mKB T
ma con un cambiamento della variabile px si trova che Z = V (2πmKB T )3/2 non dipende affatto dal campo,e questo argomento si estende a qualsiasi sistema. Quindi il magnetismo non dovrebbe esistere, in contrasto con l’esperimento. Anche la superconduttivit` a e la superfluidit` a sono fenomeni quantistici macroscopici. I successi della teoria quantistica in meno di un secolo sono stati spettacolari, e di molti fenomeni possediamo ora una descrizione quantitativa estremamente accurata in un senso prima ignoto: le predizioni quantistiche in Fisica Atomica sono verificate con grande precisione, talora 10 e pi` u cifre decimali. In nessun altro campo l’Uomo `e arrivato ad un simile grado di conoscenza. La teoria relativistica `e ben nota, ma in questo corso ci limiteremo per semplicit` a ad una introduzione alla teoria quantistica non relativistica, che pur essendo una parte del vero basta gi`a a capire qualitativamente fatti importanti come il legame chimico e lo stato solido.
7.1 Corpuscoli ed onde in Fisica classica In Fisica classica, si incontrano due tipi di oggetti fondamentali, corpuscoli ed onde. I concetti di onda e corpuscolo sono ben distinti. Un corpuscolo `e un punto materiale che obbedisce alle equazioni canoniche e quindi segue traiettorie deterministiche; se nessuna forza lo deflette, il moto `e rettilineo e uniforme. Le onde sono descritte come soluzioni di una ben definita equazione differenziale; si propagano in un mezzo elastico o nell’etere come campi continui, ed in presenza di ostacoli danno luogo a fenomeni di interferenza e diffrazione. Newton pensava che la luce fosse fatta di particelle. Per un certo tempo, verso la met`a dell’800, questa idea fu accantonata, in favore delle onde elettromagnetiche che vengono dalla teoria di Maxwell.Le onde elettromagnetiche sono, appunto, semplicemente onde, funzioni continue dello spazio-tempo. L’ipotesi corpuscolare di Newton era stata abbandonata, come gi`a l’ottica geometrica, a seguito di esperimenti di diffrazione, come il seguente. → − Un’onda piana monocromatica di vettore d’onda k = (k, 0, 0) parallelo all’asse x incontra uno schermo e passa attraverso una fenditura per y ∈ (−a, a) per poi impressionare una lastra fotografica. Per fissare le idee prendiamo l’onda polarizzata lungo l’asse z con campo elettrico E = (Ex , Ey , Ez ) = Re(0, 0, Eeikx ).
(7.1)
Il fascio non cambia n`e di frequenza n`e di polarizzazione, ma subisce una diffrazione di Fraunhofer, prevista dalle equazioni di Maxwell e ben visibile se
7.1 Corpuscoli ed onde in Fisica classica
107
ka `e dell’ordine di 1. Sulla lastra fotografica non compare una immagine netta della fenditura, come se avessimo sparato dei pallini di piombo con un fucile da caccia; l’intensit` a invece di essere costante e crollare a 0 `e una funzione I(θ) dell’angolo di deflessione. Sperimentalmente, l’intensit` a deflessa di un θ va come sin2 (kaθ) dθ. dI ∝ (kaθ)2 Questa ci ricorda la rappresentazione (3.6) della δ, δα (x) =
x sin2 ( α ) 2
π( xα )
; pi` u la
fenditura `e stretta pi` u la figura di diffrazione si allarga. Al di l` a dallo schermo il vettore d’onda della parte deflessa di un piccolo angolo θ rispetto all’asse x ha acquistato una componente y. Il vettore d’onda deflesso ha lo stesso modulo k di quello incidente, e quindi la componente y risulta |q| = k sin(θ) ∼ kθ.
y
x
Fig. 7.1. Grafico di sin2 (3x)/x2 per x da −3 a 3
La Fisica classica spiega benissimo queste cose. Se l’onda incidente `e piana, con ampiezza E costante (indipendente cio`e da y), quella ritagliata dalla fenditura deve annullarsi sullo schermo, ed essere una θ(a2 − y 2 ). Ma a sin(qa) dyeiqy = 2 , q −a ed applicando il teorema di Fourier la parte dell’onda che passa attraverso la fenditura si scrive 1 ∞ sin(qa) 2 2 θ(a − y ) = dqe−iqy π −∞ q come un pacchetto d’onde. Facendo la sostituzione E → Eθ(a2 − y 2 ) nella (7.1) viene
108
7 Meccanica quantistica: Perch´e?
sin(qa) . πq Un punto della lastra che si trova ad un angolo θ 1 riceve una componente il cui vetture d’onda `e deflesso; kq = tan θ ∼ θ. Ez ∝ ei[kx−kθy] sin(kθa) πkθ Inoltre, bisogna notare che questa `e l’ampiezza del campo, ma l’intesit`a, che viene misurata dalla lastra, va col modulo quadrato. Si noti che Ez = E
dqei[kx−qy]
E `e un’ampiezza, e l’intensit` a va con |E|2 Cos`ı tutto sembra chiaro. La diffrazione `e un fenomeno tipicamente ondulatorio.
7.2 Dualismo onda-corpuscolo La Fisica classica non spiega per`o quello che si osserva se l’intensit` a `e molto debole. Si nota che l’assorbimento `e un fenomeno del tipo s`ı-no: i pixel della figura sulla lastra o sono impressionati o non impressionati, non ci sono mezze misure. Muovendosi dalle zone di intensit` a pi` u bassa a quelle di pi` u illuminate cambia solo la probabilit` a che il pixel lo sia. Max Planck introdusse h nel 1900 per sanare la teoria del corpo nero, eliminando la catastrofe ultravioletta. Fu per` o Einstein nel 1905 a capire per primo che la luce e emessa ed assorbita in quanti, cio`e `e fatta di fotoni di energia quantizzata E = hν = h ¯ ω. Solo in questo modo si spiegava l’effetto fotoelettrico: gli esperimenti dicevano che la radiazione estrae elettroni dalle superfici se la sua frequenza supera una certa soglia, che dipende dal materiale. L’intensit` a della corrente `e proporzionale all’intensit` a della radiazione. Il legame fra frequenza e vettore d’onda `e quello classico, ω = ck. Cos`ı anche il momento `e quantizzato, ed il quanto di ogni fotone di vettore d’onda k era p=h ¯ k. Un fotone si propaga come un’onda, ma `e sempre assorbito in un punto, come un corpuscolo. Questo fatto `e confermato da innumerevoli osservazioni. De Broglie (1924) argoment`o che se alle onde elettromagnetiche sono associati i fotoni, cos`ı ad una particella materiale (ad esempio un elettrone) di − momento → p deve essere associata una funzione d’onda complessa, → − → − ψ ∝ ei k · r → − − con → p =h ¯ k . Il modulo quadrato dell’onda `e proporzionale all’intensit` a osservata del fascio elettronico. Vediamo subito un esperimento per mettere in evidenza il dualismo onda-particella. Un fascio di elettroni di momento p parallelo all’asse x incontra uno schermo e passa attraverso una fenditura per y ∈ (−a, a) per poi impressionare una lastra fotografica (o meglio un sistema rivelatore-analizzatore moderno). Il fascio non cambia la sua energia cinetica, ma subisce anch’esso una diffrazione di Fraunhofer.
7.2 Dualismo onda-corpuscolo
109
y
x
a -a
Schermo
cannone elettronico
Fig. 7.2. Esperimento di diffrazione di un fascio elettronico attraverso una fenditura: il fascio elettronico dal cannone C arriva nel punto P sul piano del rivelatore (lastra fotografica, contatore geiger, etc.). L’asse z `e ortogonale al piano della figura. Sullo schermo si osserva la figura di diffrazione
L’intensit` a deflessa di un piccolo angolo θ rispetto all’asse x va ancora sin2 (kaθ) come dI = (kaθ)2 dθ. Ma questo comportamento ondulatorio contrasta con la meccanica classica ed `e in accordo con l’ipotesi di De Broglie (e infatti non si → − → − vede nulla se ka 1) . Di nuovo, se l’onda incidente `e ψ ∝ ei k · r , con vettore → − d’onda iniziale k = (k, 0, 0), quella trasmessa `e ψ ∝ dqei[kx−qy] sin(qa) πq . Come prima, per piccoli angoli, |q| ≈ kθ; il problema si pu` o capire se si ammette che questa ψ `e un’ampiezza, e l’intensit` a va con |ψ|2 . Per le stesse ragioni un fascio di elettroni diffrange dalla superficie di un cristallo, cosa che oggi `e usata in tecniche analitiche come il LEED (low energy electron diffraction). La teoria quantistica non fa un compromesso fra i punti di vista corpuscolare ed ondulatorio. Non fa giochi di parole come quelli dei filosofi. Fa delle predizioni di estrema precisione basate su un apparato matematico i cui primi autori sono stati nel 1925, indipendentemente, Schr¨ odinger ed Heisenberg.
110
7 Meccanica quantistica: Perch´e?
7.3 Da dove passa la particella? Si pu` o fare un esperimento con una doppia fenditura che mostra in modo ancor pi` u spettacolare il carattere ondulatorio della materia (Figura 7.3). L’intensit` a va come 1 + cos[k(l1 − l2 )], dove l1 , l2 sono le lunghezze dei due cammini. Tappando uno dei buchi si osserva lo schema di diffrazione dell’altro, ma si distrugge la chiara interferenza che c’`e fra le due onde emergenti. L’intensit` a del fascio pu` o essere resa cos`ı bassa che in un dato momento non `e mai presente pi` u di un elettrone; quindi la sola particella che `e in gioco deve in qualche modo interferire con se stessa. Inoltre, non si pu`o sapere da quale fenditura `e passato l’ elettrone; se si chiude una delle fenditure lo schema di interferenza scompare. Negli anni intorno al 1960 i teorici Bohm e Aharonov suggerirono che lo schema di diffrazione fosse sensibile ad un solenoide posto dietro la fenditura e schermato in modo che la regione dove c’era il campo magnetico non fosse accessinile agli elettroni. La proposta incontr` o molto scetticismo, ma l’esperimento conferm`o le previsioni teoriche. Classicamente, gli elettroni dovrebbero essere soggetti solo alla forza di Lorentz dovuta all’attraversamento del campo magnetico, ed invece lo schema di interferenza dipende dalla corrente nel solenoide. C’`e quindi una interazione col campo elettromagnetico che `e ignota alla Fisica classica ed `e prevista dalla meccanica quantistica. Questi
b
cannone elettronico c
d
P
Schermo
a
Fig. 7.3. Esperimento della doppia fenditura: il fascio elettronico dal cannone C arriva nel punto P sul piano del rivelatore (lastra fotografica, contatore geiger, etc.) attraverso due cammini di lunghezza l1 = a + b ed l2 = c + d. Sullo schermo si osserva l’interferenza
con le fenditure erano inizialmente solo esperimenti pensati, cos`ı come p = h ¯k era una congettura di un brillante laureando (De Broglie). Oggi sono ben fattibili ed introducono nel modo pi` u naturale la funzione d’onda ψ. Maggior merito per questo va a Schr¨ odinger ed a Heisenberg che fecero correttamen-
7.3 Da dove passa la particella?
111
te gli esperimenti pensati! Correntemente2 , si fanno interferire fasci di atomi sottoponendoli a campi elettrici per misurarne la polarizzabilita. La doppia fenditura non `e materiale ma `e ottenuta con fasci laser. A
A
B
SST
SST B
S Esperimento 1
S Esperimento 2
Fig. 7.4. Esperimento 1: con uno specchio semitrasparente, il fotone va in A o in B con uguale frequenza. Esperimento 2: con un doppio specchio semitrasparente e 2 specchi riflettenti l’esito `e deterministico: il fotone finisce con certezza in A
Nuovi esperimenti molto significativi sono stati descritti recentemente da D. Deutsch3 Essi sono fatti con particelle di luce, cio`e fotoni. Consideriamo una sorgente S che emette luce contro uno specchio semitrasparente SST, analogo a quello usato nell’esperimento di Michelson-Morley (Figura 7.4). Se si fa l’esperimento con luce intensa, i rivelatori A e B ricevono ciascuno met`a dell’intensit` a incidente sullo specchio semitraspatente; le equazioni di Maxwell descrivono bene la situazione. Per` o si pu` o decrescere l’intensit` a fino ad avere un fotone alla volta, per esempio riducendo il flusso di energia a un quanto hν al secondo. Eseguendo la misura con un fotone alla volta, questo va in A o in B con la stessa frequenza. Uno potrebbe pensare che giunto in SST il fotone sceglie a caso dove andare. Ebbene, l’interpretazione non `e un problema filosofico da affrontarsi con qualche argomento a priori, ma un problema fisico da risolvere con un esperimento appropriato. L’esperimento 2 della Figura 7.4, eseguito con un fotone alla volta, risolve la questione e dimostra per` o che il fotone non sceglie a caso; infatti va sempre nel rivelatore A e mai in B. In qualche modo la particella esplora ambedue i percorsi che si dipartono dal primo specchio smitrasparente; infatti basta se se ne blocca o modifica uno , ad esempio mettendovi un mezzo trasparente, il rivelatore B comincia a contare fotoni. Se l’esperimento viene fatto con luce intensa, lo si pu`o interpretare correttamnte in modo classico con le equazioni di Maxwell. Nella → − gauge di Lorentz, il potenziale vettore A obbedisce all’equazione delle onde; → − → − a risolvendola possiamo calcolare il campo elettrico che `e E = ∂ A e l’intensit` ∂t
2 3
Vedere ad esempio A. Miffre et al., cond − mat0506106 Vedere ad esempio David Deutsch, Arthur Ekert and Rossella Lupacchini, math.HO/9911150.
112
7 Meccanica quantistica: Perch´e?
→ −2 della luce proporzionale a E . Vi `e un’onda parziale in ambedue i percorsi, ed il risultato `e che tutta l’intensit` a va in A per interferenza costruttiva, e nessuna intensit` a va in B per interferenza distruttiva. Questo fa pensare che anche nel caso di un fotone alla volta l’equazione d’onda `e utile. Il quadrato del potenziale vettore ha a che fare con la probabilit` a di trovare il fotone. Questa interpretazione va bene anche per il primo esperimento di Fig. 7.4: anche l`ı l’onda si divide in due, finch´e la misura della posizione del fotone non la distrugge determinandone la posizione. Nel caso di particelle materiali, come elettroni o atomi, che cosa useremo come equazione delle onde? La risposta `e: l’equazione di Schr¨odinger. 7.3.1 Onda piana e principio di sovrapposizione Nel caso delle onde elettromagnetiche, un’onda piana monocromatica si pu` o pensare come fatta di fotoni che hanno la stessa energia e lo stesso impulso, proporzionale al vettore di Poynting. L’analogia di De broglie suggerisce che l’ampiezza dell’onda incidente dell’esperimento della doppia fenditura, fatta di elettroni tutti con lo stesso impulso, sia piana. Questa funzione d’onda che svolge un ruolo simile al campo elettrico4 `e una grandezza complessa del tipo − − − i(→ p ·→ x − E(→ p )t) → − ], ψ− → p ,E ( x , t) ≈ exp[ h ¯
(7.2)
→ − − con → p = h ¯k, E = h ¯ ω. Nel caso elettromagnetico, l’intensit` a della luce `e proporzionale al quadrato del campo. La probabilit` a di trovare l’elettrone in 2 → − → − x , t `e proporzionale a |ψ− → p ,E ( x , t)| ; questa `e costante, quindi non si ha nessuna idea di dove l’elettrone sia. L’analogia con l’elettromagnetismo ed i fenomeni di interferenza e diffrazione suggeriscono che la teoria sia lineare. Vale infatti il principio di sovrapposizione: una combinazione lineare di funzioni d’onda `e una possibile funzione d’onda. Il modo pi` u semplice per estrarre dalla ψ l’impulso `e il seguente. Introducendo l’operatore impulso → − → − p op = (−i¯ h) ∇ (7.3) ed osserviamo che
→ − → − → (x). p op ψ− → p ,E (x) = p ψ− p ,E
Matematicamente, questa `e una equazione agli autovalori: si dice che ψ− → p ,E `e − autofunzione dell’operatore impulso con autovalore → p . Per avere una funzione → − → − reale, occorre combinare ψ− → − p ,E ( x , t) con ψ−→ p ,E ( x , t). La funzione d’onda che ha momento definito `e complessa, e rappresenta un’onda di probabilit` a. 4
Pi` u esattamente. l’analogia `e col potenziale vettore, ma qui non stiamo a sottilizzare.
7.4 Operatori
113
7.3.2 Principio di indeterminazione In uno stato di onda piana, la posizione della particella `e del tutto indeterminata. In uno stato pi` u generale, cio`e un pacchetto d’onde5 − − − 1 i(→ p ·→ x − E(→ p )t) → − → − → − ]. (7.4) ψ( x , t) = d p g( p ) exp[ h ¯ (2π)3/2 (Il fattore (2π)13/2 sar` a spiegato nel seguito.) Ora, la posizione media del pacchetto `e da calcolare come una media statistica con l’onda modificata − ψ(→ x , t): − − − − − − − − x ψ(→ x , t). (7.5) x ψ(→ x , t)∗ → <→ x >= d→ x→ x |ψ(→ x , t)|2 = d→ − Qui, g(→ p ) ha il senso di un’ampiezza di probabilit` ache l’elettrone ab− − bia impulso → p . In effetti, g(→ p ) si chiama anche funzione d’onda nella − rappresentazione → p. → − − Ora, se g( p ) `e piccata intorno a un valore → p 0 , l’incertezza sulla posizione dell’elettrone `e grande. Nel limite di una δ, si ritrova l’onda piana. Se − − − − − g(→ p ) = exp(i→ p ·→ x 0 ), il pacchetto diventa proporzionale ad una δ(→ x −→ x 0 ) e la particella `e perfettamente localizzata. Se decresce l’incertezza ∆p sull’impulso cresce quella ∆x sulla posizione, e le due grandezze non possono essere simultaneamente determinate. Questo suggerisce il principio di indeterminazione di Heisenberg h ¯ ∆p∆x ≥ 2 che vedremo in modo pi` u formale nella Sezione 10.2.6.
7.4 Operatori Per analogia con la (7.5), dobbiamo aspettarci che − − − − <→ p >= d→ p→ p |g(→ p )|2 ;
(7.6)
`e logico cercare un algoritmo che ci dia il risultato agendo direttamente su − ψ(→ x , t) invece che sulla sua componente di Fourier g. Vedremo subito che → − − − − − d→ x ψ(→ x , t)∗ (−i¯ h) ∇ψ(→ x , t) =< → p >. (7.7) Infatti, 5
La funzione avr` a sempre una trasformata di Fourier, almeno nello spazio delle distribuzioni.
114
7 Meccanica quantistica: Perch´e?
− −i¯ h∇ψ(→ x , t) =
1 (2π)3/2
− − − i(→ p ·→ x − E(→ p )t) − − − ], d→ p g(→ p )→ p exp[ h ¯
e dalla (7.4) si ha − ψ(→ x , t)∗ =
1 (2π)3/2
→ − → − − → − → − x − E( p )t) −i( p · → ]. d p g ∗ ( p ) exp[ h ¯
(7.8)
− Formiamo l’integrale (7.7) ed integriamo immediatamente su d→ x usando l’ortogonalit` a → − → − → − − − − p −→ p ), d→ x ei[ p − p ]· x = (2π)3 δ(→ che `e un noto risultato dell’analisi di Fourier; si trova in effetti → − − → − → − → − − − − − − − d→ x ψ(→ x , t)∗ (−i¯ h) ∇ψ(→ x , t) = d→ p d p δ(→ p − p )g ∗ ( p )g(→ p )→ p da cui segue immediatamente la (7.7). A questo `e servito il fattore (2π)13/2 nella (7.4). Questo risultato dice che possiamo avere la media dell’impulso usando una ψ(x) introducendo l’operatore impulso della (7.3), → − → − p op = (−i¯ h) ∇. Ci deve essere una corrispondenza fra variabili classiche ed operatori quanti− − − − p →→ p op . In generale, se stici per cui, agendo su una ψ(x), → x →→ x op = x, → A `e una grandezza che si pu`o misurare, o come si dice un osservabile, ci deve essere un operatore Aˆ tale che − − − x , t). < A >= d→ x ψ(→ x , t)∗ Aˆ ψ(→ p2 Dobbiamo trovare cosa corrisponde a energia cinetica Tˆ = 2m , il momento ˆ angolare L = r ∧ p, etc.. Queste grandezze sono funzioni delle coordina→ − te e dell’impulso: sostituendo p con (−i¯ h) ∇, li convertiamo megli operatori corrispondenti.
Commutatori Usando una funzione di prova φ si constata che [p, x]− φ(x) ≡ (px − xp)φ(x) = −i¯ hφ(x), ovvero, gli operatori x ˆ, pˆ non commutano, ma [p, x]− = px − xp = −i¯ h. Questa regola di commutazione prende il posto della parentesi di Poisson classica. Bisogna abituarsi a lavorare con operatori che non commutano. Esempio 5. (x − ip)(x + ip) = x2 + p2 + h ¯.
7.5 Interpretazione di Copenhagen
115
7.5 Interpretazione di Copenhagen La funzione d’onda `e una ampiezza di probabilit` a. Ad esempio, in un problema unidimensionale, b dx|Ψ (x, t)|2 Pab = a
`e la probabilit` a di trovare la particella in (a, b) al tempo t. In altri termini, ρ(x, t) = |ψ(x, t)|2 `e una densit` a di probabilit` a normalizzata a 1 con ∞ dxρ(x, t) ≡ 1. −∞
Un approccio probabilistico era apparso nella fisica teorica con Gibbs e Boltzmann, agli albori della meccanica statistica. Qui il discorso `e del tutto diverso, riguarda 1 elettrone e non un enorme numero di particelle, e la temperatura non entra nel problema.6 Nelle applicazioni classiche la statistica entrava perch´e noi disponiamo di una descrizione incompleta del sistema. Se conoscessi lo stato interno di una slot machine potrei predire con certezza il momento opportuno di metterci la monetina; poich´e non lo conosco, posso solo parlare di probabilit` a. Nell’interpretazione di Copenhagen, proposta da Bohr e colleghi, la funzione d’onda ψ contiene una descrizione statistica che `e per` o la pi` u completa possibile. La particella non ha una traiettoria classica e non ha valori ben definiti degli osservabili, tranne quelli i cui operatori hanno ψ come autofunzione. Il mondo microscopico `e tanto diverso da quello macroscopico; non `e strano che una particella non abbia una posizione precisa come avrebbe un corpo classico; d’altra parte i fisici sanno che una particella ed i suoi stati possono avere molte qualit` a (spin, isospin, elicit` a, colore, parit` a intrinseca, fasi, etc.) che i corpi classici non hanno. Quindi la descrizione statistica non `e, come nei casi usuali, dovuta a incompleta informazione. Di quale probabilit` a si tratta? Il significato fisico `e il seguente. Supponiamo che io voglia determinare la distanza dell’elettrone dal nucleo dell’atomo di H. Se preparo un atomo di H e faccio la misura posso ottenere qualsiasi valore. Se preparo un gran numero di atomi di H tutti nelle stesse condizioni e su − ciascuno faccio la misura trovo valori distribuiti secondo una legge |ψ(→ r )|2 e posso determinare r come media statistica della distribuzione. Questo non `e come ripetere molte volte la misura sullo stesso atomo di H, perch´e l’atto di misurare la posizione disturba il sistema. Se trovo la particella − − in → x , immediatamente dopo la sua funzione d’onda `e piccata intorno a → x, per un fenomeno che si chiama collasso della funzione d’onda. Per` o ci sono 6
In realt` a esiste pi` u di una analogia: c’`e un collegamento profondo fra meccanica quantistica e meccanica statistica, ma a questo livello il nesso `e nascosto.
116
7 Meccanica quantistica: Perch´e?
anche grandezze che hanno valore ben definito. se misuro su molti atomi di H l’energia di legame, trovo sempre 13.59 eV. Se misuro una componente del → − − − momento angolare L = → r ∧→ p il risultato `e sempre 0. Se conosciamo la funzione d’onda, possiamo calcolare valor medio di una funzione arbitraria f (x) definito da ∞ f (x) = dxρ(x, t)f (x). −∞
Questo valore medio viene sovente chiamato valore di aspettazione, anche se tutti capiscono che `e una impropriet` a di linguaggio. Infatti, uno pu` o facilmente immaginare per esempio una distribuzione di probabilit` a simmetrica intorno a x0 e che ivi si annulla; in tali circostanze x0 sarebbe un valor medio ma certo non un valore atteso. In particolare, abbiamo ∞ dxρ(x, t)x, x = −∞
e {x − x} =
∞
−∞
dxρ(x, t) {x − x} = 0.
Possiamo misurare la larghezza della distribuzione introducendo la deviazione standard σ definita fa ∞ 2 2 σ 2 = {x − x} = dxρ(x, t) {x − x} . −∞
Svolgendo il quadrato, si trova σ 2 = x2 − x2 ,
dove x = 2
∞
dxρ(x, t)x2 .
−∞
In questo modo possiamo quantificare il grado di incertezza della x in uno stato quantico definito dalla ψ. Non mancano sottili problemi nella interpretazione, che potrebbero avere conseguenze osservabili. Non tutti gli aspetti sono stati capiti, ad esempio nella regione di confine fra la fisica classica e quella quantistica. Un paradosso famoso `e quello del gatto di Schr¨ odinger . Un atomo pu` o essere preparato in uno stato ψ = c1 ψ1 + c2 ψ2 , dove c1 , c2 sono numeri complessi e ψ1 , ψ2 sono autofunzioni ortogonali di un osservabile A corrispondenti ad autovalori a1 , a2 . Una misura di A fa collassare la ψ ed obbliga il sistema a scegliere fra i due autovalori. Ebbene, il gatto di Schr¨ odinger potrebbe essere preparato in una sovrapposizione di gatto vivo e gatto morto, e stare in uno stato misto finch´e non viene osservato?
7.5 Interpretazione di Copenhagen
117
Einstein pensava che la teoria fosse incompleta (diceva che Dio non gioca a dadi.) Ci sono esperimenti che si fanno per approfondire queste importanti questioni. Tuttavia l’interpretazione di Copenhagen `e sempre stata confermata e noi ci atterremo ad essa. Accanto al modulo, la funzione d’onda ha anche una fase. Perch´e le leggi fondamentali della natura devono essere formulate in termini complessi? Non `e forse vero che le misure danno sempre risultati reali? Come abbiamo visto, una funzione d’onda di momento definito `e complessa; la fase `e necessaria perch´e si abbia interferenza. La funzione d’onda non `e osservabile; `e analoga ai potenziali elettromagnetici che determinano il campo ma non sono osservabili. Del ruolo della fase riparleremo pi` u avanti.
8 Equazione di Schr¨ odinger
` una teoria abbastanza strana da prevedere il E comportamento di particelle che interferiscono con se stesse e passano attraverso le barriere. Ci` o che poi `e quello che succede. Cerchiamo se possibile di mantenere fra gli operatori le relazioni che valgono fra le variabili classiche. Quindi, 2
¯ ˆ =−h H ∇2 + V (ˆ x) 2m `e l’hamiltoniana divenuta operatore, o hamiltoniano, per una particella in un potenziale. Il formalismo hamiltoniano vale anche per sistemi a molte particelle, e possiamo scrivere hamiltoniani anche per sistemi complicati. Si pu` o osservare che l’onda piana di momento ed energia cinetica assegnate ha → − → → − ˆp ψ− → p ,E p ,E = p ψ− e quindi anche ˆ → = Hψ− Hψ− → p ,E p ,E , 2
(8.1)
p . Dalla (8.1) si intuisce una regola generale. Se la funzione dove H = 2m d’onda ψ `e autofunzione di Aˆ con autovalore a, possiamo scriverla come ψa ; la misura della grandezza corrispondente dar` a sempre l’autovalore. Nei problemi ˆ hanno energia ben stazionari, l’hamiltoniana `e l’energia; gli autostati di di H definita. ˆ valido nei casi stazionari Ci deve essere anche un operatore dell’energia E, e non. Per le ψE deve essere tale che
ˆ → = Eψ− Eψ− → p ,E p ,E . La risposta desumibile dalla onda piana (7.2) `e
120
8 Equazione di Schr¨ odinger
∂ Eˆ = i¯ h . ∂t
(8.2)
Nei problemi stazionari, una funzione d’onda che ha energia definita deve avere anche hamiltoniana dello stesso valore ed uno pu` o aspettarsi da quanto detto che valga l’equazione di Schr¨ odinger ˆ = Eψ; ˆ Hψ per` o il discorso si generalizza perch´e questa equazione determina l’evoluzione anche nei problemi non stazionari e per sistemi che non sono in autostati di niente. Per una particella in una energia potenziale V bisogna risolvere l’equazione differenziale alle derivate parziali 2 pˆ ∂ + V (ˆ x) ψ(x, t) = i¯ h ψ(x, t), (8.3) 2m ∂t d dove pˆ = −i¯ h dx . La (8.3), nota ψ(ˆ x, t = 0), permette di trovare l’evoluzione del sistema. Formalmente, per` o, siamo liberi di pensare che l’equazione classica H(p, q) = E diventa l’equazione di Schr¨ odinger che determina la funzione d’onda. Si parla tradizionalmente di onde, e di meccanica ondulatoria; ma l’equazione di Schr¨ odinger non `e realmente una equazione delle onde, se mai `e imparentata con una equazione di diffusione nella quale si trasforma prendende un tempo immaginario t → iτ. ` immediato constatare che l’onda piana (7.2) risolve per V = 0; inoltre, E ψ−→ − → p ,E , quindi una combinazione lineare arbip ,E ha la stessa energia di ψ− traria delle due ha sempre energia E. Un altro problema immediato `e, in una dimensione spaziale, quello del muro di potenziale V (x) = ∞, x < 0, V (x) = 0, x > 0, con la condizione ψE (x, t) = 0, x < 0;
ψE (x, t) ≈ sin(kx) exp[
−iE(p)t ], p = h ¯k h ¯
(8.4)
con l’esponenziale complesso che diventa un seno. Questa funzione d’onda rappresenta un fascio di elettroni sparato contro un muro di potenziale, dal quale rimbalza; quindi c’`e una componente1 con impulso p ed una riflessa con impulso −p. L’interferenza fra onda incidente ed onda riflessa annulla la funzione d’onda per kx multiplo di π. Quella appena presentata non `e una derivazione dell’equazione di Schr¨odinger; questa non pu`o in alcun modo essere dedotta dalla teoria classica.
8.1 Equazione per gli stati stazionari Uno stato di energia definita E deve soddisfare 1
Per la formula di Eulero, sin(α) =
eiα −e−iα . 2i
8.2 Equazione di continuit` a
121
ˆ Eψ(x, t) = Eψ(x, t), con l’operatore (8.2). La dipendenza dal tempo deve essere attraverso un Et fattore di fase e−i h¯ e la densit` a di probabilit` a di un tale stato `e indipendente dal tempo. Ponendo nella (8.3) la soluzione ψ(x, t) = ψ(x)e−i
Et h ¯
,
(8.5)
si ottiene la separazione delle variabili. La ψ(x) deve risolvere l’equazione indipendente dal tempo ˆ Hψ(x) = Eψ(x). Poich´e l’equazione di Schr¨ odinger `e lineare, il pi` u generale stato ψ(x, t) pu` o sempre essere scritto come sovrapposizione di stati stazionari.
8.2 Equazione di continuit` a Qui `e utile una analogia con l’elettromagnetismo. La densit`a di carica ρ e la → − − − densit` a di corrente J = ρ→ v (dove → v `e la velocit`a) sono legate, come `e noto, dall’equazione di continuit` a ∂ρ → − + ∇ J = 0. ∂t Integrando su un volume V si trova col teorema di Gauss d dQ → − → − → − J d S = 0. ∇ J d3 x = ρd3 x + + dt V dt V S
(8.6)
(8.7)
che lega la variazione della carica Q contenuta nel volume al flusso uscente della corrente. Questa legge esprime la conservazione della carica. Nella teoria di Schr¨ odinger la particella si conserva e dobbiamo considerare la densit` a di probabilit` a ρ(x, t) = |ψ(x, t)|2 e la densit` a di corrente di probabilit` a ad essa associata. Per particelle cariche queste sono proporzionali a densit` a di carica e di corrente elettrica. Vediamo il caso unidimensionale. Moltiplicando per ψ ∗ l’equazione −
∂ψ h ¯ 2 d2 ψ + V (x, t)ψ = i¯ h 2m dx2 ∂t
per ψ si trova l’equazione coniugata −
∂ψ ∗ h ¯ 2 d2 ψ ∗ ∗ + V (x, t)ψ = −i¯ h 2m dx2 ∂t
122
8 Equazione di Schr¨ odinger
e sottraendo si perviene a ∂ψ ∗ d2 ψ d2 ψ ∗ h ¯ ∗ ∂ψ − ψ − = i ψ ψ∗ 2 − ψ 2m dx dx2 ∂t ∂t cio`e −
dψ ∗ dψ h ¯ d ∂|ψ|2 −ψ . ψ∗ = 2mi dx dx dx ∂t
Risulta cos`ı che la densit`a di corrente di probabilit` a `e dψ ∗ dψ h ¯ −ψ J= ψ∗ . 2mi dx dx 1 (ψ ∗ pψ + c.c.). Poich´e Non `e poi un risultato cos`ı strano se si pensa che J = 2m `e certo che la particella deve essere in qualche posto, la funzione d’onda va normalizzata imponendo ∞ dx|ψ(x, t)|2 = 1. −∞
Una volta normalizzata, lo rimane per tutta l’evoluzione. In tre dimensioni J=
h ¯ [ψ ∗ ∇ψ − ψ∇ψ ∗ ] . 2mi
` necessario avere funzioni complesse se Se ψ `e reale, la corrente `e nulla. E voglimo descrivere fenomeni di trasporto.
8.3 Cenno alle formulazioni di Schr¨ odinger, Heisenberg e Feynman La teoria `e stata formulata indipendentemente nel 1925 da Erwin Schr¨odinger2 e da Werner Heisenberg 3 . In un primo tempo, Schr¨odinger diceva che la meccanica delle matrici di Heisenberg non lo convinceva, ed Heisenberg mostrava scarsa stima della teoria di Schr¨ odinger. Non ci volle molto per capire che i due approcci davano gli stessi risultati perch´e erano matematicamente equivalenti, ed anzi l’uno illuminava il significato dell’altro. Successivamente, alla fine degli anni ‘40 Richard Feynman4 ha proposto una nuova formulazione della meccanica quantistica, che rivela in modo pi` u chiaro il nesso con 2 3 4
Nato a Vienna nel 1887, successore di Max Planck come professore di Fisica a Berlino nel 1927; premio Nobel nel 1933. Mor`ı a Vienna nel 1961. Nato a W¨ urzburg in Germania nel 1901, premio Nobel nel 1932. Mor`ı a Monaco nel 1976. Nato a New York City nel 1918, dove mor`ı nel 1988; premio Nobel 1965.
8.3 Cenno alle formulazioni di Schr¨ odinger, Heisenberg e Feynman
123
la meccanica classica. Date due configurazioni del sistema q(t1 ), q(t2 ), per ogni cammino virtuale dall’uno all’altro `e definito l’integrale d’azione S. Le equazioni di Eulero Lagrange permettono di scegliere fra gli infiniti cammini virtuali quelli che sono permessi classicamente. Per la meccanica quantistica, invece, ogni cammino virtuale d`a un contributo alla funzione d’onda del sistema 2πiS ∆Ψcammino ∝ exp . h La formulazione di Feynman `e molto importante, ma `e pi` u complicata dal punto di vista matematico per la difficolt`a di sommare sui cammini (path integral) e quindi parleremo delle altre due.
9 Soluzioni in una dimensione
Dai casi semplici nasce l’intuizione.
9.1 Buca di potenziale a pareti infinite Consideriamo una particella intrappolata fra x = 0 e x = a dal potenziale ⎧ ⎨ ∞ per x < 0, V (x) = 0 per 0 < x < a, ⎩ ∞ per x > a. Dobbiamo risolvere
2
2
h ¯ d − 2m dx2 ψn (x) = En ψn (x), ψn (0) = ψn (a) = 0.
Si ottiene
π ψn (x) = C sin(χn x), χn = n , a dove n = 1, 2, . . . `e intero positivo (i numeri negativi danno di nuovo le stesse soluzioni).Inoltre ¯2 2 π2 h n . En = 2ma2 Osservazioni: 1. Lo spettro energetico `e discreto. 2. ψn ha n-1 nodi (cio`e ψn (x) = 0 ha n − 1 radici distinte.) Al crescere di N si accorcia λ e cresce E. 3. E1 `e lo stato fondamentale, gli altri sono stati eccitati. Notare che c’`e una energia di punto 0, cio`e E1 > 0. Questo `e dovuto al principio di indeterminazione: poich´e `e certo che la particella `e fra x = 0 e x = a, p2 ∼ E1 . possiamo dire che ∆x ∼ a, quindi ∆p ∼ h¯a e ∆ 2m
126
9 Soluzioni in una dimensione
4. ψn (x) `e reale e non porta corrente. La costante di normalizzazione si ottiene imponendo a a 2 2 |ψn (x)| dx = C dx sin2 (χn x) = 1. 0
0
Poich´e
dx sin2 (x) =
x sin(2x) − , 2 4
viene: a
1 dx sin (χn x) = χn
a=nπ χn
2
0
d(χn x) sin2 (χn x)
0 nπ 1 x sin(2x) a − = = , χn 2 4 2 0
le autofunzioni normalizzate sono ψn (x) =
x 2 sin nπ . a a
(9.1)
Osservazioni: 1. ψn (x) `e la somma di due onde piane di momento opposto e non ha p definito. Il valor medio di p `e: a d ψn (x)(−i¯ h) ψn (x)dx. p = ψn (x)|p|ψn (x) = dx 0 Questo risultato `e immaginario, ed `e unacatastrofe se non `e p = 0. Per` o a d non c’`e problema, perch´e l’integrale `e 12 0 dx dx ψn (x)2 = 0. 2. ψn (x) `e autostato di p2 . 3. {ψn (x)} `e un set completo e ortonormale di funzioni nell’intervallo (0, a), come `e noto dalla teoria delle serie di Fourier.
9.2 Particella libera e stati del continuo La funzione d’onda per la particella libera di momento p = h ¯ k rappresenta un elettrone in un fascio monocromatico e collimato ed `e, come sappiamo, l’onda piana exp[i(kx − ω(k)t)] √ . ψk (x, t) = 2π ` il momento di approfondire alcuni aspetti importanti. E
9.2 Particella libera e stati del continuo
127
9.2.1 La normalizzazione Abbiamo incontrato il fattore √12π nella (7.4), dove appare elevato al cubo perch´e in quel caso il problema era in 3d (tridimensionale); abbiamo visto che il suo il suo scopo `e quello di assicurare il corretto valor medio p secondo la (7.7). Il metodo di normalizzazione `e diverso da quello usato nel caso degli stati legati, quando si impone 1 = |ψ(x)|2 dx. Il motivo `e che ψk (x, t) non `e a quadrato integrabile sull’asse x, ed `e normalizzata sulla δ: ∞ dxψk (x, t)∗ ψk (x, t) = δ(k − k ). −∞
Tuttavia `e sempre possibile schematizzare le cose come se l’esperimento con il cannone elettronico avvenisse in una grande scatola di lato L; in una dimensione una funzione d’onda si scrive ψk (x, t) =
exp[i(kx − ω(k)t)] √ . L
Occorre scegliere i k in modo da avere l’ortonormalit` a del set di base sulla δ di Kroneker 1, m = n, δm,n = 0, m = n. Basta imporre condizioni al contorno periodiche eikL = 1;
(9.2)
esse sono verificate per un insieme discreto di k; sono accettabili solo quelli tali che 2πn kn = , n intero L e l’ortogonalit` a `e assicurata dalla teoria delle serie di Fourier. Tuttavia `e ovvio che se L `e grande nessuna conseguenza fisica ne dipende. La δ di Dirac offre un modo formale di andare al limite di una scatola infinita. In 3d, il volume `e V = L3 , e exp[i(kx − ω(k)t)] √ ψk (x, t) = . V 9.2.2 Velocit` a di fase di un pacchetto d’onde La legge di dispersione `e la dipendenza dell’energia dall’impulso; si hanno leggi diverse a seconda della particella ed anche della teoria. Per una particella
128
9 Soluzioni in una dimensione 2
p materiale E(p) = 2m nella teoria di Newton, ma E(p) = p2 c2 + m2 c4 nel caso relativistico; per un fotone, ω = ck. Leggi di dispersione pi` u esotiche descrivono la propagazione di eccitazioni in mezzi materiali. Bench´e l’equazione di Schr¨odinger non sia quella delle onde, tuttavia parliamo di onda piana perch´e `e una f (x − vp t), dove vp `e la velocit`a di fase. Con p2 k la legge di dispersione h ¯ ω(k) = 2m la velocit`a di fase viene vp = h ¯ 2m che `e p la met`a di v = m . Quindi per una particella non `e vp la velocit`a significativa, mentre per un fotone si trova c. D’altra parte non potremmo fare le due misure di posizione necessarie per determinre la velocit`a senza alterare lo stato del sistema. La velocit`a si pu` o solo inferire misurando l’impulso o la corrente. Calcolando con ψ la corrente conservata si trova J = v; ψ rappresenta quindi una corrente di particelle di 1 che vanno verso destra con velocit`a v. densit` a 2π
9.2.3 Velocit` a di gruppo di un pacchetto d’onde Supponiamo di studiare la propagazione di un pacchetto ∞ ψ(x, t) = dkφ(k)eikx e−iω(k)t −∞
preparato inizialmente in uno stato ψ0 (x) ≡ ψ(x, 0) =
dkφ(k)eikx
con φ(k) fortemente localizzata intorno a k = k0 . Questa `e la migliore approssimazione realizzabile di un’onda piana. Poich´e contano solo i k vicini a k0 , `e lecito approssimare la legge di dispersione con ω(k) ∼ ω(k0 ) + v(k − k0 ), v =
Resta
∞
ψ(x, t) =
dω(k) |k0 . dk
dkφ(k)eikx e−i[ω(k0 )+v(k−k0 )...]t ,
−∞
cio`e ψ(x, t) ∼ exp[i(−ω(k0 )t + k0 vt)]
dkφ(k) exp[i(k[x − vt])]
= exp[i(−ω(k0 )t + k0 vt)]ψ0 (x − vt), e, a meno di un fattore di fase, il pacchetto si propaga con la velocit` a di gruppo v. p si riferisce al Per una legge di dispersione newtoniana si trova che v = m moto di un pacchetto d’onde; per fotoni la velocit`a `e comunque c.
9.3 Gradino di potenziale
129
9.3 Gradino di potenziale Consideriamo una particella nel potenziale 0, x < 0 V (x) = V > 0, x > 0 Immaginiamo che un fascio di particelle sia sparato da sinistra ed un rivelatore sia posto all’estrema destra. Noi ricercheremo gli stati stazionari, che descrivono una corrente di particelle che arriva sulla barriera. Classicamente ci aspettiamo che per energia cinetica inferiore all’altezza V della barriera le particelle siano riflesse e non ne arrivi nessuna sul rivelatore; ci aspettiamo che per energia superiore passino tutte con energia cinetica diminuita di V . V (x) V
x Fig. 9.1. Gradino di potenziale
9.3.1 Energia sotto soglia 2 2
k Supponiamo un’energia E = h¯2m < V . Evidentemente, dovendo scartare l’esponenziale crescente, la soluzione `e del tipo ikx Ae + Be−ikx con k > 0 per x < 0, ψ(x) = Ce−λx , per x > 0,
con h ¯ 2 k 2 = 2mE, h ¯ 2 λ2 = 2m(V − E). Calcolando la corrente col termine p in A si trova J = |A|2 m > 0, dove p = h ¯ k; questa `e la correte sparata dal cannone, e possiamo supporre A = 1. Imponiamo la continuit` a di funzione e derivata con 1 + B = C, ik(1 − B) = −λC =⇒ 1 − B = iλ k C. 2k ; quindi si ottiene B = C − 1 = Sommando le equazioni si ha C = k+iλ −iλ+k λ+ik ` = − . E immediato vedere che |B|2 = 1, quindi B `e un fattore di iλ+k λ−ik fase; possiamo scrivere B ≡ eiβ , con β reale, mentre C = 1 + eiβ . Quindi, β β β C = ei 2 (e−i 2 + ei 2 ) e l’intera funzione d’onda diventa reale moltiplicandola β per e−i 2 . Una funzione d’onda reale non porta corrente, e tutte le particelle sono riflesse. Questo `e evidente a priori se uno considera che la ψ si annulla a dJ x → ∞: poich´e ∂ρ ∂t = 0 ⇒ dx = 0, deve essere dappertutto J = 0.
130
9 Soluzioni in una dimensione
L’andamento trovato `e simile a quello classico, per`o `e possibile trovare particelle anche per x > 0. Questo classicamente `e impossibile, perch´e E = T + V e se V > E ci vuole una energia cinetica negativa. Quantisticamente non esiste l’energia cinetica in un dato punto, perch´e energia e posizione non sono compatibili, cio`e non sono misurabili simultaneamente con precisione arbitraria. 9.3.2 Energia sopra soglia Supponiamo una energia E > V . La soluzione `e del tipo ikx e + Be−ikx , x < 0 ψ(x) = Ceiχx , x > 0, con h ¯ 2 k 2 = 2mE, h ¯ 2 χ2 = 2m(E − V ). L’energia non `e quantizzata, perch´e non ci sono stati legati. Dalle condizioni di continuit` a di ψ e dψ dx in x = 0 1 + B = C, ik(1 − B) = iχC =⇒ 1 − B = χk C viene
'
C= B=
2k k+χ , k−χ k+χ .
La corrente incidente `e A2 k = k; quella riflessa `e |B|2 k; per definizione, il rapporto `e il coefficiente di riflessione che risulta R = |B|2 = |
χ−k 2 | . χ+k
Anche una barriera pi` u bassa dell’energia E crea una corrente riflessa; classicamente ci`o non avviene. La corrente trasmessa `e |c|2 χ; per definizione, il rapporto con la corrente incidente `e il coefficiente di trasmissione che risulta T = |C|2
1 2 χ = 4χk| | . k χ+k
Quindi, R + T = 1. V <0 Per un gradino negativo (V < 0) classicamente ci si aspetta che tutte le particelle passino con energia accresciuta di V . Quantisticamente, la soluzione precedente `e ancora valida, e si ha una corrente riflessa dal potenziale attrattivo; questa `e ben osservata sperimentalmente quando si fa diffrangere un fascio di elettroni dalla superficie di un cristallo.
9.3 Gradino di potenziale
131
V (x) V
x Fig. 9.2. Valle di potenziale
9.3.3 Buca di potenziale finita Risolviamo l’equazione degli stati stazionari per un potenziale a buca (ci limitiamo al caso simmetrico) ⎧ ⎨ 0, x < −a V (x) = −W < 0, −a < x < a ⎩ 0, x > a Stati legati Poniamo
k=
−2mE , l= h ¯2
2 2m(E + W ) ; h ¯2
(9.3)
Come nel caso dell’oscillatore, un potenziale pari (V (−x) = V (x)) permette soluzioni pari e dispari. Le soluzioni con E < 0 (stati legati) sono evidentemente del tipo pari :
dispari :⎧ ⎧ kx ⎨ Be , x < −a, ⎨ −Bekx , x < −a, ψ(x) = D cos(lx), −a < x < a, ψ(x) = D sin(lx), −a < x < a, ⎩ −kx ⎩ −kx Be Be , x > a, , x > a.
Basta imporre le condizioni di continuit` a in x = a per averle automaticamente V (x)
−a
a x −W
Fig. 9.3. Buca di potenziale profonda W
soddisfatte in x = −a. Imponendo la continuit` a di ψ e di
dψ dx
si ottiene:
132
9 Soluzioni in una dimensione
pari dispari : : D cos(la) = Be−ka , D sin(la) = Be−ka , Dl sin(la) = kBe−ka . Dl cos(la) = −kBe−ka .
(9.4)
Dividendo membro a membro, si trova la condizione agli autovalori pari : l tan(la) = k
dispari : l cot(la) = −k.
(9.5)
2
Conviene scrivere
2m(E + W ) a h ¯2
z = la =
in modo da semplificare l’argomento delle funzioni trascendenti. Esprimiamo − k2 , k in termini di l con la (9.3). Poich´e l 2 = 2mW h ¯2 k 2 a2 =
2mW 2 a − l2 a2 = z02 − z 2 > 0 h ¯2
con z02 =
2mW 2 a ; h ¯2
cos`ı k ka = = l la
z02 − z 2 . z
La (9.5) diviene pari : tan(z) =
√
dispari : z02 −z 2 , z
cot(z) = −
√
z02 −z 2 . z
(9.6)
Questa equazioni sono facilmente risolte numericamente o graficamente, e ci sono casi limite semplici. Se z0 1, possiamo dire che il pozzo `e profondo, e se z z0 stiamo cercando i livelli pi` u bassi. Vediamo l’approssimazione pi` u rozza: per ζ0 → ∞, resta tan(z) → ∞ per zn → (2n + 1) π2 , n ∈ N , cot(z) → ∞ per zn → (2n) π2 , n ∈ N , dove N `e l’insieme dei numeri naturali 1, 2, 3, . . .. La condizione z2 =
2m(E + W )a2 π2 = (2n + 1) 4 h ¯2
d` a E = −W +
h ¯ 2 π2 (2n + 1)2 . 2m(2a)2
Tenuto conto che la larghezza della buca `e 2a, queste sono le soluzioni con il numero quantico dispari (che sono pari spazialmente) nella buca infinitamente profonda; evidentemente, cot(z) → ∞ fornisce quelle pari. Questa
9.3 Gradino di potenziale
133
approssimazione peggiora al crescere di n, ed il numero dei livelli legati `e finito. Se z0 1, anche z 1 perch´e 0 < z < z0 . Per stati spazialmente pari, in luogo di z tan(z) = z02 − z 2 potremo approssimare tan(z) ≈ z, cio`e z 2 = z02 − z 2 =⇒ z 4 ≈ z02 − z 2 =⇒ z 2 ≈ z02 − z04 , e si trova sempre una soluzione. Nel caso spazialmente dispari l’equazione z cot(z) = − z02 − z 2 con cot(z) ≈ z1 non ammette soluzione. Un potenziale molto debole ha un unico stato legato e questo `e pari. ∞ La normalizzazione si ottiene imponendo −∞ |ψn (x)|2 = 1. 9.3.4 Stati del continuo Per E > 0 tutte le energie sono consentite, ma non per questo gli effetti quantistici scompaiono. Classicamente chi lanciasse una particella da −∞ la vedrebbe passare oltre la buca; quantisticamente, √ parte dell’onda incidente da −∞ `e riflessa e torna indietro. Posto ora h ¯ k = 2mE, ⎧ ikx ⎨ Ae + Be−ikx , x < −a, ψ(x) = C sin(lx) + D cos(lx), −a < x < a, ⎩ ikx F e , x > a, k l’ampiezza incidente `e A, perch´e eikx ha la corrente m > 0 che va verso destra; B `e l’ampiezza riflessa e F `e l’ampiezza trasmessa. Come prima, A non `e una vera incognita, in quanto fissa il flusso incidente; potremmo anche mettere A = 1 senza perdere generalit` a. Le condizioni in −a danno −ika + Beika = −C Ae sin(la) + D cos(la), (9.7) −ika ik Ae − Beika = l [C cos(la) + D sin(la)] ,
mentre le condizioni in a danno C sin(la) + D cos(la) = F eika , l [C cos(la) − D sin(la)] = ikF eika . Con la regola di Cramer1 , dato che il determinante dei coefficienti `e −l, troviamo C = F eika sin(la) + i kl cos(la) , (9.8) D = F eika cos(la) − i kl sin(la) . Risolvendo (9.7) si trova ' ika A = e2k [−(Ck + iDl) sin(la) + (Dk − iCl) cos(la)] , −ika B = e 2k [(−Ck + iDl) sin(la) + (Dk + iCl) cos(la)] ; sostituendovi la (9.8) e semplificando si ottiene 1
Gabriel Cramer, Ginevra 1704 - Bagnols sur C´eze (Francia) 1752
(9.9)
134
9 Soluzioni in una dimensione
A= B=
−ie2ika 2 2 2kl F (k + l ) sin(2la) −iF 2 2 2kl (k − l ) sin(2la).
+ 2ikl cos(2la) ,
(9.10)
F 2 2 Il coefficiente di riflessione `e R = | B A | e quello di trasmissione T = | A | ; la conservazione della probabilit` a `e espressa da R + T = 1, come uno pu` o verificare.
9.4 Potenziale stretto e profondo a δ Nel limite in cui V diventa una δ V (x) = −aδ(x), a > 0 il problema dello spettro discreto pu`o essere risolto con pochi calcoli. L’equazione di Schr¨ odinger per x = 0 d2 ψ = k 2 ψ(x) dx2 con k2 = −
2mE > 0, h ¯2
ha un solo stato legato, con ma2 h ¯2 √ ma|x| ma exp − 2 ψ(x) = . h ¯ h ¯ E=−
e
9.5 Barriera di potenziale: effetto Consideriamo lo stesso problema, ma per una particella nel potenziale a barriera ⎧ x < 0, ⎨0 V (x) = V > 0 0 < x < S, ⎩ 0 x > S. con il cannone a sinistra ed il rivelatore a destra. 9.5.1 Energia sotto soglia: superamento della barriera Con un’energia E < V abbiamo esponenziali reali nella barriera e complessi e±ikx , k > 0 fuori. Le onde e±ikx hanno corrente ±k. Poich´e il cannone `e a sinistra, nessuna particella proviene da x → ∞ e non c’`e onda con e−ikx per x > S. Quindi la soluzione `e del tipo
9.5 Barriera di potenziale: effetto
135
⎧ ikx ⎨ αe + βe−ikx x < 0, ψ(x) = γe−λx + δeλx 0 < x < S, ⎩ ikx e x > S, con h ¯ 2 k 2 = 2mE, h ¯ 2 λ2 = 2m(V − E). Fisseremo il flusso entrante con α = 1 e imporremo la continuit` a di funzione e derivata con V (x) V
x Fig. 9.4. Barriera di potenziale
⎧ 1 + β = γ + δ, ⎪ ⎪ ⎨ ik(1 − β) = −λγ + λδ, ⎪ γe−λS + δeλS = eikS , ⎪ ⎩ −λγe−λS + λδeλS = ikeikS .
(9.11)
Dalle ultime due (9.11) `e facile cavare γ e δ: posto η= '
troviamo subito
γ= δ=
ik , λ
eikS λS , 2 (1 − η)e eikS −λS (1 + η)e . 2
Le prime due (9.11) danno 1 1 2 = γ(1 − ) + δ(1 + ). η η Sostituendo, si ricava 2=
eikS 2
{(1 − η)eλS (1 − η1 ) + (1 + η)e−λS (1 + η1 )}
=
eikS 2
{2 cosh(λS) − (η + η1 ) sinh(λS)}
e quindi eikS =
1 cosh(λS) −
1 2 (η
+ η1 ) sinh(λS)
.
La barriera classicamente impenetrabile viene superata con probabilit` a |e ikS |2 ∼ e−2λS per effetto tunnel.
136
9 Soluzioni in una dimensione
9.5.2 Effetto tunnel: fenomeni ed applicazioni Innumerevoli sono gli esempi di fenomeni governati da effetto tunnel. Eccone un breve elenco. 1. Il decadimento α o β dei nuclei si pu` o schematizzare rozzamente in termini di una buca di potenziale con una parete trasparente. In approssimazione
Fig. 9.5. SET (Buca di potenziale con una parete trasparente, un modello per il decadimento α o β
0 uno pu` o studiare gli stati legati che si avrebbero in una buca di potenziale, trascurando il fatto che la barriera ha spessore finito. Sia φ0 lo stato fondamentale. Quando si prende in considerazione il vero potenziale, si trova che φ0 `e un pacchetto d’onde formato da autostati ψE di energia diversa, e che non ha una energia definita, ma una larghezza ∆E in energia. Prima o poi la particella scappa all’infinito. Come stimare il tempo di vita ∆t dello stato quasi legato? Come vedremo, c’e un principio di indeterminazione energia-tempo, per cui ∆E∆t ∼ h ¯. 2. I fenomeni di risonanza ed autoionizzazione in atomi, l’effetto Auger. 3. Il legame a ponte di Idrogeno. Un protone in presenza di due Ossigeni si comporta come una particella in una doppia buca di potenziale, che passa da un minimo all’altro per effetto tunnel stabilendo in tal modo un legame. Questo fenomeno `e importante per la struttura dell’acqua e per quella dei liquidi con gruppi OH. 4. Le risonanze di Feshbach delle molecole: sono dei picchi nella sezione d’urto elestica elettrone-molecola (ad esempio, elettrone-SF6 ) dovuti al fatto che l’elettrone di una opportuna lunghezza d’onda pu`o rimanere intrappolato per un certo tempo.
9.5 Barriera di potenziale: effetto
137
5. L’effetto Josephson (tunneling di coppie di Cooper superconduttive): se in un circuito si inserisce una barriera isolante fra due superconduttori, gli elettroni fanno effetto tunnel come coppie legate, a causa di una attrazione effettiva fra elettroni che in certi materiali a bassa temperatura vince la repulsione coulombiana. Si osservano fenomeni molto interessanti. Per esempio, una differenza di potenziale continua V d` a luogo ad una corrente alternata secondo la legge I = I0 sin(
2eV t), h ¯
ma sotto certe condizioni una V (t) alternata d` a una corrente continua (effetto Shapiro). 6. Dagli anni ’90 sono studiati fenomeni nuovi. In un circuito RC la carica sul condensatore `e lineare col potenziale applicato. Se la resistenza `e sostituita da una sottile barriera di ossido, gli elettroni possono passarla per effetto tunnel. Allora la carica del condensatore `e quantizzata, e si vede un grafico carica-potenziale a gradini. Ci sono anche numerose applicazioni. Fra queste: 1. I dispositivi a effetto Josephson su cui si basano i magnetometri SQUID, potrebbero portare ad un computer superconduttore. 2. Attualmente si sta sviluppando in vari laboratori il single-electron transistor basato sull’effetto tunnel. Il potenziale di gate alza e abbassa la barriera. Quindi la coerente prodotta dal potenziale V `e modulata dal potenziale di gate.
V
condensatore
source tunnel
V Gate
Gate
grain tunnel drain
Fig. 9.6. Il SET (Single electron tunneling) transistor, cio`e transistor ad effetto tunnel di un elettrone alla volta.Le parole inglesi gate,source,drain hanno un significato tecnico in elettronica; grain denota una isola metallica di dimensioni nanoscopiche (dell’ordine di 10−6 cm o meno)
138
9 Soluzioni in una dimensione
3. Il microscopio ad effetto tunnel, in cui una punta metallica esplora una molecola o una superficie e permette di farne una immagine a risoluzione atomica. Lo scanning tunelling microscope (STM) `e stato inventato nel 1981 dai ricercatori IBM, Gerd Binnig e Heinrich Rohrer, che hanno avuto il Nobel per la Fisica nel 1986. La punta scansiona la superficie e la sua distanza dalla superficie viene registrata con l’aiuto di un computer. Il posizionamento preciso della punta viene ottenuto con l’effetto piezoelettrico (certi solidi con una struttura cristallina ionica di bassa simmetria danno potenziali elettrici se deformati e permettono di costruire trasduttori di grande sensibilit` a). Una differenza di potenziale fra la punta e la superficie fa passare una corrente tunnel: il vuoto agisce da barriera. Questa corrente dipende esponenzialmente dalla distanza dalla superficie. Una galleria di imagini STM si trova sul sito http : //www.almaden.ibm.com/vis/stm/gallery.html
Fig. 9.7. Schema di principio del microscopio a tunnel. Nel particolare ingrandito si vede che la punta termina con un singolo atomo da cui la corrente passa nella vicinissima superficie del campione esplorandone la topografia.
9.6 Oscillatore Armonico L’hamiltoniano `e
2 ˆ = p + 1 mω 2 x2 . H (9.12) 2m 2 In meccanica classica, l’ampiezza dell’oscillazione `e arbitraria, / e l’oscillatore di
costante di forza k e massa m `e caratterizzato solo da ω =
k m.
In meccanica
9.6 Oscillatore Armonico
139
Fig. 9.8. Immagini ottenuta con il microscopio ad effetto tunnel e gentilmente fornite dal Gruppo del Prof. A. Balzarotti del Dipartimento di Fisica, Universit` a di Roma Tor Vergata. a) Immagini di una superficie di Si(111) (`e una particolare faccia con gli atomi disposti in un modo particolare che si chiama ricostruzione 7×7) acquisite a corrente costante con potenziale di bias rispettivamente positivo (+1.5V) (pannello superiore( e negativo (-1.5V) (pannello inferiore) Dimensione delle immagini (10 nm×10 nm). Sono chiaramente visibili i singoli atomi. b) Immagine STM a corrente costante di una superficie di Ge/Si ottenuta depositando 3 monostrati atomici di Ge su una superficie di Si(111) a T=500 C. Dimensione dell’immagine (10 nm×10nm). c) Immagine STM di una superficie di Si(001) ricostruita 2×1 acquisita a corrente costante. Da notare la diversa orientazione dei dimeri sulle terrazze adiacenti Dimensione della immagine (50×50 nm) d) Immagine STM acquisita a corrente costante di una tipica isola ottenuta depositando 4 monostrati atomici di Ge su una superficie di Si(001) mantenuta a 500 C. Da notare la tipica forma piramidale dell’isola (detta hut cluster) e la ricostruzione delle facce (105). Dimensioni della immagine: (60nm×60 nm)
140
9 Soluzioni in una dimensione
quantistica c’`e una scala di energie; l’energia ipotizzata da Einstein per il fotone di pulsazione ω `e data da E = h ¯ ω. Se poniamo mω 2 x20 ∼ h ¯ω troviamo che esiste anche la lunghezza caratteristica h ¯ x0 = . mω ˆ L’equazione di Schr¨ odinger per gli stati stazionari Hψ(x) = Eψ(x) fornisce d2 m2 ω 2 2 2mE ψ = x ψ − 2 ψ, 2 2 dx h ¯ h ¯ cio`e
d2 x2 2mE ψ = 4 ψ − 2 ψ. 2 dx x0 h ¯
Ponendo allora x = x0 q, con q numero puro,si trova q2 2mE 1 d2 ψ = ψ − 2 ψ, 2 2 2 x0 dq x0 h ¯ e si pone l’equazione di Schr¨ odinger in forma adimensionale d2 ψ dq2
= (q 2 − 2)ψ
(9.13)
E . h ¯ω
(9.14)
dove l’energia adimensionale `e =
Eliminando in (9.12) m in favore di x0 , con m = H=
h ¯ , ωx20
1 x0 p 2 x h ¯ω ( ) + ( )2 2 h ¯ x0
ovvero H=
h ¯ω d2 − 2 + q2 , 2 dq
(9.15)
che conduce di nuovo alla (9.13). Non `e difficile trovare una soluzione: poich´e q2 d2 − q2 2 = (−1 + q 2 )e− 2 e dq 2
una funzione proporzionale a e−
q2 2
`e soluzione. Tornando alla variabile x,
9.6 Oscillatore Armonico
ψ0 (x) = Ce
−
x2 2x2 0
141
,
con C costante di normalizzazione da determinare. ψ0 risolve l’equazione di Schr¨ odinger con 2 = 1, 1 E= h ¯ ω. 2 La normalizzazione impone
∞
1= −∞
Ricordando che fase arbitraria
∞ −∞
2
|ψ0 (x)| dx = C 2
e−y dy =
∞
2
2
e
− x2 x
0
dx.
−∞
√ π, si trova C 2 =
1 √ , x0 π
cio`e a meno di una
mω 1 )4 . π¯ h Questa particolare soluzione `e cos`ı semplice che deve avere un significato speciale: infatti troveremo che `e quella dello stato fondamentale, quello con la pi` u bassa energia. Per trovare la soluzione generale, cambiamo incognita con C=(
ψ(q) = h(q)e− allora
q2 2
;
q2 d ψ(q) = [h − qh(q)]e− 2 dq
e d2 dq2 ψ(q)
= {[h − qh(q)] − q[h − qh(q)]}e− = {h − 2qh + (q 2 − 1)h}e−
q2 2
q2 2
.
Cos`ı, h(q) `e determinato da ( 9.13): h − 2qh + (q 2 − 1)h = (q 2 − 2)h, h − 2qh + (2 − 1)h(q) = 0.
(9.16)
L’equazione `e del secondo ordine a coefficienti variabili. In tali casi il metodo di soluzione pi` u ovvio `e quello per serie. Si vede rapidamente che h(q) ∝ q soddi` facile controllare che h(q) ∝ 4q 2 − 2 soddisfa, con = 5 . Cersfa, con = 23 . E 2 chiamo allora polinomi di grado N che risolvano l’equazione; evidentemente l’energia dello stato cresce col grado del polinomio.
142
9 Soluzioni in una dimensione
Soluzione per serie Poniamo h(q) = a0 + a1 q + a2 q 2 + a3 q 3 + . . . + aN q N =
N
aj q j ,
j=0
dh = a1 + 2a2 q + 3a3 q 2 + . . . , dq quindi dh = a1 q + 2a2 q 2 + 3a3 q 3 + . . . = jaj q j , dq j=0 N
q
N −2 d2 h 2 = 2a + 2 ∗ 3a q + 3 ∗ 4a q + . . . = (j + 1)(j + 2)aj+2 q j . 2 2 3 dq 2 j=0
Sostituendo nella (9.16) si ottiene la relazione di ricorrenza che determinano i coefficienti l’uno dopo l’altro: (j + 1)(j + 2)aj+2 − 2jaj + (2 − 1)aj = 0, j = 0, . . . , N − 2 e quindi aj+2 =
2j + 1 − 2 aj j = 0, . . . , N − 2. (j + 1)(j + 2)
(9.17)
Anzi, queste sono relazioni di ricorrenza separate per i termini pari e dispari: conoscendo a0 si ricaverebbero tutti i pari, e da a1 tutti i dispari. Soluzioni polinomiali Cerchiamo soluzioni polinomiali; imponiamo quindi in (9.17) che aN +2 = 0 cio`e che la soluzione sia un polinomio di grado N finito; la condizione 2N + agli autovalori 1 − 2N = 0 insieme con (9.14) d` EN = (N + 12 )¯ hω. Si riconosce che la soluzione dedotta per prima era lo stato fondamentale N = 0 che ha l’energia pi` u bassa possibile (energia di punto zero); l’oscillatore non pu` o fermarsi nell’origine perch´e questo violerebbe il principio di indeterminazione. L’oscillatore ha una ben precisa frequenza caratteristica ed il salto fra due livelli consecutivi `e h ¯ ω.
9.7 Metodo operatoriale per l’oscillatore armonico
143
Comportamento asintotico Ora facciamo vedere che sono accettabili sono le soluzioni con N finito. Per j → ∞, le (9.17) diventano aj+2 ∼ 2j aj ; questo `e risolto da aj ∼ ( C , j 2 )! 1 2k C j q2 con C costante. Nel caso pari, h = j=2k ( j )! q = C k k! q = Ce ; que2
sto comportamento asintotico per grandi q manderebbe all’infinito la ψ che C j invece deve essere normalizzabile. Nel caso dispari, h = j=2k−1 ( j )! q = 2 C k (k−1 1 )! q 2k−1 , ma accrescendo i denominatori si diminuiscono le frazio2 1 2k−1 2 q ∼ Cq eq che ancora diverge esponenzialmente ni, e cos`ı h > C k k! all’infinito. I Polinomi di Hermite Poniamo 2N + 1 − 2 = 0 in (9.16) e troviamo l’equazione di Hermite, gi` a studiata nell’800 (9.18) hN (q) − 2qhN + 2N hN (q) = 0; le (9.17) divengono aj+2 =
2j − 2N aj , j = 0, . . . , N − 2. (j + 1)(j + 2)
Le soluzioni sono i polinomi di Hermite hN (q); si mostra che sono ortogonali nel senso che ∞ 2 hm (x)hn (x)e−x dx = 0, m = n. −∞
I primi sono h0 = 1, h1 (q) = 2q, h2 (q) = 4q 2 − 2, h3 (q) = 8q 3 − 12q, h4 (q) = 16q 4 − 48q 2 + 12. Si dimostrano le seguenti formule notevoli per i polinomi di Hermite, che riportiamo senza dimostrazione: dHn (x) dx
= 2nHn−1 (x),
Hn+1 (x) = 2xHn (x) − 2nHn−1 (x). Vale poi la formula di Rodrigues Hn (x) = (−1)n exp(x2 )(
d n ) exp(−x2 ). dx
9.7 Metodo operatoriale per l’oscillatore armonico Abbiamo scritto l’hamiltoniano nella forma h ¯ω d2 H= − 2 + q2 . 2 dq
(9.19)
144
9 Soluzioni in una dimensione
Gli operatori che qui compaiono non commutano, perch´e [
d , q]− = 1. dq
Questo suggerisce un metodo operatoriale per risolvere l’oscillatore armonico. Questo metodo `e potente ed `e alla base della teoria dei campi. Introduciamo l’operatore di annichilazione d 1 a = √ (q + ), dq 2 e quello di creazione d 1 a† = √ (q − ), dq 2 qui a† significa coniugato Hermitiano, ma ne vedremo nel prossimo capitolo il significato generale. Ora `e facile verificare che a† a + e che
1 1 d2 = (q 2 − 2 ) 2 2 dq
aa† − a† a = 1,
ovvero
[a, a† ]− = 1.
Ora, la (9.19) diventa 1 H =h ¯ ω(a† a + ), 2 e l’equazione di Schr¨ odinger si pu` o scrivere come 1 (a† a + )ψ = ψ. 2 Se ψ `e soluzione, anche a† ψ `e soluzione, con autovalore + 1, perch´e la regola di commutazione d` a a† aa† = a† a† a + a† e quindi 1 1 (a† a + )a† ψ = (a† [1 + a† a] + a† )ψ. 2 2 Mettendo un = a† in evidenza a sinistra risulta = a† (a† a + 1/2 + 1)ψ = a† ( + 1)ψ = ( + 1)a† ψ Cos`ı a† crea eccitazioni; nelle teorie di campo (come la QED, Quantum Electrodynamics) l’oscillatore non si osserva affatto, ma si vedono le eccitazioni, che sono i fotoni! Inoltre, aψ `e soluzione, con autovalore − 1; infatti, in
9.7 Metodo operatoriale per l’oscillatore armonico
145
1 1 (a† a + )aψ = (a† aa + a)ψ 2 2 possiamo mettere un a in evidenza a sinistra usando la regola di commutazione e viene 1 1 = (aa† a − a + a)ψ = a(a† a + − 1)ψ = ( − 1)aψ. 2 2 Di conseguenza, lo stato fondamentale `e dato da aψ0 = 0, ovvero, in unit` a di x0 , d p )ψ0 0 = (x + i )ψ0 = (x + h ¯ dx che, con integrazione immediata, d` a ψ 0 = e− Nelle variabili originali,
x2 2
.
1 x ix0 p a† = √ [ − ], h ¯ 2 x0 1 x ix0 p a= √ [ + ]. x h ¯ 2 0 La trasformazione inversa `e: x0 x = √ (a + a† ), 2 p=
−i¯ h √ (a − a† ). x0 2
` immediato verificare [p, x]− = −i¯ E h `e in accordo con quanto affermato in precedenta. Troveremo altre propriet`a di a, a† nella Sezione 10.2.10.
10 Sui quattro postulati della meccanica quantistica
L’apparato matematico della meccanica quantistica non relativistica si enuncia in forma assiomatica in 4 principi, o postulati. Esiste tuttavia una certa libert` a nel modo di esprimerli, e pi` u avanti vedremo che occorre allargare il quadro per introdurre lo spin e le statistiche quantistiche. Nel seguito ed in Appendice verranno brevemente richiamati alcuni metodi matematici che sono noti da altri Corsi.
10.1 Postulato 1 Lo stato di un sistema si rappresenta con una funzione d’onda complessa Ψa (x, t) dove: x sta per l’insieme delle coordinate, t `e il tempo, a un insieme (eventualmente vuoto) di costanti del moto ( i numeri quantici). Se a contiene i valori di tutti gli osservabili che possono essere simultaneamente conservati, lo stato quantico ne risulta individuato.
10.1.1 Funzione d’onda Tutto quello che c’`e da sapere sul sistema `e contenuto in una funzione complessa Ψ (la funzione d’onda, introdotta da Schr¨ odinger) che nel caso di un solo grado di libert` a scriveremo Ψ (x, t). Moltiplicando Ψ per una costante si ottiene una funzione d’onda che si riferisce allo stesso stato fisico, quindi conviene considerare Ψ (x, t) normalizzata con |Ψ (x, t)|2 dx = 1. La funzione `e complessa, quindi Ψ (x, t) = |Ψ (x, t)|eiφ(x,t) , dove φ(x, t) `e la fase.1 1
Si pu` o dimostrare che la fase di una funzione d’onda pu` o essere cambiata ( con una trasformazione di gauge o con un cambiamento di sistema di riferimento), e
148
10 Sui quattro postulati della meccanica quantistica
Combinazioni lineari di funzioni d’onda Φ = αΨ + βχ con coefficienti α, β complessi sono altre funzioni d’onda; il prodotto scalare Ψ |Φ = Ψ (x, t)∗ Φ(x, t)dx associa a due funzioni d’onda un numero complesso. Tutto ci` o induce nell’insieme delle funzioni d’onda una struttura di spazio vettoriale. Se Ψ |Φ = 0 diremo che le funzioni d’onda sono ortogonali. Nel prodotto scalare, Ψ | `e il bra e |Φ il ket (dalla parola Inglese Bracket=parentesi). Le funzioni d’onda sono normalizzate con Ψ |Ψ = 1. Si pu` o costruire una base ortonormale di funzioni. Insomma, le funzioni si comportano come vettori di uno spazio astratto, che ha come dimensione il massimo numero di funzioni ortogonali. Le funzioni d’onda normalizzate corrispondono a stati del sistema. Possiamo quindi associare gli stati a vettori dello spazio astratto, e spesso i termini stato e funzione d’onda sono intercambiabili. 10.1.2 Disuguaglianza di Schwarz √ → − − − − a ·→ a e Siano → a , b vettori di uno spazio vettoriale. Le norme siano a = → → − → − → − − b= b · b . Notoriamente → a · b = ab cos(θ); il quadrato di un coseno non supera 1 e quindi vale la disuguaglianza di Schwarz → − → − → − − − − |→ a · b |2 ≤ (→ a ·→ a )( b · b ). Analogamente, anche fra i vettori di stato vale |α|β|2 ≤ α|α β|β = 1. 10.1.3 Spazi di Hilbert Lo stato Ψa (x, t) `e un vettore normalizzato |a nello spazio di Hilbert L2 , lo spazio delle funzioni a quadrato integrabile. Per essere di Hilbert, uno spazio vettoriale deve essere completo, cio`e contenere tutti i limiti delle successioni convergenti. Vedremo dopo che questa condizione non `e una finezza matematica, ma `e fisicamente necessaria. Nei problemi con un numero finito di stati anche lo spazio vettoriale `e finito, e non c’`e dubbio: ogni vettore pu` o essere espanso in ogni base. Le cose sono meno banali quando si tratta di spazi di funzioni. Lo spazio P (N ) dei polinomi di grado < N non basta per espandere qualsiasi funzione, e non basta nemmeno P (∞), lo spazio di tutti i polinomi. Si dimostra invece che L2 , lo spazio delle funzioni a quadrato integrabile, `e completo. La funzione d’onda pu` o essere etichettata: Ψa (x) rappresenta uno stato con valori definiti dei numeri quantici a = {A, B, C, . . .} riferiti a osservabili compatibili, cio`e a costanti del moto che esistono simultaneamente. In genere, sono possibili scelte alternative di a. Vedremo che lo stato di una particella libera pu` o essere etichettato da energia ed impulso, oppure da energia non ha significato fisico; la differenza di fase fra due funzioni d’onda, per` o, non pu` o essere cambiata in alcun modo ed ha conseguenze fisiche importanti (effetti di interferenza.
10.2 Postulato 2
149
e dal quadrato del momento angolare, ma il quadrato del momento angolare non `e compatibile con l’impulso, e le tre componenti del momento angolare non sono compatibili fra loro. Se a contiene tutti gli osservabili compatibili, lo stato quantico ne risulta individuato; ci` o significa che due stati diversi devono differire per almeno un numero quantico. Fisicamente questo comporta che se non c’`e almeno una misura di una quantit` a conservata che distingua i due stati nulla ci autorizza a considerarli distinti.
10.2 Postulato 2 ˆ lineari, hermitiaGli osservabili Q sono rappresentati da operatori Q ˆ ovvero Φ|QΨ ˆ = QΦ|Ψ ˆ ˆ† = Q ), dotati di un set completo di ni (Q autovettori; il valore di aspettazione di Q nello stato |Ψ `e dato da ˆ ≡ Ψ |QΨ ˆ . Ψ |Q|Ψ
10.2.1 Matrici, operatori e spazi di funzioni Una matrice M ha elementi Mij dotati di due indici; il prodotto scalare fra ˆ e |Φ, cio`e Φ|Q|Ψ ˆ ha due indici Φ e Ψ , lo si chiama un elemento di Q|Ψ ˆ Nel caso unidimensionale, Φ|Q|Ψ ˆ = dxΦ∗ (x)QΨ ˆ (x). La teoria matrice di Q. di Heisenberg `e stata formulata in termini di matrici. d ˆ , come anche xˆ (che moltiplica per x), sono esempi di operatori O D ≡ dx ˆ ˆ ˆ lineari: O(Φ + Ψ ) = OΦ + OΨ , ma sono definiti in un dato spazio di funzioni ˆ ˆ , etc. appartengono allo stesso spazio. se i risultati delle operazioni OΦ, OΨ Per esempio, x ˆ porta fuori da P (N ), mentre `e un operatore lineare su P (∞) e su L2 . 10.2.2 Operatori Hermitiani e valori medi reali Il coniugato (o aggiunto) hermitiano Aˆ† di un operatore Aˆ `e definito da ˆ Aˆ† α|β = α|Aβ ∀α, β. Nel caso unidimensionale scriviamo: ∗ ˆ dxα Aβ = dx(Aˆ† α)∗ β e prendendo il complesso coniugato dei due membri troviamo ∗ ˆ = dxβ ∗ Aˆ† α, dxα∗ Aβ
150
10 Sui quattro postulati della meccanica quantistica
donde la regola generale per prendere il complesso coniugato di un elemento di matrice: ∗ ˆ (α|A|β) = β|Aˆ† |α ∀α, β. ˆ questi Si dice che Aˆ `e un operatore hermitiano o autoaggiunto se Aˆ† = A; sono gli operatori degli osservabili, come vedremo. d ; poich´e Consideriamo di nuovo D = dx f |Dg = f ∗ g|ba − Df |g, dove a, b sono gli estremi del dominio di integrazione, allora su L2 (dove le funzioni vanno a 0 all’infinito) f |Dg = −Df |g; ` facile togliere quel si dice che D `e antihermitiano per via del segno meno. E segno: pˆ = −iD `e hermitiano. Sappiamo che in effetti pˆ rappresenta una variabile dinamica, cio`e l’impulso. Ma pˆ `e hermitiano su funzioni che vanno a 0 all’infinito, ma non, ad esempio, sullo spazio di polinomi P (N ). Valori medi reali Per poter interpretare α|T |α come media dei valori misurati della grandezza T nello stato a bisogna richiedere che sia reale. Gli operatori hermitiani hanno valori medi reali. Se λ = α|T |α, in generale λ∗ = α|T † |α; se T `e hermitiano, T † = T ed il complesso coniugato `e α|T |α = λ. Ricordiamo che la media `e fatta su un ensemble di sistemi preparati nello stato a. Non `e detto nemmeno che α|T |α sia uguale al risultato sperimentale. Per esempio, lanciando un = 72 , ma questo non sar` a mai il risultato dado si ottiene in media 1+2+3+4+5+6 6 di un lancio. 10.2.3 Spazi ortogonali Sempre con T = T † , autovalori diversi appartengono ad autovettori ortogonali. Sia infatti Tˆ|m = tm |m, Tˆ|n = tn |n; prendendo prodotti scalari otteniamo n|Tˆ|m = tm n|m, m|Tˆ|n = tn m|n. Il complesso coniugato della seconda `e n|Tˆ† |m = t∗n n|m, ma nel caso hermitiano d` a n|Tˆ|m = tn n|m che sottratta dalla prima conduce a 0 = (tn − tm )n|m. Quindi se (tn − tm ) = 0, necessariamente n|m = 0.
10.2 Postulato 2
151
10.2.4 Completezza Se Tˆ rappresenta un osservabile, `e fisicamente necessaria la completezza del set {m} degli autovettori. La sua necessit`a diventa evidente quando si analizza il terzo postulato. Adesso vediamone l’aspetto matematico. La completezza del set garantisce che ogni |Ψ ha lo sviluppo sulla base degli autovettori: |Ψ = |mm|Ψ . (10.1) m
e una somma se m `e una variabile discreta, ma va inteso come Qui, m ` integrale se `e continua. Questo modo di procedere `e familiare dalla teoria delle serie e degli integrali di Fourier. Nel caso degli integrali, ∞ e−iqx ˜ f (x) = f (q). dq 2π −∞ `e l’espansione continua di una funzione nel set completo delle onde piane, che sono funzioni di impulso definito ed energia definita. Questo `e il teorema di Fourier; il fatto che la completezza sia richiesta significa fisicamente che la conoscenza di f (q) `e equivalente a quella di f (x) e quindi x non ha nessun ruolo esclusivo. D’altra parte questa nozione appartiene gi` a al formalismo Hamiltoniano classico. Formalmente, la (10.1) equivale a dire che |mm| 1= m
`e l’operatore identit` a (quello che lascia le cose come stanno). Di conseguenza ˆ j ≡ Φi |A|Φ ˆ j `e l’elemento di matrice di un operatore Aˆ fra se Aij = Φi |AΦ ˆ , due elementi di una base, e Bij l’elemento di matrice di un operatore B ˆ ˆ ˆ ˆ ˆ ˆ il prodotto AB ha Φi |AB|Φj = Φi |A k |kk| B|Φj = k Aik Bkj e le matrici degli operatori si moltiplicano righe per colonne. Matematicamente, le matrici sono una rappresentazione degli operatori. La conoscenza della matrice e della base `e equivalente a quella dell’operatore. Su ogni base, l’operatore di ∗ ) e gli un osservabile `e rappresentato da una matrice hermitiana (Mij = Mji autovalori della matrice sono quelli dell’operatore. 10.2.5 Commutatori: angolo e momento angolare Classicamente, la parentesi di Poisson di operatori canonicamente coniugati (vedi Capitolo 2.4.3) vale 1. Nella teoria quantistica, coppie di operatori canonicamente coniugati hanno commutatori −i¯ h. Ad esempio, [ˆ p, x ˆ] = pˆx ˆ−x ˆ, pˆ = h −i¯ h, dove h ¯ = 2π . Vediamo un altro esempio notevole: momento angolare ed angolo.
152
10 Sui quattro postulati della meccanica quantistica
Prendiamo come esempio un rotatore rigido piano ossia un corpo rigido girevole intorno all’asse z, di cui sia dato il momento di inerzia 2 I. In termini dell’angolo θ, la lagrangiana `e ˙ = 1 I θ˙2 . L(θ, θ) 2 ˆ z = I θ˙ `e il momento cinetico canonicamente coniugato all’angolo φ. L’oeL peratore hamiltoniano si scrive come la funzione hamiltoniana classica ed `e 2 ˆ = Lz , H 2I ˆ z `e la componente z del momento angolare, L ˆ z = xpy − ypx . dove L ˆ Per trovare autofunzioni ed autovalori di H, conviene lavorare in coordinate polari piane, con x = ρ cos φ, y = ρ sin φ. Poniamo dapprima in coordinate polari le componenti dell’impulso −i¯ h∇: esse si ottengono dalla chain rule ∂ ∂ρ ∂ ∂φ ∂ = + , ∂x ∂x ∂ρ ∂x ∂φ
∂ ∂ρ ∂ ∂φ ∂ = + . ∂y ∂y ∂ρ ∂y ∂φ
Quelle che ci occorrono per queste derivate sono le relazioni inverse y x2 + y 2 , φ = arctan . x
ρ=
Derivando il raggio troviamo che ∂ρ x ∂ρ y = = cosφ, = = sinφ. ∂x ρ ∂y ρ Per derivare φ, usiamo invece d arctan u 1 = , du 1 + u2 y ∂φ 1 d y 1 d y otteniamo ∂φ 2 dx ( x ) = − x2 +y 2 , ∂y = 1+( y )2 dy ( x ) = ∂x = 1+( y x) x quindi, esprimendo il risultato in coordinate polari,
x x2 +y 2 ,
e
sinφ ∂φ cosφ ∂φ =− , = ; ∂x ρ ∂y ρ viene 2
− Dalla meccanica elementare si sa che per un corpo di densit` a ρ(→ x ) il momento − x )(x2 + y 2 ). di inerzia rispetto all’asse z `e dato dalla formula I = d3 xρ(→
10.2 Postulato 2
153
∂ sinφ ∂ ∂ ∂ cosφ ∂ ∂ = cosφ − , = sinφ + . ∂x ∂ρ ρ ∂φ ∂y ∂ρ ρ ∂φ ˆ z = xpy − ypx , e sostituendo Ora, L ∂ cos φ ∂ ˆ Lz = −i¯ h ρ cos(φ) sinφ + ∂ρ ρ ∂φ 3 sin φ ∂ ∂ − −ρ sin(φ) cos φ ∂ρ ρ ∂φ si ottiene una spettacolare semplificazione: ∂ ˆ z = −i¯ L h . ∂φ ∂ Ora, −i¯ h ∂φ ha la regola di commutazione fondamentale con il suo coniugato canonico φ. L’equazione agli autovalori `e
ˆ z ψm (φ) = m¯ L hψm (φ) e le autofunzioni sono
eimφ ψm (φ) = √ . 2π
La condizione ψ2π (φ) = ψm (0) richiede che il numero quantico azimutale m sia intero,m = 0, ±1, ±2, · · · Dato che ¯h `e un momento angolare, l’esistenza di questa grandezza fondamentale comporta che il momento angolare `e quantizzato. Classicamente sembra ovvio che cambiando l’asse z con continuit` a anche Lz debba cambiare gradualmente, ma non `e cos`ı. Gli antichi dicevano natura non facit saltus. Invece la natura i salti li fa. Gli autovalori dell’energia del 1 m2 h ¯ 2. rotatore sono Em = 2I 10.2.6 Commutatori: principio di indeterminazione generalizzato Il principio di indeterminazione generalizzato 2 2 σA σB ≥ (
ˆ B] ˆ − |ψ ψ|[A, )2 ∀ψ. 2i
(10.2)
comporta che i due operatori sono compatibili (gli osservabili esistono simultaneamente) se e solo se commutano.3 Poich´e la disuguaglianza vale per qualsiasi stato, abbiamo una propriet` a degli operatori. Dimostriamo la (10.2). 2 ≡ ψ|(Aˆ − A)2 |ψ, La deviazione standard di Aˆ su uno stato |ψ, cio`e σA ˆ dato che A − A `e hermitiano, si pu` o riscrivere come la norma quadrata di ˆ < A >)|ψ |f = (A− 3
Se non commutano, `e pur sempre possibile che il secondo membro della (10.2) sia annulli per qualche ψ.
154
10 Sui quattro postulati della meccanica quantistica 2 σA = f |f ;
ˆ scriveremo analogamente per l’operatore B 2 ˆ < B >)|ψ. σB ≡ g|g, |g = (B−
La disuguaglianza di Schwarz consente di ottenre 2 2 σB = f |f g|g ≥ |f |g|2 , σA
dove f |g = AB − AB. Per ogni complesso z `e ovvio che |z|2 = (Re(z))2 + (Im(z))2 ≥ (Im(z))2 = z−z ∗ 2 ( 2i ) . Con z = f |g, otteniamo 2 2 σB ≥ ( σA
f |g − g|f 2 ) . 2i
Ora, si completa la dimostrazione sottraendo da f |g = AB − AB, la coniugata g|f = BA − AB. h =⇒ σpˆσxˆ ≥ 12 h ¯. Ad esempio, [ˆ p, x ˆ]− = −i¯ Minima indeterminazione Non c’`e limite all’ignoranza: sovrapponendo uno stato con p mal definito con uno che ha x ben definito si pu` o fare una ψ in cui ambedue sono indeterminati; allora σA σB pu` o eccedere e di molto la media del commutatore (−i¯ h). Possiano chiederci quando al contrario σA σB = minimo al variare di ψ. ˆ < A >)|ψ, |g = (B− ˆ < Questa risulta4 scrivendo come prima |f = (A− B >)|ψ, |g = iλ|f , con λ reale; infatti la disuguaglianza di Schwarz diventa una uguaglianza nel caso di vettori paralleli, e trascurare, come abbiamo fatto, la parte reale di f |g non rafforza la disuguaglianza se il prodotto scalare `e immaginario. La risposta dipende da un parametro, perch´e non cerchiamo uno stato unico, ma una famiglia di stati che vanno da B ben definito con A mal definito al caso opposto. Se A = pˆ, B = x ˆ, questo equivale a porre (ˆ p − p)Ψ = iλ(x − x)Ψ ;
(10.3)
uno pu` o osservare che a meno di uno spostamento dell’origine possiamo scrivere (ˆ p − p)Ψ = iλxΨ. 4
Escludiamo dalla considerazione gli autostati di A e quelli di B, per i quali σA σB = 0.
10.2 Postulato 2
155
E poi pu` o notare che a meno di un fattore di fase exp[2π i
x ] possiamo h scrivere d −i¯ h Ψ = iλxΨ. dx ` E facile ora vedere che la soluzione `e una gaussiana e che l’equazione (10.3) `e risolta dal pacchetto gaussiano spostato (da normalizzare) Ψ (x) = exp[−λ
(x− < x >)2 i
x + ] 2¯ h h ¯
10.2.7 Commutatori: grandezze compatibili ` Se due operatori A e B hanno un set comune di autovettori, commutano. E ovvio che una relazione ch vale per tutto il set completo `e vera come relazione operatoriale; Aψab = aψab , Bψab = bψab ∀ψab =⇒ ABψ = abψ = BAψ =⇒ [A, B]− = 0. Su questa base le matrici sono diagonali. Fisicamente, due operatori A e B che hanno matrici diagonali su una data base rappresentano grandezze che hanno valori ben definiti sulla base prescelta, e sono quindi compatibili. Il prodotto di due matrici diagonali `e una matrice diagonale ed i suoi elementi sono i prodotti degli elementi corrispondenti. Quindi due matrici diagonali commutano. Supponiamo che due matrici hermitiane A e B hanno una base comune di autovettori su cui sono diagonali entrambe; allora AB = BA su quella base. Qualunque altra base si ottiene con una trasformazione unitaria U con A → ˜ B] ˜ = 0 A˜ = U AU † . Cambiando base, U AU † U BU † = U BU † U AU † ⇔ [A, quindi le due matrici comutano su qualunque base. Se commutano, le grandezze sono compatibili perch´e esiste una base in cui sono ambedue diagonali. Viceversa, due matrici hermitiane che non commutano non possono essere diagonalizzate simultaneamente e rappresentano operatori non compatibili. 10.2.8 Commutatori: trasformazioni canoniche in meccanica quantistica Una trasformazione unitaria corrisponde ad un cambiamento di base che cambia la descrizione ma preserva le regole di commutazione fra gli operatori. Un tale cambiamento di rappresentazione si chiama trasformazione canonica; infatti `e del tutto analoga ad una trasformazione canonica classica, che preserva le parentesi di Poisson e fornisce una descrizione matematicamente equivalente della stessa fisica.
156
10 Sui quattro postulati della meccanica quantistica
10.2.9 Commutatori. 5-Espedienti di calcolo ˆ B] ˆ quando non c’`e Per i commutatori si usa anche la notazione semplificata [A, ˆ ˆ ˆ A. ˆ Osserviamo ˆ ˆ pericolo di confusione con l’anticommutatore [A, B]+ ≡ AB+ B le loro propriet` a seguenti che conseguono dalla definizione: ˆ B] ˆ − = −[B, ˆ A] ˆ −; [A, ˆ B ˆ + C] ˆ = [A, ˆ B] ˆ + [A, ˆ C]; ˆ [A, ˆ ˆ B, ˆ C] ˆ − + [A, ˆ C] ˆ − B; ˆ C] ˆ − = A[ [AˆB,
(10.4)
ˆ ˆ B ˆ C] ˆ − = B[ ˆ A, ˆ C] ˆ − + [A, ˆ B] ˆ − C. [A, Si ricorder` a che per le variabili classiche valgono {A, B} = − {B, A} , {AB, C} = A{B, C} + {A, C}B, ∂A ∂B ∂A ∂B dove le graffe sono le parentesi di Poisson {A, B} ≡ k ( ∂q − ∂p ). k ∂pk k ∂qk L’analogia `e evidente. Verifichiamo alcune propriet`a. Si vede facilmente che [xn , pˆ] = i¯ hnxn−1 , usando una funzione di pro2 hx; proseguendo con A = x, B = va. Oppure, usando la (10.4) [x , p]− = 2i¯ x2 , C = p si ha [x3 , p]− = x[x2 , p] + [x, p]x2 = 3i¯ hx2 , e si pu` o ottenere la formula generale per induzione. → − − − Dalla definizione del momento angolare orbitale L = → r ∧→ p Lx = ypz − zpy , Ly = zpx − xpz , Lz = xpy − ypx , e dal commutatore fondamentale [pz , z] = −i¯ h troviamo [Lx , Ly ] = ypx [pz , z]+ hLz e cicliche, cio`e [z, pz ]py x = i¯ → − → − → − L ∧ L = i¯ hL. → −2 Inoltre [ L , Lx ] = [L2y , Lx ] + [L2z , Lx ]. Usando quanto appena osservato si ottiene [L2y , Lx ] = Ly [Ly , Lx ] + [Ly , Lx ]Ly = −i¯ h(Ly Lz + Lz Ly ) == h [Ly , Lz ]+ . −i¯ h [Ly , Lz ]+ e analogamente, [L2z , Lx ] = Lz [Lz , Lx ]+[Lz , Lx ]Lz = i¯ → −2 In definitiva, [ L , Lx ] = 0 e si possono diagonalizzare simultaneamente il quadrato del momento angolare ed una sua componente. ˆ B, ˆ C, ˆ D, ˆ E, ˆ Fˆ , calcolare Problema 22. Dati gli operatori A, ˆ C, ˆ D ˆE ˆ Fˆ ]− . [AˆB Soluzione 22. Viene: si trova ˆ C, ˆ D ˆE ˆ Fˆ ]− = AˆB{[ ˆ Fˆ + D[ ˆ C, ˆ E] ˆ − Fˆ + D ˆ E[ ˆ C, ˆ Fˆ ]− } ˆ C, ˆ D] ˆ −E [AˆB ˆ Fˆ + D[ ˆ B, ˆ E] ˆ − Fˆ + D ˆ E[ ˆ B, ˆ Fˆ ]− }Cˆ ˆ B, ˆ D] ˆ −E +A{[ ˆ Fˆ + D[ ˆ A, ˆ E] ˆ − Fˆ + D ˆ E[ ˆ A, ˆ Fˆ ]− }B ˆ D] ˆ −E ˆ C. ˆ +{[A,
10.2 Postulato 2
157
10.2.10 Matrici per l’oscillatore armonico Per l’oscillatore armonico di massa m e pulsazione ω = 2πν, le matrici delle variabili dinamiche sono semplici da trovare sulla base degli autostati di H. 1 12 Sappiamo dalla Sezione 9.7 che: la lunghezza caratteristica `e x0 = (¯ h mω ) ; x ˆ =
x0 (a+a† ) √ , 2
†
) √ ; gli operatori di creazione e di annichilazione pˆ = −i¯ h (a−a x 2 0
hanno il commutatore [a, a† ] = 1, che equivale a [ˆ p, x ˆ] = −i¯ h. Inoltre |ψn = ˆ = (ˆ n + 21 )hν, dove a† a = n Nn (a† )n |ψ0 , con ψn |ψn = 1 e risulta5 H ˆ. Sappiamo anche che a† ψn = un ψn+1 , aψn = vn ψn−1 , con le costanti un , vn da determinare. La normalizzazione si trova imponendo ψn+1 |ψn+1 = 1; si trova u2n = † a ψn |a† ψn = ψn |aa† ψn = (1 + n). Quindi ψn+1 = √ ovvero
1 a† ψn , n+1
1 |ψn = √ (a† )n |ψ0 . n!
Analogamente, ponendo aψn = vn ψn−1 , da vn2 = aψn |aψn si deduce che √ aψn = nψn−1 . √ x0 √ ( nψn−1 + n + 1ψn+1 ) e la matrice di x ˆ ha elementi Cos`ı, x ˆ ψn = √ 2 √ x0 √ xmn = √ ( nδm,n−1 + n + 1δm,n+1 ). 2
(10.5)
In modo simile si trova pmn = i¯ h
√ √ 1 √ (− nδm,n−1 + n + 1δm,n+1 ). x0 2
Deve venire ([ˆ p, xˆ])mn = (−i¯ h)mn = −i¯ hδmn . Lo verifichiamo moltiplicando righe per colonne (usando la convenzione di Einstein di somma sugli indici ripetuti) queste matrici infinite: ([ˆ p, x ˆ])mn ≡ (px − xp)mn ≡ pmk xkn − xmk pkn = −i¯ hδmn .
(10.6)
Questo risultato `e verificato in Appendice 18. 5
Mentre n ˆ `e hermitiano e rappresenta un osservabile, a non `e hermitiano; la parit` a Π : x → −x `e hermitiano ma non ha un set completo, avendo solo due autovalori; non `e una variabile dinamica classica.
158
10 Sui quattro postulati della meccanica quantistica
In modo del tutto simile, possiamo costruire le matrici di x ˆ 2 ,ˆ p2 ed infine l’Hamiltoniano, ottenendo 1 Hmn = (ˆ hωδmn n + )¯ 2 diagonale sulla base degli autostati di n ˆ. 10.2.11 Matrici e modellazioni. LCAO In certi problemi, sono pochi gli stati che interagiscono in modo importante; allora il metodo delle matrici si presta ad utili modellazioni. Il modello non banale pi` u semplice `e l’Hamiltoniano 2 × 2 : Ea V, H= . V ∗ Eb che ha svariate applicazioni: molecole biatomiche, oscillazioni di neutrini, etc. Per esempio, se Ea , Eb sono livelli atomici e V `e un termine di mescolamento, si ottiene un livello legante pi` u basso di ambedue i livelli atomici ed uno antilegante pi` u alto. Questo pu` o essere un rozzo modello per una molecola come H2+ . Questo modello teorico `e stato usato per descrivere grossolanamente le molecole poliatomiche, specialmente in chimica organica, e si chiama LCAO (Linear Combination of Atomic Orbitals). Si tratta di un metodo molto semplificato, soprattutto perch´e ignora l’interazione fra gli elettroni; tuttavia, data la sua grande semplicit`a e la sua capacit` a di riprodurre alcune tendenze sperimentali, ha un rapporto costi-benefici abbastanza favorevole.
10.3 Postulato 3 Indipendentemente dal sistema e dal suo stato, ogni misura di un osserˆ λ = λ|Ψλ . vabile Q deve dare uno degli autovalori λ dell’equazione Q|Ψ La probabilit` a di un particolare λ in uno stato |Φ `e P (λ) = Φ|Ψλ |2 . In particolare, se |Φ `e autovettore appartenente ad un autovalore discreto λ, P (λ) = 1.
10.3.1 Ragioni per cui il set deve essere completo In qualche caso la meccanica quantistica d` a certezze. L’interpretazione di Copenhagen `e che dopo la misura la Φ collassa nell’autostato e ripetendo la misura subito dopo torna con certezza lo stesso valore. Dal momento che la misura deve pur dare qualche valore, e Φ|Φ = 1, |Φ|Ψλ |2 = λ P (λ) = 1; questo `e garantito questo postulato richiede λ solo dalla completezza |Φ = λ |Ψλ Ψλ |φ, cio`e da λ |Ψλ Ψλ | = 1.
10.4 Postulato 4
159
Questa esigenza talvolta richiede molta cura nella scelta dello spazio di funzioni. Ad esempio, x `e un osservabile, e l’equazione agli autovalori x ˆf (x) = λf (x) deve avere un set completo di autovettori. In P (N ) non c’`e nemmeno una soluzione, e non basta nemmeno L2 . Infatti, per trovare il set completo occorre includere le distribuzioni; sia |ϕ(x) una funzione con x definito: si richiede che (x) ∀ψ, ϕ |ψ = dx ϕ(x) (x )ψ(x ) = ψ(x). Questa propriet`a richiede a sua volta ϕ(x) (x ) = δ(x − x ); si noti anche che x ϕ(x) (x ) = xϕ(x) (x ). 10.3.2 Formalismo discreto e formalismo continuo ˆ n = λn |en , con Nel caso discreto, avremo l’equazione agli autovalori Q|e n = 1, 2, 3, . . ., con em |en = δmn ; inoltre |Ψ = n cn |en con cn = en |Ψ . Cos`ı P (n) = |cn |2 `e la probabilit` a dell’autovalore λn . ˆ k = λk |ek , con Nel caso continuo, avremo l’equazione agli autovalori Q|e −∞ < k < ∞, ma eh |ek = δ(h−k); inoltre |Ψ = dkck |ek con ck = ek |Ψ . Cos`ı dP = |ck |2 dk `e la probabilit` a di trovare l’autovalore entro dk da λk . eikx ˆ Un esempio notevole `e Q = pˆ, che ha autofunzioni ep (x) = √ , dove 2π ∞ p=h ¯ k. La componente p di |Ψ `e cp = ep |Ψ = −∞ ep (x)Ψ (x)dx = Ψ (p, t), ed `e la funzione d’onda nello spazio dei momenti. 10.3.3 Esempio: il momento angolare Qualunque direzione pu` o essere presa come asse z e il momento angolare orbiˆ z , ma la misura della componente del momento angolare tale `e descritto da L orbitale deve dare hm e un intero. Ci` o 2π , dove il numero quantico azimutale m ` `e incomprensibile classicamente. (Il momento di spin pu` o essere semi-intero, ma questo richiede la teoria di Pauli, che `e una specie di appendice ai quattro postulati; ne riparleremo.)
10.4 Postulato 4 L’evoluzione temporale `e governata dall’equazione di Schr¨odinger i¯ h
∂ψ = Hψ. ∂t
Vediamo alcune conseguenze immediate ed importanti.
(10.7)
160
10 Sui quattro postulati della meccanica quantistica
10.4.1 Dipendenza dal tempo e derivata di un operatore Anche gli elementi di matrice degli operatori indipendenti dal tempo in genere ne dipendono, per l’evoluzione temporale del pacchetto d’onda. In meccanica quantistica di definisce la derivata di un operatore come Ψ |
ˆ d dQ ˆ = Ψ | ∂ Q|Ψ ˆ + Ψ |Q| ˆ ∂ Ψ . ˆ + ∂ Ψ |Q|Ψ |Ψ ≡ Ψ |Q|Ψ dt dt ∂t ∂t ∂t
˙ = −iH|ψ =⇒ h ˙ = iψ|H e Dall’equazione di Schr¨ odinger si ricava h ¯ |ψ ¯ ψ| quindi ˆ ˆ dQ ∂Q i ˆ ˆ = + [H, Q]. dt ∂t h ¯ Classicamente, avevamo trovato a suo tempo F˙ = ∂F +{F, H}. I commutatori ricordano le parentesi di Poisson e, se con l’Hamiltoniano sono conservati.
ˆ ∂Q ∂t
∂t
= 0, gli operatori che commutano
10.4.2 Principio di indeterminazione energia-tempo Il principio di indeterminazione generalizzato 2 2 (∆A ∆B)2 ≡ σA σB ≥ (
ˆ B]|ψ ˆ ψ|[A, )2 2i
ˆ B = Q, ˆ dove Q ˆ `e un osservabile arbitrario che non dipende dal con A = H, 1 2 2 h dQ tempo, d` a (∆E∆Q) ≥ | 2i (−i¯ dt )| , quindi ∆E∆Q ≥
dQ 1 h ¯| < > |. 2 dt
(10.8)
La derivata di Q `e dovuta solo all’evoluzione del pacchetto e su uno stato stazionario sarebbe nulla. Nell’evoluzione del pacchetto Q evolver` a su frequenze dettate da H. Che accade se la misura avviene in tempo cos`ı breve che solo l’inizio dell’evoluzione ha tempo di manifestarsi? Una ragionevole stima `e ∆Q ≈<
dQ > ∆t. dt
Mettendo nella (10.8) la ragionevole stima che abbiamo fatto si arriva al principio di indeterminazione energia-tempo ∆E∆t >
1 h ¯. 2
Dal punto di vista matematico questo principio riflette note propriet`a della trasformata di Fourier. In meccanica quantistica ogni stato stazionario ψE (t)
10.4 Postulato 4
161
ha un fattore di fase armonico e−iEt/¯h ; misurando una grandezza Q non espliˆ E (t) non dipende citamente dipendente dal tempo troviamo che ψE (t)|Q|ψ ` un dal tempo. Le cose cambiano se la misura avviene in un tempo ∆t breve. E risultato dell’analisi di Fourier che, ritagliando da una sinusoide un pezzo di lunghezza finita, si introducono tutte le frequenze. In un tempo ∆t non si pu` o distingure nettamente fra ψE (t) e gli stati di energia diversa; inevitabilmente si forma un pacchetto con una certa larghezza ∆E e durante l’evoluzione del ˆ > fluttua. Sia ∆Q l’entit` pacchetto < Q a di questa fluttuazione nel tempo ∆t. Possono avere energia ben definita solo gli stati atomici di vita lunga. Bisogna tenerne conto per progettare orologi atomici! Problema 23. Una particella si trova nello stato fondamentale di un oscillap2 tore armonico di hamiltoniano H[1] = 2m + 12 mω02 x2 . Calcolare la probabilit` a P (η) che si trovi nello stato fondamentale di un oscillatore armonico di p2 hamiltoniano H[η] = 2m + 12 m(ηω0 )2 x2 . Soluzione 23. Usando 1
√ e x1 π
ψ0 (x) = con x2η =
h ¯ mηω
=
x1 η ,
posto
1 x2a
= 12 ( x12 + 1
1 x2η )
−
x2 2x2 1
,
risulta
√ 1 √ η4 πxa = 2√ ψη |ψ1 = √ πx1 xη 1+η e quindi
√
P (η) = 2
η 2 =√ 1+η η+
√1 η
.
11 Problemi a tre dimensioni
Le equazioni differenziali alle derivate parziali sono molto pi` u difficili da risolvere di quelle ordinarie, a meno che non si possano separare le variabili. Una prima separazione `e quella che porta all’equazione per gli stati stazionari, ed `e permessa quando H non dipende dal tempo. Per fortuna fra i problemi stazionari pi` u interessanti ve ne sono di separabili in coordinate cartesiane o in coordinate sferiche.
11.1 Separazione delle variabili in coordinate cartesiane L’onda piana in 3 dimensioni `e il prodotto di 3 onde piane unidimensionali e l’energia cinetica ha 3 contributi dai moti lungo x, y, z. Pi` u in generale, il problema si separa in coordinate cartesiane se l’energia potenziale `e della forma (11.1) V (x, y, z) = Ux (x) + Uy (y) + Uz (z), dove Ux (x), Uy (y) e Uz (z) sono funzioni arbitrarie delle variabili da cui dipendono. Infatti,in tal caso i moti lungo le tre direzioni sono indipendenti. Nell’equazione di Schr¨ odinger degli stati stazionari 2 ∂ ∂2 ∂2 + 2 + 2 Ψ (x, y, z) + V (x, y, z)Ψ (x, y, z) = EΨ (x, y, z) ∂x2 ∂y ∂z sostituiamo la soluzione fattorizzata Ψ (x, y, z) = X(x)Y (y)Z(z) e dividiamo i due membri per Ψ (x, y, z). Risulta
(11.2)
164
11 Problemi a tre dimensioni
1 δ2X 1 δ2 Y 1 δ2 Z + U (x) + + U (z) + + Uz (z) = E. x z X(x) δx2 Y (y) δy 2 Z(z) δz 2 Ne consegue che ⎧ 1 δ2X δ2X ⎪ ⎪ + Ux (x) = x ⇒ + Ux (x)X(x) = x X(x), ⎪ ⎪ 2 ⎪ X(x) δx δx2 ⎪ ⎪ 1 δ2Y ⎪ δ2 Y ⎨ + Uy (y) = y ⇒ + Uy (y)Y (y) = y Y (y), 2 Y (y) δy δy 2 ⎪ ⎪ δ2Z 1 δ2 Z ⎪ ⎪ ⎪ + U (z) = ⇒ + Uz (z)Z(z) = z Z(z), z z ⎪ ⎪ Z(z) δz 2 δz 2 ⎪ ⎩ x + y + z = E, ed il problema si separa in 3 equazioni ordinarie. Quelle che si ottengono in questo modo sono soluzioni particolari, ma poich´e (in accordo col secondo postulato) costituiscono un set completo la soluzione pi` u generale `e una combinazione lineare di queste. Scatola parallelepipeda Consideriamo una particella confinata da un potenziale L L 0, − L2x < x < L2x , − 2y < y < 2y , − L2z < z < V (x, y, z) = ∞ altrimenti.
Lz 2 ,
V `e della forma (11.1). Separando le variabili, si trovano le autofunzioni ψnx ny nz (x, y, z) = unx (x)uny (y)unz (z) e gli autovalori dell’energia Enx ny nz (x, y, z) = nx + ny + nz con / unx =
2 Lx
sin
πnx Lx
x+
Lx 2
,
π 2 n2
nx = h ¯ 2 2mLx2 , x
etc.. I moti lungo i 3 assi sono indipendenti; classicamente prenderemmo il prodotto delle probabilit` a, qui viene il prodotto delle ampiezze, che significa comunque indipendenza statistica. Nel caso cubico Lx = Ly = Lz = L molti livelli sono degeneri, cio`e diverse scelte di numeri quantici hanno la stessa energia, ad esempio E511 = E151 = π2 E115 = E333 = 27¯ h2 2mL 2.
11.2 Separazione delle variabili in coordinate sferiche
165
Oscillatore in 3 dimensioni Analogamente si risolve il problema con H=
1 p2 + m ωx2 x2 + ωy2 y 2 + ωz2 z 2 , 2m 2
sempre con Enx ny nz (x, y, z) = nx + ny + nz ed alta degenerazione per il caso isotropo ωx = ωy = ωz = ω.
11.2 Separazione delle variabili in coordinate sferiche Nei problemi centrali, l’energia potenziale dipende solo dalla distanza da un punto che conviene prendere allora come origine riscrivendo il problema in coordinate sferiche. Le trasformazioni da coordinate cartesiane a coordinate sferiche e viceversa sono: ⎧ ⎧ 2 2 2 ⎨ x = rsinθ cos φ, ⎪ ⎨r = x + y + z , z θ = arccos( √ 2 2 2 ), y = rsinθ sin φ, x +y +z ⎩ ⎪ ⎩ z = r cos θ, φ = arctan( y ). x
Il laplaciano in coordinate sferiche `e piuttosto complicato, ma `e noto (vedi Appendice): ∂2 ∂ 1 ∂ 1 ∂ 1 2 2 ∂ ∇ = 2 . r + 2 sin(θ) + 2 2 r ∂r ∂r r sin(θ) ∂θ ∂θ r sin (θ) ∂φ2 Se V = V (r), l’equazione degli stati stazionari h ¯2 2 ∇ + V (r) Ψ (r, θ, φ) = EΨ (r, θ, φ) − 2m si separa in una equazione radiale ed una angolare ponendo Ψ (r, θ, φ) = R(r)Y (θ, φ). Infatti, se Y soddisfa l’equazione angolare 1 ∂ ∂Y 1 ∂2Y = −λY, sin(θ) + 2 sin(θ) ∂θ ∂θ sin (θ) ∂φ2 per la funzione radiale basta risolvere l’equazione ordinaria d 2mr2 2 dR [V (r) − E] R = λR. r − dR dr h ¯2 L’equazione angolare si separa a sua volta ponendo
166
11 Problemi a tre dimensioni
Y (θ, φ) = Θ(θ)Φ(φ), dove
d2 Φ = −m2 Φ ⇒ Φ = eimφ , intero. dφ2
Riconosciamo le autofunzioni di Lz , che abbiamo gi` a incontrato nel Capitolo precedente. L’equazione per Θ `e: d dΘ sin(θ) sin(θ) + {λ sin2 (θ) − m2 }Θ = 0. dθ dθ Le soluzioni sono funzioni speciali Θ(θ) ∝ Plm (cos(θ)). Conviene adesso studiare meglio il nesso col momento angolare.
11.3 Momento angolare in 3 dimensioni 11.3.1 Algebra del momento angolare → − → − → − Da L ∧ L = i¯ h L , cio`e [Lx , Ly ] = i¯ hLz , [Ly , Lz ] = i¯ hLx , [Lz , Lx ] = i¯ hLy , possiamo dedurre gli autovalori del momento angolare. Gi`a sappiamo che L 2 = → − L2x + L2y + L2z commuta con le componenti, [L2 , L ] = 0 e che ogni componente ha autovalori m¯ h, con m intero. Scegliamo di avere diagonale la componente z e scriveremo L2 |λ, m = λ|λ, m, Lz |λ, m = m|λ, m, m ≤ l, dove λ¯ h2 `e l’autovalore di L2 e l¯ h il massimo valore che pu`o assumere la componente z a λ fissato. Infatti `e chiaro che λ ≥ m2 . Introduciamo gli operatori di shift L± , cio`e L+ = Lx + iLy , L− = Lx − iLy . Poich´e [Lz , L± ] = ±¯ hL ± , si trova Lz L± |λ, m = (m ± 1)¯ hL± |λ, m, quindi L± |λ, m = C± |λ, m ± 1, propriet` a che giustifica il nome di operatori di spostamento. Inoltre, L+ |λ, l = 0.
(11.3)
11.3 Momento angolare in 3 dimensioni
167
` immediato vedere che E L− L+ = L2 − L2z − h ¯ Lz ; quindi L− L+ + L2z + h ¯ Lz = L2 ; applicando l’identit` a a |λ, l si trova che λ = l(l + 1). Nondimeno, si usa denotare gli autostati con |l, m anzich´e con |l(l + 1), m. Moltiplichiamo scalarmente (11.3) per se stessa; si trova che 2 C± = [l(l + 1) − m(m ± 1)]¯ h2
e possiamo scrivere L± |l, m =
l(l + 1) − m(m ± 1)¯ h|l, m ± 1.
11.3.2 Matrici del momento angolare → − Con le relazioni della sezione precedente calcoliamo le matrici di L sulla base degli autostati |l, m, che sono chiamati le armoniche sferiche. Gli elementi di matrice sono: l1 m1 |L2 |l2 m2 = h ¯ 2 l1 (l1 + 1)δl1 ,l2 δm1 ,m2 (11.4) ¯ m1 δl1 ,l2 δm1 ,m2 l1 m1 |Lz |l2 m2 = h l1 m1 |L± |l2 m2 = h ¯
l2 (l2 + 1) − m2 (m2 ± 1)δl1 ,l2 δm1 ,m2 ±1 .
(11.5) (11.6)
Esempio 6. Matrici di l = 1 in unit` a di h ¯. √ √ Lz = diag(1, 0, −1); L+ |1, −1 = 2|1, 0; L+ |1, 0 = 2|1, 1; L+ |1, 1 = 0. Assegnamo i vettori di base con ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 0 0 |1, 1 → ⎝ 0 ⎠ , |1, 0 → ⎝ 1 ⎠ , |1, −1 → ⎝ 0 ⎠ , 0 0 1 e troviamo (indicando le matrici coi nomi degli operatori): ⎛ √ ⎞ 0 2 √0 L+ = ⎝ 0 0 2 ⎠ 0 0 0 da cui segue subito
⎛
√0 0 L− = ⎝ 2 √0 0 2
⎞ 0 0⎠, 0
(11.7)
(11.8)
168
11 Problemi a tre dimensioni
e quindi
⎛
⎞ 010 1 Lx = √ ⎝ 1 0 1 ⎠ , 2 010 ⎛ ⎞ 0 −i 0 1 ⎝ i 0 −i ⎠ . Ly = √ 2 0 i 0
(11.9)
(11.10)
In generale, in termini di matrici di rango 2l + 1, possiamo rappresentare il → − momento angolare sulla base delle armoniche |l, m. Le matrici di L sulla base degli autostati |l, m hanno le stesse regole di commutazione degli operatori del momento angolare e gli stessi autovalori nel sottospazio corrispondente; formano una rappresentazione del momento angolare. 11.3.3 Momento angolare in coordinate sferiche In Appendice 19 si dimostrano le trasformazioni da coordinate cartesiane a coordinate sferiche per le componenti del momento e del momento angolare. Bench´e si tratti solo di fare derivate, i calcoli sono piuttosto lunghi. ⎧ cos(φ) cos(θ) ∂ sin(φ) ∂ ∂ ⎪ ⎪ + − ipx = sin(θ) cos(φ) ⎪ ⎪ ∂r r ∂θ r sin(θ) ∂φ ⎪ ⎨ sin(φ) cos(θ) ∂ cos(φ) ∂ ∂ + + ipy = sin(θ) sin(φ) ⎪ ∂r r ∂θ r sin(θ) ∂φ ⎪ ⎪ ⎪ sin(θ) ∂ ∂ ⎪ ⎩ − . ipz = cos(θ) ∂r r ∂θ Lz = xpy − ypx = −i L± ≡ Lx ± iLy = e±iφ [ −L2 =
∂ . ∂φ
∂ ∂ ± i cot(θ) ]. ∂θ ∂φ
∂ 1 ∂2 1 ∂ sin(θ) + 2 sin(θ) ∂θ ∂θ sin(θ) ∂φ2
Si riconosce cos`ı che la nota espressione del Laplaciano si pu`o scrivere 1 ∂ L2 2 2 ∂ ∇ = 2 r − 2. r ∂r ∂r r 11.3.4 Armoniche Sferiche Per definizione, Ylm (θ, φ) `e autofunzione di L2 con autovalore h ¯ 2 l(l + 1) e di imφ h. Calcoliamo Y2m (θ, φ) = Θ2m (θ)e . Da L+ Y22 = 0, Lz con autovalore m¯ cio`e ∂Y22 = 2 cot(θ)Y22 ∂θ
11.3 Momento angolare in 3 dimensioni
169
non `e difficile vedere che, normalizzazione a parte, Y22 = e2iφ (sin2 (θ)). Questo `e generale: Yll = eliφ (sinl (θ)). Proseguiamo. Y21 ≈ L− Y22 = e−iφ [
∂ ∂ − i cot(θ) ]e2iφ (sin2 (θ)) ≈ sin(θ) cos(θ)eiφ . ∂θ ∂φ
Da Y33 = e3iφ (sin3 (θ)), applicando L− , troviamo che, norma a parte, Y32 = ∂ (sin3 (θ)) ≈ e2iφ sin2 (θ) cos(θ). e2iφ ∂θ ∂ Su Y32 , i ∂φ = −2, quindi Y31 ≈ e−iφ [
∂ + 2 cot(θ)]Y32 ≈ eiφ sin(θ)[5 cos2 (θ) − 1]. ∂θ
Le normalizzazioni si calcolano con integrali tabulati imponendo ∗ (θ, φ)Yl m (θ, φ) = δll δmm . dΩYlm Le armoniche sferiche sono facili da calcolare, e sono esse stesse tabulate, in termini di funzioni speciali note come funzioni associate di Legendre. l m 0 0 1 0 1 ±1
± /
2 0 2 ±1 ± 2 ±2
Ylm rl
Ylm √1 / 4π 3 cos θ / 4π 3 8π
sin θe±iφ
5 (3 cos2 /16π
√1 4π 3 cos θz / 4π
/
θ − 1)
± /
3 8π (x
5 2 16π (3z /
± iy) − r2 )
15 cos θ sin θe±iφ ± 8π z(x ± iy) / 2 15 15 ±2iφ 2 32π sin θe 32π (x ± iy)
15
/ 8π
La relazione di chiusura `e1 ∞ k
∗ Ykm (θ1 , φ1 )Ykm (θ2 , φ2 ) = δ(Ω1 − Ω2 )
k=0 m=−k
=
δ(θ1 − θ2 )δ(φ1 − φ2 ) . | sin(θ1 )|
La parit`a `e l’operazione P : (x, y, z) → (−x, −y, −z). Per cambiare di segno z = r cos(θ) occorre θ → π − θ, che comporta sin(θ) → sin(θ). Per cambiare di 1
come si ricorder` a, δ(g(x)) =
α
δ (x − xα )
dg dx
.
170
11 Problemi a tre dimensioni
segno x e y bisogna cambiare di segno sia cos(φ) che sin(φ). Questo si ottiene con φ → φ + π. Insomma, P : φ → φ + π, θ → π − θ. Sotto parit` a, Yll = eliφ (sinl (θ)) prende un fattore eilπ = (−1)l . Questo risultato non pu` o dipendere da m poich´e L± , come anche le componenti dello pseudovettore momento angolare, non cambiano per parit`a. Quindi la parit` a di l `e la stessa della parit`a dello stato.
11.4 Campo centrale Come abbiamo visto, con un campo centrale V (r) useremo coordinate sferiche, e cercheremo soluzioni della forma ψ(r, θ, φ) = R(r)Ylm (θ, φ) sulle quali −∇2 ψ = =
−1 ∂ r 2 ∂r −1 ∂ r 2 ∂r
2∂ r ∂r +
L2 h ¯ 2 r2
ψ 2 ∂ l(l+1) r ∂r + r2 ψ.
Poich´e l’armonica sferica si elide, si ottiene l’equazione radiale −1 ∂ 2mV (r) l(l + 1) 2 ∂R R+ R = k 2 R(r), r + r2 ∂r ∂r r2 h ¯2
(11.11)
dove
2mE . h ¯2 I calcoli si semplificano un po’ ponendo u R= ; r k2 =
si trova
h ¯ 2 −1 d2 u l(l + 1) u u u + + V (r) = E , 2 2 2m r dr r r r r
cio`e −
h ¯ 2 l(l + 1) h ¯ 2 d2 u + u(r) + V (r)u(r) = Eu(r) 2m dr2 %2m r2 $
che `e un problema unidimensionale con un termine potenziale modificato. Il termine in l(l+1) si chiama potenziale centrifugo e impedisce ad una particella di raggiungere il centro se non ha l = 0. Conviene scrivere −
2m d2 u l(l + 1) + u(r) + 2 V (r)u(r) = k 2 u(r). dr2 r2 h ¯
11.4 Campo centrale
171
Particella libera Per V = 0 si ottiene d2 u l(l + 1) = u(r) − k 2 u(r). 2 dr r2 Per V = 0 la (11.11) con ρ = kr `e l’equazione di Bessel sferica 2ρR + ρ2 R + (ρ2 − l(l + 1))R = 0 che ha soluzioni jl (ρ) = ρl (−
1 d l sin(ρ) ) . ρ dρ ρ
In tal modo si possono determinare gli autostati della particella libera con H, L2 , Lz diagonali. Per l = 0, in modo elementare ul=0 (r) = sin(kr) =⇒ Rl=0 (r) =
sin(kr) . r
L’alternativa ul=0 (r) = cos(kr) darebbe una Rl=0 (r) singolare nell’origine e va dunque scartata. ` interessante anche l’espansione dell’onda piana in armoniche sferiche, che E `e pi` u semplice per eikz /, perche vi concorrono solo le armoniche con m = 0,
2l+1 o date da Yl0 (θ, φ) = 4π Pl (cos(θ)), con Pl polinomi di Legendre. Si pu` dimostrare che vale l’identit`a
eikz =
∞ l=0
r 1 d l sin(kr) ) . (−i)l (2l + 1)Pl (cos(θ))( )l ( k r dr r
Buca di potenziale sferica Imponendo condizioni al contorno per r = R0 si ottengono gli autovalori per la particella in una scatola di potenziale sferica V = 0 r < a, V (r) = V = ∞ r > a. Nel caso l = 0 si trovano gli autovalori En0 =
h ¯ 2 π2 2 n , n = 1, 2, 3, · · · 2ma2
Pi` u in generale gli autovalori Enl si esprimono come Enl =
h ¯ 2 π2 , 2mk 2
in termini delle radici dell’equazione jl (ka) = 0.
172
11 Problemi a tre dimensioni
11.5 Stati legati dell’atomo Idrogenoide 2
Con V (r) = − Zer , l’equazione radiale `e 2mE 2m Ze2 d2 u l(l + 1) u= + u − u. 2 dr2 r2 r h ¯ h ¯2 Il problema classico di Kepler non ha scala, e l’orbita pu` o essere piccola quanto si vuole; invece la meccanica quantistica determina le dimensioni atomiche 2 in termini di h ¯ . Poich´e ddru2 `e una lunghezza quadrata inversa, la lunghezza caratteristica `e il raggio dell’orbitale −
aB h ¯2 = , me2 Z Z `e il raggio di Bohr; l’equazione `e a0 =
dove aB
−
d2 u l(l + 1) 2mE 2 u= + u− u. dr2 r2 a0 r h ¯2
Risulta aB = 0.529 Angstr¨ om, dove 1 Angstr¨ om =10−8 cm. Mettiamo l’equazione in forma adimensionale ponendo ρ=
r 2ma20 E , = <0 a0 h ¯2
(11.12)
e moltiplicando per a20 . La forma adimensionale `e 2 l(l + 1) ]u(ρ). u + u(ρ) = [− + ρ ρ2
(11.13)
Soluzione particolare Il caso2 l = 0 `e pi` u semplice, e√per ρ → ∞ approssimando con u + u(ρ) ∼ 0 si trova l’andamento u → e−ρ − : proviamo la soluzione √ u = ρe−λρ , λ = −. Risulta u = (1 − λρ)e−λρ 2 −λρ u = (−2λ + λ2 ρ)e−λρ = ( −2λ ρ + λ )ρe
e quindi soddisfa con = −1. Questi risultati, che come vedremo, riguardano lo stato normale dell’atomo, comportano R(r) ∝ e− a0 = e r
− aZr
B
, E=−
h ¯2 1 me4 Z 2 = − . 2ma20 2 h ¯2 2
Si noti la forte dipendenza da Z e che E = − Ze 2a0 . 2
Gli stati con l = 0, 1, 2, 3, . . ., si chiamano s, p, d, f, g, h, i, etc., proseguendo con l’ordine alfabetico.
11.5 Stati legati dell’atomo Idrogenoide
Normalizzazione ∞ Poich´e I(a) = 0 e−ax dx = a1 , r che √2 3 e− a0 `e normalizzato con
d2 I(a) da2
=
∞ 0
e−ax x2 dx =
2 a3
173
si vede subito
a0
∞
drr2 |R1,0 |2 = 1.
0
Dato che Y00 =
√1 , 4π
risulta ψ=
1 πa30
e− a . r
Soluzione generale Ricaviamo ora tutti gli stati legati. Dalla (11.13), vediamo che anche se l > 0, √ per ρ → ∞, non cambia l’andamento asintotico u → e−ρ − ; quello che cambia `e l’andamento a breve distanza dal centro a causa della barriera centrifuga; possiamo scrivere l(l + 1) u ∼ u(ρ), ρ → 0; ρ2 √ integrando, u → ρl+1 . Poniamo allora λ = −, con u = e−λρ ρl+1 [c0 + c1 ρ + . . . + cnr ρnr ] = e−λρ c0 ρl+1 + c1 ρl+2 + . . . + cnr ρl+1+nr ovvero u(ρ) = e−λρ
nr
cν ρν+l+1 .
(11.14)
ν=0
Quindi, la soluzione `e della forma u = e−λρ ρl+1 f (nr ,l) (ρ),
(11.15)
dove nr `e il numero quantico radiale; come vedremo, nr → ∞ non `e accettabile, quindi f (nr ,l) (ρ) `e un polinomio. Allora, derivando la (11.14), u = e−λρ
nr
cν [−λρν+l+1 + (ν + l + 1)ρν+l ].
ν=0
Derivando ancora, si trova nr u = e−λρ ν=0 cν {−λ[−λρν+l+1 + (ν + l + 1)ρν+l ] −λ(ν + l + 1)ρν+l + (ν + l + 1)(ν + l)ρν+l−1 }.
174
11 Problemi a tre dimensioni
Semplifichiamo: u = e−λρ
nr
cν {λ2 ρν+l+1 − 2λ(ν + l + 1)ρν+l + (ν + l)(ν + l + 1)ρν+l−1 }.
ν=0
Il primo termine `e λ2 u + u = e−λρ {−2λ
cν ρν+l+1 e−λρ = −u. Quindi,
nr
cν (ν + l + 1)ρν+l +
ν=0
nr
cν (ν + l)(ν + l + 1)ρν+l−1 };
ν=0
per avere potenze omogenee conviene spostare la seconda somma. Questo significa cambiare ν chiamandolo ν + 1, cio`e scrivere b nome all’indicemuto b b−1 f (ν) = f (ν + 1) = ν=a ν+1=a ν=a−1 f (ν + 1). Per non doverci preoccupare dei primi e degli ultimi termini stabiliamo che cν = 0 per ν < 0 e per ν > nr . Risulta r u +u = e−λρ {−2λ nν=0 cν (ν + l + 1)ρν+l r −1 + nν=−1 cν+1 (ν + l + 1)(ν + l + 2)ρν+l }. raccogliamo insieme potenze uguali di ρ con u + u = e−λρ {
nr
ρν+l [−2λcν (ν + l + 1)
ν=−1
+cν+1 (ν + l + 1)(ν + l + 2)]}. Ma, per la (11.13), u + u = [− ρ2 + espandendo il secondo membro viene
l(l+1) ρ2 ]u(ρ);
(11.16)
mettendoci la (11.14) ed
nr nr l(l + 1) −2 −λρ ν+l u+ u = e [−2 c ρ + l(l + 1) cν ρν+l−1 ], ν ρ ρ2 ν=0 ν=0
e spostando ancora la somma (con c−1 = 0) si trova nr nr −1 cν ρν+l + l(l + 1) ν=−1 cν+1 ρν+l ] e−λρ [−2 ν=0 nr ρν+l [−2cν + l(l + 1)cν+1 ] . = e−λρ ν=−1 Uguagliando con (11.16), −2λcν (ν + l + 1) + cν+1 (ν + l + 1)(ν + l + 2) = −2cν + l(l + 1)cν+1 , ovvero, raccogliendo, cν+1 [(ν + l + 1)(ν + l + 2) − l(l + 1)] + 2cν [1 − λ(ν + l + 1)] = 0. Conviene semplificare il coefficiente di cν+1 . Poniamo a = ν + 1; resta
11.5 Stati legati dell’atomo Idrogenoide
175
(ν + l + 1)(ν + l + 2) − l(l + 1) = (a + l)(a + l + 1) − l(l + 1) = a2 + a(l + 1) + al + l(l + 1) − l(l + 1) = a(a + 2l + 1) = (ν + 1)(ν + 2 + 2l). Risolviamo per cν+1 : cν+1 = 2
λ(ν + l + 1) − 1 cν . (ν + 1)(ν + 2l + 2)
(11.17)
Questa `e una relazione di ricorrenza che, come la (9.17), per ν → ∞ diventa una serie esponenziale f (nr ,l) (ρ) ∼ e2λρ . La serie deve terminare perch´e una funzione a crescita esponenziale renderebbe impossibile la normalizzazione. Perch´e la serie termini occorre che venga cnr +1 = 0 quando ν = nr , dove il numero quantico radiale nr `e il grado del polinomio. La condizione `e λn = 1,
(11.18)
n = nr + l + 1
(11.19)
dove definisce il cosiddetto numero quantico principale n. La funzione d’onda completa `e etichettata da n e dai numeri quantici angolari: ψn,l,m (r, θ, φ) = Rn,l (r)Yl,m (θ, φ). Per n = 1, 2, 3, 4, . . . si hanno i gusci K, L, M, N, O, P . . . che si riscontrano grosso modo in tutti gli atomi. Poich´e nr `e nullo o positivo, l varia da 0 a n−1. Il guscio K ha un solo orbitale, il guscio L ne ha 4, il guscio M ne ha 9. Quanti n−1 p ; viene l=0 (2l + 1) = n2 . ne ha il guscio n? Si ricorder` a che n=1 = p(p+1) 2 Quadrando λ = n1 , = − n12 , cio`e per la (11.12), En = −
Z 2 e2 13.59Z 2 =− eV. 2 2aB n n2
Le energie dipendono solo da n; per questo, 2s e 2p sono degeneri, 3s, 3p, 3d sono degeneri, etc.. La successione degli stati `e 1s, 2s, 2p, 3s, 3p, 3d, . . . secondo lo schema seguente. guscio n nome livello momento angolare l m permessi K 1 1s 0 m=0 2s 0 m=0 L 2 2p 1 m = −1, 0, 1 ⎧ 3s 0 m =0 ⎨ 3p 1 m = −1, 0, 1 M 3 ⎩ 3d 2 m = −2, −1, 0, 1, 2 4s 0 m=0 4p 1 m = −1, 0, 1 N 4 4d 2 m = −2, −1, 0, 1, 2 4f 3 m = −3, −2, −1, 0, 1, 2, 3 ··· ··· ··· ··· ···
176
11 Problemi a tre dimensioni
Questi livelli sono quelli osservati (a meno di piccole correzioni che dipendono da effetti relativistici). Spettroscopicamente, uno osserva fotoni alle frequenze 1 1 νmn = R − 2 , n2 m dove R `e la costante di Rydberg, fotoni che l’atomo emette nel decadimento m → n o assorbe nella transizione opposta. La serie di linee con n = 2 fu scoperta da Balmer nel 1885 e comincia nel visibile, con la riga Hα con ω23 nel rosso, la riga Hβ con ω24 nel blu, la riga Hγ con ω25 nel violetto; la serie continua nell’ultravioletto. Poi fu scoperta la serie ultravioletta di Lyman con n = 1; infine le serie infrarosse com m = 3, 4, 5. Questi risultati sono riprodotti da un modello semiclassico di Bohr (1913), ma la vera spiegazione venne nel 1925 con la meccanica quantistica ed `e 1 1 − . h ¯ ωmn = Em − En = 13, 59eV n2 m2 Le intensit` a delle transizioni sono anch’esse calcolate dalla meccanica quantistica, trattando l’interazione con la radiazione elettromagnetica con vari metodi; il pi` u elementare `e il metodo perturbativo, di cui parleremo. Eliminando λ nella (11.17) con la condizione λn = 1, troviamo la relazione di ricorrenza per i coefficienti di f (nr ,l) : cν+1 =
ν +l+1−n 2 cν . n (ν + 1)(ν + 2l + 2)
Questa relazione si pu`o semplificare un po’ eliminando il fattore cambiamento di scala.
(11.20) 2 n
con un
Cambiamento di scala Supponiamo che una funzione L(x) =
aν xν
sia definita da una relazione di ricorrenza aν+1 = ξ(ν); aν con un cambiamento di scala L(x) → L(sx) con una costante arbitraria s si ottiene a L(sx) = aν xν , aν = aν sν =⇒ ν+1 = s ξ(ν). aν 2l+1 Quindi possiamo scrivere f (nr ,l) (ρ) = L( 2ρ ha la relazione di n ), dove Lnr ricorrenza semplificata
11.5 Stati legati dell’atomo Idrogenoide
aν+1 =
ν +l+1−n aν . (ν + 1)(ν + 2l + 2)
177
(11.21)
che definisce3 i polinomi associati di Laguerre. Adesso, dalla (9.3) otteniamo u(ρ)
2ρ = e−λρ ρl+1 L2l+1 nr ( n ); λ = 1/n,
(11.22)
ρ
2ρ Rnl (ρ) = e− n ρl L2l+1 nr ( n ).
Funzioni radiali Possiamo ricavare le prime funzioni radiali dalla (11.21), ricordando che ν ≤ nr e che n = nr + l + 1. Per n = 1, nr = l = 0 e ν = 0. Ponendo a0 = 1 viene a1 = 0. Per n = 2 ci sono le due possibilit` a nr = 1, l = 0, nr = 0, l = 1. ν−1 aν . Per ν = 0 si Per nr = 1, l = 0, la (11.21) diventa aν+1 = (ν+1)(ν+2) trova a1 = −a0 /2; per ν = 1 viene a2 = 0. Quindi, 1 L11 (ρ) = 1 − ρ, 2 e, a meno di normalizzare, ρ 1 R20 (ρ) = e− 2 (1 − ρ). 2
Per nr = 0, l = 1, c’`e solo ν = 0; la (11.21) aν+1 = a1 = 0, l = 1 e viene ρ R21 (ρ) = e− 2 ρ.
ν (ν+1)(ν+4) aν ,
Di seguito, riportiamo alcune funzioni radiali normalizzate con ∞ |Rn,l (r)|2 r2 dr = 1. 0
3
I polinomi associati di Laguerre Lpq−p (x) = (−1)p
4
d dx
5p Lq (x)
sono definiti in termini dei polinomi di Laguerre Lq (x) = ex
4
d dx
5q
e−x xq .
d` a
178
11 Problemi a tre dimensioni
R1,0 = √2 3 e−ρ a0
R2,0 = √1 3 (1 − ρ2 )e− 2 2a0
R2,1 = √ 1
ρ
ρ
ρe− 2
24a30 − 2ρ 3
2 −ρ 3 + 2ρ (1 27 )e 27a30 ρ ρ 8 − R3,1 = √ 3 (1 − 6 )ρe 3 27 6a0 ρ R3,2 = √4 3 ρ2 e− 3 81 30a0
R3,0 = √ 2
Si noti che Rnl (r) ha n − 1 nodi, cio`e distanze dal nucleo dove la funzione d’onda si annulla. 11.5.1 Effetto Zeeman normale → − Consideriamo l’atomo di H in un campo magnetico uniforme e costante B : H=
1 → e→ Ze2 − (− p − A )2 − 2µ c r
con e < 0. Prendiamo l’asse z lungo il campo ed il potenziale vettore → − → B ∧− r B → − A = = (−y, x, 0); (11.23) 2 2 → − → − → − → − → − − B = rot A . Ora, [→ p , A ]− = −i¯ h ∇ · A = 0; inoltre noi trascuriamo il termine in A2 perch´e gli effetti magnetici sono in pratica piccoli e quelli quadratici richiedono campi enormi. Quindi H=
Ze2 e → p2 − → − − A ·− p 2µ r µc
e l’ultimo termine `e −
eB eB e → − → (−ypx + xpy ) = − Lz . A ·− p =− µc 2µc 2µc
Le soluzioni idrogenoidi che abbiamo ricavato sono autofunzioni di L z ; tutto quello che accade nell’effetto Zeeman normale `e che gli autovalori sono Enlm = En(B=0) −
e¯ h mB. 2µc
Ogni livello atomico etichettato con l per B = 0 si risolve in 2l + 1 livelli. Tuttavia questa descrizione dell’effetto Zeeman `e incompleta e non `e in accordo con l’esperimento, perch´e manca un ingrediente importante: lo spin. Per questo occorre passare alla teoria di Pauli.
11.6 Generatori di Traslazioni e Rotazioni e operatori unitari
Osservazione 5. µB = −
179
e h ¯ 2µc
con µ = me `e il magnetone di Bohr ∼ 9.2710−24JT −1 . Il termine in A2 `e dell’ordine
e2 A2 µc2
∼
e2 (BaB )2 µc2
=
e2 h ¯ 2 B 2 aB µ2 c2 e2
campo di 1 T.
=
hB 2 ( e¯ µc ) e2 aB
ed `e molto piccolo per un
11.6 Generatori di Traslazioni e Rotazioni e operatori unitari ˆ e che rappresentano Accanto agli operatori hermitiani, per i quali vale Aˆ† = A, ˆ osservabili, occorrono anche quelli unitari, per i quali A† = Aˆ−1 . Nell’uso pi` u comune il loro significato `e geometrico, e rappresentano rotazioni, riflessioni e traslazioni. Traslazioni Una traslazione di a in una dimensione Ta `e un operatore tale che per ogni funzione analitica f , Ta f (x) = f (x + a). Poich´e f (x + a) =
n ∞ an d f (x), n! dx n=0
`e naturale esprimere la traslazione come un operatore iperdifferenziale (contenente derivate di ogni ordine) n ∞ p an d d Ta = = ea dx = eia h¯ . n! dx n=0 L’impulso `e detto il generatore delle traslazioni infinitesime ed `e conservato se il sistema `e invariante per tutte le traslazioni. Rotazioni La matrice di una rotazione di ∆φ intorno al’asse z `e cos(∆φ) sin(∆φ) R∆φ = . − sin(∆φ) cos(∆φ) − − Notare che → x = R∆φ → x `e ruotato in senso orario se ∆φ > 0; `e invece ruotata in senso antiorario la funzione f (x, y, z) → R∆φ f (x , y , z) = f (x cos(∆φ)+y sin(∆φ), y cos(∆φ)−x sin(∆φ), z).
180
11 Problemi a tre dimensioni
→ − L’operatore R si pu` o esprimere in termini di L . Per stabilire la connessione conviene considerare ∆φ come l’esito di una successione di n → ∞ rotazioni infinitesime δφ = ∆φ n . Una rotazione infinitesima intorno all’asse z, con cos(∆φ) ∼ 1, sin(∆φ) ∼ ∆φ, produce una variazione che `e data dalla → − componente z di L perch´e → f (x , y , z) ∼ f (x + yδφ, y − xδφ, z) Rδφ 3 ∂f ∂f ∼ f (x, y, z) + δφ y −x = f (x, y, z) + δφ(−i)Lz f (x, y, z) ∂x ∂y f (x, y, z)
e f (x, y, z)
→ [1 − iδφLz ] f (x, y, z). Rδφ
Quindi l’operatore della rotazione infinitesima `e Rδφ = [1 − iδφLz ] . n
a Per la rotazione finita occorre R∆φ = Π Rδφ . Ricordando l’identit` δφ
e−a =
a Lim (1 − )n n→∞ n
si ottiene l’operatore della rotazione di un angolo ∆φ attorno all’asse z nella forma (in unit` ah ¯ = 1) Rφ = e−i∆φLz . Pi` u in generale,
−→ → − R− → = e−i∆φ· L . φ → − Per questo si parla del generatore L delle rotazioni infinitesime. → − Un sistema invariante per rotazioni R `e tale che [H, R− → ]− = 0, ∀ φ ; ma φ R− → non `e un operatore hermitiano, che rapresenti una grandezza dinamica φ † −1 conservata. Si tratta di un operatore unitario, R→ o `e vero anche − = R→ − . Per` φ φ → − che [H, L ]− = 0. Il momento angolare L si conserva. In un sistema ci possono essere pi` u momenti angolari accoppiati (momenti di diverse parti del sistema, come vedremo prossimamente anche momenti angolari di spin), ma un sistema `e isolato `e sempre invariante per rotazioni complessive, a causa dell’isotropia dello spazio. Pertanto, come in meccanica classica, il momento angolare totale di qualsiasi sistema isolato si conserva.
12 Spin e campo magnetico
In Inglese, spin vuol dire trottola, ma una trottola classica di raggio 0 non potrebbe avere momento angolare. Un elettrone ha raggio 0 e momento ¯ . Vediamo come fa. angolare intrinseco 12 h
12.1 Momenti magnetico e angolare in Fisica classica Classicamente, per una carica puntiforme (elettrone) che percorre una spira circolare di raggio r, la corrente i produce un momento di dipolo magnetico ev − → − n con S = πr2 , in notazione ovvia; poich´e i = 2πr , µ = ci S → e− → ev − e → − → − n = → L. µ = r→ r ∧− v = 2c 2c 2mc
(12.1)
e 2mc
prende il nome di fattore giromagnetico. Il dipolo produce un campo magnetico, di potenziale vettore → − − µ ∧→ r → − . A= r3 → − In un campo magnetico esterno, B il dipolo ha energia → − − E = −→ µ · B.
(12.2)
Un momento magnetico che forma un angolo θ con l’asse z precede intorno all’asse, ma non pu` o modificare θ per la conservazione dell’energia. In un campo disomogeneo la (12.2) dice che il dipolo `e soggetto a una forza → − → − → − − → − F = − ∇E = ∇[→ µ · B ].
(12.3)
182
12 Spin e campo magnetico
Misura di un momento magnetico di oggetti microscopici Immaginiamo di avere un fascio di oggetti di massa nota e di momento ma` possibile misurare µ di un corpo facendo il modo che il fascio gnetico µ. E attraversi in un breve tempo ∆t un campo magnetico non uniforme in modo da subire una piccola deflessione. I corpi devono essere privi di carica, altrimenti la forza di Lorenz complica le cose eccessivamente. Supponiamo che un momento magnetico faccia un percorso lungo l, impiegando il tempo ∆t = vl , in un campo disomogeneo, con ∂B ∂z = 0. Allora, z m∆v ≈ F ∆t, quindi ∆v ≈ µz ∂B ∂z
l mv .
Si prevede una deflessione ∆θ ≈
∂Bz l ∆v ≈ µz . v ∂z mv 2
12.2 Esperimento di Stern-Gerlach Nel 1922 Stern e Gerlach produssero un fascio di atomi di Ag e lo fecero passare in un campo disomogeneo per vedere se le correnti degli elettroni conferissero agli atomi un momento magnetico.1 Il fascio era ottenuto vaporizzando il metallo in una fornace sotto vuoto e selezionando con uno tubo di uscita gli atomi che si muovono in una direzione ben stabilita. Gli atomi del fascio in assenza di campo andavano a formare una macchia su uno schermo rivelatore. In Figura 12.1 riportiamo uno schema dell’apparato visto lungo la direzione del fascio; il polo triangolare creava la disomogeneit` a. In Figura 12.2 z N fascio x
S Fig. 12.1. Il fascio attraversa un campo disomogeneo nell’apparato di Stern e Gerlach. Fra i poli di questa calamita il campo `e fortemente disomogeneo per la foggia del polo nord
riportiamo invece uno schema dell’apparato visto lungo una direzione a 90 gradi dal fascio; come vediamo, il campo disomogeneo disperde un fascio di atomi di Argento: 1
Classicamente non c’`e altro modo di produrre un momento magnetico, ma la Natura riserva spesso sorprese.
12.2 Esperimento di Stern-Gerlach
183
z ↓ y
N
fascio di Ag
lastra fotografica S ↑
Fig. 12.2. Schema dell’apparato di Stern e Gerlach
Il piano dell’esperimento era quello di misurare µ: i momenti magnetici degli atomi escono dalla fornace orientati a caso e quindi ci si aspettava che il fascio si dovesse allargare; dall’allargamento si sarebbe dedotto µ. Stern e Gerlach avevano ragionato molto bene, dal punto di vista classico. Ma il fascio non si allarga, anzi si divide in due, uno col momento parallelo al campo e l’altro antiparallelo. I due fasci sono ugualmente intensi. Ogni fascio `e fatto di atomi che hanno momento magnetico µz determinato: se uno di questi fasci viene fatto passare attraverso un secondo apparato orientato come il precedente rimane un fascio solo; questo verifica che tutti gli atomi hanno momento parallelo. Ma se il secondo apparato `e orientato diversamente il fascio si suddivide di nuovo.
z N y
N
S
fascio di Ag S
L’esito dell’esperimento `e incomprensibile con la Fisica classica. Il momento magnetico si trova solo su o gi` u, in qualunque direzione lo si misuri. Verrebbe da chiedersi: chi dice agli atomi come orientare in anticipo le spire delle correnti?
184
12 Spin e campo magnetico
Si comprese poi che il momento magnetico `e dovuto allo spin dell’elettrone ottico dell’Ag, l’unico che partecipa ai legami chimici, mentre gli altri elettroni rimangono fortemente legati. I nuclei hanno anche loro momenti magnetici. Per`o i momenti magnetici nucleari sono trascurabili rispetto a quello di un elettrone, perch´e la massa del protone `e molto pi` u grande. L’esperimento dimostr` o molte cose inattese. 1. Un atomo di Ag ha momento magnetico µ e i valori di µz lungo una direzione sono quantizzati. → − − 2. Data la proporzionalit` a→ µ ∝ L , anche i valori di Lz sono quantizzati. 3. Ci sono 2l + 1 valori possibili di m; l’esperimento con Ag mostra che i valori sono 2, quindi il momento angolare `e 12 . L’esito dell’esperimento illustra alcuni aspetti essenziali della meccanica quantistica. L’interpretazione `e: 1. Ogni momento angolare orbitale, dovuto a qualche rotazione nello spazio, → − `e associato ad L ed ha valori interi; inoltre esiste lo spin che non ha → − analogo classico. Pi` u in generale, per il momento angolare useremo j e per la componente mj . 2. Gli atomi di Ag non hanno componente µz del momento magnetico definita quando formano il fascio, ma solo quando µz `e misurata. 3. La misura fa collassare la funzione d’onda e prepara due fasci di µz definiti; poich´e µx ed µy non sono compatibili con µz le altre componenti non sono definite. 4. Ogni nuova misura su una diversa direzione fa collassare ancora la funzione d’onda. Se per` o la nuova direzione coincide con la precedente il fascio viene deflesso ma non si sdoppia.
z S y
N N
fascio di Ag
lastra fotografica S
Fig. 12.3. Un secondo apparato di Stern e Gerlach non sdoppia di nuovo il fascio se la direzione N-S `e la stessa del primo
12.3 Matrici del momento angolare
185
12.3 Matrici del momento angolare − Fisicamente, se diciamo che un elettrone si trova in → x non abbiamo finito di specificare la situazione, perch´e ha 2 modi ortogonali di starci. I due modi sono associati a componenti Sz = ± h¯2 del momento angolare, dove z `e la direzione privilegiata dall’esperimento. Il momento angolare frazionario non si realizza con il moto di particelle e non corrisponde ad alcuna armonica sferica; si tratta di un momento angolare intrinseco, quasi come se la particella avesse un moto a trottola (trottola =spin in Inglese). → − Dal momento angolare L abbiamo ricavato le rappresentazioni (11.4, 11.5,11.6) ¯ 2 l1 (l1 + 1)δl1 ,l2 δm1 ,m2 , l1 m1 |L2 |l2 m2 = h l1 m1 |Lz |l2 m2 = h ¯ m1 δl1 ,l2 δm1 ,m2 , l1 m1 |L± |l2 m2 = h ¯ l1 (l1 + 1) − m2 (m2 ± 1)δl1 ,l2 δm1 ±1,m2 , con l, m interi. Nessuna di questa va bene per lo spin. Oltre alle rappresentazioni del momento angolare gi` a viste, ci sono anche le rappresentazioni spinoriali,2 corrispondenti a momenti angolari semiinteri, cio`e 12 , 32 , 52 · · · intrinseci alle particelle, che non hanno analogo classico.3 Ci sono atomi e nuclei con momenti angolari semi-interi, ma questo `e riconducibile al fatto che elettroni e nucleoni (ed i quark che costituiscono i nucleoni) hanno spin 1/2. Poich´e lo spin non ha a che vedere con le derivate rispetto alle coordinate (r, θ, φ), ci occorre un formalismo per il momento angolare che non ne faccia uso. Per spin 21 assegnamo i due vettori di base | ± 21 , dalla componente z di MS che pu` o valere ± 21 h ¯ . Di solito vengono chiamati anche |α per lo spin su e |β per lo spin gi` u. Poich´e si tratta di uno spazio a 2 dimensioni `e naturale introdurre una base con 1 1 1 0 |α ≡ | → ; |β ≡ | − → . 0 1 2 2 Poich´e
h ¯ h ¯ |α, Sz |β = − |β, 2 2 possiamo rappresentare Sz ponendo Sz |α =
Sz =
h ¯ σz , 2
con 2 3
La teoria che segue `e dovuta a Wolfgang Pauli (1900 Vienna - 1958 Zurigo) uno dei teorici pi` u importanti del ‘900, Premio Nobel nel 1945. Un analogo classico a ben vedere esiste, ma non riguarda i corpuscoli, ma le onde. Basta ricordare la polarizzazione della luce per cui le onde elettromagnetiche possono essere destre o sinistre. Questo corrisponde in meccanica quantistica allo spin 1 del fotone.
186
12 Spin e campo magnetico
σz =
1 0 0 −1
Si passa dall’uno all’altro stato di spin con 01 , S+ = h ¯ 00
S− = h ¯
00 10
(12.4)
in modo che S+ |α = 0, S− |α = h ¯ |β, S− |β = 0, S+ |β = h ¯ |α. Poich´e le matrici S± funzionano come operatori di shift, `e naturale introdurre le componenti x e y con S+ = Sx + iSy S− = Sx − iSy Si trova cos`ı che una rappresentazione dello spin `e data dalle matrici di Pauli, ponendo 1− → − σ S =h ¯ → 2 con 01 0 −i 10 σx = , σy = , σz = . 10 i 0 0 −1 Usando questa rappresentazione si pu`o verificare che queste matrici hanno 10 ed anticommutano, cio`e quadrato 01 [σi , σj ]+ = 2δij , → − dove gli indici corrono sulle 3 componenti. L’identificazione di S come un momento angolare `e legittima perch´e → − → − → − S ∧ S = i¯ hS , in quanto [σx , σy ]− = 2iσy e cicliche. Si tratta proprio di un momento angolare 12 h ¯ ; infatti poich´e il quadrato di ciascuna matrice di Pauli `e la matrice identit`a 2 × 2, S2 =
3 2 1 1 h ¯ = ( + 1)¯ h2 . 4 2 2
L’esperimento conferma che un elettrone pu`o transire fra α e β assorbendo o cedendo un fotone di spin 1, ad esempio in esperimenti di risonanza magnetica.
12.3 Matrici del momento angolare
187
12.3.1 Ogni direzione va bene L’esperimento di Stern-Gerlach mostra che la componente dello spin vale sem¯ in qualsiasi direzione la si misuri, e quindi l’analogia con una trottola pre ± 12 h `e alquanto fuorviante. Il formalismo di Pauli descrive correttamente questo stato di cose. La matrice (hermitiana) dello spin nella direzione del versore → − n = (sin θ cos φ, sin θ sin φ, cos θ) si ottiene da un prodotto scalare, 1 cos θ sin θe−iφ → − → − ¯ S · n = h . sin θeiφ − cos θ 2 Gli autovettori sono − | ↑, → n = − | ↓, → n =
cos θ2 sin θ2 eiφ
− sin θ2 e−iφ cos θ2
,
(12.5)
.
(12.6)
Verifica degli autovettori Si ha cos(θ) cos( θ2 ) + sin(θ) sin( θ2 ) cos θ2 cos θ sin θe−iφ = . sin θeiφ − cos θ sin(θ) cos( θ2 )eiφ − cos(θ) sin( 2θ )eiφ sin θ2 eiφ Sostituendo nel risultato le identit` a θ θ θ θ cos(θ) = cos( )2 − sin( )2 , sin(θ) = 2 cos( ) sin( ) 2 2 2 2 si trova =
θ 2 θ 2 θ 2 cos( θ2 ) cos( cos( θ2 ) 2 ) − sin( 2 ) + 2 sin( 2 ) = . sin θ2 eiφ 2 cos( θ2 )2 − cos( 2θ )2 + sin( θ2 )2 sin( θ2 )eiφ
Spinore aggiunto Gli autovettori, o autospinori, sono complessi; il coniugato `e † a = a∗ b ∗ . b La vera origine dello spin Lo spin non era previsto dai 4 postulati, e la teoria di Pauli `e fenomenologica. Si chiamano in questo modo le teorie che spiegano bene alcuni fenomeni, ma mostrano anche la necessit`a di un quadro di riferimento pi` u generale e soddisfacente. Nella teoria di Schr¨ odinger si consideravano gli osservabili noti alla Fisica classica; Pauli ha mostrato che lo spin rientra bene nel quadro
188
12 Spin e campo magnetico
concettuale; ad esempio il significato fisico della componente superiore cos θ2 − di | ↑, → n `e il seguente. Supponiamo che un fascio di particelle sia preparato − nello stato | ↑, → n , ( per esempio con un esperimento di Stern-Gerlach con il − campo disomogeneo lungo l’asse → n ) e poi se ne misuri la componente z dello − n `e l’ampiezza di probabilit` a di trovare spin alto. spin; allora, cos 2θ = α| ↑, → Una formulazione molto pi` u soddisfacente dello spin e delle sue interazioni si ha con la teoria relativistica di P.A.M. Dirac . 12.3.2 Rotazioni di spin e momento angolare Nella Sezione 11.6 abbiamo studiato le rotazioni di una funzione orbitale, −→ → − R− → = e−i∆φ· L , φ
(12.7)
→ − dove compare il generatore L delle rotazioni infinitesime. Per analogia, il → − − generatore delle rotazioni infinitesime dello spin `e S = 12 h ¯→ σ e l’operatore di rotazione `e −→ → − R− → = e−i∆φ· S . φ All’esponente c’`e una matrice 2 × 2 che `e facile da diagonalizzare ed esponenziare. Per ruotare di un angolo ∆φ attorno all’asse z uno spinore, come ad esemθ cos − 2 , ci si pu` pio | ↑, → n = o aspettare che basti φ → φ + ∆φ; questo `e sin θ2 eiφ quasi vero, ma c’`e una sottigliezza. Per capirlo, `e istruttivo scrivere l’operatore di rotazione (12.7) intorno all’asse z, 1 0 −i ∆φ 2 ∆φ 0 −1 . R = e−i 2 σz = e ∆φ
Le matrici diagonali sono facili da esponenziare come i numeri:
e cos`ı
µ0 0 ν
2
µ0 e 0 ν
R∆φ = Pertanto,
=
t
= -
ed anche
e−i 0
µ2 0 0 ν2
eµt 0 0 eνt
∆φ 2
,
, .
0 ∆φ ei 2
.
12.3 Matrici del momento angolare
− R∆φ | ↑, → n =
∆φ
e−i 2 cos θ2 ∆φ ei 2 sin θ2 eiφ
. = e−i
∆φ 2
cos θ2 sin θ2 ei[φ+∆φ]
189
:
oltre ad incrementare φ fornisce una fase complessiva allo spinore. Ne consegue che R2π = −1: l’operatore di una rotazione di 2π cambia segno allo spinore! ` Questa `e una propriet` a fondamentale delle particelle di spin semi-intero. E vero che moltiplicare per −1 una funzione d’onda non cambia lo stato, ma se si sovrappongono due funzioni d’onda la fase relativa `e importante. Un sistema la cui hamiltoniana non dipende dallo spin `e invariante per → − rotazioni di spin. Poich´e [H, R− → ]− = 0, ∀ φ `e chiaro allora che conserva il φ momento angolare S. 12.3.3 Momento magnetico di spin ed equazione di Pauli L’equazione classica (12.1) suggerisce che al momento angolare sia associato un momento magnetico. Qui per` o non ci sono correnti, e non possiamo calcolare nulla con la teoria classica. Dalla teoria relativistica di Dirac consegue che e → − → − µ = gS, (12.8) 2mc dove m `e la massa dell’elettrone e g = 2. In realt` a g ≈ 2.0023 per l’elettrone a causa di correzioni di elettrodinamica quantistica.4 In un campo magnetico B, l’energia del dipolo `e data, come classicamente, dall’equazione (12.2). L’operatore Hamiltoniano `e quindi una matrice 2 × 2, la funzione d’onda si generalizza e diventa uno spinore a(x) ψ(x) = , b(x) a 2 componenti; la particella in ogni punto x ha 2 stati. Includendo anche l’energia cinetica, l’Hamiltoniano di un atomo di Ag (particella neutra con lo spin dell’elettrone) in campo magnetico vale5 H=
p2 2MAg
0
0 p2 2MAg
. −
e → − → − g S · B; 2mc
L’equazione di Schr¨ odinger-Pauli `e della stessa forma dell’equazione di Schr¨odinger, cio`e ∂ψ i¯ h = Hψ. ∂t 4
5
Per il protone, di massa mp ≈ 1800m, con g ≈ 5, µ `e molto pi` u piccolo; il neutrone non ha carica ma ha un momento magnetico dello stesso ordine di quello del protone Stiamo trascurando deboli effetti diamagnetici.
190
12 Spin e campo magnetico
Particella libera con spin 1/2 → − − Il moto `e libero e lo spinore pu` o essere etichettato con → p =h ¯ k introducendo la soluzione onda piana a 2 componenti → − → − a 1 a(x) ei k · x = b b(x) (2π)3 con costanti a e b tali che |a|2 + |b|2 = 1. Spin 1/2 senza gradi di libert` a orbitali → − → − e Il termine magnetico 2mc g S · B , da solo ha autostati |α con autovalore µB B e |β con autovalore −µB B, dove µB `e il magnetone di Bohr ;6 approssimando g con 2 viene e¯ h . µB = 2mc Moltiplicando per le onde piane si trovano gli autostati di H per la particella neutra con spin. I due livelli sono separati dalla cosiddetta frequenza di Larmor, nota in Fisica classica, ωL =
eB . mc
Livelli di Landau: particella di Schr¨ odinger (S = 0) Per una particella carica, che sente la forza di Lorentz, prenderemo − 2 e→ → − ˆ = ( p − c A) . H 2m Potremo prendere il campo lungo l’asse z; diversamente dalla (11.23), stavolta conviene prendere la gauge di Landau7 → − A = (−y, 0, 0)B. Cos`ı
eBy 2 c )
+ p2y + p2z . 2m Qui, px e pz sono costanti del moto e la funzione d’onda pu` o essere presa nella forma ψ = ei[px x+pz z] χ(y); ˆ = H
(px +
il moto lungo z `e libero. Poniamo per semplicit` a pz = 0 perch´e il moto lungo il campo `e poco interessante e px = 0 perch´e questo equivale a spostare l’origine eB degli y; il moto lungo y `e quantizzato in modo armonico con ωL = mc , la frequenza di Larmor. I livelli quantizzati si chiamano livelli di Landau. 6 7
per e < 0 le soluzioni si scambiano; per un elettrone in campo magnetico parallelo all’asse z lo stato fondamentale `e |β . Lev Davidovic Landau nato a Baku nel 1908, morto nel 1968, `e stato il pi` u grande fisico sovietico. Premio Nobel nel 1962 per i suoi studi sui superfluidi.
12.3 Matrici del momento angolare
191
Trasformazioni di gauge − ` ben noto dall’elettromagnetismo che una trasformazione di gauge → E A → → − → − − A = A + grad χ(→ r ), con χ funzione arbitraria, non cambia n`e campo ma→ − gnetico, n`e alcuna grandezza fisica. L’equazione di Schr¨ odinger scritta con A → − o verificare. Questo camal posto di A `e risolta da ψ = ψ exp( ieχ h ¯ ), come si pu` biamento non ha conseguenze fisiche, perch´e la fase di ψ non ha importanza e la differenza di fase fra due funzioni d’onda diverse rimane immutata. Livelli di Landau: particella di W. Pauli Per una particella di carica e e spin 1/2, ⎞ ⎛ → − − (→ p − ec A )2 e → 0 − → − 2m gS · B = H=⎝ → − 2 ⎠− → − e 2mc ( p −c A) 0 2m ⎛ ⎞ → − 2 → − e ( p −c A) e¯ h g − 2mc 2 B 0 2m ⎝ ⎠ → − − p − ec A )2 (→ e¯ h g 0 + 2mc 2 B 2m eB Lo spin d` a due sottolivelli; poich´e g ∼ 2, lo spin gi` u aggiunge all’energia 2mc e lo spin su toglie altrettanto. Cos`ı i due livelli magnetici di spin sono separati di ∼ h ¯ ωL . L’equazione di Schr¨ odinger per ciascuno degli stati di spin d`a i livelli di Landau. La transizione diretta fra sottolivelli di spin pu`o essere fatta assorbendo o emettendo un fotone (epr=risonanza di spin elettronico, nmr= risonanza di spin nucleare). Per un protone lo stato fondamentale `e α. A parit` a di campo magnetico la separazione dei livelli `e molto pi` u grande per l’elettrone.
Problema 24. Ruotare |α rispetto all’asse x di ϕ = π/2 e di ϕ = π discutendo i risultati. Soluzione 24. L’operatore di rotazione di ϕ intorno all’asse x `e −iϕ 0 1 Rϕ = exp . 10 2 Separando le potenze pari da quelle dispari nell’espansione di eix = cos(x) + i sin(x) troviamo Rϕ =
1 −iϕ 1 −iϕ ( )n + σx ( )n . n! 2 n! 2
npari
(ix)n = Reeix = cos(x) n!
npari
ndispari
(ix)n = iImeix = i sin(x). n!
ndispari
192
12 Spin e campo magnetico
Pertanto,
Rϕ =
ϕ cos ϕ2 −i sin 2 ; −i sin ϕ2 cos ϕ2
√ † −1 si noti che Rϕ = Rϕ . Poich´e cos(π/4) = sin(π/4) = 1/ 2, viene 1 Rπ/2 |α = √ 2
1 −i
.
o `e Questo `e autostato (spin basso) di Sy . Inoltre, Rπ |α = −i|β. Tutto ci` intuitivo. Problema 25. Verificare l’identit` a j+ (1)j− (2) + j− (1)j+ (2) → − → − j (1) · j (2) = jz (1)jz (2) + , 2 → − → − → − → − dove j (1), j (2) sono momenti angolari di particelle diverse con [ j (1), j (2)]− = 0. Soluzione 25. Basta sostituire le definizioni.
12.4 Somma di momenti angolari Un elettrone in un campo centrale ha momento angolare orbitale e momento angolare di spin. Due elettroni in un atomo hanno ciascuno il suo momento angolare. Il nucleo di un atomo ha il suo spin, che si aggiunge al momento angolare degli elettroni ed `e a sua volta la risultante degli spin 1/2 di protoni e neutroni e dei loro momenti orbitali nel nucleo. Questi sono tutti esempi in cui si debbono comporre momenti angolari. Il momento angolare totale di un sistema isolato qualsiasi `e particolarmente interessante perch´e `e sempre conservato.8 Consideriamo in generale un sistema che ha due parti di momento angolare j 1 e j 2 , che dipendono da variabili diverse e quindi commutano: [j 1 , j 2 ]− = 0; il momento angolare del sistema `e j = j1 + j 2, esattamente come in Fisica classica. Si tratta di un momento angolare perch´e il lettore pu` o verificare che j ∧ j = i¯ hj. 8
Il momento angolare del nucleo `e accoppiato debolmente a quello degli elettroni. Il momento orbitale e di spin sarebbero conservati anche separatamente, se non → − − fosse per una interazione spin-orbita relativistica proporzionale a l · → s.
12.4 Somma di momenti angolari
193
Se prendiamo una base di autostati per ciascuno, j12 |j1 m1 = j1 (j1 + 1)¯ h2 |j1 m1 , j1z |j1 m1 = m1 h ¯ |j1 m1 2 j2 |j2 m2 = j2 (j2 + 1)¯ h2 |j2 m2 , j2z |j2 m2 = m2 h ¯ |j2 m2 una base per il sistema `e |j1 m1 j2 m2 ≡ |j1 m1 |j2 m2 . Si tratta di (2j1 + 1)(2j2 + 1) stati di ciascuno dei quali possiamo specificare immediatamente l’autovalore mj di jz : jz |j1 m1 j2 m2 = (m1 + m2 )¯ h|j1 m1 j2 m2 = mj h ¯ |j1 m1 j2 m2 . Per` o in generale non possiamo assegnare insieme j, m1 e m2 . Infatti, j 2 = j 21 + j 22 + 2j 1 · j 2 ; i quadrati commutano con le componenti, ma j 1 · j 2 non commuta: [j 2 , j1z ]− = 2[j 1 · j 2 , j1z ]− = 2[j1x j2x + j1y j2y , j1z ]−
(12.9)
e questo non `e nullo. Problema 26. Calcolare il commutatore (12.9). Soluzione 26. Si trova 2i¯ h(j 1 ∧ j 2 )z . Esempio 1 Nello stato fondamentale dell’atomo di H il momento angolare orbitale `e l = 0, ma ci sono due spin 1/2 da sommare, quello dell’elettrone e quello del nucleo. Indichiamo con α(1), β(1) i due stati dell’elettrone e con α(2), β(2) i due stati del nucleo; allora la base d` a i seguenti 4 stati: Stati mj j |α(1)α(2) 1 1 |α(1)β(2) , |β(1)α(2) 0 misto 1, 0 |β(1)β(2) -1 1
` possibile assegnare mj a tutti, ma anche j agli estremi, che hanno mj = E u grandi sono esclusi ±1. Infatti j = 0 `e escluso perch´e d` a mj = 0, mentre j pi` perch´e dovrebbero dare mj fuori da (0, 1). Lo spazio di Hilbert di dimensione 4 ha un sottospazio j = 1 di dimensione 3, con la componente |j = 1, mj = 0 che deve essere una combinazione dei due stati con mj = 0.
194
12 Spin e campo magnetico Stati mj j 3 3 |1, 12 2 2 1 |1, − 21 , |0, 12 misto 32 , 2 1 1 1 |0, − 2 , | − 1, 2 − 2 misto 32 , 3 | − 1 − 12 − 32 2
1 2 1 2
Esempio 2 Per trovare il momento angolare di un elettrone nell’orbitale 2p dell’atomo di H dobbiamo combinare l = 1 con lo spin (3 × 2 = 6 stati). Possiamo denotare gli stati con |ml , ms . o essere di Il massimo ed il minimo mj devono appartenere a j = 23 (non pu` meno, ma neanche di pi` u, perch´e altrimenti ci sarebbero altri mj ). Ma j = 32 comporta 4 stati. In tutto gli stati sono 6, quindi ne mancano 2 che saranno quelli di j = 12 . Valori permessi di j Come negli esempi proposti, in generale, il valore massimo di mj `e mj = m1 + m2 ed il minimo `e mj = −m1 − m2 . Pertanto nella base |j1 m1 j2 m2 ci deve essere una base per j = j1 + j2 ; questo significa che devono esistere 2(j1 +j2 )+1 combinazioni lineari degli elementi della base che danno autostati |jm di j 2 e jz con j = j1 + j2 e con −j ≤ mj ≤ j Altri valori pi` u grandi di j non possono esserci perch´e darebbero altri valori di mj . C’`e solo un elemento della base |j1 m1 j2 m2 che corrisponde a j = j1 + j2 ; pertanto questo valore di j `e presente una sola volta. Il valore mj = m1 +m2 −1 si ottiene in 2 modi diversi. Di questi due stati, una combinazione lineare corrisponde a |j = j1 + j2 , mj = m1 + m2 − 1 e l’altra a |j = j1 + j2 − 1, mj = m1 + m2 − 1. Quindi anche j = j1 + j2 − 1 `e presente una sola volta nella base. Esistono tutti i valori da j = j1 + j2 fino a j = |j1 − j2 | e tutti compaiono una volta sola. Infatti, j 1 +j2
(2j + 1) = (2j1 + 1)(2j2 + 1).
j=|j1 −j2 |
Coefficienti di Clebsch-Gordan Vogliamo trovare le combinazioni di |j, mj . Nel caso dei due spin 1/2, usando la Tabella 12.4, dagli operatori (12.4) 01 00 , S− = h ¯ ¯ S+ = h 00 10 calcoliamo j − = S− (1) + S− (2);
12.4 Somma di momenti angolari
195
otteniamo cos`ı |1, 0 = j − |1, 1. Normalizzando si trova 1 |1, 0 = √ (|α(1)β(2) + |β(1)α(2)). 2 Questa `e la componente mj = 0 del tripletto j = 1. La combinazione ortogonale 1 |0, 0 = √ (|α(1)β(2) − |β(1)α(2)). (12.10) 2 `e il singoletto j = 0. Questo `e un esempio di un procedimento generale con cui si pu` o passare dalla base |j1 m1 j2 m2 alla base |jmj con una trasformazione unitaria j1
|jmj =
j2
|j1 m1 j2 m2 j1 m1 j2 m2 |jmj .
m1 =−j1 m2 =−j2
I coefficienti di Clebsh Gordan j1 m1 j2 m2 |jmj si possono sempre ottenere con un procedimento analogo, e permettono di fare anche il passaggio opposto. Per un elettrone nello stato 1s abbiamo i due stati |l = 0, ml = 0|ms = ± 12 che hanno j = 1/2. Quindi scriveremo senz’altro |j =
1 1 1 , M = ± = |l = 0, ml = 0|ms = ± , 2 2 2
o, usando una notazione pi` u agile, 1 1 1 | , ± = |0, 0| ± . 2 2 2 Per l’esempio di un elettrone nel 2p (Tabella 12.4) sappiamo che 3 3 1 | , = |1, 1| . 2 2 2 La combinazione giusta per j = 32 , mj = 12 si trova agendo sullo stato con mj = 32 con j− = L− + s− . Poich´e da L± |l, m =
l(l + 1) − m(m ± 1)¯ h|l, m ± 1 √ L− |l = 1, ml = 1 = 2¯ h|l = 1, ml = 0.
Cos`ı l’abbassamento porta a √ −1 j− 3 3 1 | , = 2|1, 0| + |1, 1| . h ¯ 2 2 2 2
196
12 Spin e campo magnetico
Normalizzando, 3 1 | , = 2 2
−1 2 1 1 |1, 0| + √ |1, 1| . 3 2 2 3
(12.11)
La combinazione ortogonale `e 1 1 1 1 | , = √ |1, 0| − 2 2 2 3
−1 2 |1, 1| . 3 2
(12.12)
Dalla (12.11) ricaviamo che 1 1 3 1 1, 0, , | , = 2 2 2 2
1 1 3 1 2 , 1, 1, , − | , = 3 2 2 2 2
1 ; 3
dalla (12.12) ricaviamo che 1 1 1 1 1, 0, , | , = 2 2 2 2
1 1 1 1 1 , 1, 1, , − | , = − 3 2 2 2 2
2 . 3
Questi risultati sono in accordo con le tabella dei coefficienti di ClebshGordan. Verifica dell’appartenenza a j Per verificare se uno stato di un elettrone in un orbitale con momento angolare j appartiene a j conviene mettere nella espressione j 2 = L2 + S 2 + 2L · S l’identit` a 1 → − → − L · S = Lz Sz + (L+ S− + L− S+ ) , 2 ricordando che l1 m1 |L± |l2 m2 = h ¯ l1 (l1 + 1) − m2 (m2 ± 1)δl1 ,l2 δm1 ±1,m2 .
m1 m2 j j1 j2 m1 m2 |jm = m1 + m2 1 1 1 1 2 2 1 √1 − 12 1 2 2 1 √1 − 12 0 2 2 √1 − 12 12 1 2 − 12 12 0 − √12 − 12 − 12 1 1 Tabella 12.1. I coefficienti di Clebsch-Gordan per j1 = j2 =
1 2
12.5 Applicazione alla criptografia quantistica m1 1 1 1 0 0 0 0 -1 -1 −1
197
m2 j j1 j2 m1 m2 |jm = m1 + m2 1 3 1 2 2 1 − 21 32 3 1 1 2 −2 2 3
1 2 1 2 − 21 − 21 1 2 1 2 − 21
3 2 1 2 3 2 1 2 3 2 1 2 3 2
−
− 1
2 3 1 3 2 3 1 3 1 3 2 3
Tabella 12.2. I coefficienti di Clebsch-Gordan per j1 = 1, j2 =
1 2
12.5 Applicazione alla criptografia quantistica Ci sono informazioni che devono restare segrete a lungo, come i codici bancari, la formula della Coca Cola o i comandi di un satellite commerciale. Da millenni `e andata avanti la competizione fra chi voleva criptare i segreti con codici sempre pi` u ingegnosi e chi voleva carpirli decifrando il codice; sono noti i vantaggi che hanno avuto gli alleati per avere scoperto il codice segreto della Wehrmacht nella seconda guerra mondiale. Con la meccanica quantistica la gara `e ormai vinta da chi vuole mantenere i segreti. Vari apparecchi per realizzare la criptografia usando il principio di indeterminazione sono arrivati a livello industriale e sono venduti da varie ditte commerciali.9 Ecco uno schematica discussione del funzionamento. Il problema della criptografia `e ben noto: due persone, diciamo Alice e Bob, devono scambiarsi informazioni segrete, usando un canale publico, come una linea telefonica o la radio; chi ha interesse a carpire i segreti pu`o spiare e ricevere i segnali. Il segreto pu`o essere custodito efficacemente solo se Bob e Alice hanno un codice per criptografare; questo vuol dire che devono condividere gi` a una certa quantit` a di informazione segreta prima di cominciare la conversazione. Concettualmente, questa informazione nota sia ad Alice che a Bob equivale a un numero, che `e la chiave del codice. Evidentemente se il numero contiene moltissime cifre, la spia non avr`a alcun modo di ricostruirlo e decrittare il messaggio. Il problema `e allora in primo luogo come facciano Alice e Bob a scambiarsi la chiave senza che questa sia ricevuta anche dalla spia che ha accesso al canale pubblico. La meccanica quantistica offre la possibilit` a di scambiarsi la chiave in modo assolutamente sicuro; l’idea `e dovuta a Charles Bennet del centro di ricerche Thomas J. Watson della IBM ed a Gilles Brassard dell’Universit` a di Montreal ed `e stata sviluppata negli anni ’80. 9
Vedi ad esempio l’articolo di Gary Stix, Best-kept secrets, Scientific American, January 2005.
198
12 Spin e campo magnetico
Il segnale viene trasmesso come una successione di bit che possono valere 1 o 0. Per prima cosa Alice e Bob convengono che un fotone polarizzato orizzontale vale 1 ed uno polarizzato verticale vale 0. Per` o per trasmettere e ricevere fotoni ambedue dispongono di un secondo filtro polarizzatore ruotato di 45 gradi rispetto al primo. Quindi indicando con un trattino il piano di polarizzazione, il bit 1 pu`o viaggiare come - o come \, mentre il bit 0 pu` o viaggiare come | o come /. Se il filtro usato per ricevere `e lo stesso di quello usato per trasmettere, il bit viene letto senza errori, ma se ad esempio un segnale emesso come | viene captato con il filtro inclinato, ci sono 50 probabilit` a su 100 che venga interpretato come -. A questo punto avviene la trasmissione della chiave, con le seguenti modalit` a. Alice manda una successione casuale di bit scegliendo casualmente anche con quale filtro inviarli, e prendendo nota ogni volta di quello che fa. Per ogni bit in arrivo, Bob sceglie a caso quale filtro usare per leggerlo e annota sia il filtro usato che la lettura. Dopo la fine della trasmissione dei fotoni, Bob comunica ad Alice attraverso il canale pubblico la sequenza dei filtri usati nelle letture (senza comunicare ovviamente la sequenza delle letture). Allora Alice pu`o rivelargli, usando lo stesso canale, quali filtri sono stati usati correttamente. Allora, eliminati i fotoni letti col filtro sbagliato rimane una sequenza di bit che costituiscono la chiave segreta. Una eventuale spia pu` o ricevere i fotoni, ma la meccanica quantistica impedisce di fare ci` o che classicamente `e possibile, cio`e osservare lo stato di polarizzazione senza rischiare di modificarlo. Scegliere fra − e | significa scegliere fra due stati ortogonali, come gli stati α e β di uno spin. La spia, se riceve il fotone con il filtro sbagliato, rischia non solo di leggere la polarizzazione in modo erroneo, ma anche di modificarla. Gli errori introdotti in questo modo finiranno per tradirla. Infatti scegliendo a caso un piccolo numero di bit fra quelli che costituiscono il messaggio, Alice e Bob possono verificare sul canale pubblico se sono arrivati imperturbati o meno; in quest’ultimo caso la presenza della spia sar` a smascherata.
12.6 Fase di Pancharatnam Il fisico indiano S. Pancharatnam nel 1956 invent` o il concetto di fase geome→ − trica.10 Sia H( ξ ) un hamiltoniano che dipende da alcuni parametri ξ e sia → − |ψ( ξ ) lo stato fondamentale. Si pu` o definire la differenza di fase ∆ϕ12 fra due → − → − stati fondamentali |ψ( ξ 1 ) e |ψ( ξ 2 ) (supponendo che non siano ortogonali): → − → − → − → − ψ( ξ 1 )|ψ( ξ 2 ) = |ψ( ξ 1 )|ψ( ξ 2 )|e−i∆ϕ12 . Tuttavia, questo non pu` o avere significato fisico, perch´e la fase di uno stato `e arbitraria (la scelta della fase `e legata alla scelta della gauge). Ma ora 10
S. Pancharatnam, Proc. Indian Acad. Sci. A 44, 247 (1956)
12.6 Fase di Pancharatnam
199
consideriamo 3 punti ξ e calcoliamo la fase totale γ in un circuito chiuso ξ1 → ξ2 → ξ3 → ξ1 . Ora, γ = ∆ϕ12 + ∆ϕ23 + ∆ϕ31 . La fase di ciascuna ψ pu` o essere cambiata a volont` a con una trasformazione di gauge, ma questi cambiamenti arbitrari si elidono nel calcolo di γ. Cos`ı γ non dipende pi` u dalla gauge! Questo rimane vero in ogni circuito chiuso definito con pi` u di 2 punti ξ. Di conseguenza non c’`e ragione per supporre che γ sia privo di significato fisico. Possono esistere osservabili che non sono dati da operatori hermitiani. Per esempio, i tre stati fondamentali |ψa , | e ψb , |ψc potrebbero essere stati fondamentali per un elettrone negli atomi a, b, c che formano una molecola; in tal caso l’hamiltoniano avr` a elementi di matrice fra tali stati. Sia τab il valore dell’elemento di matrice che congiunge gli atomi a e b, e che consente ad un elettrone di saltare avanti e indietro fra i due atomi. Questo `e il modello LCAO cui si `e gi` a accennato nella Sezione 10.2.11. Seguendo una prescrizione → − introdotta da Peierls, possiamo accendere un potenziale vettore A con 2πi
τab → τab e φ0
b → → − r ·A d− a
,
−7 Gausscm2 `e il quanto di flusso o flussone. Nel caso dove φ0 = hc e = 4 × 10 di una molecola biatomica come H2 questo non ha conseguenze, ma con tre o pi` u atomi il significato fisico `e uello di un fusso magnetico φ concatenato con la molecola. Cambiare φ di un flussone non ha significato fisico. Che diventa questo concetto nel caso di molti stati? Diventa la fase di Berry,11 che `e stata introdotta solo negli anni ’80, e che adesso `e di gran moda fra i teorici per gli sviluppi fecondi che sta avendo nei pi` u vari campi della fisica. Per esempio la teoria moderna della polarizzazione dei solidi `e basata sulla fase di Berry.12
11 12
M.V. Berry, Proc. R. Soc. Lond. A392, 45 (1984) Vedere ad esempio R.Resta, J. Phys.: Condens. Matter 12 R107 (2000).
13 Sistemi di particelle: entanglement
Lo studio dei sistemi con pi` u particelle ci conduce a nuovi concetti in contrasto drammatico con la Fisica classica. Troveremo che due particelle quantistiche possono essere in uno stato entangled, cio`e ingarbugliato, e che particelle dello stesso tipo devono necessariamente esserlo a causa della simmetria di permutazione delle funzioni d’onda
13.1 Sistemi di due particelle Come generalizzare la teoria contenuta nei 4 postulati se nel problema abbiamo 2 particelle? L’idea giusta `e la pi` u ovvia: partire dalla hamiltoniana classica, sostituire l’impulso con l’operatore impulso, e scrivere l’equazione di Schr¨ odinger; la funzione d’onda Ψ (1, 2) dipender` a da tutti i gradi di libert` a orbitali e di spin delle due particelle. Il caso pi` u semplice `e quello di particelle indipendenti, cio`e senza mutua interazione, quando l’hamiltoniana `e della forma H(1, 2) = h(1) + h(2). Qui la notazione `e ovvia, con h(1) che indica la dipendenza dalle coordinate della prima particella, etc. L’equazione di Schr¨odinger `e i¯ h
∂Ψ (1, 2) = H(1, 2)Ψ (1, 2); ∂t
nel caso stazionario, si separa al solito la dipendenza temporale e si scrive H(1, 2)Ψ (1, 2) = EΨ (1, 2).
(13.1)
Questa ammette soluzioni fattorizzate (ecco ancora un esempio di separazione delle variabili): infatti se
202
13 Sistemi di particelle: entanglement
h(1)ψa (1) = a ψa (1), h(2)ψb (2) = b ψb (2), dove {ψa } e {ψb } sono set completi di soluzioni a una particella, allora ψab (1, 2) = ψa (1)ψb (2) risolve la (13.1) con E = Eab = a + b . Quelle fattorizzate sono soluzioni particolari, ma forniscono una base per espandere la soluzione pi` u generale. Se si tratta di particelle diverse, come un elettrone ed un protone, le soluzioni fattorizzate e le loro combinazioni sono tutte fisicamente realizzabili. Come vedremo, Ψ (1, 2) `e espandibile sulla base fattorizzata anche per particelle dello stesso tipo, ma allora gli stati fisicamente realizzabili vanno selezionati in base a nuovi principi di simmetria. 13.1.1 Atomo di H e Massa Ridotta Quando abbiamo trattato dell’atomo di Idrogeno nel Capitolo 11.5, siamo partiti dalla sua ben nota formulazione classica in termini di un punto materiale di massa ridotta che si muove in un potenziale esterno. Classicamente, ci si arriva a partire dal problema a due corpi introducendo coordinate relative e del baricentro. Anche nel caso quantistico possiamo partire con il problema a due corpi, elettrone e protone, che ha l’hamiltoniano H =−
h ¯2 2 h ¯2 2 ∇e − ∇ + V (ρ); 2me 2mp p
− − − qui ∇e deriva rispetto a re ,∇p deriva rispetto a rp , → ρ =→ re − → rp . La funzione → − → − d’onda ψ = ψ( re , rp ) dipende dalle coordinate di ambedue le particelle, e dai loro spin (per` o gli spin non li indichiamo perch´e l’hamiltoniano non ne dipende). Introducendo il centro di massa con − − re + mp → rp me → → − R= me + m p cambiamo variabili con me −→ −→ ∇R + ∇ρ , me + m p mp −→ −→ −→ ∇R − ∇ρ . ∇p = me + m p
− → ∇e =
Ora,
me 2me −→ −→ ]2 ∇2R + ∇2ρ + ∇R · ∇ρ , me + m p me + m p mp 2mp −→ −→ ]2 ∇2R + ∇2ρ − ∇R · ∇ρ . ∇2p = [ me + m p me + m p ∇2e = [
Ne segue che 1 1 2 1 2 1 1 ∇e + ∇p = ∇2R + + ∇2ρ . me mp me + m p me mp
13.2 Particelle ingarbugliate e pararadosso EPR
203
Introduciamo allora la massa ridotta µ con 1 1 1 = + µ me mp e la massa totale M = me + mp . Per l’atomo idrogenoide µ ∼ me ., Esiste per` o anche il positronium, che al posto del protone ha un positrone, che ha la massa dell’elettrone ed `e una particella distinta1 . Nel positronium, µ = m2e . Cos`ı usando l’hamiltoniana trasformata H=−
h ¯2 2 h ¯2 2 ∇R − ∇ + V (ρ) 2M 2µ ρ
il problema `e separabile nel senso che consente di scrivere → − − − − rp ) = φ( R )ψ(→ ρ ); ψ(→ re , →
(13.2)
il primo fattore rappresenta il moto libero del baricentro. Possiamo visualizzare la situazione pensando di formare un pacchetto d’onde del moto del baricentro localizzato intorno a R = 0. Allora dalla posizione di una particella potremmo dedurre quella dell’altra, giacch´e me → → − − rp = − re . mp Possiamo concludere che se il centro di massa fosse fermo e localizzato, anche il nucleo avrebbe il suo moto orbitale, simile a quello dell’elettrone anche se con un raggio molto pi` u piccolo. Tuttavia il principio di indeterminazione non consente di avere il centro di massa fermo e localizzato, e questa descrizione, bench´e suggestiva, `e di utilit` a limitata.
13.2 Particelle ingarbugliate e pararadosso EPR Torniamo alla fattorizzazione (13.2) della funzione d’onda che descrive il generico stato stazionario dell’atomo. Occorre riflettere sul fatto che ad essere separabili non sono i moti di elettrone e nucleo, ma il moto del baricentro e quello relativo; ed a dispetto delle considerazioni svolte per visualizzare la situazione, non esistono n`e una funzione d’onda per l’elettrone n`e una per il protone. Queste esistono nel caso di uno stato fattorizzato come segue: − − − − re , → rp ) = φ(→ re )ψ(→ rp ); ψip (→
(13.3)
tuttavia ψip descrive particelle indipendenti, non particelle in interazione. E’ evidente dal punto di vista metematico che la (13.3) `e una forma molto speciale di dipendenza funzionale, e che in generale ci si pu`o aspettare 1
precisamente, `e l’antiparticella dell’elettrone; infatti il positronium `e instabile e si trasforma in fotoni. Per capire queste cose `e necessario studiare la teoria quantistica relativistica.
204
13 Sistemi di particelle: entanglement
− − ψ(→ re , → rp ) =
− − cij φi (→ re )ψj (→ rp ),
(13.4)
i,j
dove {φi } e {ψj } sono set completi per le due particelle e cij sono ampiezze complesse. Ma nella (13.4) funzioni d’onda individuali non esistono, e si dice che le particelle sono ingarbugliate (entangled).2 Questa situazione `e veramente esotica perch´e classicamente, per descrivere lo stato di un sistema composto, dobbiamo descrivere lo stato e la dislocazione delle sue parti. Invece quantisticamente lo stato del sistema possiamo conoscerlo ma le parti hanno stati interdipendenti. La cosa si spiega meglio e si arricchisce se scegliamo i set completi {φi } e {ψj } in modo da diagonalizzare qualche osservabile. Per fissare le idee, consideriamo lo spin con i suoi due autostati α e β; la base a 2 corpi contiene i 4 stati α(1)α(2), α(1)β(2), β(1)α(2), β(1)β(2). Ora ad esempio α(1)β(2) `e una stato con la particella 1 nello stato α e la particella 2 nello stato β. Lo stato di singoletto (spin nullo) 1 |S, M = |0, 0 = √ (|α(1)β(2) − |β(1)α(2)) 2
(13.5)
`e ingarbugliato. Ciascuna particella non ha una sua funzione d’onda definita, perch´e le sue ampiezze dipendono dallo stato dell’altra particella. Questo ha delle conseguenze fisicamente verificabili e sorprendenti. Supponiamo che il sistema sia preparato nello stato |S, M = |0, 0 e poi sia misurato lo spin della particella 1. I risultati sono casuali ed equiprobabili, ma se risulta che lo spin di 1 `e α allora `e certo che quello di 2 `e β e viceversa (in accordo col fatto che la somma deve fare 0.) La misura produce il collasso della funzione d’onda in modo istantaneo. Apparentemente lo stato della particella 2 `e stato alterato dalla misura fatta sulla particella 1. Ma la misura sullo spin 1 potrebbe avvenire anche a grande distanza dalla particella 2. Se la misura produce un cambimento che va ad influire sull’altra particella, questo dovrebbe subire un ritardo dipendente dalla distanza. Questo `e il paradosso E.P.R.pubblicato nel 1935 da Einstein, Podolsky e Rosen3 . Einstein parlava di azione fantasma a distanza; era convinto che la teoria quantistica desse una descrizione incompleta della realt`a fisica. Sono state proposte da vari autori teorie delle variabili nascoste secondo le quali la meccanica quantistica dice parte della verit` a, ma per una descrizione completa ci sono altri parametri che sono ignorati dalla meccanica quantistica ma sono necessari. Un fatto inatteso `e avvvenuto nel 1964: J.S. Bell scopr`ı un famoso teorema 4 che dice che qualsiasi teoria di variabili nascoste porta delle conseguenze osservabili in contrasto con la meccanica quantistica. Da allora la questione posta dal paradosso EPR `e diventata sperimentalmente risolubile. Molti esperimenti fatti da 2
3 4
In letteratura si usa questa traduzione letterale dall’Inglese, ma sarebbe forse meglio tradurre concatenate o interconnesse per non dare l’idea di qualcosa di complicato. A. Einstein, B. Podolsky and N. Rosen, Phys. Rev. 47, 777 (1935) J.S. Bell, Physics 1, 195 (1964)
13.3 Bosoni e Fermioni
205
allora hanno sempre confermato che le predizioni della meccanica quantistica sono esatte. Quindi bisogna accettare che il collasso della funzione d’onda avviene istantaneamente.
13.3 Bosoni e Fermioni Sono dette bosoni le particelle di spin intero e fermioni quelle di spin semiintero. Cos`ı ad esempio i pioni (spin 0) fotoni e particelle W ± , Z 0 (spin 1) e i gravitoni (spin 2, non ancora osservati) sono bosoni; gli elettroni i neutrini i quark ed i nucleoni sono fermioni di spin 1/2. I sistemi complessi come nuclei ed atomi possono avere spin intero o semiintero. La distinzione `e importante e concerne una legge fondamentale della Natura di cui ancora non abbiamo parlato. 13.3.1 Principio di Pauli Per particelle identiche, entra in gioco un ingrediente nuovo. L’operatore P (1, 2) che scambia due particelle (coordinate e spin, se c’`e) `e conservato; poich´e P (1, 2)2 = 1, P (1, 2) ha autovalori ±1. I soli casi osservati sono: −Ψ (1, 2) fermioni, P (1, 2)Ψ (1, 2) = Ψ (2, 1) = Ψ (1, 2) bosoni. In teoria dei campi, questo `e il teorema spin-statistica di Pauli (1940) ma nella teoria non relativistica va preso come un altro principio, o postulato. I due tipi di particelle, che hanno propriet` a del tutto diverse, prendono nome da Enrico Fermi5 e da Satyendranath Bose.6 Si pu` o scrivere una possibile funzione d’onda per 2 elettroni non interagenti usando due spin-orbitali a 2 componenti ψ1 (x1 ), ψ2 (x2 ) come segue. La funzione antisimmetrica o determinante di Slater `e 1 Ψab (1, 2) = √ [ψa (1)ψb (2) − ψa (2)ψb (1)] 2 1 ψ (1) ψb (2) = √ a ≡ |ψa ψb |. 2! ψa (1) ψb (2) 5
6
Enrico Fermi (Roma 1901-Chicago 1954) `e uno dei grandi del ventesimo secolo, sia per quanto riguarda la Fisica Teorica che per la Fisica Sperimentale; fra i contributi pi` u noti la statistica cui obbediscono le particelle di spin semiintero, la teoria delle interazioni deboli, la scoperta della risonanza ∆++ . Premio Nobel 1938 approfitt` o del viaggio a Stoccolma per lasciare l’Italia fascista e rifugiarsi in America, dove ottenne la cittadinanza e costru`ı il primo reattore nucleare. Satyendranath Bose, fisico indiano (Calcutta 1894,Calcutta 1974), sviluppo’ la statistica delle particelle di spin intero in collaborazione con A. Einstein.
206
13 Sistemi di particelle: entanglement
Ψ (1, 2) evidentemente si azzera se ψ1 = ψ2 ; quindi non si possono mettere due elettroni nello stesso spin-orbitale. Questa regola si chiama principio di Pauli e permette di costruire le configurazioni elettroniche fondamentali degli atomi e delle molecole occupando tutti gli stati a partire dal pi` u basso fino ad esaurimento degli elettroni. Si parla anche di principio di aufbau, parola tedesca per costruzione. Riassumendo, le funzioni d’onda accettabili per 2 particelle (le pi` u semplici, e quelle che possono fornire basi di funzioni a 2 corpi) sono: ⎧ particelle distinte, ⎨ ψa (1)ψb (2) ψa (1)ψb (2) − ψa (2)ψb (1) fermioni identici, ⎩ ψa (1)ψb (2) + ψa (2)ψb (1) bosoni identici. N Se abbiamo N particelle indipendenti identiche con H = i h(i), l’equazione di Schr¨ odinger HΨ = EΨ `e separabile,ed `e risolta in termini di h(i)ψµ (i) = µ ψµ (i) ponendo Ψ (1, 2, . . . , N ) = i ψ(i) con E = (µ). µ Bench´e matematicamente corretta, questa soluzione `e fisicamente inaccettabile. In genere, potremo scrivere stati a N elettroni correttamente antisimmetrizzati come determinanti di N spin-orbitali diversi, normalizzati con √1N ! ; una notazione conveniente `e Φ(1, 2, . . . N ) = |ψ1 ψ2 . . . ψN |. Per i bosoni, invece, bisogna usare permanenti, cio`e prodotti simmetrizzati. Un popolare approccio semplificato dell’atomo con Z elettroni si chiama Metodo del Campo centrale. Gli elettroni sono trattati come particelle indipendenti che occupano spin-orbitali ψnlm etichettati come quelli idrogenoidi, ma determinati da un opportuno potenziale centrale V (r) in luogo di quello coulombiano.7 Cambiando V (r) cambiano le funzioni radiali e le energie ma le simmetrie rimangono essenzialmente le stesse. Le spettroscopie mostrano che gli atomi con pi` u elettroni hanno una struttura a gusci, con gli elettroni disposti in livelli grosso modo idrogenoidi. La disposizione corretta per lo stato fondamentale si ottiene col metodo dell’aufbau: gli elettroni riempiono tutti gli spin-orbitali disponibili in ordine crescente di energia: cos`ı He ha configurazione 1s2 , con 2 elettroni di spin opposto nel 2s, Li ha 1s2 2s, Be ha 1s2 2s2 , B 1s2 2s2 2p, e cos`ı via. Questa regola dell’aufbau o principio di Pauli ha il suo fondamento microscopico nella connessione spin-statistica. Stati di singoletto e tripletto dell’He Se a denota l’orbitale 1s dell’atomo di He, il principio di Pauli consente di metterci 2 elettroni, perch´e gli stati spin-orbitali sono ψ1 = a(r)α, ψ2 = a(r)β; 7
Molti aspetti rilevanti discendono dalla simmetria del modello, senza bisogno di specificare V (r).
13.3 Bosoni e Fermioni
207
possiamo denotarli in modo pi` u descrittivo con ψ1 = a(r) ↑, ψ2 = a(r) ↓. Il Metodo del Campo centrale descrive lo stato fondamentale dell’atomo di He con: Φ(1, 2) = |a(r) ↑ a(r) ↓ | vale a dire Φ(1, 2) =
√1 2
[ψ1 (1)ψ2 (2) − ψ1 (2)ψ2 (1)]
2 (1)] √ = a(r1 )a(r2 ) [α(1)β(2)−α(2)β = a(r1 )a(r2 )χS , 2
dove
α(1)β(2) − β(1)α(2) √ 2 `e la funzione di spin del singoletto, tale che χS =
S 2 χS ≡ (S(1) + S(2))2 χS = 0. Poich´e l’hamiltoniano (trascurando deboli effetti relativistici) non contiene lo spin, lo spin totale `e conservato. Tutti gli autostati possono essere etichettati con i numeri quantici S, mS di S 2 , Sz . Inoltre bisogna rispettare il principio dell’antisimmetria; χS `e dispari sotto P (1, 2), e si combina con funzioni orbitali pari nello scambio di x1 e x2 ; in tal modo la funzione d’onda `e dispari per scambio dei due fermioni. Con 2 spin 1/2 ci sono poi 3 combinazioni di tripletto (S = 1): ⎧ T ⎪ ⎪ χMS =1 = α(1)α(2), ⎪ ⎨ √ χTMS = χTMS=0 = α(1)β(2)+β(1)α(2) , 2 ⎪ ⎪ ⎪ ⎩ T χMS =−1 = β(1)β(2). Queste sono tutti pari per la permutazione e vogliono funzioni orbitali dispari. Con un solo orbitale la combinazione antisimmetrica `e aa − aa = 0 e non si ha tripletto. Se a, b denotano gli orbitali 1s,2s dell’atomo di He, possiamo usarli per modellizzare gli stati eccitati della configurazione 1s2s. Possiamo fare 4 determinanti: D↑↑ = |a ↑ b ↑ |, D↑↓ = |a ↑ b ↓ |, D↓↑ = |a ↓ b ↑ |, D↓↓ = |a ↓ b ↓ |. Ad esempio, D↑↓ = a(1)b(2)α(1)β(2) − a(2)b(1)α(2)β(1) `e correttamente antisimmetrizzata, ma non `e n`e singoletto n`e tripletto. Gli autostati dell’hamiltoniano devono poter essere scelti con spin definito. Infatti, svolgendo e combinando questi determinanti, si ottengono gli stati di spin definito. Il singoletto `e ΨS=0 =
a(1)b(2) + b(1)a(2) S D↑↓ + D↓↑ √ √ = χ . 2 2
208
13 Sistemi di particelle: entanglement
Vi sono poi le 3 combinazioni di tripletto ΨS=1 =
a(1)b(2) − b(1)a(2) T √ χMS . 2
Il caso MS = 1 si ottiene da D↑↑ , MS = −1 si ottiene da D↓↓ ; questi sono determinanti singoli di Slater; per MS = 0 ne occorrono due, nella combinazione D↑↓ +D↓↑ √ . 2 Il termine di scambio 2
2
e ; Calcoliamo i valori di aspettazione dell’interazione Coulombiana re12 ≡ → − r 1 −→ r 2| |− le medie sugli spin sono presto fatte poich´e il prodotto scalare delle funzioni di spin d` a 1. Nei 3 casi del tripletto 2
Ψ↑↑ | re12 |Ψ↑↑ = 12 a(1)b(2) − b(1)a(2)| r112 |a(1)b(2) − b(1)a(2) = 12 [a(1)b(2)| r112 |a(1)b(2) − b(1)a(2)| r112 |a(1)b(2) −a(1)b(2)| r112 |b(1)a(2) + b(1)a(2)| r112 |b(1)a(2)]; ma gli indici 1 e 2 sono muti; cos`ı il primo termine `e uguale all’ultimo e gli altri due sono uguali fra loro. Semplificando, Ψ↑↑ |
1 e2 |Ψ↑↑ = (a(1)b(2) − b(1)a(2)| |a(1)b(2)). r12 r12
Il primo contributo dal chiaro significato elettrostatico 1 |a(r1 )|2 |b(r2 )|2 C = a(1)b(2)| |a(1)b(2) = d3 r1 d3 r2 r12 r12
(13.6)
(13.7)
si chiama termine coulombiano, ed il secondo contributo puramente quantistico 1 −Ex = −(b(1)a(2)| |a(1)b(2)) r12 termine di scambio. Ex `e positivo, e viene col - davanti per il tripletto, col + per il singoletto. Infatti, ripetendo il calcolo con il singoletto Ψ↑↓ ritroveremmo il termine coulombiano e quello di scambio, ma quest’ultimo col +. Lo stato u bassa di 2Ex rispetto a metastabile di tripletto 1s2s3 S dell’He ha energia pi` 1s2s1 S. Il tripletto ha una funzione di spin simmetrica nello scambio fra le particelle, e cos`ı la funzione orbitale `e antisimmetrica ed attribuisce ampiezza piccola alle piccole distanze fra gli elettroni. Cos`ı spin alto porta repulsione bassa. In nuce, questa `e la ragione per cui esistono le calamite. Il termine di scambio gioca un ruolo essenziale nella teoria del legame chimico e della coesione dei solidi.
13.4 Statistiche Quantistiche
209
13.4 Statistiche Quantistiche Se abbiamo due particelle e 2 stati A e B equiprobabili a disposizione, qual’`e la probabilit` a Pinsieme di trovarle nel medesimo stato? La risposta dipende dalla statistica. Per la Fisica classica esistono solo particelle distinguibili, perch´e in linea di principio uno le pu` o marcare in qualche modo e pu`o seguirne le traiettorie con continuit` a. Le particelle identiche sono solo un caso particolare di quelle diverse; f` a poca differenza se due cose sono quasi uguali, o proprio uguali. Allora ci sono 4 casi: ⎧ ψA (1)ψA (2) ⎪ ⎪ ⎨ 1 ψA (1)ψB (2) =⇒ Pinsieme = . ψ (1)ψ (2) ⎪ 2 B A ⎪ ⎩ ψB (1)ψB (2) Per la Fisica quantistica particelle identiche sono indistinguibili in linea di principio, e questo f` a una grande differenza. Per bosoni ci sono 3 casi: ⎧ ψA (1)ψA (2) ⎨ 2 ψA (1)ψB (2) + ψB (1)ψA (2) =⇒ Pinsieme = . ⎩ 3 ψB (1)ψB (2) Per fermioni c’`e un solo caso: {ψA (1)ψB (2) − ψB (1)ψA (2) =⇒ Pinsieme = 0. Supponiamo ora di avere un sistema isolato (gas) di N >> 1 particelle indipendenti (gas perfetto) di energia totale E in equilibrio alla temperatura T . Usiamo insomma l’insieme microcanonico. Il sistema si trova in una sovrapposizione di stati quantici (stati microscopici), tutti equiprobabili. Il principio `e quello formulato da Gibbs (si veda la Sezione 5.3): L’ipotesi fondamentale della meccanica statistica `e: se un sistema in equilibrio termico ha energia E, tutti gli stati microscopici di energia E sono ugualmente probabili. Possiamo misurare le energie delle singole particelle (o molecole) del gas e trovare che sono distribuite secondo una legge n(), che per` o `e diversa nel caso classico e per fermioni e bosoni. Quella che si verifica in ciascun caso `e la distribuzione n() pi` u probabile. Preliminarmente ci dobbiamo chiedere quanti stati microscopici corrispondono ad un dato stato macroscopico. Per definire uno stato macroscopico, discretizziamo l’energia a un corpo dividendo l’asse in intervallini; discretizziamo poi lo spazio µ, cio`e lo spazio delle fasi della singola particella, le cui coordinate sono x, y, z, px , py , pz . La cella i contiene gi stati quantici( o microscopici) diversi, ma scambiando le particelle all’interno di una cella non
210
13 Sistemi di particelle: entanglement
cambia lo stato macroscopico. Le statistiche sono diverse perch´e sono diverse le distribuzioni ammissibili dentro ogni cella. La risposta differisce nei tre casi di Boltzmann, Bose e Fermi. Le celle devono essere cos`ı piccole che l’energia o considerare praticamente costante, ma sono pur sempre cos`ı grandi i si pu` da contenere molte particelle. Si tratta di trovare quanti sono gli stati microscopici distinti del gas che realizzano una data distribuzione n1 , n2 , n3 . . .. All’equilibrio regna la distribuzione pi` u probabile, ni cio`e quella che si pu` o realizzare in pi` u modi, (cio`e corrisponde a pi` u stati quantici) compatibilmente con le restrizioni i ni = E. ni = N, 13.4.1 Statistica di Boltzmann con degenerazione La Statistica di Boltzmann `e classica e qui entra ai fini didattici come caso limite. Dobbiamo determinare in quanti modi si possono ottenere i vari stati del gas considerando la possibilit` a di avere pi` u stati equivalenti in ogni cella. Questa possibilit`a manca nella sezione (5.6.2), ma peraltro il calcolo `e del tutto analogo.Il numero dei modi in cui si possono mettere n1 particelle nella N n1 prima cella `e g1 , dove il binomiale `e il numero di scelte delle particelle, n1 ed il secondo fattore assegna g1 possibili stati distinti a ciascuna. Il numero dei modi in cui si pu` o realizzare una distribuzione n1 , n2 , n3 . . . `e N N − n1 N − n1 − n2 W = g3n3 . . . ; g1n1 g2n2 n1 n3 n2 e quindi W = N!
( g nr r
r
nr !
.
Massimizziamo ln W con la formula di Stirling ln W ≈ N ln N − %$ N + ni ln gi − ni ln ni + ni % $ = N ln N + ni ln gi − ni ln ni . Applicando il metodo di Lagrange della Sezione (16.2.1) imponiamo l’annullarsi di ∂ ni ln ni − γ ni − β i ni , ni ln gi − ∂nr dove β, γ sono moltiplicatori; viene ln gr − ln nr − 1 − γ − βr = 0. Poniamo α = 1 + γ; viene
13.5 Statistica di Bose-Einstein
211
nr = gr e−α e−βr . 1 Abbiamo riottenuto la distribuzione classica di Boltzmann con β = KB T ; qui, KB `e la costante di Boltzmann; il parametro α `e fissato da ni = N, cio`e
N . −βk g k ke
e−α =
(13.8)
Di solito questo si scrive in termini del potenziale chimico µ definito da −α = µβ, nr = gr e−β(r −µ) .
13.5 Statistica di Bose-Einstein Dividiamo lo spazio delle fasi in celle macroscopicamente piccole ma tali da poter contenere un elevato numero di stati quantici; la cella i avra g i 1 stati. Le particelle sono indistinguibili, e non ha significato lo scambio di due particelle fra stati diversi (della stessa o di altre celle). Cerchiamo il numero di modi W di realizzare una distribuzione con n1 , n2 , n3 , · · · particelle nelle celle di energia 1 , 2 , 3 · · · . Poich´e le celle sono indipendenti, ( W = Wr , r
dove Wr `e il numero di stati microscopici che corrispondono alle nr particelle da disporre nella cella r dove ci sono gr stati. una volta ottenuto W troveremo nr imponendo il numero di particelle N e l’energia totale E con i moltiplicatori di Lagrange α e β scrivendo ∂ [ln W − αN − βE] = 0. ∂nr Ora, Wr `e il numero di modi di mettere nr palline in gr cassetti. Per esempio, 2 palline in 3 cassetti possono essere messe nei seguenti 6 modi: || · ·
|·|·
| · ·|
·|| ·
·| · |
· ·||
Il primo corrisponde a 2 palline nel terzo cassetto, il secondo ad una nel secondo ed una nel terzo, etc. Le posizioni dei separatori | corrispondono alle coppie (1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4). In genere, una configurazione si ottiene allineando le palline con i gr − 1 separatori fra i cassetti, quindi nr + g r nr + g r − 1 , Wr = ≈ gr − 1 gr poich´e gi 1. Allora,
212
13 Sistemi di particelle: entanglement
∂ ∂ ni + g i [(nr + gr ) ln(nr + gr ) − nr ln nr − gr ln gr ] = ln ln W = ∂ni ∂ni ni e la condizione ln
ni + g i − α − βi = 0 ni
ci d` a la distribuzione di Bose-Einstein ni =
gi α+β i e
−1
.
In analogia col caso di Boltzmann, a cui tende per βi 1, β = Il parametro α `e fissato da ni = N .
1 KB T
.
13.5.1 Corpo nero e fotoni Nel caso dei fotoni, la condizione ni = N manca perch´e il numero dei fotoni non `e fissato, e il moltiplicatore di Lagrange corrispondente α `e nullo (manca cio`e la condizione). Pertanto, il numero medio di fotoni in ogni stato (modo ¯ ω `e normale) di energia ω = h nω =
1 , eβω − 1
e quindi ciascun modo normale contiene l’energia Eω =
ω β e ω−
1
.
(13.9)
C’`e un modo normale per ogni polarizzazione in ogni punto k, e questi punti corrispondono ai nodi di un reticolo. Passando al continuo, il numero di nodi di un reticolo pu` o essere calcolato dal volume dividendo per il volumetto associato ad ogni nodo, cio`e L3 → d3 k. (13.10) (2π)3 k k
Essendo V = L3 il volume del gas di fotoni, in d3 k il numero di punti V 3 k `e (2π) e ci sono 2 stati di polarizzazione il numero di modi `e 3 d k; poich´ V 2 2 8π e 3 4πk dk. Ma ω = ck, quindi il numero di modi in dω ` l’energia a frequenza ω `e
¯ω dE ω = h
1 eβω
V ω 2 dω π 2 c3 .
V ω 2 dω ≡ V u(ω)dω. − 1 π 2 c3
Ne consegue la celebre legge di Planck per la densit`a di energia: u(ω) = h ¯ω
1 eβω
ω2 . − 1 π 2 c3
Allora,
13.5 Statistica di Bose-Einstein
213
Va detto che questo fu proprio il punto di partenza della teoria dei quanti, nell’anno 1900. Il massimo della distribuzione di Planck ωmax `e proporzionale alla temperatura assoluta (legge di spostamento di Wien). La densit` a di energia integrata su tutte le frequenze segue la legge di Stefan-Boltzmann: ∞ ω 3 dω h ¯ . U = udω = 2 3 π c 0 exp[¯ h KωB T ] − 1 Posto x = β¯ hω, U= Ora,
h ¯ 2 π c3
∞ 0
KB T h ¯
4
∞
0
x3 dx . ex − 1
π4 x3 dx = ex − 1 15
e questa `e la legge di Stefan-Boltzmann U ∼ T 4 ma con la costante determinata. Infatti la densit` a di energia determina quanta energia per unit` a di tempo incide sulla superficie di un corpo; in equilibrio, il corpo non si deve raffreddare n`e riscaldare, e quindi ne deve emettere altrettanta. 13.5.2 Funzione di partizione canonica In meccanica statistica classica abbiamo definito la funzione di partizione (5.35) con Z = e−βHS (p,q) dΓ, in termini di un integrale sullo spazio delle fasi del sistema. L’energia interna U `e data dalla (5.36), H =−
∂ ln(Z) 1 ∂Z =− . Z ∂β ∂β
Nella Teoria quantistica, la funzione di partizione di un sistema di hamilton ∞ niana H `e definita da Z = T r[e−βH ] ovvero Z = n=0 e− KT dove n sono gli autovalori dell’energia. Le energie possono essere misurate a partire dallo stato fondamentale (ma qualsiasi orgine delle energie va bene). Z interviene nel calcolo delle medie termiche degli operatori a temperatura T ; il principio con cui si calcolano queste medie `e che la probabilit` a che il sistema abbia n energia n `e data da Z1 e− KT . Per esempio, l’energia media `e ∞ n − KT ∂ T r[He−βH ] n=0 n e = − LogZ. (13.11) E = ∞ − n = KT Z ∂β n=0 e Calcoliamola per un oscillatore armonico, misurando le energie a partire da quella di punto zero. Allora il calcolo `e immediato perch´e Z `e data da una serie
214
13 Sistemi di particelle: entanglement
−1 ∞ −nω¯ h geometrica: Z = n=0 e− KT = 1 − e−β¯hω . E’ immediato verificare che n la (13.9), e quindi la legge di Planck, corrispondono alla (13.11. Cos`ı Z1 e− KT `e la probabilit` a dell’energia di avere n fotoni in equilibrio termico nel modo. La distribuzione di Bose-Einstein dei fotoni, che assegna il mumero medio di eccitazione del modo normale, realizza la distribuzione canonica dei livelli energetici. 13.5.3 Applicazioni a He liquido e Calori specifici dei solidi He liquido Nell’He liquido (isotopo 4) sotto una temperatura critica TC = 2.190 K, una frazione importante degli atomi va nello stato fondamentale (condensazione di Bose) e il nostro trattamento, che ipotizza un andamento continuo di ni in funzione di i , andrebbe modificato. Allo zero assoluto tutte le particelle si trovano nello stato di energia pi` u bassa. Calori specifici dei solidi In Fisica classica, per il teorema di equipartizione spetta ad ogni oscillatore tridimensionale una energia Eosc = 3KB T. Il contributo di ciascun oscillatore osc risulta 3KB . Questo `e grosso modo vero a al calore specifico CV = ∂E ∂T temperatura ambiente ma i calori specifici diminuiscono al diminuire della temperatura. Nel modello di Einstein dei calori specifici dei solidi, le vibrazioni atomiche (fononi) danno all’energia il contributo Ef on =
n¯ hω , eβ¯hω − 1
dove n `e il numero di oscillatori e ω la loro pulsazione; infatti i fononi sono bosoni. Il calore specifico viene: CV ≡
n(¯ hωβ)2 KB eβ¯hω ∂Ef on = . ∂t (eβ¯hω − 1)2
Questo tende a costante per β → 0 (alta termperatura) in accordo con una legge classica di Dulong e Petit. h ¯ω Per` o al di sotto della temperatura di Einstein TE = K il calore specifico B crolla e CV → 0 per T → 0 in accordo qualitativo con l’esperimento.
13.6 Statistica di Fermi-Dirac Dividiamo lo spazio delle fasi in celle macroscopicamente piccole ma tali da poter contenere un elevato numero di stati quantici; la cella i avra
13.6 Statistica di Fermi-Dirac
215
gi 1 stati. Anche per fermioni indistinguibili non ha significato lo scambio di due particelle fra stati diversi; quindi uno stato microscopico `e assegnato specificando la distribuzione dei numeri di paticelle n1 , n2 , n3 , · · · nelle celle di energia 1 , 2 , 3 · · · . Cerchiamo il numero di modi W di realizzare una imporremo che W sia massimo con i vincoli microcanonici distribuzione; n n = N, i i i = E. Le diverse celle sono statisticamente indipendenti, i i e W = i Wi . Nella generica cella dobbiamo disporre ni particelle in gi stati disponibili. I numeri di occupazione in questo caso possono essere solo 0 e 1. Quindi, gi Wi = ni modi. Cos`ı W =
i
Wi =
gi ! i ni !(gi −ni )!
e la formula di Stirling ln n! ≈ n ln n ci d` a ln W ≈ {gi ln gi − ni ln ni − (gi − ni ) ln(gi − ni )}. i
Applicando di nuovo il metodo dei moltiplicatori di Lagrange imponiamo l’annullarsi di
∂ {gi ln gi − ni ln ni − (gi − ni ) ln(gi − ni ) − α ni − β i ni ; ∂nr i trascurando 1 rispetto a ni − ln nr − (−) ln(gr − nr ) − α − βr = 0. r Quindi, ln grn−n = α + βr che comporta la distribuzione di Fermi-Dirac r
nr =
gr gr ≡ β( −µ) , eα+βr + 1 e r +1
dove µ `e il potenziale chimico. Per grandi r − µ si ritrova la distribuzione di Boltzmann con β = KB1 T . Allo zero assoluto, la funzione di Fermi f (x) = eβx1+1 `e una funzione a gradino, e si constata che µ = EF , perch´e il gradino `e al livello di Fermi. Il gradino si smussa riscaldando, ma per riscaldare in modo importante un metallo tipico , con EF = qualche eV, ci vogliono temperature di molte migliaia di gradi (temperatura ambiente corrisponde a soli 25 meV). La distribuzione di Fermi-Dirac descrive l’occupazione degli stati elettronici nei solidi. 13.6.1 Gas di Fermi Il gas di Fermi `e un gas perfetto di fermioni, di densit`a uniforme ρ assegnata. (Si parla di liquido di Fermi se vi sono interazioni).
216
13 Sistemi di particelle: entanglement
Gas in una dimensione Per esempio, in 1 dimensione (d = 1), supponiamo che ci siano N 1 elettroni indipendenti in una scatola di potenziale di lunghezza L con condizioni al o pensare ad contorno8 periodiche (il punto x = L `e identificato con x = 0; si pu` una circonferenza piuttosto che ad un segmento). La densit`a `e quindi ρ = N L. Le funzioni d’onda spaziali di una particella nella scatola sono 1 ψk (x) = √ eikx L ed imponendo la condizione al contorno eikL = 1 si trova che sono ammessi i vettori d’onda 2πn ; (13.12) kn = L fra due k permessi c’`e l’intervallo ∆k =
2π . L
Gli N elettroni riempiono questi livelli discreti, nello stato fondamentale, secondo l’aufbau, cio`e fino ad un livello massimo occupato che si chiama livello ¯ kF ed all’energia di Fermi; esso corrisponde a k = kF , all’impulso pF = h p2F k = 2m . Per definizione, fra k = 0 e k = kF ci devono essere N spin-orbitali, ovvero N/2 orbitali: N =2 1. k
Per calcolare kF , poich´e i livelli sono molto fitti, conviene passare ad una descrizione continua e kF kF dk = . (13.13) → N/2 = ∆k ∆k 0 k≤kF
Quindi in una dimensione kF `e dato da: kF = ∆k
πN N = = πρ. 2 L
(13.14)
Gas in tre dimensioni In 3 dimensioni questa diventa la teoria di Sommerfeld dei metalli: consideriamo un gas di densit` a ρ = LN3 ≡ N V . Invece della (13.13), in 3d L3 = d3 k. (13.15) (2π)3 k
8
Se L `e abbastanza grande, le propriet` a del liquido che vogliamo studiare sono indipendenti dalle condizioni al contorno usate. Bench´e la dimostrazione non sia elementare, il risultato `e intuitivo.
13.6 Statistica di Fermi-Dirac
217
Mettendo due elettroni in ogni orbitale in ordine crescente di energia fino ad esaurirli tutti ( metodo dell’aufbau), deve risultare, passando a coordinate sferiche, 2V 4π kF 2 V 3 N =2 d k= k dk, =2 (2π)3 k
da cui N= ovvero
V kF3 , 3π 2 1
(13.16) 1
kF = (3π 2 ρ) 3 ∼ 3.093 ρ 3 . Gas di Fermi Il gas di Fermi di densit`a ρ ha una lunghezza caratteristica (raggio medio per particella) r0 definita da 4π 3 1 = r . (13.17) ρ 3 0 Quindi r0 ∼ k1F . Di solito lo si misura in raggi di Bohr introducendo il raggio di Wigner-Seitz adimensionale rs = arB0 . L’elettrone primo vicino ad un dato elettrone si trova a distanza ∼ r0 . Il Cs ha rs ∼ 6 e Al ha rs ∼ 2, con gli altri elementi metallici per lo pi` u in questo intervallo. L’energia di Fermi `e EF =
2 h ¯2 (3π 2 ρ) 3 . 2m
Per ρ = 0.1 a.u. viene9 EF ∼ 1.03a.u. ∼ 28eV ; le energie di Fermi dei metalli sono tipicamente dell’ordine da 5 a 10 eV. L’energia totale viene KF k2 V V =h ¯2 2 kF 5 , h ¯2 k 4 dk = h ¯2 (13.18) Etot = 2 2m 2π m 0 10π 2 m k
e la densit` a di energia cinetica Etot 5 ∼ ρ 3 ∼ r0−5 V
(13.19)
cresce velocemente con la densit`a. L’energia cinetica media per elettrone risulta, usando la (13.16), ¯ =
Etot 3 = EF . N 5
Per ρ = 0.1a.u. la densit` a di energia viene di circa 0.06 a.u. 9
in Unit` a Atomiche (a.u.) si pone h ¯ = 1, le lunghezze sono misurate in raggi di Bohr ( 0.529 ρA ) e le energie in Hartrees (27.2 eV).
218
13 Sistemi di particelle: entanglement
f
Fig. 13.1. Curva spessa: funzione di Fermi per KB T = 0.1µ; curva sottile: funzione di Fermi per KB T = 0.3µ
La teoria di Sommerfeld spiega ad esempio perch´e il contributo degli elettroni al calore specifico dei metalli cresce linearmente con la temperatura T. Ma la densit` a di energia del gas di elettroni `e positiva (gli elettroni hanno solo energia cinetica) e gli elettroni non sfuggono al metallo solo perch´e sono contenuti in una scatola. La vera natura della scatola `e ovviamente elettrostatica, ma la coesione di un metallo `e pi` u difficile da capire di quella di un cristallo ionico, che si spiega anche classicamente. La teoria di Sommerfeld non basta. Per descrivere i metalli `e stato molto studiato un modello chiamato Jellium in cui gli elettroni si muovono su un fondo uniforme di carica positiva. In tal caso, la carica negativa degli elettroni `e compensata esattamente dal fondo positivo e non vi `e contributo elettrostatico diretto all’energia dello stato fondamentale. Vi `e per` o un contributo di scambio che in un intervallo di densit` a pu` o contribuire a spiegare la coesione dei metalli. Risulta infatti che ¯ ∼
2.21 0.916 − rs2 rs
(13.20)
esprimendo l’energia in Rydberg (1 Rydberg = 13.59 eV). Il primo termine `e energia cinetica ed il secondo `e energia di scambio. u perfetto quanto pi` u alta `e la Il gas `e perfetto per rs → 0, cio`e `e tanto pi` densit` a (nel caso classico `e vero il contrario). Qualunque cosa, se compressa abbastanza, diventa metallo. Pressione di degenerazione L’andamento della distribuzione di Fermi `e a gradino allo zero assoluto; al crescere di KB T il gradino si trasforma in una discesa graduale. Il potenziale chimico µ corrisponde a occupazione 21 . Quando KB T > µ molti elettroni si trovano nella coda esponenziale della distribuzione, ed il gas di Fermi diventa simile a quello classico. Nei metalli in condizioni normali pochissimi elettroni soddisfano questa condizione ed il gas si chiama degenere. La sua equazione
13.7 Cenno al calcolatore quantistico
219
di stato `e molto diversa da quella classica. Per N fissato, l’energia (13.18) dipende dal volume: Etot = h ¯2
5 V 2 3 (3π V N ) 10π 2 m
−5 3
2
= η V −3 ,
(13.21)
dove
5 h ¯2 2 3 (3π N ) . (13.22) 10π 2 m Anche allo zero assoluto, in gas di Fermi ha una pressione, di natura puramente quantica. Possiamo misurarla con un esperimento pensato. Facciamo a un lavoro espandere adiabaticamente10 di dV il volume del gas; questo compir` δL = P dV e la sua energia cambier` a di
η=
dEtot = −P dV.
(13.23)
Dalla (13.21), dEtot 2E =− . dV 3V Cos`ı, troviamo che la pressione di degenerazione `e 5
2 2 (3π 2 ρ) 3 2 Etot = h ¯ . P = 3 V 3 10π 2 m
(13.24)
L’equazione di stato di un gas perfetto classico `e P = N KB T ρ; la pressione si annulla allo zero assoluto e cresce linearmente con la densit`a. Il comportamento predetto dalla (13.24) per il gas di elettroni degenere `e molto diverso, con una crescita molto pi` u veloce della pressione, anche alle pi` u basse temperature. Questa legge determina l’alta resistenza allo schiacciamento dei metalli, ed anche la stabilit` a delle stelle degeneri (nane bianche e stelle di neutroni). Le forze che derivano dalla pressione di degenerazione sono fra le pi` u intense note.
13.7 Cenno al calcolatore quantistico Come sappiamo dalle ( 12.5,12.6,) uno stato di spin dipende da due angoli che possono variare con continuit` a e che fissano la sovrapposizione di spin alto e basso. Uno spin classico `e un oggetto che si trova in uno di due stati, l’uno o l’altro, ma mai in una sovrapposizione. Lo stato di uno spin classico si pu` o specificare dando un bit di informazione, 0 oppure 1. Un insieme di 4 spin classici pu`o trovarsi in uno di 24 stati, cio`e (0, 0, 0, 0) (0, 0, 0, 1) (0, 0, 1, 0) (0, 0, 1, 1) (0, 1, 0, 0) (0, 1, 0, 1) (0, 1, 1, 0) (0, 1, 1, 1) (1, 0, 0, 0) (1, 0, 0, 1) (1, 0, 1, 0) (1, 0, 1, 1) (1, 1, 0, 0) (1, 1, 0, 1) (1, 1, 1, 0) (1, 1, 1, 1) 10
Il primo principio dice dEtot = δQ + δL, e qui δQ = 0.
220
13 Sistemi di particelle: entanglement
assegnare una configurazione equivale a dare un numero intero fra 1 e 16 che dice quale fra le configurazioni in elenco si realizza. Invece per assegnare lo stato di 4 spin quantistici occorre specificare 16 numeri che variano con continuit`a; questo significa che c’`e molta pi` u informazione. Cambiare la configurazione dei 4 spin classici equivale a cambiare un intero da 1 a 16 in un altro; cambiare la configurazione dei 4 spin quantistici equivale a fare una trasformazione unitaria in uno spazio a 16 dimensioni. In altri termini, la simulazione classica di un sistema di n spin (detti anche q-bits) comporta un numero esponenzialmente crescente di bits classici. Nel 1982 R. P. Feynman sugger`ı la possibilit` a di costruire un calcolatore basato sul principio di sovrapposizione e quindi sugli effetti quantistici. Ecco un primo esempio di calcolo che `e pi` u vantaggioso fre con un computer quantistico. Consideriamo una funzione fα (x) di cui il calcolo `e oneroso e si sa che sia in x=0 che in x=1 pu`o valere 0 o 1 a seconda di α. Si vuol sapere solo se per un dato α la f assume lo stesso valore o valori diversi. Con un calcolatore classico non c’`e altro da fare che calcolare ambedue i valori e confrontarli. David Deutsch ha dimostrato teoricamente che un computer quantistico determinerebbe il risulato con un solo calcolo di f. La specialit` a dei calcolatori quantistici `e quella di poter fornire informazioni globali sulle funzioni da calcolare. Potenzialmente questo potrebbe portare un progresso enorme; tuttavia a ci`o si oppongono grandi difficolt` a di ordine teorico e pratico. Una difficolt` a di principio `e dovuta al fatto che il sistema quantistico `e non `e mai perfettamente isolato e prima o poi `e soggetto alla perdita di coerenza, o decoherence, come si chiama in letteratura. L’idea base `e la seguente. Consideriamo uno spin in uno stato |ψ = α| ↑ + β| ↓ con |α| = |β| = 12 . Il nostro computer quantistico potrebbe usare l’informazione contenuta nella fase relativa di α e β e connessa alla sua evoluzione in un campo magnetico applicato. Tuttavia, se lo spin non `e ben isolato, c’`e una parte incognita dell’hamiltoniana che descrive l’interazione con un sistema esterno X. La decoherence consiste nel fatto che se X interagisce diversamente con | ↑ e | ↓, e si comporta come un rivelatore dello stato di spin, in capo ad un certo tempo caratteristico la relazione di fase `e persa. Questo `e analogo a quello che accade nell’esperimento della doppia fenditura se si cerca di rivelare da che parte passa la particella: ipso facto si distrugge l’interferenza e si produce un comportamento classico. Si pu`o dire che il comportamento classico emerge naturalmente da quello quantistico quando il sistema in studio `e cos`ı complesso che non possiamo conoscere tutta l’hamiltoniana, e perdiamo gli effetti di interferenza. Il futuro dir` a se la proposta del computer quantistico `e realizzabile e che usi potr` a avere.
14 Teoria delle perturbazioni indipendenti dal tempo
I calcolatori servono per calcolare, le approssimazioni per capire.
14.1 Introduzione Spesso siamo interessati ad un problema della forma (H0 + Vˆ )ψ = Eψ, mentre sappiamo risolvere il problema imperturbato con Vˆ = 0 H0 ψn(0) = En(0) ψn(0) . Supponiamo qui per semplicit` a che i livelli imperturbati siano una successione (0) (0) (0) discreta {E1 , E2 , E3 , · · ·} e che Vˆ sia piccolo, nel senso che gli autovalori corretti {E1 , E2 , E3 , · · ·} si discostano poco da quelli imperturbati. In tali circostanze possiamo tentare di trovare una utile soluzione approssimata. L’idea `e quella di introdurre un parametro adimensionale λ, scrivere (H0 + λVˆ )ψ = Eψ
(14.1)
e scrivere autovalori ed autovettori come una espansione in potenze di λ. Il parametro λ ci serve nel corso dei calcoli per stabilire immediatamente per ogni contributo a quale potenza (o ordine perturbativo) appartiene. Alla fine, metteremo λ = 1. Vedremo che sotto certe ipotesi possiamo trattare Vˆ come un operatore piccolo rispetto ad H0 , nel senso uno o due termini della serie forniscono gi` a una approssimazione soddisfacente. Ci proponiamo di calcolare l’autovalore e l’autostato del livello n. Prima di tutto `e utile riscrivere il problema sulla base imperturbata {ψ (0) }: (0) ψ= cm ψm ; m
222
14 Teoria delle perturbazioni indipendenti dal tempo (0)
se λ → 0, cm → δmn , mentre E → En , e questo `e l’ordine 0. La (14.1) d`a 4 5 0 (0) (0) cm Em + λVˆ ψm =E cm ψm . m
m
Moltiplicando per ψk0∗ e integrando, si ottiene (0) (E − Ek )ck = λ Vkm cm .
(14.2)
m
14.1.1 Spettro discreto non degenere (0)
Il caso pi` u semplice `e quello in cui i livelli imperturbati {En } non sono degeneri (le energie sono diverse per n diversi). L’effetto della perturbazione `e debole se sposta poco i livelli rispetto alla separazione dei livelli di H0 e ciascun livello perturbato si pu` o ricondurre senza ambiguit`a ad uno imperturbato da (0) cui deriva. Cerchiamo allora la soluzione della (14.2) che si riduce a ψn per λVˆ → 0, supponendo valida l’espansione in serie di λ, ψ = ψ (0) + λψ (1) + λ(2) ψ (2) + . . . . Quindi poniamo (0)
(1)
(2)
ck = ck + λck + λ(2) ck + . . . (0) (1) (2) E = En + λEn + λ(2) En + . . . , (0)
dove ck = δk,n . Con ci` o, la (14.2) `e (0)
(0)
(En − Ek
(1)
(2)
(1)
(2)
+ λEn + λ2 En + . . .)(δk,n + λck + λ2 ck + . . .) = (14.3) (1) 2 (2) λ m Vkm (δm,n + λcm + λ cm + . . .).
Eseguiamo la moltiplicazione a primo membro e separiamo le potenze di λ: (0)
(0)
(1)
(1)
(0)
(0)
[En − Ek ]δk,n +λ[En δk,n + ck (En − Ek )] (2)
(2)
(0)
(0)
(1)
(0)
+λ2 [En δk,n + ck (En − Ek ) + ck En ] + . . . (14.4) =λ
m Vkm δm,n
+ λ2
(1)
m
Vkm cm + . . . .
All’ordine 0, resta il risultato banale (0)
(En(0) − Ek )δk,n = 0. Al primo ordine, per` o (0)
(1)
(E (0) − Ek )ck + En(1) δk,n = % n $ % $
m
Vk,m δm,n = Vk,n .
14.1 Introduzione
223
Per k = n la prima graffa `e nulla e troviamo En(1) = Vn,n . Per k = n la seconda graffa `e nulla e troviamo le ampiezze delle eccitazioni virtuali Vk,n (1) ck = (0) , k = n, (0) En − Ek Vk,n (0) ψn(1) = ψ . (14.5) (0) (0) k k =n En − Ek (1)
(1)
cn non `e determinato da questo argomento, ma ora vedremo che cn = 0. Infatti in tal modo < ψ (1) |ψ (0) >= 0; cos`ı ψ|ψ = 1 + O(λ2 ), cio`e la funzione d’onda risulta correttamente normalizzata al primo ordine. V Dalla (14.5) `e evidente che la condizione di validit` a `e (0) k,n (0) 1; `e En −Ek
chiaro anche che il metodo non si applica in questa forma se lo spettro `e continuo, perch´e l’annullarsi del denominatore pone problemi delicati. Al secondo ordine, la (14.4) d`a (1) (0) (2) (En(0) − Ek )ck + En(1) ck + En(2) δk,n = Vk,m c(1) m . $ % $ % m (1)
Per k = n resta la seconda graffa, dove cn = 0; cos`ı la correzione di secondo ordine all’energia viene En(2) =
Vn,m c(1) m =
m
|Vn,m |2
m =n
En − Em
(0)
(0)
.
(14.6)
Questa correzione `e sempre negativa per lo stato fondamentale. Problema 27. Mostrare che l’energia dell’atomo di H nello stato fondamentale in un debole campo elettrico uniforme E `e E = E0 + 21 αE2 e stabilire l’ordine di grandezza della polarizzabilit` a α. Soluzione 27. La perturbazione Vˆ = ezE non ha effetto lineare, ma quadratico sullo stato fondamentale perch´e ψ0 |Vˆ |ψ0 = 0, in quanto l’operatore `e dispari. La correzione all’energia ∆E viene dal second’ordine. La polarizzabilit` a ha le dimensioni di un volume, come si vede e2 dal fatto che [E] = [ L ], mentre [E] = [ Le2 ]. Per un atomo di H, α `e dell’ordine di a30 . Sperimentalmente, α = 0.66 10−24 cm3 .
224
14 Teoria delle perturbazioni indipendenti dal tempo
Problema 28. Un oscillatore con hamiltoniano H0 =
1 p2 + mω 2 x2 2m 2
`e soggetto alla perturbazione H = bx + c. Trovare la correzione allo stato fondamentale con la teoria delle perturbazioni fino al secondo ordine. Studiare il caso b = −mω 2 a con c = 21 mω 2 a2 , che corrisponde ad uno spostamento x → x − a. †
†
) ) √ √ , dove x0 = , pˆ = −i¯ h (a−a Soluzione 28. Ricordiamo che x ˆ = x0 (a+a 2 x0 2 / h ¯ † a c, ed il termine lineare mω , [a, a ] = 1. Al primo ordine la costante d` 2
2
2
x2
2
b 01 ) = − h¯bω 20 = − 12 mω d` a 0. Al secondo ordine E (2) = − b (x 2 . Nel caso in h ¯ω esame la correzione viene 1 b2 c− = 0. 2 mω 2 Questa `e una soluzione esatta visto che la perturbazione sposta l’oscillatore con x → x− a. Quindi la somma di tutti i termini successivi della serie `e nulla.
Problema 29. (oscillatore anarmonico quartico) Per l’oscillatore anarmonico di hamiltoniano 1 x ˆ = (ˆ H n + )¯ hω + α( )4 , 2 x0 calcolare l’effetto della perturbazione al primo e secondo ordine nello stato fondamentale. Quando il secondo ordine `e piccolo rispetto al primo? √ √ Soluzione/29. Ricordiamo che x ˆ = (x0 (a+a† ))/ 2, pˆ = −i¯ h((a−a† ))/(x0 2), h ¯ , [a, a† ] = 1. La correzione al primo ordine `e E 1 = α[( xx0 )4 ]0,0 . dove x0 = mω La√matrice di x ha elementi (10.5); gli unici non zero sono xn+1,n = xn,n+1 = x0 C n + 1, con C = √ . Pertanto,agendo con x, da |0 si va solo a |1, e quindi 2 (x4 )0,0 = x0,1 (x2 )1,1 x1,0 . Da |1 a |1 si va passando per |0 e per |2, quindi (x2 )1,1 = x1,0 x0,1 + x1,2 x2,1 . In tutto, (x4 )0,0 = x0,1 [x1,0 x0,1 + x1,2 x2,1 ]x1,0 = 3C 4 . La correzione al primo ordine `e E 1 = 43 α. Veniamo al second’ordine. Nel calcolo della (14.6) gli stati con m > 4 non a, restano da calcolare entrano. Poich´e (x4 )0,1 = 0 = (x4 )0,3 per parit`
14.1 Introduzione
225
(x4 )0,2 = x0,1 (x3 )1,2 = x0,1 [x1,2 (x2 )2,2 + x1,0 (x2 )0,2 ] = x√ 0,1 x1,2 (x2,1 x1,2 √ + x2,3 x3,2 √) + x0,1 x1,0 x0,1 x1,2 = ( 2(2 + 3) + 2)C 4 = 6 2C 4 e quindi (x4 )0,4 = x0,1 x1,2 x2,3 x3,4 =
√ 24C 4 .
Ed anche il secondo ordine `e ottenuto: ' √ 6 √ 4 2 3 |x404 |2 | 24|2 |x02 | α2 α2 C 8 |6 2|2 (2) −E0 = 8 + + . = 8 x0 h ¯ω 2 4 x0 h ¯ω 2 4 In tutto, viene 3 21α2 1 h ¯ω + α − 2 4 8¯ hω e il second’ordine `e piccolo rispetto al primo se α h ¯ ω. E0 ≈
ˆ = (ˆ Problema 30. Per l’oscillatore anarmonico di hamiltoniano H n + 21 )¯ hω + x 3 α( x0 ) , calcolare la correzione all’energia al primo e secondo ordine nello stato n. Perch´e la teoria delle perturbazioni non pu` o essere del tutto valida? Soluzione 30. 15α2 2 1 11 hω − (n + n + ). En = (n + )¯ 2 h ¯ω 30 Tuttavia, il potenziale perturbato non ha un minimo e non ci possono essere veri livelli discreti. Problema 31. Una particella confinata nella buca di potenziale unidimenL sionale 0 < x < L `e soggetta alla perturbazione V (x) = V0 cos( πx L )θ( 2 − x). Calcolare la correzione di primo ordine ai livello n = 1 e n = 2. ` noto che Soluzione 31. E ψn (x) =
nπx 2 sin( ); L L
L2 π nπx 2 πx 0 En = 2V ) = 2Vπ0 02 dt sin(nt)2 cos(t). Per n = 1 viene L 0 dx sin( L ) cos( L π 8V0 0 2 d(t) sin(t)2 cos3 (t). Integrando in d sin(t) E1 = 2V 3π e per n = 2 E2 = π 0 1 0 si trova = 8 Vπ0 0 dx(x2 − x4 ) = 16V 15π . 14.1.2 Caso degenere (0)
Cerchiamo la soluzione della (14.2), cio`e (E − Ek )ck = λ (0) caso di un livello imperturbato En degenere g volte; sia
m
Vkm cm , nel
226
14 Teoria delle perturbazioni indipendenti dal tempo {^°)},
u=
l,...,g
una base di funzioni imperturbate di energia En . All'ordine 0, resta
(£#>>-Jif)c f c =0. che dice che Ck = 0 se En' ^ E^'. Quindi un V piccolo rispetto alia distanza dagli altri livelli produce un mescolamento piccolo con le altre autofunzioni, ma puo avere effetti qualitativi nel sottospazio En e risolvere la degenerazione, del tutto o in parte. Per calcolare le correzioni di primo ordine En, il mescolamento con le altre autofunzioni con E^ ^ En si trascura del tutto. Nello spazio degenere H e della forma: H^ = En^5^ + V^, ^u=l...g; per diagonalizzarla, basta diagonalizzare V. Si pone E = E% + En e si ottiene per le ampiezze degli stati degeneri il sistema secolare
v
Gli autovettori forniscono le autofunzioni dell'approssimazione zero per i livelli che emergono dalla rottura della degenerazione; queste sono combinazioni lineari delle ipl \ Gli altri livelli intervengono nella teoria solo a part ire dal secondo ordine. Di solito e importante andare al secondo ordine solo nei casi in cui non c'e scissione della degenerazione al primo. Problema 32. Riprendiamo (dalla Sezione 10.2.5) il rotatore rigido piano, L2
di momento di inerzia / ed hamiltoniano H = ^f. Le autofunzioni sono ipkid) =
§L
IK=
con
autovalori k = 0, e k = ±mh, m = 1,2, — Gli autovalori 2 k2
dell'energia Ek = ft fj sono tutti due volte degeneri eccetto il piu basso k = 0. Si chiede di studiare l'effetto di una perturbazione direzionale y = 27rA(5(0-0 o ), dove A, 0o sono delle cost ant i. Soluzione 32. II livello fondamentale k = 0 viene spostato al primo ordine di A. Per i livelli eccitati, (m\V\m) = A / Jo (m) = A / Jo
#e-im^(0 - 0o)e^ =A
deimH{4> - 4>Q)eim* = \e2im*°
14.1 Introduzione
227
e la matrice della perturbazione sullo spazio di funzioni ψ−m , ψm , m > 0 `e λ λe2imφ0 V = . λe−2imφ0 λ Gli autovalori danno le correzioni all’energia al primo ordine. imφ −e 0 1 1 della L’autovalore E = 0 corrisponde all’autovettore √2 e−imφ0 matrice V , ovvero a e−imφ0 sin [m(φ − φ0 )] eimφ0 √ ψ− = − √ φ−m + √ φm = i π 2 2 che non sente la perturbazione.
eimφ0 L’autovalore E = 2λ corrisponde all’autovettore della mae−imφ0 0 )] √ trice V , ovvero a ψ+ = cos[m(φ−φ . (La soluzione `e pi` u veloce se uno vede che π o essere eliminato φ0 `e solo uno spostamento dell’origine degli angoli, quindi pu` e rimesso a posto alla fine dei calcoli.) √1 2
1
Problema 33. Descrivere l’effetto Stark-Lo Surdo per l’atomo di H con n=2 (l’atomo di H in un campo elettrico uniforme E). Soluzione 33. La perturbazione V = ezE in questo caso agisce al primo ordine (effetto Stark lineare). Le funzioni d’onda ψnlm = Rnl Ylm (θ, φ) coinvolte sono: ⎧ 3 − r ψ200 R20 (r) = 2( 2a10 ) 2 (1 − 2ar 0 )e 2a0 Y00 = √14π , ⎪ ⎪ / ⎪ r ⎪ ⎪ 3 ⎨ ψ210 R21 (r) = √1 ( 2a1 ) 32 ar e− 2a0 Y = 10 4π cos(θ), 0 0 3 / r 1 1 3 r − 3 ⎪ Y11 = − 8π sin(θ)eiφ , ⎪ ψ211 R21 (r) = √3 ( 2a0 ) 2 a0 e 2a0 ⎪ / ⎪ ⎪ r 3 ⎩ 3 Y1−1 = − 8π sin(θ)e−iφ . ψ21−1 R21 (r) = √13 ( 2a10 ) 2 ar0 e− 2a0 Dobbiamo costruire la matrice della perturbazione su questa base. Poich´e V `e dispari, non ci sono elementi diagonali. Poich´e V non dipende da φ gli elementi di matrice fra funzioni con m diversi sono nulli. Si mescolano ψ200 con ψ210 e la matrice da diagonalizzare in effetti `e 2 × 2. Usando cos(θ) = zr si trova ψ200 |V |ψ210 = 3ea0 E e viene
'
(1)
E− = 3ea0 E (1)
E+ = −3ea0 E
ψ200√ −ψ210 2 ψ200√ +ψ210 2
Il livello degenere si divide in 3, con m = ±1 imperturbato e m = 0 sdoppiato.
228
14 Teoria delle perturbazioni indipendenti dal tempo
14.2 Perturbazioni dipendenti dal tempo Le transizioni fra stati quantici avvengono sotto l’effetto di una perturbazione esterna dipendente dal tempo. Questa sezione sta alla base della teoria di tutte le spettroscopie. Si voglia risolvere ∂ψ = H0 + Vˆ (t) ψ (14.7) i¯ h ∂t conoscendo il set completo e ortonormale di soluzioni del problema imperturbato ∂φn = H0 φn (t); i¯ h ∂t come sappiamo, −in t φn (t) = φn (0) exp( .) h ¯ Per fissare le idee, supponiamo che il sistema sia descritto da H0 e si trovi sull’autostato φn ma poi sotto l’azione della debole perturbazione Vˆ (t) possa transire ad altri stati imperturbati.1 Per prima cosa, mettiamoci nella base imperturbata con ψ= ak (t)φk (t); k
sostituendo nella (14.7) e semplificando troviamo i¯ h a˙ k (t)φk (t) = ak (t)Vˆ φk (t). k
k
Moltiplichiamo scalarmente per φm (t): si trova Vmk (t)ak (t), i¯ ha˙ m =
(14.8)
k
dove Vmk (t) = φm (t)|Vˆ (t)|φk (t) = φm (0)|Vˆ (t)|φk (0)eiωmk t , h ¯ ωmk = m − k .
(14.9)
Notare la doppia dipendenza temporale di Vmk (t); oltre alla dipendenza dal tempo dell’operatore c’`e il fattore di fase. Date le condizioni iniziali, possiamo calcolare esattamente l’evoluzione in presenza di Vˆ . Abbiamo riscritto il problema nella base imperturbata, e di solito il sistema parte con la condizione iniziale ψ(0) = φn (0) =⇒ ak (0) = δkn ;
(14.10)
cos`ı possiamo calcolare la probabilit`a di possibili transizioni da n ad altri stati. Per sottolineare la condizione iniziale, 1
P.A.M. Dirac, 1926
14.2 Perturbazioni dipendenti dal tempo
229
indicheremo le ampiezze con an→m . Data la (14.9), se ωkn > 0 questa `e l’ampiezza della promozione del sistema ad un livello m pi` u alto, e se ωmn < 0 quella del decadimento ad uno pi` u basso sotto l’effetto della perturbazione. L’energia del sistema non si conserva, dato che l’hamiltoniano dipende dal tempo. Finora non abbiamo fatto approssimazioni, ma di solito la soluzione esatta `e onerosa in modo proibitivo. Se la perturbazione `e piccola, in un senso che poi preciseremo, in prima approssimazione possiamo sostituire al secondo membro della (14.8) la condizione iniziale (14.10) ψ(t) ∼ φn (t), ovvero ak (0) ∼ δkn . Si ottiene d i¯ h an→m (t) = Vmn (t), dt la cui soluzione `e della forma i t Vmn (τ )dτ, (14.11) an→m (t) = − h ¯ con gli estremi di integrazione precisi che dipenderanno dalle condizioni iniziali. Ad esempio se Vˆ `e acceso al tempo 0 e spento al tempo T , per t > T T scriveremo 0 , etc.. Problema 34. Una particella si trova confinata fra x = 0 e x = a (buca di potenziale unidimensionale a pareti infinite). Al tempo t = 0, la particella `e nello stato fondamentale. a. Calcolare al primo ordine la probabilit`a di transizione Pm allo stato eccitato m sotto l’azione del il potenziale V (t) = λδ(x − a2 )θ(t)θ(T − t). b. Stabilire il criterio di validit` a della approssimazione. c. Come deve essere scelto T per massimizzare la probabilit`a di transire al secondo livello eccitato? / Soluzione 34. Usando le autofunzioni (9.1) ψn (x) = a2 sin nπ xa troviamo πx a 2λ mπx ) sin( )δ(x − ) eiωm1 τ , Vm1 (t) = dx sin( a a a 2 con h ¯ π 2 (m2 − 1) ωm1 = . 2ma2 T Quindi, Pm = | h¯2λa sin(mπ/2) 0 eiωm1 τ dτ |2 . Inoltre Pm 1. T iω τ 2 m1 T ) , la condizione `e cos(ω31 T ) = −1 cio`e Poich´e| 0 e m1 dτ | = 2 1−cos(ω 2 ωm1 ω31 T = π, 3π, 5π, · · · Problema 35. Un oscillatore armonico di pulsazione ω al tempo t = 0 `e nello stato fondamentale. Calcolare al primo ordine la probabilit`a di transizione a stati eccitati per t > T sotto l’azione della perturbazione istantanea V (t) = (a + a† )V0 T δ(T − t). ` possibile transire solo a primo stato eccitato, con probabilit`a Soluzione 35. E V0 T 2 | h¯ | .
230
14 Teoria delle perturbazioni indipendenti dal tempo
Perturbazioni periodiche: regola d’oro di Fermi Un caso particolarmente importante `e quello di una perturbazione periodica, ˆ eiωt + e−iωt , ω > 0. Vˆ (t) = W Ad esempio, l’interazione col campo elettromagnetico `e data dal minimal coupling (2.48) e le transizione elettromagnetiche sono indotte da una perturba→ −2 zione (trascurando il piccolo termine in A ) − → → − − ˆ =→ W A ·− p = A (0) · → p eiωt + c.c. Usiamo la (14.11 con estremi di integrazione da −∞ a ∞ perch´e l’integrando `e una funzione periodica. Viene iWmn ∞ i(ωmn +ω)τ e an→m (t) = − + ei(ωmn −ω)τ dτ. h ¯ −∞ ∞ Ora, questo si calcola ricordando la nota identit` a −∞ eimx = 2πδ(x). Cos`ı viene an→m ≡ am (t → ∞)
iWmn ? 2π [δ (ωmn + ω) + δ (ωmn − ω)] . − = h ¯
Se ωmn < 0 (emissione) contribuisce solo il primo termine, se ωmn > 0 (assorbimento) solo il secondo. Si ottengono cos`ı righe infinitamente strette con la condizione di risonanza ±ωmn = ω per l’assorbimento o emissione della radiazione. Tuttavia questi risultati non sono accettabili per il fatto increscioso che δ(x)2 `e una espressione priva di senso; non possiamo calcolare la probabilit`a di transizione Pn→m = a∗n→m an→m . Dov’`e l’errore? In effetti non si tratta di un banale errore, ma di una schematizzazione troppo rozza. Una eccitazione perfettamente monocromatica deve durare per un tempo T → ∞ ed `e irrealizzabile fisicamente. Sovente nei problemi fisici si risolvono delle difficolt` a sostituendo infiniti con quantit` a grandi e zeri con quantit` a piccole. Anche in questo caso per uscire dalla difficolt`a basta introdurre la durata T finita dell’esperimento. Per l’assorbimento di un treno d’onde che dura un tempo T troviamo iWmn T i(ωmn −ω)τ e dτ. an→m (t) = − h ¯ 0 e quindi Pn→m =
∗ iWmn h ¯
0
T
T iWmn e−i(ωmn −ω)τ1 dτ1 × − ei(ωmn −ω)τ2 dτ2 . h ¯ 0
T ixT Poich´e 0 eixτ dτ = e ix−1 , ora le righe hanno una larghezza finita ∼ T1 e non ci sono pi` u problemi. Tuttavia `e possibile anche trascurare la larghezza finita
14.2 Perturbazioni dipendenti dal tempo
231
delle righe semplificando cos`ı il risultato. Se T `e abbastanza lungo `e ragioneT ∞ vole approssimare uno dei due integrali con 0 ∼ −∞ , cio`e 2πδ (ωmn − ω); allora l’altro vale T . Quindi, Wmn 2 T × 2πδ (ωmn − ω) . Pn→m = h ¯ Si vede cos`ı che la probabilit` a cresce linearmente col tempo T che dura l’esperimento, con la conseguenza che prima o poi sar` a violata la condizione a superer`a 1. Infatti, ad essere ben di validit` a Pn→m 1 e poi la probabilit` definita `e la velocit`a di transizione (transition rate) Rn→m =
∂Pn→m ∂T
che `e quello che realmente si misura; includendo un fattore ¯h si trova la regola d’oro di Fermi 2 Rn→m =
1 |Wmn |2 2πδ (m − n − h ¯ ω) . h ¯
Problema 36. Sia H0 = σz ; Vˆ = λ(eiωt + e−iωt )σx ,
0 con ψ(0) = ( ); si 1
calcoli la rate R al primo ordine. Soluzione 36. R =
2πλ2 h ¯ δ(2
−h ¯ ω).
Regole di selezione idrogenoidi Un atomo idrogenoide pu` o assorbire un fotone promovendo l’elettrone ad un livello superiore o emettere energia quando l’elettrone scende ad un livello inferiore. La probabilit` a di transizione si calcola in approssimazione di dipolo supponendo uniforme il campo elettrico dell’onda elettromagnetica sulla scala delle dimensioni atomiche; questo appare ragionevole nel visibile o nel vicino ultravioletto essendo le lunghezze d’onda dell’ordine delle migliaia di ρA. Oc− corre calcolare gli elementi di matrice di → r = (x, y, z) fra le funzioni d’onda coinvolte. La transizione `e possibile se almeno una fra le ampiezze Ax = ψn l m |x|ψnlm , Ay = ψn l m |y|ψnlm , Az = ψn l m |z|ψnlm , `e diversa da 0. Poich´e il dipolo `e dispari questo richiede che gli orbitali abbiano parit` a opposta; poich´e l’armonica sferica Ylm (θ, φ) ha parit` a (−1)l que sto richiede che l e l abbiano parit` a opposta (regola di Laporte). Inoltre, valgono le regole di selezione m = m oppure m = m ± 1, l = l ± 1 . Per 2
Questa forma della regola d’oro di Fermi `e data ad esempio nel Landau-Lifshitz Mecanique Quantique $ 42, con una derivazione pi` u tradizionale.
232
14 Teoria delle perturbazioni indipendenti dal tempo
capirle, conviene ricordare che a meno di una costante di proporzionalit` a z ∼ Y10 (θ, φ), (x ± iy) ∼ Y1±1 (θ, φ). Le regole di selezione su m sono evidenti perch´e altrimenti l’integrale su φ si annulla. Pi` u in generale, uno pu` o usare il fatto che 3 2l + 1 ∗ l100|l 0l1mq|l m dΩYl m (θ, φ)Y1q (θ, φ)Ylm (θ, φ) = 4π 2l + 1 e le propriet`a dei coefficienti di Clebsh-Gordan. Il fotone assorbito o emesso si rivela una particella di spin 1.
15 Metodo variazionale
Finiamo, come abbiamo cominciato, con un principio variazionale. Sia φ una qualsiasi funzione d’onda di un arbitrario sistema quantistico, ad una o molte particelle, debitamente normalizzata con N =< φ|φ >= 1.
(15.1)
E =< φ|H|φ >
(15.2)
Il valor medio dell’energia non pu` o essere pi` u basso dell’energia 0 dello stato fondamentale; infatti, espandiamo la φ arbitraria sulla base degli autovettori ψn di H: |φ = |ψn ψn |φ. n
Dal momento che n ≥ 0 risulta che E= |ψn |φ|2 n ≥ 0 .
(15.3)
n
Quindi, lo stato fondamentale pu`o essere ricercato con un principio di minimo. Esempio: l’oscillatore armonico Per illustrare il metodo, prendiamo un caso in cui si conosce gi`a la soluzione; p2 determiniamo1 lo stato fondamentale dell’oscillatore armonico (H = 2m + 1 2 2 mω x ) fra le gaussiane normalizzate 2 2
φ(x) = Ae−bx , A = ( 1
∞ ∞
dx exp −αx2 =
π , α
∞ ∞
2b 1/4 ) . π
dxx2 exp −αx2 =
1 2
π . α3
234
15 Metodo variazionale
Viene φ|x2 |φ =
1 4b ,
2
d 2 2 φ| dx 2 |φ = φ|(−2b + 4b x )|φ = −b, e si trova:
E=
h ¯ 2 b mω 2 + , 2m 8b
dove il primo termine `e l’energia cinetica ed il secondo l’energia potenziale. h ¯2 mω 2 E(b) ha un solo minimo. dE a b = mω ¯ ω/2. db = 2m − 8b2 = 0 d` 2¯ h , E =h Si ottiene cos`ı la soluzione esatta, perch´e si era scelta la gaussiana. In genere si troveranno soluzioni approssimate.
15.1 Il principio variazionale L’energia (15.2) `e un funzionale quadratico2 di φ. Studiamo l’effetto su E di una variazione di φ; prendiamo la variazione infinitesima ma per il resto arbitraria come dipendenza dalle variabili. Per caratterizzare la variazione scriveremo φ → φ + αη dove η `e una funzione complessa arbitraria delle stesse variabili da cui dipende φ, mentre α → 0 `e un parametro complesso il cui modulo `e infinitesimo e la cui fase `e arbitraria. La variazione dell’energia E =< φ|H|φ > che consegue da φ → φ + αη , al primo ordine in α, `e δE = α∗ < η|H|φ > +α < φ|H|η > +O(α2 ), ma poich´e α `e piccolo, trascuriamo gli O(α2 ). La condizione che E sia stazionario rispetto alle variazioni di φ `e E stazionario ⇐⇒ {δE = 0, η arbitrario}.
(15.4)
Ma la condizione (15.4) `e troppo forte per essere interessante, dato che variazioni di φ che non conservino la normalizzazione sono inaccettabili; la variazione cambia la norma con δN = α∗ < η|φ > +α < φ|η > +O(α2 ). Quindi l’estremo deve essere condizionato, restringendo la ricerca alle sole funzioni di norma 1. La condizione si impone efficientemente col metodo di Lagrange della Sezione 16.2.1, scrivendo δ(E − λN ) = 0. Si noti che questa condizione di minimo vincolato si ottiene da quella di minimo non vincolato δE = δφ|H|φ = 0 sostituendo H con H − λ. In questo modo, |φ > dipende dal moltiplicatore λ , il cui valore `e infine fissato imponendo N =< φ(λ)|φ(λ) >= 1. 2
Un funzionale di φ `e un integrale definito che ha φ nell’integrando e pu` o essere pensato come una funzione di infinite variabili che sono i valori che φ prende nel campo di integrazione. Questo `e quadratico perch´e φ compare nel bra e nel ket.
15.1 Il principio variazionale
235
Una conveniente semplificazione Se variamo solo il bra, cio`e ridefiniamo δE e δN con δE = α∗ < η|H|φ >, δN = α∗ < η|φ >, non commettiamo alcun errore, perch´e la variazione del ket d`a una informazione ridondante. Otteniamo lo stesso principio variazionale con meno algebra. Quindi la regola `e: basta variare il bra. Applicando il metodo di Lagrange, si ha la condizione di estremo vincolato α∗ < η|H − λ|φ >= 0. Poich´e η `e arbitrario, occorre che sia (H − λ)|φ >= 0. Cos`ı la vera condizione `e l’equazione degli stati stazionari e λ coincide con l’autovalore E. Riassumendo, {Hφ = Eφ, < φ|φ >= 1} ⇔ {δ(E −λN ) = 0, λ = E} ⇔ {δ(E) = 0, N = 1}. ` un altro modo di scrivere l’equazione di Schr¨odinger. La meccanica classica E ha il suo principio variazionale; questa `e la controparte quantistica. Il principio variazionale vale per tutti gli autostati, ed il moltiplicatore di Lagrange `e l’autovalore dell’energia. Questa `e una riformulazione esatta della meccanica quantistica, e consente di comprendere meglio la struttura della teoria, dimostrare dei teoremi generali, e fare calcoli. Esempio Data la matrice hamiltoniana
⎛
−3 1 ⎜ 1 0 ⎜ H=⎜ ⎜ 1 0 ⎝ 1 0 1 0
⎞ 111 0 0 0⎟ ⎟ 0 0 0⎟ ⎟ 0 0 0⎠ 000
trovare con il metodo variazionale le autofunzioni della forma ⎛ ⎞ α ⎜β⎟ ⎜ ⎟ ⎟ ψ=⎜ ⎜β⎟. ⎝β⎠ β Poich´e la normalizzazione richiede N = ψ|ψ = α2 + 4β 2 = 1 mentre E = ψ|H|ψ = 8αβ − 3α2 , il principio richiede di estremizzare f (α, β) = E − λN. Si trova:
236
15 Metodo variazionale
⎧ ∂f ⎨ ∂α = 0 =⇒ 4β = (3 + λ)α ⎩ ∂f = 0 =⇒ α = λβ. ∂β La condizione di compatibilit` a λ(3 + λ) = 4 fornisce le radici λ = −4, λ = 1. Per λ = −4 da α = −4β si trova ⎞ ⎛ −4 ⎜ 1 ⎟ ⎟ 1 ⎜ 1 ⎟ ψ−4 = √ ⎜ ⎜ 20 ⎝ 1 ⎟ ⎠ 1 che `e l’autostato fondamentale esatto con autovalore ⎛ ⎞ = −4. 1 ⎜1⎟ ⎜ ⎟ ⎟ Per λ = 1 da α = β si trova ψ1 = √15 ⎜ ⎜ 1 ⎟ che `e l’autostato eccitato ⎝1⎠ 1 esatto con autovalore = 1.
15.2 Approssimazioni variazionali Come diceva il grande Richard Feynman, un fisico teorico per fare progresso deve capire un dato problema non in uno, ma in parecchi modi diversi. Il principio variazionale `e equivalente all’equazione di Schr¨odinger, ma oltre all’importanza teorica ha anche una grande utilit` a pratica, perch´e permette di generare approssimazioni in problemi altrimenti intrattabili. Uno pu` o scegliere delle funzioni di prova φ(x, {λ1 , λ2 , · · · λn }) dipendenti da un certo numero di parametri {λ1 , λ2 , · · · λn }. Si cerca il minimo dell’energia in funzione dei parametri. Se φ non `e gi` a normalizzata, la condizione di normalizzazione pu`o essere imposta con un moltiplicatore di Lagrange. Se la vera φ dello stato fondamentale appartiene alla classe di funzioni considerate, si ottiene la soluzione esatta. Se la vera φ dello stato fondamentale non appartiene alla classe di funzioni considerate, si ottiene un valore di E sempre pi` u alto del vero; l’approssimazione migliora allargando la classe di funzioni, cio`e aumentando il numero dei parametri. Tipicamente `e pi` u facile ottenere con questo metodo autovalori accurati che funzioni d’onda precise. Non esiste un criterio generale per la scelta delle funzioni di prova: una scelta felice `e molto importante, e dipende dall’intuito di chi la propone. Certe soluzioni sono giustamente celebri.3 3
Il metodo di Hartree-Fock per risolvere i problemi a molti elettroni `e un metodo variazionale in cui si impone come funzione d’onda un determinante di Slater. funzionid’onda atomiche sono state tabulate per un gran numero di atomi e ioni. La teoria di Bardeen, Cooper e Schrieffer della superconduttivit` a `e stata proposta inizialmente con una soluzione variazionale.
15.2 Approssimazioni variazionali
237
Anche gli stati eccitati corrispondono a estremi del funzionale. Per`o, dal punto di vista pratico, volendo approssimare gli stati eccitati con questo approccio si trovano severe limitazioni. Il problema `e che i veri autostati sono tutti ortogonali fra loro, ma la stessa propriet` a non `e garantita per le f che corrispondono ai punti stazionari in una classe limitata di funzioni. Non possiamo in alcun modo rinunciare all’ortogonalit` a, e non possiamo dare alcun significato fisico ad uno stato eccitato che non sia ortogonale a quello fondamentale. Se lo ortogonalizziamo, il principio variazionale non `e pi` u soddisfatto. Che possiamo fare? Dobbiamo in genere studiare gli stati eccitati con altri metodi. C’`e una eccezione molto importante: lo stato pi` u basso di ogni tipo di simmetria si pu` o sempre cercare col metodo variazionale. In un atomo, nel caso non-relativistico, gli stati sono etichettati con L, m (momento angolare e componente z); stati con momenti angolari diversi sono automaticamente ortogonali, cos`ı se la funzione con cui si approssima lo stato fondamentale di un atomo ha per esempio L = 0, e quella con cui cerchiamo il primo stato eccitato ha un L = 1 differente, possiamo usare il principio variazionale con la garanzia che i due stati verranno ortogonali. Il discorso si generalizza ad ogni tipo di simmetria , perch´e una simmetria `e un operatore X, unitario (cio`e XX † = 1, vedi Sezione 11.6), tale che [H, X]− = 0. Autostati di un operatore unitario X appartenenti ad autovalori diversi sono ortogonali. Infatti, se Xφ1 = eiα φ1 e Xφ2 = eiβ φ2 , (φ1 , φ2 ) = (φ1 , X † Xφ2 ) = ei(β−α) (φ1 , φ2 ) e, con α = β, questo richiede (φ1 , φ2 ) = 0. Problema 37. Per l’oscillatore anarmonico quartico del Problema 29 trovare 2 la condizione variazionale per una fuzione di prova φ(x) = Ae−bx , A = ∞ 1/4 ( 2b usando l’identit` a −∞ dxx4 exp(−αx2 ) = 34 απ5 . π) Soluzione 37. E =
h ¯2b 2m
+
mω 2 8b
+
3α 16x40 b2
= minimo.
Parte III
Appendici
16 Richiamo di risultati utili di Analisi Matematica
16.1 Numeri complessi Definiamo i2 = −1, z = a + ib, con a e b reali, ed il complesso coniugato z ∗ = a − ib. Dalla formula di Eulero, eiα = cos(α) + i sin(α), α reale segue z = |z|eiϕ ,
√ dove |z| `e il modulo e ϕ ≡ arg(z) l’argomento. Inoltre, |z| a2 + b2 ,, mentre 1 ϕ = arctan( ab ) = 2i ln( zz∗ ). Inoltre, z n = |z|n eniϕ . Le n radici n-sime dell’unit`a possono scriversi √ 2π 2π n 1 = cos( k) + i sin( k), n n dove k corre sugli interi da 0 a n − 1.
16.2 Derivazione Derivata di una funzione inversa Sia ad esempio y(x) sin(x): la funzione inversa `e definita da xarcsin(y). Per evitare ambiguit`a dobbiamo fissare un intervallo di x in cui la y assume tutti i valori fra −1 e 1, e scegliamo − π2 < x < π2 ; in questo intervallo cos(x) > 0. Per dy 1 calcolare la derivata dell’arcoseno si usa dx = cos(x) che comporta dx dy = cos(x) . √ 1 2 Poich´e ora la variabile indipendente `e y scriveremo dx = √ 1 2. dy = 1−sin (x)
In questo modo si trovano le derivate delle funzioni inverse. differenziale totale ∂f ∂f ∂f dx + dy + dt, ∂x ∂y ∂t dove x, y, t sono variabili indipendenti. df (x, y, t) =
1−y
242
16 Richiamo di risultati utili di Analisi Matematica
Derivata di una funzione composta Si ha
∂f ∂f dx ∂f dy d f (x(t), y(t), t) = + + , dt ∂t ∂x dt ∂y dt
dove la variabile indipendente `e t. 16.2.1 Moltiplicatori di Lagrange Incontreremo in varie occasioni problemi isoperimetrici in cui si cercano estremi vincolati di funzioni o funzionali. Consideriamo per fissare le idee la condizione di stazionariet` a lungo una curva g(x, y) = C di una f (x, y) definita sul piano. Questo `e un tipico esempio di problema isoperimetrico (estremo → − condizionato). Gli estremi incondizionati sono dati da ∇f (x, y) = 0.
Fig. 16.1. I gradienti di f e di g sono paralleli nel punto di minimo vincolato
− Preso un punto → r appartenente alla curva ed uno spostamento infinitesimo → − → − − d r lungo la curva, ∇g(x, y) · d→ r = 0: tutta la famiglia di curve g(x, y) = C → − − a al gradiente di g, ed `e definita da ∇g(x, y) · d→ r = 0, cio`e dalla ortogonalit` un particolare C `e una costante di integrazione. La condizione di stazionariet`a della f lungo lo stesso spostamento infini→ − − − r = 0. Quindi i gradienti di f e g tesimo d→ r lungo la curva `e ∇f (x, y) · d→ → − devono essere paralleli, ∇ [f (x, y) − λg(x, y)] = 0. 16.2.2 Laplaciano Il Laplaciano in coordinate cartesiane vale ∂2V ∂2V ∂2V − ∇2 V (→ r)= + + . ∂x2 ∂y 2 ∂z 2
16.3 Integrazione
243
Quello in coordinate sferiche `e invece dato da 1 ∂V 1 ∂2V 1 ∂ 2 ∂V (r )+ 2 (sin(θ) )+ 2 2 . 2 r ∂r ∂r r sin(θ) ∂θ r sin (θ) ∂φ2
− ∇2 V (→ r)=
16.3 Integrazione 16.3.1 Integrazione per parti
b
dxf (x)g (x) = f (b)g(b) − f (a)g(a) −
a
Posto g(k, λ) =
∞ 0
b
dxf (x)g(x).
a
e
−λx2 k
x dx, con k intero, si trova che ⎧ 1.3.5...(k−1) ⎨ k+2
g(k, λ) =
⎩
2 2 (k−1) 1.3.5... 2 2λ
π λk+1
k+1 2
k pari, k dispari.
16.3.2 Derivata sotto il segno di integrale Se tutte le funzioni coinvolte sono abbastanza regolari, si ha d dx
β(x)
dtf (t, x) = f (β(x)) α(x)
dβ dα − f (α(x)) + dx dx
β(x)
dt α(x)
∂f (t, x) . ∂x
16.3.3 Formula di Stirling Per N 1, `e utile la formula di Stirling √ N ! = N (N − 1)(N − 2) · · · 2 ∼ N N e−N 2πN (il rapporto fra i due membri tende a 1 per N → ∞). A noi baster` a una versione pi` u semplice in cui la radice quadrata si trascura. Infatti, Ln(N !) =
N 1
N
Ln(n) ∼
Ln(x) = [x(Ln(x) − 1)] |N 1 = N LnN − N, 1
ed il rapporto fra i due membri tende a 1 al crescere di N . Per N grande il logaritmo della radice quadrata cresce senza limiti, ma diviene trascurabile rispetto a N LnN e ad N .
244
16 Richiamo di risultati utili di Analisi Matematica
16.3.4 Trasformate di Fourier La definizione che useremo `e
∞
F [f ] = f (ω) =
dtf (t)eiωt .
−∞
La convergenza dell’integrale nel senso elementare richiede che f (t), oltre ad essere abbastanza buona, vada a 0 abbastanza rapidamente a ±∞; funzioni buone da questo punto di vista sono quelle appartenenti a L2 , cio`e quelle a quadrato integrabile, per cui ∞ dt|f (t)|2 < ∞. −∞
Questo `e un caso che sar` a molto importante nel seguito. Il Teorema di Fourier dice che ∞ dω f (ω)e−iωt . f (t) = −∞ 2π Integrando per parti si trova che F [ df ı la trasformata di dt ] = −iωf (ω); cos` Fourier consente di riscrivere le eqauzioni differenziali a coefficienti costanti (vedi pi` u avanti) come equazioni algebriche, e pi` u in generale di eseguire trasformazioni che in certi casi possono essere utili per risolvere le equazioni.
16.4 Equazioni differenziali ordinarie lineari Sia data l’equazione differenziale (Dn + a1 (x)Dn−1 + · · · + an (x))y = f (x), dove D sta per l’operatore
d dx
(16.1)
e ai (x) sono funzioni note.
16.4.1 Equazioni differenziali ordinarie lineari omogenee Se f (x) = 0, l’equazione (16.3) si dice omogenea. La somma di due soluzioni (dette integrali particolari) y1 (x) e y2 (x) `e soluzione. La soluzione pi` u generale richiede la conoscenza di n soluzioni yj (x) linearmente indipendenti, tali cio`e che W (x) = 0, dove W (x) denota il determinante Wronskiano y1 (x) y2 (x) · · · yn (x) Dy1 (x) Dy2 (x) · · · Dyn (x) W (x) = . . .. .. .. .. . . . . Dn y1 (x) Dn y2 (x) · · · Dn yn (x)
16.4 Equazioni differenziali ordinarie lineari
245
Le n funzioni yj (x) costituiscono un sistema fondamentale di soluzioni. L’integrale generale `e allora della forma y(x) =
n
αj yj (x)
(16.2)
j
dove le αj sono costanti arbitrarie. Nel caso particolare in cui le ai sono costanti (equazioni differenziali ordinarie lineari omogenee a coefficienti costanti) si conosce l’integrale generale. Infatti la funzione yj (x) = eλx gode della propriet` a che Dyj (x)λyj (x). Allora `e chiaro che si hanno integrali particolari di questa forma. Sostituendo nella 16.3 con f=0 yj (x) = eλx , si vede che si tratta di un integrale particolare purch´e sia soddisfatta l’equazione algebrica (equazione caratteristica) (λn + a1 λn−1 + · · · + an )y = 0.
(16.3)
Questa equazione ha n radice complesse; se queste sono distinte, abbiamo trovato gli n integrali particolari linearmente indipendenti. Se vi sono radici multiple, l’insieme degli integrali particolari yj (x) = eλx ha meno di n elementi e non basta per formare l’integrale generale. Tuttavia si trova che le funzioni mancanti possono sempre essere prese della forma yj (x) = xq eλx , dove λ `e radice dell’equazione caratteristica e q `e un intero inferiore alla molteplicit` a di λ. 16.4.2 Equazioni differenziali ordinarie lineari non omogenee Nel caso f (x) = 0, sia y(x) un integrale particolare della (16.3); aggiungendo a y(x) una qualsiasi soluzione della omogenea associata (cio`e della stessa equazione con f = 0) si ottiene un’altra soluzione. Cos`ı l’integrale generale della (16.3) si ottiene aggiungendo all’integrale generale della omogenea associata un qualsiasi integrale particolare y(x). Lagrange ha inventato il metodo della variazione delle costanti arbitrarie che permette di trovare y(x). Il metodo prevede di determinare un sistema fondamentale di soluzioni yj (x) della omogenea associata e di scrivere l’integrale particolare cercato come la combinazione lineare n y(x) = ci (x)yi (x). (16.4) i
Introduciamo i vettori c(x) = (c1 (x), c2 (x), · · · , cn (x)) e F (x) = (0, 0, · · · , f (x)). Sostituendo la (16.4) nella (16.3) si trova la condizione W (x)
dc = F (x), dx
dove W `e il Wronskiano. Risolvendo con la regola di Cramer si trovano le derivate delle incognite ci (x), ed integrando si determina la soluzione (16.4).
17 Funzione di Green dell’equazione delle onde
Calcoliamo [∇2 −
1 ∂2 − ]G(→ r , t), c2 ∂t2
A tal fine usiamo nuovamente ∇2 φ(r) = 1 ∂2 r ∂r 2 δ(t
−
r c ),
ma per ogni f (t −
r c)
δ(t − rc ) − . G(→ r , t) = r 1 ∂2 r ∂r 2 (rφ(r)).
Per r = 0, ∇2
4
δ(t− rc ) r
5 =
vale l’identit` a
r 1 ∂2 r ∂2 f (t − ) 2 2 f (t − ). 2 ∂r c c ∂t c 4 5 4 5 δ(t− rc ) δ(t− rc ) ∂2 = c12 ∂t ,e Quindi ∇2 2 r r [∇2 −
1 ∂2 − ]G(→ r , t) = 0, r = 0. c2 ∂t2
∂2 → − Integriamo [∇2 − c12 ∂t 2 ]G( r , t) su una sfera S di raggio arbitrario R0 e centro nell’origine, con superficie δS.
Contributo del termine in ∇2 Applichiamo il teorema di Gauss: → − δ(t − rc ) δ(t − rc ) r 2 3 ∇ grad d r · dS r r r S δS Passiamo a coordinate sferiche ottenendo: → − δ(t − rc ) δ(t − rc ) r 2 3 ∇ grad R2 dΩ. d r= · r r r r=R0 0 S Ora,
∂ ∂x r
→ − = xr , e cos`ı grad r = rr e viene:
(17.1)
248
17 Funzione di Green dell’equazione delle onde
→ − 1 r r r r grad δ(t − ) − grad r δ (t − ) = − δ (t − ), c c c rc c si trova
→ − → − δ(t − rc ) r r r r − 2 δ (t − ) − 3 δ(t − ). r r c c r c Sostituiamo nella (17.1); l’integrale angolare d` a 4π e troviamo δ(t − rc ) R0 R0 R0 2 )+ δ (t − )}. ∇ d3 r − 4π{δ(t − r c c c S grad
Contributo del termine in 2
(17.2)
∂2 ∂t2
2
∂ r 1 ∂ r D’altra parte, sempre usando ∂r 2 δ(t − c ) c2 ∂t2 δ(t − c ), 1 ∂ 2 δ(t − rc ) 1 ∂2 4 r5 d3 r 2 2 d3 r δ t− 2 c ∂t r r ∂r c S
S
R0 1 ∂2 4 r5 . δ t − = 4π drr2 r ∂r2 c 0
Integrando per parti, viene 3 R0 r5 r5 ∂ ∂ 4 ∂ 4 4π δ t− dr r δ t− − . ∂r ∂r c ∂r c 0 Ma l’integrando `e una derivata, e si ottiene r=R0 4 r5 r5 ∂ 4 . −δ t− = 4π r δ t − ∂r c c r=0 Pertanto, - . 3 2 δ t − rc R0 R0 R0 3 1 ∂ 4π −δ t − δ t− d r 2 2 + + δ(t) . c ∂t r c c c S
(17.3) Il risultato In conclusione, mettendo insieme (17.2) e (17.3), 1 ∂2 − [∇2 − 2 2 ]G(→ r , t)d3 r = −4πδ(t) c ∂t S e quindi [∇2 − − Cos`ı G(→ r , t) =
δ(t− rc ) r
1 ∂2 − − ]G(→ r , t) = −4πδ(→ r )δ(t). c2 ∂t2
`e la funzione di Green dell’equazione delle onde.
18 Una verifica
Verifichiamo la (10.6): pmk xkn x √ √ √ 1 √ 0 = i¯ h √ (− kδm,k−1 + k + 1δm,k+1 ) √ ( nδk,n−1 + n + 1δk,n+1 ) x0 2√ 2 √ √ √ = i¯ h 21 − m + 1δm,k−1 + mδm,k+1 nδk,n−1 + n + 1δk,n+1 = i¯ h 21 − (m + 1)nδm,n−2 4 √ 5 + − (m + 1)(n + 1) + mn δm,n + m(n + 1)δm,n+2 . Invece, √ √ √ √ m + 1δm,k−1 + mδm,k+1 − nδk,n−1 + n + 1δk,n+1 = i¯ h 21 − (m + 1)nδm,n−2 4 √ 5 + (m + 1)(n + 1) − mn δm,n + m(n + 1)δm,n+2 .
xmk pkn =
1 2
Pertanto, ([ˆ p, x ˆ])mn ≡ (px − xp)mn ≡ pmk xkn − xmk pkn = −i¯ hδmn .
19 Trasformazioni a coordinate sferiche
Dimostriamo alcune relazioni presentate in (11.3.3). Ricordiamo la trasformazione da coordinate cartesiane a coordinate sferiche `e ⎧ ⎧ 2 2 2 ⎪ ⎨ x = r sin θ cos φ, ⎨r = x + y + z , z θ = arccos( √ 2 2 2 ), y = r sin θ sin φ, x +y +z ⎩ ⎪ ⎩ z = r cos θ, φ = arctan( yx ). Poniamo ora h ¯ = 1. ipx =
∂r ∂ ∂θ ∂ ∂φ ∂ ∂ = + + . ∂x ∂x ∂r ∂x ∂θ ∂x ∂φ
Allora, ∂r x = = sin(θ) cos(φ), ∂x r y ∂r = = sin(θ) sin(φ), ∂y r z ∂r = = cos(θ). ∂z r Usando
troviamo
1 d arccos(t) = − √ , dt 1 − t2 dθ 1 = −/ dx 1 − (√
z )2 x2 +y 2 +z 2
Ma
d dx
d dx
z x2
+
y2
+
z2
=
z x2 zx , r3
+ y2 + z 2
.
252
19 Trasformazioni a coordinate sferiche
−/ 1 − (√ e cos`ı
1 z )2 x2 +y 2 +z 2
dθ =− dx r2
r
=−
zx x2 + y 2
x2 + y 2
,
.
Esprimendo il risultato in coordinate sferiche, viene ∂θ cos(θ) cos(φ) = , ∂x r cos(θ) sin(φ) ∂θ = , ∂y r ∂θ sin(θ) =− . ∂z r Inoltre, usando d 1 arctan(t) = , dt 1 + t2 si trova ∂φ y sin(φ) =− 2 , =− ∂x x + y2 r sin(θ) ∂φ x cos(φ) = 2 , = ∂y x + y2 r sin(θ) ∂φ = 0. ∂z Quindi, il momento `e dato da ⎧ cos(φ) cos(θ) ∂ sin(φ) ∂ ∂ ⎪ ⎪ ipx = sin(θ) cos(φ) + − ⎪ ⎪ ∂r r ∂θ r sin(θ) ∂φ ⎪ ⎨ sin(φ) cos(θ) ∂ cos(φ) ∂ ∂ + + ipy = sin(θ) sin(φ) ⎪ ∂r r ∂θ r sin(θ) ∂φ ⎪ ⎪ ⎪ ⎪ ⎩ ipz = cos(θ) ∂ − sin(θ) ∂ . ∂r r ∂θ → − Calcoliamo le componenti di L : sin(θ) ∂ ∂ − Lx = ypz − zpy = r sin(θ) sin(φ)(−i) cos(θ) ∂r r ∂θ sin(φ) cos(θ) ∂ cos(φ) ∂ ∂ + + −r cos(θ)(−i) sin(θ) sin(φ) . ∂r r ∂θ r sin(θ) ∂φ I termini in
∂ ∂r
si cancellano come si poteva attendere e Lx = i(sin(φ)
∂ ∂ + cot(θ) cos(φ) ); ∂θ ∂φ
19 Trasformazioni a coordinate sferiche
253
analogamente, Ly = zpx − xpz = ∂ cos(φ) cos(θ) ∂ sin(φ) ∂ r cos(θ)(−i) sin(θ) cos(φ) + − ∂r r ∂θ r sin(θ) ∂φ sin(θ) ∂ ∂ − −r sin(θ) cos(φ)(−i) cos(θ) , ∂r r ∂θ cosicch´e Ly = i(− cos(φ)
∂ ∂ + cot(θ) sin(φ) ), ∂θ ∂φ
mentre, come gi`a sapevamo Lz = xpy − ypx = −i
∂ . ∂φ
Inoltre, L± ≡ Lx ± iLy = e±iφ [
∂ ∂ ± i cot(θ) ]. ∂θ ∂φ
→ −2 Calcoliamo L . ∂ ∂ ∂ ∂ − cot(θ) cos(φ) − cot(θ) cos(φ) L2x = − − sin(φ) − sin(φ) ; ∂θ ∂φ ∂θ ∂φ sviluppando, ∂ ∂ ∂ ∂ × sin(φ) + sin(φ) × cot(θ) cos(φ) ∂θ ∂θ ∂θ ∂φ ∂ ∂ ∂ ∂ × sin(φ) + cot(θ) cos(φ) × cot(θ) cos(φ) , + cot(θ) cos(φ) ∂φ ∂θ ∂φ ∂φ
−L2x = sin(φ)
ma questi × sono prodotti non commutativi, cio`e prodotti di operatori, quindi −L2x =
∂ ∂ ∂ ∂ ∂2 cot(θ) cos(φ) + cot(θ) sin(φ) cos(φ) + sin(φ) 2 ∂θ ∂θ ∂φ ∂θ ∂φ ∂ ∂ ∂ + cot(θ) cos(φ)2 + cot(θ) sin(φ) cos(φ) ∂θ ∂φ ∂θ
sin(φ)2
2
∂ ∂ + cot(θ)2 cos(φ) sin(φ) ∂φ + cot(θ)2 cos(φ)2 ∂φ 2.
In tal modo, −[L2x + L2y ] = Poich´e cot(θ)2 + 1 =
1 sin(θ)2 ,
2 ∂2 ∂ 2 ∂ + cot(θ) + cot(θ) . ∂θ2 ∂θ ∂φ2
254
19 Trasformazioni a coordinate sferiche
−L2 =
∂ 1 ∂2 1 ∂ sin(θ) + sin(θ) ∂θ ∂θ sin(θ)2 ∂φ2
Si riconosce cos`ı che la nota espressione del Laplaciano si pu`o scrivere ∂ 1 ∂ L2 ∇2 = 2 r2 − 2. r ∂r ∂r r
20 Sistema internazionale e sistema di Gauss
La forma (11) delle equazioni di Maxwell `e quella valida nel sistema di Gauss, che usa unit` a dei sistemi cgs elettrostatico ed elettromagnetico. Di conseguenza, nel sistema di Gauss il teorema della circuitazione si scrive 4πi , H · dl = c dove H `e il campo magnetico e i la corrente, e la legge di Faraday che esprima la forza elettromotrice in termini della derivata del flusso dell’induzione magnetica B `e 1 dΦ f =− . c dt Invece, nel Sistema Internazionale le equazioni di Maxwell nel vuoto sono → − → − ∇ · D = ρ, → − → − ∇ · B = 0, → − → − → − B, ∇ ∧ E = − ∂∂t
(20.1)
→ − → − → − − D +→ j, ∇ ∧ H = ∂∂t → − → − → − → − dove B = µ0 H , D = 0 E , c = √10 µ0 . La forza di Lorentz cambia anch’essa. Nel Sistema Internazionale questa `e → − → − − → − F = q[ E + → v ∧ B ], (20.2) ma nel sistema di Gauss si scrive → − v → − → − → − F = q[ E + ∧ B ]. c IL raggio di Bohr nel sistema di Gauss viene aB = 2
(20.3) h ¯2 me2 ,
mentre nel Sistema
η Internazionale aB = 0 πme eα= 2 . La costante di struttura fine `
e2 h ¯c
∼
1 137
nel
256
20 Sistema internazionale e sistema di Gauss 2
1 sistema di Gauss e diventa α = 2e0 hc ∼ 137 nel Sistema Internazionale. Nella Tabella 20.1 riportiamo le conversioni da un sistema all’altro.
Nome e simbolo Unit` a SI fattore Lunghezza l Metro m = 102 Massa m Kilogrammo Kg = 103 Forza F Newton = 105 Energia Joule = 107 Carica Coulomb = 3 · 109 Campo elettrico E Volt/m = 13 · 10−4 Induz. Magnetica B Tesla = 104 Flusso magn. Φ Weber = 108
Unita Gauss centimetri cm grammi g dine erg statcoulomb statvolt/cm Gauss Maxwell
Tabella 20.1. Conversione tra il sistema SI ed il sistema di Gauss
Indice
δ, 34 ampiezza di probabilit` a, 113 Angstr¨ om, 172 Angstrom, 52 armoniche sferiche, 168 aufbau, 206, 217 autofunzione, 119 autovettori, 149 Avogadro, 73 azione relativistica, 98 Balmer, 176 base, 148 Bell, 204 Berry , 199 Boltzmann, 50, 54, 61, 68, 75, 210, 213, 215 Bose, 205, 211, 214 bosoni, 205, 209 buco nero, 102 calcolatore quantistico, 219 calore specifico, 50, 52, 73, 214 cammini virtuali, 17 campo centrale, 206 capostazione, 79 Carnot, 46 catastrofe ultravioletta, 53, 74 celle, 69, 210, 211, 214 ciclo, 46, 54 Clausius, 46 coefficienti di Clebsch-Gordan, 194 collasso della funzione d’onda, 115, 184
colore, 52 commutatori, 114, 151, 156 complessioni, 61 completezza, 151 composizione delle velocit` a, 92 condensazione di Bose, 214 condizioni al contorno, 127 continuo, 126, 133 coordinate sferiche, 163, 165, 217, 251 corpo nero, 52, 74, 212 corrente, 94, 121, 128 costante di Planck, 105 Cramer, 133 criptografia quantistica, 197 cronotopo di Minkowski, 93 De Broglie, 108 decadimento dei nuclei, 136 decoherence, 220 Deutsch, 111, 220 deviazione standard, 116 Dialogo dei Massimi Sistemi, 77 diffrazione, 106, 108 Dirac, 33, 188, 214 distribuzione canonica, 66, 214 distribuzioni, 33 doppia fenditura, 110 dualismo onda-corpuscolo, 108 Dulong, 74, 214 effetto effetto effetto effetto
Auger, 136 Bohm-Aharonov, 110 Doppler, 96 Josephson, 137
258
Indice
effetto M¨ ossbauer, 97 effetto Stark - Lo Surdo, 227 effetto tunnel, 134 effetto Zeeman, 178 Einstein, 74, 77, 83, 101, 108, 117, 204, 211, 214 energia di Fermi, 217 energia di punto zero, 142 energia di riposo, 98 energia interna, 45, 55, 71 energia libera, 48 ensemble, 59 ensemble canonico, 65 ensemble grancanonico, 76 ensemble microcanonico, 60 entalpia, 48 entropia, 47, 50, 54, 62, 64, 71 equazione agli autovalori, 112 equazione di continuit` a, 121 equazione di Pauli, 189 equazione di Schr¨ odinger, 159 equazione per gli stati stazionari, 120 equazioni canoniche, 23 equazioni di Maxwell, 41, 255 equazioni lagrangiane, 12, 28 equilibrio, 45 equipartizione, 72 estremi fissi, 20 etere, 81 Eulero, 12, 241 fase, 94, 117, 127, 198 fattore giromagnetico, 181 Fermi, 205, 214, 215, 219, 230 FermiDirac, 214 fermioni, 205, 209 Feynman, 122, 220, 236 fondo di radiazione cosmica, 83 forza centrifuga, 100 forza di Lorentz, 27, 99, 190, 255 fotone, 128, 212 fotoni, 108 Fourier, 107, 151, 160, 244 funzione analitica, 33 funzione d’onda, 112, 147 funzione di distribuzione, 59 funzione di Fermi, 215 funzione di partizione, 67, 71, 213 funzione di stato, 48
funzione generatrice, 24 funzioni radiali, 177 Galileo, 7, 77, 100 gas di Fermi, 215 gas perfetto, 50, 68, 218 gatto di Schr¨ odinger, 116 Gerlach, 182 Gibbs, 49, 57, 59, 63, 209 Green, 42, 247 Hamilton, 21 hamiltoniana, 22, 152 hamiltoniano, 119 He, 206, 214 Heavyside, 33 Heisenberg, 109, 122 Hermite, 143 Hilbert, 193 insieme, 59 insieme canonico, 65 insieme grancanonico, 76 insieme microcanonico, 60, 215 interferenza, 148 interferometro, 81, 86 interpretazione di Copenhagen, 115 intervallo, 91, 93 ipersfera, 38, 63 ipersuperficie, 62 Jeans, 74 jellium, 218 kelvin, 46 Kepler, 172 Kirchhoff, 52 Lagrange, 10, 70, 210, 215, 235, 242 lagrangiana, 79, 98, 99 Laguerre, 177 Landau, 190 laplaciano, 242, 254 legame a ponte di Idrogeno, 136 Legendre, 20, 48 legge di Faraday, 255 Lienard, 43 Liouville, 60 livello di Fermi, 215 lunghezza propria, 84
Indice macchinista, 79 massa gravitazionale, 101 massa inerziale, 101 matrici, 149 Maxwell, 41, 49, 57, 68, 80, 106, 255 metalli, 216, 218 Michelson, 81, 86 microscopio a effetto tunnel, 138 minima azione, 18 minimal coupling, 29 modello LCAO, 158 momenti generalizzati, 14 momento angolare, 151, 159, 166, 185, 192 momento di inerzia, 16 momento magnetico, 181 Newton, 7, 79, 106 normalizzazione, 122, 127 numeri quantici, 148 numero quantico principale, 175 operatore di annichilazione, 144, 157 operatore di creazione, 144, 157 operatore energia, 119 operatore impulso, 112 operatore iperdifferenziale, 179 operatori, 113 operatori hermitiani, 149 operatori lineari, 149 oscillatore, 138 oscillatore anarmonico, 237 oscillatore anarmonico quartico, 224 oscillatore armonico, 157, 165 osservabili, 147 pacchetto, 128 Pancharatnam , 198 paradosso dei gemelli, 89 paradosso di Gibbs, 63 paradosso E.P.R., 204 particella libera, 126 particelle distinguibili, 69, 209 particelle indistinguibili, 209, 211 particelle ingarbugliate, 203 Pauli, 185, 187, 191, 205 Peierls, 199 perturbazione di livelli degeneri, 225
259
perturbazione di livelli non degeneri, 222 perturbazione dipendenti dal tempo, 228 perturbazioni periodiche, 230 Petit, 74, 214 pirometro, 54 Pisa, 7, 83, 100 Planck, 46, 53, 61, 75, 105, 212 Podolsky, 204 Poisson, 29, 151 potenziale centrifugo, 170 potenziale chimico, 211, 215 potere emissivo, 54 pressione, 72 primo principio, 45 principio di equivalenza, 100 principio di indeterminazione, 113, 153, 160 principio di relativit` a, 77 principio di Relativit` a Generale, 84, 101 principio di sovrapposizione, 112 principio variazionale, 19, 22, 233, 234 principio zero, 45 probabilit` a, 112, 209 probabilit` a di transizione, 229 problema ergodico, 59 quadriaccelerazione, 94 quadriimpulso, 98 quadrivelocit` a, 94 quadrivettore, 94 quanti, 53, 54 raggio di Bohr, 172, 217 raggio di Schwarzschild, 102 raggio di Wigner-Seitz, 217 Rayleigh, 74 reazione, 11 red shift, 101 regola d’oro, 230 regole di selezione, 231 relativit` a dei tempi, 86 relativit` a delle lunghezze, 86 reversibile, 46, 51 risonanze, 136 Rosen, 204 rotatore, 10, 16, 151, 152, 226 rotazione, 179
260
Indice
rotazioni di spin, 188 Rydberg, 218 scambio, 208, 218 Schr¨ odinger, 80, 109, 122, 147, 201, 236 Schwarz, 148 secondo principio, 46 separazione delle variabili, 163 set completo, 149, 158 simultaneit` a, 84 singoletto, 195, 204, 206 sistema di Gauss, 255 sistema internazionale, 255 sistemi inerziali, 78 Slater, 205 solido, 74, 214 Sommerfeld, 216, 218 spazi di Hilbert, 148 spazio, 61 spazio µ, 69 spazio delle fasi, 58, 66, 209, 211 spettro, 74 spin, 181 stati legati, 131 Stefan, 54, 213 Stern, 182 Stirling, 64, 70, 210 stirling, 243 temperatura, 46 temperatura canonica, 65 tempo proprio, 84
tensori, 94 teorema di Bohr-van Leeuwen, 105 termodinamica, 45 Terra, 83 terzo principio, 52 transistor a elettrone singolo, 137 trasformazione di Lorentz, 90 trasformazione puntuale, 18 trasformazioni canoniche, 24, 155 trasformazioni di gauge, 191 trasformazioni puntuali, 14 traslazione, 179 tripletto, 195, 206 trivettore, 99 unit` a atomiche, 217 valore di aspettazione, 116, 149 variabile indipendente, 21 variabili canonicamente coniugate, 23 variabili indipendenti, 13, 23, 25 velocit` a della luce, 81 velocit` a della Terra, 81 velocit` a di gruppo, 128 Wiechert, 43 Wien, 52 Zartmann, 57 Zeeman, 178 zero assoluto, 52, 215