A Nadine e Vanessa
Collana di Fisica e Astronomia
A cura di: Michele Cini Stefano Forte Massimo Inguscio Guida Montagna Oreste Nicrosini Franco Pacini Luca Peliti Alberto Rotondi
Egidio Landi Degl’Innocenti
Spettroscopia atomica e processi radiativi
123
EGIDIO LANDI DEGL’INNOCENTI Dipartimento di Astronomia e Scienza dello Spazio Università degli Studi di Firenze
Springer-Verlag fa parte di Springer Science+Business Media springer.com © Springer-Verlag Italia, Milano 2009 ISBN 978-88-470-1158-8
e-ISBN 978-88-470-1159-5
Quest’opera è protetta dalla legge sul diritto d’autore, e la sua riproduzione è ammessa solo ed esclusivamente nei limiti stabiliti dalla stessa. Le fotocopie per uso personale possono essere effettuate nei limiti del 15% di ciascun volume dietro pagamento alla SIAE del compenso previsto. Le riproduzioni per uso non personale e/o oltre il limite del 15% potranno avvenire solo a seguito di specifica autorizzazione rilasciata da AIDRO, Via Corso di Porta Romana n. 108, Milano 20122, e-mail
[email protected] e sito web www.aidro.org. Tutti i diritti, in particolare quelli relativi alla traduzione, alla ristampa, all’utilizzo di illustrazioni e tabelle, alla citazione orale, alla trasmissione radiofonica o televisiva, alla registrazione su microfilm o in database, o alla riproduzione in qualsiasi altra forma (stampata o elettronica) rimangono riservati anche nel caso di utilizzo parziale. La violazione delle norme comporta le sanzioni previste dalla legge.
Riprodotto da copia camera-ready fornita dall’Autore Progetto grafico della copertina: Simona Colombo, Milano In copertina: immagine adattata dall’originale di N.A. Sharp, NOAO/AURA/NSF Stampa: Grafiche Porpora, Segrate, Milano Stampato in Italia Springer-Verlag Italia s.r.l., Via Decembrio, 28 - 20137 Milano
Prefazione Questo libro raccoglie le dispense del corso da me tenuto ininterrottamente, per pi` u di 25 anni, presso il Corso di Laurea in Fisica (poi divenuto Corso di Laurea Magistrale in Scienze Fisiche e Astrofisiche) dell’Universit` a di Firenze. Col passare degli anni le dispense, inizialmente manoscritte, si sono notevolmente ampliate mano a mano che il programma del corso `e cambiato per rivolgersi ad argomenti diversi, come richiesto, anno per anno, dalla programmazione didattica del Corso di Studi. Negli ultimi anni, grazie a un notevole sforzo di revisione e di aggiustamento, le dispense hanno finalmente assunto la veste editoriale adeguata che si trova adesso sotto gli occhi del lettore. Il corso, inizialmente denominato “Spettroscopia” e in seguito, a partire dal 1997, “Spettroscopia Astronomica”, `e attualmente rivolto agli studenti del curriculum Astrofisico del Corso di Laurea suddetto sebbene, nel corso del tempo, abbia ricevuto anche l’attenzione di studenti appartenenti ad altri curricula, in particolare quelli di Fisica dello Stato Solido interessati alla spettroscopia atomica. Gli argomenti trattati sono molteplici e l’intero volume contiene materiale sufficiente per almeno due corsi annuali (di secondo livello o di Dottorato). Selezionando opportunamente gli argomenti, `e possibile sviluppare un certo numero di percorsi didattici diversi. Ad esempio, volendo sviluppare un corso del tipo “Complementi di Elettromagnetismo e Termodinamica”, ci si potrebbe limitare a trattare gli argomenti contenuti nei Cap. 1, 2, 3 e 10, per un corso di “Spettroscopia Atomica Elementare” sarebbero sufficienti i Cap. 1, 2 e 6, mentre per un corso pi` u approfondito di “Spettroscopia Atomica” si potrebbero aggiungere anche i Cap. 4, 5, 7, e 9. Altre possibilit` a potrebbero riguardare corsi del tipo “Processi Radiativi”, “Spettroscopia Astronomica” oppure “Applicazioni di Elettrodinamica Quantistica”, adattando il programma a seconda dei casi. Lo schema mostrato nella figura di pagina seguente illustra la relazione logica fra i diversi capitoli e pu` o facilitare nella scelta del percorso didattico voluto. Ad esempio, la comprensione degli argomenti contenuti nel Cap. 15 (processi del secondo ordine) implica la conoscenza di quelli contenuti nel Cap. 3 (in cui si trattano i pi` u semplici di tali processi nell’ambito della fisica classica), nel Cap. 5 (in cui si introduce l’equazione relativistica di Dirac) e nel Cap. 11 (dedicato all’interazione materia-radiazione). I capitoli per cos`ı dire “introduttivi”, ovvero i Cap. 1, 5, 6 e 10 richiedono quelle conoscenze di base di elettromagnetismo, meccanica quantistica, relativit` a speciale e termodinamica statistica che sono normalmente acquisite a livello di Laurea Triennale. Ai lettori che si sentissero meno preparati su tali argomenti, questo libro offre la possibilit`a di approfondire il loro bagaglio culturale per mezzo di applicazioni fisiche di-
viii
PREFAZIONE
1
2
4
6
5
11
7
13
9
10
3
8
12
14
15
Lo schema illustra le relazioni logiche esistenti fra i vari capitoli del libro.
rette che possono contribuire a rendere meno aridi gli argomenti stessi, spesso trattati a livello notevolmente formale. Le Appendici costituiscono una parte non trascurabile di questo libro. Alcune di esse sono dedicate a sviluppare importanti risultati che emergono come complementi naturali degli argomenti trattati nel testo. Altre sono invece rivolte a introdurre in maniera assiomatica il formalismo utilizzato nel testo stesso. Per finire, intendo ringraziare i docenti del Corso di Laurea in Fisica fiorentino degli anni 1960 che mi hanno insegnato come il cammino maestro della Fisica passi sempre per l’interpretazione quantitativa dei fenomeni empirici senza eccessive indulgenze nei riguardi del formalismo. In particolare i miei ringraziamenti vanno ai defunti Prof. Manlio Mand` o e Simone Franchetti e ai Prof. Marco Ademollo e Giuliano Toraldo di Francia. Un sentito ringraziamento anche alle generazioni di studenti che si sono succeduti negli anni e che, con le loro illuminanti domande e richieste di chiarimento, hanno contribuito in maniera determinante alla presente stesura di questo libro. Arcetri, 26 Gennaio 2009
Egidio Landi Degl’Innocenti
Indice
1. LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO 1.1 Le equazioni di Maxwell 1 1.2 Energia trasportata dal campo elettromagnetico 2 1.3 Quantit` a di moto trasportata dal campo elettromagnetico 3 1.4 Potenziali elettromagnetici 5 1.5 Invarianza di gauge (di calibro) 6 1.6 Soluzione delle equazioni di Maxwell nel vuoto 8 1.7 Pressione della radiazione 12 1.8 Onde piane sinusoidali 14 2. SPETTRO E POLARIZZAZIONE 2.1 Spettro della radiazione 2.2 Spettri particolari di alcune forme d’impulso 2.3 Spettri di segnali stocastici e di segnali periodici 2.4 Spettroscopio a reticolo di diffrazione 2.5 Polarizzazione di un’onda monocromatica 2.6 Misure spettropolarimetriche 2.7 Propriet` a dei parametri di Stokes
17 22 24 29 35 39 44
3. RADIAZIONE DI CARICHE ELETTRICHE IN MOTO 3.1 Potenziali elettromagnetici dovuti a cariche e correnti 3.2 I potenziali di Li´enard e Wiechart 3.3 Campo elettromagnetico di una carica in moto 3.4 Irraggiamento di una carica in moto 3.5 La diffusione Thomson 3.6 La diffusione Rayleigh 3.7 La radiazione di frenamento 3.8 La radiazione di ciclotrone 3.9 La radiazione di sincrotrone 3.10 Sviluppo multipolare nella zona di radiazione 3.11 Diagramma di radiazione per le componenti multipolari
49 55 58 63 68 71 72 79 81 87 92
4. QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO 4.1 Oscillatore armonico, operatori di creazione e distruzione 97 4.2 Sviluppo del campo elettromagnetico in serie di Fourier 101 4.3 Passaggio alla quantizzazione 104 4.4 Intensit`a e fotoni 109
x
INDICE
5. EQUAZIONI D’ONDA RELATIVISTICHE 5.1 Equazione di Dirac per la particella libera 5.2 Equazione di Dirac per l’elettrone in un campo elettromagnetico 5.3 Limite non relativistico dell’equazione di Dirac 5.4 Limite all’ordine zero. Equazione di Pauli 5.5 Limite al primo ordine 5.6 L’equazione di Dirac descrive una particella di spin 21 5.7 Soluzione dell’equazione di Dirac in un campo magnetico
113 119 121 123 126 129 132
6. ATOMI CON UN SOLO ELETTRONE DI VALENZA 6.1 Atomo di Idrogeno, teoria di Bohr 6.2 L’equazione di Schr¨ odinger in coordinate sferiche 6.3 Atomo di Idrogeno, teoria quantistica 6.4 Atomo di Idrogeno, correzioni relativistiche 6.5 Spettri dei metalli alcalini
137 145 153 159 165
` ELETTRONI DI VALENZA 7. ATOMI CON PIU 7.1 Il principio di esclusione di Pauli 7.2 L’Hamiltoniana non relativistica: buoni numeri quantici 7.3 L’approssimazione del campo centrale 7.4 Il metodo di Thomas-Fermi 7.5 Il metodo variazionale e il metodo di Hartree-Fock 7.6 Configurazioni 7.7 Il principio di formazione del sistema periodico 7.8 Configurazioni di elettroni eccitati 7.9 Richiami della teoria del momento angolare 7.10 Termini provenienti da configurazioni assegnate 7.11 Le autofunzioni dell’Hamiltoniana non relativistica 7.12 L’atomo di Elio 7.13 L’atomo di Carbonio
171 175 178 179 183 188 191 195 196 204 212 214 218
8. ENERGIE DEI TERMINI 8.1 La regola della traccia 8.2 Calcolo di elementi di matrice diagonali 8.3 Elementi di matrice di particella singola 8.4 Elementi di matrice dell’interazione Coulombiana 8.5 Somme su sottozone chiuse 8.6 Struttura dei termini
221 224 229 230 233 236
9. MAGGIORI DETTAGLI SUGLI SPETTRI 9.1 L’interazione spin-orbita 9.2 Il teorema di Wigner-Eckart e il teorema della proiezione
239 242
INDICE
9.3 9.4 9.5 9.6 9.7 9.8 9.9
La regola degli intervalli di Land´e L’accoppiamento j-j e l’accoppiamento intermedio L’effetto Zeeman classico L’effetto Zeeman quantistico L’effetto Paschen-Back La struttura iperfine, effetto isotopico La struttura iperfine, effetto di spin nucleare
xi 246 252 255 257 263 266 270
10. LEGGI DI EQUILIBRIO TERMODINAMICO 10.1 I principi della statistica 10.2 La distribuzione Maxwelliana delle velocit`a 10.3 La legge di Saha-Boltzmann 10.4 La radiazione di corpo nero 10.5 Propriet` a della radiazione di corpo nero 10.6 La statistica di Fermi-Dirac 10.7 La statistica di Bose-Einstein
273 277 279 285 291 295 297
11. INTERAZIONE FRA MATERIA E RADIAZIONE 11.1 L’Hamiltoniana d’interazione 11.2 Le equazioni cinetiche 11.3 La regola aurea di Fermi 11.4 L’elemento di matrice 11.5 Processi elementari 11.6 Le equazioni dell’equilibrio statistico 11.7 I coefficienti di Einstein 11.8 L’equazione del trasporto radiativo 11.9 I coefficienti di assorbimento e di emissione 11.10 Profilo del coefficiente di emissione
301 303 307 309 312 319 322 324 326 330
12. REGOLE DI SELEZIONE E FORZE DELLE RIGHE 12.1 Regole di selezione sui numeri quantici 12.2 Regole di selezione sulle configurazioni 12.3 Transizioni proibite 12.4 Transizioni semiproibite 12.5 Righe proibite in oggetti astronomici 12.6 Forze relative entro multipletti in accoppiamento L-S
337 339 342 344 345 349
13. PLASMI IN CONDIZIONI DI NON-EQUILIBRIO 13.1 La temperatura cinetica degli elettroni 13.2 Collisioni elettrone-atomo 13.3 Le relazioni di Milne-Einstein 13.4 L’atomo a due livelli in condizioni di non-equilibrio
355 357 359 360
xii
INDICE
14. TRASPORTO RADIATIVO 14.1 Soluzione formale dell’equazione del trasporto radiativo 14.2 Trasporto radiativo nelle atmosfere stellari 14.3 Il modello di atmosfera grigia 14.4 L’equazione di Hopf 14.5 Modelli realistici di atmosfere stellari 14.6 Lo spettro continuo 14.7 Righe spettrali in equilibrio termodinamico locale 14.8 Righe spettrali in condizioni di non equilibrio
363 366 370 375 376 378 382 385
15. PROCESSI DEL SECONDO ORDINE 15.1 Considerazioni introduttive 15.2 La diffusione Thomson (teoria quantistica) 15.3 La diffusione Rayleigh quantistica e la diffusione Raman 15.4 La diffusione Compton: aspetti cinematici 15.5 La diffusione Compton: aspetti dinamici 15.6 L’equazione di Klein-Nishina 15.7 La sezione d’urto totale della diffusione Compton 15.8 Propriet` a di polarizzazione della diffusione Compton 15.9 Scambio di energia fra fotoni ed elettroni 15.10 L’effetto Compton inverso
389 393 398 400 403 410 418 419 422 424
APPENDICI A.1 Unit`a di misura dell’elettromagnetismo A.2 Algebra tensoriale A.3 La funzione delta di Dirac A.4 Le leggi dell’elettromagnetismo ritrovate A.5 L’equazione di Larmor nel caso relativistico A.6 Irraggiamento di onde gravitazionali A.7 Calcolo dell’integrale di Thomas-Fermi A.8 Energia della configurazione normale dell’atomo di Silicio A.9 Calcolo della costante di struttura fine di un termine A.10 Il principio fondamentale della termodinamica statistica A.11 Probabilit` a di transizione per le coerenze A.12 Somme sui numeri quantici magnetici A.13 Calcolo di un elemento di matrice A.14 Invarianza di gauge nell’Elettrodinamica Quantistica A.15 Le matrici gamma e gli invarianti relativistici
427 435 442 444 447 451 454 455 457 459 462 465 468 469 471
COSTANTI FISICHE
481
INDICE ANALITICO
483
Capitolo 1
Leggi generali del campo elettromagnetico Le equazioni di Maxwell racchiudono i principali risultati sperimentali sull’elettricit`a e il magnetismo, ottenuti fra la fine del XVIII e la met`a del XIX secolo grazie al lavoro di ricerca di numerosi scienziati quali, fra gli altri, Coulomb, Volta, Ørsted, Amp`ere, Faraday e Gauss. Lo scopo di questo capitolo `e quello di riprendere tali equazioni e di svilupparne una serie di conseguenze particolarmente rilevanti per la comprensione dei fenomeni elettromagnetici. In particolare, vedremo come le equazioni di Maxwell implicano la possibilit` a di definire per il campo elettromagnetico due quantit` a fisiche fondamentali quali la densit` a di energia e la densit`a di quantit` a di moto (o di impulso). Vedremo anche come la soluzione delle equazioni di Maxwell possa essere notevolmente semplificata mediante l’introduzione di due potenziali, il potenziale scalare e il potenziale vettore, di cui studieremo le principali propriet` a. L’ultima parte del capitolo `e dedicata allo studio delle onde elettromagnetiche piane, una soluzione particolare delle equazioni di Maxwell nel vuoto.
1.1 Le equazioni di Maxwell Nel sistema di unit`a c.g.s. di Gauss, consistentemente utilizzato in tutto questo volume, le equazioni di Maxwell, che riassumono varie leggi empiriche relative ai fenomeni elettromagnetici, si scrivono nella forma 1 = 4πρ , divE
(1.1)
=0 , divB
(1.2)
4π 1 ∂E = j , (1.3) c ∂t c + 1 ∂B = 0 , (1.4) rotE c ∂t `e il campo elettrico e B `e il vettore induzione magnetica, ρ `e la densit` dove E a di carica e j `e la corrispondente densit` a di corrente. La prima equazione non − rotB
1
Il lettore che non sia familiare con il sistema di unit` a qui utilizzato pu` o trovare nell’App. 1 le relazioni che sussistono fra questo sistema e il Sistema Internazionale, pi` u appropriato per le applicazioni pratiche dell’elettromagnetismo piuttosto che per quelle teoriche.
2
CAPITOLO 1
`e altro che l’espressione differenziale della legge di Coulomb per le cariche elettriche, la seconda, talvolta detta legge di Gilbert, `e l’analoga espressione per le cosiddette cariche magnetiche, implementata dal fatto che non esistono monopoli magnetici, la terza `e l’espressione differenziale della legge di Amp`ere, cos`ı come modificata da Maxwell per tener conto della corrente di spostamento, e la quarta `e infine l’espressione differenziale della legge dell’induzione di Faraday. Nella forma qui scritta le equazioni sono del tutto generali, nel senso che esse valgono non solo nel vuoto ma anche in presenza di un mezzo materiale pur di introdurre, nella densit` a di carica ρ, anche le cariche di polarizzazione e, nella densit` a di corrente j, anche le correnti di magnetizzazione e quelle di polarizzazione. Pi` u precisamente, nei mezzi materiali si introducono, accanto ai e B, anche i vettori D e H, detti rispettivamente spostamento elettrico vettori E ` `e il vettore campo elettrico e campo magnetico. E necessario specificare che E misurato entro una cavit` a aghiforme diretta lungo la direzione del campo stesso `e il vettore (per evitare la formazione di cariche di polarizzazione), mentre B campo magnetico misurato entro una cavit`a di spessore infinitesimo disposta perpendicolarmente alle linee di forza (per evitare la formazione di correnti di magnetizzazione). C’`e da notare infine che le equazioni di Maxwell gi`a contengono l’equazione di continuit`a per la carica elettrica. Infatti, prendendo la divergenza dell’Eq. (1.3) e sostituendo l’Eq. (1.1), si ottiene −
4π ∂ρ 4π = divj , c ∂t c
ovvero, ∂ρ + divj = 0 , ∂t che `e l’equazione di continuit`a esprimente la conservazione della carica elettrica.
1.2 Energia trasportata dal campo elettromagnetico Consideriamo un sistema di cariche e correnti soggette esclusivamente a interazioni di carattere elettromagnetico. Se si indica con W l’energia meccanica per unit` a di volume, si ha, ricordando che le forze magnetiche non compiono lavoro, ∂W . = j · E ∂t Ricavando j dall’Eq. (1.3) si ottiene
LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO
3
∂W c − 1 E · ∂E , = E · rotB ∂t 4π 4π ∂t e sottraendo al secondo membro l’Eq. (1.4) moltiplicata scalarmente per il vettore cB/(4π), si ha ∂W c − c B · rotE − 1 E · ∂E − 1 B · ∂B . = E · rotB ∂t 4π 4π 4π ∂t 4π ∂t Ricordando infine l’identit` a vettoriale (si veda l’App. 2, Eq. (A2.4)) × B) =B · rotE −E · rotB , div(E si pu` o scrivere ∂ =0 , (W + u) + divS ∂t dove u=
1 (E 2 + B 2 ) , 8π
= c E ×B . S 4π
Questa equazione, detta teorema di Poynting, rappresenta un bilancio energetico e si interpreta dicendo che il campo elettromagnetico possiede un’energia per unit` a di volume data da u e che, inoltre, esso trasporta energia lungo la Il modulo di questo vettore d`a la densit` direzione individuata dal vettore S. a di flusso dell’energia, ovvero l’energia che fluisce, per unit` a di tempo, attraverso l’unit` a di superficie disposta normalmente alla direzione del vettore stesso. Il `e detto vettore di Poynting. vettore S
1.3 Quantit` a di moto trasportata dal campo elettromagnetico la quantit` Indichiamo con Q a di moto per unit` a di volume del medesimo sistema di cariche e correnti considerato nel paragrafo precedente. Tale quantit` a di moto varia nel tempo secondo l’equazione ∂Q + j × B , = ρE ∂t c dove il primo termine del secondo membro `e dovuto alla forza elettrica, mentre il secondo termine `e dovuto alla forza di Lorentz. Eliminando ρ e j attraverso le Eq. (1.1) e (1.3), si ha
4
CAPITOLO 1
∂Q 1 )×B − 1 ∂E × B , + 1 (rotB = E divE ∂t 4π 4π 4πc ∂t ovvero, ricordando la definizione del vettore di Poynting ∂Q 1 )×B − 1 ∂S + 1 E + 1 (rotB × ∂B . = E divE ∂t 4π 4π c2 ∂t 4πc ∂t Sostituiamo adesso il termine ∂ B/∂t attraverso l’Eq. (1.4) e ricordiamo che divB = 0 (Eq. (1.2)); si ottiene cos`ı la formula simmetrica
∂ ∂t
+ S Q c2
=
1 +B divB −E × rotE −B × rotB ) , (E divE 4π
e per mezzo dell’identit` a vettoriale div(a a ) −
1 grad(a2 ) = a diva − a × rota , 2
deducibile per mezzo delle Eq. (A2.8) e (A2.9) dell’App. 2, si ottiene ∂ S 1 E +B B ) − 1 grad(E 2 + B 2 ) . Q+ 2 = div(E ∂t c 4π 8π Introduciamo adesso il tensore T, detto tensore di Maxwell, definito dall’espressione T=
1 B ) − 1 (E 2 + B 2 ) U , (E E + B 4π 8π
dove U `e il tensore unitario (Uij = δij ). In componenti si ha Tij = Tji =
1 1 (Ei Ej + Bi Bj ) − (E 2 + B 2 ) δij . 4π 8π
Ricordando l’identit` a tensoriale (si veda l’Eq. (A2.10)) div(f T) = (gradf ) · T + f divT , (dove f `e uno scalare arbitrario e T un tensore arbitrario), e la relazione v · U = U · v = v , (dove v `e un vettore arbitrario), si ottiene infine 1 ∂ Q + 2 S = divT . ∂t c
LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO
5
Questa equazione rappresenta un bilancio di impulso. Essa si interpreta dicendo che il campo elettromagnetico possiede una quantit` a di moto per unit` a 2 . Inoltre, il campo elettromagnetico si comporta di volume data dal vettore S/c come un mezzo materiale elastico soggetto a deformazioni, nel cui interno, come `e noto, si sviluppano delle forze descritte dal cosiddetto tensore degli sforzi. La variazione nell’unit` a di tempo della quantit` a di moto contenuta entro un volume arbitrario `e uguale al flusso del tensore −T attraverso una superficie che racchiude il volume stesso. Se si considera una superficie infinitesima dS caratterizzata dal versore normale n, la quantit` a dF = −n · T dS rappresenta il flusso di quantit` a di moto attraverso il dS (definito positivamente se diretto lungo n).
1.4 Potenziali elettromagnetici Tenendo presente l’Eq. (1.2), e ricordando che la divergenza del rotore di un vettore arbitrario `e identicamente nulla, il campo magnetico2 pu` o essere fatto detto potenziale vettore, attraverso discendere da un opportuno potenziale A, l’equazione = rotA . B Sostituendo questo risultato nell’Eq. (1.4), si ha
+ 1 ∂A rot E c ∂t
=0 ,
e ricordando che il rotore del gradiente di un vettore arbitrario `e nullo, possiamo introdurre il potenziale scalare φ scrivendo = −gradφ − 1 ∂ A . E c ∂t e di E nelle equazioni di Maxwell non omogenee. Sostituiamo questi valori di B Dall’Eq. (1.3) si ha )+ 1 ∂ rot(rotA c ∂t 2
1 ∂A gradφ + c ∂t
= 4π
j , c
si dovrebbe parlare pi` Riferendosi al vettore B u propriamente di “induzione magnetica” invece che di “campo magnetico”. In effetti, `e ormai invalso l’uso, quando questo non comporta come al campo magnetico. equivoci, di riferirsi a B
6
CAPITOLO 1
ovvero, per mezzo dell’identit` a vettoriale (A2.11) j 1 ∂φ 1 ∂2A = −4π . ∇ A − 2 2 − grad divA + c ∂t c ∂t c 2
Dall’Eq. (1.1) si ha poi ∇2 φ +
1 ∂ = −4π ρ , divA c ∂t
un’equazione che pu` o anche essere scritta nella forma 1 ∂φ 1 ∂2φ 1 ∂ 2 ∇ φ− 2 2 + divA + = −4π ρ . c ∂t c ∂t c ∂t Il sistema formato da queste due ultime equazioni permette, in linea di prin e φ (e quindi i campi E eB ), una volta note cipio, di ricavare i potenziali A e φ possono esρ e j e le condizioni al contorno. Vedremo comunque che A sere sottoposti a una condizione supplementare che permette di semplificare notevolmente le equazioni cui sono soggetti.
1.5 Invarianza di gauge (di calibro) e φ determinano univocamente i campi elettrico e magnetico; I potenziali A e φ che danno luogo agli stessi valori per tuttavia, esistono diverse funzioni A E e B. Infatti, se si eseguono le seguenti sostituzioni − gradχ , →A = A A
(1.5)
1 ∂χ , (1.6) c ∂t dove χ `e una funzione arbitraria delle coordinate e del tempo, si ottiene, per i e B , nuovi campi E φ → φ = φ +
= rot(A − gradχ) = rotA =B , B e, analogamente, 1 ∂ 1 ∂χ . − (A − gradχ) = E E = −grad φ + c ∂t c ∂t Questa propriet`a viene detta invarianza di gauge (di calibro) e pu` o essere convenientemente sfruttata mediante un’opportuna scelta della funzione χ.
LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO
7
0 e φ0 siano i potenziali vettore e scalare che danno Supponiamo infatti che A luogo ai campi E e B che siamo interessati a calcolare a partire da una distribuzione assegnata di cariche e correnti e da opportune condizioni al contorno. Consideriamo allora la trasformazione di gauge =A 0 − gradχ , A 1 ∂χ . c ∂t Se si sceglie la funzione χ in modo da soddisfare l’equazione φ = φ0 +
∇2 χ −
1 ∂2χ 0 + 1 ∂φ0 , = divA c2 ∂t2 c ∂t
si ha 1 ∂φ =0 . (1.7) c ∂t Quando si scelgono i potenziali in modo che soddisfino a questa equazione, e φ divengono si dice che si adotta il gauge di Lorenz3 e le equazioni per A + divA
− ∇2 A
j 1 ∂2A = −4π , 2 2 c ∂t c
(1.8)
1 ∂2φ = −4π ρ . (1.9) c2 ∂t2 In assenza di cariche libere, le cose possono essere ulteriormente semplificate 0 e φ0 siano mediante un’ulteriore trasformazione di gauge. Supponiamo che A una coppia di potenziali elettromagnetici che gi` a soddisfano il gauge di Lorenz. Se eseguiamo una trasformazione di gauge, `e necessario, per rimanere entro il gauge di Lorenz, che la funzione χ soddisfi l’equazione ∇2 φ −
1 ∂2χ =0 . c2 ∂t2 D’altra parte, in assenza di cariche elettriche, il potenziale φ0 soddisfa l’equazione ∇2 χ −
∇2 φ0 − 3
1 ∂ 2 φ0 =0 , c2 ∂t2
Il fisico danese L.V. Lorenz (1829-1891) non deve essere confuso col pi` u famoso fisico olandese H.A. Lorentz (1853-1928), noto soprattutto per le trasformazioni e per la forza che ne portano il nome. Entrambi i fisici, quasi contemporanei, sono ricordati insieme per un’equazione che viene detta di Lorentz-Lorenz la quale collega l’indice di rifrazione di un mezzo materiale al coefficiente di polarizzabilit` a delle molecole che lo compongono.
8
CAPITOLO 1
che `e la stessa equazione soddisfatta da χ e quindi anche da ∂χ/∂t. Scegliendo quindi la funzione χ in modo che −
1 ∂χ = φ0 , c ∂t
`e possibile fare in modo che il nuovo potenziale scalare sia φ=0 ,
(1.10)
col che la condizione di Lorenz risulta semplicemente =0 . divA
(1.11)
Un altro gauge particolarmente interessante `e il gauge di Coulomb che si ottiene scegliendo una funzione χ tale da soddisfare l’equazione 0 , ∇2 χ = divA 0 `e, al solito, il potenziale vettore che interessa calcolare. Con questa dove A trasformazione di gauge si ottiene =0 , divA e φ risultano e le equazioni per A − ∇2 A
∂φ j 1 1 ∂2A , = −4π + grad 2 2 c ∂t c c ∂t ∇2 φ = −4π ρ .
Questo gauge ha il vantaggio che il potenziale scalare coincide con quello (istantaneo) dell’elettrostatica, anche nel caso di fenomeni non stazionari che comportano la presenza di cariche e correnti variabili nel tempo.
1.6 Soluzione delle equazioni di Maxwell nel vuoto Consideriamo una regione dello spazio priva di cariche e di correnti. Come abbiamo visto nel paragrafo precedente, nel gauge di Lorenz possiamo porre φ = 0 dimodoch´e il campo elettromagnetico resta descritto dal solo potenziale vettore che obbedisce all’equazione − ∇2 A
1 ∂2A =0 , 2 2 c ∂t
LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO
9
con la condizione supplementare del gauge di Lorenz (nel vuoto) =0 . divA Supponiamo che il campo elettromagnetico dipenda da una sola coordinata, che immedesimiamo con l’asse z di un sistema di riferimento cartesiano ortogonale. La prima equazione diviene 1 ∂2A ∂2A − =0 . ∂z 2 c2 ∂t2 Questa equazione, che viene detta comunemente equazione delle onde, ammette la soluzione generale t) = A p (z − c t) + A r (z + c t) , A(z, p e A r sono funzioni (vettoriali) arbitrarie del loro argomento. I due dove A termini a secondo membro rappresentano onde piane che si propagano rispettivamente lungo la direzione positiva e negativa dell’asse z (onde progressive e regressive) con velocit`a c. Se fissiamo l’attenzione, ad esempio, sulle onde descritte dal primo termine del secondo membro, ovvero se ammettiamo che sia t) = A p (z − c t) , A(z, si vede immediatamente che, fissato un tempo t, il potenziale vettore `e costante su un qualsiasi piano z = costante. Inoltre, il valore del potenziale vettore che si trova al tempo t0 nel piano z = z0 si sposta, nel tempo dt, di una quantit` a dz tale che z0 − c t0 = (z0 + dz) − c (t0 + dt) , ovvero dz = c dt . Questo giustifica la denominazione di onda piana progressiva data alla pro p (z − c t). (Analogamente si pu` pagazione descritta dal potenziale vettore A o r (z + c t) descrive un’onda regressiva). mostrare che il potenziale vettore A Generalizzando i risultati precedenti, supponiamo adesso che la propagazione avvenga lungo una direzione caratterizzata dal versore n. Abbiamo allora r , t) = a(f ) , A( dove la quantit` a f , detta fase dell’onda, `e data da f = n · r − c t ,
10
CAPITOLO 1
r essendo la distanza del punto generico dall’origine del sistema di riferimento, e a essendo una funzione (vettoriale) arbitraria di f . Applicando la condizione di Lorenz (Eq. (1.11)), si ha div[ a(f ) ] = a (f ) · n = 0 ,
(1.12)
dove si `e tenuto conto che ⎛ ⎞ ∂f ∂ ⎝ = nj xj ⎠ = ni , ∂xi ∂xi j e dove si `e introdotta la notazione a (f ) per designare la derivata del vettore a(f ) rispetto al proprio argomento a (f ) =
d a(f ) . df
Integrando l’Eq. (1.12) rispetto a f ottiene a(f ) · n + a0 · n = 0 , dove a0 `e un vettore costante, indipendente cio`e da r e da t, che possiamo uguagliare a zero per mezzo di un’opportuna trasformazione di gauge (si applichi l’Eq. (1.5) scegliendo per χ la funzione a0 · r ). Si ha quindi a(f ) · n = 0 , il che significa che il potenziale vettore che descrive l’onda piana `e perpendicolare alla direzione di propagazione. eB associati all’onda. Con semplici passaggi Consideriamo adesso i vettori E si ottiene = rot[ a(f ) ] = n × a (f ) , B = − 1 ∂ a(f ) = a (f ) . E c ∂t eB sono entrambi perpendicolari Si ottiene quindi il risultato che i vettori E alla direzione di propagazione e che, inoltre = n × E , B
LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO
11
E
n
B eB formano, in quest’ordine, una terna destra. Fig. 1.1. I vettori n, E
il che significa che i due vettori sono perpendicolari fra loro e tali da formare B ), come si vede nella Fig. 1.1 con n una terna destrorsa4 (nell’ordine n, E, L’energia elettrica e magnetica trasportate dall’onda sono uguali fra loro (in quanto E 2 = B 2 ); la densit` a totale di energia elettromagnetica `e data da u=
1 2 1 (E 2 + B 2 ) = E , 8π 4π
mentre il vettore di Poynting risulta = c E ×B = c E 2 n . S 4π 4π Confrontando le due formule precedenti e ricordando che il modulo del vettore di Poynting rappresenta l’energia che fluisce per unit` a di tempo attraverso l’unit` a di superficie disposta perpendicolarmente al versore n, ne risulta che l’energia si propaga con la velocit` a c. Per la densit` a di quantit` a di moto si ha poi g =
S u E2 n = n , = 2 c 4π c c
da cui si vede che la densit`a di quantit` a di moto `e diretta lungo la direzione di propagazione dell’onda ed `e pari alla densit` a di energia divisa per c. Questo `e un importante risultato classico che si traduce in meccanica quantistica nella relazione E = c p che collega l’energia E all’impulso p di un fotone. 4
B) sia destrorsa e non sinistrorsa `e connesso con le convenzioni Il fatto che la terna ( n, E, che sono state storicamente stabilite per individuare i segni delle cariche elettriche e delle masse magnetiche. Si ricordi che la carica elettrica positiva (negativa) `e quella che si deposita per strofinio su una bacchetta di vetro (di ebanite), mentre la massa magnetica positiva (negativa) ` e quella che viene attratta dal polo Nord (polo Sud) terrestre.
12
CAPITOLO 1
Il flusso della quantit` a di moto si pu` o poi calcolare attraverso il tensore di Maxwell. Per tale flusso, valutato attraverso l’unit` a di superficie disposta perpendicolarmente alla direzione di propagazione, si ha F (n ) = −n · T . · n = B · n = 0, si ottiene Sostituendo l’espressione di T e tenendo conto che E 1 2 F (n ) = E n . 4π Pi` u in generale, possiamo calcolare il flusso di quantit` a di moto attraverso una superficie unitaria diretta perpendicolarmente alla direzione individuata dal versore arbitrario n . Si ha F (n ) = −n · T , e, sostituendo 1 E2 + B2 (n · E) E + (n · B) B − n . F (n ) = − 4π 2 eB formano una terna ortogonale, si pu` Tenendo conto che n, E, o scrivere n = (n · n ) n +
E B (n · E) (n · B) + , E2 B2
per cui, essendo E 2 = B 2 , si ottiene 1 2 E (n · n ) n , F (n ) = 4π ovvero il flusso `e sempre diretto lungo la direzione di propagazione ma contiene il fattore di proiezione (n · n) = cosθ, dove θ `e l’angolo definito nella Fig. 1.2.
1.7 Pressione della radiazione Consideriamo un’onda piana che si propaghi lungo la direzione n e supponiamo che essa incida sulla superficie dS di un corpo perfettamente assorbente orientata come in Fig. 1.2. La superficie dS assorbe, nel tempo dt, una quantit` a di moto d q data da E2 d q = F (n ) dS dt = (n · n) n dS dt , 4π la cui proiezione lungo la direzione perpendicolare all’elemento di superficie risulta
LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO
13
n’ θ
n dS
onda piana Fig. 1.2. Un’onda elettromagnetica piana incide su una superficie elementare. Il flusso della quantit` a di moto ` e diretto lungo n.
d q · n =
E2 E2 (n · n)2 dS dt = cos2 θ dS dt . 4π 4π
Questo trasferimento di quantit` a di moto si manifesta come una pressione5 (pressione di radiazione) che vale Prad =
E2 d q · n = cos2 θ = u cos2 θ , dS dt 4π
(1.13)
dove u `e la densit`a di energia. Il risultato cos`ı ottenuto vale per una superficie perfettamente assorbente. Nel caso di una superficie perfettamente riflettente bisogna tener conto che la quantit` a di moto trasferita `e doppia, dimodoch´e il secondo membro della formula precedente deve essere moltiplicato per un fattore 2. La pressione esercitata dalla luce su una superficie fu rivelata sperimentalmente da Lebedev nel 1901 mediante una delicata esperienza attraverso la quale riusc`ı a mostrare, entro gli errori sperimentali, la correttezza del valore teorico previsto dalle equazioni di Maxwell. In ambito astrofisico, oggi sappiamo che la pressione di radiazione ha importanza fondamentale negli interni delle stelle calde e quale meccanismo di accelerazione di venti stellari. A livello di astronautica esistono alcuni progetti di navicelle spaziali che sfruttano la pressione esercitata dalla radiazione solare come mezzo di propulsione verso l’esterno del sistema solare (vele cosmiche). 5
Effettivamente, nel caso schematizzato in figura si ha anche una forza di taglio, oltre che una forza perpendicolare alla superficie. Le forze di taglio si elidono quando la superficie `e investita da radiazione isotropa, caso in cui il fattore cos 2 θ dell’Eq. (1.13) assume il valore 1/3, pari alla sua media sull’angolo solido.
14
CAPITOLO 1
1.8 Onde piane sinusoidali Un tipo particolarmente importante di onde piane `e l’onda piana sinusoidale che `e descritta da un potenziale vettore della forma
r , t) = A 0 cos ω (n · r − c t) + ϕ , A( c 0 e ϕ sono due costanti che prendono rispettivamente il nome di amdove A piezza e fase dell’onda, ω `e la cosiddetta frequenza angolare, e n `e il versore che individua la direzione di propagazione. L’espressione di sopra pu` o anche essere scritta (in maniera del tutto equivalente) sotto varie forme diverse introducendo, volta per volta, la frequenza ciclica (o frequenza tout court) ν, il periodo T , la lunghezza d’onda λ, o il numero d’onde k. Queste grandezze sono collegate fra loro (e con la velocit` a della luce) dalle relazioni ν=
ω 1 = , 2π T
λ=
2π , k
k = ω n = k n , c
λν = c ,
ω = ck .
Ad esempio, si pu`o scrivere r , t) = A 0 cos A(
2π n · r − 2π ν t + ϕ , λ
oppure r, t) = A 0 cos(k · r − ω t + ϕ) . A( eB Se, ad esempio, si adotta quest’ultima espressione, si ottiene per E r , t) = B 0 sin(k · r − ω t + ϕ) , B(
r, t) = E 0 sin(k · r − ω t + ϕ) , E(
dove 0 = −k × A 0 , B
0 = − ω A 0 . E c
Naturalmente si ha ancora, a ciascun istante e in ogni punto dello spazio, r , t) = n × E( r, t) , B( come abbiamo mostrato, in forma pi` u generale, nel paragrafo precedente. Per l’energia e per la quantit` a di moto dell’onda piana sinusoidale si ottengono espressioni variabili, nello spazio e nel tempo, del tipo sin2 (k ·r − ω t + ϕ).
15
LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO
Volendo considerare le medie temporali di tali quantit` a, si riottengono le corrispondenti espressioni del paragrafo precedente con i termini E 2 e B 2 sostituiti rispettivamente da E02 /2, e B02 /2 (la media su un periodo del quadrato della funzione seno `e pari a 1/2). Talvolta `e conveniente rappresentare un’onda piana sinusoidale mediante un esponenziale complesso, anzich´e mediante un’espressione reale, come ad esempio r , t) = A 0 e i (k·r−ω t+ϕ) , A(
oppure
r , t) = A 0 e i (k·r−ω t) , A(
0 `e un vettore complesso dato da dove A 0 e i ϕ . 0 = A A In questi casi, si fa la convenzione che la quantit` a fisica osservabile (ad esempio il campo elettrico) rappresenti la parte reale dell’espressione complessa introdotta. L’uso degli esponenziali complessi `e comodo quando si debbano compiere operazioni lineari, in quanto la parte reale del risultato `e uguale al risultato che si otterrebbe eseguendo le stesse operazioni lineari sulla parte reale. Quando per` o si debbono eseguire operazioni non lineari (come ad esempio per il calcolo dell’energia), prima si deve prendere la parte reale dell’esponenziale complesso e poi eseguire l’operazione desiderata. A questo proposito notiamo che se A(t) e B(t) sono due quantit` a complesse aventi la stessa dipendenza sinusoidale dal tempo A(t) = A e−i ω t ,
B(t) = B e−i ω t ,
con A e B costanti nel tempo, si pu` o scrivere, per la media temporale su un periodo delle loro parti reali ReA(t) ReB(t)
=
1 1 Re(AB ∗ ) = Re(A∗ B) . 2 2
Infatti: ReA(t) =
1 [A e−i ω t + A∗ e i ω t ] , 2
ReB(t) =
1 [B e−i ω t + B ∗ e i ω t ] , 2
e quindi ReA(t) ReB(t) Essendo tuttavia
=
e±2 i ω t
ReA(t) ReB(t)
=
1 4
AB e−2 i ω t + AB ∗ + A∗ B + A∗ B ∗ e 2 i ω t = 0, si ottiene
1 1 1 (AB ∗ + A∗ B) = Re(AB ∗ ) = Re(A∗ B) . 4 2 2
.
Capitolo 2
Spettro e polarizzazione Oltre che dalla direzione di propagazione, la radiazione elettromagnetica `e caratterizzata da due altre propriet`a fondamentali, tipiche dei fenomeni ondosi: lo spettro e la polarizzazione. Tali propriet` a, che sono di cruciale importanza per poter risalire dall’osservazione della radiazione alle caratteristiche fisiche del corpo che l’ha emessa, sia esso un atomo oppure una stella, sono codificate nell’andamento dei vettori campo elettrico e campo magnetico in funzione del tempo. In questo capitolo analizzeremo i concetti matematici che stanno alla base delle definizioni di spettro e di polarizzazione della radiazione elettromagnetica e vedremo come tali concetti possano essere concretizzati in misure fisiche realizzate per mezzo di appropriati strumenti, quali lo spettroscopio a reticolo e il polarimetro, di cui illustreremo i principi di funzionamento.
2.1 Spettro della radiazione L’onda monocromatica piana, introdotta nel capitolo precedente come soluzione delle equazioni di Maxwell, costituisce un’astrazione matematica e, come tale, pu` o fornire la descrizione della radiazione emessa in un processo fisico reale solo come caso limite. Pi` u in generale, i campi elettrico e magnetico associati alla radiazione che fluisce attraverso una superficie infinitesima, pensata fissa nello spazio, risultano descritti da delle opportune funzioni del tempo dal cui andamento dipendono le caratteristiche spettrali e polarimetriche della radiazione stessa. Tuttavia, come abbiamo visto nel capitolo precedente, in un’onda piana generica (non necessariamente monocromatica) propagantesi nel vuoto, `e sempre uguale in modulo al vettore campo il vettore campo magnetico, B, elettrico, E, ed `e ad esso perpendicolare (entrambi essendo perpendicolari alla direzione di propagazione). Se si fissa uno dei due vettori, l’altro risulta automaticamente individuato. Per caratterizzare in maniera esauriente la radiazione possiamo quindi limitarci a considerare uno solo dei due campi, ad esempio il campo elettrico, che risulta descritto, nel punto di osservazione, dalla funzione vettoriale E(t). Allo scopo di non appesantire troppo le notazioni, ci riferiremo inizialmente a una funzione scalare del tempo –invece che vettoriale– della forma E(t). Trascureremo quindi quei fenomeni che sono associati alla direzione del vettore campo elettrico nel piano perpendicolare alla direzione di propagazione. Tali fenomeni, detti fenomeni di polarizzazione, saranno illustrati in paragrafi suc-
18
CAPITOLO 2
cessivi di questo capitolo (Par. 2.5 e 2.6). Lo spettro della radiazione dipende dalla variazione temporale della funzione E(t) e, di conseguenza, non `e possibile definire lo spettro in un preciso istante ma soltanto su un intervallo di tempo sufficientemente lungo (nel senso che sar` a precisato in seguito). Se si suppone che la funzione E(t) si annulli sufficientemente per t → ±∞, possiamo definirne la trasformata di Fourier nello spazio ˆ delle frequenze angolari, E(ω), come la funzione complessa data dall’integrale ∞ 1 ˆ E(ω) = E(t) ei ω t dt . (2.1) 2π −∞ Poich´e la funzione E(t) `e reale, la complessa e coniugata della trasformata di ˆ ∗ , `e tale che Fourier, E(ω) ∞ ˆ ∗= 1 ˆ E(ω) E(t) e−i ω t dt = E(−ω) , 2π −∞ cosicch´e `e sempre possibile connettere la trasformata di Fourier a frequenze negative con quella a frequenze positive. In altre parole, la trasformata di Fourier a frequenze negative non contiene ulteriori informazioni rispetto alla parte a frequenze positive e pu`o, in un certo senso, essere eliminata. Dalla trasformata di Fourier si pu`o risalire al campo elettrico stesso mediante l’operazione di anti-trasformata, scrivendo ∞ ˆ E(t) = E(ω) e−i ω t dω . −∞
Per provare questa equazione, moltiplichiamo ambo i membri dell’Eq. (2.1) per e−i ω t e integriamo in dω. Si ha ∞ ∞ ∞ 1 ˆ dt E(t) e−i ω (t −t) dω . E(ω) e−i ω t dω = 2π −∞ −∞ −∞ D’altra parte, per l’ultimo integrale si pu` o scrivere, con un procedimento di passaggio al limite,
∞
e −∞
−i ω (t −t)
Ω
dω = lim
Ω→∞
−Ω
e−i ω (t −t) dω = lim
Ω→∞
2 sin(Ω Δt) , Δt
(2.2)
dove si `e posto Δt = t − t. Il grafico della funzione 2 sin(Ω Δt)/Δt `e rappresentato nella Fig. 2.1. Da esso si vede che la funzione si comporta, per Ω → ∞, come una funzione delta di Dirac1 . Pi` u precisamente 1
In principio, la delta di Dirac non `e una vera e propria funzione ma, piuttosto, una distribuzione, ovvero un funzionale che associa a una qualsiasi funzione reale f (x) un numero reale F [f (x)]. Le principali propriet` a della delta di Dirac sono illustrate nell’App. 3.
19
SPETTRO E POLARIZZAZIONE
2Ω
Ω
0
0 π/Ω
Fig. 2.1. Grafico della funzione 2 sin(ΩΔt)/Δt in funzione di Δt. La funzione ha un massimo nell’origine e il primo zero si verifica per Δt = π/Ω. Al limite per Ω → ∞, il picco centrale diventa sempre pi` u alto e, nello stesso tempo, si stringe sempre pi` u intorno a Δt = 0.
lim
Ω→∞
2 sin(Ω Δt) = 2π δ(Δt) . Δt
Sostituendo si ottiene quindi ∞ ∞ 1 −i ω t ˆ dω = E(t) 2π δ(t − t) dt = E(t ) , E(ω) e 2π −∞ −∞ che `e l’espressione che volevamo dimostrare. Consideriamo adesso il flusso di energia (energia per unit`a di superficie e per unit` a di tempo)2 trasportata dalla radiazione elettromagnetica. Ricordando la definizione del vettore di Poynting, e indicando il flusso con F , si ha F =
c 2 E (t) , 4π
e, per la quantit` a totale di energia, F, che traversa la superficie unitaria fra t = −∞ e t = +∞ 2
Il flusso di una data grandezza fisica (ad esempio l’energia, la carica, la massa, etc.) `e generalmente definito come la quantit` a di tale grandezza che attraversa un’area unitaria nell’unit` a di tempo. Bisogna per` o tener presente che tale definizione non `e universalmente accettata e che talvolta si parla di flusso riferendosi alla quantit` a della medesima grandezza che traversa una superficie assegnata (non necessariamente unitaria) nell’unit` a di tempo. In fisica matematica, il flusso di un vettore attraverso una superficie chiusa `e definito in maniera diversa (si ricordi il teorema di Gauss), senza far alcun riferimento all’unit` a di tempo.
20
CAPITOLO 2
∞
c F= F dt = 4π −∞
∞
E 2 (t) dt .
−∞
Introducendo la trasformata di Fourier, si pu` o scrivere
∞
2
E (t) dt = −∞
∞
∞
dt −∞
ˆ E(ω) e−i ω t dω
−∞
∞
ˆ )∗ ei ω t dω . E(ω
−∞
Valutando l’integrale in dt mediante un procedimento di passaggio al limite analogo a quello dell’Eq. (2.2) si ha ∞ ei (ω −ω) t dt = 2π δ(ω − ω) , −∞
per cui si ottiene il cosiddetto teorema di Parseval ∞ ∞ 2 ˆ E 2 (t) dt = 2π |E(ω)| dω . −∞
(2.3)
−∞
∗ ˆ ˆ , si ha Sostituendo nell’espressione per F e ricordando che E(ω) = E(−ω) infine ∞ 2 ˆ F =c |E(ω)| dω . 0
A parte il fattore di proporzionalit` a c, questa equazione permette di identificare il modulo quadro della trasformata di Fourier della funzione E(t) con l’energia totale (formalmente fra t = −∞ e t = +∞) che fluisce per unit`a di 2 ˆ superficie nell’intervallo spettrale dω. La quantit` a |E(ω)| `e chiamata lo spet3 tro della radiazione elettromagnetica . Come appare evidente dalla deduzione sopra presentata, tale spettro non dipende dal comportamento istantaneo della funzione E(t), ma dal suo comportamento su tempi molto lunghi (in principio infiniti). ` ovvio che, in pratica, una qualsiasi misura atta a individuare lo spettro E della radiazione non pu` o mai protrarsi per un tempo infinito, ma `e necessariamente limitata a un intervallo di tempo T , detto anche tempo di campionatura. Questo fatto impedisce ovviamente di poter ottenere informazioni sulla variabilit` a della funzione E(t) su periodi dell’ordine o maggiori di T , il che implica che lo spettro della radiazione a frequenze minori di una frequenza di taglio, ω t , con ωt 1/T , rimane indefinito. Questa limitazione non ha per` o alcuna rilevanza pratica per la radiazione elettromagnetica in quanto anche se T `e molto 3
In pratica le misure di spettro sono generalmente delle misure relative, nelle quali ci` o che si 2 a meno di una costante di proporzionalit` ˆ misura ` e l’andamento con ω della funzione |E(ω)| a. Pi` u precisamente si dovrebbe quindi dire che lo spettro della radiazione elettromagnetica `e 2. ˆ proporzionale a |E(ω)|
SPETTRO E POLARIZZAZIONE
21
breve, ad esempio un secondo, il valore di ωt risulta pari a 1 Hz, e la condizione ω < ωt viene a interessare una regione dello spettro del tutto irrilevante. In pratica, si ha molto spesso a che fare con fenomeni di tipo stazionario. Si pensi ad esempio alla radiazione emessa da una lampada a scarica, oppure ` ovvio che in questi casi l’integrale alla radiazione proveniente da una stella. E che definisce la trasformata di Fourier (Eq. (2.1)) `e divergente ed `e quindi necessaria una trattazione particolare, del tipo di passaggio al limite, nella quale il tempo di campionatura diventa essenziale. Consideriamo quindi un tempo di campionatura T sufficientemente grande da contenere tutte le caratteristiche spettrali significative del fenomeno in studio e poniamo artificialmente uguale a zero il campo elettrico per tempi t esterni all’intervallo di campionatura. ˆ La trasformata di Fourier, che adesso indichiamo con E(ω, T ) per ricordare la dipendenza “artificiale” da T che `e stata cos`ı introdotta, risulta data da 1 ˆ E(ω, T)= 2π
T /2
E(t) ei ω t dt .
(2.4)
−T /2
Andiamo adesso a considerare la quantit` a totale di energia, FT , che traversa la superficie unitaria nell’intervallo di tempo compreso fra −T /2 e T /2. Per essa si ha FT =
c 4π
T /2
E 2 (t) dt .
−T /2
Partendo da questa espressione, e utilizzando il fatto che il tempo di campionatura pu` o essere formalmente considerato come tendente a ∞, si possono ripetere tutti i passaggi matematici che hanno portato al teorema di Parseval per ottenerne una forma modificata valida per i fenomeni di tipo stazionario, ovvero FT =
c 4π
T /2
E 2 (t) dt = c
−T /2
∞
ˆ |E(ω, T )|2 dω .
(2.5)
0
Vedremo in seguito, riferendoci ad alcuni casi specifici di fenomeni stazionari, ˆ come anche la quantit`a |E(ω, T )|2 sia proporzionale a T . Questo ci permette di dare una definizione del tutto coerente di flusso monocromatico, ovvero della quantit` a di energia contenuta nell’intervallo di frequenza dω che fluisce attraverso la superficie unitaria nel tempo unitario. Indicando tale quantit` a con Fω , possiamo scrivere ∞ c ∞ ˆ FT = Fω dω = |E(ω, T )|2 dω , T T 0 0 dalla quale si ottiene Fω =
c ˆ |E(ω, T )|2 . T
(2.6)
22
CAPITOLO 2
2.2 Spettri particolari di alcune forme d’impulso Consideriamo alcune forme particolari della funzione E(t) e deduciamone i corrispondenti spettri. Sia E(t) una funzione di tipo gaussiano rappresentata matematicamente dall’equazione (caso a) 1
E(t) = E0 e− 2 (t/τ )
2
.
La trasformata di Fourier `e data da (si ricordi l’Eq. (2.1)) E0 ∞ − 1 (t/τ )2 +i ω t ˆ E(ω) = e 2 dt . 2π −∞ Introducendo la variabile ridotta x = t/τ e aggiungendo e togliendo la quantit`a ω 2 τ 2 /2 all’esponente, si ottiene E0 τ − 1 ω2 τ 2 ∞ − 1 (x−i ω τ )2 ˆ 2 e E(ω) = e 2 dx , 2π −∞ √ e, passando alla variabile complessa z = (x − i ωτ )/ 2 2 E0 τ − 12 ω2 τ 2 ˆ e e−z dz , E(ω) = √ 2π L dove L `e un cammino,√nel piano complesso della variabile z, parallelo all’asse reale. L’integrale vale π per cui si ottiene E02 τ 2 −ω2 τ 2 e . 2π Se ne conclude che lo spettro di una funzione E(t) di tipo gaussiano `e a sua volta una funzione di tipo gaussiano. Calcoli simili possono essere ripetuti per ulteriori forme della funzione E(t). Se (caso b) E0 sin(ω0 t) per |t| < τ2 E(t) = , 0 per |t| ≥ τ2 2 ˆ |E(ω)| =
dove τ `e un tempo tale da contenere un gran numero di periodi dell’onda (τ 1/ω0 ), si ottiene, per lo spettro a frequenze positive 2 ˆ |E(ω)|
E02 sin2 [(ω − ω0 ) τ /2] , 4π 2 (ω − ω0 )2
con un contributo simmetrico, a frequenze negative, centrato intorno alla frequenza −ω0 . Infine, se (caso c)
23
SPETTRO E POLARIZZAZIONE
Fig. 2.2. Grafico della funzione E(t) e della corrispondente trasformata di Fourier modulo quadro, |E(ω)|2 , per i tre casi a), b), e c) considerati nel testo. Si noti la corrispondenza fra il tempo caratteristico di durata del segnale, τ , e l’ampiezza in frequenza dello spettro, 1/τ .
E(t) =
E0 sin(ω0 t) e−t/τ 0
per t ≥ 0 per t < 0
,
dove τ `e di nuovo un tempo tale da contenere un gran numero di periodi dell’onda (τ 1/ω0 ), si ottiene per lo spettro a frequenze positive 2 ˆ |E(ω)|
1 E02 , 16π 2 (ω − ω0 )2 + (1/τ )2
con un contributo simmetrico, a frequenze negative, centrato intorno alla frequenza −ω0 . Le forme delle funzioni E(t) e i conseguenti spettri sono riportate nella Fig. 2.2. Dai tre casi considerati si deduce che l’ampiezza in frequenza dello
24
CAPITOLO 2
E(t)
t t1
t2
t3
Fig. 2.3. Andamento col tempo del campo elettrico dovuto alla sovrapposizione statistica di tre segnali elementari, tutti della stessa forma.
spettro, Δω, di un tipico segnale avente durata temporale τ `e collegata a tale durata dalla relazione Δω τ 1 . In altre parole, pi` u rapido `e l’impulso, pi` u larga `e la banda di frequenze nella quale la trasformata di Fourier `e significativamente diversa da zero, ovvero pi` u largo `e lo spettro. Al limite, se si considera un impulso avente una durata temporale infinitesima, del tipo di una delta di Dirac, lo spettro `e costante, cio`e indipendente dalla frequenza.
2.3 Spettri di segnali stocastici e di segnali periodici Consideriamo una situazione fisica in cui il campo elettrico E(t) `e di tipo stazionario e indichiamo con T il tempo di campionatura. Un caso particolare `e quello di un segnale di tipo stocastico, ovvero quello in cui il campo `e dato dalla sovrapposizione di un numero molto elevato, N , di segnali elementari, tutti uguali fra loro in forma, che si susseguono a istanti casuali con la frequenza N = N/T . Tali segnali possono eventualmente sovrapporsi l’uno con l’altro, come illustrato schematicamente nella Fig. 2.3, e sono tali da avere dei tempi scala caratteristici molto minori del tempo di campionatura. Indicando con t1 , t2 , · · · , tN gli istanti dei singoli segnali elementari, e con f (t) la funzione del tempo che descrive ciascun segnale, il campo elettrico `e dato dall’espressione
25
SPETTRO E POLARIZZAZIONE
E(t) =
N
f (t − tj ) .
j=1
La trasformata di Fourier di tale campo elettrico risulta N 1 T /2 ˆ f (t − tj ) ei ω t dt . E(ω, T ) = 2π j=1 −T /2
Nel j-esimo integrale eseguiamo il cambiamento di variabile t − tj = τ , e definiamo la trasformata di Fourier del segnale elementare attraverso la consueta equazione4 ∞ 1 f (τ ) ei ω t . fˆ(ω) = 2π −∞ Con facili passaggi si ottiene ˆ E(ω, T ) = fˆ(ω) S , dove il numero complesso S `e dato da S=
N
ei ω tj .
j=1
La trasformata di Fourier del campo elettrico `e quindi data dalla trasformata di Fourier del segnale elementare moltiplicata per la somma di N fattori di fase, ovvero di N numeri complessi tutti di modulo 1. Siccome i tempi tj sono distribuiti casualmente nel tempo, i fattori di fase, sommandosi fra loro, tendono ad annullarsi l’uno con l’altro di modo che il modulo del numero complesso S viene a risultare molto minore di N , come illustrato nella Fig 2.4. Siamo qui in una situazione molto simile a quella del moto Browniano nel quale una particella esegue nello spazio un random walk e si allontana lentamente nel tempo dalla sua posizione iniziale. Guardiamo adesso come si comporta il modulo quadro della trasformata. Per esso si ha ˆ |E(ω, T )|2 = |fˆ(ω)|2 |S|2 = |fˆ(ω)|2
N N
ei ω (tj −tk ) .
j=1 k=1
La somma doppia che compare in questa equazione pu` o essere spezzata in due parti. Prima si sommano gli N termini con j = k e poi gli N (N − 1) termini 4
Poich´ e abbiamo supposto che la funzione f (t) vari su tempi scala molto minori di T l’integrale in dt pu` o essere esteso fra −∞ e ∞ invece che fra −T /2 e T /2.
26
CAPITOLO 2
Fig. 2.4. La figura illustra il risultato della somma S di 100 numeri complessi aventi modulo uguale a 1 e fasi casuali. Man mano che si aggiungono i successivi addendi, il risultato della somma parziale si sposta nel piano complesso, a partire dal punto iniziale O, secondo un tipico movimento di random walk fino a raggiungere il punto finale P.
con j = k. La prima somma d`a ovviamente per risultato N , mentre la seconda, essendo i tempi tj e tk distribuiti in maniera casuale, porta un contributo molto piccolo il cui rapporto rispetto alla prima tende a zero per N tendente all’infinito. Si ottiene quindi, ricordando che N = N T 2 ˆ ˆ |E(ω, T )|2 = N T |f(ω)| .
(2.7)
Come avevamo anticipato nel Par. 2.1, la trasformata di Fourier risulta proporzionale al tempo di campionatura T . Ricordando l’Eq. (2.6) il flusso monocromatico risulta Fω = c N |fˆ(ω)|2 . Questa espressione pu`o essere generalizzata al caso in cui il campo elettrico possa essere considerato come la combinazione incoerente di due segnali di tipo stocastico. Se si suppone, ad esempio, che il campo elettrico risulti dalla sovrapposizione di tanti segnali elementari di forma f (t), distribuiti casualmente nel tempo con frequenza Nf , e di tanti segnali elementari di forma g(t), distribuiti anch’essi casualmente nel tempo con frequenza Ng , ripetendo il ragionamento sviluppato sopra si ottiene che il flusso monocromatico `e dato da Fω = c Nf |fˆ(ω)|2 + Ng |ˆ g (ω)|2 .
27
SPETTRO E POLARIZZAZIONE
Infine, nel caso in cui si abbia una distribuzione continua di segnali elementari (dipendenti, ad esempio, da un parametro ζ), sempre assumendo la distribuzione temporale stocastica e l’incoerenza fra segnali di tipo diverso, l’equazione precedente pu`o essere ulteriormente generalizzata scrivendo 2 ˆ Fω = c Ntot |f(ω)|
,
(2.8)
dove Ntot `e la frequenza totale dei segnali elementari e |fˆ(ω)|2 `e la media di |fˆ(ω)|2 rispetto al parametro ζ. Passiamo adesso a considerare il caso in cui la funzione stazionaria E(t) sia una funzione periodica del tempo con periodo T . In base al teorema di Fourier, valido per una funzione periodica arbitraria, il campo elettrico pu` o essere espresso mediante l’equazione E(t) =
∞
E (n) e−i n ω0 t ,
n=−∞
dove ω0 `e la frequenza angolare fondamentale definita da ω0 =
2π , T
e dove le E (n) (con E (−n) = E (n)∗ ) sono quantit`a complesse, dette componenti di Fourier, date dall’equazione E (n) =
1 T
t0 +T
E(t) e2π i n t/T dt =
t0
1 T
t0 +T
E(t) ei n ω0 t dt ,
t0
t0 essendo un istante arbitrario. Vogliamo determinare la relazione esistente fra la trasformata di Fourier e le componenti di Fourier, E (n) . Per questo, consideriamo un tempo di campionatura, T , che contenga un numero molto grande di periodi. Si ha 1 ˆ E(ω, T)= 2π
T /2
E(t) ei ω t dt ,
−T /2
ovvero, sostituendo l’espressione di E(t) in termini di componenti di Fourier ∞ 1 (n) T /2 i (ω−n ω0 ) t ˆ E e dt . E(ω, T ) = 2π n=−∞ −T /2 Sviluppando l’integrale si ha ∞ 1 (n) 2 sin[(ω − n ω0 ) T /2 ] ˆ E(ω, T)= E , 2π n=−∞ ω − n ω0
28
CAPITOLO 2
ed essendo, per T → ∞, lim
T →∞
2 sin[(ω − n ω0 )T /2 ] = 2π δ(ω − n ω0 ) , ω − n ω0
si ottiene ∞
ˆ E(ω, T)=
E (n) δ(ω − n ω0 ) .
n=−∞
Questa espressione, seppur corretta, non `e per` o appropriata per calcolare il modulo quadro della trasformata di Fourier in quanto farebbe intervenire il quadrato di una funzione delta di Dirac cui `e impossibile attribuire il significato corretto senza far ricorso a concetti matematici tipici della teoria delle ˆ distribuzioni. Per il calcolo della |E(ω, T )|2 si pu` o comunque seguire il proˆ cedimento di considerare l’espressione di E(ω, T ) in funzione di T , andarne a valutare il modulo quadro e passare poi al limite per T → ∞. Cos`ı facendo si ottiene una somma doppia del tipo ˆ |E(ω, T )|2 = ×
∞ ∞ 1 (n) (m)∗ E E 4π 2 n=−∞ m=−∞
2 sin[(ω − n ω0 )T /2 ] 2 sin[(ω − m ω0 )T /2 ] . ω − n ω0 ω − m ω0
Per n = m, nel limite T → ∞ le due funzioni di T che compaiono al secondo membro sono per` o mutuamente esclusive, nel senso che dove una `e diversa da zero l’altra `e nulla, e viceversa. La somma doppia pu` o quindi essere ristretta a una somma singola ponendo m = n. Osservando poi che 4 sin2 [(ω − n ω0 )T /2] = 2π T δ(ω − n ω0 ) , T →∞ (ω − n ω0 )2 lim
si ottiene ˆ |E(ω, T )|2 =
T 2π
∞
(2.9)
|E (n) |2 δ(ω − n ω0 ) .
n=−∞
Di nuovo abbiamo ottenuto il risultato che la trasformata di Fourier `e proporzionale al tempo di campionatura T . Ricordando l’Eq. (2.6), ed escludendo l’armonica zero (che equivale a supporre che la media tempoarle di E(t) sia nulla), il flusso monocromatico di un segnale periodico `e dato da Fω =
∞ c (n) 2 |E | δ(ω − n ω0 ) . 2π n=1
(2.10)
Lo spettro di un segnale periodico `e quindi composto da un “pettine” di funzioni delta di Dirac centrate alla frequenza fondamentale e, in generale, a
SPETTRO E POLARIZZAZIONE
29
d Onda diffratta
θ
L Onda piana incidente
Reticolo di diffrazione
Fig. 2.5. Schema del reticolo di diffrazione.
tutte le armoniche superiori. Il “peso” di ciascuna armonica `e proporzionale al modulo quadro della rispettiva componente di Fourier.
2.4 Spettroscopio a reticolo di diffrazione Lo spettroscopio a reticolo di diffrazione pu` o essere a buona ragione considerato lo strumento prototipo per misurare lo spettro della radiazione, almeno per quanto riguarda la regione visibile dello spettro elettromagnetico e le regioni limitrofe dell’infrarosso e dell’ultravioletto. In questo paragrafo ne diamo una trattazione semplificata al fine di illustrare la connessione fra la definizione matematica di spettro e i risultati pratici delle misure. Facendo riferimento alla Fig. 2.5, la radiazione, proveniente da una sorgente di laboratorio oppure da un telescopio, viene convertita in un’onda piana per mezzo di un sistema di lenti e viene fatta incidere perpendicolarmente su un reticolo piano a trasparenza5, caratterizzato dalla presenza di N tratti separati l’uno dall’altro dalla distanza d, detta costante del reticolo. Sul piano del reticolo, il campo elettrico associato alla radiazione sia descritto dalla funzione E(t). I tratti del reticolo danno luogo al fenomeno della diffrazione e l’espressione per l’onda diffratta pu` o essere calcolata attraverso il principio di Huygens5
Il reticolo piano a trasparenza `e il tipo pi` u semplice di reticolo di diffrazione. In pratica si possono utilizzare molti altri tipi di reticolo (a riflessione, a gradinata, a dente di sega, di trasparenza e fase, circolare, concavo, etc.).
30
CAPITOLO 2
Fresnel. Per il caso di un reticolo ideale a trasparenza, il principio pu`o enunciarsi dicendo che ciascun tratto del reticolo `e l’asse di un’onda cilindrica la cui ampiezza, sulla faccia di emergenza del reticolo, `e semplicemente data da E(t) in corrispondenza delle zone di trasparenza ed `e nulla in corrispondenza di quelle opache. Andiamo a considerare l’onda diffratta dal tratto j-esimo del reticolo nella direzione che forma un angolo θ con la direzione dell’onda incidente. Alla distanza L dal reticolo, l’ampiezza di tale onda `e data, al tempo t, da un’espressione del tipo d sinθ L d Ej (t, θ) = k E t − − j , c c dove k `e una costante, in generale complessa6 , e dove l’indice j numera i tratti del reticolo a partire dal primo (si veda la Fig. 2.5). Sommando il contributo delle onde diffratte da tutti i tratti del reticolo ed esprimendo il campo elettrico dell’onda incidente attraverso il suo integrale di Fourier7 , si ottiene, con semplici passaggi E d (t, θ) =
N
∞
−∞
j=1
ˆ k E(ω, T ) e−i ω(t−L/c) e i j ω d sinθ/c dω .
La somma su j pu` o essere facilmente eseguita ricordando che, per una serie geometrica troncata, si ha 1 + q + q 2 + · · · + q N −1 =
1 − qN . 1−q
Si ottiene quindi d
∞
E (t, θ) = −∞
ˆ k E(ω, T ) e−i ω[t−(L+d sinθ)/c] f (ω, θ) dω ,
dove f (ω, θ) =
1 − e i N ω d sinθ/c . 1 − e i ω d sinθ/c
L’equazione ottenuta per E d (t, θ) definisce direttamente la trasformata di Fourier del campo elettrico diffratto in direzione θ. Con simboli evidenti si ha 6
Nel caso di un reticolo ideale a trasparenza si pu` o mostrare che k ` e data da a cosθ/λ dove a` e la dimensione della zona trasparente di ciascun tratto e λ ` e la lunghezza d’onda (si veda G. Toraldo di Francia, La Diffrazione della Luce, Edizioni Scientifiche Einaudi, Boringhieri, Torino, 1958). In pratica, la costante k dipende anche dai dettagli di costruzione del reticolo stesso.
7
Ci riferiamo qui al caso in cui la radiazione abbia un comportamento stazionario, per cui `e necessario riferirsi alla trasformata di Fourier relativa a un certo tempo di campionatura T .
SPETTRO E POLARIZZAZIONE
31
ˆ ˆ d (ω, θ, T ) = k E(ω, T ) e i ω (L+d sinθ)/c f (ω, θ) . E In altre parole, a parte un fattore di proporzionalit`a, la trasformata di Fourier del campo elettrico diffratto in direzione θ si ottiene moltiplicando la trasformata di Fourier del campo incidente per un fattore di fase e per la funzione complessa f (ω, θ), detta funzione di trasferimento del reticolo. In un comune spettroscopio, la radiazione diffratta dal reticolo viene focheggiata per mezzo di un sistema di lenti sul rivelatore8, il quale risponde con un segnale proporzionale al quadrato del campo elettrico su di esso incidente. Nel punto del rivelatore su cui va a cadere la radiazione proveniente dalla direzione θ si ha quindi un segnale, S(θ), che risulta dato dall’espressione S(θ) = K
T /2
E d (t, θ)2 dt ,
−T /2
dove K `e una costante che dipende dall’efficienza del rivelatore (oltre che dalle unit` a in cui si misura S), e dove T `e il tempo su cui si esegue la misura (il tempo di campionatura). Ricordando il teorema di Parseval nella forma dell’Eq. (2.5) e ponendo K = 4π K, si ottiene
S(θ) = K
0
∞
ˆ d (ω, θ, T )|2 dω = K |E
∞
ˆ k 2 |E(ω, T )|2 |f (ω, θ)|2 dω . (2.11)
0
Studiamo adesso l’andamento con θ della funzione |f (ω, θ)|2 a ω fissato. Dalla definizione si ottiene sin2 N ω2dcsinθ . |f (ω, θ)|2 = sin2 ω d2sinθ c Questa funzione presenta dei massimi molto elevati in corrispondenza di quei valori di sinθ tali da annullare il denominatore, ovvero per sinθm = m
2π c , ωd
(2.12)
dove m `e un intero qualsiasi (positivo, negativo o nullo) che caratterizza il cosiddetto ordine dello spettro9 . In corrispondenza di tali valori di θ si ha, con un passaggio al limite 8
Al giorno d’oggi il rivelatore ` e generalmente costituito da una camera CCD o da una serie di fotomoltiplicatori. Anteriormente venivano comunemente utilizzate le lastre fotografiche.
9
Si noti che sostituendo in luogo della frequenza angolare la lunghezza d’onda (ω = 2πc/λ), l’Eq. (2.12) pu` o esser posta nella forma d sinθm = mλ, che ` e l’equazione che risulta dalla teoria elementare del reticolo di diffrazione.
32
CAPITOLO 2
Fig. 2.6. Grafico del modulo quadro della funzione di trasferimento del reticolo. Il grafico `e ottenuto per N = 8. I reticoli comunemente usati in laboratorio e nella pratica astronomica hanno valori di N molto pi` u elevati. Un tipico reticolo per osservazioni solari ha N 10 5 .
|f (ω, θm )|2 = N 2 . Tali punti si chiamano massimi principali e si pu`o mostrare che fra due qualsiasi di essi si vengono a trovare (N − 1) zeri della funzione che corrispondono a valori di θ tali da annullare il numeratore ma non il denominatore. Il primo zero contiguo a θm si trova a una distanza Δθ tale che 1 ω d sin(θm + Δθ) = m+ π , 2c N ovvero, mediante uno sviluppo in serie 1 tanθm . (2.13) mN Fra gli (N − 1) zeri si trovano inoltre, per il teorema di Rolle, (N − 2) massimi della funzione che prendono il nome di massimi secondari e nei quali la funzione assume un valore dell’ordine dell’unit`a. Il grafico della funzione per N = 8 `e riportato nella Fig. 2.6. Come mostrato dalla figura, all’aumentare di N la funzione assume un comportamento del tipo di “pettine” di delta di Dirac. In prima approssimazione si ottiene, tenendo conto dell’altezza dei picchi e della loro larghezza Δθ =
|f (ω, θ)|2 =
N tanθm δ(θ − θm ) . m m
SPETTRO E POLARIZZAZIONE
33
Alternativamente, si pu` o anche studiare l’andamento della stessa funzione con ω, a θ fissato. Di nuovo si trova che la funzione presenta dei massimi molto elevati, nei quali assume il valore N 2 , in corrispondenza delle frequenze ωm date da ωm = m
2π c . d sinθ
Il primo zero contiguo a ωm si trova a una distanza in frequenza, Δω, tale che (ωm + Δω) d sinθ 1 = m+ π , 2c N ovvero, Δω =
2π c . N d sinθ
Di nuovo, si ottiene in prima approssimazione un comportamento a “pettine” di delta di Dirac espresso dall’equazione |f (ω, θ)|2 =
m
N
2π c δ(ω − ωm ) . d sinθ
Sostituendo questo risultato nell’Eq. (2.11) si ricava la seguente espressione per il segnale misurato dal rivelatore dello spettroscopio in corrispondenza della direzione θ S(θ) = K k 2 N
2π c |E(ωm , T )|2 . d sinθ m
Messi a parte i possibili problemi derivanti dalla sovrapposizione degli spettri di ordine diverso, questa formula mostra che, se ci si restringe a considerare intervalli di θ sufficientemente piccoli (in modo da poter trascurare la leggera dipendenza da θ contenuta nel fattore k 2 / sinθ), il segnale ottenuto sul rivelatore dello spettroscopio fornisce effettivamente una misura del modulo quadro della trasformata di Fourier del campo elettrico della radiazione incidente, ovverosia del suo spettro. In altre parole, lo spettroscopio funziona come un dispositivo capace di eseguire in maniera analogica la trasformata di Fourier del campo elettrico incidente. Si noti anche che il segnale S(θ) `e proporzionale al tempo della misura, T , tale dipendenza essendo contenuta nel modulo quadro della trasformata di Fourier (si ricordino i risultati del Par. 2.3, e in particolare l’Eq. (2.7)). La teoria dello spettroscopio a reticolo presentata sopra permette anche di determinare il potere risolutivo dello strumento. Se si suppone di avere in ingresso una radiazione composta da due onde puramente monocromatiche che differiscono in frequenza di una piccola quantit` a δω, esse saranno diffratte,
34
CAPITOLO 2
all’ordine m, lungo due direzioni che formano fra loro un angolo δθ. Differenziando l’Eq. (2.12) si ottiene δθ = tanθm
δω . ω
D’altra parte, affinch´e i corrispondenti segnali sul rivelatore appaiano distinti, `e necessario che l’angolo δθ sia maggiore della larghezza intrinseca di ciascun segnale, Δθ, data dall’Eq. (2.13). Si ottiene quindi la condizione δω 1 ≥ . ω mN Questo pone un limite inferiore alla differenza in frequenza, (δω)min , che si deve avere affinch´e i segnali appaiono distinti. Ovviamente si ha (δω)min 1 = . ω mN Per potere risolutivo di uno strumento si intende il rapporto fra la frequenza ω e tale minima differenza (δω)min . Il potere risolutivo dello spettroscopio a reticolo `e quindi dato da P = mN . Come esempio pratico, consideriamo un reticolo di diffrazione caratterizzato da un numero di tratti N = 105 e da una costante d = 1.5 μm. Se la radiazione incidente copre tutto l’intervallo visibile tra 3800 e 7000 ˚ A, lo spettro del primo ordine si trova compreso fra gli angoli di deflessione (θ1 )min = 14◦ .7 ,
(θ1 )max = 27◦ .8 ,
lo spettro del secondo ordine fra gli angoli (θ2 )min = 30◦ .4 ,
(θ2 )max = 69◦ .0 ,
mentre lo spettro del terzo ordine parte dall’angolo di deflessione (θ3 )min = 49◦ .5 , e si estende fino a θ = 90◦ , angolo cui corrisponde la lunghezza d’onda di 5000 ˚ A. Gli spettri di ordine superiore non sono osservabili. Infine, il potere risolutivo `e pari a 105 per lo spettro del primo ordine, 2 × 105 per lo spettro del secondo ordine e 3 × 105 per quello del terzo ordine. Intorno a 5000 ˚ A, ad esempio, due righe possono essere risolte nello spettro del secondo ordine solo se esse distano pi` u di 25 m˚ A.
SPETTRO E POLARIZZAZIONE
35
2.5 Polarizzazione di un’onda monocromatica I fenomeni di polarizzazione della radiazione elettromagnetica sono connessi col fatto che il vettore campo elettrico (o l’associato vettore campo magnetico) di un pennello di radiazione che si propaga nel vuoto pu` o essere diretto lungo una qualsiasi direzione appartenente al piano perpendicolare alla direzione di propagazione. Per descrivere tali fenomeni, iniziamo col considerare un’onda monocromatica piana di frequenza angolare ω che si propaga lungo la direzione z di un sistema di riferimento cartesiano ortogonale destrorso (x, y, z). Il vettore campo elettrico dell’onda pu` o essere scomposto nelle due componenti lungo gli assi x e y. In un punto assegnato dello spazio, tali componenti risultano descritte da espressioni del tipo Ex (t) = E1 cos( ωt − φ1 ) ,
Ey (t) = E2 cos( ωt − φ2 ) ,
dove E1 , E2 , φ1 e φ2 sono quattro quantit` a reali. Alternativamente, si possono utilizzare quantit` a complesse scrivendo Ex (t) = Re[ E1 e−i ω t ] ,
Ey (t) = Re[ E2 e−i ωt ] ,
dove E1 = E1 ei φ1 ,
E2 = E2 ei φ2 .
L’estremo del vettore campo elettrico ruota nel piano x-y descrivendo un’ellisse che viene detta ellisse di polarizzazione. Per renderci conto di questo fatto, consideriamo l’equazione generale di un’ellisse riferendola ai suoi assi principali x e y . In forma parametrica l’equazione dell’ellisse `e Ex = E0 cosγ cos(ωt) ,
Ey = −E0 sinγ sin(ωt) ,
dove E0 `e una quantit` a reale e positiva e dove γ (con |γ | ≤ π/4) `e un parametro connesso con l’eccentricit` a dell’ellisse ( | tanγ | essendo il rapporto fra i semiassi). Nell’equazione precedente abbiamo assunto che, all’istante t = 0, il campo elettrico sia diretto lungo l’asse positivo x . Eliminando t, si ottiene
E02
Ey2 Ex2 + 2 =1 . 2 cos γ E0 sin2 γ
I semiassi dell’ellisse valgono rispettivamente E0 | cosγ | e E0 | sinγ |; se γ `e positivo l’ellisse `e percorsa in senso orario, ammesso che la rotazione sia osservata da una persona che veda la radiazione venirgli incontro. La situazione geometrica `e rappresentata nella Fig. 2.7, nella quale l’asse z esce dal foglio provenendo da dietro. Se il vettore campo elettrico `e visto ruotare in senso orario si dice
36
CAPITOLO 2
y
y’ E
x’
ξ x
Fig. 2.7. Al trascorrere del tempo l’estremo del vettore campo elettrico descrive l’ellisse di polarizzazione
che si ha a che fare con polarizzazione ellittica positiva (o destrorsa); nel caso contrario si ha a che fare con polarizzazione ellittica negativa (o sinistrorsa). Si possono avere due casi particolari (o degeneri) di polarizzazione ellittica: se γ = ±π/4, l’ellisse degenera in un cerchio e la polarizzazione viene detta circolare (destra e sinistra, rispettivamente). Se invece γ = 0, l’ellisse degenera in un segmento e la polarizzazione viene detta lineare (o rettilinea). Per connettere le caratteristiche geometriche dell’ellisse (ampiezza, E0 , azimut del semiasse maggiore, ξ, e rapporto fra i semiassi, tanγ) alle quantit` a E1 , dal sistema (x , y ) al sistema E2 , φ1 e φ2 , trasformiamo le componenti di E (x, y). Con riferimento alla Fig. 2.7 si ha Ex = Ex cosξ − Ey sinξ ,
Ey = Ex sinξ + Ey cosξ ,
e, sostituendo Ex = E0 [ cosγ cosξ cos(ωt) + sinγ sinξ sin(ωt) ] , Ey = E0 [ cosγ sinξ cos(ωt) − sinγ cosξ sin(ωt) ] . Identificando queste espressioni con quelle date precedentemente, si ottengono le relazioni che connettono le quantit` a E1 , E2 , φ1 e φ2 con i parametri dell’ellisse E1 cos φ1 = E0 cosγ cosξ ,
E1 sin φ1 = E0 sinγ sinξ ,
E2 cos φ2 = E0 cosγ sinξ ,
E2 sin φ2 = −E0 sinγ cosξ .
Quadrando le quattro equazioni si ottiene
SPETTRO E POLARIZZAZIONE
37
E02 = E12 + E22 ; moltiplicando la prima per la quarta e sottraendo il prodotto della seconda per la terza sin(2γ) =
2E1 E2 sin(φ1 − φ2 ) ; E12 + E22
moltiplicando la prima per la terza e aggiungendo il prodotto della seconda per la quarta cos(2γ) sin(2ξ) =
2E1 E2 cos(φ1 − φ2 ) ; E12 + E22
sottraendo dalla somma dei quadrati delle prime due la somma dei quadrati delle ultime due cos(2γ) cos(2ξ) =
E12 − E22 ; E12 + E22
infine, dividendo fra di loro le due ultime equazioni ottenute tan(2ξ) =
2E1 E2 cos(φ1 − φ2 ) . E12 − E22
Le equazioni scritte permettono di ottenere i parametri dell’ellisse, (E0 , γ, ξ), a partire dalle quantit`a che descrivono l’oscillazione elettrica lungo gli assi x e y, (E1 , E2 , φ1 , φ2 ). Come si vede dalle equazioni precedenti, i parametri dell’ellisse dipendono solo dalla differenza di fase (φ1 − φ2 ) e non dalle fasi assolute. Fondamentali dal punto di vista della caratterizzazione delle propriet`a di polarizzazione di un’onda monocromatica piana sono le quattro quantit` a bilineari nelle componenti del campo elettrico che compaiono nelle equazioni precedenti, ovvero (E12 + E22 ), (E12 − E22 ), 2E1 E2 cos(φ1 − φ2 ), e 2E1 E2 sin(φ1 − φ2 ). La prima quantit` a, (E12 + E22 ), `e proporzionale al flusso di energia, ovvero all’energia che traversa l’unit`a di superficie nell’unit`a di tempo. Indichiamo tale flusso col simbolo10 FI . Attraverso le altre quantit` a si possono definire dei flussi associati che indichiamo con FQ , FU , e FV . Per la nostra onda monocromatica, ricordando la definizione del vettore di Poynting e tenendo conto che le funzioni sin2 (ω t) e cos2 (ω t) valgono in media 1/2, mediando su un periodo si ha FI = FU = 10
c (E 2 + E22 ) , 8π 1
c 2 E1 E2 cos(φ1 − φ2 ) , 8π
c (E 2 − E22 ) , 8π 1 c FV = 2 E1 E2 sin(φ1 − φ2 ) . 8π
FQ =
Nel Par. 2.1, nel quale abbiamo fatto astrazione dalle propriet` a di polarizzazione, tale quantit` a` e stata pi` u semplicemente indicata col simbolo F .
38
CAPITOLO 2
Bisogna notare che simboli I, Q, U e V , utilizzati come indici nelle equazioni precedenti, vengono comunemente utilizzati per denotare delle quantit`a fisiche diverse, legate alle prime da delle costanti moltiplicative dimensionali. Tali quantit` a sono i cosiddetti parametri di Stokes, usualmente introdotti nella teoria del trasporto radiativo per radiazione polarizzata, che hanno le dimensioni dell’intensit` a specifica del campo di radiazione e che sono quindi dimensionalmente uguali a un’energia per unit` a di superficie, per unit`a di tempo, per unit` a di intervallo spettrale e per unit`a di angolo solido. Nel seguito ci riferiremo a FI , FQ , FU e FV come ai flussi (di energia) nei quattro parametri di Stokes. Invertendo le equazioni precedenti si possono legare le caratteristiche geometriche dell’ellisse di polarizzazione ai flussi nei parametri di Stokes. Si ottiene, con facili passaggi E02 =
8π FI , c
cos(2γ) sin(2ξ) =
sin(2γ) = FU , FI
FV , FI tan(2ξ) =
cos(2γ) cos(2ξ) =
FQ , FI
FU . FQ
A seconda dei valori dei flussi nei parametri di Stokes, l’ellisse di polarizzazione assume forme diverse, e, viceversa, ogni ellisse di polarizzazione `e caratterizzata da una particolare quaterna di flussi nei parametri di Stokes. In particolare, se l’ellisse degenera in una circonferenza (γ = ±π/4), si ha che FQ = FU = 0, FV = ±FI , il segno pi` u riferendosi a una circonferenza percorsa in senso orario (per un osservatore che veda avvicinarsi l’onda) e il segno meno a una circonferenza percorsa in senso antiorario. In questo caso si parla di polarizzazione circolare pura, positiva e negativa (oppure destrorsa e sinistrorsa), rispettivamente. Se invece l’ellisse degenera in un segmento (γ = 0), si ha FV = 0 e FQ2 + FU2 = FI2 , i valori di FQ e FU essendo legati all’angolo ξ che il segmento forma con l’asse x. In questo caso si parla di polarizzazione lineare (o rettilinea) pura. I flussi nei parametri di Stokes, possono anche essere espressi in termini delle ampiezze complesse E1 e E2 introdotte precedentemente. Si ha infatti, come `e facile verificare c (E ∗ E1 + E2∗ E2 ) , 8π 1 c (E ∗ E2 + E2∗ E1 ) , FU = 8π 1 FI =
c (E ∗ E1 − E2∗ E2 ) , 8π 1 c i (E1∗ E2 − E2∗ E1 ) . FV = 8π
FQ =
(2.14)
Possiamo infine osservare che i flussi nei parametri di Stokes di un’onda monocromatica piana non sono indipendenti fra loro. Quadrando infatti le espressioni precedenti, `e facile verificare per mezzo di semplici passaggi algebrici che i flussi nei parametri di Stokes sono legati dalla relazione FI2 = FQ2 + FU2 + FV2 .
(2.15)
39
SPETTRO E POLARIZZAZIONE
Questa relazione `e tipica delle onde monocromatiche le quali, per loro natura, sono sempre polarizzate. In altre parole, `e impossibile rappresentare una radiazione priva di polarizzazione (avente cio`e FQ = FU = FV = 0) per mezzo di un’onda monocromatica. La relazione precedente traduce in termini matematici il fatto che sono sufficienti tre soli parametri geometrici, che possono essere ad esempio l’ampiezza, il rapporto fra il semiasse maggiore e il semiasse minore, e l’inclinazione dell’asse maggiore, per definire completamente l’ellisse di polarizzazione.
2.6 Misure spettropolarimetriche L’onda monocromatica piana considerata nel paragrafo precedente ha un carattere di polarizzazione perfettamente definito. Essa rappresenta tuttavia un caso estremamente particolare. In tutta generalit`a possiamo assumere che le due componenti del vettore campo elettrico lungo due direzioni, x e y, perpendicolari alla direzione z di propagazione di un pennello di radiazione elettromagnetica, siano descritte da due funzioni arbitrarie del tempo, E1 (t) e E2 (t). Dall’andamento di queste due funzioni dipendono non solo lo spettro, ma anche le caratteristiche di polarizzazione della radiazione. Per le due funzioni E1 (t) e E2 (t), facendo riferimento a un fenomeno di tipo stazionario e al tempo di campionatura T , definiamo le rispettive trasformate di Fourier secondo l’Eq. (2.4)
ˆ1 (ω, T ) = 1 E 2π
T /2
−T /2
E1 (t) e
iωt
dt ,
ˆ2 (ω, T ) = 1 E 2π
T /2
−T /2
E2 (t) ei ω t dt .
A partire da queste definizioni possiamo generalizzare le varie equazioni che abbiamo dedotto precedentemente introducendo, in luogo del flusso monocromatico Fω , il flusso monocromatico nei singoli parametri di Stokes. Generalizzando l’Eq. (2.6), relativa a un segnale di tipo stazionario, si ottiene c T c FωQ = T c FωU = T c FωV = T FωI =
ˆ2 (ω, T )∗ E ˆ2 (ω, T )) , (Eˆ1 (ω, T )∗ Eˆ1 (ω, T ) + E ˆ2 (ω, T )∗ E ˆ1 (ω, T ) − E ˆ2 (ω, T )) , (Eˆ1 (ω, T )∗ E ˆ1 (ω, T )∗ E ˆ2 (ω, T )∗ E ˆ2 (ω, T ) + E ˆ1 (ω, T )) , (E ˆ2 (ω, T )∗ E ˆ2 (ω, T ) − E ˆ2 (ω, T )) . i (Eˆ1 (ω, T )∗ E
Generalizzando l’Eq. (2.8), relativa a un segnale stocastico, si ottiene
(2.16)
40
CAPITOLO 2
FωI = c Ntot fˆ1 (ω)∗ fˆ1 (ω) + fˆ2 (ω)∗ fˆ2 (ω)
,
FωQ = c Ntot fˆ1 (ω)∗ fˆ1 (ω) − fˆ2 (ω)∗ fˆ2 (ω)
,
FωU = c Ntot fˆ1 (ω)∗ fˆ2 (ω) + fˆ2 (ω)∗ fˆ1 (ω)
,
FωV = c Ntot i fˆ1 (ω)∗ fˆ2 (ω) − fˆ2 (ω)∗ fˆ1 (ω)
.
(2.17)
Infine, generalizzando l’Eq. (2.10) relativa a un segnale periodico, si ottiene FωI =
∞ c (n)∗ (n) (n)∗ (n) E1 E1 + E 2 E2 δ(ω − n ω0 ) , 2π n=1
FωQ =
∞ c (n)∗ (n) (n)∗ (n) E1 E1 − E2 E2 δ(ω − n ω0 ) , 2π n=1
FωU =
∞ c (n)∗ (n) (n)∗ (n) E1 E2 + E 2 E1 δ(ω − n ω0 ) , 2π n=1
FωV =
∞ c (n)∗ (n) (n)∗ (n) i E1 E2 − E2 E1 δ(ω − n ω0 ) . 2π n=1
(2.18)
Le equazioni precedenti mostrano che la caratterizzazione polarimetrica della radiazione elettromagnetica implica la determinazione di prodotti bilineari di ˆi (ω)∗ E ˆj (ω) con i, j = 1, 2. Nella regione ratrasformate di Fourier del tipo E dio dello spettro elettromagnetico, a frequenze minori o dell’ordine del GHz, questo pu`o essere realizzato andando a misurare direttamente i campi elettrici E1 (t) e E2 (t) per mezzo di due antenne disposte lungo gli assi x e y e ricavando poi le espressioni bilineari stesse mediante procedure di tipo elettronico. Per la regione visibile dello spettro elettromagnetico, e per le regioni limitrofe dell’ultravioletto e dell’infrarosso, questo non `e per`o possibile a causa dell’elevata frequenza della radiazione (ν 1015 Hz). Come abbiamo gi` a detto, in queste regioni dello spettro elettromagnetico le misure di campo elettrico vengono realizzate attraverso dei rivelatori (camere CCD, fotomoltiplicatori, lastre fotografiche, etc.) che danno un segnale proporzionale all’energia incidente, e quindi al quadrato del campo elettrico. Quello che si ottiene dalle misure `e quindi soltanto un tipo di informazione che si riferisce a integrali del tipo
T /2
−T /2
E1 (t)2 + E2 (t)2 dt ,
dove T `e il tempo di esposizione del rivelatore. Limitandoci a considerare fenomeni di tipo stazionario, ricordando il teorema di Parseval nella forma dell’Eq. (2.5), e isolando il contributo della radiazione contenuta in un intervallo
SPETTRO E POLARIZZAZIONE
41
x Ep α
E y
E1
E2
Fig. 2.8. Il filtro polarizzante `e disposto lungo una direzione che forma l’angolo α con l’asse x. La radiazione proviene da dietro il foglio.
di frequenza Δω centrato intorno alla frequenza ω, il segnale del rivelatore pu` o essere espresso nella forma
ˆ1 (ω, T )∗ E ˆ2 (ω, T )∗ E ˆ1 (ω, T ) + E ˆ2 (ω, T ) , S=K E dove K `e una costante dimensionale che dipende dalla sensibilit`a del rivelatore, dalle unit` a di misura in cui si misura il segnale e dall’ampiezza dell’intervallo di frequenza considerato. Questa formula mostra che, senza ricorrere a ulteriori dispositivi, le uniche misure che si possono realizzare sono quelle del flusso monocromatico FωI . Le misure di polarizzazione si ottengono interponendo sul cammino della radiazione degli opportuni dispositivi che alterano le caratteristiche di polarizzazione della radiazione incidente in maniera nota a priori. Questi dispositivi sono i filtri polarizzanti (o semplicemente polarizzatori) e le lamine di ritardo. I filtri polarizzanti (ideali) godono della propriet` a di essere completamente trasparenti alla radiazione il cui vettore campo elettrico vibri lungo una particolare direzione (detta direzione di accettazione o di trasparenza del filtro) e completamente opachi alla radiazione il cui vettore campo elettrico vibri lungo la direzione a essa perpendicolare. Se si dispone quindi il filtro in modo tale che la direzione di accettazione formi un angolo α con l’asse x (si veda la Fig. 2.8 per le convenzioni adottate), il rivelatore risponder`a con un segnale del tipo ˆp (ω, T )∗ E ˆp (ω, T ) , S(α) = K E
(2.19)
ˆp (ω, T ) `e la trasformata di Fourier della proiezione del campo elettrico dove E lungo l’asse di accettazione del polarizzatore. Con riferimento alla Fig. 2.8, tale trasformata pu` o essere espressa nella forma (ovviamente le trasformate delle componenti di un vettore si trasformano come le componenti stesse per rotazioni del sistema di riferimento) ˆp (ω, T ) = cosα E ˆ1 (ω, T ) + sinα Eˆ2 (ω, T ) , E
42
CAPITOLO 2
per cui si ottiene ˆ1 (ω, T )∗ E ˆ2 (ω, T )∗ E ˆ1 (ω, T ) + sin2 α E ˆ2 (ω, T )+ S(α) = K cos2 α E ˆ2 (ω, T )∗ E ˆ2 (ω, T ) + E ˆ1 (ω, T ) ˆ1 (ω, T )∗ E . + sinα cosα E Invertendo le Eq. (2.16) e sostituendo nell’equazione precedente, il segnale S(α) pu` o essere espresso attraverso i flussi monocromatici nei parametri di Stokes. Si ottiene S(α) = K FωI + cos(2α) FωQ + sin(2α) FωU , dove K `e una nuova costante. Da questa equazione si vede che i flussi monocromatici nei parametri di Stokes Q e U possono essere definiti operativamente mediante le equazioni
FωQ =
1 [S(0◦ ) − S(90◦ )] , 2 K
FωU =
1 [S(45◦ ) − S(135◦)] . 2 K
Il flusso monocromatico nel parametro di Stokes Q, rappresenta quindi la differenza fra il segnale misurato dal rivelatore a valle di un filtro polarizzante orientato sotto l’angolo α = 0◦ (direzione di accettazione coincidente con l’asse x) e il segnale misurato a valle di un filtro polarizzante orientato sotto l’angolo α = 90◦ (direzione di accettazione coincidente con l’asse y). Il significato dell’altro flusso monocromatico, quello nel parametro di Stokes U , `e del tutto analogo con gli angoli di orientazione del polarizzatore sostituiti da 45 ◦ (direzione di accettazione coincidente con la bisettrice degli assi x e y) e 135 ◦ (direzione di accettazione coincidente con la bisettrice degli assi −x e y), rispettivamente. Riguardo al flusso monocromatico nel parametro di Stokes I, si ha 1 [S(α) + S(α + 90◦ )] , 2 K con α qualsiasi. Alternativamente, la stessa quantit` a si pu` o misurare pi` u semplicemente senza interporre alcun filtro polarizzante (ideale). Da questo si vede che il flusso monocromatico nel parametro di Stokes I coincide col flusso monocromatico convenzionale. Le espressioni dedotte precedentemente mostrano che il flusso monocromatico nel parametro di Stokes V non pu` o essere misurato disponendo solamente di un filtro polarizzante. Per la sua misura `e necessario introdurre un ulteriore dispositivo, la lamina di ritardo. In generale, si pu` o definire lamina di ritardo (ideale) un dispositivo che scompone il fascio di radiazione entrante in due fasci distinti, caratterizzati da polarizzazioni diverse, sfasa un fascio rispetto FωI =
SPETTRO E POLARIZZAZIONE
43
all’altro, e ricompone infine in uscita i due fasci per formarne uno nuovo la cui polarizzazione `e diversa dalla polarizzazione del fascio in ingresso. In pratica, una lamina di ritardo pu` o essere realizzata attraverso un cristallo birifrangente caratterizzato da due assi perpendicolari fra loro e perpendicolari al suo asse ottico. Uno dei due assi `e detto asse veloce (fast axis) mentre l’altro `e detto asse lento (slow axis). Le componenti del campo elettrico lungo l’asse veloce e l’asse lento si propagano lungo l’asse ottico con indici di rifrazione diversi, nf e ns , rispettivamente, con ns > nf . Questa differenza fra gli indici di rifrazione provoca all’interno della lamina uno sfasamento (o ritardo) δ tale che, ˆf (ω) e E ˆs (ω) sono le trasformate di Fourier delle componenti del vettore se E campo elettrico lungo i due assi all’ingresso della lamina, le stesse trasformate ˆf (ω) e E ˆs (ω) , sono date (a meno di un fattore di fase all’uscita dalla lamina, E inessenziale) da ˆf (ω) = E ˆf (ω) , E
ˆs (ω) = E ˆs (ω) ei δ , E
dove δ = 2π (ns − nf ) L/λ , essendo L lo spessore geometrico della lamina e λ = 2π c/ω la lunghezza d’onda della radiazione. Se δ = π/2 si dice che si ha a che fare con una lamina a quarto d’onda, se δ = π con una lamina a mezz’onda, e cos`ı via. Si pu` o mostrare facilmente che una lamina a quarto d’onda trasforma un fascio polarizzato circolarmente in un fascio polarizzato linearmente (con direzioni che differiscono di 90 ◦ per polarizzazione circolare destra o sinistra, rispettivamente) e che una lamina a mezz’onda ruota di 90◦ la direzione della polarizzazione lineare (quando tale direzione coincide con la bisettrice dell’angolo compreso fra l’asse veloce e l’asse lento). Si noti inoltre che il ritardo di una lamina dipende fortemente da λ, da cui la difficolt` a che risulta nel costruire delle lamine cosiddette acromatiche (ovvero per le quali il ritardo sia indipendente dalla lunghezza d’onda). Supponiamo adesso di disporre di una lamina a quarto d’onda e inseriamola lungo il fascio in modo che l’asse veloce sia diretto lungo l’asse x. Facciamo poi seguire ad essa il polarizzatore, orientato di nuovo sotto un angolo α come ˆ2 (ω, T ) sono le trasformate di Fourier delle mostrato in Fig. 2.8. Se Eˆ1 (ω, T ) e E componenti del campo elettrico lungo gli assi x e y all’ingresso della lamina, le componenti all’uscita della lamina sono date (a meno di un inessenziale ˆ2 (ω, T ) ei π/2 = i E ˆ2 (ω, T ), rispettivamente. La fattore di fase) da Eˆ1 (ω, T ) e E trasformata di Fourier della proiezione del vettore campo elettrico lungo l’asse di accettazione del polarizzatore `e quindi data da ˆp (ω, T ) = cosα Eˆ1 (ω, T ) + i sinα E ˆ2 (ω, T ) . E Il rivelatore risponder` a con un nuovo segnale, T (α), ancora dato dal secondo membro dell’Eq. (2.19). Con la presente espressione per Eˆp (ω, T ) si ottiene
44
CAPITOLO 2
ˆ2 (ω, T )∗ E ˆ2 (ω, T ) T (α) = K cos2 α Eˆ1 (ω, T )∗ Eˆ1 (ω, T ) + sin2 α E ˆ2 (ω, T )∗ E ˆ2 (ω, T ) + E ˆ1 (ω, T ) ˆ1 (ω, T )∗ E , + i sinα cosα E ovvero, in termini di flussi monocromatici nei parametri di Stokes T (α) = K FωI + cos(2α) FωQ + sin(2α) FωV . Il flusso monocromatico nel parametro di Stokes V pu` o quindi essere definito operativamente dalla relazione 1 [T (45◦ ) − T (135◦)] . 2 K In pratica, le operazioni schematiche che abbiamo descritto per la misura dei flussi nei parametri di Stokes vengono realizzate per mezzo di opportuni strumenti detti polarimetri. Tali strumenti sono realizzati per mezzo di una o pi` u lamine di ritardo e da un polarizzatore di uscita. Quando si intenda eseguire sia l’analisi polarimetrica che l’analisi spettroscopica della radiazione, in genere si fa precedere la prima alla seconda, nel senso che la radiazione traversa il polarimetro prima di entrare nello spettroscopio. Il polarizzatore di uscita del polarimetro viene generalmente tenuto in posizione fissa perch´e un ordinario reticolo di diffrazione `e sensibile in maniera considerevole alla polarizzazione della radiazione che incide su di esso. FωV =
2.7 Propriet` a dei parametri di Stokes Come abbiamo visto nel Par. 2.5, un’onda monocromatica presenta sempre un carattere di polarizzazione ben definito. La cosa cessa di essere valida quando si considera un pennello di radiazione avente carattere stocastico. Per dimostrare questa propriet`a, consideriamo la quantit` a 2 2 2 2 P = FωI − FωQ − FωU − FωV . Sostituendo le espressioni delle Eq. (2.17) relative a un segnale stocastico, e sviluppando i calcoli si ottiene 2 P = 4 c2 Ntot [ f1∗ f1
f2∗ f2 − f1∗ f2
f2∗ f1 ] ,
dove, per non appesantire troppo le notazioni, abbiamo indicato con fi (i = 1, 2) le trasformate di Fourier fˆi (ω). Introduciamo adesso la quantit`a complessa A definita dall’equazione A = f2 f1∗ f1 − f1 f1∗ f2
.
45
SPETTRO E POLARIZZAZIONE
Per la media statistica del suo modulo quadro si ottiene, con facili passaggi |A|2 = f1∗ f1 f1∗ f1
f1∗ f1
e |A| e poich´e le quantit`a diseguaglianza di Cauchy-Schwarz f1∗ f1
2
f2∗ f2 − f1∗ f2
f2∗ f1
,
sono entrambe positive, se ne deduce la
f2∗ f2 − f1∗ f2
f2∗ f1 ≥ 0 ,
la quale, sostituita nell’espressione per P ottenuta precedentemente, implica
FωI
2
2 2 2 − FωQ − FωU − FωV ≥ 0 .
Si noti che il segno di uguaglianza vale soltanto quando la quantit` a A `e nulla, ovvero quando il rapporto fra le trasformate f1 e f2 `e tale da soddisfare l’equazione f1 = f2
f1∗ f1 f1∗ f2
.
In questo caso le trasformate delle due componenti dei segnali elementari lungo gli assi x e y sono caratterizzate dall’avere un rapporto fra le ampiezze costante e una differenza di fase anch’essa costante. Il caso dell’onda monocromatica considerato precedentemente `e un caso particolare di questa situazione. Il caso opposto `e invece quello in cui le trasformate delle due componenti sono caratterizzate dall’avere ampiezze medie uguali f1∗ f1 = f2∗ f2
,
e una relazione di fase aleatoria, dimodoch´e f1∗ f2 = f2∗ f1 = 0 . In questo caso si ha FωQ = FωU = FωV = 0 , e si dice che si ha a che fare con radiazione non polarizzata, oppure con radiazione naturale. Come abbiamo visto, i flussi nei parametri di Stokes necessitano di una direzione di riferimento per la loro definizione. Tale direzione `e arbitraria, dimodoch´e `e sempre necessario specificare chiaramente qual’`e la direzione di riferimento scelta quando si introducono tali quantit` a sia in calcoli teorici che in esperimenti di laboratorio o in osservazioni astronomiche. Nella pratica dell’astronomia notturna, ad esempio, `e invalso l’uso di scegliere come direzione di riferimento il meridiano passante per l’oggetto osservato. In fisica solare, o nell’osservazione di oggetti estesi, si possono scegliere direzioni di riferimento
46
CAPITOLO 2
x
x’
θ y
y’ Fig. 2.9. Una rotazione del sistema di riferimento implica una trasformazione dei flussi nei parametri di Stokes Q e U . La radiazione proviene da dietro il foglio.
diverse, appropriate alla geometria del particolare fenomeno in studio. Ad esempio, quando si osserva la polarizzazione al lembo solare, `e abitudine scegliere come direzione di riferimento la tangente al lembo stesso. Al cambiare del sistema di riferimento, i parametri di Stokes si trasformano mediante semplici relazioni lineari. Per vederlo, riferiamoci alla Fig. 2.9 e siano FωI , FωQ , FωU , FωV i flussi nei parametri di Stokes relativi alla direzione di riferimento x. Se (FωI ) , (FωQ ) , (FωU ) , (FωV ) sono i flussi nei parametri di Stokes relativi alla direzione x , ruotata di un angolo θ rispetto a x (in senso antiorario guardando la sorgente di radiazione), le leggi di trasformazione si trovano facilmente osservando che f1 = cosθf1 + sinθf2 ,
f2 = cosθf2 − sinθf1 .
Sostituendo nelle Eq. (2.17) si ottiene (FωI ) = FωI ,
(FωQ ) = cos(2θ) FωQ + sin(2θ) FωU ,
(FωU ) = cos(2θ) FωU − sin(2θ) FωQ ,
(FωV ) = FωV .
Al cambiare della direzione di riferimento solo i flussi nei parametri di Stokes relativi alla polarizzazione lineare, FωQ e FωU , cambiano, trasformandosi l’uno nell’altro secondo le equazioni precedenti. Gli altri flussi (in intensit` a e in polarizzazione circolare) sono invece invarianti. Si noti che una rotazione di un angolo θ = π lascia tutto inalterato, il che significa che la direzione di riferimento `e definita a meno del senso. Osserviamo infine che, in pratica, i flussi nei parametri di Stokes vengono spesso denotati con i simboli I, Q, U , e V , senza specificare, in molti casi, se essi siano riferiti all’unit` a di intervallo di frequenza (o di frequenza angolare, o di lunghezza d’onda), oppure se siano riferiti, oppure no, all’unit` a di angolo solido. Spesso questo non provoca inconvenienti in quanto i risultati delle misure
SPETTRO E POLARIZZAZIONE
47
polarimetriche vengono generalmente espressi mediante i rapporti Q/I, U/I, e V /I che sono indipendenti da eventuali fattori di proporzionalit`a impliciti nelle diverse definizioni. Per uniformit` a di notazioni, osserviamo semplicemente che il simbolo Iν (e i corrispondenti simboli Qν , Uν e Vν ) dovrebbero essere riservati a esprimere l’energia della radiazione, avente frequenza compresa fra ν e ν +dν, e direzione compresa entro l’angolo solido unitario, che fluisce, nell’unit`a di tempo, attraverso l’unit` a di superficie unitaria disposta perpendicolarmente alla direzione della radiazione.
Capitolo 3
Radiazione di cariche elettriche in moto Una delle conseguenze pi` u importanti delle equazioni di Maxwell `e l’emissione di radiazione elettromagnetica da parte di particelle cariche in moto accelerato. In questo capitolo daremo una descrizione classica di tale fenomeno, mettendone in evidenza le caratteristiche generali riguardo alle sezioni d’urto e alle propriet` a spettrali e polarimetriche della radiazione emessa, sia nel caso di particelle non relativistiche, che nel caso di particelle relativistiche. In particolare descriveremo alcuni processi fisici fondamentali quali la diffusione Thomson e Rayleigh, e daremo una trattazione approfondita della radiazione di frenamento (in approssimazione non relativistica), della radiazione di ciclotrone e di quella di sincrotrone. L’ultima parte del capitolo `e dedicata allo studio dell’irraggiamento dovuto a un numero elevato di particelle e al suo sviluppo in onde multipolari.
3.1 Potenziali elettromagnetici dovuti a cariche e correnti r , t) e il campo maCome abbiamo visto nel Cap. 1, il campo elettrico E( r, t) nel punto di coordinate r e all’istante t possono essere dedotti gnetico B( r, t) e φ(r, t) in tutta generalit` a a partire dai potenziali elettromagnetici A( mediante le equazioni r, t) = −gradφ(r, t) − 1 ∂ A(r, t) , E( c ∂t
r , t) = rotA( r, t) . B(
Qualora si adotti il gauge di Lorenz, i potenziali elettromagnetici soddisfano le equazioni differenziali alle derivate parziali (Eq. (1.8) e (1.9)) r, t) − ∇2 A(
1 ∂2 4π A(r, t) = − j (r, t) , c2 ∂t2 c
(3.1)
∇2 φ(r, t) −
1 ∂2 φ(r, t) = −4π ρ(r, t) , c2 ∂t2
(3.2)
dove ρ(r, t) e j (r, t) sono la densit` a di carica e di corrente, rispettivamente, e la condizione supplementare dell’Eq.(1.7)
50
CAPITOLO 3
1 ∂ φ(r, t) = 0 . (3.3) c ∂t Per trovare la soluzione di questo sistema di equazioni differenziali `e conveniente rifarsi al caso statico. Consideriamo preliminarmente l’equazione statica per il potenziale scalare (equazione di Poisson) r, t) + divA(
∇2 φ(r ) = −4π ρ(r ) ,
(3.4)
e cerchiamo di risolverla per il caso particolare ∇2 φ(r ) = −4π δ(r ) ,
(3.5)
dove δ(r ) `e la funzione di Dirac tridimensionale definita, in coordinate cartesiane, da δ(r ) = δ(x) δ(y) δ(z). Per ovvie ragioni di simmetria, il potenziale φ dipende solo dal modulo del vettore r. In queste circostanze, l’operatore Laplaciano `e dato semplicemente da (si veda l’Eq. (6.7)) 1 d 2 2 d ∇ = 2 r , r dr dr e pu` o anche esprimersi nella forma pi` u compatta 1 d2 r . r dr2 L’equazione differenziale per φ risulta quindi, per r = 0 ∇2 =
(3.6)
1 d2 [ rφ(r) ] = 0 . r dr2 La soluzione pi` u generale di questa equazione `e della forma r φ(r) = a + b r , con a e b costanti arbitrarie, e si ottiene quindi, per r = 0, a +b . r La costante b fissa il valore del potenziale per r → ∞. Assumendo che il potenziale si annulli all’infinito, tale costante risulta nulla, per cui φ(r) =
a . r Per determinare il valore della costante a, si pu` o ricordare che l’operatore Laplaciano `e dato da φ(r) =
∇2 = div grad .
RADIAZIONE DI CARICHE IN MOTO
51
Applicando il teorema di Gauss a una sfera di raggio arbitrario centrata nell’origine e tenendo conto che grad
a a a = − 2 n = − 3 r , r r r
dove n `e il versore di r, si ottiene −4π a = −4π , ovvero a = 1. Abbiamo quindi ottenuto il risultato fondamentale che la soluzione dell’equazione differenziale (3.5) che soddisfa la condizione al contorno di annullarsi per r → ∞ `e φ(r ) =
1 . r
Questo risultato pu`o essere generalizzato per traslazione. Ovviamente, la soluzione dell’equazione ∇2 φ(r ) = −4π δ(r − r ) ,
(3.7)
che soddisfa la medesima condizione al contorno `e φ(r ) =
1 . |r − r |
Se infine osserviamo che si pu`o sempre scrivere ρ(r ) = ρ(r ) δ(r − r ) d3r , per la linearit` a dell’operatore Laplaciano, si ottiene che la soluzione dell’equazione differenziale (3.4) `e la seguente ρ(r ) 3 φ(r ) = d r . |r − r | Il risultato che abbiamo ottenuto `e molto intuitivo dal punto di vista fisico e poteva essere anticipato ricordando che una carica puntiforme, q, genera nello spazio un campo elettrico che discende da un potenziale della forma V = q/r, r essendo la distanza dalla carica. L’espressione data sopra altro non `e che la generalizzazione di quest’ultima formula al caso di una distribuzione continua di cariche. Qui abbiamo preferito darne una prova matematica pi` u formale utilizzando un metodo standard della risoluzione delle equazioni differenziali lineari non omogenee detto metodo della funzione di Green. Ritorniamo adesso al caso dipendente dal tempo e cominciamo col risolvere l’equazione
52
CAPITOLO 3
∇2 φ(r, t) −
1 ∂ φ(r, t) = −4π f (t) δ(r ) , c2 ∂t2
dove f (t) `e una funzione arbitraria del tempo. Come nel caso precedente, la funzione φ, per ovvie ragioni di simmetria, pu` o dipendere soltanto dal modulo del vettore r, oltre che, adesso, dal tempo. Esprimendo l’operatore ∇2 attraverso l’Eq. (3.6), l’equazione per φ(r, t) risulta, per r = 0 1 ∂2 1 ∂2 [ r φ(r, t) ] − 2 2 φ(r, t) = 0 , 2 r ∂r c ∂t ovvero
∂2 1 ∂2 [ r φ(r, t) ] = 0 . − ∂r2 c2 ∂t2
La soluzione pi` u generale di questa equazione `e della forma r φ(r, t) = g(t ± r/c) , dove g `e una funzione arbitraria del proprio argomento, ovvero φ(r, t) =
g(t ± r/c) . r
In analogia a quanto fatto nel caso stazionario, imponiamo la condizione nell’origine applicando il teorema di Gauss a una sfera di raggio infinitesimo. Si ottiene g(t) = f (t) , per cui la soluzione `e della forma φ(r, t) =
f (t ± r/c) . r
Delle due soluzioni che si sono cos`ı ottenute solo una, quella col segno meno, ha significato nel problema fisico che stiamo considerando. Confrontando il risultato del caso dipendente dal tempo con quello ottenuto nel caso statico, vediamo infatti che il potenziale a distanza r dall’origine e al tempo t ha la stessa espressione del potenziale del caso statico corrispondente alla carica f (t − r/c), ovvero alla carica che si trova nell’origine al cosiddetto tempo anticipato, t , definito da t = t −
r . c
Questo risultato trova una sua spiegazione naturale nel fatto che i segnali elettromagnetici si propagano con velocit`a c. La soluzione con il segno pi` u farebbe
RADIAZIONE DI CARICHE IN MOTO
53
intervenire il tempo ritardato, t + r/c, invece del tempo anticipato. Essa non ha un’interpretazione fisica diretta in questo problema e deve essere scartata. Ripetendo gli argomenti svolti nel caso stazionario, si trova che la soluzione dell’equazione differenziale (3.2) `e data dall’espressione ρ(r , t ) 3 φ(r, t) = d r , (3.8) |r − r | dove t `e il tempo anticipato definito da |r − r | . (3.9) c Mediante considerazioni del tutto analoghe, per il potenziale vettore soluzione dell’Eq. (3.1) si ottiene l’espressione j (r , t ) 3 r , t) = 1 A( d r . (3.10) c |r − r | t = t −
Prima di poter accettare le soluzioni date dalle Eq. (3.8) e (3.10) per i potenziali scalare e vettore `e per`o necessario verificare che tali soluzioni soddisfino la condizione imposta dal calibro di Lorenz (Eq. (3.3)). Diamo nel seguito la dimostrazione premettendo che, quando si ha a che fare con funzioni del tipo f (r, t ), oppure f (r , t ) con t tempo anticipato, il simbolo di derivata parziale diventa ambiguo perch´e le variabili r (o r ) e t non sono indipendenti. Se si d` a infatti, ad esempio, una variazione δr a r, si possono considerare alternativamente due tipi diversi di incremento della funzione, δf1 e δf2 , dati da δf1 = f (r + δr, t ) − f (r, t ) ,
δf2 = f (r + δr, t + δt ) − f (r, t ) ,
dove δt `e la variazione di t dovuta al δr. Indicheremo l’operazione di derivazione eseguita con l’incremento δf2 col consueto simbolo “∂” di derivata parziale. Viceversa, l’operazione di derivazione eseguita con l’incremento δf 1 sar` a indicata col simbolo “δ”. Fra le due operazioni di derivazione sussiste la relazione ∂ δ ∂t ∂ f (r, t ) = f (r, t ) + f (r, t ) . ∂xk δxk ∂xk ∂t C’`e da notare che per funzioni che dipendono solo da r (e non dal tempo), i due tipi di derivata, ∂ e δ, coincidono. r, t). Poich´e tale operazione Iniziamo col valutare la divergenza del vettore A( deve essere fatta a t costante, dall’Eq. (3.10) si ha ∂ jk (r , t ) 1 ∂ divA(r, t) = d3r . Ak (r, t) = ∂xk c ∂xk |r − r | k
k
54
CAPITOLO 3
Per valutare questo integrale teniamo conto del fatto che la dipendenza da xk `e contenuta sia nel denominatore che nel numeratore in quanto il tempo anticipato, t , dipende da |r − r | e quindi da xk . Se poi osserviamo che ∂ ∂ |r − r | = − |r − r | , ∂xk ∂xk pu` l’espressione per divA o anche essere posta nella forma r , t) = 1 divA( c
1 ∂ δ jk (r , t ) + − jk (r , t ) d3r . ∂xk |r − r | |r − r | δxk k
Il primo pezzo dell’integrale pu` o essere trasformato, per il teorema di Gauss, in un integrale di superficie. Supponendo che la densit`a di corrente si annulli sufficientemente all’infinito, l’integrale d`a risultato nullo, per cui δ 1 r, t) = 1 divA( jk (r , t ) d3r . c |r − r | δxk k
Valutiamo adesso il secondo termine della condizione di Lorenz. Per l’Eq.(3.8) si ha 1 ∂ ρ(r , t ) 3 1 ∂ φ(r, t) = d r . c ∂t c ∂t |r − r | Se adesso teniamo conto che, a r e r fissati, si ha ∂ ∂ ρ(r , t ) = ρ(r , t ) , ∂t ∂t si ottiene 1 ∂ φ(r, t) = c ∂t δ 1 1 ∂ = jk (r , t ) + ρ(r , t ) d3r . c |r − r | δxk ∂t
r , t) + divA(
(3.11)
k
D’altra parte, l’equazione di continuit` a della carica, scritta per il punto di coordinate r e l’istante t , risulta, nelle notazioni che abbiamo introdotto, δ ∂ jk (r , t ) + ρ(r , t ) = 0 , δxk ∂t k
per cui la parentesi graffa contenuta nell’Eq. (3.11) si annulla e la condizione di Lorenz risulta verificata.
55
RADIAZIONE DI CARICHE IN MOTO
3.2 I potenziali di Li´ enard e Wiechart Nel paragrafo precedente abbiamo trovato le espressioni dei potenziali scalare e vettore per una distribuzione arbitraria di cariche e correnti. Adesso andiamo ad applicare tali espressioni al caso particolare in cui sia presente una sola particella puntiforme, di carica e, mobile nel tempo secondo l’equazione oraria r0 (t). Per il moto della particella definiamo i vettori velocit`a e accelerazione secondo le consuete equazioni v (t) =
d r0 (t) , dt
a(t) =
d2 d v (t) = 2 r0 (t) . dt dt
Le densit` a di carica e corrente dovute alla particella puntiforme possono essere espresse in termini della funzione delta di Dirac tridimensionale. Si ha ρ(r, t) = e δ[ r − r0 (t)] ,
j (r, t) = e v (t) δ[ r − r0 (t)] ,
e si ottiene quindi, dalle Eq. (3.8) e (3.10) φ(r, t) = e
δ[r − r0 (t )] 3 d r , |r − r |
r, t) = e A( c
v (t ) δ[r − r0 (t )] 3 d r , |r − r |
dove t `e il tempo anticipato definito dall’Eq. (3.9). La presenza della funzione delta di Dirac permette di valutare facilmente gli integrali contenuti nelle espressioni precedenti. Ricordiamo che date due funzioni arbitrarie f (x) e g(x), per la funzione delta di Dirac unidimensionale si ha (si veda anche l’App. 3)
∞
f (x) δ[g(x)] dx = −∞
N
f (xi )
i=1
1 |g (xi )|
,
dove xi , con i = 1, . . . , N , sono le N soluzioni dell’equazione g(x) = 0 e dove g (x) `e la derivata della funzione g(x) rispetto alla variabile x. Per la delta di Dirac tridimensionale, l’equazione precedente si generalizza nella seguente espressione f (r ) δ[g(r )] d3r =
N
f (ri )
i=1
1 , |J(ri )|
dove ri , con i = 1, . . . , N , sono le N soluzioni dell’equazione vettoriale g (r ) = 0, e dove J `e lo Jacobiano della trasformazione r = g(r ), ovvero il determinante della matrice Jacobiana Jkl (r ) definita da Jkl (r ) =
∂gk (r ) . ∂xl
56
CAPITOLO 3
Punto in cui si calcola il campo all’istante t z
r
R = r −r 0(t’) Traiettoria y
n a
r 0 (t’) v x
Particella carica all’istante anticipato t’ Fig. 3.1. Geometria per il calcolo del campo elettromagnetico nel punto di coordinate r all’istante t. I vettori v e a sono, rispettivamente, la velocit` a e l’accelerazione della particella all’istante anticipato. Il versore n ` e diretto lungo la direzione che va dalla posizione della particella all’istante anticipato al punto in cui si calcola il campo.
Ritornando agli integrali che ci interessa calcolare, osserviamo preliminarmente che, dato che la velocit`a della particella `e necessariamente minore di c, l’equazione r − r0 (t ) = 0 ammette, a r e t fissati, una e una sola soluzione, schematicamente illustrata nella Fig. 3.1. Per non appesantire troppo il formalismo con nuove notazioni, indicheremo con r e con t il punto e l’istante corrispondenti a tale soluzione. Per quanto concerne la matrice Jacobiana, si ha Jjk =
∂ ∂ xj − [r0 (t )]j = δjk − [r0 (t )]j . ∂xk ∂xk
Tenendo conto della definizione del tempo anticipato (Eq. (3.9)) si ottiene ∂ ∂t ∂ vj ∂ [ r (t )] = [ r (t )] =− |r − r | , 0 j 0 j ∂xk ∂t ∂xk c xk dove vj `e la componente j-esima della velocit`a della particella valutata all’istante t . Per calcolare l’ultima derivata, posto = r − r , R
57
RADIAZIONE DI CARICHE IN MOTO
si ha ∂Ri = −δik , ∂xk per cui ∂ 2 ∂ R = ∂xk ∂xk
Ri Ri
= −2Rk ,
i
e quindi ∂ ∂ √ 2 Rk = −nk , R= R =− ∂xk ∂xk R dove abbiamo introdotto il versore n per indicare la direzione del vettore R. Tenendo conto di questo risultato, la matrice Jacobiana risulta Jjk = δjk −
vj nk . c
Possiamo adesso calcolare lo Jacobiano. Si ha ⎛
vx nx c ⎜ vy nx ⎜ J = det ⎜ − c ⎝ vz nx − c e, con semplici passaggi algebrici, 1−
vx ny − c vy ny 1− c vz ny − c
J =1−
vx nz − c vy nz − c vz nz 1− c
⎞ ⎟ ⎟ ⎟ , ⎠
v · n . c
La sostituzione di questi risultati negli integrali contenenti le delte di Dirac porta alle seguenti espressioni per i potenziali φ(r, t) =
e , κR
r, t) = e v , A( cκR
(3.12)
v · n , c
(3.13)
dove si `e posto κ=1−
e dove tutte le quantit` a che compaiono in queste equazioni, ovvero v , R, n, κ vanno valutate all’istante anticipato t soluzione dell’equazione implicita t = t −
|r − r0 (t )| . c
(3.14)
58
CAPITOLO 3
v
Fig. 3.2. I segnali emessi da una sorgente in movimento a tempi successivi, qui rappresentati sotto forma di onde sferiche, si infittiscono nella direzione della velocit` a e si diradano nella direzione opposta. In ogni caso, essendo la velocit` a v minore di c, ciascuna onda sferica contiene tutte quelle emesse a tempi successivi. Questa `e la ragione per cui l’Eq. (3.14) ammette una sola soluzione.
I potenziali che abbiamo ottenuto prendono il nome di potenziali di Li´enard e Wiechart. Essi fanno comparire nella loro espressione il fattore 1/κ che, come vedremo, `e di importanza fondamentale nel determinare le propriet`a di irraggiamento delle cariche in movimento. Il significato fisico di tale fattore pu` o essere intuitivamente compreso osservando che i segnali emessi da una sorgente in movimento si infittiscono nella direzione della velocit`a e si diradano nella direzione opposta, come esemplificato nella Fig. 3.2. Infine, `e interessante osservare che, nel caso statico, il potenziale scalare di Li´enard e Wiechart si riduce al potenziale dell’elettrostatica (in quanto κ = 1), mentre il potenziale vettore `e nullo, essendo v = 0.
3.3 Campo elettromagnetico di una carica in moto Il campo elettrico e il campo magnetico dovuti, nel punto di coordinate r e all’istante t, a una particella puntiforme di carica e mobile con legge oraria r0 (t), si ottengono applicando ai potenziali di Li´enard e Wiechart le equazioni generali che definiscono i potenziali scalare e vettore, ovvero r, t) = rotA( r , t) , B(
(3.15)
r, t) = −gradφ(r, t) − 1 ∂ A( r, t) . E( c ∂t
(3.16)
RADIAZIONE DI CARICHE IN MOTO
59
La determinazione dei campi risulta quindi un banale esercizio di derivazione. Tale esercizio presenta per`o alcune sottili difficolt` a matematiche che `e necessario illustrare in dettaglio. Cominciamo con l’osservare che i potenziali di Li´enard e Wiechart contengono al denominatore l’espressione κR e che tale espressione pu`o essere posta nella forma κR =
v · n v · R 1− R=R− . c c
Osserviamo inoltre che, dato un vettore della forma = xa − xb , X con xa e xb funzioni di un parametro arbitrario ζ, si ha ∂xb ∂ ∂xa − , X= ∂ζ ∂ζ ∂ζ per cui ∂xb ∂ 2 ∂xa X = 2X · − , ∂ζ ∂ζ ∂ζ con la notazione vers(X), si ha e quindi, introducendo il versore del vettore X ∂ ∂ √ 2 1 · ∂xa − ∂xb = vers(X) · ∂xa − ∂xb . X= 2X X = ∂ζ ∂ζ 2X ∂ζ ∂ζ ∂ζ ∂ζ Utilizzando questo risultato, si ottengono facilmente le espressioni sotto riportate ∂R = −n · v , ∂t
∂t 1 ∂R n · v =κ , =1+ =1− ∂t c ∂t c
∂t 1 1 v = , grad [ r0 (t ) ] = −[ gradR ] . = ∂t ∂t κ c ∂t Per l’ultima equazione, si ha infatti ∂ ∂ ∂t [r0 (t )]j = [r0 (t )]j = ∂xi ∂t ∂xi vj ∂R R ∂ =− = vj t− . ∂xi c c ∂xi
{grad [ r0 (t ) ]}ij =
D’altra parte,
60
CAPITOLO 3
gradR = grad| r − r0 (t ) | = n − grad [ r0 (t ) ] · n = n + [gradR]
v · n , c
dalla quale si ottiene n , κ che permette di riscrivere l’equazione per il gradiente di r0 (t ) nella forma gradR =
grad [r0 (t )] = −
n v . κc
Si ha inoltre = grad [ r − r0 (t ) ] = U + gradR
n v , κc
dove U `e il tensore unitario (Uij = δij ), e ancora 1 n R = − gradR = − , grad t = grad t − c c κc grad v = (grad t )
∂v n a , =− ∂t κc
∂R ∂R ∂t v · n = =− , ∂t ∂t ∂t κ
∂t ∂R ∂R v ∂v ∂v ∂t a = =− , = = , ∂t ∂t ∂t κ ∂t ∂t ∂t κ dove a `e l’accelerazione della particella al tempo anticipato t . Attraverso queste relazioni `e facile esprimere sia il gradiente che la derivata temporale del prodotto κR. Si ha
v · R grad(κR) = grad R − c
= gradR −
1 − 1 gradR · v , (gradv ) · R c c
ovvero n 1 v v 2 n v 2 n v 1 ) n , grad(κR) = + 2 (a · R ) n − − 2 = 1 − 2 − + (a · R κ c κ c c κ c κ c c2 κ 2 ∂ ∂ v · R n · v 1 + v . (κR) = R− =− − a · R ∂t ∂t c κ cκ cκ Siamo adesso in grado di calcolare il campo elettrico. Attraverso le Eq. (3.16) e (3.12) si ottiene
61
RADIAZIONE DI CARICHE IN MOTO
r , t) = −e grad E(
1 κR
e ∂ − 2 c ∂t
v κR
,
ovvero, r , t) = E(
e κ2 R 2
grad(κR) −
e c2 κ R
∂ ∂v e v + 2 2 2 (κR) . ∂t c κ R ∂t
Sostituendo le espressioni trovate precedentemente si ottiene infine v 2 n v 1 r , t) = e ) n − e a 1 − E( ( a · R − + κ2 R 2 c2 κ c κ c2 c2 κ 2 R 1 v2 n · v e v − a · R + . + 2 2 2 − c κ R κ κc κc L’espressione del campo elettrico contiene vari addendi di cui alcuni proporzionali a R−2 e altri proporzionale a R−1 . Raccogliendo i primi si ottiene il cosiddetto termine Coulombiano, talvolta anche detto termine di velocit` a, che generalizza alle cariche in movimento l’usuale espressione del campo Coulombiano dell’elettrostatica. Raccogliendo gli altri termini si ottiene invece il cosiddetto termine di radiazione, talvolta detto anche termine di accelerazione r , t)]Coul perch´e proporzionale all’accelerazione della carica. Indicando con [E( e [E(r, t)]rad i due contributi, per mezzo di semplici fattorizzazioni si ottiene n · v v2 v2 v e [E(r, t)]Coul = 3 2 κ+ − 2 1 − 2 n − , κ R c c c c ovvero, ricordando l’espressione di κ (Eq. (3.13)) v2 v r , t)]Coul = e [E( . 1 − n − κ3 R 2 c2 c
(3.17)
Analogamente r , t)]rad = [E(
e c2 κ 3 R
v n − (a · n ) − κ a , c
ovvero, come `e facile verificare, r , t)]rad = [E(
e n × c2 κ 3 R
v n − × a . c
(3.18)
L’espressione per il campo elettrico pu`o essere posta in forma alternativa introducendo le notazioni tipiche della meccanica relativistica. Definendo v β = , c
a ˙ β = , c
62
CAPITOLO 3
si ottiene
r , t) = E(
e κ3 R 2
)+ (1 − β 2 ) (n − β
e ˙ n × [(n − β ) × β ] . c κ3 R
(3.19)
L’espressione per il campo magnetico discende da calcoli simili. Attraverso le Eq. (3.15) e (3.12) si ha e v e e 1 B(r, t) = rot = rotv + grad × v . c κR c κR c κR D’altra parte, si ha rotv = [grad t ] × a = −
1 n × a , cκ
e quindi, utilizzando risultati precedenti
r , t) = − B(
e e n × a − 2 2 2 c κ R c κ R2
1 v 2 n v − + 2 (a · R ) n × v . 1− 2 c κ c c κ
In analogia a quanto fatto per il campo elettrico, separiamo nel secondo membro i termini proporzionali a R−2 da quelli proporzionali a R−1 . Si ottiene
r , t) = − B(
e c κ3 R 2
v v2 e κ n × a + (a · n ) n × . 1 − 2 n × v − 2 3 c c κ R c
e β˙ questa espressione pu`o essere posta nella forma In termini dei vettori β
r , t) = − B(
e 2 ˙ − (n · β ) n × β˙ + (β ˙ · n ) n × β , − e n × β (1−β ) n × β κ3 R 2 c κ3 R
ovvero, come `e facile verificare
r , t) = − B(
! e 2 ˙ + n × n × (β ×β ˙ ) − e n × β . (1 − β ) n × β κ3 R 2 c κ3 R
Attraverso questa espressione, e attraverso l’espressione che abbiamo prece r , t) (Eq. (3.19)), `e facile dimostrare la relazione dentemente trovato per E( notevole r , t) = n × E( r , t) , B(
(3.20)
RADIAZIONE DI CARICHE IN MOTO
63
la quale mostra che il modulo del vettore campo magnetico `e sempre minore o uguale al modulo del vettore campo elettrico. Notiamo infine che le Eq. (3.19) e (3.20) sono estremamente generali e, data l’invarianza relativistica delle equazioni di Maxwell, dalle quali siamo partiti per la loro deduzione, sono valide in un sistema di riferimento inerziale arbitrario. Considerandone il limite non relativistico al primo ordine in β, `e possibile mostrare che da esse si ottengono le ordinarie leggi dell’elettromagnetismo valide per fenomeni stazionari. La deduzione di questa propriet`a `e contenuta nell’App. 4.
3.4 Irraggiamento di una carica in moto Come abbiamo visto nel paragrafo precedente, il campo elettromagnetico prodotto da una carica in movimento consta di due termini, uno inversamente proporzionale a R2 e l’altro inversamente proporzionale a R. Ovviamente, il primo termine prevale per R tendente a zero, mentre il secondo termine prevale ` interessante calcolare il valore di R per il quale i per R tendente all’infinito. E due termini sono dello stesso ordine di grandezza. Indicando con Rc tale valore, si ha per esso e κ3 Rc2
ea c2 κ3 Rc
,
ovvero c2 . a Indicando con L le dimensioni tipiche della regione in cui si muove la carica e con τ il tempo caratteristico su cui avvengono variazioni significative del moto, si ha Rc
a
L , τ2
per cui c2 τ 2 . L D’altra parte, come vedremo meglio in seguito, la stessa carica irradia a frequenze caratteristiche ν c/τ , per cui la distanza critica Rc pu` o anche porsi nella forma λ2 /L, dove λ `e la lunghezza d’onda tipica della radiazione irraggiata dalla carica in moto. La regione dello spazio in cui R Rc viene detta la zona di radiazione. In tale zona il campo elettromagnetico `e dato dalle Eq. (3.18) e (3.20) che qui riscriviamo Rc
64
CAPITOLO 3
r , t) = E(
e n × c2 κ 3 R
v n − × a , c
r , t) = n × E( r , t) . B(
Bisogna ricordare a proposito di queste equazioni che le quantit` a R, κ, n, v e a che ivi compaiono devono essere valutate al tempo anticipato t . Tuttavia, quando ci si ponga a grande distanza dalla carica stessa, ovverosia quando sia verificata la diseguaglianza R L, si pu` o trascurare l’effetto del tempo anticipato sia sulla distanza R che sul versore n ed entrambe queste quantit` a possono quindi essere considerate costanti. Il primo fatto da osservare a proposito dei campi elettrico e magnetico nella zona di radiazione `e che essi sono perpendicolari fra loro, sono entrambi perpendicolari al versore n e sono uguali in modulo. Questa `e una caratteristica che abbiamo gi` a incontrato nel Par. 1.6 per le onde piane che si propagano nel che `e dato da vuoto. Il secondo fatto concerne il vettore di Poynting, S, = c E ×B = c E × (n × E) = c E 2 n . S 4π 4π 4π Il vettore di Poynting nel punto P `e quindi diretto secondo la direzione che va dalla carica al punto P stesso. Consideriamo adesso il caso non relativistico in cui v c. Quando questa diseguaglianza `e verificata, il campo elettrico, all’ordine pi` u basso in v/c, `e dato da r , t) = e n × [ n × a ] = − e [ a − (a · n ) n ] . E( c2 R c2 R Come risulta da questa espressione, il campo elettrico `e diretto perpendicolarmente a n e giace nel piano individuato da n e da a, l’accelerazione della particella al tempo anticipato. Se si desidera quindi calcolare la componente del vettore campo elettrico lungo un versore di polarizzazione ei (i = 1, 2) perpendicolare a n, si ha r , t) · ei = − e a · ei . E( c2 R
(3.21)
Inoltre, indicando con θ l’angolo compreso fra la direzione dell’accelerazione (all’istante anticipato) e la direzione n, si ha per il vettore di Poynting a distanza R dalla carica 2 2 2 = e a sin θ n . S 3 4π c R2
Questa equazione mostra che la potenza emessa dalla carica in movimento dipende dalla direzione come sin2 θ. Quando si riporta in grafico, per ogni direzione, un segmento proporzionale alla potenza emessa lungo la direzione stessa,
RADIAZIONE DI CARICHE IN MOTO
65
Fig. 3.3. Diagramma di radiazione (o diagramma d’antenna) di una particella non relativistica. L’accelerazione della particella ` e diretta lungo l’asse verticale. La potenza emessa lungo una direzione che forma l’angolo θ con l’accelerazione `e proporzionale al segmento disegnato in figura.
si ottiene un diagramma che `e detto diagramma di radiazione. Il diagramma relativo a una carica (non relativistica) accelerata `e mostrato nella Fig. 3.3. pu` La stessa equazione per S o essere utilizzata per trovare la potenza totale emessa dalla carica. Calcolando il flusso W del vettore di Poynting attraverso una sfera di raggio R, e tenendo conto che " 1 2 sin2 θ dΩ = , 4π 3 si ottiene la cosiddetta equazione (o formula) di Larmor 2 e 2 a2 . (3.22) 3 c3 Ritornando al caso generale, `e interessante osservare la presenza di un importante fenomeno fisico dovuto alla presenza del fattore 1/κ3 nelle espressioni trovate per il campo di radiazione. Se consideriamo, per semplicit` a, il caso di una carica la cui accelerazione sia parallela alla velocit`a, il vettore di Poynting, alla distanza R dalla carica e nella direzione individuata dal versore n, `e dato da W =
2 2 2 e2 a2 sin2 θ = e a sin θ n = S n , 4π c3 κ6 R2 4π c3 (1 − β cosθ)6 R2
dove β = v/c e dove θ `e l’angolo compreso fra n e la direzione della velocit`a (che coincide, a parte eventualmente il senso, con quella dell’accelerazione). Per
66
CAPITOLO 3
Fig. 3.4. Diagramma di radiazione di una particella relativistica avente β = 0.8. Sia l’accelerazione che la velocit` a della particella sono dirette lungo l’asse verticale, quest’ultima nel senso che va dal basso verso l’alto. La potenza emessa lungo una direzione che forma l’angolo θ con l’accelerazione (e la velocit` a) ` e proporzionale al segmento disegnato in figura.
valori di β diversi da zero, il diagramma di radiazione risulta profondamente modificato rispetto al diagramma di radiazione del caso non relativistico, come illustrato nella Fig. 3.4. La radiazione tende a concentrarsi nella direzione “in avanti” rispetto al moto della particella. Questo `e un tipico effetto relativistico, conosciuto sotto il nome di beaming effect, che diventa sempre pi` u cospicuo mano a mano che la velocit` a della particella si avvicina alla velocit` a della luce. L’ampiezza angolare del cono entro il quale si concentra la radiazione si pu`o stimare osservando che, per β 1, il fattore 1/κ presenta un massimo molto elevato per θ = 0. Ponendo, nell’intorno di θ = 0, cosθ 1 − θ 2/2, si ha 1 1 1 . 2 κ 1 − β + β θ /2 1 − β + θ2/2 Questa espressione pu`o anche essere posta nella forma 1 2 , 2 κ θ + θ02 dove si `e introdotto l’angolo θ0 dato da # θ0 = 2 (1 − β) . Ricordando l’espressione del fattore relativistico γ (fattore di Lorentz), dato da 1 , γ= # 1 − β2
RADIAZIONE DI CARICHE IN MOTO
67
Fig. 3.5. Diagramma di radiazione di una particella relativistica avente β = 0.8. L’accelerazione ` e diretta lungo l’asse verticale, mentre la velocit` a` e diretta lungo l’asse orizzontale, da sinistra verso destra. La potenza emessa lungo una direzione, appartenente al piano che contiene velocit` a e accelerazione (φ = 0) e formante l’angolo θ con l’accelerazione, `e proporzionale al segmento disegnato in figura.
si ha, per il caso ultra-relativistico 1 1 # , γ= # (1 − β)(1 + β) 2(1 − β) per cui si ottiene θ0
1 . γ
Il valore θ0 `e proprio l’ampiezza angolare del cono nel quale viene concentrata la radiazione. Mano a mano che aumenta l’energia della particella, e quindi il fattore γ, l’ampiezza del cono diventa sempre pi` u piccola. Nel caso in cui l’accelerazione `e perpendicolare alla velocit` a, il calcolo del vettore di Poynting `e pi` u complicato e si perde la simmetria cilindrica. Introducendo un sistema di coordinate in cui l’accelerazione `e diretta lungo l’asse z e la velocit` a lungo l’asse x e indicando con θ e φ le coordinate polari della direzione n, si ottiene per il vettore di Poynting in tale direzione
= S
4π c3
e 2 a2 (1 − β sinθ cosφ)2 − (1 − β 2 ) cos2 θ n . 6 2 (1 − β sinθ cosφ) R
Il corrispondente diagramma di radiazione, relativo al piano contenente i vettori velocit`a e accelerazione (φ = 0), `e mostrato nella Fig. 3.5.
68
CAPITOLO 3
Infine, nel caso generale in cui l’accelerazione non sia n´e parallela n´e perpendicolare alla velocit` a, l’espressione del vettore di Poynting diviene ancora pi` u complicata. Essa `e riportata nell’App. 5, nella quale `e anche dimostrata la generalizzazione dell’equazione di Larmor per la potenza emessa da una carica relativistica, che risulta. 2 e2 6 2 (γ a + γ 4 a2⊥ ) , (3.23) 3 c3 dove a e a⊥ sono rispettivamente le componenti dell’accelerazione in direzione parallela e perpendicolare alla velocit` a. Come `e facile verificare, nel caso non relativistico in cui β 1, γ 1, essendo a2 + a2⊥ = a2 , si riottiene l’usuale espressione (3.22) dell’equazione di Larmor. W =
3.5 La diffusione Thomson Si consideri un elettrone libero di carica e = −e0 , con e0 = 4.803×10−10 u.e.s., e si supponga che l’elettrone sia soggetto all’azione di un’onda elettromagnetica polarizzata, di frequenza ω, che si propaga lungo la direzione n . Definita una coppia di versori e1 e e2 tali da formare con n una terna destrorsa come in Fig. 3.6, siano E1 e E2 le componenti complesse del vettore campo elettrico dell’onda lungo tali versori. Il moto dell’elettrone, che supponiamo non relativistico, `e descritto dall’equazione e0 E (t) , m (t), il campo elettrico dell’onda dove m `e la massa dell’elettrone e dove E incidente, `e dato da (t) = Re E e−i ω t = Re (E e + E e ) e−i ω t . E 1 1 2 2 a(t) = −
Siamo interessati a determinare l’espressione del campo elettrico emesso dall’elettrone nella zona di radiazione lungo la direzione individuata dal versore n di Fig. 3.6. Introducendo i due versori e1 e e2 (tali da formare con n una terna destrorsa) e utilizzando notazioni complesse, le componenti dell’accelerazione lungo tali versori sono date da A1 = −
e0 e1 · (E1 e1 + E2 e2 ) , m
A2 = −
e0 e2 · (E1 e1 + E2 e2 ) , m
`e implicitamente definito dall’equazione dove il vettore complesso A e−i ω t . a(t) = Re A
(3.24)
69
RADIAZIONE DI CARICHE IN MOTO
elettrone diffondente e1 e2
e’1
n
n’ e’2 Fig. 3.6. Geometria della diffusione Thomson nel caso generale. La scelta dei versori di polarizzazione `e arbitraria.
Tenendo conto dell’Eq. (3.21), le componenti, E1 e E2 , del campo di radiazione alla distanza R e nella direzione n sono date, in forma matriciale, dalle espressioni rc e1 · e1 e1 · e2 E1 E1 =− eiΦ , (3.25) E2 E2 R e2 · e1 e2 · e2 dove Φ = ωR/c `e un fattore di fase inessenziale introdotto dal ritardo, e dove rc , il cosiddetto raggio classico dell’elettrone, `e definito da e20 = 2.818 × 10−13 cm . (3.26) m c2 L’espressione che abbiamo ottenuto `e la legge della diffusione Thomson in termini di campi elettrici. Essa raccoglie tutte le propriet`a, spettrali, direzionali, e polarimetriche della radiazione diffusa, oltre alle propriet` a generali relative alla sezione d’urto. Dal punto di vista spettrale si ha semplicemente che l’elettrone oscilla alla stessa frequenza, ω, della radiazione incidente. La radiazione diffusa `e quindi, come si suol dire, coerente, ovvero lo spettro `e del tipo di una delta di Dirac centrata alla medesima frequenza ω. Per analizzare i risultati relativi al diagramma di radiazione e alla polarizzazione `e conveniente scegliere in maniera adeguata i versori di polarizzazione. Con la scelta schematizzata nella Fig. 3.7, la matrice 2 × 2 che compare nell’Eq. (3.25) si semplifica notevolmente e risulta 1 0 , 0 cosΘ rc =
dove Θ `e l’angolo di diffusione. Possiamo adesso passare a descrivere il processo di diffusione in termini di flussi nei parametri di Stokes. Per questo, bisogna ricordare le espressioni del Cap. 2, in particolare le Eq. (2.14), che collegano fra loro i flussi nei parametri di Stokes con le componenti del campo elettrico. Indicando con (FI , FQ , FU , FV )†
70
CAPITOLO 3
e’1
elettrone diffondente n’
e’2
Θ e1
Piano di diffusione
e2
n
Fig. 3.7. Caso particolare della geometria della diffusione Thomson. I versori di polarizzazione e1 e e1 sono perpendicolari al piano contenente le direzioni della radiazione incidente e diffusa (piano di diffusione), mentre e2 e e2 giacciono nel piano stesso.
il vettore di Stokes relativo alla radiazione incidente e con (FI , FQ , FU , FV )† quello relativo alla radiazione diffusa, con semplici passaggi algebrici si ottiene la seguente equazione matriciale ⎛
⎞ FI ⎜ F ⎟ 1 r2 ⎜ Q⎟ c ⎜ ⎟= ⎝ FU ⎠ 2 R2 FV
⎛
⎞⎛ ⎞ 1 + cos2 Θ FI sin2 Θ 0 0 ⎜ sin2 Θ ⎟⎜F ⎟ 2 1 + cos Θ 0 0 ⎜ ⎟⎜ Q⎟ ⎜ ⎟ . (3.27) ⎟⎜ ⎝ 0 0 2 cosΘ 0 ⎠ ⎝ FU ⎠ FV 0 0 0 2 cosΘ
In particolare, per la diffusione sotto l’angolo Θ di un raggio non polarizzato, si ottiene, per i flussi non nulli rc2 r2 (1 + cos2 Θ) FI , FQ (Θ) = c 2 sin2 Θ FI . 2 2R 2R Queste equazioni mostrano che la radiazione `e diffusa prevalentemente in avanti (o indietro) rispetto alla direzione della radiazione incidente. Il rapporto R fra la radiazione diffusa in direzione Θ e quella diffusa in avanti `e dato dall’equazione FI (Θ) =
1 + cos2 Θ , 2 e varia fra 1 e 1/2. Inoltre, la radiazione diffusa `e polarizzata linearmente e la frazione di polarizzazione `e data da R=
FQ (Θ) sin2 Θ = , FI (Θ) 1 + cos2 Θ il che implica che la polarizzazione lineare `e sempre positiva, ovvero perpendicolare al piano di diffusione, e che la radiazione `e polarizzata al 100% per
RADIAZIONE DI CARICHE IN MOTO
71
Θ = 90◦ . Inoltre, integrando l’intensit` a della radiazione diffusa su una sfera di raggio R si ottiene (si ricordi che la media di cos2 Θ sull’angolo solido vale 1/3) " W = R2 FI (θ) dΩ = σT FI , dove σT , la cosiddetta sezione d’urto Thomson, `e data da σT =
8π 2 8π e40 rc = = 6.652 × 10−25 cm2 . 3 3 m 2 c4
3.6 La diffusione Rayleigh La diffusione Rayleigh `e del tutto simile alla diffusione Thomson, con la sola differenza che l’elettrone, invece di essere libero, `e legato a un atomo o a una molecola. Dal punto di vista della fisica classica, l’elettrone legato pu`o essere descritto per mezzo di un semplice modello, dovuto a Lorentz, secondo il quale si suppone che l’azione sull’elettrone della nuvola di carica positiva presente nell’atomo possa essere schematizzata come una forza di richiamo elastica della forma F = −k x, dove k `e una costante e x `e la posizione dell’elettrone rispetto al centro di gravit`a delle cariche positive. La legge di moto dell’elettrone legato sotto l’azione di un campo elettrico di frequenza ω `e quindi
dove ω0 =
# k/m, e dove
d2 x e0 = −ω02 x − E (t) , dt2 m
(t) = Re( E e−i ω t ) . E L’equazione differenziale si risolve facilmente cercando una soluzione stazionaria del tipo x(t) = x0 e−i ω t . Trovata la soluzione, si determina poi l’accelerazione derivando due volte rispetto al tempo. Il risultato per le componenti dell’accelerazione (complessa) lungo i due versori e1 e e2 di Fig. 3.6 `e il seguente
A1 = −
e0 ω 2 e1 ·(E1 e1 +E2 e2 ) , m ω 2 − ω02
A2 = −
e0 ω 2 e2 ·(E1 e1 +E2 e2 ) . m ω 2 − ω02
Questa espressione `e molto simile a quella che abbiamo ottenuto precedentemente per la diffusione Thomson (Eq. (3.24)) e, come `e logico attendersi, si riduce alla precedente per ω0 = 0 (caso dell’elettrone libero). Ripetendo gli stessi ragionamenti di quelli sviluppati nel paragrafo precedente, si ottengono esattamente gli stessi risultati con la sola differenza che la sezione d’urto
72
CAPITOLO 3
Thomson, σT , deve essere sostituita con la sezione d’urto Rayleigh, σR , definita da σR =
(ω 2
8π 2 ω4 ω4 r . σT = 2 2 2 − ω0 ) (ω − ω02 )2 3 c
Un aspetto importante della diffusione Rayleigh `e il fatto che, per ω0 ω, la sezione d’urto risulta proporzionale a ω 4 . Dato che questa `e una buona approssimazione per la radiazione visibile diffusa dalle molecole di Azoto e Ossigeno, i costituenti pi` u abbondanti dell’atmosfera terrestre, e dato che la luce del cielo non `e altro che luce solare diffusa da tali molecole, ne segue che il cielo `e di colore azzurro1. Per la stessa ragione, il Sole (e gli altri astri) appaiono di colore rosso al sorgere e al tramontare.
3.7 La radiazione di frenamento Si d` a il nome di radiazione di frenamento (Bremsstrahlung in lingua tedesca) a quella radiazione che viene emessa quando una particella carica di alta velocit`a (tipicamente un elettrone) viene deviata passando nel campo Coulombiano generato da un’altra particella (in genere un nucleo atomico). In questo processo la carica viene accelerata e risulta quindi frenata perdendo energia per irraggiamento. La radiazione di frenamento `e un processo fisico fondamentale dei plasmi astrofisici. Essa trova anche vaste applicazioni tecnologiche e di laboratorio. La radiazione a raggi X che proviene dalle sorgenti comunemente utilizzate sia nei laboratori di ricerca sia, come strumento diagnostico e terapeutico, nelle strutture sanitarie nient’altro `e se non radiazione di frenamento, generalmente prodotta accelerando elettroni per mezzo di alte differenze di potenziale e facendoli urtare contro una lastra metallica ad alto Z. Sebbene lo studio dettagliato della radiazione di frenamento richieda una trattazione quantistica, qui lo affronteremo dal punto di vista classico, sottolineando solo alla fine della trattazione l’influenza che i fenomeni quantistici possono avere sui risultati ottenuti. Per fissare le idee, consideriamo un fascio unidirezionale di elettroni non relativistici che urtano contro dei nuclei pesanti (ovvero di massa molto maggiore di quella degli elettroni) e proponiamoci di esaminare le caratteristiche spettrali, geometriche e polarimetriche della radiazione emessa in tale processo. Con riferimento alla Fig. 3.8 sia v la velocit`a dell’elettrone che transita in vicinanza di un nucleo di carica Ze0 . Indichiamo con m la massa dell’elettrone e con b il suo parametro d’urto e supponiamo che l’elettrone sia sufficientemente veloce da poter trascurare la deviazione della 1
La radiazione di colore azzurro (4000 ˚ A) ` e diffusa con una sezione d’urto circa 10 volte maggiore rispetto a quella di colore rosso (7000 ˚ A).
73
RADIAZIONE DI CARICHE IN MOTO
z e1 e2
n
θ nucleo
ϕ b
y
χ traiettoria della particella
x
Fig. 3.8. Geometria per il calcolo della radiazione di frenamento.
sua traiettoria rispetto alla linea retta. Questo `e ben verificato se vale la diseguaglianza 1 Z e20 m v2 , 2 b che implica b bmin , dove 2 Z e20 . (3.28) m v2 Nell’approssimazione della traiettoria rettilinea, e utilizzando il sistema di coordinate (x, y, z) della Fig. 3.8, la posizione dell’elettrone in funzione del tempo `e data dall’equazione bmin =
r0 (t) = b cosϕı + b sinϕ j + v t k , dove ı, j, e k sono tre versori diretti, rispettivamente, come gli assi x, y, e z, ϕ `e l’angolo che specifica (insieme al parametro d’urto) la geometria della collisione, e t `e il tempo misurato dall’istante in cui l’elettrone traversa il piano x-y. L’accelerazione dell’elettrone si calcola facilmente tenendo conto della forza di Coulomb esercitata dal nucleo. Si ottiene a(t) =
−Z e20 r0 (t) Ze20 =− (b cosϕı + b sinϕ j + v t k ) . 3 m r0 (t) m (b2 + v 2 t2 )3/2
74
CAPITOLO 3
Fig. 3.9. Grafico delle funzioni F 2 (z) e G2 (z).
Si consideri adesso la radiazione emessa a grande distanza lungo la direzione individuata dal versore n e si introducano, come in Fig. 3.8, due versori e 1 e e2 secondo la consueta convenzione per cui la terna (e1 , e2 , n ) `e una terna destrorsa. Se θ e χ sono gli angoli polare e azimutale che individuano la direzione n, si ha n = sinθ cosχı + sinθ sinχ j + cosθ k, , e1 = − cosθ cosχı − cosθ sinχ j + sinθ k ,
e2 = sinχı − cosχ j .
Applicando l’equazione non relativistica (3.21), le componenti del campo elettrico nel punto alla distanza R dal nucleo lungo la direzione n sono date da E1 (t + R/c) = E2 (t + R/c) =
Z e30 [ b cosθ cos(ϕ − χ) − v t sinθ ] , + v 2 t2 )3/2
m c2 R (b2
Z e30 b sin(ϕ − χ) . m c2 R (b2 + v 2 t2 )3/2
Differentemente dai casi che abbiamo considerato nei paragrafi precedenti, il campo elettrico non presenta un andamento col tempo di tipo sinusoidale. Per ottenere le propriet` a spettrali e le corrispondenti propriet` a polarimetriche del campo di radiazione, `e necessario passare attraverso le trasformate di Fourier delle due componenti del vettore campo elettrico. Questo porta a dover valutare degli integrali della forma ∞ ∞ cos(ω t) t sin(ω t) dt , dt , 2 + v 2 t2 )3/2 2 + v 2 t2 )3/2 (b (b −∞ −∞
75
RADIAZIONE DI CARICHE IN MOTO
che, attraverso la sostituzione tanx = v t/b, possono essere ricondotti alle funzioni F (z) e G(z) definite da2
π/2
F (z) =
cos(z tanx) cosx dx , 0
G(z) =
π/2
sin(z tanx) sinx dx . 0
Per mezzo di queste funzioni, il cui quadrato `e riportato in grafico nella Fig. 3.9, si ottiene per le trasformate di Fourier ∞ 1 Z e30 ˆ f1 (ω) = E1 (t) ei ω t dt = 2π −∞ π m c2 b v R (3.29) × [ cosθ cos(ϕ − χ) F (z) − i sinθ G(z) ] e i Φ , ∞ 1 Z e30 sin(ϕ − χ) F (z) e i Φ , fˆ2 (ω) = E2 (t) ei ω t dt = 2π −∞ π m c2 b v R dove Φ = ωR/c `e una fase inessenziale (dovuta al tempo ritardato) e dove ωb . v Possiamo adesso valutare i flussi monocromatici nei parametri di Stokes della radiazione emessa nella direzione n. Per questo dobbiamo rifarci alle considerazioni sviluppate nel Par. 2.3. Le espressioni che veniamo di ottenere sono le trasformate di Fourier delle componenti, lungo i versori e1 e e2 , degli impulsi del campo elettrico emessi nel passaggio, in prossimit` a del nucleo, di un singolo elettrone, con valori assegnati del parametro d’urto b e dell’angolo φ. Pensiamo adesso alla situazione fisica in cui si ha un flusso uniforme di elettroni, tutti aventi velocit` a v. Siamo ovviamente in presenza di un fenomeno stocastico, descritto a livello microscopico da una situazione del tipo di quella della Fig. 2.3, per la quale i flussi monocromatici sono dati dalle Eq. (2.17). Indicando con Ne la densit` a numerica degli elettroni del fascio, nell’unit`a di tempo si ha un numero di collisioni, con parametro d’urto compreso fra b e b + db e angolo compreso fra ϕ e ϕ + dϕ, dato da dNcoll = Ne v b db dϕ, per cui si ottiene z=
2π
FωI (n ) = c v Ne 0
FωQ (n )
2π
= c v Ne
∞
dϕ
= c v Ne
[ fˆ1 (ω)∗ fˆ1 (ω) − fˆ2 (ω)∗ fˆ2 (ω) ] b db ,
0
2π
dϕ 0
2
[ fˆ1 (ω)∗ fˆ1 (ω) + fˆ2 (ω)∗ fˆ2 (ω) ] b db ,
0
0
FωU (n )
∞
dϕ
∞
[ fˆ1 (ω)∗ fˆ2 (ω) + fˆ2 (ω)∗ fˆ1 (ω) ] b db ,
0
Le funzioni F (z) e G(z) possono essere collegate alle funzioni di Bessel modificate di seconda specie, Kn (z). Si ha F (z) = z K1 (z), G(z) = z K0 (z).
76
CAPITOLO 3
FωV (n ) = c v Ne
2π
dϕ 0
∞
i [ fˆ1 (ω)∗ fˆ2 (ω) − fˆ2 (ω)∗ fˆ1 (ω) ] b db .
0
Sostituendo i valori delle trasformate di Fourier date dalle Eq. (3.29), ed eseguendo l’integrazione su ϕ, i flussi nei parametri di Stokes U e V si annullano. Per i due rimanenti si ottiene ∞ db I Fω (n) = C , (1 + cos2 θ)F 2 (z) + 2 sin2 θ G2 (z) b 0 ∞ 2 db FωQ (n) = − C sin2 θ , F (z) − 2 G2 (z) b 0 dove si `e posto Z 2 e60 Ne . π m 2 c3 v R 2 Bisogna tuttavia prendere in considerazione il fatto che gli integrali che compaiono nelle equazioni precedenti sono divergenti perch´e, per b → 0 gli integrandi vanno all’infinito come b−1 . Questa divergenza `e dovuta all’approssimazione della traiettoria rettilinea che abbiamo introdotto all’inizio del calcolo. Dato che l’approssimazione non `e giustificata per b < bmin, con bmin definito nell’Eq. (3.28), la divergenza pu` o essere evitata cambiando il primo estremo di integrazione da 0 a bmin. Cos`ı facendo si ottiene un’espressione approssimata che pu` o essere migliorata solo per mezzo di calcoli pi` u complicati. Se allora si definiscono le due quantit`a ∞ ∞ 1 2 ωb 1 2 ωb F= F db , G= G db , v v bmin b bmin b C=
si ottiene FωI (n) = C [ (1 + cos2 θ) F + 2 sin2 θ G ] ,
FωQ (n) = − C sin2 θ ( F − 2 G ) .
Come si pu` o arguire dall’espressione degli integrali che definiscono F e G e dagli andamenti di F 2 (z) e G2 (z) della Fig. 3.9, a ogni frequenza angolare ω che contribuisce sostanzialmente all’emissivit`a, la diseguaglianza F G `e sempre ben verificata. Questo implica che, con buona approssimazione, il diagramma di radiazione presenta una dipendenza da θ della forma (1 + cos2 θ) il che mostra che la radiazione emessa verso “i poli”, ovvero nella direzione del fascio di elettroni, `e due volte pi` u intensa di quella emessa nel “piano equatoriale”. Per quanto riguarda invece la polarizzazione, la radiazione `e linearmente polarizzata, con un valore percentuale, praticamente indipendente dalla frequenza, dato da FωQ (n) sin2 θ = − . FωI (n) 1 + cos2 θ
RADIAZIONE DI CARICHE IN MOTO
77
Questa equazione mostra che la radiazione emessa nel piano perpendicolare alla velocit`a delle particelle collidenti `e polarizzata linearmente al 100%, la direzione di polarizzazione essendo contenuta nel piano stesso (si ricordi la definizione dei due versori di polarizzazione della Fig. 3.8). Cambiando la direzione di emissione, la polarizzazione mantiene le stesse caratteristiche (lineare e diretta perpendicolarmente alla velocit`a) ma la percentuale `e sempre pi` u bassa mano a mano che sin2 θ diminuisce. In particolare, la radiazione emessa lungo la direzione della velocit`a (o in direzione opposta) non `e polarizzata. Infine, le equazioni precedenti possono anche essere utilizzate per dare una stima di ordine di grandezza per la potenza monocromatica totale (cio`e integrata su tutto l’angolo solido) della radiazione di frenamento. Eseguiamo per questo un’approssimazione piuttosto brutale sul comportamento della funzione F 2 (z) supponendo che essa valga 1 nell’intervallo di z compreso fra 0 e 1 e che sia nulla per z > 1. Questo implica, per la quantit`a F, bmax 1 bmax db = ln F= , bmin bmin b dove bmax =
v . ω
Se si suppone inoltre che G = 0, integrando il flusso FωI (n ) sulla una sfera di raggio R, e sostituendo i valori di bmin e bmax , si ottiene m v3 16 Z 2 e60 Ne Wω = ln , 3 m 2 c3 v 2 Z e20 ω ovvero un andamento spettrale quasi piatto, la dipendenza da ω essendo contenuta solo nel logaritmo. Un’analisi pi` u approfondita dello stesso problema3 , compiuta senza utilizzare l’approssimazione della traiettoria rettilinea, mostra che la formula da noi derivata `e corretta pur di apportare delle leggere modifiche. Nel limite delle basse frequenze (ω → 0), il fattore 12 nell’argomento del logaritmo deve essere sostituito dal fattore 2 e−γ , dove γ `e la costante di Eulero-Mascheroni definita da n−1 1 0.57721 . γ = lim − ln n + n→∞ k k=1
Viceversa, nel limite delle alte frequenze (ω → ∞), l’equazione √ deve essere modificata moltiplicando il secondo membro per il fattore π/ 3 e omettendo il logaritmo, cos`ı da dare 3
´ Si veda L. Landau & E. Lifchitz, Th´ eorie du Champ, Editions Mir, Moscou, 1966.
78
CAPITOLO 3
16π Z 2 e60 Ne . Wω = √ 3 3 m 2 c3 v La formula mostra che nel limite delle alte frequenze la potenza Wω `e indipendente da ω. Questo implica che per la radiazione di frenamento si ottiene, per cos`ı dire, una sorta di catastrofe dell’ultravioletto simile a quella della teoria classica della radiazione di corpo nero. Definendo infatti la potenza totale irradiata attraverso l’equazione ∞ W = Wω dω , 0
si ottiene un integrale divergente. La ragione di questo fatto `e dovuta all’aver trascurato completamente gli effetti quantistici, la cui conseguenza pi` u importante `e la comparsa di un valore di soglia per la frequenza angolare dei fotoni emessi, ωmax , data da h ¯ ωmax =
1 m v2 . 2
Per ottenere una stima di ordine di grandezza di W , trascuriamo la leggera dipendenza dal logaritmo e integriamo in dω fra 0 e ωmax . Si ottiene W
Z 2 e60 Ne v Z 2 e60 Ne ωmax = . 2 3 m c v 2 m c3 h ¯
Questa equazione permette l’introduzione di un’opportuna sezione d’urto, che indichiamo con σf , per la radiazione di frenamento. Il valore della sezione d’urto si ottiene dividendo la potenza totale irradiata, W , per il flusso di energia, Fe , degli elettroni collidenti che `e definito da Fe = Ne v
1 m v2 . 2
Con facili passaggi si trova σf =
W 1 = Z 2 α 2 rc2 , Fe β
hc)), β = v/c, e rc `e il dove α `e la costante della struttura fine (α = e20 /(¯ raggio classico dell’elettrone definito nell’Eq. (3.26). Come si vede, si ha una dipendenza della sezione d’urto dal quadrato del numero di carica Z. Per questa ragione, nei dispositivi tecnici che vengono utilizzati per la produzione di raggi X il bersaglio per gli elettroni accelerati `e costituito da lastre metalliche ad alto Z (tipicamente piombo). La formula precedente mostra anche che si ha una dipendenza quadratica inversa dalla velocit` a degli elettroni e, al limite per β → 0 si ottiene una divergenza. Questo `e ovviamente dovuto alle approssimazioni
RADIAZIONE DI CARICHE IN MOTO
79
z e1 B
n
e2 θ
y
χ x
traiettoria proiettata sul piano x−y
Fig. 3.10. Geometria per il calcolo della radiazione di ciclotrone.
introdotte, in particolare all’aver supposto che l’elettrone interagisca solo col nucleo atomico e non anche con la nuvola elettronica presente in ciascun atomo.
3.8 La radiazione di ciclotrone Un elettrone non relativistico mobile in una regione dello spazio dove `e presente un campo magnetico `e soggetto alla forza di Lorentz. Il moto dell’elettrone `e descritto dall’equazione d2 x e0 dx , ×B =− dt2 mc dt `e il campo magnetico che supponiamo uniforme e costante nel tempo. dove B In un sistema di coordinate (x, y, z) il cui asse z `e diretto lungo la direzione del campo, la soluzione pi` u generale di questa equazione `e la seguente
x = x0 + A cos(ωc t + φ) ,
y = y0 + A sin(ωc t + φ) ,
z = z0 + v t ,
dove la quantit` a e0 B (3.30) mc `e la cosiddetta frequenza di ciclotrone, e dove x0 , y0 , z0 , A, φ, e v sono sei costanti di integrazione. L’elettrone descrive un moto elicoidale, ovvero un moto circolare di raggio A nel piano x-y, sovrapposto a un moto uniforme lungo l’asse z. Il moto circolare si svolge alla velocit`a v⊥ = A ωc e il senso di percorrenza `e antiorario se si osserva il moto dall’estremit`a positiva dell’asse z. ωc =
80
CAPITOLO 3
Scegliendo opportunamente l’orientazione degli assi x e y, l’origine del sistema di coordinate e l’origine del tempo, l’equazione del moto pu` o essere posta nella seguente “forma minima” x=
v⊥ cos(ωc t) , ωc
y=
v⊥ sin(ωc t) , ωc
z = v t .
Dall’equazione di moto si calcola con facili passaggi il vettore accelerazione e, da questo, le sue componenti lungo i versori e1 e e2 , relativi alla direzione n, definiti come in Fig. 3.10. Senza perdere in generalit` a, la simmetria cilindrica del problema permette inoltre di scegliere la direzione n come appartenente al piano x-z (χ = 0). Si ottiene a1 = v⊥ ωc cosθ cos(ωc t) ,
a2 = v⊥ ωc sin(ωc t) ,
e applicando l’equazione non relativistica (3.21), le componenti del campo elettrico nel punto a grande distanza R lungo la direzione n risultano espresse dalle equazioni e0 v⊥ ωc cosθ cos(ωc t) , c2 R e0 v⊥ ωc sin(ωc t) . E2 (t + R/c) = c2 R Queste equazioni mostrano che le componenti del vettore campo elettrico sono periodiche con periodo T = 2π/ωc. Per esprimere i flussi nei parametri di Stokes bisogna far quindi ricorso alle Eq. (2.18) le quali, a loro volta, implicano il calcolo delle componenti di Fourier. D’altra parte, poich´e il campo ha un andamento temporale di tipo perfettamente sinusoidale, tutte le componenti di Fourier sono nulle eccetto quelle relative all’armonica fondamentale. Ricordando la definizione si ha E1 (t + R/c) =
(1)
E1
=
1 T
T
E1 (t) ei ωc t dt ,
(1)
E2
0
=
1 T
T
E2 (t) ei ωc t dt , 0
dalle quali si ottiene, con semplici passaggi e0 v⊥ ωc e0 v⊥ ωc i Φ (1) cosθ e i Φ , e E2 = i , 2 2c R 2 c2 R dove Φ = ωc R/c `e una fase inessenziale introdotta dal tempo anticipato. I flussi nei parametri di Stokes sono quindi espressi, in forma matriciale, dalle seguenti equazioni ⎛ I⎞ ⎛ ⎞ Fω 1 + cos2 θ ⎜ F Q ⎟ e2 v 2 ω 2 ⎜ − sin2 θ ⎟ ⎜ ω ⎟ ⎜ ⎟ ⎜ U ⎟ = 0 ⊥3 2c ⎜ ⎟ δ(ω − ωc ) . ⎝ Fω ⎠ 8π c R ⎝ ⎠ 0 V Fω −2 cos θ (1)
E1
=
RADIAZIONE DI CARICHE IN MOTO
81
Questa equazione mostra che la radiazione di ciclotrone `e polarizzata ellitticamente. In particolare, la radiazione emessa lungo la direzione del campo magnetico (θ = 0 oppure θ = π) `e polarizzata circolarmente e quella emessa nel piano perpendicolare al campo magnetico (θ = π/2) `e polarizzata linearmente (la direzione di polarizzazione essendo perpendicolare al campo magnetico). Il diagramma di radiazione `e della forma (1+cos2 θ), il che significa che l’intensit` a emessa “ai poli” `e doppia di quella emessa “nel piano equatoriale”. Infine, la potenza totale emessa, W , si determina mediante una doppia integrazione del flusso FωI su una sfera di raggio R e sulle frequenze. Tenendo conto che la media del fattore (1 + cos2 θ) sull’angolo solido `e 34 , si ottiene W =
2 ωc2 2 e20 v⊥ , 3 c3
oppure, ricordando la definizione della frequenza di ciclotrone (Eq. (3.30)) W =
2 B2 2 2 e40 v⊥ = rc2 β⊥ v⊥ B 2 , 3 m 2 c5 3
dove β⊥ = v⊥ /c e dove rc `e il raggio classico dell’elettrone. L’ultima equazione permette anche l’introduzione di un’opportuna sezione d’urto. Ricordando che la densit` a di energia magnetica `e B 2 /(8π), il flusso di energia spazzato dall’elettrone nel suo moto accelerato (cio`e facendo astrazione dal moto rettilineo uniforme lungo il campo magnetico) `e v⊥ B 2 /(8π). Tale energia `e trasformata dall’elettrone in energia raggiante con una sezione d’urto data da σc =
16 π β⊥ rc2 . 3
Ricordando il risultato ottenuto per la sezione d’urto Thomson, σT , si ha σc = 2 β⊥ σT .
3.9 La radiazione di sincrotrone Quando si passa a considerare il moto di un elettrone relativistico in un campo magnetico, le caratteristiche fisiche di tale moto rimangono inalterate rispetto al caso non relativistico descritto nel paragrafo precedente, eccetto per il fatto che la frequenza diminuisce, passando dalla frequenza di ciclotrone, ω c , a quella di sincrotrone, ωs , che adesso dipende dalla velocit`a della particella essendo data da ωs =
# e0 B = ωc 1 − β 2 , γ mc
82
CAPITOLO 3
dove β = v/c e dove γ `e il fattore di Lorentz. L’analisi delle caratteristiche della radiazione di sincrotrone va effettuata secondo le formule relativistiche date precedentemente (si ricordi in particolare l’Eq. (3.18)). La cosa importante da sottolineare `e che il fattore κ viene adesso a svolgere un ruolo fondamentale nel fenomeno fisico, cos`ı come l’effetto dovuto al tempo anticipato che non si limita pi` u a introdurre un semplice fattore di fase nelle espressioni delle trasformate di Fourier del campo di radiazione. L’analisi del fenomeno nella sua completezza `e molto complessa. In questo volume ci limitiamo a considerare il caso di un elettrone che descriva una traiettoria circolare e non elicoidale4 . Facendo sempre riferimento alla Fig. 3.10, si pu` o supporre, senza perdere in generalit`a, che la posizione dell’elettrone al tempo anticipato t sia data dalla legge x(t ) =
cβ [ cos(ωs t )ı + sin(ωs t ) j ] . ωs
Le corrispondenti espressioni della velocit`a e dell’accelerazione sono ovviamente date da v (t ) = c β [− sin(ωs t )ı + cos(ωs t ) j ] , a(t ) = −c β ωs [ cos(ωs t )ı + sin(ωs t ) j ] . Data la simmetria cilindrica del problema, consideriamo la radiazione emessa lungo una direzione appartenente al piano x-z della Fig. 3.10. Definito n = sinθı + cosθ k , si ha, con facili passaggi n − β = [ sinθ + β sin(ωs t ) ]ı − β cos(ωs t ) j + cosθ k ,
(n − β )×a = c β ωs cosθ sin(ωs t )ı − cosθ cos(ωs t ) j − [ sinθ sin(ωs t ) + β] k ,
× a = n × (n − β)
= c β ωs cos2 θ cos(ωs t )ı + [ sin(ωs t ) + β sinθ ] j − sinθ cos θ cos(ωs t ) k . La proiezione di quest’ultimo vettore sui versori e1 = − cosθı + sinθ k ,
e2 = −j ,
risulta 4
Per una trattazione pi` u approfondita si veda ad esempio G.B. Rybicki & A.P. Lightman, Radiative Processes in Astrophysics, John Wiley & Sons, New York, etc., 1979.
83
RADIAZIONE DI CARICHE IN MOTO
z campo magnetico
elettrone in orbita circolare
y
cono di radiazione
x
Fig. 3.11. Illustrazione dell’effetto faro. La particella relativistica ruota sulla circonferenza emettendo la maggior parte della radiazione entro il cono disegnato in figura. La situazione qui illustrata si riferisce all’istante in cui la radiazione emessa `e diretta lungo l’asse x. Al passare del tempo, il cono spazza tutte le direzioni del piano x-y.
! × a e1 · n × (n − β) = −c β ωs cosθ cos(ωs t ) ,
! × a e2 · n × (n − β) = −c β ωs [ sin(ωs t ) + β sinθ ] . Siamo adesso in grado di calcolare le componenti del campo elettrico all’istante t e a distanza R dalla carica lungo la direzione n. Dall’Eq. (3.18) si ottiene E1 (t) =
e0 β ωs cosθ cos(ωs t ) , c R κ3 (t )
E2 (t) =
e0 β ωs [ sin(ωs t ) + β sinθ ] , c R κ3 (t )
dove v (t ) · n = 1 + β sinθ sin(ωs t ) , c e dove il tempo anticipato, t , `e legato al tempo t dalla relazione κ(t ) = 1 −
t = t − t 0 +
β sinθ cos(ωs t ) , ωs
t0 essendo il tempo impiegato dalla luce a percorrere la distanza che separa il centro dell’orbita dal punto in cui si calcolano le componenti del campo elettrico.
84
CAPITOLO 3
Come gi` a illustrato precedentemente, il fattore κ−3 diviene essenziale per particelle relativistiche, quando β si avvicina a 1. In questo caso, essendo la particella in rotazione sull’orbita circolare, l’effetto beaming si trasforma pi` u propriamente in un “effetto faro” come illustrato schematicamente nella Fig. 3.11. In pratica, l’osservatore riceve un impulso di radiazione periodico, con periodo 2π/ωs , estremamente concentrato nel tempo. Poich´e tale impulso `e anche concentrato spazialmente ad angoli θ π/2, le equazioni precedenti per E1 e E2 mostrano che la radiazione `e polarizzata linearmente in direzione perpendicolare all’asse z, ovvero perpendicolare al campo magnetico. Ci proponiamo adesso di esaminare in maggior dettaglio le caratteristiche spettropolarimetriche della radiazione emessa. Per questo `e necessario calcolare le componenti di Fourier delle quantit` a E1 e E2 , ovvero le quantit` a
(n)
E1
=
1 T
T
E1 (t) ei n ωs t dt , 0
(n)
E2
=
1 T
T
E2 (t) ei n ωs t dt , 0
dove T = 2π/ωs . Sostituendo le espressioni trovate precedentemente si ha (n) E1
(n)
E2
2π/ωs cos(ωs t ) i n ωs t e0 β ωs2 cosθ e = dt , 2π c R κ3 (t ) 0 e0 β ωs2 2π/ωs sin(ωs t ) + β sinθ i n ωs t = dt . e 2π c R 0 κ3 (t )
Per valutare gli integrali, osserviamo che 1 dt dt = , = 1 + β sinθ sin(ωs t ) = κ(t ) , dt dt κ(t ) dt d 1 d 1 1 = = − 3 β ωs sinθ cos(ωs t ) , dt κ(t ) dt dt κ(t ) κ (t ) dt d cos(ωs t ) d cos(ωs t ) = = dt κ(t ) dt dt κ(t ) ωs ωs β sinθ cos2 (ωs t ) sin(ωs t ) + = − 3 [sin(ωs t ) + β sin θ] . =− 2 κ(t ) κ (t ) κ(t ) κ (t ) Sostituendo nelle espressioni delle componenti di Fourier, si ottiene (n)
E1
(n)
E2
2π/ωs d 1 e0 ωs cotθ ei n ωs t dt , ) 2π c R dt κ(t 0 2π/ωs d cos(ωs t ) i n ωs t e0 β ωs e =− dt . 2π c R 0 dt κ(t ) =−
RADIAZIONE DI CARICHE IN MOTO
85
Integriamo adesso per parti entrambi gli integrali. Il fattore finito si annulla per le condizioni di periodicit` a. Nell’integrale che rimane effettuiamo poi un cambiamento di variabile passando dalla variabile t alla variabile t . Poich´e dt = κ(t ) dt , si ottiene, ricordando la relazione fra t e t , (n)
E1
(n)
E2
2π/ωs i n e0 ωs2 cotθ ei n ωs (t0 +t ) e−i n β sinθ cos(ωs t ) dt , 2π c R 0 i n e0 β ωs2 2π/ωs = cos(ωs t ) ei n ωs (t0 +t ) e−i n β sinθ cos(ωs t ) dt . 2π c R 0
=
Il fattore di fase che proviene dal tempo t0 `e presente in entrambe le componenti e pu` o essere eliminato senza perdere in generalit` a. Effettuando in entrambi gli integrali il cambiamento di variabile ϕ = ωs t e sviluppando il primo esponenziale si ha
(n)
E1
(n)
E2
=
=
i n e0 ωs cotθ 2π c R i n e0 β ωs 2π c R
2π
[ cos(nϕ) + i sin(nϕ) ] e−i n β sinθ cosϕ dϕ ,
0 2π
cosϕ [ cos(nϕ) + i sin(nϕ) ] e−i n β sinθ cosϕ dϕ .
0
Gli integrali che compaiono in queste espressioni possono essere semplificati osservando che il contributo portato dal termine in sin(nϕ) `e nullo. Il contributo portato dal termine in cos(nϕ) pu` o poi essere ricondotto a funzioni speciali. Definite infatti le funzioni di Bessel di ordine intero come le soluzioni dell’equazione differenziale x2
d2 Jn dJn + (x2 − n2 ) Jn = 0 , +x dx2 dx
si pu` o dimostrare che Jn (x) =
in 2π
2π
cos(nϕ) e−i x cosϕ dϕ ,
0
e, per derivazione Jn (x)
d i n+1 Jn (x) = − = dx 2π
2π
cosϕ cos(nϕ) e−i x cos ϕ dϕ .
0
Attraverso queste relazioni `e possibile esprimere le componenti di Fourier nella forma (n)
E1
=
1 n e0 ωs cotθ Jn (nβ sinθ) , i n−1 c R
86
CAPITOLO 3 (n)
E2
=−
1 n e0 β ωs Jn (nβ sinθ) . in cR
Ricordando infine l’Eq. (2.18) si possono esprimere i flussi nei parametri di Stokes attraverso l’espressione ⎛
⎞ ⎛ 2 2 ⎞ FωI cot θ Jn (z) + β 2 J2 n (z) ∞ ⎜FQ ⎟ ⎟ 2 2 2 2 e2 ω 2 2 ⎜ ⎜ ω ⎟ ⎜ cot θ Jn (z) − β Jn (z) ⎟ n ⎜ ⎜ U ⎟ = 0 s2 ⎟ δ(ω − n ωs ) , ⎝ Fω ⎠ 2π c R n=1 ⎝ ⎠ 0 −2β cot θ Jn (z) Jn (z)
FωV dove
z = n β sinθ . ` interessante considerare il limite di queste espressioni per β → 0. Tenendo E conto dello sviluppo in serie di potenze z n 1 z2 − + ··· , Jn (z) = 2 n! 4(n + 1)! al primo ordine in z si ottiene che tutte le funzioni di Bessel di ordine intero con n ≥ 2 sono nulle. Per J1 (z) si ha poi J1 (z) =
z , 2
J1 (z) =
1 , 2
e si ritrovano le formule date per la radiazione di ciclotrone. Una caratteristica fondamentale dello spettro della radiazione di sincrotrone `e che a esso contribuiscono tutte le armoniche della frequenza ωs . Un problema interessante `e quello di chiedersi a quale armonica si abbia emissione massima. Un’analisi basata sugli sviluppi asintotici delle funzioni di Bessel5 mostra che, per valori di β vicini a 1, il massimo dell’emissione, integrata sull’angolo solido, si ottiene all’armonica caratterizzata dall’indice nmax dato da nmax (1 − β 2 )−3/2 = γ 3 . Ad esempio, per β = 0.99 si ha nmax 350. La frequenza che corrisponde al massimo, ωmax , `e quindi data da ωmax = γ 3 ωs = γ 2 ωc . Per elettroni ultra-relativistici, lo spettro della radiazione di sincrotrone risulta quindi uno spettro “quasi continuo”. Questo vale anche se gli elettroni hanno 5
´ Si veda L. Landau & E. Lifchitz, Th´ eorie du Champ, Editions Mir, Moscou, 1966.
87
RADIAZIONE DI CARICHE IN MOTO
tutti la stessa energia e si muovono lungo orbite circolari (e non elicoidali), caso a cui ci siamo limitati nella presente trattazione. Infine, per valutare la potenza totale emessa su tutto l’angolo solido possiamo utilizzare l’equazione di Larmor generalizzata al caso relativistico (Eq. (3.23)). Tenendo conto che l’accelerazione `e perpendicolare alla velocit` a e che vale in modulo c β ωs , si ottiene W =
2 e40 2 e20 4 2 2 γ β ωs = γ2β2B2 , 3c 3 m 2 c3
ovvero, in forma alternativa W =
2 2 2 2 2 γ β B c rc , 3
dove rc `e il raggio classico dell’elettrone. Quest’ultima equazione permette anche l’introduzione di un’opportuna sezione d’urto, analogamente a quanto gi` a fatto per la radiazione di ciclotrone. Ricordando che la densit` a di energia magnetica `e B 2 /(8π), il flusso di energia spazzato dall’elettrone nel suo moto `e c β B 2 /(8π). Tale energia `e trasformata dall’elettrone in energia raggiante con una sezione d’urto data da σs =
16π 2 2 γ β rc , 3
ovvero, in termini della sezione d’urto Thomson σs = 2 γ 2 β σT .
3.10 Sviluppo multipolare nella zona di radiazione Nei paragrafi precedenti ci siamo interessati a trovare le propriet` a della radiazione elettromagnetica irraggiata da una singola carica elettrica in moto arbitrario. Adesso andiamo a considerare il caso in cui si abbia un insieme di N cariche elettriche in moto, invece di una sola. Ovviamente, per la linearit`a delle equazioni di Maxwell, l’espressione dei campi elettrico e magnetico nella zona di radiazione si generalizza per semplice addizione dei campi dovuti a ciascuna carica. Si ha
r , t) = E(
N i=1
i (r, t) , E
r, t) = B(
N i=1
i (r, t) = B
N i=1
i (r, t) , ni × E
88
CAPITOLO 3
dove, ricordando l’Eq. (3.18) i (r, t) = E
ei ni × c2 κ3i Ri
vi × ai . ni − c
In questa espressione, tutte le quantit` a geometriche e dinamiche relative alla particella i-esima, ni , κi , Ri , vi e ai devono essere valutate al tempo anticipato della particella medesima, ti , definito da | r − ri (ti )| , c essendo ri (t) la traiettoria della particella i-esima. Ogni particella ha in generale un tempo anticipato diverso. Consideriamo il caso semplificato in cui l’insieme di particelle si trovi in una regione dello spazio avente dimensioni L molto minori della distanza R dal punto in cui si valutano i campi (L R). In queste condizioni, si pu`o supporre che il versore n e la distanza R siano uguali per tutte le cariche. Sotto queste ipotesi, a meno di termini dell’ordine di L/R, si ha per il campo elettrico ti = t −
ei r , t) = 1 E( n × 2 c R i=1 κ3i N
vi × ai . n − c
Se supponiamo adesso che le cariche si muovano con velocit` a non relativistiche, ovvero se supponiamo vi c (i = 1, . . . , N ), tutti i fattori κi sono uguali a 1 e il secondo termine entro la parentesi tonda del secondo membro pu`o essere trascurato. Si ottiene allora, per il campo elettrico all’ordine zero nel rapporto v/c N 1 E0 (r, t) = 2 n × n × ei ai . c R i=1 Introduciamo adesso l’ulteriore ipotesi di trascurare la dipendenza dal tempo anticipato ti nell’accelerazione della particella i-esima. Per questo, consideriamo un punto di coordinate rc (il punto “centrale”, per fissare le idee, del nostro insieme di cariche) e misuriamo le coordinate spaziali delle singole particelle rispetto a tale punto, definendo si = ri − rc . Con questa posizione, il tempo anticipato ti risulta, essendo |si | |r − rc | R si · n , c dove tc `e il tempo anticipato relativo al punto centrale. Affinch´e l’ipotesi di trascurare la dipendenza da ti sia giustificata, bisogna che il tempo tipico τ ti = tc +
RADIAZIONE DI CARICHE IN MOTO
89
su cui avvengono variazioni nel moto delle particelle sia molto maggiore del rapporto L/c, dove L sono le dimensioni tipiche della regione dello spazio in cui si trovano le particelle. D’altra parte, la lunghezza d’onda λ caratteristica della radiazione emessa dalle particelle `e dell’ordine di c τ , per cui si deve avere λ cτ L . Quando questa condizione `e verificata, definendo il momento di dipolo elettrico attraverso l’equazione del sistema di cariche, D, = D
N
ei si ,
(3.31)
i=1
si ottiene .. ) , 0 (r, t) = 1 n × (n × D E c2 R dove si `e adottata la “convenzione dei punti” per indicare la derivazione rispetto al tempo e dove la derivata seconda del momento di dipolo elettrico deve essere valutata al tempo anticipato tc . L’irraggiamento descritto da questa equazione viene detto irraggiamento di dipolo elettrico. Esso presenta un diagramma di radiazione uguale in tutto e per tutto a quello della carica singola non relativistica gi` a esaminato nel Par. 3.4 e descritto dalla Fig. 3.3. Per la potenza totale emessa si ha poi, in stretta analogia al risultato ivi ottenuto Wd.e. =
2 .. 2 D . 3 c3
.. sia nullo. Per In alcuni casi, si pu`o verificare la circostanza che il vettore D determinare le propriet`a dell’irraggiamento del sistema di cariche `e allora necessario andare a considerare il contributo del campo elettrico al primo ordine in v/c, contributo che abbiamo precedentemente trascurato. Con riferimento all’equazione generale per il campo elettrico, dobbiamo tener conto di tre termini distinti che provengono, rispettivamente: (a) dal fattore in vi /c in parentesi tonda; (b) dal fattore moltiplicativo κ−3 i ; (c) dalla correzione del termine di ordine zero in ai dovuto all’effetto del tempo anticipato. Con semplici considerazioni si ottiene allora per il contributo al campo elettrico dovuto al primo ordine nello sviluppo in v/c N ! ˙i ) , 1 (r, t) = 1 E e n × −( v × a ) + 3 ( v · n )( n × a ) + ( s · n )( n × a i i i i i i c3 R i=1
90
CAPITOLO 3
dove tutte le quantit` a sono valutate al tempo anticipato “centrale” t c . Questa espressione pu`o essere posta in forma diversa osservando che, dato un vettore w qualsiasi, si ha n × w = −n × [ n × [ n × w ]] , per cui, modificando attraverso questa equazione il primo termine entro la parentesi graffa, si pu`o scrivere
1 (r, t) = 1 n × n × A , E c3 R dove = A
N
ei n × (vi × ai ) + 3 ( vi · n ) ai + (si · n ) a˙i
! ,
i=1
ovvero, sviluppando il doppio prodotto vettoriale = A
N
ei (ai · n ) vi + 2 (vi · n ) ai + (si · n ) a˙i
! .
i=1
Modifichiamo adesso la forma di questa equazione ponendo ... ai = s¨i , a˙i = si . vi = s˙i , Con queste posizioni si ha = A
N
... ! ei (s¨i · n ) s˙i + 2 (s˙i · n ) s¨i + (si · n ) si .
i=1
Introduciamo il momento di dipolo magnetico del sistema attraverso l’espressione 1 = 1 M ei si × vi = ei si × s˙i . 2 c i=1 2 c i=1 N
N
(3.32)
Derivando due volte rispetto al tempo si ottiene N .. ... ! = 1 ei s˙i × s¨i + si × si , M 2c i=1
e, prendendone il prodotto vettoriale col versore n, N ! .. ... ... × n = 1 ei (s˙i · n ) s¨i − (s¨i · n ) s˙i + (si · n ) si − (si · n ) si . M 2 c i=1
RADIAZIONE DI CARICHE IN MOTO
91
di deduce Da questa equazione, ricordando l’espressione del vettore A N .. ... ... ! − cM × n = 1 3 (s¨i · n ) s˙i + 3 (s˙i · n ) s¨i + (si · n ) si + (si · n ) si . A 2 i=1
Definiamo adesso il tensore simmetrico Q / attraverso il seguente prodotto diadico Q /=
N
ei si si .
(3.33)
i=1
Come specificheremo meglio in seguito, questo tensore `e strettamente collegato al tensore del momento di quadrupolo elettrico che viene definito in elettrostatica. Derivandolo tre volte rispetto al tempo e moltiplicandolo scalarmente per il versore n (indifferentemente a destra o a sinistra in quanto il tensore `e simmetrico), si ottiene facilmente N ... ... ... ... ! n · Q /=Q / · n = ei (si · n )si + 3 (s¨i · n ) s˙i + 3 (s˙i · n ) s¨i + (si · n ) si , i=1
risulta espresso, in termini del momento di per cui, in definitiva, il vettore A dipolo magnetico e del tensore Q / , dall’equazione .. ... = cM × n + 1 n · Q A / . 2 Se adesso sostituiamo questa equazione nell’espressione del campo elettrico attraverso l’equazione E1 (r, t) e introduciamo il vettore Q = n · Q Q / , si ottiene ... .. 1 1 n × M + n × (n × Q ) . E1 (r, t) = 2 c R 2c ` interessante osservare che, ai fini del calcolo del campo E1 (r, t), il tensore Q E / pu` o essere senz’altro sostituito dal tensore del momento di quadrupolo elettrico, generalmente definito in elettrostatica dall’espressione Q=
1 ei si si − s2i U , 3 i=1
N
dove U `e il tensore unitario. Ovviamente si ha
92
CAPITOLO 3
Q=Q /−
1 ei s2i U , 3 i
cosicch´e i due tensori Q e Q / differiscono fra loro di una quantit` a proporzionale al tensore unitario. Se si adotta l’espressione di Q in luogo di Q / per definire si ottiene un altro vettore che differisce da Q per una quantit` il vettore Q, a 1 (r, t) a proporzionale a n la quale non d` a alcun contributo al campo elettrico E causa della presenza del doppio prodotto vettoriale. Quindi, ai fini del calcolo data sopra pu` di questo campo, la definizione di Q o essere sostituita dalla definizione equivalente = n · Q . Q
3.11 Diagramma di radiazione per le componenti multipolari Come abbiamo visto nel paragrafo precedente, il contributo del campo elettrico nella zona di radiazione dovuto alle correzioni del primo ordine in v/c pu` o, sotto un certo numero di ipotesi, essere scomposto nella somma di un termine dovuto all’irraggiamento di dipolo magnetico e un termine dovuto all’irraggiamento di quadrupolo elettrico, ovvero 1 (r, t) = E d.m. (r, t) + E q.e. (r, t) , E dove ... .. , q.e. = 1 n × (n × Q ) . d.m. = 1 n × M E E c2 R 2 c3 R Vogliamo adesso determinare i diagrammi di radiazione che competono indipendentemente ai due tipi diversi di irraggiamento. Se esiste soltanto irraggiamento di dipolo magnetico, esprimendo il vettore di Poynting attraverso la consueta espressione valida nella zona di radiazione, ovvero r, t) = c E 2 (r, t) n , S( 4π si ottiene
r, t) = S(
.. 2 sin2 θ M
n , .. . Il diagramma di radiazione dove θ `e l’angolo compreso fra i due vettori n e M `e in tutto e per tutto analogo a quello dell’irraggiamento di dipolo elettrico 4π c3 R2
RADIAZIONE DI CARICHE IN MOTO
93
mostrato nella Fig. 3.3. L’unica differenza fra questi due casi `e dovuta al fatto che nell’irraggiamento di dipolo elettrico compare un doppio prodotto .. ), mentre nell’irraggiamento di dipolo magnetico compare vettoriale, n × (n × D .. . Questa differenza ha conseguenze solo un prodotto vettoriale singolo, n × M sulle caratteristiche di polarizzazione dei due tipi di emissione. Nel primo caso il vettore campo elettrico giace nel piano contenente la direzione di propagazione, .. , mentre nel secondo caso il vettore campo elettrico `e diretto n, e il vettore D perpendicolarmente al piano contenente la direzione di propagazione e il vettore .. . Per la potenza totale si ottiene una formula del tutto analoga a quella M dell’emissione di dipolo elettrico, ovvero 2 .. 2 M . 3 c3 Passiamo adesso ad analizzare il caso dell’emissione di quadrupolo supponendo che esista solo tale tipo di irraggiamento. Il vettore di Poynting `e dato da Wd.m. =
... 2 1 n × Q n , 16π c5 R2 ovvero, ricordando la definizione del vettore Q r , t) = S(
r , t) = S(
... 2 1 n × n · Q / n , 16π c5 R2
... ... il tensore Q / potendo alternativamente essere sostituito dal tensore Q . Nel seguito ci atterremo a quest’ultima definizione, osservando che il ...tensore Q `e un tensore a traccia nulla6 e che tale propriet`a si conserva per Q . Ricordiamo poi che per un tensore cartesiano simmetrico, quale Q, si pu` o sempre determinare un opportuno sistema di riferimento, (x, y, z), nel quale il tensore stesso `e diagonale. Si pu`o quindi scrivere, in tale riferimento ... Q = Aı ı + B j j + C k k , dove ... A = Qxx ,
... B = Qyy ,
... C = Qzz ,
con A+B+C =0 . Individuando in questo sistema la direzione arbitraria n con gli angoli polari θ e φ, ovvero ponendo 6
Questa propriet` a semplifica la deduzione delle equazioni che saranno provate in seguito.
94
CAPITOLO 3
Fig. 3.12. Diagramma di radiazione per l’emissione di quadrupolo nel caso semplificato in cui sia A = B. Il diagramma ` e a simmetria di rotazione attorno all’asse verticale.
n = sinθ cosφı + sinθ sinφ j + cosθ k , si ottiene, con facili passaggi ... n × (n · Q ) = sinθ cosθ sin φ (C − B)ı + sinθ cosθ cosφ (A − C) j + sin2 θ sinφ cosφ (B − A) k , e il vettore di Poynting risulta 2 1 sin θ cos2 θ sin2 φ (B − C)2 + sin2 θ cos2 θ cos2 φ (C − A)2 5 2 16π c R + sin4 θ sin2 φ cos2 φ (A − B)2 n .
r , t) = S(
Questa formula esprime il diagramma di radiazione per l’emissione di quadrupolo elettrico. Tale diagramma risulta relativamente complicato e manca, in generale, di simmetria. Soltanto nel caso semplificato in cui sia A = B (che implica C = −2 A), si ottiene la seguente espressione, a simmetria di rotazione attorno all’asse z, illustrata nella Fig. 3.12 9 sin2 θ cos2 θ A2 n . 16π c5 R2 Tornando al caso generale, l’espressione per la potenza totale irradiata su tutto l’angolo solido pu` o essere facilmente determinata osservando che la media sull’angolo solido delle tre funzioni r, t) = S(
95
RADIAZIONE DI CARICHE IN MOTO
sin2 θ cos2 θ sin2 φ , 1 15 .
vale
sin2 θ cos2 θ cos2 φ ,
sin4 θ sin2 φ cos2 φ
Si ottiene quindi Wq.e. =
1 (B − C)2 + (C − A)2 + (A − B)2 , 5 60 c
e, ricordando che A + B + C = 0, per cui A2 + B 2 + C 2 = −2 (AB + BC + CA) , si ha
Wq.e. =
... 2 ... 2 1 ... 2 1 2 2 2 (Q . A = + B + C ) + (Q ) + (Q xx yy zz ) 20 c5 20 c5
Infine, si pu` o osservare che, dato un tensore di rango due qualsiasi, T ij , se ne pu` o definire il modulo quadro, T2 , con l’equazione Tij2 , T2 = ij
e si pu` o dimostrare che tale quantit` a `e invariante per rotazioni del sistema di riferimento. In particolare, nel sistema di riferimento in cui il tensore `e diagonale, si ha 2 2 2 T2 = Txx + Tyy + Tzz .
L’espressione per la potenza dell’irraggiamento di quadrupolo pu`o quindi essere scritta, in un sistema arbitrario, nella forma Wq.e. =
1 ... 2 Qij . 20 c5 ij
(3.34)
Osserviamo infine che le espressioni per l’irraggiamento di onde elettromagnetiche che abbiamo ottenuto in questi ultimi due paragrafi possono essere “traslate” in maniera euristica per descrivere l’irraggiamento di onde gravitazionali. L’Appendice 6 `e dedicata a questo argomento.
Capitolo 4
Quantizzazione del campo elettromagnetico Nella sua interazione con la materia, la radiazione elettromagnetica presenta un comportamento caratteristico per il quale l’assorbimento e l’emissione avvengono sotto forma di quanti di energia comunemente denominati fotoni. Tali fenomeni non possono essere descritti in base alla teoria classica sviluppata nel capitolo precedente ma necessitano una trattazione specifica capace di unificare, nell’ambito di una teoria formalmente coerente, i concetti di base dell’Elettromagnetismo e della Meccanica Quantistica. Tale teoria, detta Elettrodinamica Quantistica, `e stata sviluppata a partire dagli anni 1930 grazie al contributo di eminenti fisici, fra i quali basta qui ricordare Dirac e Feynman. In questo capitolo daremo un’introduzione di base del formalismo, cosiddetto di seconda quantizzazione, che viene oggi comunemente utilizzato nell’ambito dell’Elettrodinamica Quantistica per introdurre il concetto di fotone. Le applicazioni di questo formalismo alla descrizione dell’interazione fra materia e radiazione e allo studio di specifici processi fisici saranno trattate in capitoli successivi (Cap. 11 e 15).
4.1 Oscillatore armonico, operatori di creazione e distruzione Consideriamo un oscillatore armonico unidimensionale, la cui realizzazione pratica pi` u semplice `e costituita da una particella puntiforme, di massa m, mobile lungo una retta e soggetta all’azione di una forza di richiamo elastica. Detta x la coordinata misurata lungo tale retta a partire dalla posizione di equilibrio, l’equazione di moto `e mx ¨ = −k x , dove k `e la costante di richiamo. Come `e noto questa equazione ammette soluzioni di tipo armonico caratterizzate dalla frequenza angolare $ k ω= . m Nel formalismo della meccanica analitica, il sistema fisico `e descritto dalla funzione Hamiltoniana H, che rappresenta l’energia totale, data da
98
CAPITOLO 4
H=
1 p2 + k x2 , 2m 2
dove p `e l’impulso della particella. Seguendo le convenzioni della meccanica analitica, indichiamo col simbolo q la coordinata x. Sostituendo inoltre ω in luogo di k, l’Hamiltoniana si pu` o riscrivere nella forma H=
p2 1 + m ω2 q2 . 2m 2
In questa equazione p rappresenta pi` u propriamente il momento cinetico coniugato alla variabile q. Le equazioni di moto per q e p si ottengono attraverso le ben note equazioni di Hamilton p˙ = −
∂H = −m ω 2 q , ∂q
q˙ =
p ∂H = . ∂p m
Introduciamo adesso, in luogo delle variabili q e p, delle loro combinazioni lineari della forma a = C (m ω q + i p) , a∗ = C (m ω q − i p) ,
√ dove i = −1 `e l’unit`a immaginaria e dove C `e una costante reale il cui valore sar` a specificato in seguito. Per le equazioni di moto si ha, con facili passaggi, a˙ = C (m ω q˙ + i p) ˙ = −i ω a , e, analogamente, a˙ ∗ = i ω a∗ . Come si vede, con l’introduzione delle variabili a e a∗ , le equazioni differenziali risultano disaccoppiate e quindi di pi` u facile soluzione. Passando alla descrizione quantistica, q e p devono essere pensati come operatori lineari Hermitiani agenti su un opportuno spazio di Hilbert. I due operatori devono inoltre soddisfare la regola di commutazione [ q, p ] = q p − p q = i h ¯ , dove abbiamo introdotto il consueto simbolo per indicare il commutatore fra due operatori, e dove h ¯ `e la costante di Planck divisa per 2π (¯ h = 1.055 × 10−27 erg s). Con l’introduzione delle quantit` a a e a∗ , che nella formulazione
QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO
99
quantistica divengono gli operatori a e a† , gli operatori q e p si esprimono attraverso le equazioni 1 (a + a† ) , 2C mω i (a − a† ) , p=− 2C e l’Hamiltoniana risulta (facendo attenzione a non alterare l’ordine degli operatori) q=
H=
1 (a† a + a a† ) . 4 m C2
Valutiamo adesso il commutatore fra gli operatori a e a† . Si ha [ a, a† ] = C 2 [ m ω q + i p , m ω q − i p ] = 2 C 2 m h ¯ω , e scegliamo la costante C in modo che si abbia (4.1) [ a, a† ] = 1 . √ ¯ ω, col che l’Hamiltoniana risulta Per far questo `e sufficiente porre C = 1/ 2 m h H=
1 h ¯ ω (a a† + a† a) , 2
e, tenendo presente la regola di commutazione fra a e a† , si ottiene H=h ¯ ω a† a + 21 .
(4.2)
u Con l’introduzione degli operatori a e a† , che, per ragioni che saranno pi` chiare in seguito, prendono il nome, rispettivamente, di operatore di distruzione e di creazione, l’Hamiltoniana `e stata ricondotta a una forma molto semplificata. Adesso troveremo autovalori e autovettori di questa Hamiltoniana dimenticando, in un certo qual modo, la sua origine e sfruttando unicamente la regola di commutazione fra gli operatori a e a† . Calcoliamo preliminarmente alcuni commutatori [H, a] = h ¯ ω [ a† a, a ] = h ¯ ω [ a† , a ] a = −¯ hω a , ¯ ω [ a† a, a† ] = h ¯ ω a† [ a, a† ] = h ¯ ω a† . [H, a† ] = h Supponiamo adesso di conoscere un particolare autovettore, |H , dell’Hamiltoniana e il corrispondente autovalore H H|H = H|H
,
e consideriamo il prodotto scalare H| a† a |H . Con facili passaggi si ottiene
100
CAPITOLO 4
h ¯ ω H| a† a |H = (H −
1 2
h ¯ ω) H|H
.
In questa equazione si pu`o osservare che il primo membro `e positivo, essendo il prodotto della quantit` ah ¯ ω per la norma del vettore a|H . Essendo d’altra parte positiva anche la norma del vettore |H , ne risulta per l’autovalore H H≥
1 2
h ¯ω ,
il segno di uguaglianza essendo verificato solo quando a|H = 0. Applicando poi l’Hamiltoniana al vettore a|H , si ha, attraverso le regole di commutazione dimostrate precedentemente H a|H = (aH − h ¯ ω a)|H = (H − h ¯ ω) a|H
.
Questa equazione mostra che, se |H `e un autovettore dell’Hamiltoniana corrispondente all’autovalore H, allora il vettore a|H `e anch’esso un autovettore dell’Hamiltoniana corrispondente all’autovalore (H − h ¯ ω). Applicando ripetutamente questa propriet`a, si trova che, in generale, il vettore an |H (con n intero) `e anch’esso autovettore dell’Hamiltoniana corrispondente all’autovalore (H − n h ¯ ω). Cos`ı facendo si ottiene una catena di autovettori aventi autovalori sempre minori. Questa catena deve per` o interrompersi perch´e, altrimenti, si arriverebbe a trovare degli autovalori che non soddisfano pi` u la condizione H ≥ 21 h ¯ ω. L’unico modo possibile per interrompere la catena `e che, per un certo intero m, si verifichi am |H = 0 . Questo significa che il vettore am−1 |H `e l’autovettore che corrisponde all’autovalore 21 h ¯ ω. Tale autovettore, che sar`a indicato nel seguito col simbolo |0 , `e tale che a|0 = 0 ,
H|0 =
1 2
h ¯ ω |0
.
†
a di commutaSe consideriamo adesso il vettore a |0 , si ha, per le propriet` zione dimostrate precedentemente H a† |0 = (a† H + h ¯ ω a† )|0 =
3 2
h ¯ ω a† |0
,
e, analogamente, per un intero n qualsiasi ¯ ω a†n |0 H a†n |0 = (n + 12 ) h
.
Si `e cos`ı costruita, a partire dall’autovettore |0 , una catena di autovettori corrispondenti ad autovalori mano a mano crescenti. Gli autovalori dell’Hamiltoniana sono quindi dati dalle quantit` a 12 h ¯ ω, (1 + 12 ) h ¯ ω, . . . , (n + 12 ) h ¯ ω, . . . , e a tali autovalori corrispondono gli autovettori |0 , a† |0 , . . . , a†n |0 , . . . .
101
QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO
Gli autovettori cos`ı trovati non sono per` o normalizzati. Per trovare la norma dell’autovettore generico, bisogna considerare la quantit`a 0| an a†n |0 , che pu` o essere facilmente valutata tenendo conto dell’equazione (dimostrabile con un procedimento di induzione) [ a, a†n ] = n a†n−1 . Per la norma del vettore a†n |0 , si ha 0| an a†n |0 = 0| an−1 a a†n |0 = 0| an−1 (a†n a + n a†n−1 )|0 = = n 0| an−1 a†n−1 |0
.
Applicando successivamente questa equazione si ottiene infine 0| an a†n |0 = n! 0|0
.
Se si suppone allora che l’autovettore |0 sia normalizzato, si possono ottenere gli altri autovettori normalizzati, che indichiamo con |n , attraverso l’espressione 1 |n = √ a†n |0 n!
.
` facile mostrare che gli operatori a e a† agiscono sull’autovettore |n E seguente maniera √ n |n − 1 , √ † a |n = n + 1 |n + 1
nella
a|n =
.
Queste equazioni giustificano il nome loro attribuito di operatori di distruzione e di creazione, qualora si interpreti il numero quantico n come numero di occupazione di ipotetiche particelle.
4.2 Sviluppo del campo elettromagnetico in serie di Fourier Si consideri il campo elettromagnetico racchiuso in una cavit`a cubica, la cosiddetta “scatola”, di lato L e volume V = L3 . In assenza di cariche e correnti, per quanto visto nel Par. 1.5, possiamo utilizzare il caso particolare del gauge di Lorenz nel quale il potenziale scalare φ(x, t) `e nullo (Eq. (1.10)), dimodoch´e x, t) che `e soggetto alla conil campo `e descritto dal solo potenziale vettore A( dizione supplementare (non invariante relativisticamente) dell’Eq. (1.11)
102
CAPITOLO 4
x, t) = 0 , divA( e che soddisfa l’equazione delle onde 1 ∂2 A(x, t) = 0 . c2 ∂t2 Fissiamo un istante arbitrario t e sviluppiamo il potenziale vettore in serie di Fourier della variabile x. Imponendo che esso soddisfi alle cosiddette condizioni di periodicit` a, ovvero x, t) − ∇2 A(
y, z, t) = A(x + mx L, y + my L, z + mz L) , A(x, con mx , my , mz interi arbitrari (positivi, negativi, o nulli), si ottiene x, t) = (t) ei k·x , A( C k k
con la somma estesa a tutti i valori di k tali da soddisfare le condizioni di periodicit` a, ovvero a tutti i valori di k della forma k = nx 2π , ny 2π , nz 2π , L L L con nx , ny , nz interi arbitrari (positivi, negativi, o nulli). Essendo la funzione x, t) reale, il vettore complesso C (t) soddisfa la propriet` A( a di coniugazione k (t)∗ = C (t) . C k −k Imponiamo adesso che il potenziale vettore soddisfi l’equazione delle onde. Si (t) l’equazione differenziale ottiene per C k (t) d2 C k (t) , = −ωk2 C k dt2 dove abbiamo introdotto la frequenza angolare ωk (relativa al vettore d’onda k ) attraverso l’espressione ωk = c k , k essendo il modulo del vettore k. L’equazione differenziale pu` o essere facilmente risolta per dare (t) = C (−) e−i ωk t + C (+) ei ωk t , C k k k (+) costanti. Sostituendo si ottiene (−) e C con C k
k
QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO
x, t) = A(
(−) ei (k·x−ωk t) + C
k
103
(+) ei (k·x+ωk t) , C k
k
k
con (+) . (−)∗ = C C k − k Il potenziale vettore `e stato cos`ı decomposto in onde progressive e regressive. Tenendo conto che ωk = ω−k , si pu` o trasformare l’esponenziale che compare nell’onda regressiva mediante l’equazione e i (k·x+ωk t) = e−i (−k·x−ω−k t) , e cambiando nella seconda somma l’indice k in −k si ottiene (−)∗ (−) ei (k·x−ωk t) + x, t) = e−i (k·x−ωk t) , C C A(
k
k
k
k
che mostra in maniera diretta la realt` a della funzione A(x, t). Imponiamo infine la condizione supplementare di gauge (div A(x, t) = 0). Si ottiene, per ogni valore di k, la condizione di trasversalit` a k · C (−) = 0 . k
Possiamo soddisfare questa condizione nella seguente maniera. Per ogni vettore d’onda k, definiamo due versori di polarizzazione (in generale complessi) ekλ (λ = 1, 2) entrambi perpendicolari a k e perpendicolari fra loro, tali cio`e da soddisfare le equazioni ekλ · k = 0 , ∗ . ekλ · ekλ = δλλ
Con l’introduzione di questi versori possiamo soddisfare la condizione di trasversalit`a scrivendo (−) e−i ωk t = C ckλ(t) ekλ , k λ
dove ckλ(t) `e una funzione oscillante che soddisfa l’equazione differenziale d c (t) = −i ωk c (t) . kλ dt kλ Per il potenziale vettore si ottiene quindi l’espressione finale ∗ −i x, t) = ckλ(t) ekλ ei k·x + c∗kλ(t) ekλ e k·x , A( kλ
104
CAPITOLO 4
dalla quale si possono dedurre le espressioni per i vettori campo elettrico e campo magnetico ∗ −i x, t) = − 1 ∂ A( x, t) = i E( ωk ckλ(t) ekλ ei k·x − c∗kλ(t) ekλ e k·x , c ∂t c kλ
x, t) = rotA( x, t) = i B(
k × c (t) e ei k·x − c∗ (t) e ∗ e−i k·x . kλ kλ kλ kλ
kλ
Le somme che compaiono in queste espressioni sono estese a tutti i valori di k tali da soddisfare le condizioni di periodicit` a, e, fissato k, ai due possibili stati di polarizzazione. Ciascuna coppia (k, λ) definisce un cosiddetto modo del campo di radiazione entro la cavit` a. Il numero di modi per i quali il modulo del vettore d’onda `e compreso fra k e k + dk e la direzione del vettore d’onda `e compresa nell’angolo solido dΩ si pu` o trovare osservando che, nello spazio dei numeri d’onda, gli estremi dei possibili vettori k vengono a trovarsi sulle maglie di un reticolato cubico avente per lato 2π/L. Si ottiene quindi per tale numero dN = 2
2π L
−3 V 2 k 2 dk dΩ = k dk dΩ , 4π 3
(4.3)
dove V `e il volume della cavit`a e dove il fattore 2 supplementare `e stato introdotto per tener conto dei due possibili stati di polarizzazione.
4.3 Passaggio alla quantizzazione Lo sviluppo in serie di Fourier ottenuto nel paragrafo precedente `e basato su considerazioni puramente classiche. Si passa alla quantizzazione in rappresentazione di Schr¨odinger interpretando le grandezze classiche ckλ (t) e c∗kλ(t), ovvero i coefficienti dipendenti dal tempo che compaiono nello sviluppo in serie di Fourier del potenziale vettore e dei campi, come operatori quantistici ckλ e c† , indipendenti dal tempo, che agiscono su un opportuno spazio di Hilbert. kλ x, t), E( x, t) e B( x, t), divengono Cos`ı facendo, anche le grandezze classiche A( x) si ha, ad esempio operatori indipendenti dal tempo. Per l’operatore A( x) = A(
∗ −i c ekλ e i k·x + c† ekλ e k·x , kλ
kλ
kλ
x) e B( x). con espressioni analoghe per gli operatori E( Dobbiamo adesso costruire l’operatore che corrisponde alla Hamiltoniana del campo di radiazione. Per far questo ci basiamo sul principio di corrispondenza e scriviamo, ricordando l’espressione per la densit`a di energia del campo
QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO
H=
u(x ) d3 x = V
1 8π
105
2 (x ) + B 2 (x ) d3 x , E V
x ) e B( x ) sono l’operatore campo elettrico e l’operatore campo madove E( x) e gnetico, rispettivamente. Sostituendo le espressioni operatoriali per E( B(x ) si ottiene un’espressione contenente una somma doppia sugli indici (k, λ) o ossere (k , λ ). Tuttavia, tenendo conto delle condizioni di periodicit`a, si pu` vare che portano contributo non nullo all’integrale soltanto i termini contenenti prodotti di esponenziali del tipo ei k·x e−i k·x ,
per i quali l’integrazione in d3 x vale semplicemente V. Per ciascuno dei due contributi, quello elettrico e quello magnetico, che indichiamo rispettivamente con Hel. e Hma. , si ottengono quattro pezzi distinti, ovvero 1 2 (x ) d3 x = − V Hel. = ωk2 c c (ekλ · e−kλ ) E 2 kλ −kλ 8π V 8π c kλλ
Hma.
† ∗ ∗ ∗ + c† c† (ekλ · e−∗kλ ) − c c† (ekλ · ekλ ekλ · ekλ ) , ) − c c ( kλ kλ kλ −kλ kλ kλ 1 2 (x ) d3 x = − V ckλ c−kλ (k × ekλ ) · (−k × e−kλ ) = B 8π V 8π kλλ
∗ ∗ + c† c† (k × ekλ ) · (−k × e−∗kλ ) − c c† (k × ekλ ) · (k × ekλ ) kλ −kλ
kλ kλ
∗ ) · (k × ekλ ) . − c† c (k × ekλ kλ kλ
Osservando poi che, per due versori arbitrari e1 e e2 , entrambi perpendicolari al vettore k si ha (k × e1 ) · (k × e2 ) = k 2 (e1 · e2 ) , e che k 2 = ωk2 /c2 , si ottiene che, per i primi due addendi che compaiono entro le parentesi quadre a secondo membro, i contributi elettrico e magnetico si elidono, mentre, per gli ultimi due addendi, i contributi elettrico e magnetico risultano uguali. Tenendo infine conto che ∗ , ekλ · ekλ = δλλ
si ottiene l’espressione H=
V 2 † † c . ω c + c c k kλ kλ kλ kλ 4π c2 kλ
106
CAPITOLO 4
Per ricondurre questa Hamiltoniana alla somma di Hamiltoniane gi`a studiate precedentemente, passiamo dagli operatori c e c† agli operatori a e a† kλ kλ kλ kλ definiti da $ 1 ωk V c a = . kλ c 2π h ¯ kλ Con questa posizione, l’Hamiltoniana risulta
1 , (4.4) ¯ ωk a a† + a† a H= 2 h kλ kλ
kλ kλ
kλ
e l’operatore potenziale vettore si scrive nella forma % 2π h ¯ ∗ −i x) = a ekλ e i k·x + a† ekλ c e k·x . A( kλ kλ ωk V
(4.5)
kλ
Per completare la quantizzazione del campo elettromagnetico `e per` o necessario conoscere le regole di commutazione degli operatori a e a† . Queste kλ kλ possono essere dedotte attraverso il principio di corrispondenza sfruttando il fatto che conosciamo le equazioni di moto che regolano l’evoluzione temporale delle quantit`a classiche corrispondenti (ckλ (t) ∼ exp(−i ωk t)). Se |ψ `e un qualsiasi vettore di stato del sistema quantistico, l’osservabile classica corrispondente all’operatore akλ `e data dal valore di aspettazione ψ| akλ |ψ , e tale osservabile deve soddisfare l’equazione d ψ| a |ψ = −i ωk ψ| a |ψ . kλ kλ dt Tenendo conto d’altra parte che lo stato |ψ obbedisce all’equazione di Schr¨odinger, si ha d i ψ| a |ψ = ψ|[ H, a ]|ψ kλ kλ dt h ¯ e, sostituendo l’espressione trovata per H,
,
i d ω ψ|[ a a† + a† a , a ]|ψ ψ| a |ψ = kλ k λ k λ kλ k λ k λ dt 2 k
.
k λ
Identificando le due espressioni trovate per la derivata dell’osservabile, si ha ωk ψ| akλ |ψ = − 12
& k λ
ωk ψ|[ ak λ a†k λ + a†k λ ak λ , akλ ]|ψ
.
Poich´e l’espressione a secondo membro deve contenere, come quella a primo membro, soltanto quantit` a dipendenti dagli indici k e λ, e poich´e ci`o deve verificarsi per qualsiasi vettore di stato |ψ , si deve avere
107
QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO
[a , a ] = 0 k λ
per k = k, λ = λ ,
(4.6)
[a , a† ] = 0
per k = k, λ = λ ,
(4.7)
kλ
kλ
k λ
il che significa che operatori a e a† relativi a modi diversi commutano. L’equazione precedente risulta quindi ψ| a |ψ = − 12 ψ| a [ a† , a ] + [ a† , a ] a | ψ kλ
kλ
kλ
kλ
kλ
kλ
kλ
.
Essendo il vettore di stato arbitrario, questa equazione pu`o essere soddisfatta solo ponendo [ a , a† ] = 1 , kλ
kλ
(4.8)
e l’Hamiltoniana assume la forma H=
h ¯ ωk a† a + 21 . kλ kλ
(4.9)
kλ
Confrontando i risultati contenuti nelle Eq. (4.6)-(4.9) con quelli del Par. 4.1 (Eq. (4.1) e (4.2)), possiamo concludere che l’Hamiltoniana quantistica del campo elettromagnetico risulta pari alla somma di tante Hamiltoniane di oscillatore armonico, indipendenti fra loro; ciascun oscillatore `e associato a un modo del campo di radiazione caratterizzato dal vettore d’onda k (e quindi dalla frequenza angolare ωk ) e dal versore di polarizzazione ekλ . Ricordando i risultati del Par. 4.1 si ha che l’energia relativa a ciascun modo pu`o assumere soltanto uno dei valori Ekλ = h ¯ ωk (n + 12 ) , dove n `e un intero arbitrario maggiore o uguale a 0. Questo risultato si interpreta dicendo che il modo contiene un numero n di fotoni tutti di energia h ¯ ωk . Il numero n prende anche il nome di numero d’occupazione del modo. In particolare, se n = 0, l’energia assume il valore 12 h ¯ ωk , ovvero si ottiene la cosiddetta energia di zero. Tale energia ha, in molti casi, un’importanza puramente formale e pu`o essere ignorata in gran parte delle applicazioni. Si deve notare che, essendo il numero di modi infinito, l’energia di zero del campo elettromagnetico `e infinita. Per interpretare in maniera coerente la realt` a fisica si `e costretti a “rinormalizzare” l’energia che compete allo stato di vuoto imponendo che essa sia zero. Poich´e l’Hamiltoniana totale `e uguale alla somma di tante Hamiltoniane indipendenti, ne consegue che i suoi autovalori sono uguali alla somma degli autovalori delle singole Hamiltoniane. Gli autovalori dell’Hamiltoniana totale sono quindi della forma
108
CAPITOLO 4
E=
h ¯ ωk (nkλ + 12 ) ,
kλ
e risultano individuati dall’insieme dei numeri interi nkλ che specificano il numero di fotoni presenti in ciascun modo. Per quanto riguarda l’identificazione degli autovettori, ovvero degli stati stazionari del campo di radiazione, si pu`o utilizzare una generalizzazione del formalismo introdotto nel Par. 4.1 scrivendo l’autovettore nella forma compatta |n1 , n2 , . . . , nkλ , . . .
= |n1 |n2 · · · |nkλ · · · ,
ovvero come il prodotto diretto di tanti “ket” ciascuno definito in uno spazio di Hilbert diverso. Ciascun operatore a o a† opera soltanto sul vettore |nkλ kλ kλ relativo al modo corrispondente, per cui si ha a |n1 , n2 , . . . , nkλ , . . .
=
√ nkλ |n1 , n2 , . . . , nkλ − 1, . . .
a† |n1 , n2 , . . . , nkλ , . . .
=
# nkλ + 1 |n1 , n2 , . . . , nkλ + 1, . . .
kλ
kλ
,
(4.10) ,
(4.11)
il che giustifica il nome di operatori di distruzione e creazione di fotoni dato rispettivamente agli operatori akλ e a† . kλ Il formalismo introdotto in questo paragrafo prende il nome di formalismo della seconda quantizzazione. Questa denominazione non `e del tutto giustificata nel caso della quantizzazione del campo elettromagnetico ma trae origine dal fatto che procedimenti del tutto analoghi possono essere applicati alla quantizzazione di campi di particelle. Volendo ad esempio introdurre la quantizzazione di un campo di particelle non relativistiche di massa m, si parte dall’equazione di Schr¨ odinger per la funzione d’onda delle particelle stesse ih ¯
∂ h ¯2 2 ψ(x, t) = − ∇ ψ(x, t) , ∂t 2m
si sviluppa la funzione d’onda ψ(x, t) in serie di Fourier, e si interpretano poi i coefficienti dello sviluppo come operatori quantistici. In questo caso ha effettivamente senso parlare di seconda quantizzazione, in quanto il campo di particelle `e gi` a descritto da un’equazione d’onda quantistica. Nel caso dell’elettromagnetismo, invece, l’equazione d’onda per i fotoni `e una equazione classica che discende dalle equazioni di Maxwell. Per concludere, bisogna osservare che il formalismo che abbiamo qui introdotto non `e covariante, dato che non `e covariante l’espressione assunta per il = 0). La quantizzazione del campo eletgauge elettromagnetico (φ = 0, divA tromagnetico in forma covariante, pi` u elegante e sicuramente pi` u soddisfacente
QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO
109
dΩ P
Ω
dS fluisce attraFig. 4.1. La radiazione contenuta nell’angolo solido dΩ, centrato intorno a Ω, verso l’elemento di superficie dS.
dal punto di vista teorico1 , richiede l’utilizzazione di un formalismo pi` u pesante che non `e per` o necessario per molte applicazioni, quali quelle che saranno sviluppate nei Cap. 11 e 15 per trattare l’interazione fra materia e radiazione.
4.4 Intensit` a e fotoni Il concetto di fotone introdotto nel paragrafo precedente pu`o essere messo in stretta relazione con le quantit`a fisiche tradizionalmente impiegate per la descrizione dei fenomeni di irraggiamento, quali l’intensit`a specifica e la densit`a di energia del campo di radiazione. Si consideri un punto arbitrario P dello spazio e un elemento di superficie dS Indichiamo con la cui direzione normale `e individuata dal versore unitario Ω. dEν l’energia del campo elettromagnetico, avente frequenza compresa fra ν e che ν + dν e direzione compresa entro l’angolo solido dΩ centrato intorno a Ω, fluisce, nel tempo infinitesimo dt, attraverso il dS (si veda la Fig.4.1). Il dEν `e ovviamente proporzionale al prodotto dS dν dt dΩ e si ha quindi t) dS dν dt dΩ . dEν = Iν (P, Ω, t) che prende Questa equazione definisce implicitamente la quantit`a Iν (P, Ω, il nome di intensit` a specifica (o intensit`a tout court) del campo di radiazione e che `e in generale funzione, oltre che della frequenza, del punto, della direzione e del tempo. Se l’intensit` a non dipende dal tempo, il campo di radiazione si dice stazionario, se non dipende dalla direzione si dice isotropo e se non dipende dal punto P si dice omogeneo. In luogo dell’intensit` a specifica Iν si pu` o anche considerare la quantit` a Iλ che porta lo stesso nome e che `e definita dalla stessa equazione, eccetto per l’intervallo di frequenza dν che `e sostituito dall’intervallo di lunghezza d’onda 1
Si veda ad esempio J.D. Bjorken & S.D. Drell, Relativistic Quantum Fields, McGraw-Hill, New York, etc., 1965.
110
CAPITOLO 4
dλ. Analogamente si pu` o anche considerare la quantit` a Iω anch’essa definita dalla medesima equazione con il dω (intervallo di frequenza angolare) in luogo del dν (intervallo di frequenza). Evidentemente, per intervalli corrispondenti si ha Iν dν = Iλ dλ = Iω dω , e poich´e dλ = λ2 dν/c, dω = 2π dν, si ha anche Iλ =
c Iν , λ2
Iω =
1 Iν . 2π
(4.12)
Altra quantit` a, strettamente connessa all’intensit`a specifica, `e la densit` a di t), energia del campo di radiazione. Tale quantit` a, indicata col simbolo u ν (P, Ω, `e definita facendo riferimento a un elemento di volume dV centrato intorno al punto P. Se si indica con dEν la quantit` a di energia elettromagnetica contenuta nel dV e avente frequenza compresa fra ν e ν + dν e direzione contenuta nel dΩ si ha, per definizione t) dV dν dΩ . dEν = uν (P, Ω, Poich´e la radiazione elettromagnetica si propaga con velocit`a c, ne segue immediatamente la relazione fra Iν e uν , ovvero t) = c uν (P, Ω, t) . Iν (P, Ω,
(4.13)
Consideriamo adesso i modi del campo di radiazione che corrispondono all’intervallo di frequenza (ν, ν + dν) e alle direzioni contenute nell’angolo solido dΩ. Il numero di tali modi `e dato dall’Eq. (4.3) che, trasformando il dk nel dν per mezzo della relazione k = 2πν/c, d` a dN =
2 V ν2 dν dΩ , c3
(4.14)
dove V `e il volume di normalizzazione che possiamo qui identificare come il t) il numero di fotoni per volume infinitesimo dV . Se indichiamo con nν (P, Ω, modo relativo a tali modi e se ricordiamo che ciascun fotone ha energia h ν si ottiene 2 t) h ν 2 ν dV dν dΩ , dEν = nν (P, Ω, c3
e ricordando la definizione di uν si ottiene la relazione t) = uν (P, Ω,
2 h ν3 t) , nν (P, Ω, c3
ovvero, in termini di intensit` a specifica
QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO
3 t) = 2 h ν nν (P, Ω, t) . Iν (P, Ω, c2
111
(4.15)
` importante osservare che un’espressione analoga vale anche classicamente. E In questo caso, invece di parlare di numero di fotoni per modo si parla pi` u semplicemente di energia per modo e, indicando con ν (P, Ω, t) tale quantit` a, si ha 2 ν2 ν (P, Ω, t) . (4.16) c2 Il numero di fotoni per modo `e una quantit` a molto importante che pu` o servire a caratterizzare in maniera fisica le sorgenti luminose. Come vedremo nel Cap. 10, per una sorgente termica tale numero `e dato da Iν (P, Ω, t) =
nν =
1 , e h ν/(kB T )
dove T `e la temperatura. Nel visibile a 5000 ˚ A, ad esempio, una normale lampada a incandescenza con filamento di Tungsteno (T 2700 K) produce una radiazione avente circa 2 × 10−5 fotoni per modo, mentre tale numero `e circa 10−2 per la radiazione solare (T 5800 K). La radiazione emessa da un laser, invece, presenta un numero di fotoni per modo molto pi` u elevato che pu`o raggiungere valori tipici dell’ordine di 107 o anche superiori.
Capitolo 5
Equazioni d’onda relativistiche Per poter porre su base quantitativa lo studio degli spettri atomici, cui saranno dedicati i prossimi capitoli di questo volume, `e necessario premettere uno studio approfondito delle equazioni relativistiche per le particelle atomiche con particolare riguardo all’equazione di Dirac per l’elettrone. In questo capitolo vedremo come sia possibile descrivere, nell’ambito della meccanica quantistica, le propriet` a dinamiche di una particella relativistica libera, oppure mobile in un campo elettromagnetico stazionario. Questo ci porter`a a introdurre un appropriato formalismo di tipo matriciale dal quale scaturiscono, in maniera del tutto naturale, un certo numero di conseguenze fisiche che sono spesso assunte in maniera fenomenologica nei trattati elementari di spettroscopia atomica (spin dell’elettrone, interazione spin-orbita, etc.).
5.1 Equazione di Dirac per la particella libera La relazione impulso-energia per una particella libera non relativistica di massa m `e espressa dall’equazione E=
p2 , 2m
dove p `e l’impulso, che coincide con il momento cinetico coniugato alla variabile posizione x. Il moto della particella `e descritto in meccanica quantistica dall’equazione di Schr¨ odinger ih ¯
∂ p2 |ψ = |ψ ∂t 2m
,
dove p `e l’operatore associato alla variabile dinamica classica “impulso”. L’operatore p deve soddisfare la relazione fondamentale della meccanica quantistica che stabilisce che fra gli operatori associati a due variabili dinamiche canonicamente coniugate, q e p, deve valere la regola di commutazione [ q, p ] = i h ¯ . L’espressione esplicita dell’operatore p dipende dalla particolare rappresentazione utilizzata per esprimere i vettori di stato dello spazio di Hilbert. Se si sce-
114
CAPITOLO 5
glie la rappresentazione nella quale i vettori di stato sono espressi come combinazioni lineari degli autovettori dell’operatore posizione (rappresentazione della funzione d’onda), l’operatore x `e il semplice moltiplicatore mentre l’operatore p risulta p = −i h ¯ grad . In tale rappresentazione l’equazione di Schr¨odinger assume la forma ih ¯
∂ h ¯2 2 ψ(x, t) = − ∇ ψ(x, t) , ∂t 2m
e, in accordo con i postulati della meccanica quantistica, la quantit` a |ψ(x, t)|2 rappresenta la densit`a di probabilit` a di trovare la particella nell’intorno del punto x all’istante t. Passando alla dinamica relativistica, la relazione impulso-energia diventa E 2 = p 2 c2 + m 2 c4 , ovvero E=
# p 2 c2 + m 2 c4 ,
dove m `e la massa a riposo della particella e c `e la velocit`a della luce. Si potrebbe quindi pensare di scrivere un’equazione di Schr¨odinger del tipo ih ¯
# ∂ ψ(x, t) = p2 c2 + m2 c4 ψ(x, t) , ∂t
h2 ∇2 . La radice quadrata presente al secondo memin cui p2 `e l’operatore −¯ bro pone tuttavia dei seri problemi interpretativi riguardo al significato da attribuire all’operatore che agisce sulla funzione d’onda. Se, ad esempio, si sostituisce alla radice quadrata il suo sviluppo in serie di potenze, si ottengono potenze di tutti gli ordini in ∇2 e l’equazione risulta praticamente insolubile. Un’equazione di gran lunga pi` u semplice si ottiene traducendo in termini quantistici la relazione quadratica fra energia e impulso scritta sopra. L’equazione risultante, detta equazione di Klein-Gordon, `e la seguente m 2 c2 1 ∂2 2 ∇ − 2 2 ψ(x, t) = ψ(x, t) . c ∂t h ¯2 Tuttavia questa equazione, oltre a presentare l’inconveniente di essere un’equazione differenziale del secondo ordine rispetto al tempo (a differenza dell’equazione di Schr¨ odinger che `e del primo ordine), descrive correttamente soltanto le particelle relativistiche che non presentano spin, quali ad esempio i bosoni. Il problema di determinare un’equazione relativistica che potesse descrivere particelle dotate di spin, quali l’elettrone, fu brillantemente risolto da Dirac, il
115
EQUAZIONI D’ONDA RELATIVISTICHE
quale, nel 1928, propose un’equazione d’onda nella quale gli operatori ∂/∂xi comparivano linearmente al pari dell’operatore ∂/∂t, approccio del tutto naturale in una teoria relativistica in cui la coordinata temporale non `e privilegiata rispetto alle coordinate spaziali. L’equazione proposta da Dirac, che ovviamente porta il suo nome, `e la seguente ∂ ∂ ∂ ∂ 2 ih ¯ ψ(x, t) = −i h ¯ c α1 + β m c ψ(x, t) , + α2 + α3 ∂t ∂x1 ∂x2 ∂x3 e pu` o anche essere scritta nella forma pi` u compatta ∂ ψ(x, t) = HD ψ(x, t) = c α (5.1) · p + β m c2 ψ(x, t) , ∂t dove HD `e la cosiddetta Hamiltoniana di Dirac e dove α1 , α2 , α3 , e β sono quattro quantit` a adimensionali, aventi carattere operatoriale, le quali godono, per definizione, della propriet` a di commutare con gli operatori ∂/∂t e ∂/∂xi . Tali quantit` a vengono determinate imponendo che dall’equazione di Dirac si ottenga la corretta relazione relativistica fra energia e impulso. Derivando rispetto al tempo l’Eq. (5.1) e risostituendo l’equazione stessa, si ottiene ih ¯
−¯ h2
∂2 · p + β m c2 ψ(x, t) , ψ(x, t) = c α · p + β m c2 c α 2 ∂t
e si deve quindi imporre che cα · p + β m c2 c α · p + β m c2 = p2 c2 + m2 c4 . Sviluppando (e facendo attenzione a non alterare l’ordine degli operatori non commutanti), si ottiene
c2
ij
αi αj pi pj + m c3
(αi β + β αi ) pi + m2 c4 β 2 = c2
i
p i p i + m 2 c4 ,
i
e quindi, per avere un identit` a fra il primo e il secondo membro, si devono imporre le condizioni {αi , αj } = 2 δij ,
{αi , β} = 0 ,
β2 = 1 ,
(5.2)
dove si `e introdotto il simbolo di anticommutatore definito da {A, B} = AB + BA . Gli enti pi` u semplici che soddisfano una tale algebra sono delle matrici, di cui adesso andiamo a studiare le propriet` a. Innanzitutto, essendo il quadrato
116
CAPITOLO 5
di ciascuna delle quattro matrici uguale all’unit` a, gli autovalori devono essere uguali a ±1. Inoltre, essendo β 2 = 1 e β αi = −αi β, per la traccia di ciascuna delle matrici αi si ottiene la seguente relazione Tr(αi ) = Tr(β 2 αi ) = −Tr(β αi β) . D’altra parte, per la propriet` a ciclica della traccia di una matrice si ha anche Tr(αi ) = Tr(β 2 αi ) = Tr(β αi β) . Avendo quindi ottenuto Tr(αi ) = −Tr(αi ), si deve necessariamente avere Tr(αi ) = 0 . In maniera del tutto analoga si prova anche che Tr(β) = 0. Quindi, poich´e la traccia `e la somma degli autovalori, e poich´e questi ultimi possono essere soltanto uguali a ±1 (in quanto le matrici hanno per quadrato l’unit` a), ne consegue che le matrici devono essere di ordine pari. Non essendo possibile costruire quattro matrici 2 × 2 che obbediscano all’algebra delle Eq. (5.2), la scelta cade sulle matrici 4 × 4. Risulta quindi che gli enti αi e β introdotti nell’equazione di Dirac possono essere rappresentati mediante matrici di ordine 4. Tali matrici prendono il nome di matrici di Dirac. La scelta delle matrici di Dirac non `e univoca. Una possibile rappresentazione, che risulta particolarmente adatta a trattare il limite non relativistico, `e quella data, in termini di matrice 2 × 2, dalle seguenti espressioni I 0 0 σi αi = , (5.3) , β= 0 −I σi 0 dove I `e la matrice unit` a di ordine 2 e dove le σi sono le matrici 2 × 2 di Pauli 0 1 0 −i 1 0 , σ2 = , σ3 = . σ1 = 1 0 i 0 0 −1 A partire dalle loro espressioni si pu`o facilmente mostrare che le matrici di Pauli soddisfano le relazioni [ σi , σj ] = 2 i ijk σk , k
{σi , σj } = 2 δij , dove ijk `e il tensore completamente antisimmetrico, o tensore di Ricci (si veda l’App. 2). Le due equazioni precedenti possono essere condensate nell’unica σi σj = δij + i ijk σk . k
EQUAZIONI D’ONDA RELATIVISTICHE
117
` facile verificare che le quattro matrici definite nelle Eq. (5.3), ovvero le quatE tro matrici ⎛
0 ⎜0 α1 = ⎝ 0 1 ⎛ 0 ⎜0 α3 = ⎝ 1 0
0 0 1 0
0 1 0 0
0 0 0 −1
1 0 0 0
⎞ 1 0⎟ ⎠ , 0 0 ⎞ 0 −1 ⎟ ⎠ , 0 0
⎛
0 ⎜0 α2 = ⎝ 0 i ⎛ 1 ⎜0 β=⎝ 0 0
⎞ 0 0 −i 0 i 0 ⎟ ⎠ , −i 0 0 0 0 0 ⎞ 0 0 0 1 0 0 ⎟ ⎠ , 0 −1 0 0 0 −1
` importante sottolineare che esisoddisfano l’algebra delle matrici di Dirac. E stono infinite rappresentazioni delle matrici di Dirac. Dato infatti un set di matrici di Dirac, un qualsiasi altro set ottenuto dal precedente mediante una trasformazione di similitudine arbitraria `e anch’esso un set di matrici di Dirac1 . Bisogna infine osservare che il carattere matriciale dell’equazione di Dirac comporta automaticamente che la funzione d’onda non sia pi` u uno scalare ma un ente a quattro componenti detto spinore. L’equazione di Dirac per la particella libera pu` o essere risolta esattamente. Cerchiamo infatti una soluzione della forma ψ(x, t) = W e i (q·x−E t)/¯h , dove W `e uno spinore a quattro componenti indipendente da x e t. Sostituendo nell’Eq. (5.1), si trova che lo spinore W deve soddisfare l’equazione E W = (c α · q + β m c2 ) W . Il problema di determinare i possibili valori per E `e ricondotto alla soluzione dell’equazione caratteristica ⎛
m c2 − E 0 ⎜ Det ⎝ c qz c q+
0 mc − E c q− −c qz 2
c qz c q+ −m c2 − E 0
⎞ c q− −c qz ⎟ ⎠=0 , 0 2 −m c − E
dove si `e posto q+ = qx + i qy ,
q− = qx − i qy .
Risolvendo il determinante si ottiene l’equazione di quarto grado in E 1
Una rappresentazione particolarmente utile per trattare il limite ultra-relativistico `e la cosiddetta rappresentazione di Majorana.
118
CAPITOLO 5
(E 2 − c2 q 2 − m2 c4 )2 = 0 , che ammette le quattro soluzioni E1 = E2 = ε ,
E3 = E4 = −ε ,
dove ε=
# c 2 q 2 + m 2 c4 .
Si sono cos`ı ottenute due soluzioni a energia positiva, con la corretta relazione relativistica fra energia e impulso, ma anche due soluzioni a energia negativa (anch’esse con la corretta relazione fra energia e impulso). Le soluzioni a energia negativa scaturiscono naturalmente dall’equazione di Dirac e sono una caratteristica peculiare delle equazioni d’onda relativistiche (si pu`o mostrare infatti che anche l’equazione di Klein-Gordon ammette soluzioni a energia negativa). Una volta trovati gli autovalori si pu` o passare alla determinazione dei corrispondenti autovettori. Si pu` o facilmente verificare che i quattro spinori W1 , W2 , W3 , e W4 , dati da ⎛
⎞ ε + m c2 1 0 ⎜ ⎟ W1 = # ⎝ ⎠ , 2 c qz 2 ε(ε + m c ) c q+ ⎛
⎞ −c qz 1 ⎜ −c q+ ⎟ W3 = # ⎝ 2⎠ , 2 ε(ε + m c2 ) ε + m c 0
⎛
⎞ 0 2 1 ⎜ε + mc ⎟ W2 = # ⎝ ⎠ , 2 c q− 2 ε(ε + m c ) −c qz ⎛
⎞ −c q− 1 ⎜ c qz ⎟ W4 = # ⎝ ⎠ , 0 2 ε(ε + m c2 ) ε + m c2
costituiscono quattro autovettori ortogonali e normalizzati corrispondenti, rispettivamente, ai quattro autovalori E1 , E2 , E3 e E4 . Queste espressioni mostrano che, al limite non relativistico, le ultime due componenti degli spinori a energia positiva sono trascurabili rispetto alle prime due. L’opposto `e vero per gli spinori a energia negativa. Le soluzioni a energia negativa furono opportunamente interpretate dallo stesso Dirac, il quale fu condotto a ipotizzare, e quindi a predire, l’esistenza di antiparticelle. L’interpretazione data da Dirac, qui esemplificata per il caso degli elettroni, `e la seguente: si pu` o pensare che lo stato di vuoto, ovvero lo stato in cui nessuna particella `e presente, sia in realt`a la situazione in cui tutti gli stati a energia negativa sono riempiti in accordo col principio di Pauli (mare di Fermi). Quando un elettrone, eccitato ad esempio per assorbimento di un quanto di radiazione di energia superiore al valore di soglia 2 m c2 (pari a circa 1 MeV), passa da uno stato di energia negativa a uno stato di energia positiva,
119
EQUAZIONI D’ONDA RELATIVISTICHE
esso lascia nel mare di Fermi una “lacuna”. Tale lacuna si comporta come una particella in tutto simile all’elettrone, ma di carica opposta, che viene detta positrone (o positone o elettrone positivo). In altre parole, si pu`o pensare che l’eccitazione di un elettrone da uno stato di energia negativa a uno stato di energia positiva dia luogo alla creazione di una coppia elettrone-positrone con conseguente annichilazione di un quanto di radiazione. I positroni furono rivelati sperimentalmente da Anderson nel 1932 con un esperimento in camera di Wilson. La scoperta dell’antiprotone avvenne molto pi` u tardi, nel 1955, ad opera di Chamberlain e Segr`e, quando si resero disponibili acceleratori di particelle con energie dell’ordine di qualche GeV.
5.2 Equazione di Dirac per l’elettrone in un campo elettromagnetico L’Hamiltoniana classica di una particella relativistica, dotata di carica e mobile in un campo elettromagnetico, si scrive nella forma $ H=
e 2 c2 p − A + m 2 c4 + e φ , c
(5.4)
dove e `e il valore algebrico della carica della particella, m la sua massa a e φ sono i potenziali elettromagnetici e infine p riposo, A `e il momento cinetico coniugato alla posizione della particella, che `e connesso all’impulso π dalla relazione e π = p − A . c Questa espressione dell’Hamiltoniana pu`o essere dedotta in varie maniere. Noi ci limitiamo qui a verificare che essa conduce alle corrette equazioni di moto. Per far questo, ricaviamo tali equazioni per mezzo delle equazioni di Hamilton −1/2 dx ∂H e 2 e 2 = v = = c2 p − A − A + m 2 c4 , c p dt ∂ p c c −1/2 ∂H e 2 e 2 d p 2 4 =− = c e (gradA ) · p − A c p − A + m c − e gradφ . dt ∂x c c Dalla seconda equazione, introducendo v , si ha e d p ) · v − e gradφ . = (gradA dt c Se adesso teniamo presente l’identit` a vettoriale (si veda l’Eq. (A2.9))
120
CAPITOLO 5
= (gradA ) · v − v · gradA , v × rotA = B, si ottiene e ricordiamo che rotA e d p + e v · gradA − e gradφ . = v × B dt c c Per l’impulso π si ha quindi e e d dπ + e v · gradA − e gradφ − e dA . p − A = = v × B dt dt c c c c dt L’ultimo termine del secondo membro rappresenta la derivata totale (o Euleriana) del potenziale vettore lungo la traiettoria della particella. Esso vale ∂A dA , = + v · gradA dt ∂t per cui, ricordando l’espressione del campo elettrico in termini dei potenziali elettromagnetici, si ha infine dπ + e v × B . = eE dt c Questa equazione, unita all’altra che si ottiene, con facili passaggi, dalla prima equazione di Hamilton, ovvero m π = # v , 1 − v 2 /c2 mostra che l’Hamiltoniana da cui siamo partiti `e corretta, in quanto essa conduce alle ben note equazioni relativistiche del moto di una particella carica in un campo elettromagnetico. Confrontando l’espressione dell’Hamiltoniana (5.4) con quella della particella libera, si vede che, per una particella carica in un campo elettromagnetico, sussiste, fra le quantit`a e A , c la stessa relazione che sussiste, per la particella libera, fra le quantit`a E e p. Questo significa che, in meccanica classica (relativistica), si passa dalla descrizione della particella libera a quella della particella carica in presenza di un campo elettromagnetico operando nell’Hamiltoniana la sostituzione formale E −eφ ,
p −
e A , E → E −eφ . (5.5) c Questa sostituzione formale `e conosciuta sotto il nome di regola, o principio, dell’accoppiamento minimale. p → p −
EQUAZIONI D’ONDA RELATIVISTICHE
121
Per il principio di corrispondenza si pu` o allora scrivere l’equazione di Dirac per una particella carica in un campo elettromagnetico applicando la regola dell’accoppiamento minimale all’Eq. (5.1). Si ha ih ¯
∂ e ψ(x, t) = c α · p − A + β m c2 + e φ ψ(x, t) , ∂t c
(5.6)
dove α e β sono le matrici 4 × 4 introdotte precedentemente, ovvero le matrici e φ sono, dal punto di vista operatoriale, dei moltiplicatori di Dirac, mentre A funzioni del punto e, eventualmente, del tempo. Si pu` o notare infine che, se si esegue una trasformazione di gauge sui potenziali elettromagnetici, ovvero se si pone = A − gradχ , A
φ = φ +
1 ∂χ , c ∂t
la nuova equazione di Dirac cos`ı ottenuta ammette per soluzione la funzione d’onda ψ (x, t) data da ψ (x, t) = ψ(x, t) e−i δ , dove δ=
eχ . h ¯c
Si ottiene quindi il risultato che, per trasformazioni di gauge, la funzione d’onda si trasforma secondo un fattore di fase. La fase risulta proporzionale alla funzione χ, generatrice della trasformazione di gauge stessa. In particolare, il modulo quadro della funzione d’onda `e invariante per trasformazioni di gauge.
5.3 Limite non relativistico dell’equazione di Dirac Per ottenere il limite non relativistico dell’equazione di Dirac per la particella carica in un campo elettromagnetico, `e conveniente scrivere la funzione d’onda ψ(x, t), che `e uno spinore di ordine 4, nella forma 2 χ e−i (m c +) t/¯h , ψ(x, t) = (5.7) ξ dove χ e ξ sono due spinori di ordine 2, e dove l’energia totale `e stata scritta nella forma (m c2 + ) in maniera tale che venga a rappresentare l’energia della particella a meno dell’energia di riposo m c2 . Il limite non relativistico si ottiene imponendo che sia mc2 . Allo stesso tempo, per` o, bisogna imporre
122
CAPITOLO 5
che le altre energie in gioco, come ad esempio l’energia elettrostatica, eφ, siano anch’esse piccole rispetto all’energia di riposo. Sostituendo la funzione d’onda (5.7) nell’Eq. (5.6) e supponendo che gli spinori χ e ξ siano, al pari dei potenziali elettromagnetici, indipendenti dal tempo, si ha e χ χ χ χ 2 , (m c + ) = cα · p − A +eφ + mc β ξ ξ ξ ξ c 2
e tenendo presente l’espressione esplicita delle matrici di Dirac (Eq. (5.3)), si ottengono le due equazioni accoppiate per gli spinori χ e ξ e c σ · p − A ξ = ( − e φ)χ , c e (2 m c2 + − e φ) ξ = c σ · p − A χ . c Ricaviamo adesso ξ dalla seconda equazione moltiplicando ambo i membri a sinistra per l’operatore (2 m c2 + − e φ)−1 . Si ottiene e ξ = (2 m c2 + − e φ)−1 c σ · p − A χ , (5.8) c e sostituendo questa espressione nella prima equazione, si ha e e c σ · p − A (2 m c2 + − e φ)−1 c σ · p − A χ = ( − e φ)χ . c c
(5.9)
Questa `e un’equazione esatta; il limite non relativistico si ottiene supponendo che sia ( − e φ) m c2 , e sviluppando l’operatore (2 m c2 + − e φ)−1 in serie di potenze
(2 m c2 + − e φ)−1
2 −eφ 1 −eφ 1− = + + ··· . 2 m c2 2 m c2 2 m c2
(5.10)
Gli ordini successivi del limite non relativistico dell’equazione di Dirac si ottengono andando a considerare i vari termini presenti nella parentesi quadra a secondo membro. Se si considera solo il primo termine, si ottiene il limite all’ordine 0, se si considerano i primi due termini, si ottiene il limite all’ordine 1, e cos`ı via.
EQUAZIONI D’ONDA RELATIVISTICHE
123
5.4 Limite all’ordine zero. Equazione di Pauli Consideriamo prima di tutto il limite non relativistico all’ordine pi` u basso, ovvero trascuriamo tutti i termini eccetto l’unit`a nell’Eq.(5.10) e sostituiamo il risultato nelle Eq. (5.8) e (5.9). Le equazioni per gli spinori χ e ξ risultano 1 e 2 σ · p − A χ = ( − e φ)χ , 2m c 1 e ξ= σ · p − A χ . 2mc c Quest’ultima equazione mostra che, essendo per una particella non relativistica ' e '' ' − A 'p ' = | π | m c , c risulta anche, per la norma dei due spinori |ξ| |χ| . Riprendiamo adesso l’equazione per χ e osserviamo che, se a e b sono due vettori qualsiasi che non commutano necessariamente fra loro, ma commutano con le matrici di Pauli, si ottiene, attraverso le propriet`a delle matrici stesse (σ · a )(σ · b ) = a · b + i σ · a × b . Tenendo conto di questa propriet`a, l’equazione per χ risulta
1 e 2 e i e p − A σ · p − A + × p − A χ = ( − e φ)χ . 2m c 2m c c
Il secondo addendo in parentesi quadra (che risulterebbe nullo nel caso le due non fossero operatori) pu` quantit` a p e A o essere trasformato sfruttando la regola di commutazione ¯ [ pi , Aj ] = −i h
∂Aj . ∂xi
Si ottiene, con facili passaggi ¯ e e ieh ¯ = ieh rotA p − A × p − A = B , c c c c `e il vettore campo magnetico. Sostituendo questo risultato si ottiene dove B infine il limite non relativistico dell’equazione di Dirac all’ordine zero, ovvero
124
CAPITOLO 5
e 2 1 eh ¯ p − A − σ · B + e φ χ = χ . 2m c 2mc
Questa equazione `e nota come equazione di Pauli e, a parte il secondo fattore in parentesi quadra, pu` o essere ottenuta in maniera diretta applicando il principio dell’accoppiamento minimale (Eq. (5.5)) all’equazione di Schr¨odinger era stato per la particella libera. Il termine aggiuntivo, proporzionale a σ · B, introdotto fenomenologicamente da Pauli per descrivere l’accoppiamento fra il momento magnetico intrinseco dell’elettrone e il campo magnetico. Tale termine contiene infatti il vettore σ che, come vedremo meglio in seguito, `e pro` interessante osservare che, nella teoria di porzionale allo spin dell’elettrone. E Dirac, lo spin compare in maniera del tutto naturale quale effetto relativistico di ordine zero. Consideriamo adesso un caso particolare dell’equazione di Pauli, ovvero il caso di una particella non relativistica mobile, oltre che in un potenziale elettrostatico φ, in un campo magnetico costante. Tale campo magnetico discende da un potenziale vettore della forma = A
1 2
× x , B
= 0. Infatti, tenendo conto dell’identit` che soddisfa la condizione divA a vettoriale (A2.6) si ha = −1 B · gradx + rotA 2
1 2
divx = B
1 2
+ 3B )=B . (−B
D’altra parte si ha anche 2 e 2 e 1 p2 +A · p ) + e A2 . p − A − ( p·A = 2m c 2m 2mc 2 m c2 Questa quantit` a pu` o essere trasformata tenendo conto che
+A · p = 2 A · p − i h = 2A · p = B × x · p = B ·M , p · A ¯ divA = x × p dove M `e il momento angolare orbitale della particella che porremo =h nella forma M ¯ . Inoltre A2 =
1 4
× x )2 = (B
1 4
· x )2 ] = [B 2 x2 − (B
1 4
B 2 x2⊥ ,
Sostidove x⊥ rappresenta la componente di x nel piano perpendicolare a B. tuendo questi risultati intermedi, l’equazione di Pauli per la particella carica, mobile in un campo magnetico uniforme e in un campo elettrico di potenziale φ, risulta 2 p eh ¯ e2 2 2 − ( + σ ) · B + B x⊥ + e φ χ = χ . (5.11) 2m 2mc 8 m c2
EQUAZIONI D’ONDA RELATIVISTICHE
125
μ
a Fig. 5.1. Una particella carica che percorre l’orbita di area a d` a luogo, per il principio di equivalenza di Amp`ere, a un momento magnetico μ. Il caso disegnato in figura corrisponde a un valore positivo della carica.
Il significato fisico dei vari termini che compaiono in questa equazione `e immediato: p2 /(2m) `e l’energia cinetica della particella, −e¯ h( · B)/(2mc) `e l’energia di interazione del momento angolare orbitale col campo magnetico, −e¯ h(σ · B)/(2mc), il termine introdotto fenomenologicamente da Pauli, `e l’energia di interazione del momento angolare intrinseco (spin) col campo magnetico, eφ `e l’energia elettrostatica e, infine, e2 B 2 x2⊥ /(8mc2 ) `e un termine, sempre positivo, che viene chiamato termine diamagnetico. La presenza del termine di interazione fra il momento angolare orbitale e il campo magnetico pu` o essere giustificata anche attraverso delle considerazioni fisiche elementari quando si supponga che la particella sia mobile in un campo di forze centrale. In tal caso, ragionando classicamente, la particella `e infatti soggetta a un moto periodico caratterizzato da un’orbita chiusa (si veda la Fig. 5.1). Si pu` o allora pensare di associare alla particella una corrente elettrica i e quindi, in base al principio di equivalenza di Amp`ere, un momento magnetico “classico” μ c dato dall’espressione μ c =
i a , c
dove a `e un vettore che ha per modulo l’area dell’orbita, per direzione la normale al piano dell’orbita, e per senso quello stabilito dalla regola della vite destra (regola del cavatappi). Se T `e il periodo con cui viene percorsa l’orbita, la corrente vale e/T , per cui μ c =
e a . cT
La quantit` a a/T `e d’altra parte la velocit` a areolare della particella e pu` o essere connessa al momento angolare. Si ottiene μ c =
e e eh ¯ e a = x × v = x × p = . c T 2c 2mc 2mc
Ricordando infine che l’espressione classica per l’energia di un dipolo immerso si ottiene in un campo magnetico `e data da − μc · B,
126
CAPITOLO 5
eh ¯ ·B , 2mc che `e giusto il termine che compare nell’equazione di Pauli. Emagnetica = −
5.5 Limite al primo ordine Il limite non relativistico al primo ordine dell’equazione di Dirac si ottiene considerando i primi due termini entro la parentesi quadra dell’Eq. (5.10) e sostituendo tale equazione nella (5.9). Si ottiene e 1 e −eφ σ · p − σ · p − A 1− A χ = ( − e φ)χ . 2m c 2 m c2 c Scambiamo adesso l’ordine dei due primi fattori che compaiono a primo membro. Per far questo bisogna tener conto della regola di commutazione e ih ¯e e −eφ = σ · [ p , φ ] = − σ · gradφ . σ · p − A , 1− 2 2 c 2mc 2mc 2 m c2 Ripetendo calcoli analoghi a quelli sviluppati nel paragrafo precedente, l’equazione di Dirac risulta −eφ e 2 e 1 i e 1− p − A + σ · p − A × p − A χ 2 m c2 2m c 2m c c
e ih ¯e e gradφ · p − A − + i σ · gradφ × p − A χ = ( − e φ)χ . 2 2 4m c c c Sviluppiamo ulteriormente i calcoli solo nel caso semplificato di un campo = 0. Tenendo conto che puramente elettrostatico, per cui si pu` o supporre A p × p = 0, l’equazione precedente diviene ih ¯e − e φ p2 χ− 1− [ gradφ · p + i σ · gradφ × p ] χ = ( − e φ)χ . 2 m c2 2m 4 m 2 c2 Poich´e all’ordine zero si ha p2 χ = ( − e φ)χ , 2m il termine − e φ p2 χ , 2 m c2 2 m
127
EQUAZIONI D’ONDA RELATIVISTICHE
che `e gi` a una correzione del primo ordine, pu`o essere sostituito, a meno di ordini superiori, con una qualsiasi delle due espressioni p4 ( − e φ)2 χ , oppure χ . (5.12) 8 m 3 c2 2 m c2 Inoltre, supponendo che il potenziale nel quale si muove la particella sia un potenziale centrale (φ = φ(r)), e tenendo conto che ∂φ 1 ∂φ gradφ = vers(r ) = r , ∂r r ∂r si possono eseguire le trasformazioni ∂φ ∂ , ∂r ∂r 1 ∂φ 1 ∂φ gradφ × p = r × p = h ¯ . r ∂r r ∂r Sostituendo, si ottiene l’equazione finale per il limite non relativistico al primo ordine nel caso semplificato di un potenziale puramente elettrostatico a simmetria sferica gradφ · p = −i h ¯
p2 p4 eh ¯ 2 1 ∂φ eh ¯ 2 ∂φ ∂ +eφ− + σ · χ = χ . − 2m 8 m 3 c2 4 m2 c2 ∂r ∂r 4 m2 c2 r ∂r
(5.13)
I primi due termini rappresentano al solito l’energia cinetica e l’energia elettrostatica di ordine zero. Si pu` o cercare di dare un’interpretazione fisica degli altri termini che compaiono nell’equazione. Il termine proporzionale a p4 `e la correzione relativistica dell’energia cinetica. Si ha infatti, con ovvie notazioni
Ecin
# = c2 p2 + m2 c4 −m c2 = m c2
$
p2 1+ 2 2 −1 m c
=
p4 p2 − +· · · . 2 m 8 m 3 c2
Il termine proporzionale a σ · descrive la cosiddetta interazione spin-orbita ed era stato introdotto empiricamente nell’equazione di Schr¨odinger ancor prima che ne fosse data una spiegazione formalmente corretta attraverso l’equazione di Dirac. L’interpretazione fisica dell’interazione spin-orbita va ricercata nell’accoppiamento fra il dipolo magnetico μ c associato al momento angolare della particella e il dipolo magnetico μ s associato al momento angolare intrinseco (spin) della particella stessa. Se si ammette che i due dipoli siano paralleli, si ha per l’energia di interazione Edipolo−dipolo =
1 μ c · μ s , r3
(5.14)
128
CAPITOLO 5
dove r `e la distanza tra i due dipoli, ovvero la distanza della particella dal punto origine del potenziale centrale nel quale essa si sta muovendo. D’altra parte, se ammettiamo, come suggerito dai risultati ottenuti nel paragrafo precedente, che sia μ c =
eh ¯ , 2mc
μ s =
eh ¯ σ , 2mc
si ottiene ¯2 1 e2 h σ · . 4 m 2 c2 r 3 Questa quantit` a coincide esattamente con quella ottenuta attraverso l’equazione di Dirac qualora si scelga per φ il potenziale Coulombiano dovuto a una carica −e (opposta a quella della particella), come nel caso di un atomo di Idrogeno. In tal caso si ha infatti φ = −e/r, e il termine in questione dell’equazione di Dirac risulta Edipolo−dipolo =
2 2 eh ¯ 2 1 ∂φ ¯ 1 = e h σ · σ · = Edipolo−dipolo . 2 2 4 m c r ∂r 4 m 2 c2 r 3 L’ulteriore termine che compare nell’equazione di Dirac, ovvero il termine proporzionale a gradφ · p, viene detto termine di Darwin e non ha analogo classico. Dal punto di vista del calcolo del suo valore di aspettazione su una funzione d’onda arbitraria esso pu` o essere trasformato in modo da portarlo nella forma di un cosiddetto termine di contatto. Se ψ `e la funzione d’onda –supposta qui scalare e reale–, il valore di aspettazione del termine di Darwin (scritto nella sua forma generale, ovvero senza supporre di essere nel caso del potenziale a simmetria sferica) risulta
EDarwin =
eh ¯2 4 m 2 c2
ψ gradφ · gradψ dV .
Questo integrale pu` o essere trasformato tenendo conto che ψ gradφ · gradψ =
1 2
gradψ 2 · gradφ =
1 2
div(ψ 2 gradφ) − ψ 2 ∇2 φ
.
Se si suppone che la funzione d’onda e il campo elettrico si annullino sufficientemente all’infinito, per il teorema di Gauss il primo termine in parentesi quadra d` a contributo nullo all’integrale e si ottiene EDarwin = −
eh ¯2 8 m 2 c2
ψ 2 ∇2 φ dV .
Questa espressione mostra che, al fine del calcolo del suo valore di aspettazione, al termine di Darwin contribuiscono solo i punti dove sono presenti le cariche
129
EQUAZIONI D’ONDA RELATIVISTICHE
elettriche che generano il potenziale φ. Ad esempio, se si suppone che φ sia dovuto a un’unica carica q situata nel punto x0 , ricordando che ∇2 φ = −4π q δ(x − x0 ) , si ottiene EDarwin =
4π e q h ¯2 2 ψ (x0 ) . 8 m 2 c2
(5.15)
5.6 L’equazione di Dirac descrive una particella di spin 1/2 Nei paragrafi precedenti abbiamo gi`a introdotto il concetto di spin, anche se in maniera non del tutto precisa. Adesso vogliamo provare in maniera rigorosa che una particella descritta dall’equazione di Dirac possiede un momento angolare intrinseco che vale 1/2 in unit` a h ¯ . Per far questo, osserviamo che se un’osservabile `e una costante del moto, essa deve godere della propriet` a che l’operatore associato commuti con l’Hamiltoniana. Poich´e il momento angolare totale j di una particella libera si conserva nel tempo, si deve avere [ H , j ] = 0 . Consideriamo il commutatore dell’Hamiltoniana di Dirac col momento angolare orbitale della particella, = x × p/¯ h. Ricordando l’Eq. (5.1) si ha 1 [ H , ] = [c α · p + β m c2 , x × p ] , h ¯ e per la componente i-esima del commutatore si ottiene ⎡ ⎤ 1 ikl ⎣ c αj pj + β m c2 , xk pl ⎦ = [ H , i ] = h ¯ j kl
c ikl αj [ pj , xk ] pl = −i c ikl αk pl . = h ¯ jkl
kl
Si ha quindi, in forma intrinseca [ H , ] = −i c α × p . Se ne deduce che il momento angolare orbitale della particella non `e una costante del moto in quanto non commuta con l’Hamiltoniana.
130
CAPITOLO 5
Consideriamo adesso le matrici τ , di ordine 4, definite da τ = − 2i α ×α ,
(5.16)
dove αi sono le matrici di Dirac. Ricordando la loro definizione in termini di matrici 2 × 2 (Eq. (5.3)), si ha
τi =
− 2i
&
jk ijk
0 σj
σj 0
0 σk
σk 0
=
− 2i
&
jk ijk
σj σk 0
0 σj σk
.
D’altra parte, per le propriet` a delle matrici di Pauli vale la relazione ijk σj σk = 2 i σi , jk
per cui si ottiene τi =
σi 0
0 σi
.
Le matrici τ sono quindi una generalizzazione all’ordine 4 delle matrici 2 × 2 di ` facile mostrare che esse soddisfano le stesse relazioni di quest’ultime, Pauli. E ovvero
[τi , τj ] = 2 i
{τi , τj } = 2 δij ,
ijk τk ,
τi τj = δij + i
k
ijk τk .
k
Considerando il commutatore [ H , τ ] si ha
& & 2 = c α p + β m c , α α [H , τi ] = − 2i kl ikl j j k l j = − 2i
&
kl ikl
& j
c pj [ αj , αk αl ] + m c2 [ β , αk αl ] .
Valutando i due commutatori che compaiono nel secondo membro si ha [ αj , αk αl ] = 2 δjk αl − 2 δjl αk ,
[ β , αk αl ] = 0 ,
per cui, con facili passaggi, si ottiene infine [ H , τ ] = 2 i c α ×p . Se introduciamo quindi il vettore j attraverso la relazione j = +
1 2
τ ,
131
EQUAZIONI D’ONDA RELATIVISTICHE
si ottiene [ H , j ] = 0 . Il vettore j `e una costante del moto ed `e quindi del tutto naturale immedesimarlo col vettore momento angolare totale. La relazione precedente mostra che esso si ottiene addizionando il momento angolare orbitale con un vettore, che indichiamo con s, che rappresenta il momento angolare intrinseco (spin) della particella s =
1 2
τ .
Il vettore s soddisfa le relazioni (immediatamente deducibili da quelle del vettore τ )
[ s i , sj ] = i
ijk sk ,
{si , sj } =
1 2
δij ,
si s j =
1 4
δij +
i 2
&
k ijk sk
.
k
Queste propriet`a mostrano che il vettore s soddisfa tutti i requisiti per essere considerato, a buon diritto, un momento angolare (si veda il Par. 7.9). Inoltre, essendo s2 = si si = 34 , i
si ottiene che il momento angolare intrinseco vale 12 (si ricordi dalla teoria del momento angolare che l’autovalore dell’operatore J 2 vale J(J + 1)). Nel limite non relativistico dell’equazione di Dirac sviluppato nei paragrafi precedenti, e in particolare nel limite all’ordine zero, abbiamo visto che il contributo preponderante dell’interazione della particella carica con un campo magnetico `e descritto da un termine dell’Hamiltoniana dato da eh ¯ . ( + σ ) · B 2mc Questa espressione `e consistente con l’idea che al momento angolare orbitale sia associato un dipolo magnetico μ e allo spin sia associato un momento magnetico μ s . Riferendoci al caso dell’elettrone, per cui e = −e0 , con e0 = 4.803 × 10−10 u.e.s., i dipoli sono dati da Hmagnetica = −
μ = −μ0 ,
μ s = −μ0 σ ,
dove abbiamo introdotto la quantit` a μ0 , detta magnetone di Bohr, definita da2 2
Si ricordi che nel sistema di unit` a c.g.s. di Gauss, l’unit` a di misura dell’induzione magnetica ` e il gauss, che si abbrevia con “G”.
132
CAPITOLO 5
μ0 =
¯ e0 h = 9.274 × 10−21 erg G−1 . 2mc
(5.17)
a stato interpretato in termini classici (si veda il Par. 5.4). Il momento μ `e gi` Per quanto riguarda μ s si pu` o osservare che, essendo σ la rappresentazione di ordine 2 della matrice τ di ordine 4, e, essendo τ = 2s, si pu` o anche scrivere μ s = −2 μ0 s . Il rapporto fra il momento magnetico (in unit`a di magnetoni di Bohr) e il corrispondente momento angolare (in unit`a h ¯ ) viene detto rapporto giromagnetico. Si ottiene quindi che il rapporto giromagnetico dell’elettrone vale −1 per il momento angolare orbitale e vale −2 per lo spin. Questo comportamento anomalo del momento magnetico associato allo spin era stato assunto fenomenologicamente nella teoria di Pauli dell’elettrone. Il fatto che ci`o scaturisca in maniera del tutto naturale dall’equazione di Dirac costituisce uno dei maggiori successi di questa teoria.
5.7 Soluzione dell’equazione di Dirac in un campo magnetico L’equazione di Dirac pu` o essere risolta esattamente in un certo numero di casi particolari. Come applicazione della teoria sviluppata in questo capitolo, cerchiamo la soluzione per una particella carica mobile in un campo magnetico costante. Un tale campo pu` o essere descritto dai potenziali elettromagnetici φ=0 ,
= A
1 2
× x , B
e l’equazione di Dirac risulta ih ¯
∂ ψ(x, t) = HB ψ(x, t) , ∂t
dove HB , l’Hamiltoniana di Dirac nel caso di campo magnetico costante, `e data da e HB = c α · p − A + β m c2 . c 2 Per risolvere questa equazione, cominciamo con l’osservare che l’operatore H B ha un’espressione molto pi` u semplice dell’operatore HB stesso. Si ha infatti
e e 2 · p − A = cα · p − A HB + β m c2 c α + β m c2 . c c
EQUAZIONI D’ONDA RELATIVISTICHE
133
L’espressione a secondo membro pu`o essere sviluppata tenendo conto dell’algebra delle matrici α e β (Eq. (5.2)). Ricordando inoltre la definizione delle matrici τ (Eq. (5.16)) e la regola di commutazione [ pi , Aj ] = −i h ¯
∂Aj , ∂xi
si trova, con alcune trasformazioni e 2 2 + m 2 c4 . = c2 p − A −eh ¯ c τ · B HB c Supponiamo adesso di aver risolto l’equazione agli autovalori per l’operatore 2 HB e indichiamo con 2 gli autovalori stessi (che devono necessariamente essere reali e positivi) e con Φ gli autovettori. Si ha, per definizione 2 (HB − 2 ) Φ = 0 ,
e l’equazione pu` o anche essere scritta nelle due forme alternative (HB − ) (HB + ) Φ = 0 ,
(HB + ) (HB − ) Φ = 0 .
Queste due equazioni mostrano che le due funzioni d’onda Ψ− = (HB − ) Φ ,
Ψ+ = (HB + ) Φ,
sono autofunzioni dell’Hamiltoniana HB corrispondenti rispettivamente agli autovalori e −. Attraverso questo algoritmo `e quindi possibile ricondurre la soluzione dell’equazione di Dirac alla soluzione dell’equazione agli autovalori 2 per l’operatore HB . Tenendo conto dell’espressione esplicita del potenziale vettore, e introducendo un sistema di assi cartesiani (x, y, z) con l’asse z diretto lungo la direzione del 2 campo magnetico, l’operatore HB assume la forma
2 HB
2 2 eB eB 2 y + c py − x + c2 p2z − e h = c px + ¯ c B τ3 + m 2 c 4 . 2c 2c 2
Il carattere spinoriale dell’operatore `e contenuto solamente nella matrice τ3 che `e diagonale ed `e esplicitamente data da ⎛
1 ⎜0 τ3 = ⎝ 0 0
0 −1 0 0
⎞ 0 0 0 0 ⎟ ⎠ . 1 0 0 −1
Inoltre, tutti i commutatori che si possono costruire a partire da due qualsiasi 2 dei cinque termini che compongono l’operatore HB sono nulli, con l’eccezione
134
CAPITOLO 5
del commutatore fra i primi due termini che `e diverso da zero. Allo scopo di 2 trasformare l’operatore HB in una somma di operatori commutanti, eseguiamo un cambiamento di variabile introducendo gli operatori eB eB a = γ py − x − i δ px + y , 2c 2c eB eB † x + i δ px + y , a = γ py − 2c 2c dove γ e δ sono due costanti reali da scegliere opportunamente. Con queste 2 trasformazioni, si ottiene per HB l’espressione 2 HB =
c2 2 c2 2 †2 † † (a + a + a a + a a) − (a + a†2 − a a† − a† a) 4 γ2 4 δ2
¯ c B τ3 + m 2 c 4 , + c2 p2z − e h e, per il commutatore fra gli operatori a e a† , [ a, a† ] =
2eBh ¯ γδ . c
Se adesso imponiamo γ 2 = δ2 ,
γδ =
c , 2eBh ¯
2 l’operatore HB risulta espresso come somma di Hamiltoniane commutanti gi`a note. Con facili passaggi, si ottiene 1 ∓ τ3 2 HB + c2 p2z + m2 c4 , = 2 |e| h ¯ c B a† a + 2
dove |e| `e il valore assoluto della carica della particella e dove il segno davanti a τ3 vale meno per le cariche positive e pi` u per le cariche negative. Ricordando i risultati ottenuti a proposito dell’oscillatore armonico nel Par. 4.1, e tenendo conto che gli autovalori della matrice τ3 sono ±1, gli autovalori dell’operatore 2 HB risultano della forma 2 = m2 c4 + c2 qz2 + 2 |e| h ¯ cBn , dove qz `e l’autovalore (continuo) dell’operatore pz e dove n `e un intero arbitrario positivo o nullo. Infine, per gli autovalori dell’Hamiltoniana HB , si ha =±
# m2 c4 + c2 qz2 + 2 |e| h ¯ cBn ,
(n = 0, 1, 2, . . .) .
I livelli energetici che si sono cos`ı trovati prendono il nome di livelli di Landau. Essi sono caratterizzati da un parametro continuo, qz , che `e la componente
EQUAZIONI D’ONDA RELATIVISTICHE
135
dell’impulso della particella lungo la direzione del campo magnetico, e da un indice intero, n, che invece caratterizza il moto nel piano perpendicolare al campo magnetico. Come nel caso dell’equazione di Dirac per la particella libera, esistono livelli a energia positiva e livelli a energia negativa. L’equazione che esprime gli autovalori dell’energia pu`o anche essere posta nella forma pi` u significativa % q2 B = ± m c2 1 + 2z 2 + 2 n , m c Bq dove abbiamo introdotto il cosiddetto campo magnetico quantistico, Bq , definito da Bq =
m 2 c3 , |e| h ¯
che, nel caso degli elettroni, vale 4.414 × 1013 G. Nel caso particolare in cui qz mc e B Bq , la radice si pu` o sviluppare in serie di potenze e all’ordine pi` u basso si ottiene q2 = ± mc2 + z + h ¯ ωc n , 2m dove la quantit` a ωc , definita da ωc =
|e| B , mc
`e la frequenza di ciclotrone che abbiamo gi`a incontrato nel Cap. 3 (Eq. (3.30)).
Capitolo 6
Atomi con un solo elettrone di valenza L’analisi spettroscopica della radiazione emessa da sostanze atomiche e molecolari nelle pi` u svariate condizioni di pressione e temperatura `e stata portata avanti per lungo tempo a partire dal momento in cui `e stata dimostrata l’esistenza di righe di assorbimento nello spettro del Sole da parte di Fraunhofer nel 1817. Questi studi hanno portato, nel corso degli anni, alla nascita di una nuova disciplina della fisica sperimentale e teorica che prende il nome di spettroscopia. Tale disciplina ha avuto un’importanza storica fondamentale per la comprensione della struttura atomica, sebbene sia stato necessario attendere l’avvento della meccanica quantistica per poter dare un’interpretazione rigorosa di quanto osservato nei laboratori terrestri e nei plasmi astrofisici. In questo volume affronteremo lo studio dei concetti di base della spettroscopia mediante un approccio moderno, iniziando col dare una descrizione, a livelli di sofisticazione crescenti, degli spettri pi` u semplici, ovvero quelli relativi ad atomi che contengono un solo elettrone di valenza (atomi idrogenoidi, metalli alcalini e relative sequenze isoelettroniche). Le complicazioni introdotte dalla presenza di un numero maggiore di elettroni di valenza sono illustrate nei capitoli successivi.
6.1 Atomo di Idrogeno, teoria di Bohr Lo spettro dell’atomo di Idrogeno `e il pi` u semplice ed `e stato anche il primo per il quale `e stata sviluppata un’interpretazione teorica adeguata. Le regolarit` a che compaiono nei valori delle lunghezze d’onda della serie di righe che si osserva nello spettro visibile dell’atomo di Idrogeno furono formulate quantitativamente da Balmer (un professore di scuole secondarie svizzero) nel 1886. Balmer trov` o che le lunghezze d’onda di tali righe potevano essere ben rappresentate attraverso la formula empirica λ = λB
n2 , −4
n2
dove λB `e una costante che vale circa 3647 ˚ A e dove n `e un intero che pu` o assumere i valori 3, 4, 5, etc.. Oggi, in maniera pi` u moderna, si preferisce scrivere la formula precedente nella forma
138
CAPITOLO 6
ν¯ = RH
1 1 − 2 2 2 n
,
(n > 2) ,
dove ν¯ (= 1/λ) `e il numero d’onde della riga e RH (= 4/λB ) `e la cosiddetta costante di Rydberg per l’atomo di Idrogeno. Se nella formula precedente si sostituisce l’intero 2 con altri numeri interi, si ottengono altre serie di righe, in modo tale che lo spettro completo dell’atomo di Idrogeno pu` o essere rappresentato dalla formula ν¯ = RH
1 1 − 2 2 m n
,
(n > m) .
(6.1)
La serie con m = 1 cade nell’ultravioletto e prende il nome di serie di Lyman; quella con m = 2 cade nel visibile e prende ovviamente il nome di serie di Balmer. Le altre serie cadono nell’infrarosso sempre pi` u lontano e prendono il nome di serie di Paschen (m = 3), di Brackett (m = 4), di Pfund (m = 5), e di Humphreys (m = 6). Lo spettro dell’atomo di Idrogeno `e rappresentato schematicamente in Fig. 6.1. La formula per ν¯ pu` o anche essere posta nella forma ν¯ = Tm − Tn , dove Tk =
RH , k2
(con k intero) .
(6.2)
Questo significa che il numero d’onde di una qualsiasi riga dello spettro dell’atomo di Idrogeno `e dato dalla differenza di due “termini spettroscopici” della forma RH /k 2 . In effetti, questa propriet` a `e del tutto generale, nel senso che essa vale per gli spettri di tutti gli altri elementi. Si verifica infatti sperimentalmente che i numeri d’onda delle numerosissime righe osservate nello spettro di un qualsiasi elemento (o ione) possono essere sempre ottenuti come differenze di un numero molto minore di termini, anche se, in generale, tali termini non possono essere espressi da semplici funzioni matematiche come quella dell’Eq. (6.2). Questo fatto ebbe un’importanza storica notevole e viene oggi assunto a principio, venendo denominato principio di Rydberg-Ritz. Esso afferma che tutte le righe dello spettro di un elemento (in un particolare stato di ionizzazione) si possono ottenere per differenza fra due qualsiasi termini spettroscopici, caratteristici dell’elemento stesso (in quel particolare stato di ionizzazione). Il numero di termini `e molto minore del numero di righe possibili. L’interpretazione teorica dello spettro dell’atomo di Idrogeno fu data per la prima volta da Bohr mediante un modello relativamente semplice che introduceva, accanto alle usuali leggi della meccanica classica, delle opportune ipotesi
139
ATOMI CON UN SOLO ELETTRONE DI VALENZA
Lyman
ν (cm −1 )
90000
Balmer
30000
60000
1000
2000
Paschen
0 5000
10000 λ (A)
Fig. 6.1. Spettro dell’atomo di Idrogeno dall’ultravioletto all’infrarosso. Le prime righe delle serie di Lyman, Balmer e Paschen sono rappresentate da tratti verticali. I limiti delle serie sono rappresentati in tratteggio. La scala orizzontale `e lineare nel numero d’onda.
quantistiche. Bench´e la teoria di Bohr appaia oggi superata alla luce della moderna meccanica quantistica, essa costituisce tuttavia una buona introduzione alla fisica atomica e vale la pena esporla in questa sede. Il punto di partenza della teoria di Bohr `e il cosiddetto modello planetario dell’atomo, emerso dai lavori sperimentali di Rutherford, secondo il quale l’atomo `e costituito da un nucleo centrale di carica positiva, praticamente puntiforme, intorno al quale ruotano gli elettroni. Bohr svilupp`o le proprie considerazioni per l’atomo pi` u semplice, il cosiddetto atomo idrogenoide, nel quale un solo elettrone ruota intorno a un nucleo centrale di carica Ze0 (dove e0 `e il valore assoluto della carica dell’elettrone e Z `e un intero). Le ipotesi introdotte da Bohr sono le seguenti: (a) Delle infinite orbite che, secondo la meccanica classica, un elettrone pu`o descrivere nel suo moto intorno al nucleo, solo alcune, che verificano delle opportune regole di quantizzazione, sono permesse. In contraddizione con la teoria classica dell’elettromagnetismo, l’elettrone non irradia quando si muove su tali orbite sebbene il suo moto sia accelerato. (b) La radiazione viene emessa oppure assorbita in seguito alla “transizione” dell’elettrone fra un’orbita permessa e un’altra. Tali processi avvengono per “quanti” di radiazione caratterizzati dalla frequenza ν=
ΔE , h
dove ΔE `e la differenza fra le energie che competono alle due orbite fra le quali avviene la transizione e dove h `e la costante di Planck (h = 6.626×10 −27 erg s). Si pu` o notare che questa seconda ipotesi contiene implicitamente il principio di Rydberg-Ritz, i termini spettroscopici essendo dati dalle energie delle orbite, a meno del fattore 1/(ch). Supponendo per semplicit` a che l’elettrone si muova su orbite circolari, dalla seconda legge della dinamica si ottiene
140
CAPITOLO 6
Z e20 m v2 = , r2 r
(6.3)
dove r `e il raggio dell’orbita, v la velocit`a dell’elettrone e m la sua massa. A questa equazione classica Bohr aggiunge la condizione di quantizzazione 1 per la quale il momento angolare dell’elettrone deve essere multiplo intero della costante ¯h = h/2π mvr = nh ¯ ,
(n = 1, 2, 3, . . .) .
Eliminando la velocit` a fra le due equazioni si ottiene, per il raggio dell’orbita caratterizzata dal “numero quantico” n rn =
h ¯ 2 n2 . m e20 Z
La quantit` ah ¯ 2 /(me20 ), avente le dimensioni di una lunghezza, prende il nome di raggio della prima orbita di Bohr e viene usualmente indicata col simbolo a0 . Essa vale 0.529 × 10−8 cm, ovvero 0.529 ˚ A. Attraverso tale quantit` a si ottiene allora rn = a0
n2 . Z
Sull’orbita generica di raggio r, l’elettrone possiede l’energia E=
1 2
m v2 −
Z e20 Z e20 =− , r 2r
dove abbiamo utilizzato l’Eq. (6.3) e abbiamo assunto nulla l’energia elettrostatica all’infinito. Sostituendo il valore di rn trovato precedentemente, si ottiene per l’energia dell’elettrone sull’orbita caratterizzata dal numero quantico n En = −
e20 Z 2 m e40 Z 2 = − . 2 a0 n 2 2h ¯ 2 n2
Dalla condizione di quantizzazione del momento angolare `e poi facile trovare la velocit`a vn che compete all’elettrone sull’orbita n-esima. Si ottiene vn =
e20 Z , h ¯ n
e, introducendo la quantit` a adimensionale α, detta costante della struttura fine, definita da 1
In effetti, il ragionamento originale di Bohr `e diverso, essendo basato sul principio di corrispondenza. Quella qui riportata `e un’adattazione moderna che non altera lo spirito della derivazione.
ATOMI CON UN SOLO ELETTRONE DI VALENZA
α=
141
1 e20 = = 7.29735 × 10−3 , h ¯c 137.036
si ottiene vn = α c
Z , n
la quale mostra che per l’atomo di Idrogeno (Z = 1) dobbiamo attenderci delle correzioni relativistiche dell’ordine di α2 . Dall’espressione per rn e vn , si pu` o poi trovare il periodo dell’elettrone sull’n-esima orbita. Si trova facilmente Tn =
2π rn 2π h ¯ 3 n3 = , vn m e40 Z 2
per cui si ottiene l’analogo della terza legge di Keplero rn3 Z e20 , = Tn2 4π 2 m
indipendente da n .
Si pu` o infine osservare che, con l’introduzione della costante della struttura fine, l’espressione per l’energia En pu` o anche essere scritta nella forma En = −m c2
α2 Z 2 . 2 n2
I risultati precedenti sono stati ottenuti supponendo che la massa del nucleo sia infinita. Se si tiene invece conto del fatto che la massa del nucleo `e finita, essi vanno modificati sostituendo alla massa dell’elettrone, m, la cosiddetta massa ridotta, mr , definita da mr =
m Mn , m + Mn
dove Mn `e la massa del nucleo intorno al quale ruota l’elettrone. Poich`e si ha sempre m Mn , si pu` o sviluppare in serie l’equazione precedente ottenendo m , mr m 1 − Mn che mostra che la correzione per la massa ridotta `e dell’ordine dello 0.5 per mille nel caso dell’atomo di Idrogeno. La prova formale dell’effetto della massa ridotta si basa sul cosiddetto teorema dei due corpi che qui ricordiamo. Siano dati due corpi di massa m1 e m2 , rispettivamente. Se il corpo 1 esercita sul corpo 2 la forza F , allora, per il terzo principio della dinamica, il corpo 2 esercita sul corpo 1 la forza −F , cosicch´e, per il secondo principio, il moto dei rispettivi centri di massa `e retto, con simboli evidenti, dalle equazioni
142
CAPITOLO 6
¨2 = F , m2 x
¨ 1 = −F . m1 x
Per il moto relativo, descritto dal raggio vettore x = x2 − x1 , si ha quindi 1 1 ¨ ¨ ¨ x = x2 − x1 = F , + m2 m1 ovvero ¨ = F , mr x dove mr =
m1 m2 . m1 + m 2
Quest’ultima equazione mostra che il moto del corpo 2 (nel nostro caso l’elettrone), riferito al corpo 1 (nel nostro caso il nucleo), `e lo stesso del moto assoluto di un corpo su cui agisce la stessa forza e la cui massa `e pari alla massa ridotta. Tenendo conto della correzione dovuta alla massa ridotta, l’energia dell’atomo idrogenoide sull’n-esima orbita risulta En = −
mr e40 Z 2 . 2h ¯ 2 n2
(6.4)
In base alla seconda ipotesi di Bohr, il numero d’onde del quanto emesso nella transizione fra l’orbita n-esima e l’orbita m-esima (con n > m) risulta En − Em 1 1 2 ν¯ = = RZ , − 2 hc m2 n dove R, la costante di Rydberg per l’atomo idrogenoide, `e data da R=
mr e40 , 4π c h ¯3
e in particolare, per l’atomo di Idrogeno, RH =
e40 m Mp , m + Mp 4π c h ¯3
Mp essendo la massa del protone. Come si vede, il modello di Bohr porta a un’espressione per i numeri d’onda delle righe spettrali dell’atomo di Idrogeno che coincide con quella osservata (Eq. (6.1)). Pi` u quantitativamente, si possono confrontare i valori numerici, teorico e sperimentale, ottenuti per RH . Sostituendo i valori delle costanti
ATOMI CON UN SOLO ELETTRONE DI VALENZA
143
atomiche, si trova un ottimo accordo . Questo fatto costitu`ı, dal punto di vista storico, una delle prove pi` u convincenti della correttezza della teoria di Bohr 2 . Come abbiamo gi` a osservato, le formule dedotte in questo paragrafo si applicano non solo allo spettro dell’atomo di Idrogeno ma anche agli spettri degli atomi idrogenoidi, ovvero degli atomi composti da un solo elettrone in orbita intorno a un nucleo avente carica Ze0 , con Z > 1. Tali spettri sono quelli dell’Elio una volta ionizzato, He+ , per cui Z = 2 (spettro dell’ He II), del Litio due volte ionizzato, Li++ , per cui Z = 3 (spettro del Li III), del Berillio tre volte ionizzato, etc.3 . Gli spettri degli idrogenoidi sono del tutto analoghi a quello dell’Idrogeno, con la differenza di un fattore di scala 1/Z nelle dimensioni delle orbite e di un fattore Z 2 nelle energie, ovvero nei numeri d’onda o nelle frequenze (oltre a una ulteriore differenza, dell’ordine della frazione del permille, dovuta all’effetto della massa ridotta che influisce sulla costante di Rydberg). La serie di Balmer dell’Elio ionizzato, ad esempio, viene a cadere nell’ultravioletto invece che nel visibile. Le condizioni di quantizzazione di Bohr si applicano soltanto alle orbite legate, cio`e alle orbite (ellittiche, in fisica classica) che corrispondono a energie negative. Le orbite che corrispondono a valori positivi dell’energia (iperboliche, in fisica classica) sono quindi tutte “possibili”. Oltre alle transizioni fra orbite quantizzate a energia negativa, sono anche possibili transizioni fra orbite a energia positiva e orbite a energia negativa, oppure fra due orbite entrambe a energia positiva. Nel primo caso, il numero d’onda del quanto di energia `e dato da R + 2 , hc n dove n `e il numero quantico dell’orbita a energia negativa e dove `e l’energia cinetica dell’elettrone all’infinito sull’orbita iperbolica. Poich´e pu` o assumere un qualsiasi valore positivo o nullo, ne segue che la serie di righe discrete, il cui limite si trova al numero d’onda R/n2 , sfuma in uno spettro continuo dalla parte dei numeri d’onda maggiori (lunghezze d’onda minori). Per lo spettro dell’atomo di Idrogeno, ad esempio, si ha il cosiddetto continuo di Lyman per λ < 912 ˚ A, il continuo di Balmer per λ < 3647 ˚ A, etc.. Una transizione di questo genere corrisponde, in assorbimento, all’espulsione di un elettrone dall’atomo (effetto fotoelettrico o fotoionizzazione), mentre in emissione corrisponde ν¯ =
2
Bisogna dire che al momento in cui Bohr pubblic` o i suoi risultati le costanti fisiche erano conosciute con scarsa precisione e la coincidenza fra valori teorici e sperimentali di R H non costitu`ı di per s´ e una prova sufficiente per avvalorare il suo modello presso la comunit` a scientifica. Oggi la situazione ` e profondamente mutata e la costante di Rydberg `e una delle costanti fisiche che sono conosciute con il maggior numero di cifre significative (R H = 1.0967758341 × 105 cm−1 ). 3 Lo spettro di un elemento n volte ionizzato si indica col simbolo dell’elemento seguito dal numero (n + 1) scritto in cifre romane. Ad esempio, lo spettro del Na I ` e lo spettro del Sodio neutro, lo spettro del C IV ` e lo spettro del Carbonio ionizzato tre volte, lo spettro del Fe XV ` e lo spettro del Ferro ionizzato 14 volte, e cos`ı via.
144
CAPITOLO 6
eV
12
cm
−1
0
5 4 3
Serie di Balmer
2
30000
9 Serie di Lyman
6
3
0
60000
90000 1
Fig. 6.2. Diagramma di Grotrian dell’atomo di Idrogeno. I livelli del continuo sono rappresentati dalla zona ombreggiata che, in principio, si estende indefinitamente verso l’alto.
al fenomeno inverso, detto ricombinazione elettronica. L’osservazione del continuo al limite della serie di righe che trae origine dal livello fondamentale `e molto importante, in quanto fornisce direttamente il potenziale di ionizzazione dell’atomo (o dello ione). Se ν¯∞ `e il numero d’onda corrispondente al limite di tale serie, il potenziale di ionizzazione espresso (come `e consuetudine) in eV si ottiene semplicemente dalla formula χ(eV) = 1.2398 × 10−4 ν¯∞ (cm−1 ) . Per l’atomo di Idrogeno, ad esempio, essendo ν¯∞ = RH si ottiene il potenziale di ionizzazione di 13.598 eV. Una transizione fra due orbite a energia positiva `e caratterizzata dal numero d’onda ν¯ =
− , hc
dove e sono le energie cinetiche all’infinito dell’elettrone sulle orbite iperboliche iniziale e finale. Una tale transizione corrisponde, in emissione, al cosiddetto fenomeno della Bremsstrahlung (radiazione di frenamento) e, in assorbimento,
ATOMI CON UN SOLO ELETTRONE DI VALENZA
145
al cosiddetto fenomeno della Bremsstrahlung inversa4. Una rappresentazione grafica particolarmente utile dei termini spettroscopici e delle righe spettrali si ottiene riportando in un diagramma i livelli energetici mediante dei tratti orizzontali su una scala verticale di energie (o di numeri d’onda). La Fig. 6.2 fornisce l’esempio di un tale diagramma (detto diagramma di Grotrian) per l’atomo di Idrogeno. L’energia del particolare livello si legge direttamente sulla scala di sinistra e il valore zero `e assegnato per convenzione al livello fondamentale. Il numero d’onda del termine corrispondente si legge invece sulla scala di destra, nella quale lo zero corrisponde, sempre per convenzione, al limite di ionizzazione. Una qualsiasi riga spettrale `e rappresentata mediante una linea verticale che connette due livelli energetici. La lunghezza della linea, misurata sulla scala di destra, fornisce direttamente il numero d’onda della riga spettrale e quindi la sua lunghezza d’onda. Per concludere, `e necessario menzionare che la teoria di Bohr, dedotta per orbite circolari, fu in seguito generalizzata da Sommerfeld al caso pi` u generale delle orbite ellittiche. Non ci dilungheremo qui su tale teoria dato che, al giorno d’oggi, essa riveste interesse quasi esclusivamente dal punto di vista storico.
6.2 L’equazione di Schr¨ odinger in coordinate sferiche L’approccio moderno per determinare la struttura e le caratteristiche del sistema dei livelli energetici degli atomi (e quindi del relativo spettro) si basa sulla soluzione dell’equazione di Schr¨ odinger stazionaria. Per una particella di massa m mobile in un campo di forze che ammette potenziale, l’equazione `e la seguente
p2 H |ψ = + V |ψ = E |ψ 2m
,
dove V `e l’energia potenziale della particella. Nella rappresentazione delle funzioni d’onda, dove l’operatore p vale −i h ¯ grad, l’equazione, per un potenziale indipendente dal tempo, diviene −
h ¯2 2 ∇ + V (x ) ψ(x ) = Eψ(x ) . 2m
Se il campo di forze `e a simmetria sferica, la soluzione dell’equazione di Schr¨odinger risulta semplificata introducendo le coordinate sferiche, r, θ, φ, definite implicitamente dalle equazioni (si veda la Fig. 6.3) 4
Si veda il Par. 3.7 per la teoria classica della radiazione di frenamento.
146
CAPITOLO 6
z
#
# $
$
θ
r
er eφ eθ
!
!
!
!
!
!
!
"
"
"
"
"
"
"
φ
y
x Fig. 6.3. Sistema di coordinate sferiche (r, θ, φ) e corrispondenti versori e r ,eθ ,eφ .
x = r sinθ cosφ ,
y = r sinθ sinφ ,
z = r cosθ ,
dove (x, y, z) `e un sistema di riferimento cartesiano ortogonale destrorso. Andiamo adesso a determinare l’espressione dell’operatore ∇2 (Laplaciano) in tale sistema di coordinate. Poich´e risulta ∇2 = div grad , dobbiamo esprimere in coordinate sferiche sia l’operatore gradiente che l’operatore divergenza. Introduciamo quindi i tre versori er , eθ ed eφ , tali da formare, in quest’ordine, una terna trirettangola destra, come in Fig. 6.3. Tali versori sono espressi, in funzione dei tre versori ı, j, k, diretti rispettivamente lungo gli assi x, y, z, dalle equazioni er = sinθ cosφı + sinθ sinφ j + cosθ k , eθ = cosθ cosφı + cosθ sinφ j − sinθ k , eφ = − sinφı + cosφ j . La distanza infinitesima dP fra due punti aventi coordinate sferiche (r, θ, φ) e (r + dr, θ + dθ, φ + dφ) si scrive nella forma dP = er dr + eθ r dθ + eφ r sinθ dφ . Osserviamo poi che, data una funzione scalare arbitraria, f , del punto, si ha, per definizione stessa di gradiente df = gradf · dP = (gradf )r dr + (gradf )θ r dθ + (gradf )φ r sinθ dφ ,
ATOMI CON UN SOLO ELETTRONE DI VALENZA
147
z dr
dθ y dφ x Fig. 6.4. La figura mostra il volumetto infinitesimo utilizzato per trovare l’espressione dell’operatore divergenza in coordinate sferiche.
dove si sono indicate con il simbolo (gradf )r,θ,φ , rispettivamente, le tre componenti del gradiente della funzione f lungo i tre versori er , eθ , eφ . D’altra parte, poich´e si ha anche df =
∂f ∂f ∂f dr + dθ + dφ , ∂r ∂θ ∂φ
dal confronto delle ultime due equazioni, essendo f arbitraria, si ottengono le espressioni per le componenti sferiche dell’operatore gradiente gradr =
∂ , ∂r
gradθ =
1 ∂ , r ∂θ
gradφ =
∂ 1 . r sin θ ∂φ
(6.5)
Analogamente possiamo determinare l’espressione dell’operatore divergenza. Facendo riferimento al flusso di un vettore v arbitrario attraverso la superficie del volumetto infinitesimo della Fig. 6.4, si ha, per il teorema di Gauss (divv ) r2 sinθ dr dθ dφ = +
∂ (vr r2 sinθ) dr dθ dφ ∂r
∂ ∂ (vθ r sinθ) dr dθ dφ + (vφ r) dr dθ dφ , ∂θ ∂φ
dalla quale si ottiene divv =
1 ∂ 2 1 ∂ 1 ∂ (r vr ) + (sinθ vθ ) + vφ . r2 ∂r r sinθ ∂θ r sinθ ∂φ
(6.6)
Ricordando che ∇2 = div grad, e ricordando le Eq. (6.5), si ottiene in definitiva l’espressione dell’operatore Laplaciano di una funzione scalare del punto in coordinate sferiche
148
CAPITOLO 6
1 ∂ ∇ = 2 r ∂r 2
1 ∂ ∂ 1 ∂2 2 ∂ r + 2 sinθ + 2 2 . ∂r r sinθ ∂θ ∂θ r sin θ ∂φ2
(6.7)
Mediante questa espressione, l’equazione di Schr¨odinger stazionaria per una particella mobile in un potenziale centrale risulta H ψ(r, θ, φ) = E ψ(r, θ, φ) , dove l’Hamiltoniana, espressa in coordinate sferiche, `e data da H=−
h ¯2 1 ∂ 1 ∂ ∂ 1 ∂2 2 ∂ r + sinθ + + V (r) . 2m r2 ∂r ∂r r2 sinθ ∂θ ∂θ r2 sin2 θ ∂φ2
Prima di procedere alla soluzione di questa equazione, `e opportuno trovare anche l’espressione, sempre in coordinate sferiche, degli operatori associati al momento angolare orbitale. Ricordando la definizione = 1 x × p = −i x × grad , h ¯
(6.8)
si ha = −i r er × er ∂ + eθ 1 ∂ + eφ 1 ∂ , ∂r r ∂θ r sinθ ∂φ dalla quale si ottiene, essendo er × eθ = eφ , er × eφ = −eθ , ∂ 1 ∂ − eθ . = −i eφ ∂θ sinθ ∂φ Da questa equazione si possono determinare le tre componenti del momento angolare orbitale lungo gli assi x, y, z di Fig. 6.3. Tenendo conto delle relazioni fra le terne (er , eθ , eφ ) e (ı, j, k), si ha ∂ ∂ + cotθ cosφ , x = ı · = i sinφ ∂θ ∂φ ∂ ∂ + cotθ sinφ , y = j · = i − cosφ ∂θ ∂φ ∂ z = k · . = −i ∂φ Per 2 si ha poi ∂ 1 ∂ ∂ 1 ∂ − eθ · eφ − eθ . = · = − eφ ∂θ sinθ ∂φ ∂θ sinθ ∂φ 2
ATOMI CON UN SOLO ELETTRONE DI VALENZA
149
Per calcolare questa quantit` a bisogna preliminarmente trovare le derivate dei versori rispetto alle coordinate sferiche. Con facili considerazioni geometriche si trova ∂ er = 0 , ∂r ∂ eθ = 0 , ∂r ∂ eφ = 0 , ∂r
∂ er = eθ , ∂θ ∂ eθ = −er , ∂θ ∂ eφ = 0 , ∂θ
∂ er = sinθeφ , ∂φ ∂ eθ = cosθeφ , ∂φ ∂ eφ = − sinθer − cosθeθ . ∂φ
Si ottiene allora 2 = −
1 ∂2 ∂2 ∂ − − cotθ , ∂θ2 ∂θ sin2 θ ∂φ2
ovvero 1 ∂ =− sinθ ∂θ 2
∂ 1 ∂2 sinθ − . ∂θ sin2 θ ∂φ2
L’espressione di trovata precedentemente permette anche di determinare le propriet` a di commutazione delle diverse componenti del momento angolare totale. Si ha infatti × = − eφ ∂ − eθ 1 ∂ × eφ ∂ − eθ 1 ∂ , ∂θ sinθ ∂φ ∂θ sinθ ∂φ dalla quale si ottiene, come `e facile verificare × = i , che `e la relazione fondamentale che esprime le regole di commutazione fra le componenti del momento angolare. Da questa propriet` a segue immediatamente l’altra [ 2 , ]=0 , esprimente il fatto che il quadrato del momento angolare orbitale commuta con ciascuna delle sue componenti. Con l’introduzione dell’operatore 2 , l’equazione di Schr¨odinger pu` o essere anche posta nella forma
h ¯2 ∂ h ¯2 2 ∂ 2 − r + + V (r) ψ(r, θ, φ) = E ψ(r, θ, φ) . 2 m r2 ∂r ∂r 2 m r2
(6.9)
150
CAPITOLO 6
Tenendo conto che l’operatore 2 opera soltanto sulle variabili θ e φ, e che l’operatore z opera solo sulla variabile φ, possiamo cercare una soluzione dell’equazione di Schr¨odinger che sia contemporaneamente autofunzione dei tre operatori commutanti H, 2 e z . Per far questo, iniziamo col determinare le autofunzioni dell’operatore z , ovvero determiniamo le funzioni tali che −i
∂ Φμ = μ Φ μ . ∂φ
Integrando questa equazione si ottiene, a meno di una funzione moltiplicativa arbitraria delle variabili r e θ, Φμ (φ) = e i μ φ . Osserviamo per` o che la funzione Φμ (φ) deve essere a un solo valore. Perch´e questo sia verificato, si deve avere μ=m , con m intero qualsiasi (positivo, negativo, o nullo). Si ottiene quindi che gli autovalori dell’operatore z sono gli interi m e che le corrispondenti autofunzioni sono della forma Φm (φ) = ei m φ . Passiamo adesso a determinare le autofunzioni comuni degli operatori 2 e z . Per far questo cerchiamo le funzioni della forma Θλ Φm tali da soddisfare l’equazione 1 ∂ ∂ 1 ∂2 − sinθ − Θ λ Φm = λ Θ λ Φm . sinθ ∂θ ∂θ sin2 θ ∂φ2 Sostituendo l’espressione per Φm ed eseguendo il cambiamento di variabile definito da x = cosθ , si ottiene per la funzione Θλ l’equazione differenziale m2 d2 Θλ dΘλ + λ − (1 − x2 ) Θλ = 0 . − 2 x dx2 dx 1 − x2 Per risolvere questa equazione, poniamo Θλ (x) = (1 − x2 )|m|/2 fλ (x) . Eseguendo le derivate e sostituendo, si ottiene per fλ l’equazione differenziale (1 − x2 )fλ (x) − 2 x (1 + |m|)fλ (x) + (λ − |m| − m2 )fλ (x) = 0 .
ATOMI CON UN SOLO ELETTRONE DI VALENZA
151
Infine, cerchiamo una soluzione per la funzione fλ di tipo serie di potenze ck xk . fλ (x) = k
Eseguendo le derivate e sostituendo, si ottiene una relazione ricorrente fra i coefficienti ck della forma ck+2 =
(k + |m|) (k + |m| + 1) − λ ck . (k + 2) (k + 1)
Se la serie non `e troncata si ottiene, per k → ∞, che il rapporto ck+2 /ck tende a 1. La serie `e quindi divergente per x = ±1. Per ottenere una funzione finita bisogna ammettere che la serie sia troncata, e questo impone per l’autovalore λ l’espressione λ = l(l + 1) , con l intero e con l ≥ |m| . Si noti che il grado massimo del polinomio, kmax risulta pari a kmax = l − |m| , e che il polinomio `e di grado pari oppure di grado dispari a seconda che kmax sia a sua volta pari o dispari. Le funzioni che abbiamo determinato sono, a parte una costante moltiplicativa, delle funzioni ben note in fisica-matematica. Esse prendono il nome di funzioni di Legendre (per m = 0) e di funzioni associate di Legendre di prima specie (per m arbitrario) e vengono usualmente denotate, rispettivamente, con |m| i simboli Pl (x) e Pl (x). Si pu` o mostrare che le funzioni associate di Legendre sono tali da soddisfare le condizioni di ortogonalit`a 1 |m| |m| Pl (x) Pl (x) dx = 0 , se l = l . −1
Riassumendo, abbiamo quindi trovato che le autofunzioni comuni degli operatori 2 e z sono caratterizzate da due numeri quantici interi, m e l, e risultano della forma |m|
Pl
(cosθ) e i m φ .
Moltiplicando queste funzioni per un opportuno fattore, si ottengono le cosiddette armoniche sferiche, Ylm (θ, φ). Il fattore viene scelto in modo tale che le armoniche sferiche siano normalizzate all’unit`a su tutto l’angolo solido e in
152
CAPITOLO 6
modo che esse soddisfino a ulteriori propriet` a del momento angolare (si veda l’equazione (6.10) che coinvolge gli operatori ± detti operatori di shift). La definizione delle armoniche sferiche `e la seguente % 2l + 1 (l − |m|)! |m| Ylm (θ, φ) = (−1)(m+|m|)/2 Pl (cosθ) ei m φ , 4π (l + |m|)! e le loro propriet`a fondamentali sono riassunte dalle seguenti equazioni ∂ 1 ∂2 1 ∂ 2 sinθ − Ylm (θ, φ) = Ylm (θ, φ) = − sinθ ∂θ ∂θ sin2 θ ∂φ2 = l(l + 1)Ylm (θ, φ) , ∂ Ylm (θ, φ) = m Ylm (θ, φ) , ∂φ ∂ ∂ ± i cotθ Ylm (θ, φ) = ± Ylm (θ, φ) = (x ± i y )Ylm (θ, φ) = ±e±i φ ∂θ ∂φ # = (l ± m + 1)(l ∓ m) Ylm±1 (θ, φ) , (6.10)
z Ylm (θ, φ) = −i
∗ Ylm (θ, φ) = (−1)m Yl−m (θ, φ) ,
2π
dφ 0
π
Ylm (π − θ, φ + π) = (−1)l Ylm (θ, φ) , (6.11)
∗ dθ sinθ Ylm (θ, φ) Yl m (θ, φ) = δll δmm .
(6.12)
0
Le espressioni esplicite delle armoniche sferiche pi` u semplici sono le seguenti $ Y00 =
1 , 4π
$ Y10 =
3 cosθ , 4π
$ Y1±1 = ∓
3 sinθ e ± i φ . (6.13) 8π
Tornando all’equazione di Schr¨ odinger nella forma (6.9), cerchiamo una soluzione del tipo ψ(r, θ, φ) = R(r) Ylm (θ, φ) =
1 P (r) Ylm (θ, φ) , r
dove R(r) `e la funzione radiale “ordinaria” mentre P (r) `e la cosiddetta funzione radiale ridotta, entrambe le funzioni dipendendo, in generale, dal numero quantico l. La funzione ridotta deve obbedire alla condizione al contorno P (0) = 0 , in modo tale che la funzione d’onda ψ sia finita nell’origine. Sostituendo, si ottiene per la funzione P (r) la cosiddetta equazione di Schr¨odinger radiale
ATOMI CON UN SOLO ELETTRONE DI VALENZA
h ¯ 2 d2 P (r) + Veff (r)P (r) = E P (r) , 2 m dr2 dove l’energia potenziale efficace, Veff (r), `e data da −
153
(6.14)
h ¯ 2 l(l + 1) . 2 m r2 L’equazione (6.14) `e in tutto e per tutto analoga a quella per il moto unidimensionale della particella, con la sola differenza che all’energia potenziale vera e propria `e necessario aggiungere un ulteriore termine detto potenziale centrifugo. Tale termine, che si annulla per l = 0, tende a mantenere la particella lontana dall’origine e la sua importanza aumenta quadraticamente all’aumentare del momento angolare orbitale. Bisogna osservare che la comparsa del potenziale centrifugo non `e una caratteristica della sola meccanica quantistica ma che una cosa del tutto analoga si verifica anche in fisica classica quando si studia il moto di una particella in un potenziale centrale. Poich´e in un potenziale centrale il momento angolare M `e costante, si pu` o introdurre un sistema di coordinate polari (r, φ) nel piano dell’orbita (definito appunto come il piano perpendicolare al vettore momento angolare). In tali coordinate, la conservazione del momento angolare implica Veff (r) = V (r) +
m r2 φ˙ = M , con M costante. D’altra parte, per il teorema di conservazione dell’energia meccanica, si ha 1 2
m v 2 + V (r) =
1 2
m r˙ 2 +
1 2
m r2 φ˙ 2 + V (r) = E ,
con E costante. Sostituendo per φ˙ il valore dedotto dalla conservazione del momento angolare si ha M2 =E , 2 m r2 che `e appunto l’equazione del moto unidimensionale di una particella in un potenziale “efficace” contenente il termine aggiuntivo dovuto al potenziale centrifugo. La traduzione quantistica di questa equazione `e appunto l’equazione di Schr¨ odinger radiale (6.14). 1 2
m r˙ 2 + V (r) +
6.3 Atomo di Idrogeno, teoria quantistica Applichiamo le considerazioni svolte nel paragrafo precedente a un atomo idrogenoide. L’energia potenziale dell’elettrone `e data da −Ze20 /r, per cui l’equazione di Schr¨ odinger radiale (Eq. (6.14)) risulta
154
CAPITOLO 6
h ¯ 2 l(l + 1) h ¯ 2 d2 Z e20 + P (r) = E P (r) , − P (r) + − 2 mr dr2 r 2 mr r 2 dove abbiamo introdotto la massa ridotta mr in quanto il teorema dei due corpi ammette una diretta generalizzazione quantistica. Per risolvere questa equazione `e conveniente introdurre delle variabili adimensionali. Ricordando i risultati ottenuti attraverso la teoria di Bohr, introduciamo i parametri ξ ed ponendo a0 Z 2 e20 , E = − , Z 2 a0 dove il raggio della prima orbita di Bohr contiene adesso la massa ridotta in luogo della massa effettiva dell’elettrone, ovvero r=ξ
a0 =
h ¯2 . mr e20
Eseguendo la sostituzione, si ottiene l’equazione differenziale 2 l(l + 1) d2 − P (ξ) + − P (ξ) = 0 . dξ 2 ξ ξ2 Osserviamo che, per ξ → ∞, l’equazione differenziale assume la forma semplificata d2 P (ξ) − P (ξ) = 0 . dξ 2 Se > 0 (caso delle orbite legate), la soluzione asintotica dell’equazione `e quindi P (ξ) = C e ±
√
ξ
,
dove C `e una costante. Delle due soluzioni dobbiamo scegliere quella con l’esponenziale negativo perch´e l’altra diverge. Poniamo quindi P (ξ) = e−
√ ξ
f (ξ) ,
dove f (ξ) `e una nuova funzione. Sostituendo, si ottiene per f (ξ) l’equazione differenziale √ 2 l(l + 1) f (ξ) − 2 f (ξ) + − f (ξ) = 0 . ξ ξ2 Cerchiamo per f (ξ) una soluzione del tipo serie di potenze ponendo f (ξ) = ξ p L(ξ) = ξ p
∞ k=0
ck ξ k ,
(c0 = 0) ,
ATOMI CON UN SOLO ELETTRONE DI VALENZA
155
dove p `e un numero reale positivo (p > 0) in quanto vogliamo che sia P (0) = 0. Sostituendo si ottiene la relazione ∞
ck [(k + p)(k + p − 1) − l(l + 1)] ξ
k+p−2
=2
k=0
∞
ck
√ (k + p) − 1 ξ k+p−1 .
k=0
Il termine di grado pi` u basso della prima somma (corrispondente a k = 0) non ha il suo analogo nella seconda somma. Si deve quindi avere p(p − 1) = l(l + 1) . Questa equazione di secondo grado in p ammette le due soluzioni p = l + 1, e p = −l. La seconda `e per` o da scartare in quanto deve essere p > 0. Si ottiene quindi che p `e un intero dato da p=l+1 . Sostituendo questo valore di p, si ottiene la relazione ricorrente cui devono soddisfare i coefficienti della serie di potenze ck+1 [(k + l + 2)(k + l + 1)] = 2 ck
√ (k + l + 1) − 1 .
Se la serie non `e troncata, poich´e si ha √ ck+1 , lim =2 k→∞ ck k √
la funzione f (ξ) va all’infinito come e2 ξ , dimodoch´e la funzione P (ξ) diverge. Se vogliamo una funzione limitata dobbiamo supporre che la serie sia troncata, ovvero dobbiamo imporre che, in corrispondenza di un certo intero k0 ≥ 0, sia √ (k0 + l + 1) = 1 .
(6.15)
Questa equazione porta agli autovalori possibili per che sono dati da =
1 1 = 2 , (k0 + l + 1)2 n
dove n `e un intero tale che n≥l+1 . Ricordando le nostre sostituzioni iniziali si ottiene quindi per gli autovalori dell’energia E=−
e20 Z 2 , 2 a0 n 2
156
CAPITOLO 6
ovvero un’espressione che coincide con quella trovata attraverso la teoria di Bohr. Per quanto riguarda le autofunzioni, determiniamo l’equazione differenziale cui soddisfa la serie di potenze L(ξ). Ricordando la sua definizione e l’equazione differenziale per f (ξ), si ha ξ
d2 l+1 ξ d L(ξ) + 2 1 − L(ξ) = 0 . L(ξ) + 2 l + 1 − dξ 2 n dξ n
Questa equazione pu`o essere riportata all’equazione differenziale caratteristica dei polinomi generalizzati di Laguerre. Per far questo bisogna introdurre una nuova variabile, ρ, data da ρ=
2 2Z ξ= r . n n a0
In termini di ρ, l’equazione differenziale risulta ρ
d2 d L(ρ) + (2 l + 2 − ρ) L(ρ) + (n − l − 1) L(ρ) = 0 . 2 dρ dρ
I polinomi generalizzati di Laguerre5 soddisfano l’equazione differenziale x
d (q) d2 (q) L (x) + p L(q) L (x) + (q + 1 − x) p (x) = 0 , dx2 p dx p
per cui la nostra funzione L(ρ) `e, a parte un fattore di proporzionalit`a, il (2l+1) polinomio generalizzato di Laguerre Ln−l−1 . Raccogliendo i risultati precedenti, abbiamo trovato che l’autofunzione radiale ridotta corrispondente agli autovalori n e l pu` o essere espressa con maggior semplicit` a in termini della variabile ρ ed `e data, a parte un fattore di proporzionalit` a, da Pnl (ρ) = e−ρ/2 ρl+1 Ln−l−1 (ρ) . (2l+1)
(6.16)
Questo risultato, unito a quello ottenuto nel paragrafo precedente per la parte angolare della funzione d’onda, permette di esprimere le autofunzioni dell’atomo idrogenoide nella forma ψnlm (r, θ, φ) = Nnl e−ρ/2 ρl Ln−l−1 (ρ) Ylm (θ, φ) , (2l+1)
dove Nnl `e un fattore da determinare imponendo che le autofunzioni siano normalizzate. Tenendo conto della formula, 5
Seguiamo qui la convenzione contenuta nel volume M. Abramowitz & I.A. Stegun, Handbook of Mathematical Functions, Dover Publ., New York, 1971.
ATOMI CON UN SOLO ELETTRONE DI VALENZA
∞
0
157
2 2 n [(n + l)! ]3 (2l+1) , e−ρ ρ2l Ln−l−1 (ρ) ρ2 dρ = (n − l − 1)!
si ottiene Nnl =
Z a0
3/2
% 2 n2
(n − l − 1)! . [(n + l)! ]3
(6.17)
Le espressioni esplicite delle autofunzioni dell’atomo idrogenoide possono essere ottenute attraverso la formula dei polinomi generalizzati di Laguerre L(q) p (x)
=
p
(−1)m
m=0
[(p + q)!]2 xm . (p − m)! (q + m)! m!
(6.18)
Le autofunzioni normalizzate per i primi due livelli (n = 1 e n = 2) risultano ψ100 (r, θ, φ) =
Z a0
3/2
2 e−Zr/a0 Y00 (θ, φ) ,
(6.19)
3/2 1 −Zr/(2a0 ) Zr Z √ e 2− Y00 (θ, φ) , ψ200 (r, θ, φ) = a0 a0 8 3/2 1 Zr Z √ e−Zr/(2a0 ) Y1m (θ, φ) . ψ21m (r, θ, φ) = a0 a0 2 6
Le propriet` a dei polinomi generalizzati di Laguerre permettono di determinare i valori medi delle potenze di r sulle autofunzioni radiali. Definendo ∞ ∞ 2 2 rk = Rnl (r) rk r2 dr = Pnl (r) rk dr , 0
ed esprimendo r
r4 r−1 r−4
in unit` a di
0
ak0 ,
si ottengono i seguenti risultati
1 n2 [3 n2 − l(l + 1)] , r2 = [5 n2 + 1 − 3 l(l + 1)] , 2Z 2 Z2 n2 = [35 n2 (n2 − 1) − 30 n2 (l + 2)(l − 1) + 3(l + 2)(l + 1)l(l − 1)] , 8 Z3 n4 = [63 n4 − 35 n2 (2l2 + 2l − 3) + 5 l(l + 1)(3l 2 + 3l − 10) + 12] , 8 Z4 Z 2 Z2 2 Z3 , , = 2 , r−2 = 3 r−3 = 3 n n (2l + 1) n l(l + 1)(2l + 1) 4 Z 4 [3 n2 − l(l + 1)] . = 5 n (2l + 3)(2l + 1)(2l − 1)l(l + 1) (6.20)
r = r3
k
158
CAPITOLO 6
I valori riportati nelle equazioni precedenti permettono di riottenere in senso probabilistico i risultati della teoria di Bohr. Il caso delle orbite circolari corrisponde infatti ad assumere, fissato n, il massimo valore possibile per il numero quantico l, ovvero l = n − 1. Per tale valore si ottiene r = a0
2 n2 + n , 2Z
che, al limite per grandi valori di n, coincide con l’espressione del raggio delle orbite di Bohr. Interessante `e anche calcolare la varianza σ(r) definita da , σ(r) =
r2 − r
2
.
Sempre per l = n − 1 si ottiene √ n 2n+1 , σ(r) = a0 2Z e quindi σ(r) 1 . =√ r 2n+1 Per grandi valori di n la funzione d’onda dell’elettrone tende a essere sempre pi` u concentrata intorno all’orbita di Bohr. Le autofunzioni che abbiamo determinato dipendono da tre numeri quantici, n, l, e m, che soddisfano le seguenti disuguaglianze n≥1 ,
l ≤n−1 ,
|m| ≤ l .
I tre numeri quantici prendono il nome, rispettivamente di numero quantico principale, numero quantico azimutale, e numero quantico magnetico. Talvolta si fa riferimento anche al cosiddetto numero quantico radiale, nr , definito da nr = n−l−1. Come abbiamo visto sopra, nr rappresenta il grado del polinomio generalizzato di Laguerre che compare nell’espressione dell’autofunzione. Per una propriet` a dei polinomi stessi, nr rappresenta anche il numero dei valori di r in cui l’autofunzione si annulla. Per una circostanza del tutto particolare, tipica del potenziale Coulombiano, gli autovalori dell’atomo idrogenoide dipendono solo dal numero quantico principale n e non anche da l (l’indipendenza da m `e caratteristica del potenziale centrale ed `e connessa alla simmetria sferica dell’Hamiltoniana). Questo fa s`ı che gli autovalori dell’atomo idrogenoide siano doppiamente degeneri (rispetto a m e a l). Per calcolare la degenerazione del livello n `e sufficiente osservare che l pu` o assumere i valori 0, 1, . . . , n − 1, e che, assegnato l, m pu` o assumere i (2 l + 1) valori −l, −l + 1, . . . , 0, . . . , l − 1, l. La degenerazione `e quindi
ATOMI CON UN SOLO ELETTRONE DI VALENZA
g(n) =
n−1
159
(2 l + 1) = n2 .
l=0
In teoria relativistica, quando si introduce lo spin, le funzioni d’onda sono caratterizzate da un ulteriore numero quantico, ms , l’autovalore dell’operatore sz , proiezione dello spin lungo l’asse di quantizzazione z, che pu` o assumere i due valori ± 12 . Tenendo conto anche dello spin, la degenerazione del livello n risulta quindi uguale a 2 n2 .
6.4 Atomo di Idrogeno, correzioni relativistiche Sebbene l’equazione di Dirac per l’atomo idrogenoide possa essere risolta in maniera esatta, preferiamo qui dedurre l’espressione delle correzioni relativistiche ai livelli energetici di tale atomo applicando la teoria delle perturbazioni. Riprendiamo quindi l’equazione di Dirac al limite non relativistico sviluppato al primo ordine (Eq. (5.13)) e, in tale equazione, sostituiamo il potenziale φ con Ze0 /r, la carica e con −e0 , e la massa m con la massa ridotta mr . A proposito di quest’ultima sostituzione bisogna dire che l’equazione di Dirac `e valida per un ipotetico nucleo di massa infinita, e che la sua generalizzazione al caso della massa finita (problema relativistico dei due corpi) porta a equazioni notevolmente complesse6 . La sostituzione m → mr non `e quindi completamente giustificata dal punto di vista teorico, ma va piuttosto considerata come un’approssimazione di carattere fenomenologico. Tenendo conto di queste sostituzioni, l’equazione pu` o essere posta nella forma H |ψ = (H0 + H ) |ψ = E |ψ
,
dove |ψ `e, in notazione di Dirac, la funzione d’onda spinoriale, e dove H0 = 1 H =− 2 m r c2
p2 Ze20 , − 2 mr r
2 ¯2 1 ∂ ¯2 1 Z e20 h Z e20 Z e20 h + E+ − σ · . r 4 m2r c2 r2 ∂r 4 m2r c2 r3
Riguardo al primo termine nell’espressione di H , notiamo che abbiamo preferito esprimerlo mediante la seconda delle due forme alternative dell’Eq.(5.12). Ricordiamo brevemente i risultati della teoria delle perturbazioni al primo ordine. Si abbia un’Hamiltoniana H esprimibile nella forma H0 + H , con 6
Si veda l’articolo: R. Giachetti & E. Sorace, Journal of Physics A 39, 15207 (2006).
160
CAPITOLO 6
H H0 , e supponiamo di aver risolto l’equazione di Schr¨ odinger stazionaria per H0 trovando gli autovalori En e i corrispondenti autovettori |n H0 |n = En |n
.
Per determinare la “perturbazione” indotta dall’Hamiltoniana H sugli autovalori En si agisce nella seguente maniera: a) se l’autovalore dell’energia non `e degenere, la correzione ΔEn all’energia si ottiene attraverso l’elemento di matrice diagonale ΔEn = n| H |n
,
mentre l’autovettore resta invariato; b) se invece l’autovalore `e degenere, indicato con ν un ulteriore numero quantico (o un set di numeri quantici) che caratterizza gli autovettori, |n, ν , dello spazio degenere, si calcolano gli elementi di matrice Hνν n, ν| H |n, ν =
,
e si determinano autovalori e autovettori di tale matrice che danno, rispettivamente, le correzioni all’energia En e gli autovettori dell’Hamiltoniana totale. Naturalmente, il calcolo risulta enormemente semplificato quando `e possibile trovare una base rispetto alla quale la matrice H νν `e diagonale. Altrimenti, con l’esclusione delle matrici di ordine 2 e, in qualche caso, di quelle di ordine 3, il calcolo, in generale, pu` o essere eseguito solo numericamente. Applichiamo adesso la teoria delle perturbazioni al nostro caso particolare. Come abbiamo visto nel paragrafo precedente, l’Hamiltoniana H0 ammette, tenendo conto anche dello spin, autofunzioni caratterizzate dai quattro numeri quantici n, l, m, ms di cui conosciamo l’espressione esplicita. Per tali autofunzioni utilizzeremo la notazione compatta |nlmms . L’energia invece dipende solo da n, per cui, per un n fissato, si hanno 2 n2 livelli degeneri caratterizzati da tutti i possibili valori diversi di l, m, e ms . Dobbiamo quindi calcolare, in principio, gli elementi di matrice Hlmm nlmms | H |nl m ms = s ,l m ms
.
L’Hamiltoniana H consta di tre termini. I primi due, agendo soltanto sulla variabile radiale r, commutano con gli operatori 2 , z e sz e, quindi, hanno elementi di matrici diagonali rispetto ai corrispondenti numeri quantici. Il terzo termine, invece, contenendo l’espressione σ · , non `e diagonale. Si pu`o tuttavia ovviare a questo inconveniente eseguendo un cambiamento di base, passando cio`e dalla base |nlmms alla base |nljmj , dove j e mj sono i numeri quantici relativi a un nuovo operatore, j, definito da j = + s .
ATOMI CON UN SOLO ELETTRONE DI VALENZA
161
Come mostrato nella sezione di questo libro dedicata alla teoria del momento angolare (Par. 7.9), il cambiamento di base implica che i nuovi vettori di stato si ottengono mediante opportune combinazioni lineari dei vecchi vettori le quali coinvolgono i coefficienti di Clebsh-Gordan (o i simboli 3-j di Wigner). Per i nostri scopi presenti non `e per` o necessario entrare nei dettagli della trasformazione. Basta qui osservare che, attraverso l’introduzione dell’operatore j, si pu` o trovare un’espressione appropriata per il termine · σ . Si ha infatti j 2 = ( + s )2 = 2 + s2 + 2 · s , dalla quale si ottiene, ricordando che σ = 2 s · σ = 2 · s = j 2 − 2 − s2 . L’operatore · σ risulta diagonale nella nuova base e, poich´e il terzo termine dell’Hamiltoniana H contiene tale operatore moltiplicato per una funzione di r, anche tale termine risulta, adesso, diagonale. Consideriamo uno stato caratterizzato, oltre che da n, dai tre numeri quantici l, j, e mj . L’energia imperturbata `e, come sappiamo E=−
Z 2 e20 1 , 2 a0 n 2
dove a0 = h ¯ 2 /(mr e20 ). Indichiamo con ΔE1 , ΔE2 e ΔE3 l’energia di perturbazione dovuta, rispettivamente, ai tre termini dell’Hamiltoniana H , ovvero al termine di correzione dell’energia cinetica, al termine di Darwin, e al termine di interazione spin-orbita. Si ha, per il primo termine 1 Z 2 e40 Z 2 Z a0 r−1 2 −2 ΔE1 = − , − + a0 r 2 mr c2 a20 4 n4 n2 e, ricordando le espressioni per r k date nel paragrafo precedente (Eq. (6.20)), si ottiene Z 4 e40 1 2 1 ΔE1 = − . − + 2 mr c2 a20 4 n4 n4 n3 (2l + 1) Questa espressione pu`o essere messa nella forma pi` u significativa Z 2 e20 Z 2 α2 3 n ΔE1 = − , − 2 a0 n 2 n 2 4 l + 12 dove α `e la costante della struttura fine. Per il termine di Darwin, indicando con Rnl (r) la funzione radiale, si ha ¯2 ∞ d Z e20 h 1 Rnl (r) r2 dr . Rnl (r) 2 ΔE2 = − 4, m2r c2 0 r dr
162
CAPITOLO 6
Risolvendo l’integrale si ottiene ΔE2 =
Z e20 h ¯2 2 R (0) . 8 m2r c2 nl
Questa quantit` a `e tipica di un termine di contatto, risultato che avevamo gi` a ottenuto nel Par. 5.5 (cfr. Eq. (5.15)). Essa `e diversa da zero solo per stati aventi l = 0 in quanto essi sono gli unici per i quali la funzione radiale `e diversa da zero nell’origine. Per mezzo delle Eq. (6.16), (6.17) e (6.18), si ottiene Rnl (0) =
Pnl (r) r
=2
r=0
Z n a0
3/2 δl,0 ,
e quindi ΔE2 =
Z 2 e20 1 2 2 1 Z α δl,0 . 2 a0 n 2 n
Infine, per il termine di interazione spin-orbita si ottiene ΔE3 =
¯ 2 −3 Z e20 h r [ j(j + 1) − l(l + 1) − 4 m2r c2
3 4
] ,
dove, per le regole d’addizione di due momenti angolari, il numero quantico j pu` o assumere i due valori (l − 12 ) e (l + 12 ), se l = 0, e il solo valore j = 12 , se l = 0. Sostituendo l’espressione per r −3 (Eq. (6.20)), si ha ΔE3 =
Z 2 e20 1 2 2 j(j + 1) − l(l + 1) − Z α 2 a0 n 2 n l(l + 1)(2l + 1)
3 4
.
(6.21)
` da notare che, per l = 0, questa espressione risulta indeterminata, essendo E della forma 0/0. Considerazioni pi` u approfondite mostrano che, in tale caso, si deve assumere ΔE3 = 0. Raccogliendo i contributi portati dai tre termini, aggiungendo tale risultato all’energia imperturbata, e distinguendo fra i tre casi possibili, si ottiene, per l’energia dello stato caratterizzato dai numeri quantici n, l, j e mj , l’espressione Z 2 α2 Z 2 e20 1 3 1 + (n − ) , (l = 0) , Enljmj = − 4 2 a0 n 2 n2 Z 2 α2 n Z 2 e20 1 3 − Enljmj = − 1+ , (l = 0 , j = l + 12 ) , 2 a0 n 2 n2 l+1 4 Z 2 α2 n 3 Z 2 e20 1 −4 Enljmj = − 1+ , (l = 0 , j = l − 12 ) . 2a0 n2 n2 l Le tre formule possono essere finalmente raccolte nell’unica
163
ATOMI CON UN SOLO ELETTRONE DI VALENZA
Enljmj
Z 2 α2 n Z 2 e20 1 1+ =− 2 a0 n 2 n2 j+
1 2
−
3 4
.
Questa espressione mostra che l’energia non dipende dal numero quantico mj (come era ovvio attendersi, essendo [ H, jz ] = 0) e che, inoltre, essa dipende soltanto da j (momento angolare totale) ma non da l (momento angolare orbitale). L’espressione inoltre coincide con lo sviluppo in serie al secondo ordine in α2 della soluzione esatta dell’equazione di Dirac per il campo Coulombiano. Tale soluzione, che contiene anche l’energia di riposo mc2 , `e infatti7
Enljmj = m c2 1 +
αZ √ n − k + k 2 − α2 Z 2
2 −1/2 ,
dove k=j+
1 2
.
Come abbiamo gi` a detto, la massa che compare in questa formula `e per`o la massa dell’elettrone e non la sua massa ridotta. Prescindendo da questa differenza, la formula da noi trovata e quella relativa alla soluzione esatta differiscono, per l’atomo di Idrogeno, di una quantit` a dell’ordine di α6 m c2 = α4
e20 . a0
Questa correzione `e cos`ı piccola da essere praticamente inosservabile sperimentalmente (e da confondersi con altre correzioni di cui parleremo in seguito). Per queste ragioni, la formula da noi trovata con la teoria delle perturbazioni pu` o, a tutti gli effetti, essere considerata esatta e non approssimata. Una volta che si tenga conto delle opportune correzioni, la formula `e verificata sperimentalmente con ottima precisione. La struttura dei livelli dell’atomo di Idrogeno risultante dalle correzioni relativistiche, la cosiddetta struttura fine, `e schematicamente illustrata nella Fig. 6.5. I livelli presentano una struttura complessa con l’energia che aumenta, fissato n, all’aumentare di j. Poich´e il valore minimo di j `e 12 , mentre il valore massimo `e n − 12 , la differenza in energia fra i livelli estremi risulta pari a ΔE =
e20 α2 (n − 1) , 2 a0 n 4
e diminuisce rapidamente all’aumentare di n. In termini numerici, se si considera la riga Lyα a 1216 ˚ A, si pu` o osservare che tale riga risulta separata dalla 7
Per la deduzione dell’equazione si veda ad esempio P.A.M. Dirac, The Principles of Quantum Mechanics, 4th Ed., Clarendon Press, Oxford, 1958.
164
CAPITOLO 6
l=0
l=1
l=2
n=4 3/2 1/2
n=3
n=2
5/2 3/2
7/2 5/2
1/2
3/2 1/2
l=3
5/2 3/2
1/2
3/2 1/2
1/2
n=1 1/2
Fig. 6.5. Diagramma di Grotrian della struttura fine dei primi 4 livelli dell’atomo di Idrogeno. Le linee punteggiate rappresentano le energie dei livelli imperturbati, quali risultano dalla teoria non relativistica. Il valore del numero quantico j ` e dato a destra di ciascun livello. Gli intervalli di energia non sono rappresentati in scala.
struttura fine in due componenti che differiscono fra loro di 5.4 m˚ A. Per la riga Lyβ a 1026 ˚ A, si hanno ancora due componenti con una separazione di 1.1 m˚ A. Come abbiamo detto precedentemente, esistono ulteriori correzioni allo spettro dell’atomo di Idrogeno che sono dovute, per un lato, alla presenza dello spin nucleare (struttura iperfine) e, per l’altro lato, a fenomeni di natura puramente quantistica dovuti alla cosiddetta auto-energia (self-energy) dell’elettrone. Alla struttura iperfine `e dedicata una sezione di questo volume (si vedano i Par. 9.8 e 9.9). Per quanto riguarda gli altri fenomeni, accenniamo semplicemente al fatto che essi furono messi in evidenza sperimentalmente da W.E. Lamb nel 1947. Mediante dispositivi spettroscopici di elevata risoluzione si osserva che livelli caratterizzati dagli stessi valori dei numeri quantici n e j, ma da diversi valori di l, hanno energie leggermente diverse (in contraddizione con la teoria di Dirac la quale prevede invece lo stesso valore per l’energia). Ad esempio, per il livello n = 2 dell’atomo di Idrogeno, si osserva, fra il sottolivello l = 0, j = 21 e il sottolivello l = 1, j = 12 , una differenza in energia pari a 1057.8 MHz (per confronto, la differenza in energia fra i sottolivelli l = 1, j = 12 e l = 1, j = 32 `e pari a 10968.6 MHz, ovvero circa un ordine di grandezza pi` u alta).
ATOMI CON UN SOLO ELETTRONE DI VALENZA
165
Questo effetto, che prende il nome di Lamb-shift, si spiega supponendo che l’elettrone in orbita intorno al nucleo esegua delle transizioni “virtuali” (che non conservano l’energia) con emissione di fotoni che vengono immediatamente riassorbiti dall’elettrone medesimo. Bisogna infatti osservare che il principio di indeterminazione di Heisenberg permette, su un tempo piccolo Δt, che la conservazione dell’energia possa essere violata di una quantit`a ΔE data da h ¯ . Δt L’insieme di questi processi virtuali porta a una correzione all’energia dell’elettrone la quale dipende dall’orbita stessa ed `e quindi diversa per stati con l diversi. I calcoli dettagliati, sviluppati da Bethe, sono in ottimo accordo con i valori osservati8 . ΔE
6.5 Spettri dei metalli alcalini Dopo quelli degli atomi idrogenoidi, gli spettri pi` u semplici risultano quelli dei metalli alcalini, ovvero degli elementi che occupano la prima colonna del sistema periodico, insieme alle loro sequenze isoelettroniche (Li, Be + , B++ , . . ., Na, Mg+ , Al++ , . . ., K, Ca+ , Sc++ , . . ., etc.). Questi atomi (ioni) sono caratterizzati dalla presenza di un solo “elettrone di valenza” (elettrone ottico), ovvero di un solo elettrone che ruota pi` u esternamente attorno a una nuvola di carica costituita dal nucleo e dagli altri elettroni. Ammettendo che la nuvola di carica abbia simmetria sferica, i livelli energetici dell’elettrone di valenza si trovano, come per il caso dell’atomo idrogenoide, risolvendo l’equazione stazionaria di Schr¨ odinger in un opportuno potenziale centrale, V (r). Per quanto riguarda la parte angolare le autofunzioni sono sempre date dalle armoniche sferiche, mentre la funzione radiale ridotta, P (r), obbedisce all’Eq. (6.14) che qui riscriviamo h ¯ 2 d2 h ¯ 2 l(l + 1) − P (r) = E P (r) . P (r) + V (r) + 2 m dr2 2 m r2 Un’approssimazione fenomenologica che pu`o essere assunta per V (r) `e la seguente a b V (r) = − − 2 , r r dove a e b sono due costanti. Tale espressione non `e che l’inizio dello sviluppo della funzione V (r) in serie di potenze di 1/r e risulta particolarmente appropriata per i metalli alcalini in quanto, per valori elevati di r, il potenziale 8
Per una discussione approfondita del Lamb-shift si veda H.A. Bethe & E.E. Salpeter, Quantum Mechanics of One- and Two-Electron Atoms, Springer-Verlag, Berlin, etc. 1957.
166
CAPITOLO 6
presenta un andamento Coulombiano (in accordo col fatto che gli elettroni interni schermano completamente la carica del nucleo), mentre, per piccoli valori di r, prevale il termine in r−2 che descrive la riduzione dell’effetto di schermo all’interno della nuvola elettronica. La costante a vale Zr e20 , dove Zr , il cosiddetto numero di carica residua, `e dato da Zr = Z − N e + 1 ,
(6.22)
con Z numero di carica del nucleo e Ne numero totale degli elettroni (Zr = 1 per atomi neutri, 2 per atomi una volta ionizzati, etc.). Per quanto riguarda la costante b, essa pu` o essere posta nella forma b=
h ¯2 β , 2m
con β adimensionale. Con queste posizioni, l’equazione per la funzione radiale ridotta risulta h ¯ 2 d2 h ¯ 2 l (l + 1) Zr e20 − + P (r) = E P (r) , (6.23) P (r) + − 2 m dr2 r 2 m r2 dove il numero reale l , definito implicitamente dall’equazione l (l + 1) = l(l + 1) − β , `e tradizionalmente scritto nella forma l = l − δl , la quantit` a δl essendo detta correzione di Rydberg, oppure difetto quantistico (quantum defect). L’equazione (6.23) pu` o essere risolta, in stretta analogia a quanto fatto nel caso dell’atomo idrogenoide. Eseguiti analoghi cambiamenti di variabile, si trova che, affinch´e la funzione radiale ridotta sia convergente all’infinito, deve essere verificata una relazione analoga a quella dell’Eq. (6.15) con l sostituito da l , ovvero √
(k0 + l + 1) =
√ (k0 + l − δl + 1) = 1 ,
dove k0 `e un intero ≥ 0 che stabilisce l’ordine del polinomio che compare nella funzione d’onda radiale ridotta. Per l’energia si ottiene infine Enl = −
1 Zr2 e20 , 2 a0 (n − δl)2
la quale mostra che le energie degli atomi alcalini, a differenza di quelle degli atomi idrogenoidi, dipendono anche dal numero quantico azimutale l, in quanto δl `e funzione di l. Il numero quantico n qui introdotto `e dato da
ATOMI CON UN SOLO ELETTRONE DI VALENZA
167
n = nr + l + 1 , dove nr , il numero quantico radiale, coincide con k0 . Poich´e nr ≥ 0, anche nel caso degli atomi alcalini si ha quindi l ≤n−1 . In certi casi si preferisce scrivere la formula per le energie nella forma Enl = −
Zr2 e20 1 , 2 a0 n∗2
(6.24)
dove n∗ = n − δl
(6.25)
`e un numero reale che prende il nome di numero quantico effettivo (effective quantum number). La correzione di Rydberg, δl, decresce rapidamente all’aumentare di l. Questo significa che, per l elevato, le energie dei livelli si approssimano sempre pi` u al corrispondente valore idrogenoide. La cosa non `e sorprendente e si interpreta pensando che le orbite con valore di l basso sono quelle pi` u allungate, cio`e quelle che penetrano pi` u profondamente entro la nuvola elettronica centrale (orbite penetranti). Per tali orbite ci si deve quindi attendere un’energia inferiore alla corrispondente energia idrogenoide. Viceversa, per alti valori di l, le orbite sono praticamente circolari e tendono quindi a evitare la zona centrale dell’atomo in cui il potenziale elettrico differisce sostanzialmente dal potenziale Coulombiano. Per tali orbite l’energia coincide quindi col valore idrogenoide. Un’ulteriore differenza rispetto al caso idrogenoide consiste nel fatto che il numero quantico n corrispondente al livello energetico pi` u basso (stato fondamentale) non `e uguale a 1, come per gli atomi idrogenoidi, ma `e uguale a 2 per il Litio, 3 per il Sodio, e cos`ı via. Questa `e una conseguenza del principio di esclusione di Pauli di cui parleremo in seguito (si vedano i Par. 7.1 e 7.7). Il diagramma di Grotrian per l’atomo di Sodio neutro `e rappresentato schematicamente nella Fig. 6.6. In tale figura sono anche riportate le righe appartenenti alle serie pi` u importanti del Na I. Dalla figura appare evidente che si hanno transizioni soltanto fra termini appartenenti a colonne adiacenti. In simboli, indicando con Δl la variazione del numero quantico azimutale nella transizione, si deve avere Δl = ±1 .
(6.26)
Una legge di questo genere viene detta regola di selezione. Nel Cap. 12 vedremo come questa legge possa essere dedotta in maniera rigorosa considerando l’interazione dell’atomo col campo di radiazione. Per il momento ci accontentiamo
168
CAPITOLO 6
s (l=0)
ν 6 5
p (l=1)
d (l=2)
6
f (l=3)
6
6
5
5
5
4
4
4
3
4
3
Na I 3
Fig. 6.6. Diagramma di Grotrian dell’atomo di Sodio neutro. La scala verticale d` a direttamente le energie dei livelli in cm−1 . Il numero quantico principale `e indicato accanto a ciascun livello. La figura mostra anche le varie serie di righe, ovvero le serie principale, sottile, diffusa e fondamentale.
di introdurre la regola di selezione in maniera fenomenologica accennando che essa `e dovuta al fatto che il cosiddetto elemento di matrice di dipolo fra gli stati iniziale e finale della transizione, ovvero l’elemento di matrice ψi | r |ψf
,
`e nullo a meno che non sia verificata la regola (6.26). Naturalmente tale regola di selezione vale non soltanto per lo spettro dell’atomo di Sodio ma per tutti gli spettri degli atomi con un solo elettrone di valenza, compresi gli atomi idrogenoidi. Le prime classificazioni proposte per interpretare lo spettro degli atomi alcalini rendono conto dell’uso spettroscopico di indicare i termini aventi valori di l pari a 0, 1, 2, 3, rispettivamente con le lettere (minuscole) “s”, “p”, “d”, “f ”. Infatti, la cosiddetta serie “principale” `e quella che risulta dalle transizioni fra termini con l = 1 e lo stato fondamentale; essa rende conto della denominazione “p” data ai termini con l = 1. Analogamente la serie “sottile” (sharp), che proviene dalla combinazione dei termini aventi l = 0 con il termine pi` u basso di quelli aventi l = 1, giustifica la denominazione “s” data ai termini con l = 0. Infine, la serie “diffusa”, che connette i termini aventi l = 2 col termine pi` u basso con l = 1, e la serie “fondamentale”, che connette i termini aventi l = 3 col termine pi` u basso con l = 2, rendono conto della denominazione “d” e “f ”
ATOMI CON UN SOLO ELETTRONE DI VALENZA
169
dei termini aventi l = 2 e l = 3, rispettivamente. Per valori di l pi` u elevati si procede poi con le lettere in ordine alfabetico a partire da “g” e con l’esclusione della lettera “j” (riservata, per cos`ı dire, ai momenti angolari) e delle lettere gi`a precedentemente utilizzate, in maniera da stabilire la corrispondenza risultante dal seguente schema
valori di l 0 denominazione s
1 p
2 3 d f
4 g
5 h
6 i
7 k
8 l
9 10 11 12 . . . . m n o q ...
Il gergo della spettroscopia si basa pesantemente sull’utilizzazione di questo codice. Ad esempio, invece di parlare di un elettrone la cui funzione d’onda `e caratterizzata dal numero quantico principale n = 3 e dal numero quantico azimutale l = 1, si parla semplicemente di un elettrone 3p. Il fatto poi che deve essere l ≤ (n − 1) fa s`ı che “esistano” soltanto elettroni 1s, 2s, 2p, 3s, 3p, 3d, e cos`ı via, mentre non esistono, ad esempio, elettroni 1d o elettroni 3f . I risultati teorici ottenuti per gli spettri dei metalli alcalini, condensati nelle Eq. (6.24) e (6.25), possono essere confrontati coi dati spettroscopici di laboratorio. Ad esempio, facendo riferimento allo spettro del Na I, si trova che le energie di tutti i livelli ns si ottengono dalle suddette equazioni (entro un errore inferiore o dell’ordine dell’1%) assumendo per la correzione di Rydberg il valore empirico δl = 1.36. Analogamente, per i livelli np si trova il valore δl = 0.87 e per i livelli nd il valore δl = 0.01. Le considerazioni sin qui svolte sugli spettri dei metalli alcalini hanno fatto astrazione dalla presenza dello spin. Anche per questi atomi si hanno, ovviamente, delle correzioni relativistiche descritte da termini analoghi a quelli visti per il caso dell’atomo idrogenoide. L’effetto del terzo e quarto termine nella parentesi quadra dell’Eq. (5.13), che dipendono soltanto dalla variabile radiale r, `e quello di apportare delle ulteriori correzioni al potenziale centrale (modificando leggermente, ad esempio, la costante β introdotta all’inizio del paragrafo). L’ultimo termine, che pu` o essere adesso riscritto nella forma h ¯2 1 d V (r) 2 · s , 4 m2 c2 r dr provoca invece uno sdoppiamento dei livelli aventi l = 0 (struttura fine). Introducendo il numero quantico j che (per l = 0) pu` o assumere i due valori l + 12 e l − 12 , si pu` o stimare l’intervallo in energia fra i due livelli di struttura fine sfruttando la formula precedentemente dedotta per gli atomi idrogenoidi. Un’applicazione diretta dell’Eq. (6.21) d` a Enlj=l+1/2 − Enlj=l−1/2 =
Z4 e20 2 , α 3 eff 2 a0 n l (l + 1)
170
CAPITOLO 6
dove Zeff rappresenta una sorta di carica nucleare efficace che parametrizza il potenziale nel quale si muove l’elettrone di valenza. Varie formule alternative sono state proposte per migliorare l’accordo di questa formula con i dati sperimentali. A seguito di un’analisi approfondita delle orbite penetranti, `e 4 stato proposto da Land´e di sostituire nella formula precdente il fattore Z eff con 2 2 Z Zr (Zr essendo il numero di carica residua), e di sostituire inoltre il numero quantico n con n∗ . La formula cos`ı modificata risulta quindi Enlj=l+1/2 − Enlj=l−1/2 =
e20 2 Z 2 Zr2 . α ∗3 2 a0 n l (l + 1)
Il confronto con i dati sperimentali mostra un accordo soddisfacente, soprattutto per quanto riguarda l’andamento con il numero quantico azimutale l. La presenza della struttura fine fa s`ı che gli spettri degli atomi alcalini si presentino come “spettri di doppietti”. Particolarmente conosciuto `e il cosiddetto doppietto del Sodio che si origina nella transizione fra il livello n = 3, l = 0 (livello 3s) e il livello n = 3, l = 1 (livello 3p), separato dalla struttura fine in due sottolivelli aventi j = 12 e j = 32 , rispettivamente. Le due righe del doppietto cadono rispettivamente alle lunghezze d’onda (nel vuoto) di 5891.58 e 5897.56 ˚ A, con una separazione di 5.98 ˚ A, ovvero di 17.2 cm−1 . Si noti che la formula dovuta a Land´e applicata al livello 3p d` a per la separazione il valore 36.6 cm−1 , ottenuto ponendo Z = 11, Zr = 1, n∗ = 2.13, l = 1. Questo valore `e circa il doppio di quello osservato sperimentalmente, il che mostra chiaramente i limiti della formula medesima che, in molti casi, pu`o essere utilizzata solo per dare una stima di ordine di grandezza. La formula, sebbene approssimata, illustra comunque una caratteristica fondamentale degli spettri atomici, ovvero che l’interazione spin-orbita aumenta rapidamente all’aumentare di Z.
Capitolo 7
Atomi con pi` u elettroni di valenza Gli spettri degli atomi che presentano un solo elettrone di valenza, considerati nel capitolo precedente, sono relativamente semplici e costituiscono gli unici esempi in cui i livelli energetici possono essere determinati mediante la soluzione di un’equazione di Schr¨ odinger unidimensionale. Quando si passa a trattare atomi che presentano un numero maggiore di elettroni di valenza, le cose si complicano considerevolmente ed `e indispensabile ricorrere a un certo numero di approssimazioni per rendere trattabile matematicamente il problema. Questo capitolo `e dedicato a introdurre le basi fisiche di tali approssimazioni oltre ai relativi concetti che da esse conseguono e che sono alla base della complessa terminologia comunemente utilizzata nella pratica spettroscopica (configurazioni, termini, multipletti, molteplicit` a, numeri quantici, etc.).
7.1 Il principio di esclusione di Pauli Una delle conseguenze pi` u importanti della meccanica quantistica `e il fatto che due particelle della stessa specie (come ad esempio due elettroni, due protoni, due atomi di Idrogeno, etc.) sono in tutto e per tutto indistinguibili dal punto di vista osservativo. Naturalmente, anche restando nell’ambito della fisica classica, non `e certo pensabile che corpuscoli della stessa natura possano portare dei “segni distintivi” che permettano di identificarli. Tuttavia, in fisica classica, `e sempre possibile, almeno in via di principio, seguire un corpuscolo con continuit` a nel tempo in maniera da stabilire con precisione la sua traiettoria ed `e quindi possibile identificarlo anche quando sia entrato in interazione con un corpuscolo della stessa natura. La situazione `e completamente diversa in meccanica quantistica, secondo i cui principi la rappresentazione pi` u adeguata che si pu` o dare di un corpuscolo `e quella di un pacchetto d’onde. Se due pacchetti d’onde che descrivono particelle uguali entrano in interazione fra loro (si pensi ad esempio a un urto fra due elettroni), anche se in seguito tornano a separarsi `e impossibile dire, sia dal punto di vista osservativo che da quello concettuale, quale pacchetto sia da attribuire a un corpuscolo e quale all’altro. D’altra parte, quando si descrive un sistema contenente due o pi` u particelle indistinguibili, `e necessario attribuire alle grandezze fisiche di ciascuna di esse il proprio simbolo matematico. Ad esempio, per un sistema composto di N elettroni, attribuiremo a un elettrone le coordinate (x1 , y1 , z1 ), a un altro
172
CAPITOLO 7
le coordinate (x2 , y2 , z2 ), e cos`ı via. Ovviamente, l’Hamiltoniana, cos`ı come qualsiasi altra osservabile del sistema, deve risultare simmetrica rispetto allo scambio di due qualsiasi degli indici che numerano gli elettroni (altrimenti gli elettroni sarebbero distinguibili!). Se si indica formalmente con Sij l’operatore che, agendo sulle variabili dinamiche del sistema, opera lo scambio delle particelle i e j, si deve avere, per qualsiasi osservabile O, Sij O = O . Per la funzione d’onda la situazione `e diversa in quanto la fase di tale funzione non `e una quantit` a osservabile. La condizione di invarianza rispetto allo scambio di due particelle non va quindi imposta alla funzione d’onda, bens`ı al suo modulo quadro. Se |ψ `e (in notazione di Dirac) la funzione d’onda complessiva del sistema di N particelle, la condizione di invarianza per il modulo quadro `e soddisfatta se Sij |ψ = e i α |ψ
,
dove α `e un numero reale arbitrario. D’altra parte, se si applica due volte l’operatore di scambio, la funzione d’onda deve ritornare a essere se stessa, per cui si deve avere Sij Sij |ψ = e 2 i α |ψ = |ψ
.
Si ottiene quindi e i α = ±1 , per cui, Sij = ±1 . Le funzioni d’onda per le quali vale il segno pi` u sono dette simmetriche (rispetto allo scambio delle particelle), mentre quelle per le quali vale il segno meno sono dette antisimmetriche. D’altra parte, dall’equazione di Schr¨ odinger segue che il tipo di simmetria di una funzione d’onda `e costante nel tempo. Infatti, la variazione infinitesima d|ψ nel tempo dt `e data da d|ψ =
1 H|ψ dt , ih ¯
ed essa ha lo stesso carattere di simmetria della |ψ dato che l’Hamiltoniana `e simmetrica rispetto allo scambio di due particelle. L’esperienza mostra che le particelle aventi spin nullo, oppure intero, hanno funzioni d’onda simmetriche, mentre quelle aventi spin semi-intero hanno funzioni d’onda antisimmetriche. Le prime sono dette particelle di Bose-Einstein,
` ELETTRONI DI VALENZA ATOMI CON PIU
173
o, pi` u semplicemente bosoni, le seconde sono dette particelle di Fermi-Dirac, o fermioni. Trattiamo adesso il caso particolare di N particelle identiche non interagenti e vediamo come, in questo caso, si possa esprimere la funzione d’onda del sistema complessivo per mezzo delle funzioni d’onda di particella singola. Per un tale sistema, indicando genericamente con xi l’intero set di coordinate (incluse eventualmente le coordinate di spin) della particella i-esima, l’Hamiltoniana `e uguale alla somma di N Hamiltoniane di particella singola, tutte uguali fra loro H(x1 , x2 , . . . , xN ) =
N
H(xi ) .
i=1
Indichiamo inoltre con ψa (x) le autofunzioni dell’Hamiltoniana H(x), e con Ea i corrispondenti autovalori H(x) ψa (x) = Ea ψa (x) . Come `e facile verificare, la funzione Ψ(a1 , a2 , . . . , aN ) = ψa1(x1 ) ψa2(x2 ) · · · ψaN(xN ) `e autofunzione dell’Hamiltoniana totale e corrisponde all’autovalore (Ea1 + Ea2 + · · · + EaN ), ovvero H(x1 , x2 , . . . , xN ) Ψ(a1 , a2 , . . . , aN ) = (Ea1 +Ea2 +· · ·+EaN ) Ψ(a1 , a2 , . . . , aN ) . Tuttavia questa funzione non soddisfa, salvo casi particolari, i requisiti richiesti di simmetria. La soluzione simmetrica si ottiene mediante un’operazione detta di simmetrizzazione ΨS (a1 , a2 , . . . , aN ) = NS P {ψa1(x1 ) ψa2(x2 ) · · · ψaN(xN )} , P
dove P `e l’operatore di permutazione delle coordinate delle particelle e dove la somma `e estesa a tutte le permutazioni possibili. NS `e poi una costante di normalizzazione da determinare in modo che | ΨS |2 = 1. Analogamente la soluzione antisimmetrica si ottiene mediante un’operazione detta di antisimmetrizzazione ΨA (a1 , a2 , . . . , aN ) = NA
(−1)P P {ψa1(x1 ) ψa2(x2 ) · · · ψaN(xN )} ,
(7.1)
P
dove il fattore di segno (−1)P vale ±1 a seconda che la permutazione considerata sia pari o dispari. Ad esempio, dalla funzione d’onda ψa (x1 )ψb (x2 )ψc (x3 ),
174
CAPITOLO 7
la quale rappresenta uno stato (del sistema complessivo) in cui la particella 1 occupa lo stato (di particella singola) a, la particella 2 lo stato b, e la particella 3 lo stato c, si ottiene la funzione d’onda antisimmetrica ΨA (a, b, c) = NA [ψa (x1 ) ψb (x2 ) ψc (x3 ) + ψa (x2 ) ψb (x3 ) ψc (x1 ) + ψa (x3 ) ψb (x1 ) ψc (x2 ) − ψa (x2 ) ψb (x1 ) ψc (x3 ) − ψa (x1 ) ψb (x3 ) ψc (x2 ) − ψa (x3 ) ψb (x2 ) ψc (x1 )] . Questa autofunzione descrive adesso uno stato (del sistema complessivo) in cui una particella (senza specificare quale) occupa lo stato (di particella singola) a, un’altra lo stato b e l’ultima lo stato c. Solo l’autofunzione antisimmetrizzata descrive uno stato fisico (ovviamente se le particelle considerate sono fermioni), mentre l’autofunzione di partenza non descrive uno stato fisico in quanto essa implica la distinguibilit` a delle particelle. L’operazione di antisimmetrizzazione si pu` o anche ottenere mediante la valutazione del determinante (detto determinante di Slater) di un’opportuna matrice ⎛ ⎞ ψa1(x1 ) ψa2(x1 ) · · · ψaN(x1 ) ⎜ ψ (x ) ψ (x ) · · · ψ (x ) ⎟ a2 2 aN 2 ⎟ ⎜ a 2 ΨA (a1 , a2 , . . . , aN ) = NA Det⎜ 1 ⎟ . ⎝ ··· ··· ··· ··· ⎠ ψa1(xN ) ψa2(xN ) · · · ψaN(xN ) Ricordando le regole dello sviluppo di un determinante, la propriet` a di antisimmetria della funzione d’onda rispetto allo scambio di due particelle risulta correlata al fatto che il determinante di una matrice cambia di segno se si scambiano fra loro due righe qualsiasi. Dalle medesime regole segue anche che, se si vuol ottenere una funzione d’onda non identicamente nulla, gli stati di particella singola a1 , a2 , . . . , aN , devono essere tutti distinti. In caso opposto si otterrebbe infatti una matrice avente due o pi` u colonne uguali e il relativo determinante risulterebbe nullo. Quanto abbiamo qui mostrato `e un’illustrazione del principio scoperto empiricamente da Pauli e che prende il nome di principio di esclusione o principio di Pauli: in un sistema composto da pi` u fermioni, ogni stato quantico pu` o essere occupato al pi` u da un fermione, ovvero, ogni fermione deve possedere un set di numeri quantici diverso dal set di qualsiasi altro fermione. Tale principio si pu` o anche enunciare facendo riferimento al cosiddetto concetto di numero di occupazione che `e, per definizione, il numero di particelle che condividono lo stesso stato quantico di particella singola. Nel caso dei fermioni, il numero di occupazione pu`o essere soltanto 0 oppure 1. Invece, nel caso dei bosoni, tale numero non `e soggetto ad alcuna limitazione. Osserviamo infine che il fattore di normalizzazione introdotto nelle formule precedenti risulta (se le singole ψai (x) sono normalizzate)
` ELETTRONI DI VALENZA ATOMI CON PIU
NS = (N ! m1 ! m2 ! · · ·)−1/2
175
per il caso simmetrico , per il caso antisimmetrico ,
NA = (N !)−1/2
dove, nel caso dei bosoni, m1 , m2 , · · · , sono i numeri di occupazione degli stati occupati dalle particelle.
7.2 L’Hamiltoniana non relativistica: buoni numeri quantici Consideriamo un atomo (o ione) composto da N elettroni mobili intorno a un nucleo centrale avente numero di carica Z. Trascurando le correzioni relativistiche, l’Hamiltoniana totale del sistema di elettroni si scrive nella forma H=
2 N 2 Ze20 e0 pi − + , 2 m r r i i=1 i<j ij
(7.2)
dove ri `e il vettore posizione (riferito al nucleo) dell’elettrone i-esimo, pi `e l’impulso del medesimo elettrone e dove rij `e il modulo della distanza dell’elettrone i-esimo dall’elettrone j-esimo, ovvero rij = rji = |ri − rj | . Il primo termine dell’Hamiltoniana rappresenta il contributo dell’energia cinetica e dell’energia potenziale dei singoli elettroni nel campo del nucleo, mentre il secondo termine rappresenta l’energia dovuta alla repulsione Coulombiana degli elettroni. Allo scopo di risolvere l’equazione agli autovalori per l’Hamiltoniana H, `e opportuno determinare preliminarmente gli operatori che commutano con essa in modo da stabilire un set di numeri quantici che possono essere assegnati in spin tutta generalit` a agli stati atomici. Consideriamo anzitutto l’operatore S, totale, definito da = S
N
sk ,
k=1
dove sk `e lo spin dell’elettrone k-esimo. Poich´e abbiamo considerato l’Hamiltoniana in approssimazione non relativistica, essa non contiene alcun operatore di spin e si ha evidentemente [H , sk ] = 0 , da cui
176
CAPITOLO 7
]=0 . [H , S definito Per quanto riguarda l’operatore momento angolare orbitale totale, L, da N = L k , k=1
la situazione `e diversa in quanto il momento angolare orbitale della singola particella, k , non commuta con l’Hamiltoniana a causa della presenza del termine di interazione Coulombiana fra gli elettroni. Si ha infatti 1 [H , k ] = e20 , k . rij i<j Alla somma contribuiscono solo i termini nei quali uno dei due indici (i oppure j) `e uguale a k, per gli altri termini il commutatore essendo banalmente nullo. Si ha quindi 1 2 [H , k ] = e0 , k . rik i =k
Il commutatore pu` o essere valutato tenendo conto della definizione dell’operatore k (si veda l’Eq. (6.8)) e tenendo conto che, introdotto il simbolo grad(k) per denotare l’operatore gradiente rispetto alle coordinate del k-esimo elettrone, si ha grad(k)
1 1 ri − rk = = grad(k) . 3 rik |ri − rk | rik
Si ottiene quindi, con facili passaggi [H , k ] = i e20
rk × ri i =k
3 rik
.
Se per` o si somma su tutti gli elettroni, ovvero se si considera il commutatore dell’Hamiltoniana col momento angolare orbitale totale, si ottiene ] = i e20 [H , L
rk × ri k
i =k
3 rik
=0 ,
in quanto nella somma compaiono coppie di prodotti vettoriali (rk ×ri e ri ×rk ) che si annullano. che con L, definito l’operatore Visto che l’Hamiltoniana commuta sia con S momento angolare totale J nella forma
` ELETTRONI DI VALENZA ATOMI CON PIU
J =
177
N +S , k + sk = L k=1
si ha ovviamente [H , J ] = 0 . Infine, un ultimo operatore che commuta con l’Hamiltoniana `e l’operatore parit` a, P, che effettua l’inversione di tutte le coordinate degli elettroni rispetto all’origine. Dato che l’Hamiltoniana `e funzione soltanto delle distanze degli elettroni dal nucleo, ri , e delle distanze reciproche degli elettroni, rij , essa non cambia a seguito di tale inversione e si ha quindi [H , P ] = 0 . Poich´e l’operatore parit` a ha per quadrato l’identit` a i suoi autovalori possono essere soltanto 1 oppure −1. Gli stati del primo tipo sono detti “pari” (even); quelli del secondo tipo “dispari” (odd )1 . Riassumendo, abbiamo visto come l’Hamiltoniana H commuti con un certo numero di operatori. Conseguentemente, agli autovalori di H, ovvero agli stati atomici, possono essere assegnati i corrispondenti numeri quantici. La convenzione standard utilizzata in spettroscopia `e quella di individuare gli stati atomici con i simboli S, P , D, etc., a seconda che il numero quantico L sia 0, 1, 2, e cos`ı via. L `e il numero quantico connesso all’operatore momento angolare nel senso che l’autovalore dell’operatore L2 vale L(L + 1). La orbitale totale L, corrispondenza fra lettere e numeri `e la stessa di quella gi`a menzionata per il caso del momento angolare di particella singola, ovvero valori di L 0 denominazione S
1 P
2 D
3 F
4 5 G H
6 I
7 K
8 L
9 M
10 11 12 · · · . N O Q ···
Per lo spin si usa la convenzione di porre come apice, a sinistra della lettera corrispondente a L, il valore (2S + 1), pari alla molteplicit` a dovuta allo spin; S `e il numero quantico connesso allo spin totale, nel senso che l’autovalore dell’operatore S 2 vale S(S + 1). Si hanno cos`ı, per S = 0, gli stati 1S, 1P , 1D, etc., per S = 1/2, gli stati 2S, 2P , 2D, e cos`ı via. Tali simboli si leggono rispettivamente “singoletto esse”, “singoletto pi”, “singoletto di”, “doppietto esse”, “doppietto pi”, “doppietto di”, e si continua con i “tripletti”, i “quartetti”, i “quintetti”, etc.. A destra della lettera corrispondente a L si pone poi, come indice, il valore di J, dove, al solito, J `e il numero quantico che corrisponde 1
Per le autofunzioni di particella singola la parit` a` e data da (−1)l dove l ` e il numero quantico azimutale. Questa propriet` a ` e contenuta nell’Eq. (6.11). L’operatore parit` a corrisponde infatti alla trasformazione θ → π − θ, φ → φ + π.
178
CAPITOLO 7
al momento angolare totale nel senso che l’autovalore dell’operatore J 2 vale J(J + 1). Infine, per quanto riguarda l’operatore parit` a, si contrassegnano gli stati dispari (aventi autovalore −1) con una lettera “o” minuscola (che sta per “odd ”) posta come apice a destra della lettera corrispondente a L. La denomio nazione completa di uno stato atomico pu`o quindi risultare, ad esempio, 6F3/2 , 3 che si legge “sestetto effe tre mezzi dispari”, oppure D3 , che si legge “tripletto di tre (pari)”. Questa maniera di contrassegnare gli stati energetici `e diretta conseguenza della propriet` a di commutazione dell’Hamiltoniana H con gli operatori L 2 , S 2 , 2 J , e P. Tale Hamiltoniana non `e tuttavia completa in quanto abbiamo totalmente trascurato le correzioni relativistiche. Come vedremo in seguito, l’introduzione delle correzioni relativistiche fa s`ı che L e S cessino di essere buoni numeri quantici e provoca la necessit` a di introdurre degli schemi di accoppiamento approssimati (accoppiamento L-S, accoppiamento j-j, accoppiamento intermedio). Tali argomenti saranno trattati nel Cap. 9.
7.3 L’approssimazione del campo centrale L’analisi degli spettri degli atomi complessi si basa sull’introduzione di un potenziale centrale nel quale, in prima approssimazione, si pu`o pensare che ciascun elettrone si muova per effetto delle interazioni elettrostatiche dovute al nucleo e a tutti gli altri elettroni. Questa approssimazione prende il nome di “approssimazione del campo centrale”. Formalmente, l’approssimazione consiste nel separare l’Hamiltoniana H dell’Eq. (7.2) in due termini: un termine di ordine zero, H0 , che definisce le energie e le autofunzioni di base, e un termine di perturbazione, H1 , da trattare nello spirito della teoria delle perturbazioni. In formule, si pone H = H0 + H1 , dove
H1 =
N 2 pi + Vc (ri ) , H0 = 2m i=1
(7.3)
2 N e0 Ze20 −Vc (ri ) − + . r r i i=1 i<j ij
(7.4)
La quantit` a Vc (r) qui introdotta rappresenta l’energia dell’elettrone nel potenziale centrale di cui sopra. Quanto pi` u la funzione Vc (r) `e ben scelta, tanto pi` u `e verificata la diseguaglianza
` ELETTRONI DI VALENZA ATOMI CON PIU
179
H1 H0 , e tanto pi` u `e quindi giustificato applicare la teoria delle perturbazioni al primo ordine. La determinazione della funzione Vc (r) costituisce un problema matematico di notevole complessit`a che pu` o essere risolto solo attraverso metodi numerici approssimati. Due di questi metodi, ovvero il metodo statistico di ThomasFermi, e il metodo variazionale, perfezionato in seguito nel metodo autoconsistente di Hartree-Fock, sono descritti nei paragrafi seguenti. A priori, `e solo possibile stabilire quali debbano essere le condizioni al contorno per Vc (r). Se infatti si pone Z(r) e20 , r dobbiamo attenderci che la Z(r) si comporti asintoticamente nella forma Vc (r) = −
lim Z(r) = Z ,
r→0
lim Z(r) = Zr ,
r→∞
dove Zr `e il numero di carica residua introdotto nell’Eq. (6.22) (Zr = 1 per ` importante sottolineare atomi neutri, 2 per atomi una volta ionizzati, etc.). E che gran parte delle considerazioni che svolgeremo in seguito risultano praticamente indipendenti dalla forma esplicita del campo centrale. La conoscenza dettagliata della funzione Vc (r) `e necessaria solo quando si vogliano stabilire gli aspetti pi` u propriamente quantitativi degli spettri atomici.
7.4 Il metodo di Thomas-Fermi Il primo metodo sviluppato per determinare il potenziale centrale di un atomo complesso `e il cosiddetto metodo statistico di Thomas-Fermi. Trattandosi di un metodo statistico esso risulta tanto pi` u appropriato quanto pi` u alto `e il numero di elettroni, e quindi quanto pi` u `e elevato il numero di carica Z del nucleo. Si consideri un atomo neutro composto da un nucleo avente numero di carica Z e da Z elettroni. Si supponga inoltre che gli elettroni abbiano una distribuzione spaziale a simmetria sferica e si indichi con n(r) il numero di elettroni per unit` a di volume. Il potenziale elettrostatico dovuto al nucleo centrale e alla nuvola elettronica `e anch’esso a simmetria sferica e obbedisce all’equazione di Poisson (3.4) ∇2 φ(r) = 4π e0 n(r) , con le condizioni al contorno
(7.5)
180
CAPITOLO 7
φ(r) =
Ze0 , r
r φ(r) = 0 ,
per r → 0 , per r → ∞ .
(7.6)
Consideriamo adesso gli elettroni che si trovano in un elemento di volume dV a distanza r dal nucleo. All’elettrone avente impulso p compete l’energia totale, Et , data da Et =
p2 − e0 φ(r) , 2m
e, affinch´e tale elettrone risulti legato all’atomo, bisogna che tale quantit`a sia negativa, il che implica che l’impulso deve essere in modulo inferiore al valore pmax dato da pmax =
# 2 m e0 φ(r) .
Ammettendo che gli elettroni siano il pi` u possibile impacchettati, senza violare tuttavia il principio di esclusione di Pauli, possiamo pensare che essi occupino tutti gli stati a loro disposizione con impulso minore di pmax . Il numero di elettroni dN che occupano l’elemento di volume dV e che hanno impulso compreso fra 0 e pmax si pu` o valutare calcolando l’estensione dello spazio delle fasi a loro disposizione e dividendo tale espressione per h3 , dove h `e la costante di Planck. Tenendo conto anche dello spin (che contribuisce a moltiplicare per un fattore 2 il volume dello spazio delle fasi), si ottiene dN =
8π 3 p dV . 3 h3 max
Sostituendo il valore di pmax trovato precedentemente, si giunge alla seguente relazione che collega n(r) con φ(r) n(r) =
dN 1 [2 m e0 φ(r)]3/2 . = dV 3π 2 h ¯3
Se adesso sostituiamo questa espressione nell’Eq. (7.5), otteniamo l’equazione differenziale per il potenziale φ(r) ∇2 φ(r) = C [φ(r)]3/2 , dove
√ 5/2 8 2 e0 m3/2 C= . 3π h ¯3
Questa equazione pu`o essere trasformata in un’equazione adimensionale ponendo
` ELETTRONI DI VALENZA ATOMI CON PIU
φ(r) =
181
Ze0 χ(r) , r
dove χ(r) `e una nuova funzione che, per le condizioni al contorno (7.6), deve soddisfare le condizioni χ(0) = 1 e χ(r → ∞) = 0. Ricordando l’espressione dell’operatore Laplaciano in coordinate sferiche (Eq. (6.7)) si ottiene r1/2
d2 χ(r) = C [χ(r)]3/2 , dr2
dove C = C (Ze0 )
1/2
√ 8 2 Z 1/2 e30 m3/2 = . 3π h ¯3
Infine, ponendo r = b x, con x adimensionale, determiniamo la costante b in modo da rendere l’equazione differenziale il pi` u semplice possibile. Questo si ottiene per b = C −2/3 , ovvero 2/3 1 3π b= Z −1/3 a0 = 0.885341 Z −1/3 a0 , 2 4 dove a0 `e il raggio della prima orbita di Bohr. Con queste posizioni si ottiene per χ(x) l’equazione differenziale (detta equazione di Thomas-Fermi) x1/2
d2 χ = χ3/2 . dx2
Questa equazione differenziale si pu`o risolvere numericamente partendo da x = 0, dove χ(0) = 1, assegnando un valore di prova alla derivata χ (0) e procedendo poi per x crescenti. Il valore che porta alla corretta condizione al contorno all’infinito (χ(∞) = 0) `e χ (0) = −1.588558 , e la soluzione corrispondente `e mostrata nel grafico della Fig. 7.1. La soluzione dell’equazione di Thomas-Fermi si presta alla determinazione dell’energia totale di ionizzazione di un atomo neutro, ovvero all’energia necessaria per rimuovere tutti gli elettroni e portarli a distanza infinita dal nucleo. Il metodo `e quello di calcolare l’energia elettrostatica dovuta alla distribuzione totale di carica Eelett e di applicare il teorema del viriale per asserire che l’energia di legame dell’atomo `e pari a met` a dell’energia elettrostatica stessa. Indicando con Elegame tale energia (misurata in valore assoluto) si ha Elegame = − 12 Eelett , ovvero
182
CAPITOLO 7
Fig. 7.1. Soluzione dell’equazione di Thomas-Fermi.
Elegame =
1 4
Z
e20
∞
0
1 4π r2 n(r) dr + e0 r
∞
2
φ(r) 4π r n(r) dr
,
0
dove il primo integrale a secondo membro rappresenta l’energia elettrostatica dovuta all’interazione della nuvola elettronica col nucleo, mentre il secondo integrale rappresenta quella dovuta all’interazione mutua della nuvola elettronica. Sostituendo le espressioni per φ(r) e per n(r) e introducendo la variabile x, si ottiene, per mezzo di alcuni passaggi algebrici Elegame =
4 3π
2/3
e20 7/3 Z 2 a0
0
∞
(1 + χ) χ3/2 dx . x1/2
Tenendo conto dell’equazione differenziale di Thomas-Fermi, l’integrale pu` o esser valutato per mezzo di integrazioni per parti (si veda l’Eq. (A7.4)). Esso vale − 12 7 χ (0), per cui, ricordando il valore di χ (0)
Elegame = −
12 7
4 3π
2/3 e2 e2 χ (0) Z 7/3 0 = 1.53796 Z 7/3 0 = 20.9 Z 7/3 eV . 2 a0 2 a0
L’andamento con la potenza 7/3 di Z `e ben verificato dai dati spettroscopici. Per i primi elementi del sistema periodico si trova tuttavia che i dati sono meglio rappresentati da un coefficiente numerico dell’ordine di 16 invece di 20.9.
` ELETTRONI DI VALENZA ATOMI CON PIU
183
Questa discrepanza non `e sorprendente se si ricorda che il metodo statistico di Thomas-Fermi `e soprattutto appropriato per trattare atomi con Z elevato. ` necessario infine sottolineare che il metodo statistico di Thomas-Fermi forE nisce il valore per il potenziale φ(r) dovuto al nucleo e a tutti gli elettroni piuttosto che l’energia potenziale Vc (r) da introdurre nell’approssimazione del potenziale centrale. Quest’ultima quantit` a `e in effetti l’energia potenziale nel quale si muove l’elettrone nel campo creato dal nucleo e da tutti gli altri elettroni (lui escluso, naturalmente). La questione della connessione fra φ(r) e Vc (r) pu` o essere risolta solo in modo approssimato. Nei loro lavori, Fermi e collaboratori hanno spesso utilizzato per Vc (r) la seguente espressione Vc (r) = −
e20 (Z − 1) e20 − χ(r/b) . r r
7.5 Il metodo variazionale e il metodo di Hartree-Fock Il metodo variazionale `e principalmente utilizzato per determinare, spesso in maniera approssimata, l’autovalore e l’autofunzione del livello fondamentale di un sistema atomico. Tuttavia esso pu` o essere opportunamente generalizzato per estendere tali calcoli anche ai livelli eccitati. L’idea che sta alla base del metodo `e la seguente: consideriamo un sistema atomico descritto dall’Hamiltoniana H e siano |n i suoi autostati ed En i corrispondenti autovalori. Ricordando che l’insieme degli autovettori |n costituisce una base ortogonale e completa, se |ψ `e l’autofunzione normalizzata che descrive uno stato fisico arbitrario del sistema, essa pu` o essere sviluppata nella forma |ψ =
cn |n
.
n
Il valore di aspettazione dell’Hamiltoniana su tale stato `e quindi dato da H = ψ| H |ψ =
| cn |2 En .
n
Se indichiamo con E0 il minimo degli autovalori En , essendo En ≥ E0 , si ha H ≥ E0
| cn |2 = E0 .
n
Il metodo variazionale consiste nel calcolare il valore di aspettazione H usando delle funzioni d’onda di prova dipendenti da un certo numero di parametri e nel variare poi tali parametri fino a trovare il valore minimo, H min .
184
CAPITOLO 7
Il valore cos`ı trovato rappresenta un valore per eccesso dell’energia dello stato fondamentale del sistema, E0 , e risulta tanto pi` u vicino al valore vero quanto migliore `e la scelta delle funzioni d’onda di prova e dei parametri che le descrivono. Analogamente, la funzione d’onda che corrisponde ai valori dei parametri che minimizzano H rappresenta una funzione d’onda approssimata per lo stato fondamentale del sistema. Applichiamo il metodo variazionale al calcolo dell’energia dello stato fondamentale dell’Elio e degli ioni appartenenti alla sua sequenza isoelettronica (H− , He, Li+ , Be++ , etc.)2 . L’Hamiltoniana di tali sistemi `e H=
p2 Ze20 Ze20 e2 p21 + 2 − − + 0 , 2m 2m r1 r2 r12
(7.7)
dove Z = 1 per lo ione di Idrogeno negativo H− , Z = 2 per l’Elio, Z = 3 per il Li+ , e cos`ı via. Come funzione di prova assumiamo il prodotto di due autofunzioni (una per ciascun elettrone), entrambe relative allo stato fondamentale dell’atomo idrogenoide corrispondente al numero di carica z, dove z `e il parametro da variare. Poich´e ciascuno dei due elettroni contribuisce a schermare parzialmente la carica del nucleo, dobbiamo attenderci che z < Z. Ricordando le Eq. (6.19) e (6.13), poniamo ψ(r1 , r2 ; z) =
z 3 −z (r1 +r2 )/a0 e . π a30
(7.8)
Osserviamo per inciso che questa funzione `e simmetrica nello scambio dei due elettroni e che sembra quindi violare il principio di esclusione. Effettivamente, come vedremo meglio in seguito, il suo corretto carattere di simmetria si ottiene moltiplicandola per una funzione di spin antisimmetrica. Poich´e per` o lo spin non interviene nel problema che stiamo trattando, possiamo disinteressarci di questa complicazione. Introdotta la funzione di prova, dobbiamo calcolare i valori di aspettazione dell’Hamiltoniana (7.7) su tale funzione. Ricordando l’espressione dell’operatore Laplaciano in coordinate sferiche (Eq. (6.7)), questo conduce al calcolo di integrali della forma ∞ 1 d 2 d −z r/a0 I1 = r e e−z r/a0 r2 dr , r2 dr dr 0 ∞ 1 I2 = e−z r/a0 e−z r/a0 r2 dr , r 0 1 −z (r1 +r2 )/a0 I3 = d3r1 d3r2 e−z (r1 +r2 )/a0 e . r12 2
H− ` e lo ione Idrogeno negativo, ovvero ` e un atomo di Idrogeno con un elettrone supplementare. Tale ione `e stabile e costituisce una causa di opacit` a importante nelle atmosfere stellari (si veda il Par. 14.6).
` ELETTRONI DI VALENZA ATOMI CON PIU
185
I primi due integrali si calcolano facilmente e danno per risultato a0 , 4z
I1 = −
I2 =
a20 . 4 z2
Il calcolo del terzo integrale `e pi` u complesso e comporta l’utilizzazione di un’espressione che ci risulter`a necessaria anche in seguito (si veda il Par. 8.4). Indicando con Θ l’angolo formato fra i vettori r1 e r2 , per il teorema di Carnot si ha 1 1 =# 2 , r12 r1 − 2 r1 r2 cosΘ + r22 e, indicando con r> e r< , rispettivamente, la maggiore e la minore delle due distanze r1 e r2 , 1 = r12
1
$ r>
2 . r r< 1 − 2 r< cosΘ + r> >
Se si tiene adesso presente la formula che definisce la funzione generatrice delle funzioni di Legendre ∞ 1 # = Pn (μ) xn 1 − 2μx + x2 n=0
(|x| ≤ 1) ,
si ottiene l’espressione ∞ n r< 1 = Pn (cos Θ) . n+1 r12 r n=0 >
(7.9)
Sostituendo questa espressione nell’integrale, ed eseguendo l’integrazione sugli angoli polari dei due elettroni, si vede facilmente, per le propriet`a delle funzioni di Legendre, che contribuisce all’integrale il solo termine con n = 0. Si ottiene quindi3 ∞ ∞ 1 −2z (r1 +r2 )/a0 2 2 I3 = 16π 2 dr1 dr2 e r1 r2 , r> 0 0 ed eseguendo l’integrale con metodi elementari si ottiene I3 = 3
5π 2 a50 . 8 z5
Nel caso che stiamo considerando, in cui le funzioni d’onda degli elettroni sono a simmetria sferica, questa espressione per l’integrale I3 si pu` o anche ottenere, pi` u direttamente, attraverso semplici considerazioni basate sul teorema di Gauss.
186 Ione Valori calcolati (eV) Valori osservati (eV) Errore (%)
CAPITOLO 7
H−
He
Li+
Be++
B3+
C4+
N5+
O6+
−0.74 0.75 –
23.1 24.6 6.1
74.0 75.6 2.1
152.2 153.8 1.0
257.6 259.3 0.7
390.2 392.0 0.5
550.0 551.9 0.3
736.9 739.1 0.3
Tab. 7.1. Potenziale di ionizzazione dell’atomo di Elio e della sua sequenza isoelettronica.
Infine, sostituendo i valori trovati per gli integrali, si ottiene il valore di aspettazione dell’Hamiltoniana sulle funzioni di prova H =
e20 2 (z − 2 Zz + a0
5 8
z) .
Il primo termine in parentesi `e il contributo dell’energia cinetica, il secondo quello dell’interazione Coulombiana degli elettroni col nucleo, e il terzo quello dell’interazione Coulombiana fra i due elettroni. Nello spirito del metodo delle variazioni dobbiamo cercare il valore di z che minimizza H . Tale valore `e presto trovato uguagliando a zero la derivata di H rispetto a z. Il minimo si trova per z=Z−
5 16
,
e si ottiene H
min
=−
e20 Z− a0
5 2 16
.
5 La corrispondente autofunzione `e data dall’Eq. (7.8) con z sostituito da (Z− 16 ). Il risultato ora ottenuto permette di determinare il potenziale di ionizzazione dell’atomo di Elio (e della sua sequenza isoelettronica). Tale potenziale `e infatti dato dall’equazione
I+ H
min
=−
e20 2 Z , 2 a0
dove il secondo membro rappresenta l’energia dell’elettrone nello stato fondamentale dello ione risultante dalla ionizzazione. Sostituendo il valore di H min si ottiene I=
e20 2 5 Z − 4Z + 2 a0
25 128
.
Il confronto con i dati spettroscopici `e riportato nella Tab. 7.1. La tabella mostra che, astraendo dallo ione H− , per il quale il calcolo fornisce un valore negativo dell’energia di legame, i risultati del calcolo variazionale (ottenuti con una funzione di prova contenente un solo parametro libero) sono
` ELETTRONI DI VALENZA ATOMI CON PIU
187
relativamente accurati, soprattutto all’aumentare di Z. Ovviamente si possono ottenere risultati migliori introducendo funzioni di prova pi` u sofisticate. Con tali funzioni si trova, ad esempio, che lo ione H− `e effettivamente stabile (si veda il Par. 14.6). Una volta ottenuta la funzione d’onda dello stato fondamentale, il calcolo variazionale pu` o essere esteso alla determinazione dei livelli energetici aventi energia maggiore. Ad esempio, per ottenere l’energia del primo livello eccitato, `e sufficiente calcolare il valore di aspettazione dell’Hamiltoniana su stati descritti da funzioni di prova (dipendenti da uno o pi` u parametri) ortogonali rispetto alla funzione d’onda del livello fondamentale. Il minimo del valore di aspettazione ottenuto al variare dei parametri fornisce un limite superiore per l’energia del primo livello eccitato. Il metodo variazionale, che abbiamo qui illustrato con un semplice modello per l’atomo a due elettroni, `e anche utilizzato per trovare i livelli energetici di atomi complessi costituiti da un numero elevato di elettroni. In prima approssimazione tali atomi vengono descritti dall’Hamiltoniana non relativistica dell’Eq. (7.2). Per tali atomi si adotta una funzione d’onda di prova, Ψ, contenente un certo numero di parametri liberi e si calcola il valore di aspettazione dell’Hamiltoniana su tale funzione d’onda H = Ψ|H|Ψ
.
I parametri vengono poi variati fino ad ottenere il minimo per H . Le prime applicazioni numeriche di questo tipo si ebbero agli inizi degli anni 1930 ad opera soprattutto di Hartree. In questi primi lavori, la funzione di prova `e data semplicemente dal prodotto di N funzioni d’onda di particella singola, senza nessun tentativo di antisimmetrizzazione. Le funzioni d’onda di particella singola sono inoltre scelte in maniera tale da essere ortogonali fra loro e normalizzate. Una volta determinate le “migliori” funzioni d’onda col metodo variazionale si procede poi a trovare la densit`a di carica (calcolata sommando i moduli quadri delle funzioni d’onda di particella singola) e a risolvere l’equazione di Poisson (3.4) per determinare il potenziale φ(r). Dal potenziale φ(r) si passa poi all’energia potenziale Vc (r) attraverso delle espressioni approssimate simili a quelle viste nel paragrafo precedente e si risolve l’equazione di Schr¨ odinger stazionaria per trovare delle nuove funzioni d’onda di particella singola. Tali funzioni d’onda vengono di nuovo parametrizzate e si ripete il procedimento fino a trovare una soluzione autoconsistente del problema. I lavori di Hartree sono stati successivamente generalizzati da parte di diversi autori (fra cui in particolare Fock) per tener conto dell’indistinguibilit` a delle particelle. Il risultato `e una teoria complessa che `e oggi nota col nome di teoria di Hartree-Fock. La teoria spiega in maniera quantitativa la struttura dei livelli energetici degli atomi pi` u semplici e costituisce in ogni caso il punto di partenza per sviluppare interpretazioni pi` u sofisticate basate, in generale, sulla teoria delle perturbazioni.
188
CAPITOLO 7
7.6 Configurazioni L’Hamiltoniana di ordine zero, H0 , che abbiamo introdotto nell’approssimazione del campo centrale, `e costituita dalla somma di N Hamiltoniane formalmente uguali e indipendenti fra loro (si veda l’Eq. (7.3)). Per trovare i suoi autovalori e autovettori `e sufficiente risolvere l’equazione di Schr¨ odinger per l’Hamiltoniana di particella singola. Tenendo conto anche dello spin, la soluzione di tale equazione risulta caratterizzata da quattro numeri quantici n, l, m, e ms , ovvero ψnlmms =
1 Pnl (r) Ylm (θ, φ) χms , r
(7.10)
o assudove Ylm (θ, φ) `e l’armonica sferica, χms `e l’autofunzione di spin che pu` mere una delle due espressioni 0 1 , , oppure 1 0 a seconda che la proiezione dello spin lungo l’asse di quantizzazione sia 12 oppure − 12 , rispettivamente, e dove Pnl (r) `e la soluzione dell’equazione di Schr¨odinger radiale h ¯ 2 d2 h ¯ 2 l(l + 1) Pnl (r) = W0 (n, l)Pnl (r) , − Pnl (r) + Vc (r) + 2 m dr2 2 m r2
(7.11)
Vc (r) essendo il potenziale centrale e W0 (n, l) l’autovalore dell’energia, che dipende soltanto dai due numeri quantici n e l. I quattro numeri quantici n, l, m, e ms obbediscono alle solite restrizioni viste a proposito degli atomi idrogenoidi e dei metalli alcalini, ovvero n≥l+1 ,
|m| ≤ l ,
ms = ± 12 .
A proposito della prima diseguaglianza bisogna dire che, per un potenziale Vc (r) arbitrario, il significato del numero quantico principale n `e connesso al numero dei nodi (senza contare l’origine) della funzione d’onda radiale. Tale numero `e infatti dato da (n − l − 1). Con le autofunzioni di particella singola possiamo costruire le autofunzioni dell’Hamiltoniana H0 . Esse saranno caratterizzate da N set di numeri quantici a1 , a2 , . . . , aN , ciascun set ai essendo costituito dalla quaterna di numeri quantici (ni , li , mi , msi ). A tale autofunzione compete l’autovalore W0 =
i
W0 (ni , li ) ,
(7.12)
` ELETTRONI DI VALENZA ATOMI CON PIU
189
che dipende soltanto dai numeri quantici n e l, ma non dipende da m e ms . La conseguenza di questo fatto `e che esistono in generale diverse autofunzioni distinte che corrispondono al medesimo autovalore dell’Hamiltoniana H0 . Gli stati fisici corrispondenti formano, nel loro insieme, una cosiddetta configurazione che pu`o essere specificata assegnando il numero di elettroni contraddistinti dalla coppia di numeri quantici n e l, ovvero, pi` u sinteticamente, il numero di elettroni che occupano l’orbitale (nl). Nelle notazioni tipiche della spettroscopia una configurazione si designa brevemente con la scrittura n1 l1q1 n2 l2q2 . . . nk lkqk ,
& dove qi `e il numero di elettroni che occupano l’orbitale (ni li ), con i qi = N . Ad esempio, una possibile configurazione di un atomo con 5 elettroni `e la seguente 1s2 2s2 2p , nella quale, come `e consuetudine, si `e omesso l’esponente 1 all’orbitale 2p. I set completi di numeri quantici, ai , non possono tuttavia essere arbitrari. Infatti, a causa del principio di esclusione di Pauli, il set ai deve differire dal set aj (con i = j) per almeno uno dei numeri quantici n, l, m, ms . Questo fa s`ı che esistano delle restrizioni sul numero di elettroni che possono occupare un determinato orbitale. Dalle disuguaglianze scritte sopra si ha infatti che in un orbitale l si possono trovare al massimo Ql elettroni, dove Ql = 2 (2l + 1) . Cos`ı, ad esempio, in un orbitale s si possono trovare al massimo due elettroni, in un orbitale p sei elettroni, in un orbitale d dieci elettroni, e cos`ı via, dimodoch´e un’ipotetica configurazione quale 1s3 2s2 non rappresenta alcuno stato fisico (in quanto viola il principio di esclusione di Pauli). Un importante concetto riguardo alle configurazioni `e quello di parit` a, concetto che avevamo gi`a incontrato parlando delle autofunzioni di particella singola. Per l’autofunzione di particella singola, la parit`a `e data da (−1)l , dove l `e il numero quantico azimutale. Tale concetto si generalizza in maniera molto semplice alle configurazioni. La parit` a di una configurazione `e infatti data da & P = (−1) i li , e rappresenta il fattore per il quale viene moltiplicata la funzione d’onda di un qualsiasi stato appartenente alla configurazione per inversione delle coordinate degli elettroni rispetto all’origine. Le configurazioni si distinguono in configurazioni pari oppure dispari. Ad esempio, la configurazione 1s2 2s2 2p2 `e una configurazione pari (P = 1), mentre la configurazione 1s2 2s 2p3 `e una configurazione dispari (P = −1).
190
CAPITOLO 7
Un altro importante concetto `e quello di degenerazione. Assegnata una configurazione, ci possiamo chiedere quale sia il numero di stati quantici distinti a essa corrispondenti. Per trovare tale numero si pu` o ragionare nel modo seguente. Assegnato l’orbitale (nl), ovvero, come si usa dire, assegnata una sottozona (appartenente alla zona n), sia qnl il numero di elettroni in essa presenti. A ciascuno di tali elettroni pu`o essere assegnata una qualsiasi coppia di numeri quantici (m, ms ), in maniera per`o che ciascuna coppia differisca dalle altre per almeno uno dei due numeri quantici. Poich`e le coppie distinte sono in numero Ql , il numero di possibilit` a `e dato dalle combinazioni semplici di qnl oggetti della classe Ql . Per la degenerazione si ha quindi - Ql g= , qnl nl
dove il prodotto `e steso a tutti i valori possibili dei numeri quantici n e l e dove abbiamo introdotto il simbolo di coefficiente binomiale definito da n! n = (0 ≤ m ≤ n) . m m! (n − m)! A proposito di questa formula giova osservare che, essendo n n =1 , =1 , 0 n `e inutile considerare esplicitamente i contributi provenienti sia dalle cosiddette sottozone chiuse (quelle con qnl = Ql ) che dalle cosiddette sottozone vuote (quelle con qnl = 0). Ad esempio, per la configurazione 1s2 2s2 2p4 , si pu` o valutare la degenerazione tenendo conto soltanto della sottozona aperta 2p, e si ottiene 6 = 15 . g= 4 Inoltre, dalla propriet` a dei coefficienti binomiali n n , = n−m m segue una regola di simmetria secondo la quale, ad esempio, la degenerazione della configurazione nd4 `e uguale a quella della configurazione nd6 , etc.. Infine si pu` o osservare che la degenerazione di una configurazione dipende criticamente dal fatto che gli elettroni siano “equivalenti” oppure “non equivalenti”, ovvero che essi abbiano, a parit` a di l, valori uguali oppure diversi di
` ELETTRONI DI VALENZA ATOMI CON PIU
191
n. Ad esempio, consideriamo la configurazione 1s2 2s2 2p 3p 4p. Per tale configurazione, la degenerazione (dovuta ai tre elettroni p non equivalenti) `e data da 6 6 6 = 216 . · · g= 1 1 1 Invece, per la configurazione 1s2 2s2 2p2 3p, in cui si hanno due elettroni p equivalenti e uno non equivalente, si ha 6 6 = 90 , · g= 1 2 mentre per la configurazione 1s2 2s2 2p3 , con tre elettroni p equivalenti la degenerazione vale 6 = 20 . g= 3 Come si vede, la degenerazione diminuisce rapidamente all’aumentare del numero di elettroni equivalenti, un’ovvia conseguenza del principio di esclusione di Pauli.
7.7 Il principio di formazione del sistema periodico Il principio di esclusione di Pauli e l’approssimazione del campo centrale sono alla base del cosiddetto principio di formazione, col quale si riescono a comprendere, anche se non sempre in maniera quantitativa, le propriet` a fondamentali del sistema periodico degli elementi. Il principio consiste nel procedere a un’immaginaria “costruzione” degli atomi, considerati sempre nel loro stato fondamentale, partendo dall’atomo di Idrogeno e aggiungendo, volta per volta, un elettrone e una carica positiva al nucleo. Come sappiamo, l’atomo di Idrogeno nel suo stato fondamentale ha un solo elettrone nella sottozona 1s. Aggiungendo un elettrone e una carica positiva al nucleo, si ottiene l’atomo di Elio, nel quale i due elettroni possono entrambi “coabitare” nella sottozona 1s; ovviamente, lo stato 1s dell’atomo di Elio `e diverso dallo stato 1s dell’atomo di Idrogeno, dato che il potenziale centrale (approssimato) nel quale si muovono gli elettroni dell’Elio `e diverso dal potenziale puramente Coulombiano dell’atomo di Idrogeno. La configurazione che compete allo stato fondamentale dell’Elio, la cosiddetta configurazione normale, `e quindi 1s2 . Con l’atomo di Elio si chiudono sia la sottozona che la zona (che in questo caso coincidono, essendo n = 1). Le zone vengono comunemente disegnate con lettere maiuscole dell’alfabeto, a partire dalla lettera K e procedendo
192
CAPITOLO 7
in ordine alfabetico, secondo la convenzione dello schema seguente n 1 denominazione K
2 3 L M
4 5 6 N O P
7 Q
... . ...
Con l’atomo di Elio si chiude quindi la zona K. Passando all’atomo successivo, ovvero al Litio, l’elettrone “aggiunto”, deve andare a occupare uno stato della zona L. In questa zona si hanno sia orbitali s che orbitali p, ma ai primi compete energia minore perch´e le orbite sono pi` u penetranti (si ricordi la discussione del Par. 6.5 a proposito dei metalli alcalini). L’elettrone si dispone quindi nella sottozona 2s, e la sua autofunzione radiale `e molto pi` u “espansa” dell’autofunzione radiale dei due elettroni interni che occupano la zona K. Se si ricordano infatti i risultati dell’atomo idrogenoide, il valor medio della distanza radiale r relativo a uno stato 2s `e 4 volte pi` u grande del corrispondente valore per uno stato 1s, e, in questo caso, il rapporto risulta ancora maggiore perch´e gli elettroni interni risentono di una carica efficace pi` u elevata (una stima basata sulle considerazioni svolte nel 5 Par. 7.5 porta un ulteriore fattore 3 − 16 2.7, col che il rapporto assume un valore dell’ordine di 11). La conseguenza di questo fatto `e che il Litio presenta un elettrone pi` u debolmente legato degli altri, con un potenziale di ionizzazione di 5.4 eV (da confrontare col valore di 13.6 eV per l’Idrogeno e di 24.5 per l’Elio). Siccome le propriet` a chimiche degli elementi dipendono soltanto dagli elettroni periferici (elettroni di valenza od ottici), si comprende facilmente la ragione per cui il Litio `e un elemento chimicamente attivo con tendenza a cedere facilmente un elettrone (elemento monovalente). L’atomo successivo `e il Berillio, con configurazione normale 1s2 2s2 , al quale segue il Boro con configurazione normale 1s2 2s2 2p. Il Boro d` a inizio a un “periodo” di 6 elementi nel quale si riempie in maniera sempre pi` u completa la sottozona 2p. Si hanno cos`ı gli atomi di Carbonio, Azoto, Ossigeno, Fluoro e Neon. Col Neon, la cui configurazione normale `e 1s2 2s2 2p6 , si chiude sia la sottozona 2p che la zona L. Gli elementi con i quali si arriva a completare la sottozona p mostrano, dal punto di vista chimico, scarsissima tendenza a combinare con altri elementi. Essi sono detti gas nobili o gas inerti, e, dal punto di vista fisico, sono caratterizzati da elevati potenziali di ionizzazione. La stabilit` a chimica `e dovuta al fatto che una sottozona chiusa comporta una “nuvola” di carica elettronica caratterizzata da un’esatta simmetria sferica, conseguenza di una propriet` a delle armoniche sferiche l m=−l
2
|Ylm (θ, φ)| =
2l +1 , 4π
(indipendente da θ e φ) .
Inoltre, gli elettroni appartenenti a una sottozona p chiusa sono difficilmente eccitabili, in quanto devono essere portati su orbitali relativamente lontani in energia (l’orbitale 3s, ad esempio, nel caso del Neon). Questo non si verifica
` ELETTRONI DI VALENZA ATOMI CON PIU
193
invece per gli elementi relativi a sottozone s chiuse, come ad esempio il Berillio (per i quali rimane comunque vera la propriet` a di simmetria sferica della carica). Nel caso del Berillio, `e relativamente facile eccitare un elettrone 2s portandolo all’orbitale 2p e questo spiega la sua maggiore reattivit` a chimica rispetto a un elemento come il Neon. Dopo che si `e completata una zona, si ricomincia con un elemento contenente un elettrone debolmente legato, poi con due elettroni, tre elettroni, etc., legati sempre meno debolmente, fino ad arrivare nuovamente a una zona completa avente la massima stabilit`a. Da questo fatto risulta evidente l’origine della periodicit` a di quelle propriet` a degli elementi che dipendono dagli elettroni esterni, come il comportamento chimico e quello spettroscopico. Nella Tab 7.2 sono riportate le configurazioni elettroniche normali osservate di tutti gli elementi fino all’Uranio (Z = 92). Per evitare inutili ripetizioni, la configurazione `e data a meno delle configurazioni dei gas nobili precedenti. Ad esempio, la configurazione normale del Sodio che si legge in tabella `e 3s. La configurazione effettiva si ottiene facendo precedere a questo simbolo le configurazioni dell’Elio e del Neon quali si leggono in tabella, cos`ı da ottenere 1s2 2s2 2p6 3s. Dalla tabella si vede che il processo di “costruzione” degli atomi procede regolarmente fino al riempimento totale della sottozona 3p con l’Argon (Z = 18). Arrivati all’Argon, si potrebbe pensare che, a partire dall’elemento successivo, si cominci a riempire la sottozona 3d. Si ha invece un’inversione, nel senso che gli orbitali 4s si riempiono prima di quelli 3d. Questo non `e affatto incomprensibile se si ricorda che la correzione di Rydberg, di cui abbiamo parlato a proposito degli spettri dei metalli alcalini, `e tanto pi` u importante quanto pi` u alta `e la carica nucleare. L’effetto di penetrazione fa s`ı che l’energia dell’elettrone sull’orbita 4s sia pi` u bassa dell’energia sull’orbita 3d che `e praticamente circolare. La sottozona 3d comincia quindi a riempirsi dopo la sottozona 4s. Si ottiene cos`ı una serie di 10 elementi che va dallo Scandio (Z = 21) allo Zinco (Z = 30). Dopo lo Zinco si riempie la sottozona 4p e si procede poi lungo il tracciato illustrato nella Fig.7.2, nel quale ciascun “passo” `e contrassegnato dal numero atomico dell’elemento col quale si inizia il riempimento della sottozona successiva. Bisogna notare che, in questo processo di riempimento successivo delle sottozone, si verificano alcune irregolarit`a. Ad esempio, quando col Bario (Z = 56) si `e riempita la sottozona 6s, si passa al riempimento della sottozona 5d e si ha cos`ı il Lantanio con configurazione normale (esterna) 5d 6s2 . A questo punto, invece di proseguire con la sottozona 5d, si salta, per cos`ı dire, alla sottozona 4f e si ottiene una serie di 14 elementi, dal Cerio (Z = 58) al Lutezio (Z = 71), con propriet`a simili a quelle del Lantanio (famiglia delle terre rare o dei lantanidi). Successivamente torna a riempirsi la sottozona 5d. Una cosa del tutto analoga si verifica con le sottozone 6d e 5f . Il corrispondente del Lantanio `e l’Attinio (Z = 89) mentre il corrispondente della famiglia dei lantanidi `e la famiglia degli attinidi.
194
CAPITOLO 7
Z
Si.
Elemento
Configuraz.
Z
Si.
Elemento
Configuraz.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46
H He Li Be B C N O F Ne Na Mg Al Si P S Cl Ar K Ca Sc Ti V Cr Mn Fe Co Ni Cu Zn Ga Ge As Se Br Kr Rb Sr Y Zr Nb Mo Tc Ru Rh Pd
Idrogeno Elio Litio Berillio Boro Carbonio Azoto Ossigeno Fluoro Neon Sodio Magnesio Alluminio Silicio Fosforo Zolfo Cloro Argon Potassio Calcio Scandio Titanio Vanadio Cromo Manganese Ferro Cobalto Nichel Rame Zinco Gallio Germanio Arsenico Selenio Bromo Krypton Rubidio Stronzio Ittrio Zirconio Niobio Molibdeno Tecnezio Rutenio Rodio Palladio
1s 1s2 2s 2s2 2s2 2p 2s2 2p2 2s2 2p3 2s2 2p4 2s2 2p5 2s2 2p6 3s 3s2 3s2 3p 3s2 3p2 3s2 3p3 3s2 3p4 3s2 3p5 3s2 3p6 4s 4s2 3d 4s2 3d2 4s2 3d3 4s2 3d5 4s 3d5 4s2 3d6 4s2 3d7 4s2 3d8 4s2 3d10 4s 3d10 4s2 3d10 4s2 4p 3d10 4s2 4p2 3d10 4s2 4p3 3d10 4s2 4p4 3d10 4s2 4p5 3d10 4s2 4p6 5s 5s2 4d 5s2 4d2 5s2 4d4 5s 4d5 5s 4d5 5s2 4d7 5s 4d8 5s 4d10
47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92
Ag Cd In Sn Sb Te I Xe Cs Ba La Ce Pr Nd Pm Sm Eu Gd Tb Dy Ho Er Tm Yb Lu Hf Ta W Re Os Ir Pt Au Hg Tl Pb Bi Po At Rn Fr Ra Ac Th Pa U
Argento Cadmio Indio Stagno Antimonio Tellurio Iodio Xenon Cesio Bario Lantanio Cerio Presodimio Neodimio Promezio Samario Europio Gadolinio Terbio Disprosio Olmio Erbio Tullio Itterbio Lutezio Afnio Tantalio Wolframio Renio Osmio Iridio Platino Oro Mercurio Tallio Piombo Bismuto Polonio Astazio Radon Francio Radio Attinio Torio Protoattinio Uranio
4d10 5s 4d10 5s2 4d10 5s2 5p 4d10 5s2 5p2 4d10 5s2 5p3 4d10 5s2 5p4 4d10 5s2 5p5 4d10 5s2 5p6 6s 6s2 5d 6s2 4f 5d 6s2 4f 3 6s2 4f 4 6s2 4f 5 6s2 4f 6 6s2 4f 7 6s2 4f 7 5d 6s2 4f 9 6s2 4f 10 6s2 4f 11 6s2 4f 12 6s2 4f 13 6s2 4f 14 6s2 4f 14 5d 6s2 4f 14 5d2 6s2 4f 14 5d3 6s2 4f 14 5d4 6s2 4f 14 5d5 6s2 4f 14 5d6 6s2 4f 14 5d7 6s2 4f 14 5d9 6s 4f 14 5d10 6s 4f 14 5d10 6s2 4f 14 5d10 6s2 6p 4f 14 5d10 6s2 6p2 4f 14 5d10 6s2 6p3 4f 14 5d10 6s2 6p4 4f 14 5d10 6s2 6p5 4f 14 5d10 6s2 6p6 7s 7s2 6d 7s2 6d2 7s2 5f 2 6d 7s2 5f 3 6d 7s2
Tab. 7.2. Configurazione elettronica normale degli elementi. La configurazione `e data a meno delle configurazioni dei gas nobili che precedono l’elemento nella Tabella. Per alcuni elementi si presentano delle eccezioni rispetto alle “regole” enunciate nel testo. La configurazione normale del Cromo, ad esempio, che dovrebbe essere 3d4 4s2 , ` e invece 3d5 4s.
195
` ELETTRONI DI VALENZA ATOMI CON PIU
1s 3
2s
5
2p 11
3s
13
3p
19
21
4s
3d 31
4p 37
5s
39
4d 49
5p 55
6s
57
6p
4f 58 72
5d
5f
5g
6d
6f
6g
6h
7d
7f
7g
7h
81
90
87 89
7s
7p
7i
Fig. 7.2. Tracciato schematico che illustra il riempimento successivo delle sottozone secondo il principio di formazione del sistema periodico degli elementi. Ciascun passo da sottozona a sottozona ` e contrassegnato dal numero atomico dell’elemento col quale si inizia il riempimento della sottozona successiva.
Altre irregolarit` a minori si incontrano qua e l` a, soprattutto durante il riempimento delle sottozone d oppure f . Come si deduce dalla Tab 7.2, tali irregolarit` a si verificano per gli elementi Cromo, Rame, Niobio, Molibdeno, Rutenio, Rodio, Palladio, Argento, Gadolinio, Platino, Oro e Torio. La configurazione normale (esterna) dell’Oro, ad esempio, `e 4f 14 5d10 6s, invece di essere 4f 14 5d9 6s2 .
7.8 Configurazioni di elettroni eccitati Attraverso il principio di formazione abbiamo trovato la configurazione elettronica che compete a tutti gli elementi del sistema periodico nel loro stato fondamentale, ovvero la cosiddetta configurazione normale. L’eccitazione di uno o pi` u elettroni a orbitali di energia maggiore d` a luogo a ulteriori configurazioni. Consideriamo ad esempio l’atomo di Carbonio, avente configurazione normale 1s2 2s2 2p2 . L’eccitazione di uno o pi` u elettroni pu` o portare a confi-
196
CAPITOLO 7
gurazioni varie, come ad esempio 1s 2s2 2p3 1s2 2s 2p2 3s 1s2 2s2 3s 3p 1s2 2s2 2p 3d
eccitazione di un elettrone 1s a 2p , eccitazione di un elettrone 2s a 3s , eccitazione dei due elettroni 2p a 3s e 3p , eccitazione di un elettrone 2p a 3d .
Le configurazioni risultanti dall’eccitazione di elettroni interni (appartenenti cio`e a zone o sottozone chiuse), come la prima e la seconda di quelle elencate sopra, corrispondono in generale a energie molto maggiori dell’energia della configurazione normale e le righe che provengono dalle relative transizioni vanno a cadere nella regione dei raggi ultravioletti duri o dei raggi X. I relativi spettri vengono osservati in laboratorio per lo pi` u come spettri in assorbimento. Le configurazioni che si originano dall’eccitazione di due o pi` u elettroni esterni, come la terza dell’elenco, sono responsabili della comparsa dei cosiddetti termini anomali. Tali termini costituiscono, come dice il loro stesso nome, una anomalia e sono osservati raramente e solo in condizioni particolari. Di gran lunga pi` u importanti sono invece le configurazioni che si originano dall’eccitazione di un solo elettrone appartenente alla sottozona aperta, come la quarta dell’elenco. Praticamente tutte le righe dello spettro visibile e del vicino ultravioletto di un dato elemento si originano da transizioni fra una configurazione di questo tipo e la configurazione normale oppure fra due configurazioni di questo tipo. Come abbiamo visto nel Par. 7.6, una configurazione corrisponde a un numero g di stati quantici diversi, descritti dalle funzioni d’onda Ψ(a1 , a2 , . . . , aN ), autofunzioni degeneri dell’Hamiltoniana H0 . Considerando delle opportune combinazioni lineari di tali funzioni d’onda `e possibile costruire delle nuove quantit` a che risultano autofunzioni, oltre che dell’Hamiltoniana H0 , anche di un set di operatori che commutano con H0 e che commutano fra loro. Il set pi` u appropriato `e costituito, nella maggior parte dei casi, dagli operatori L 2 , Lz , S 2 e Sz . Sorge quindi il problema di stabilire, per un’assegnata configurazione, quali siano i possibili autostati di tali operatori e, pi` u in particolare, a quali valori dei numeri quantici L e S essi corrispondano singolarmente. Si suol dire in questi casi che si vanno a cercare i termini di tipo L-S (o termini tout court) che si originano da una data configurazione. Per risolvere questo problema `e per` o necessario ricordare alcuni risultati della teoria del momento angolare.
7.9 Richiami della teoria del momento angolare In meccanica quantistica il momento angolare `e definito come un operatore le cui tre componenti cartesiane, Jx , Jy , e Jz , soddisfano le regole vettoriale, J, di commutazione
197
` ELETTRONI DI VALENZA ATOMI CON PIU
[Ji , Jj ] =
i ijk Jk ,
k
che possono essere condensate nell’unica identit` a operatoriale J × J = i J . Da queste propriet`a di commutazione si ottiene che ciascuna componente del momento angolare commuta col suo modulo quadro, ovvero [J , J 2 ] = 0 . A partire dalle due equazioni precedenti si pu` o impostare il problema della ricerca degli autovalori e degli autovettori del momento angolare assumendo come set massimo di operatori commutanti il modulo quadro e una qualsiasi ad esempio la componente Jz . Il risultato delle tre componenti del vettore J, `e che gli autovettori possono essere individuati da due numeri quantici, j e m tali che j pu` o assumere soltanto valori interi o semi-interi non negativi (0, 12 , 1, 3 o assumere solo uno dei (2j + 1) valori (−j, −j + 1, 2 , etc.), e, fissato j, m pu` . . ., j − 1, j). Indicati tali autovettori (normalizzati) col simbolo |j, m , gli autovalori sono dati da J 2 |j, m = j(j + 1) |j, m
,
Jz |j, m = m |j, m
.
Le fasi relative degli autovettori sono poi fissate stabilendo, per convenzione, che gli elementi di matrice dei cosiddetti operatori di shift, J± = Jx ± iJy , siano reali, ovvero che sia j, m ± 1|J± |j, m =
# # j(j + 1) − m(m ± 1) = (j ± m + 1)(j ∓ m) .
Si considerino adesso due operatori di momento angolare, J1 , e J2 , commutanti fra loro. Si pu` o facilmente mostrare che l’operatore somma dei due momenti angolari, J = J1 + J2 , soddisfa le regole di commutazione caratteristiche dei momenti angolari ed `e quindi, esso stesso, un momento angolare nel senso della meccanica quantistica. Per la descrizione degli autostati comuni dei due momenti angolari si possono utilizzare due diverse rappresentazioni (o basi). Una prima base `e quella dei quattro operatori commutanti J12 , J1z , J22 , J2z . Se |j1 , m1 sono gli autovettori di J1 e |j2 , m2 sono quelli di J2 , gli autovettori di questa base sono dati dal prodotto diretto |j1 , m1 |j2 , m2 e possono essere indicati col simbolo compatto |j1 j2 m1 m2 . Per essi si ha
198
CAPITOLO 7
J12 |j1 j2 m1 m2 = j1 (j1 +1)|j1 j2 m1 m2 ,
J1z |j1 j2 m1 m2 = m1 |j1 j2 m1 m2 ,
J22 |j1 j2 m1 m2 = j2 (j2 +1)|j1 j2 m1 m2 ,
J2z |j1 j2 m1 m2 = m2 |j1 j2 m1 m2 .
un’altra base `e invece quella dei quattro operatori commutanti J12 , J22 , J 2 , Jz , i cui autovettori sono indicati col simbolo |j1 j2 JM , e sono tali che J12 |j1 j2 JM
= j1 (j1 + 1)|j1 j2 JM
J 2 |j1 j2 JM
= J(J + 1)|j1 j2 JM
, ,
J22 |j1 j2 JM
= j2 (j2 + 1)|j1 j2 JM
Jz |j1 j2 JM
= M |j1 j2 JM
,
.
Poich´e le due basi descrivono il medesimo spazio vettoriale, esiste una trasformazione di similitudine che connette una base all’altra. Si ha quindi |j1 j2 JM
=
|j1 j2 m1 m2
j1 j2 m1 m2 |j1 j2 JM
,
(7.13)
m1 m2
|j1 j2 m1 m2 =
|j1 j2 JM
j1 j2 JM |j1 j2 m1 m2
.
(7.14)
JM
I coefficienti che compaiono in queste trasformazioni, qui scritti nella forma di prodotti scalari, sono detti coefficienti di Wigner o, pi` u spesso, coefficienti di Clebsh-Gordan. Tali coefficienti sono identicamente nulli a meno che non sia M = m 1 + m2 , e a meno che J non sia uguale a uno qualsiasi dei possibili valori J = |j1 − j2 |, |j1 − j2 | + 1, . . . , j1 + j2 − 1, j1 + j2 . La dimostrazione della prima condizione si ottiene facilmente considerando il prodotto scalare j1 j2 m1 m2 |J1z + J2z |j1 j2 JM
,
e facendo agire l’operatore J1z + J2z = Jz alternativamente sul “bra” oppure sul “ket”. Si ottiene (m1 + m2 − M ) j1 j2 m1 m2 |j1 j2 JM
=0 ,
la quale mostra che, affinch´e il coefficiente di Clebsh-Gordan sia diverso da zero, deve necessariamente essere M = m1 + m2 . La dimostrazione della seconda condizione `e invece pi` u complessa e verr` a data in seguito.
199
` ELETTRONI DI VALENZA ATOMI CON PIU
In luogo dei coefficienti di Clebsh-Gordan si considerano spesso, soprattutto nei lavori pi` u moderni, i cosiddetti simboli 3-j, introdotti da Wigner e definiti dall’equazione
j1 j2 m1 m2 |j1 j2 JM
= (−1)
j1 −j2 +M
√ 2J + 1
j1 m1
j2 m2
J −M
.
(7.15)
L’espressione esplicita dei simboli 3-j (e quindi quella dei coefficienti di ClebshGordan) pu` o essere trovata attraverso un calcolo laborioso. Definendo in maniera opportuna le fasi relative dei vettori delle due basi, i simboli 3-j (e i coefficienti di Clebsh-Gordan) risultano reali e sono dati dall’espressione4
1 = (−1)a−b+γ √ abαβ|abcγ = (−1)a−b+γ Δ(a, b, c) 2c + 1 # × (a + α)!(a − α)!(b + β)!(b − β)!(c + γ)!(c − γ)! (−1)ν a b α β
c −γ
ν
×[(a−α−ν)! (c−b+α+ν)! (b+β−ν)! (c−a−β+ν)! ν! ( a+b−c−ν)!] −1 , (7.16) dove l’indice ν assume tutti i valori che danno luogo a fattoriali aventi significato (ovvero non negativi), e dove il simbolo Δ(a, b, c) `e definito da % (a + b − c)! (a + c − b)! (b + c − a)! . (7.17) Δ(a, b, c) = (a + b + c + 1)! I simboli 3-j soddisfano alcune importanti propriet` a che sono qui di seguito enunciate senza dimostrazione (ovviamente, i coefficienti di Clebsh-Gordan soddisfano propriet` a analoghe): a) Il simbolo 3-j
a b α β
c γ
`e nullo a meno che non sia α + β + γ = 0 e a meno che a, b e c non soddisfino la diseguaglianza triangolare (|a − b| ≤ c ≤ a + b). b) Relazioni di completezza e di ortonormalit` a a b c a b c = δcc δγγ , (2c + 1) (7.18) α β γ α β γ αβ
4
Questa formula, dovuta a G. Racah (Physical Review 62, 438, [1942]), `e particolarmente simmetrica nello scambio dei tre momenti angolari a, b e c. Per la deduzione di una formula equivalente, ma meno simmetrica, si veda ad esempio E. Landi Degl’Innocenti & M. Landolfi, Polarization in Spectral Lines, Kluwer Acad. Publ., Dordrecht, 2004.
200
CAPITOLO 7
z
J
2
m2
J
M=m 1 + m 2
J1
m1
Fig. 7.3. Fissati m1 e m2 , l’estremo del vettore J, risultante di j1 e j2 , pu` o trovarsi su un punto qualsiasi della circonferenza disegnata in alto. Il vettore J non ` e quindi determinato univocamente.
cγ
(2c + 1)
a α
b β
c γ
a α
b β
c γ
= δαα δββ .
c) Cambiando di segno le componenti della seconda riga, il simbolo 3-j risulta moltiplicato per il fattore di segno (−1)a+b+c a b c a b c = (−1)a+b+c . (7.19) −α −β −γ α β γ d) Scambiando fra loro due qualsiasi colonne, il simbolo 3-j risulta moltiplicato per lo stesso fattore (−1)a+b+c . Ad esempio a b c b a c = (−1)a+b+c . (7.20) α β γ β α γ I coefficienti di Clebsh-Gordan hanno un’interpretazione fisica immediata. Il loro modulo quadro, ovvero la quantit` a | j1 j2 m1 m2 |j1 j2 JM |2 , `e, secondo i principi della meccanica quantistica, la probabilit` a che, dati due sistemi per i quali si siano misurati separatamente i quadrati del momento angolare, trovando rispettivamente i valori j1 (j1 +1) e j2 (j2 +1), e le componenti dei momenti lungo l’asse z, trovando i valori m1 e m2 , la misura del quadrato del momento
201
` ELETTRONI DI VALENZA ATOMI CON PIU
m2
¡
¡
£¢
l
l
l
l
m
m
m
l
l m
²
² ³
³
µ´
µ´
·¶
l
l
l
l
m
m
m
m
·¶
£¢
¹¸
¥¤
¹¸
F
F
F
F
G
G
G
G
F
~
~
§¦
ȼ
F
¥¤
ȼ
½¼
F
F
F
G
G
G
D
D
D
E
E
E
À
À
æ
æ
Á
ç
ç
D
D
D
D
E
E
E
E
ô õ
÷ö
÷ö
Â
 Ã
Ã
x
x
y
y
Ö ×
ÙØ
6
6
6
6
7
7
7
7
{z
éè
B
B
B
B
C
C
C
C
P Q
{z
8
8
8
8
9
9
9
9
óò
óò
B
B
B
B
C
C
C
C
ÏÎ
ÏÎ
ÑÐ
ÑÐ
ÓÒ
ÓÒ
ÕÔ
ÕÔ
ML
ML
ON
ON
ed
ed
32
32
ÇÆ
ÉÈ
ÉÈ
ËÊ
ËÊ
ÍÌ
@
@
@
@
A
A
A
A
@
@
@
@
A
A
A
A
ÍÌ
>
>
>
>
?
?
?
?
ßÞ
áà
áà
ãâ
>
>
>
>
?
?
?
?
v
v
J
w
w
K
ãâ
UT
WV
H
H
%
%
kj
kj
I
WV
I
YX
'
'
n
n
n
n
n
o
o
o
o
o
M=j 1 + j 2 M=j 1 + j − 1 2 M=j 1 + j − 2
n o
p
p
p
p
p
p
p
q
q
q
q
q
q
q
r
r
r
r
r
r
r
s
s
s
s
s
s
s
J K
<
<
<
<
=
=
=
=
YX
<
<
<
<
=
=
=
=
[Z
[Z
]\
]\
_^
_^
a`
a`
cb
)(
)(
+*
+*
-,
-,
/.
/.
10
cb
:
:
:
:
;
;
;
;
:
f g
}|
ñð
:
f g
}|
ñð
ÇÆ
UT
8 9
ïî
ÅÄ
ih
8 9
ïî
ÅÄ
SR
8 9
íì
ÿþ
ih
8 9
íì
ÿþ
SR
4 5
ëê
<
P
4 5
ëê
éè
<
Q
4 5
ýü
ßÞ
4 5
n o
±°
ýü
ÝÜ
4 5
ûú
ÝÜ
4 5
4
4 5
ûú
ÛÚ
±°
4 5
ùø
ÛÚ
¯®
ùø
ÙØ
6 7
>
Ö
6 7
4
6 7
>
×
¯®
6 7
@
ä å
¬
@
ä å
¬
¿¾
B
ô õ
ǻ
2
D E
B
0
ǻ
¿¾
Á
½¼
©¨
8
D
©¨
8
F G
D
§¦
10
:
:
:
:
;
;
;
;
t
t
t
t
t
t
t
u
u
u
u
u
u
u
M= j −j 1
0
2
m1
Fig. 7.4. Diagramma schematico che illustra come varia il numero di stati aventi un valore di M assegnato al variare di M stesso. Il diagramma si riferisce al caso particolare in cui j 1 ` e uguale a 5 e j2 ` e uguale a 4.
angolare del sistema complessivo dia per risultato J(J + 1) e la misura della componente z dia per risultato M . Come si vede dalla Fig.7.3, il risultato di una simile misura non `e univoco neppure in fisica classica. Mentre infatti M `e pari a m1 +m2 , (propriet` a che si trasporta inalterata in meccanica quantistica), il valore del modulo del momento angolare risultante dipende dall’orientazione reciproca dei due momenti angolari componenti. A questa indeterminazione classica si sovrappone quella tipica quantistica secondo la quale, quando si misura la componente z di un momento angolare, le altre due componenti risultano indeterminate. Possiamo adesso dimostrare che i possibili valori di J variano per unit` a intere da |j1 − j2 | a (j1 + j2 ). Per questo facciamo riferimento alla Fig.7.4 nella quale gli stati fisici del sistema complessivo sono individuati dai punti di un reticolato, ciascun punto essendo caratterizzato da un valore di m1 e un valore di m2 . Se nel reticolato si tracciano delle diagonali cos`ı come disegnato in figura, si pu` o osservare che ciascuna diagonale unisce fra loro stati aventi lo stesso valore di M = m1 + m2 . Il valore pi` u elevato di M `e (j1 + j2 ) ed esiste solo uno stato avente tale valore di M . Se si indica con N (M ) il numero di stati aventi un assegnato valore di M , si ha che N (j1 + j2 ) = 1. Passando al valore inferiore di M , si ha N (j1 + j2 − 1) = 2 e, al diminuire di M , il numero di stati aumenta fino a che si arriva al valore M = |j1 − j2 | per il quale N (|j1 − j2 |) = 2jmin + 1, dove jmin `e il minore fra j1 e j2 . Al diminuire ulteriore di M , N (M ) rimane invariato fino a M = −|j1 − j2 | per poi diminuire di unit` a in unit` a fino a M = −(j1 + j2 ). La situazione `e ulteriormente illustrata dall’istogramma di Fig.7.5 che si riferisce al caso particolare j1 = 5, j2 = 4. Il conteggio degli stati aventi un assegnato valore di M permette di determi-
202
CAPITOLO 7
N(M)
5
M −9 −8 −7 −6 −5 −4 −3 −2 −1 0
1
2
3 4
5
6
7
8
9
Fig. 7.5. Istogramma che illustra il variare del numero di stati aventi M assegnato al variare di M stesso. Il diagramma si riferisce al caso in cui j 1 ` e uguale a 5 e j2 ` e uguale a 4.
nare quali sono i valori di J risultanti dalla somma dei due momenti angolari. Il fatto che esista uno stato avente il valore M = j1 + j2 implica che deve esistere un valore di J pari a j1 + j2 . Questo fa s`ı che si possono “cancellare” dall’istogramma della Fig.7.5 uno stato avente M = j1 + j2 , uno stato avente M = j1 + j2 − 1, e cos`ı via, fino alla cancellazione di uno stato avente M = −j1 − j2 . Questo equivale a togliere dall’istogramma la riga pi` u bassa. A questo punto si osserva che esiste uno stato, e uno solo, avente M = j1 + j2 − 1. Questo implica che deve esistere un valore di J pari a j1 + j2 − 1 e si pu` o cos`ı cancellare la seconda riga (partendo dal basso) dell’istogramma. Ripetendo questo tipo di ragionamento si arriva a provare facilmente che tutti e soli i valori possibili di J sono |j1 − j2 |, |j1 − j2 | + 1, . . . , j1 + j2 − 1, j1 + j2 , come avevamo anticipato. Come verifica, si pu`o andare a controllare che il numero totale di stati sia effettivamente quello che dovevamo aspettarci, ovvero che sia verificata l’equazione j 1 +j2
(2J + 1) = (2j1 + 1)(2j2 + 1) .
J=|j1 −j2 |
La somma pu` o essere eseguita distinguendo i due casi j1 ≥ j2 , oppure j1 < j2 e tenendo conto dell’identit` a (valida sia per la somma di interi che di semi-interi) n2 i=n1
i=
n2 (n2 + 1) − n1 (n1 − 1) . 2
203
` ELETTRONI DI VALENZA ATOMI CON PIU
m2
!"
9:;<=>?@AB
-.
#$
%&
'
'(
W
W X
X
Y
Y Z
Z }
} ~
0
ij
gh
mn
kl
[\
EF
c
c d
d
a
_
_ `
`
a b
b
ef
w
w x
x
s
s
]
]
t
t
^
^
r
r
q
q
op
zy
vu
zy
|{
/
/
/
0
0
0
3
3 4
/
/
/
/
0
0
0
0
/
/
/
/
0
0
0
0
4
75
75 86
86
L
L
K
K
|{
U
U
S
S
Q
Q
O
O
M
M
V
T
T
R
R
P
P
N
N
0
/ 0
vu
V
IJ
GH
~
+,
12
CD
M=2j − 1 M=2j − 2 M=2j − 3 M=2j − 4
)*
m1
Fig. 7.6. Diagramma schematico che illustra il variare del numero di stati aventi M assegnato al variare di M stesso. Il diagramma si riferisce al caso in cui le due particelle siano indistinguibili con j1 e j2 entrambi uguali a 3.
Si ottiene ad esempio, per j1 ≥ j2 , j 1 +j2
(2J + 1) = 2
J=j1 −j2
(j1 + j2 + 1)(j1 + j2 ) (j1 − j2 − 1)(j1 − j2 ) − 2 2
+ (2j2 + 1) = (2j1 + 1)(2j2 + 1) . Nel caso particolare in cui i due numeri quantici j1 e j2 siano uguali, `e possibile mostrare che gli autostati |j1 j2 JM si dividono in due gruppi aventi carattere di simmetria opposto rispetto allo scambio dei due momenti angolari. In questo caso, ponendo j1 = j2 = j, si ha, ricordando l’Eq. (7.13) e la connessione fra coefficienti di Clebsh-Gordan e simboli 3-j (Eq. (7.15)) √ j j J |jjJM = |jjm1 m2 , (−1)M 2J + 1 m1 m2 −M m1 m2
e tenendo presente la propriet`a di simmetria dei simboli 3-j rispetto allo scambio di due colonne adiacenti (Eq. (7.20)), si vede che per lo scambio dei due momenti angolari l’autostato |jjJM risulta moltiplicato per il fattore (−1)2j+J . Si ottiene quindi che gli autovettori corrispondenti agli autovalori J = 2j, 2j−2, etc. sono simmetrici rispetto allo scambio dei due momenti angolari, mentre gli autovettori corrispondenti agli autovalori J = 2j − 1, 2j − 3, etc. sono antisimmetrici. Si noti che, se j `e intero, il gruppo degli autovettori simmetrici termina con J = 0 e quello degli autovettori antisimmetrici termina con J = 1, mentre, se j `e semi-intero accade l’opposto. Questa propriet`a poteva anche dedursi imponendo direttamente il principio di esclusione di Pauli al reticolato di Fig.7.4. Si supponga che j1 e j2 (con j1 = j2 = j) siano i numeri quantici di momento angolare (orbitale, oppure di spin, oppure totale) di due particelle indistinguibili, e si supponga inoltre
204
CAPITOLO 7
N(M) 5
M −5 −4 −3 −2 −1 0
1
2
3
4
5
Fig. 7.7. Istogramma che illustra il variare del numero di stati aventi M assegnato al variare di M stesso. Il diagramma si riferisce al caso di particelle indistinguibili con j 1 e j2 entrambi uguali a 3.
che tutti gli altri eventuali numeri quantici delle due particelle siano uguali. In questo caso, il reticolato di Fig.7.4 assume la forma quadrata e si restringe, per il principio di esclusione, al “semireticolato” di Fig. 7.6 (che si riferisce al caso particolare j1 = j2 = 3). Se poi si vanno a contare gli stati aventi un determinato valore di M , si trova l’istogramma rappresentato nella Fig.7.7 e ripetendo il ragionamento di pagina precedente si deduce che i possibili valori del momento angolare totale sono J = 2j − 1, 2j − 3, etc., fino ad arrivare a J = 1 nel caso che j sia intero, oppure a J = 0 nel caso che j sia semiintero. Questi sono gli stati che soddisfano il principio di esclusione e quindi sono gli stati aventi una funzione d’onda antisimmetrica rispetto allo scambio delle particelle.
7.10 Termini provenienti da configurazioni assegnate In questo paragrafo ci poniamo il problema di determinare, per un’assegnata configurazione, i possibili valori dei numeri quantici L e S. Iniziando dai casi pi` u semplici, consideriamo in primo luogo una configurazione corrispondente a una sottozona chiusa, come ad esempio s2 , p6 , d10 , f 14 , etc.. Per fissare le idee, ci riferiamo al caso della configurazione p6 . I valori possibili di m e di ms per i 6 elettroni sono i seguenti (m, ms ) = (−1, − 12 ), (−1, 12 ), (0, − 12 ), (0, 12 ), (1, − 12 ), (1, 12 ) , e il principio di esclusione di Pauli vieta qualsiasi altra combinazione di numeri quantici. Si ha allora un solo stato quantico, caratterizzato da
` ELETTRONI DI VALENZA ATOMI CON PIU
ML =
mi = 0 ,
i
MS =
205
msi = 0 ,
i
e si tratta ovviamente di uno stato avente L = 0 e S = 0, ovvero di uno stato S. Analoghe considerazioni possono essere ripetute per una qualsiasi altra configurazione corrispondente a una sottozona chiusa e si giunge quindi alla conclusione che una sottozona chiusa `e sempre caratterizzata dall’avere momento angolare nullo (sia orbitale che di spin). Il termine corrispondente `e un termine di tipo 1S. In base a questo si comprende anche che, per determinare i termini di una qualsiasi configurazione, `e giustificato considerare solamente gli elettroni appartenenti a sottozone aperte, dato che quelle chiuse non portano alcun contributo al momento angolare. In precedenza avevamo visto che una simile propriet` a vale anche per la degenerazione di una configurazione. Procedendo in ordine di difficolt`a crescente, andiamo a considerare le configurazioni con un solo elettrone in una sottozona aperta. Ovviamente, il momento angolare della configurazione corrisponde (sia per la parte orbitale che per la parte di spin) al momento angolare dell’elettrone singolo e si ha quindi, semplicemente, che alla configurazione ns (con n arbitrario) corrisponde il termine 2 S, alla configurazione np il termine 2P , alla configurazione nd il termine 2D, e cos`ı via. Quando si vanno a considerare configurazioni con due o pi` u elettroni bisogna cominciare a distinguere fra elettroni equivalenti e non equivalenti. Ad esempio, la configurazione np n p (con n = n ), che si indica sinteticamente col simbolo pp , ha termini diversi dalla configurazione np2 , che si indica sinteticamente col simbolo p2 . Analogamente, la configurazione d2 d ha termini diversi da quella d3 , e ancora diversi da quella dd d , etc.. Per le configurazioni di due elettroni non equivalenti, i termini possono essere ottenuti combinando separatamente, secondo le regole del momento angolare, i momento angolari orbitali e i momenti di spin dei due elettroni ed accoppiando poi ciascun valore risultante di L con ciascun valore risultante di S. Se si considera ad esempio la configurazione dd , L pu` o assumere i valori che provengono dall’addizione di due momenti angolari entrambi uguali a 2, ovvero, i valori 0, 1, 2, 3, 4. Analogamente, S pu` o assumere i valori che provengono dall’addizione di due momenti angolari entrambi uguali a 21 , ovvero i valori 0 e 1. In definitiva si ottengono i dieci possibili termini 1
1
S, 1P, 1D, 1F, 1G, 3S, 3P, 3D, 3F, 3 G .
Analogamente, se si considera la configurazione pd, L pu` o assumere i tre valori 1, 2, 3 ed S sempre i due valori 0, 1, per cui si hanno i sei termini 1
P, 1D, 1F, 3P, 3D, 3F .
206
CAPITOLO 7
Configurazione ss sp sd sf pp pd pf dd df ff
Termini 1
S, 3S P , 3P 1 D, 3D 1 F , 3F 1 S, 1P , 1D, 3S, 3P , 3D 1 P , 1D, 1F , 3P , 3D, 3F 1 D, 1F , 1 G, 3D, 3F , 3 G 1 S, 1P , 1D, 1F , 1 G, 3S, 3P , 3D, 3F , 3 G 1 P , 1D, 1F , 1 G, 1H, 3P , 3D, 3F , 3 G, 3H 1 S, 1P , 1D, 1F , 1 G, 1H, 1I, 3S, 3P , 3D, 3F , 3 G, 3H, 3I 1
Tab. 7.3. Termini provenienti da configurazioni di due elettroni non equivalenti.
La Tab 7.3 riassume i termini possibili per le configurazioni di due elettroni non equivalenti che si riscontrano pi` u comunemente nell’analisi spettroscopica. Passando ai termini di due elettroni equivalenti, bisogna tener presenti le considerazioni sulla simmetria delle autofunzioni svolte nel paragrafo precedente. Poich´e l’autofunzione complessiva deve essere antisimmetrica rispetto allo scambio delle due particelle, si aprono due possibilit`a distinte: a) si prende un’autofunzione simmetrica per la parte di spin e un’autofunzione antisimmetrica per la parte angolare, oppure b) si prende un’autofunzione antisimmetrica per la parte di spin e un’autofunzione simmetrica per la parte angolare. Per l’autofunzione di spin, si ha che il valore S = 1 corrisponde a un’autofunzione simmetrica e il valore S = 0 a un’autofunzione antisimmetrica. Per quanto riguarda la parte angolare si hanno pi` u possibilit` a; ad esempio, per due elettroni p equivalenti si possono avere i tre valori L = 2 (funzione simmetrica), L = 1 (antisimmetrica), L = 0 (simmetrica). Tenendo presenti queste considerazioni, si arriva facilmente a costruire la Tab 7.4. Configurazione s2 p2 d2 f2
Termini 1
S S, 1D, 3P 1 S, 1D, 1 G, 3P , 3F 1 S, 1D, 1 G, 1I, 3P , 3F , 3H
1
Tab. 7.4. Termini provenienti da configurazioni di due elettroni equivalenti.
Con tre o pi` u elettroni presenti in sottozone aperte la struttura dei termini diviene sempre pi` u complessa. La maniera pi` u appropriata di trattare questo tipo di problemi `e basata sulla teoria dei gruppi, anche se si possono ottenere
` ELETTRONI DI VALENZA ATOMI CON PIU
Config. ss s ss p ss d spp sp2 spd pp p p2 p pp d pdf
207
Termini 2
S(2), 4S P (2), 4P 2 D(2), 4D 2 S(2), 2P (2), 2D(2), 4S, 4P , 4D 2 S, 2P , 2D, 4P 2 P (2), 2D(2), 2F (2), 4P , 4D, 4F 2 S(2), 2P (6), 2D(4), 2F (2), 4S, 4P (3), 4D(2), 4F 2 S, 2P (3), 2D(2), 2F , 4S, 4P , 4D 2 S(2), 2P (4), 2D(6), 2F (4), 2 G(2), 4S, 4P (2), 4D(3), 4F (2), 4 G 2 S(2), 2P (4), 2D(6), 2F (6), 2 G(6), 2H(4), 2I(2),4S, 4 P (2), 4D(3), 4 F (3), 4 G(3), 4H(2), 4I 2
Tab. 7.5. Termini provenienti da configurazioni di tre elettroni di cui almeno due non equivalenti.
gli stessi risultati per mezzo di un approccio pi` u elementare che consiste nella costruzione di opportune tabelle, come sar`a esemplificato in seguito. Nel caso di configurazioni di tre elettroni, bisogna distinguere di nuovo i casi di elettroni equivalenti o non equivalenti, osservando che si possono anche avere casi intermedi in cui si hanno due elettroni equivalenti e uno no. Quando uno almeno degli elettroni `e non equivalente, i termini della configurazione si possono ottenere mediante le usuali regole di somma di due momenti angolari aggiungendo i momenti angolari del terzo elettrone (quello non equivalente) ai momenti angolari dei termini corrispondenti alla somma dei primi due (sia che siano equivalenti fra loro, sia che non lo siano). Ad esempio, per la configurazione pp p , si ha dalla Tab. 7.3 che i termini relativi alla configurazione pp sono i seguenti: 1S, 1P , 1D, 3S, 3P , 3D. Aggiungendo a questi termini un nuovo elettrone p (non equivalente), si ottiene: a) a partire da 1S: il termine 2P b) a partire da 1P : i termini 2S, 2P , 2D c) a partire da 1D: i termini 2P , 2D, 2F d) a partire da 3S: i termini 2P , 4P e) a partire da 3P : i termini 2S, 2P , 2D, 4S, 4P , 4D f) a partire da 3D: i termini 2P , 2D, 2F , 4P , 4D, 4F . In definitiva, si perviene quindi alla seguente struttura di termini 2
S(2), 2P (6), 2D(4), 2F (2), 4S, 4P (3), 4D(2), 4F ,
dove i numeri in parentesi indicano il numero di volte in cui compare il termine corrispondente (omettendo la parentesi quando tale numero `e uguale a 1). Volendo individuare un particolare termine di quelli molteplici, si usa specificare
208
CAPITOLO 7
m= 2 2 1 1 1 0 0
1
m= 1 0 2 1 0 2 1
0
m = −1
ML
0 1 0 1 2 1 2
2 1 1 0 -1 -1 -2
MS 1 2, 1 2, 1 2,
- 12 - 12 - 12 3 1 1 1 1 1 1 3 2, 2, 2, 2, -2, -2, -2, -2 1 1 2, -2 1 1 2, -2 1 1 2, -2
Termini × × Δ ×Δ+ Δ × ×
Tab. 7.6. La tabella illustra la procedura per determinare i termini provenienti dalla configurazione p3 . Si veda il testo per il significato dei numeri contenuti nelle prime cinque colonne. I simboli nell’ultima colonna individuano schematicamente i termini secondo il seguente codice: × = 2D, Δ = 2P , + = 4S.
entro parentesi il suo termine “progenitore”. Cos`ı, ad esempio, si possono distinguere i due termini 2S ottenuti sopra scrivendo rispettivamente (1P )2S per indicare quello ottenuto a partire dal termine 1P e (3P )2S per indicare quello ottenuto a partire dal termine 3P . Ripetendo ragionamenti analoghi a quello svolto per la configurazione pp p si arriva facilmente ai risultati contenuti nella Tab. 7.5 relativi alle configurazioni pi` u comuni che si incontrano nella pratica spettroscopica. Nel caso invece che gli elettroni siano equivalenti, la procedura per determinare i possibili valori di L e S diviene, come dicevamo, pi` u complessa, perch´e non si possono pi` u applicare con semplicit` a le regole di addizione di due momenti angolari per ottenere una funzione d’onda con le caratteristiche volute di antisimmetria rispetto allo scambio degli elettroni. In questi casi, il problema pu` o essere risolto costruendo una tabella nella quale si enumerano tutte le possibili combinazioni, per i valori di m e di ms da assegnare agli elettroni, che soddisfino il principio di esclusione di Pauli. Un esempio pratico per la configurazione p3 `e riportato nella Tab 7.6. In tale tabella, il numero contenuto in ciascuna delle cellette delle prime tre colonne (individuate da uno dei possibili valori di m) rappresenta il numero di elettroni, Nm , che hanno quel particolare valore di m. Chiaramente tale numero pu` o assumere soltanto i valori Nm = 0, 1, 2, perch´e altrimenti il principio di esclusione sarebbe violato. Una volta specificati i valori di Nm , il valore di ML `e facilmente trovato attraverso l’equazione ML = m Nm , m
ed `e riportato nella quarta colonna. Si osserva poi che le cellette per cui N m = 0 oppure Nm = 2 non portano alcun contributo al numero quantico MS . La cosa `e ovvia per Nm = 0, mentre, per Nm = 2, bisogna tener conto del principio di
` ELETTRONI DI VALENZA ATOMI CON PIU
209
Pauli per il quale i due elettroni devono avere spin anti-paralleli. Il contributo a MS proviene quindi solo dalle cellette aventi Nm = 1 e, se si indica con k il numero di tali cellette, i valori possibili per MS sono in numero di 2k , in quanto si hanno due possibilit` a distinte di orientazione per lo spin dell’elettrone di ciascuna celletta. I valori possibili di MS si ottengono aggiungendo in tutte le combinazioni possibili k addendi pari a ± 12 . Cos`ı, ad esempio, per k = 1 si hanno i due valori di MS pari a 12 e - 21 ; per k = 2 si hanno i quattro valori di MS pari a 1, 0, 0, -1; per k = 3 si hanno gli otto valori 32 , 12 , 12 , 12 , - 12 , - 12 , - 12 , - 32 ; e cos`ı via. Riportati quindi i valori possibili di MS nella quinta colonna, la tabella risulta completa e si pu` o procedere alla individuazione dei termini. Questo si pu` o fare cominciando a considerare il valore pi` u elevato di M L che figura in tabella (ML = 2). Tale valore `e associato a due valori di MS , pari a ± 12 e si deve quindi avere un termine 2D che `e indicato per convenienza con un simbolo (×) nell’ultima colonna della tabella. Naturalmente, a questo termine corrispondono anche gli altri possibili valori di ML , ovvero 1, 0, -1, -2, associati con i due valori MS = ± 12 . Si identificano allora le righe corrispondenti a queste coppie di valori ML e MS col solito simbolo nell’ultima colonna, pensando mentalmente di cancellare dalla tabella gli stati cos`ı identificati. A questo punto il valore pi` u elevato di ML `e ML = 1 che `e di nuovo associato a MS = ± 21 . Si ha quindi un termine 2P che viene indicato con un nuovo simbolo (Δ). Una volta individuati gli stati corrispondenti a questo termine, resta un insieme di stati con ML = 0 e MS = ± 32 , ± 12 . Si ha quindi un ultimo termine del tipo 4 S, individuato col simbolo (+), che esaurisce gli stati possibili. In definitiva si `e trovato che la configurazione p3 d` a luogo a tre termini, ovvero 2P , 2D, e 4 S. Un altro esempio, relativo alla configurazione d3 , `e riportato nella Tab. 7.7. Dall’analisi di tale tabella si ricavano i termini 2P , 2D(2), 2F , 2 G, 2H, 4P , 4F . Dalla maniera nella quale queste tabelle sono costruite e successivamente analizzate risulta chiaro che i termini di un’assegnata configurazione di q elettroni equivalenti sono gli stessi dei termini della configurazione complementare di (Q − q) elettroni equivalenti, dove Q `e il numero massimo di elettroni che si possono trovare nella sottozona. Ad esempio, le configurazioni p 2 e p4 hanno gli stessi termini, cos`ı come le configurazioni d3 e d7 , le configurazioni f 4 e f 10 , e cos`ı via. Per dimostrarlo, supponiamo di avere costruito la tabella relativa alla configurazione di q elettroni di momento angolare l e scambiamo ciascuno dei numeri contenuto nelle prime colonne (corrispondenti ai possibili valori di m) col suo complemento a 2 (ovvero 0 → 2, 1 → 1, 2 → 0). Se si indicano con km i numeri contenuti nella tabella originaria, i nuovi numeri saranno (2 − km ). Il numero totale di elettroni `e ora dato da l m=−l
(2 − km ) = 2 (2 l + 1) −
l
km = 2 (2 l + 1) − q = Q − q .
m=−l
D’altra parte, se una riga della tabella originaria dava per risultato M L , per la
210
CAPITOLO 7
2
1
0
−1
−2
ML
2 2 2 2 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 0 0 0 2 1 1 1 0 0 0 0 0 0 2 2 2 1 1 1 1 1 1 0 0 0 0 0 0 0
0 1 0 0 0 1 0 0 2 1 1 0 0 0 1 0 0 2 1 1 0 0 0 2 2 1 1 1 0 0
0 0 1 0 0 0 1 0 0 1 0 2 1 0 0 1 0 0 1 0 2 1 0 1 0 2 1 0 2 1
0 0 0 1 0 0 0 1 0 0 1 0 1 2 0 0 1 0 0 1 0 1 2 0 1 0 1 2 1 2
5 4 3 2 4 3 2 1 2 1 0 0 -1 -2 2 1 0 1 0 -1 -1 -2 -3 -1 -2 -2 -3 -4 -4 -5
3 2, 3 2, 3 2,
1 2, 1 2, 1 2,
1 2, 1 2, 1 2,
3 2, 3 2,
1 2, 1 2,
1 2, 1 2,
3 1 1 2, 2 2,
3 2, 3 2,
1 2, 1 2,
1 2, 1 2,
3 1 1 2, 2, 2,
3 1 1 2, 2, 2,
MS
Termini
1 2, 1 2, 1 2, 1 2, 1 2,
× × × × Δ Δ+‡ Δ+‡ ×Δ+ ‡∇ ×Δ+ ‡ ×Δ+ × † ∇† ‡∇ Δ+‡ × † Δ+‡ × Δ ×
- 12 - 12 - 12 - 12 - 12 1 1 1 1 3 2, -2, -2, -2, -2 1 1 1 1 3 2, -2, -2, -2, -2 1 1 1 1 3 2, -2, -2, -2, -2 1 1 2, -2 1 1 1 1 3 2, -2, -2, -2, -2 1 1 1 1 3 2, -2, -2, -2, -2 1 1 2, -2 1 1 1 1 3 , 2 -2, -2, -2, -2 1 1 2, -2 1 1 2, -2 1 1 2, -2 1 1 2, -2 1 1 2, -2 1 1 1 1 3 2, -2, -2, -2, -2 1 1 1 1 3 2, -2, -2, -2, -2 1 1 2, -2 1 1 1 1 3 2, -2, -2, -2, -2 1 1 2, -2 1 1 2, -2 1 1 2, -2 1 1 2, -2 1 1 1 1 3 2, -2, -2, -2, -2 1 1 2, -2 1 1 2, -2 1 1 2, -2
Tab. 7.7. La tabella illustra la procedura per determinare i termini provenienti dalla configurazione d3 . I simboli nell’ultima colonna individuano schematicamente i termini secondo il seguente codice: × = 2H, Δ = 2 G, + = 4F , ‡ = 2F , = 2D (primo termine), = 2D (secondo termine), ∇ = 4P , † = 2P .
nuova tabella si ha ML =
l
m (2 − km ) = −ML ,
m=−l
mentre i valori di MS rimangono inalterati. Le tabelle che si ottengono dalle
` ELETTRONI DI VALENZA ATOMI CON PIU
211
Config.
Termini
s p, p5 p2 , p4 p3 d, d9 d2 , d8 d3 , d7 d4 , d6 d5 f , f 13 f 2 , f 12 f 3 , f 11 f 4 , f 10
S P 1 S, 1D, 3P 2 P , 2D, 4S 2 D 1 S, 1D, 1 G, 3P , 3F 2 P , 2D(2), 2F , 2 G, 2H, 4P , 4F 1 S(2), 1D(2), 1F , 1 G(2), 1I, 3P (2), 3D, 3F (2), 3 G, 3H, 5D 2 S, 2P , 2D(3), 2F (2), 2 G(2), 2H, 2I, 4P , 4D, 4F , 4 G, 6S 2 F 1 S, 1D, 1 G, 1I, 3P , 3F , 3H 2 P , 2D(2), 2F (2), 2 G(2), 2H(2), 2I, 2K, 2L, 4S, 4D, 4F , 4 G, 4I 1 S(2), 1D(4), 1F , 1 G(4), 1H(2), 1I(3), 1K, 1L(2), 1N , 3P (3), 3D(2), 3 F (4), 3 G(3), 3H(4), 3I(2), 3K(2), 3L, 3M , 5S, 5D, 5F , 5 G, 5I 2 P (4), 2D(5), 2F (7), 2 G(6), 2H(7), 2I(5), 2K(5), 2L(3), 2M (2), 2 N , 2O, 4S, 4P (2), 4D(3), 4F (4), 4 G(4), 4H(3), 4I(3), 4K(2), 4L, 4 M , 6P , 6F , 6H 1 S(4), 1P , 1D(6), 1F (4), 1 G(8), 1H(4), 1I(7), 1K(3), 1L(4), 1M (2), 1 N (2), 1Q, 3P (6), 3D(5), 3F (9), 3 G(7), 3H(9), 3I(6), 3K(6), 3L(3), 3 M (3), 3N , 3O, 5S, 5P , 5D(3), 5F (2), 5 G(3), 5H(2), 5I(2), 5K, 5L, 7F 2 S(2), 2P (5), 2D(7), 2F (10), 2 G(10), 2H(9), 2I(9), 2K(7), 2L(5), 2 M (4), 2N (2), 2O, 2Q, 4S(2), 4P (2), 4D(6), 4F (5), 4 G(7), 4H(5), 4 I(5), 4K(3), 4L(3), 4M , 4N , 6P , 6D, 6F , 6 G, 6H, 6I, 8S
f 5, f 9 f 6, f 8 f7
2
2
Tab. 7.8. Termini provenienti da configurazioni di elettroni equivalenti.
due configurazioni complementari hanno quindi la stessa struttura e danno luogo esattamente agli stessi termini. Giova infine osservare che, se si hanno q elettroni equivalenti e se si indica con p il numero di possibili valori di m (p = 2 l + 1 = Q/2), il numero di righe che si debbono considerare nella costruzione di una tabella come le precedenti, Nrighe , `e pari al numero delle soluzioni intere, non negative dell’equazione k1 + k2 + · · · + kp = q , con ki ≤ 2. Si pu` o dimostrare che tale numero `e dato da Nrighe =
r
p! , r! (q − 2r)! (p − q + r)!
con la somma estesa a tutti i valori di r tali da rendere significativi i fattoriali del denominatore. Ad esempio, volendo costruire la tabella per la configurazione
212
CAPITOLO 7
f 6 si avrebbe (q = 6, p = 7) Nrighe =
3 r=0
7! = 357 . r! (6 − 2r)! (1 + r)!
Con i procedimenti esposti si possono determinare i termini relativi a ogni assegnata configurazione di elettroni equivalenti. I risultati per le configurazioni pi` u comuni sono riportati nella Tab 7.8 (che riassume anche i risultati gi` a contenuti in alcune delle tabelle precedenti).
7.11 Le autofunzioni dell’Hamiltoniana non relativistica Come abbiamo visto nel Par. 7.6, le configurazioni costituiscono un insieme di stati quantici descritti da autofunzioni della forma ΨA (a1 , a2 , . . . , aN ) che soddisfano l’equazione di Schr¨ odinger H0 ΨA (a1 , a2 , . . . , aN ) = W0 ΨA (a1 , a2 , . . . , aN ) , dove H0 `e l’Hamiltoniana dell’Eq. (7.3) e W0 `e definito nell’Eq. (7.12). Tali stati quantici sono degeneri, e, come abbiamo visto, la degenerazione vale g. Se si vuole adesso andare a considerare l’azione dell’Hamiltoniana H1 dell’Eq. (7.4) `e necessario, in generale, valutare tutti gli elementi di matrice della forma ΨA (a1 , a2 , . . . , aN )|H1 |ΨA (a1 , a2 , . . . , aN )
,
ovvero tutti gli elementi di matrice fra gli stati appartenenti a una configurazione e gli stati appartenenti sia alla stessa configurazione che a configurazioni diverse. La diagonalizzazione della matrice risultante porta alla determinazione degli stati energetici del sistema atomico (in approssimazione non relativistica). Ovviamente il problema cos`ı impostato risulta di enorme complessit`a e si `e soliti introdurre un’approssimazione che consiste nel supporre l’Hamiltoniana H1 come una perturbazione dell’Hamiltoniana H0 in modo tale da poter applicare la teoria delle perturbazioni al primo ordine. In questa approssimazione, l’Hamiltoniana H1 viene diagonalizzata separatamente su ciascuna configurazione e si tralasciano gli elementi di matrice fra configurazioni diverse. In altre parole, se il nostro sistema atomico consiste di N configurazioni, ciascuna avente degenerazione gi (i = 1, 2, . . . , N ), invece di diagonalizzare un’unica matrice avente &N dimensione D = i=1 gi , si diagonalizzano N matrici aventi dimensione gi . Bisogna sottolineare che questo approccio `e approssimato e che attraverso di esso si trascura un fenomeno, detto interazione fra configurazioni, che pu`o assumere, in certi casi, un’importanza notevole. D’altra parte, quando l’interazione fra configurazioni non `e trascurabile, i numeri quantici stessi che caratterizzano
213
` ELETTRONI DI VALENZA ATOMI CON PIU
le configurazioni non risultano pi` u buoni numeri quantici e la configurazione pu` o essere assegnata a uno stato solo come approssimazione di ordine zero. In questo caso, uno stato atomico dovrebbe essere piuttosto descritto da una combinazione lineare di autofunzioni del tipo ΨA (a1 , a2 , . . . , aN ), con la somma estesa ad autofunzioni relative a configurazioni diverse. Poich´e per` o l’Hamiltoniana H1 commuta con l’operatore parit` a P, la parit` a di uno stato resta sempre un buon numero quantico e la combinazione lineare di cui sopra `e in ogni caso ristretta alle configurazioni della stessa parit`a. L’interazione fra configurazioni risulta particolarmente importante per stati eccitati, laddove la differenza fra le energie W0 relative a configurazioni limitrofe diminuisce. Per gli stati di energia pi` u bassa l’interazione fra configurazioni pu` o essere nella maggior parte dei casi trascurata. Nel seguito adotteremo l’approssimazione di trascurare il fenomeno dell’interazione fra configurazioni e determineremo le energie degli stati nell’ambito della teoria delle perturbazioni. Introdotta questa approssimazione, come abbiamo detto, il problema della ricerca dell’energia degli stati che si originano da una data configurazione implica la diagonalizzazione dell’Hamiltoniana H1 sullo spazio degenere della configurazione stessa. Tale diagonalizzazione non `e per`o necessaria qualora si riesca a determinare una base sulla quale l’Hamiltoniana H1 sia gi`a diagonale. Effettivamente tale base esiste ed `e la base costituita dalle autofunzioni che descrivono i termini, ovvero dalle autofunzioni degli operatori L2 , Lz , S 2 , e Sz di cui abbiamo parlato nel paragrafo precedente. Infatti, se Ψ(α, L, S, ML , MS ) `e l’autofunzione di un termine (L, S, ML , MS ) derivante dalla configurazione α, e Ψ(α, L , S , ML , MS ) `e l’analoga autofunzione di un termine (L , S , ML , MS ), tenendo conto che gli operatori L2 , S 2 , Lz , Sz commutano con H1 , si ha 0 = Ψ(α, L, S, ML, MS )|[L2 , H1 ]|Ψ(α, L , S , ML , MS ) = [L(L + 1) − L (L + 1)] Ψ(α, L, S, ML , MS )|H1 |Ψ(α, L , S , ML , MS )
,
0 = Ψ(α, L, S, ML , MS )|[S 2 , H1 ]|Ψ(α, L , S , ML , MS ) = [S(S + 1) − S (S + 1)] Ψ(α, L, S, ML , MS )|H1 |Ψ(α, L , S , ML , MS )
,
0 = Ψ(α, L, S, ML , MS )|[Lz , H1 ]|Ψ(α, L , S , ML , MS ) = (ML − ML ) Ψ(α, L, S, ML, MS )|H1 |Ψ(α, L , S , ML , MS )
,
0 = Ψ(α, L, S, ML, MS )|[Sz , H1 ]|Ψ(α, L , S , ML , MS ) = (MS − MS ) Ψ(α, L, S, ML , MS )|H1 |Ψ(α, L , S , ML , MS )
.
Queste quattro equazioni mostrano che si possono avere elementi di matrice di H1 diversi da zero solo se si considerano termini che hanno gli stessi valori per L, per S, per ML e per MS . Sulla base delle autofunzioni Ψ(α, L, S, ML , MS ) l’Hamiltoniana `e diagonale a blocchi, ciascun blocco essendo caratterizzato dalla
214
CAPITOLO 7
quaterna di valori (L, S, ML , MS ). In particolare, se la configurazione non ammette termini molteplici, l’Hamiltoniana `e diagonale. Inoltre, gli elementi di matrice non dipendono da ML e da MS e possono essere calcolati per una combinazione qualsiasi di questi due numeri quantici. La dimostrazione di questo fatto `e immediata e si basa sulla propriet` a di commutazione dell’Hamiltoniana con gli operatori di shift L± = Lx ± i Ly e S± = Sx ± i Sy . La ricerca delle energie dei termini pu`o essere impostata attraverso un metodo generale (il cosiddetto metodo della traccia o della somma sulla diagonale) che `e descritto nel capitolo seguente. Qui preferiamo illustrare i risultati pi` u importanti che si ottengono attraverso tale metodo su alcuni atomi aventi struttura particolarmente semplice, quali l’atomo di Elio e l’atomo di Carbonio.
7.12 L’atomo di Elio Come abbiamo visto nel Par. 7.7, la configurazione normale dell’atomo di Elio `e 1s2 , alla quale compete un solo termine 1S di momento angolare nullo. Le altre configurazioni pi` u comuni risultano dall’eccitazione di uno dei due elettroni 1s che passa all’orbitale nl. Si hanno quindi, ad esempio, le configurazioni eccitate 1s 2s, 1s 2p, 1s 3s, 1s 3p, 1s 3d, etc.. A ciascuna di queste configurazioni corrispondono due termini, uno di singoletto e uno di tripletto, del tipo 1L e 3 L. Consideriamo in particolare una configurazione 1s nl (con n ≥ 2). Indicando genericamente con ψa (x ) la funzione d’onda relativa all’orbitale 1s e con ψb (x ) la funzione d’onda di uno qualsiasi degli stati m relativi all’orbitale nl, le parti dipendenti dalle coordinate spaziali delle funzioni d’onda del singoletto e del tripletto sono date rispettivamente da 1 Ψ(1L) = √ [ψa (x1 )ψb (x2 ) + ψa (x2 )ψb (x1 )] , 2 1 Ψ(3L) = √ [ψa (x1 )ψb (x2 ) − ψa (x2 )ψb (x1 )] . 2 Le funzioni d’onda totali si ottengono moltiplicando la prima espressione per una funzione d’onda di spin antisimmetrica (cui corrisponde S = 0) e la seconda espressione per una funzione d’onda di spin simmetrica (S = 1), in modo tale da ottenere in ogni caso una funzione d’onda antisimmetrica. L’espressione esplicita delle autofunzioni di spin non `e rilevante in quanto l’Hamiltoniana H1 non dipende dallo spin. La correzione all’energia del singoletto ΔE(1L), si ottiene calcolando l’elemento di matrice ΔE(1L) = Ψ(1L)|H1 |Ψ(1L)
.
o essere posta nella forma (si ricordi l’Eq.(7.4)) L’Hamiltoniana H1 pu`
215
` ELETTRONI DI VALENZA ATOMI CON PIU
H1 = f (x1 ) + f (x2 ) + g(x1 , x2 ) , dove
f (x1 ) = −
2 e20 − Vc (r1 ) , r1
f (x2 ) = −
2 e20 − Vc (r2 ) , r2
g(x1 , x2 ) =
e20 , r12
e si ottiene, con queste posizioni, ΔE(1L) = Ψ(1L)|f (x1 )|Ψ(1L) + + Ψ(1L)|g(x1 , x2 )|Ψ(1L)
Ψ(1L)|f (x2 )|Ψ(1L) .
Sostituendo l’espressione per Ψ(1L), si osserva che il primo dei tre elementi di matrice consta di quattro termini che sono dati da 3 1 d d3 x2 |ψa (x1 )|2 |ψb (x2 )|2 f (x1 ) , x 1 2
d3 x2 |ψa (x2 )|2 |ψb (x1 )|2 f (x1 ) ,
d3 x1
1 2
d3 x2 ψa∗ (x1 ) ψb∗ (x2 ) ψa (x2 ) ψb (x1 ) f (x1 ) ,
3
1 2
d x1
d3 x2 ψa∗ (x2 ) ψb∗ (x1 ) ψa (x1 ) ψb (x2 ) f (x1 ) .
d3 x1
1 2
Eseguendo l’integrazione in d3 x2 , gli ultimi due integrali si annullano, a causa dell’ortogonalit` a delle funzioni d’onda ψa e ψb , mentre i primi due integrali si semplificano e danno, rispettivamente 1 2
Ia =
d3 x |ψa (x )|2 f (x ) ,
1 2
1 2
Ib =
1 2
d3 x |ψb (x )|2 f (x ) .
Il secondo elemento di matrice si calcola in maniera analoga e porta allo stesso risultato. Infine il terzo elemento di matrice, che contiene l’interazione Coulombiana, consta anch’esso di quattro termini. Due di essi sono dati, rispettivamente, da 1 2 Jab 1 2 Kab
=
1 2
=
1 2
d3 x2 |ψa (x1 )|2 |ψb (x2 )|2
d3 x1
3
d x1
e20 , r12
d3 x2 ψa∗ (x1 ) ψb∗ (x2 ) ψa (x2 ) ψb (x1 )
e20 , r12
216
CAPITOLO 7
eV
1
1
S
3
20
D
3
3
3
S
2
3
P
D
3
3
2
1
P
3
2
3
0
2
15
100000
10
paraelio
5
0
ortoelio
1
200000
cm−1
Fig. 7.8. Diagramma di Grotrian dell’atomo di Elio. Ciascun livello `e contrassegnato dal numero quantico principale n dell’elettrone ottico.
e gli altri due sono ad essi uguali (come si deduce scambiando le variabili di integrazione x1 e x2 ). Raccogliendo i vari contributi si ottiene ΔE(1L) = Ia + Ib + Jab + Kab . Eseguendo lo stesso calcolo per il tripletto si ottiene invece ΔE(3L) = Ia + Ib + Jab − Kab , il che significa, poich`e si pu` o dimostrare che la quantit`a Kab `e sempre positiva, che lo stato di tripletto ha energia inferiore allo stato di singoletto. Gli integrali dell’interazione Coulombiana che compaiono in queste espressioni, Jab e Kab , sono detti rispettivamente integrale diretto e integrale di scambio. Mentre l’integrale diretto ha un’interpretazione fisica immediata (essendo pari al valor medio dell’interazione Coulombiana quale ci si aspetterebbe attraverso considerazioni fisiche elementari), l’integrale di scambio `e un risultato puramente quantistico e non `e possibile dargli un’interpretazione fisica diretta. Il risultato che abbiamo ottenuto per le configurazioni 1s nl dell’atomo di Elio `e un caso particolare (o, pi` u precisamente un’estensione5 ) di un principio che porta il nome di prima regola di Hund. Tale regola enuncia che fra i termini che derivano da una configurazione di elettroni equivalenti, quello che ha energia minore `e quello che ha molteplicit` a pi` u elevata (ovvero il massimo valore di S), 5
La prima regola di Hund si applica a termini provenienti da configurazioni di elettroni equivalenti. Qui viene invece applicata a termini di configurazioni del tipo 1s nl.
` ELETTRONI DI VALENZA ATOMI CON PIU
217
e, a parit` a di molteplicit` a, quello che ha il valore di L pi` u elevato. La prima regola di Hund ammette un’interpretazione fisica qualitativa. Infatti, se si considera il termine avente spin pi` u elevato, questo corrisponde alla funzione di spin avente massimo carattere di simmetria rispetto allo scambio degli elettroni, ovvero alla funzione d’onda spaziale il pi` u possibile antisimmetrica. Questo fa s`ı che gli elettroni si trovino il pi` u lontano possibile fra loro, rendendo quindi minima l’energia di repulsione Coulombiana (che `e sempre positiva). La struttura dei termini dell’atomo di Elio `e rappresentata schematicamente nel diagramma di Grotrian della Fig. 7.8. In tale diagramma il sistema dei singoletti `e disegnato separatamente da quello dei tripletti. Poich´e la regola di selezione ΔS = 0 (vedi sotto) risulta particolarmente ben verificata per l’atomo di Elio, lo spettro fu interpretato dai primi spettroscopisti come quello di due elementi distinti, che furono chiamati rispettivamente paraelio (S = 0, sistema dei singoletti) e ortoelio (S = 1, sistema dei tripletti). Per gli spettri atomici con pi` u elettroni ottici valgono un certo numero di regole di selezione. Queste regole saranno giustificate teoricamente in seguito (si veda il Cap. 12). Per il momento possiamo semplicemente considerarle come regole empiriche che spiegano la ragione per cui solo certe righe sono presenti negli spettri. Si hanno due tipi diversi di regole di selezione, ovvero regole di selezione che riguardano l’intercombinazione fra configurazioni e regole di selezione che riguardano l’intercombinazione fra termini. Le prime sono le seguenti (a) Δl = ±1 ,
(b) pari −→ / pari ,
(b ) dispari −→ / dispari ,
mentre per le seconde si ha (c) ΔS = 0 ,
(d) ΔL = ±1, 0 ; 0 −→ / 0 .
La regola (a) enuncia che sono possibili transizioni fra configurazioni che differiscono fra loro per i numeri quantici di un solo elettrone. Inoltre, il numero quantico azimutale dell’elettrone deve differire di una unit` a fra le configurazioni iniziale e finale. La regola (b), detta regola di Laporte, enuncia che sono possibili transizioni solo fra configurazioni pari e configurazioni dispari o viceversa. La regola (c) esprime il fatto che lo spin totale, S, deve restare invariato nella transizione mentre la (d) esprime il fatto che il momento angolare orbitale totale, L, pu` o variare al pi` u di una unit` a nella transizione (con esclusione della transizione 0 → 0 che `e proibita). C’`e da notare che, in alcuni casi, le regole di selezione non sono indipendenti. Ad esempio, nel caso dell’Elio in cui un elettrone rimane sempre nello stato 1s, la regola di selezione su Δl coincide con la regola di selezione su ΔL. Inoltre, la regola di Laporte sembra essere una ripetizione della regola su Δl. In verit` a, la regola di Laporte `e pi` u generale e pu`o essere applicata anche nel caso che sia
218
CAPITOLO 7
presente il fenomeno dell’interazione fra configurazioni (infatti, anche se a uno stato non pu` o essere assegnata una particolare configurazione, gli pu`o sempre essere assegnata una definita parit`a). Queste regole di selezione rendono conto del fatto che le uniche righe che si osservano nello spettro dell’Elio sono quelle tracciate nel diagramma di Fig. 7.8. L’atomo di Elio ammette quindi due livelli cosiddetti metastabili, ovvero due livelli eccitati che non possono combinare con il livello fondamentale, o, pi` u in generale, con livelli di energia minore. I due livelli metastabili dell’Elio sono i livelli 1S e 3S provenienti dalla configurazione 1s 2s.
7.13 L’atomo di Carbonio La configurazione normale dell’atomo di Carbonio `e 1s2 2s2 2p2 che d` a origine ai tre termini 1S, 1D, e 3P (si veda la Tab. 7.8). In base alla prima regola di Hund, il termine avente energia pi` u bassa `e il termine 3P che `e quindi anche lo stato fondamentale dell’atomo di Carbonio. Come vedremo nel capitolo seguente, la teoria prevede inoltre che il termine 1D si trovi a energia pi` u bassa del termine 1S, con un rapporto fra gli intervalli dato da S − 1D 3 = . 1D − 3P 2 1
Come mostra il diagramma di Grotrian della Fig. 7.9, i termini si trovano effettivamente nell’ordine energetico previsto dalla teoria, sebbene il rapporto fra gli intervalli risulti di 1.13 invece che di 1.50. Questo fatto, dovuto soprattutto al fenomeno dell’interazione fra configurazioni, mostra chiaramente i limiti delle approssimazioni che vengono introdotte per l’interpretazione dei dati spettroscopici a livello elementare. Le pi` u importanti configurazioni di elettroni eccitati sono quelle in cui uno dei due elettroni 2p passa a un’orbita pi` u elevata. Esse sono del tipo 1s2 2s2 2p np 2 2 (n = 3, 4, . . .), 1s 2s 2p ns (n = 3, 4, . . .), 1s2 2s2 2p nd (n = 3, 4, . . .), etc.. Ciascuna delle configurazioni del primo tipo d` a luogo a sei termini, 1S, 1P , 1D, 3 3 3 S, P , D. Le configurazioni del secondo tipo danno luogo a due termini, 1P e 3P . Infine le configurazioni del terzo tipo danno luogo a sei termini, 1P , 1D, 1 F , 3P , 3D, 3F . Il diagramma di Grotrian dell’atomo di Carbonio `e riportato schematicamente nella Fig. 7.9. Da tale figura si pu`o osservare che dei sei termini provenienti dalla configurazione 1s2 2s2 2p 3p, il pi` u basso in energia `e il termine 1P . Questo fatto non `e in contraddizione con la prima regola di Hund (che prevederebbe un’energia minore per il termine 3D) in quanto tale regola `e strettamente valida solo per le configurazioni di elettroni equivalenti. Analogamente, per la configurazione 1s2 2s2 2p 3d, il termine pi` u basso `e il termine 1D (e non il 3F ).
219
` ELETTRONI DI VALENZA ATOMI CON PIU
eV
2s 2 2p np 2s 2 2p ns
2s 2p 3
2s 2 2p nd
10
3
1
1
P
8
1
6
4
S D 1 P
1
3
P S 3 D
3
P
P F 1 D 1
3
P D 3 F
3
P
3
D
3
5
S
1
S
2
D 3
1
0
P
Fig. 7.9. Diagramma di Grotrian dell’atomo di Carbonio. Ciascun livello `e contrassegnato dalla propria denominazione spettroscopica.
Nel diagramma di Grotrian sono anche riportati alcuni termini della configurazione 1s2 2s 2p3. Tale configurazione risulta dall’eccitazione di un elettrone appartenente a una sottozona interna ma in questo caso, essendo la differenza in energia fra l’orbitale 2s e l’orbitale 2p relativamente piccola, alcuni dei termini corrispondenti si vengono a trovare al di sotto del limite di ionizzazione dell’atomo. La configurazione d` a luogo, in principio, a sei termini, 1P , 1D, 3S, 3 3 5 P , D, S, tre dei quali sono riportati nel diagramma. In conclusione di questo capitolo osserviamo che, malgrado l’enorme quantit` a di lavoro dedicata all’osservazione e all’analisi degli spettri atomici (di laboratorio e astrofisici), la conoscenza dei livelli energetici degli atomi e degli ioni `e ancora ben lontana dall’essere completa. Analisi sufficientemente esaustive sono disponibili solo per quegli atomi (o ioni) aventi pochi elettroni nelle zone aperte. L’analisi dei metalli appartenenti ai gruppi di transizione `e ancora piuttosto incompleta e ancor pi` u lo `e quella dei lantanidi e degli attinidi, gruppi caratterizzati da una notevole complessit`a di struttura.
Capitolo 8
Energie dei termini Nel capitolo precedente abbiamo introdotto l’Hamiltoniana non relativistica di un atomo complesso e abbiamo visto come, per mezzo dell’approssimazione del campo centrale, essa possa essere separata in due parti: un’Hamiltoniana di ordine zero, i cui autovettori, in generale degeneri, sono i molteplici stati appartenenti alle diverse configurazioni, e un’Hamiltoniana “correttiva” contenente vari termini fra cui, in particolare, il termine di repulsione Coulombiana fra gli elettroni. Trascurando il fenomeno dell’intrazione fra configurazioni, il che equivale a considerare l’Hamiltoniana correttiva come una perturbazione dell’Hamiltoniana di ordine zero, abbiamo visto, nel caso particolare dell’atomo di Elio, come sia possibile esprimere le energie dei termini per mezzo di integrali che coinvolgono le autofunzioni di particella singola relative all’Hamiltoniana di ordine zero. In questo capitolo generalizzeremo i risultati ottenuti per l’atomo di Elio a un atomo qualsiasi, sempre impostando il problema dal punto di vista della teoria delle perturbazioni. Questo ci porter` a a ottenere dei risultati generali che possono essere direttamente confrontati con i dati spettroscopici. Tali risultati, seppur approssimati, costituiscono la base di partenza per lo sviluppo di procedimenti pi` u sofisticati che vengono oggi utilizzati per l’analisi dettagliata degli spettri atomici.
8.1 La regola della traccia Quando si trascuri il fenomeno dell’interazione fra configurazioni, le energie dei termini provenienti da una configurazione assegnata si ottengono diagonalizzando l’Hamiltoniana H1 dell’Eq. (7.4) sullo spazio di degenerazione della configurazione. Questo, in principio, implica la diagonalizzazione di una matrice di ordine g, dove g `e la degenerazione della configurazione, i cui singoli elementi di matrice sono della forma ΨA (a1 , a2 , . . . , aN )| H1 |ΨA (a1 , a2 , . . . , aN )
,
dove (a1 , a2 , . . . , aN ) e (a1 , a2 , . . . , aN ) sono due set di numeri quantici corrispondenti alla medesima configurazione. Come abbiamo visto nel Par. 7.11, la diagonalizzazione potrebbe essere evitata qualora si riuscissero a costruire delle opportune combinazioni lineari delle ΨA (a1 , a2 , . . . , aN ) tali da risultare autovettori degli operatori L2 e S 2 . Tale costruzione presenta per`o, in generale, delle notevoli difficolt`a per cui si preferisce ricorrere a un metodo diverso.
222
CAPITOLO 8
In primo luogo, si pu` o osservare che ciascuna delle g funzioni d’onda degeneri ΨA (a1 , a2 , . . . , aN ) `e un autovettore degli operatori Lz e Sz corrispondente, rispettivamente, agli autovalori ML e MS dati da ML =
N
mi ,
MS =
i=1
N
msi ,
i=1
dove mi e msi sono, rispettivamente, il numero quantico magnetico e il numero quantico della proiezione (lungo l’asse z) dello spin dell’elettrone i-esimo. Se si ricorda poi che l’Hamiltoniana H1 commuta con gli operatori Lz e Sz , ne segue che l’Hamiltoniana risulta diagonale a blocchi, ogni blocco, ovvero ogni singola sottomatrice, essendo caratterizzata da un’opportuna coppia di valori (ML , MS ). Supponiamo adesso di aver effettivamente eseguito la diagonalizzazione di una di tali sottomatrici. Sulla sua diagonale appariranno le energie dei termini compatibili con i valori di ML e di MS che caratterizzano la sottomatrice stessa. Se si ricorda la propriet`a fondamentale delle matrici secondo la quale la traccia `e invariante per trasformazioni di similitudine, si arriva alla conclusione seguente: assegnata una coppia di valori (ML , MS ), si considerino tutti i termini compatibili con tali valori. La somma delle energie di tali termini `e uguale alla somma degli elementi di matrice diagonali del tipo ΨA (a1 , a2 , . . . , aN )|H1 |ΨA (a1 , a2 , . . . , aN )
,
A
dove Ψ (a1 , a2 , . . . , aN ) `e un autofunzione di Lz e Sz corrispondente, rispettivamente, agli autovalori ML e MS . Queste semplici considerazioni permettono, in molti casi, di ottenere le energie dei termini per mezzo di combinazioni lineari di elementi di matrice diagonali. Chiariamo queste considerazioni attraverso un esempio. Consideriamo per questo la configurazione pp la quale, come sappiamo, ammette i sei termini 1 S, 1P , 1D, 3S, 3P , 3D. Il valore pi` u alto possibile per ML `e 2, e quello pi` u alto possibile per MS `e 1. Questa coppia di valori (ML , MS ) `e compatibile solamente col termine 3D, e, indicando con lo stesso simbolo del termine la sua energia, si pu` o scrivere 3
D = [2, 1] ,
dove abbiamo introdotto il simbolo abbreviato [ML , MS ] per indicare la somma degli elementi di matrice diagonali dell’Hamiltoniana H1 fra tutti gli stati ΨA aventi per autovalori di Lz e Sz i valori ML e MS , rispettivamente. Se adesso procediamo, diminuendo i valori di ML e MS fino ad arrivare per entrambi a zero, si ottengono le altre equazioni 3
D + 3P = [1, 1] ,
3
D + 3P + 3S = [0, 1] ,
3
D + 1D = [2, 0] ,
223
ENERGIE DEI TERMINI 3
D + 1D + 3P + 1P = [1, 0] ,
3
D + 1D + 3P + 1P + 3S + 1S = [0, 0] . (8.1)
Invertendo queste equazioni si ottiene, con semplici passaggi algebrici 3
D = [2, 1] ,
P = [1, 1] − [2, 1] ,
3
D = [2, 0] − [2, 1] ,
1
S = [0, 1] − [1, 1] ,
3
P = [1, 0] − [2, 0] − [1, 1] + [2, 1] ,
1
S = [0, 0] − [1, 0] − [0, 1] + [1, 1] .
1
Le somme indicate dai simboli [ML , MS ] altro non sono che somme di elementi di matrici diagonali. Ogni elemento di matrice pu`o poi essere individuato attraverso i valori di m e di ms di ciascun elettrone (ricordiamo che gli altri numeri quantici n e l sono gi`a stabiliti dalla configurazione). Per questo, nel caso di configurazioni a due elettroni, si usa una notazione compatta del tipo 1 ± (m± 1 , m2 )
per indicare l’elemento di matrice diagonale dell’Hamiltoniana sullo stato in cui l’elettrone 1 ha numero quantico magnetico m1 e numero quantico di spin +1/2 oppure −1/2 e, analogamente, l’elettrone 2 ha numero quantico magnetico m 2 e numero quantico di spin +1/2 oppure −1/2. Introdotta questa notazione, `e ± facile andare a identificare tutte le coppie del tipo (m± 1 , m2 ) che contribuiscono alla somma [ML , MS ]. Nel nostro caso particolare si ha [2, 1] = (1+ , 1+ ) ,
[1, 1] = (1+ , 0+ ) + (0+ , 1+ ) ,
[0, 1] = (1+ , −1+ ) + (0+ , 0+ ) + (−1+ , 1+ ) ,
[2, 0] = (1+ , 1− ) + (1− , 1+ ) ,
[1, 0] = (1+ , 0− ) + (1− , 0+ ) + (0+ , 1− ) + (0− , 1+ ) , [0, 0] = (1+ , −1− ) + (1− , −1+ ), +(0+ , 0− ) + (0− , 0+ ) + (−1+ , 1− ) + (−1− , 1+ ) . Sostituendo queste espressioni nelle Eq. (8.1), si ottengono i risultati riportati nella Tab. 8.1 In definitiva, siamo quindi riusciti a esprimere le energie dei termini come somme algebriche di elementi di matrice diagonali dell’Hamiltoniana H1 su autostati dell’Hamiltoniana H0 . Nelle equazioni finali della Tab. 8.1, c’`e da notare che, ad esempio, l’elemento di matrice indicato col simbolo (1+ , 1− ) `e diverso dall’elemento di matrice indicato col simbolo (1− , 1+ ). Questo `e perch´e i due elettroni sono non equivalenti, e l’ordine entro la parentesi `e importante. Nel caso di configurazioni con due elettroni equivalenti, invece, l’ordine entro la parentesi `e irrilevante; per di pi` u, in quest’ultimo caso, elementi di matrice come (0+ , 0+ ) non devono comparire nelle espressioni delle energie dei termini 1
Il simbolo ` e introdotto nel classico volume di spettroscopia atomica E.U. Condon & G.H. Shortley, The Theory of Atomic Spectra, Cambridge Univ. Press, Cambridge, 1935.
224
CAPITOLO 8
Configurazione pp 3
D= P = 3 S= 1 D= 1 P = 3
1
S=
(1+ , 1+ ) (1+ , 0+ ) + (0+ , 1+ ) − (1+ , 1+ ) (1+ , −1+ ) + (0+ , 0+ ) + (−1+ , 1+ ) − (1+ , 0+ ) − (0+ , 1+ ) (1+ , 1− ) + (1− , 1+ ) − (1+ , 1+ ) (1+ , 0− ) + (1− , 0+ ) + (0+ , 1− ) + (0− , 1+ ) − (1+ , 1− ) − (1− , 1+ ) − (1+ , 0+ ) − (0+ , 1+ ) + (1+ , 1+ ) (1+ , −1− ) + (1− , −1+ ) + (0+ , 0− ) + (0− , 0+ ) + (−1+ , 1− ) + (−1− , 1+ ) − (1+ , 0− ) − (1− , 0+ ) − (0+ , 1− ) − (0− , 1+ ) −(1+ , −1+ ) − (0+ , 0+ ) − (−1+ , 1+ ) + (1+ , 0+ ) + (0+ , 1+ )
Tab. 8.1. Energie dei termini della configurazione pp espresse come somme di elementi di ± matrice diagonali di stati elettronici della forma (m± 1 , m2 ).
perch´e le corrispondenti funzioni d’onda si riferiscono a stati che violano il principio di esclusione di Pauli. Il metodo sopra esposto per la configurazione pp `e basato sulla regola generale dell’invarianza della traccia di una matrice per trasformazioni di similitudine. Nelle applicazioni spettroscopiche tale regola viene chiamata regola della traccia oppure regola della somma sulla diagonale (diagonal sum rule). Il metodo pu` o essere applicato a configurazioni qualunque e implica calcoli elementari, anche se spesso laboriosi. Nella Tab. 8.2 riportiamo i risultati relativi alle configurazioni p2 , p3 e p2 p . Per quest’ultimo caso `e necessario introdurre la ± ± notazione (m± 1 , m2 ; m3 ) per distinguere fra i due elettroni equivalenti, con indici 1 e 2, dall’elettrone non equivalente, con indice 3. Bisogna sottolineare che nell’ultimo caso analizzato, quello della configurazione p2 p , la regola della traccia non permette di determinare separatamente l’energia dei due termini 2D e dei tre termini 2P , ma solo la somma delle energie dei termini ripetuti. Questa `e una limitazione generale della regola della traccia. Se si vogliono determinare le singole energie dei termini ripetuti bisogna ricorrere a una effettiva diagonalizzazione della sottomatrice relativa solamente a tali termini.
8.2 Calcolo di elementi di matrice diagonali Si abbia da calcolare l’elemento di matrice diagonale Ψ(a1 , a2 , . . . , aN )| H1 |Ψ(a1 , a2 , . . . , aN )
.
L’Hamiltoniana H1 (si veda l’Eq.(7.4)) consta della somma di uno stesso operatore, f (i), relativo a ciascun elettrone, e della somma, relativa a tutte le
225
ENERGIE DEI TERMINI
Configurazione p2 3
P = D= 1 S= 1
(1+ , 0+ ) (1+ , 1− ) (1+ , −1− ) + (1− , −1+ ) + (0+ , 0− ) − (1+ , 0+ ) − (1+ , 1− ) Configurazione p3
4
S= D= 2 P = 2
(1+ , 0+ , −1+ ) (1+ , 1− , 0+ ) (1+ , 1− , −1+ ) + (1+ , 0+ , 0− ) − (1+ , 1− , 0+ ) Configurazione p2 p
4
D= P = 4 S= 4
2
F = D(2) =
2 2
P (3) =
2
S=
(1+ , 0+ ; 1+ ) (1+ , −1+ ; 1+ ) + (1+ , 0+ ; 0+ ) − (1+ , 0+ ; 1+ ) (1+ , −1+ ; 0+ ) + (1+ , 0+ ; −1+ ) + (−1+ , 0+ ; 1+ ) − (1+ , −1+ ; 1+ ) − (1+ , 0+ ; 0+ ) (1+ , 1− ; 1+ ) (1+ , 0− ; 1+ ) + (1− , 0+ ; 1+ ) + (1+ , 0+ ; 1− ) + (1+ , 1− ; 0+ ) − (1+ , 1− ; 1+ ) − (1+ , 0+ ; 1+ ) (1+ , 1− ; −1+ ) + (1+ , 0+ ; 0− ) + (1+ , 0− ; 0+ ) + (1− , 0+ ; 0+ ) + (1+ , −1+ ; 1− ) + (1+ , −1− ; 1+ ) + (1− , −1+ ; 1+ ) + (0+ , 0− ; 1+ ) − (1+ , 0− ; 1+ ) − (1− , 0+ ; 1+ ) − (1+ , 0+ ; 1− ) − (1+ , 1− ; 0+ ) − (1+ , −1+ ; 1+ ) − (1+ , 0+ ; 0+ ) + (1+ , 0+ ; 1+ ) (1+ , 0+ ; −1− ) + (1+ , 0− ; −1+ ) + (1− , 0+ ; −1+ ) + (1+ , −1+ ; 0− ) + (1+ , −1− ; 0+ ) + (1− , −1+ ; 0+ ) + (0+ , 0− ; 0+ ) + (0+ , −1+ ; 1− ) + (0+ , −1− ; 1+ ) + (0− , −1+ ; 1+ ) − (1+ , 1− ; −1+ ) − (1+ , 0+ ; 0− ) − (1+ , 0− ; 0+ ) − (1− , 0+ ; 0+ ) − (1+ , −1+ ; 1− ) − (1+ , −1− ; 1+ ) − (1− , −1+ ; 1+ ) − (0+ , 0− ; 1+ ) − (1+ , −1+ ; 0+ ) − (1+ , 0+ ; −1+ ) − (−1+ , 0+ ; 1+ ) + (1+ , −1+ ; 1+ ) + (1+ , 0+ ; 0+ )
Tab. 8.2. Energie dei termini delle configurazione p2 , p3 e p2 p . Il simbolo 2D(2), che appare nella parte relativa alla configurazione p 2 p , rappresenta la somma delle energie dei due termini 2D che si originano da tale configurazione. Analogo significato ha il simbolo 2P (3).
coppie distinte di elettroni, di un operatore, g(i, j), simmetrico nello scambio dell’elettrone i-esimo con l’elettrone j-esimo. Esplicitamente si ha
H1 = F + G =
N i=1
dove
f (i) +
i<j
g(i, j) ,
(8.2)
226
CAPITOLO 8
f (i) = −Vc (ri ) −
Ze20 , ri
g(i, j) =
e20 . rij
(8.3)
. . , aN ) `e del tipo di determinante di Ricordando che la funzione Ψ(a1 , a2 , .√ Slater (si veda l’Eq.(7.1), con NA = 1/ N ! ), si ha per il primo contributo di H1 1 (−1)P+Q N! i=1 N
Ψ(a1 , a2 , . . . , aN )| F |Ψ(a1 , a2 , . . . , aN ) =
P
Q
× P[ψa1 (x1 )ψa2 (x2 ) · · · ψaN (xN )]|f (xi )|Q[ψa1 (x1 )ψa2 (x2 ) · · · ψaN (xN )]
,
con la somma estesa a tutte le permutazioni possibili, P e Q, delle coordinate degli elettroni nel “bra” e, rispettivamente, nel “ket”. La somma contiene N × (N !)2 termini, il generico dei quali risulta, a parte un segno,
ψa1 (x1 )|ψa1 (x1 )
ψa2 (x2 )|ψa2 (x2 ) · · · ψai (xi )|f (xi )|ψai (xi ) · · · × ψaN (xN )|ψaN (xN )
,
essendo (a1 , a2 , . . . , aN ) e (a1 , a2 , . . . , aN ) due permutazioni arbitrarie (e in generale distinte) di (a1 , a2 , . . . , aN ). Per la propriet` a di ortonormalit` a delle autofunzioni ψaj , questo termine risulta nullo a meno che non sia a1 = a1 , a2 = a2 , . . ., aN = aN . Si ha allora 1 N! i=1 N
Ψ(a1 , a2 , . . . , aN )|F|Ψ(a1 , a2 , . . . , aN ) =
P
P[ψa1 (x1 )ψa2 (x2 ) · · · ψaN (xN )]|f (xi )|P[ψa1 (x1 )ψa2 (x2 ) · · · ψaN (xN )]
,
col che la somma contiene soltanto N ×N ! termini. Fissiamo adesso l’attenzione sugli N ! termini della somma che contengono l’elemento di matrice di f (xi ), con i fissato. (N − 1)! di questi termini risultano uguali a ψa1 (xi )|f (xi )|ψa1 (xi ) , (N − 1)! uguali a ψa2 (xi )|f (xi )|ψa2 (xi ) , e cos`ı via fino agli (N − 1)! uguali a ψaN (xi )|f (xi )|ψaN (xi ) . Si ottiene quindi
Ψ(a1 , a2 , . . . , aN )|F|Ψ(a1 , a2 , . . . , aN ) =
N N 1 ψaj (xi )|f (xi )|ψaj (xi ) . N i=1 j=1
D’altra parte, una volta che l’elemento di matrice `e stato calcolato, esso non dipende pi` u dalle coordinate xi dell’elettrone, per cui si ottiene in definitiva
227
ENERGIE DEI TERMINI
Ψ(a1 , a2 , . . . , aN )|F|Ψ(a1 , a2 , . . . , aN ) =
N
ψaj (x)|f (x)|ψaj (x)
,
j=1
ovvero, abbreviando le notazioni con un simbolismo evidente Ψ(a1 , a2 , . . . , aN )|F|Ψ(a1 , a2 , . . . , aN ) =
N
aj |f |aj
.
(8.4)
j=1
Malgrado le complicazioni formali introdotte dall’antisimmetrizzazione delle autofunzioni, il risultato che abbiamo ottenuto per l’elemento di matrice diagonale dell’operatore F `e ovvio e intuitivo. In pratica si tratta di sommare l’elemento di matrice diagonale dell’operatore di particella singola, f , su tutti gli stati ai di particella singola occupati dagli elettroni. Calcoliamo adesso l’elemento di matrice diagonale dell’operatore G. Si ha Ψ(a1 , a2 , . . . , aN )|G|Ψ(a1 , a2 , . . . , aN ) =
1 (−1)P+Q N! i<j P
Q
× P[ψa1 (x1 )ψa2 (x2 ) · · · ψaN (xN )]|g(xi , xj )|Q[ψa1 (x1 )ψa2 (x2 ) · · · ψaN (xN )]
.
Esplicitando, come nel caso precedente relativo all’operatore F, il generico termine della somma nella forma ψa1 (x1 )|ψa1 (x1 )
ψa2 (x2 )|ψa2 (x2 ) · · ·
× ψai (xi )ψaj (xj )|g(xi , xj )|ψai (xi )ψaj (xj ) · · · ψaN (xN )|ψaN (xN )
,
`e facile rendersi conto che, in questo caso, l’elemento di matrice pu` o essere non nullo in due situazioni diverse, ovvero quando si ha caso a) a1 = a1 , a2 = a2 , ai = ai , aj = aj , aN = aN , oppure quando si ha caso b) a1 = a1 , a2 = a2 , ai = aj , aj = ai , aN = aN . Nel caso a) la permutazione Q `e la stessa della permutazione P, mentre nel caso b) essa `e la stessa della P con in pi` u lo scambio fra i numeri quantici delle particelle i e j. Indicando tale permutazione con P’, si ha che
(−1)P+P = −1 , in quanto le due permutazioni P e P’ hanno parit` a diversa. In base a queste considerazioni si ottiene
228
CAPITOLO 8
Ψ(a1 , a2 , . . . , aN )|G|Ψ(a1 , a2 , . . . , aN ) =
1 1 Aij − Bij , N! N! i<j i<j P
P
dove Aij = P[ψa1 (x1 )ψa2 (x2 )···ψaN (xN )]|g(xi , xj )|P[ψa1 (x1 )ψa2 (x2 )···ψaN (xN )] , Bij = P[ψa1 (x1 )ψa2 (x2 )···ψaN (xN )]|g(xi , xj )|P [ψa1 (x1 )ψa2 (x2 )···ψaN (xN )] . Fissiamo adesso l’attenzione su una particolare coppia (i, j). Degli N ! termini che compaiono nella somma ce ne sono (N − 2)! che danno per risultato
ψa1 (xi )ψa2 (xj )|g(xi , xj )|ψa1 (xi )ψa2 (xj )
− ψa1 (xi )ψa2 (xj )|g(xi , xj )|ψa2 (xi )ψa1 (xj )
,
(N −2)! che danno risultato analogo con la coppia di stati (a1 , a3 ) al posto della coppia (a1 , a2 ), e cos`ı via per tutte le possibili coppie ordinate di stati (ar , as ). Osservando poi che, a causa della simmetria dell’operatore g(i, j) rispetto allo scambio delle particelle, la coppia ordinata (ar , as ) d` a lo stesso risultato della coppia ordinata (as , ar ), si ottiene
Ψ(a1 , a2 , . . . , aN )|G|Ψ(a1 , a2 , . . . , aN ) =
2 N (N − 1) i<j coppie a
r ,as
ψar (xi )ψas (xj )|g(xi , xj )|ψar (xi )ψas (xj )
− ψar (xi )ψas (xj )|g(xi , xj )|ψas (xi )ψar (xj )
,
dove la somma sulle coppie va intesa nel senso di coppie non ordinate. Una volta calcolati gli elementi di matrice che compaiono in questa equazione, il risultato non dipende pi` u dai valori degli indici i e j. Osservando che la somma su i e j implica N (N − 1)/2 termini si ottiene, in notazioni compatte Ψ(a1 , a2 , . . . , aN )|G|Ψ(a1 , a2 , . . . , aN ) = [ ar , as |g|ar , as − ar , as |g|as , ar ] . =
(8.5)
coppie ar ,as
Gli elementi di matrice che compaiono col segno positivo nel secondo membro sono detti “diretti”, mentre gli altri sono detti “di scambio”. Il contributo di questi ultimi all’energia totale di un sistema atomico viene chiamato il contributo dovuto all’energia di scambio. Gli elementi di matrice diretti hanno un’interpretazione fisica immediata, essendo integrali del tipo
ENERGIE DEI TERMINI
|ψar (x1 )|2 |ψas (x2 )|2
229
e20 dx1 dx2 . r12
Gli elementi di matrice di scambio, invece, sono una conseguenza del carattere antisimmetrico delle autofunzioni, ovvero del principio di esclusione, e non hanno analogo classico.
8.3 Elementi di matrice di particella singola Nel paragrafo precedente abbiamo ricondotto gli elementi di matrice diagonali di operatori di tipo F e G fra stati di N particelle a elementi di matrice fra stati di una particella (nel caso dell’operatore F) oppure di due particelle (nel caso dell’operatore G). Adesso andiamo a calcolare esplicitamente questi elementi di matrice tenendo conto che le autofunzioni di particella singola sono del tipo (si vedano le Eq. (7.10) e (7.11)) ψnlmms =
1 Pnl (r) Ylm (θ, φ) χms , r
dove Pnl (r) `e l’autofunzione radiale ridotta, soluzione dell’equazione di Schr¨ odinger
−
h ¯ 2 d2 h ¯ 2 l(l + 1) Pnl (r) = W0 (n, l)Pnl (r) , P (r) + V (r) + nl c 2 m dr2 2 m r2
Vc (r) essendo il potenziale centrale. Ricordando l’espressione dell’operatore F delle Eq. (8.2) e (8.3), il primo integrale da valutare `e del tipo Ze20 2 2 |ψnlmms | −Vc (r) − r sin θ dr dθ dφ , r e porta direttamente, tenendo conto della propriet` a delle armoniche sferiche espressa dall’Eq. (6.12), a un integrale radiale, funzione di n e di l, definito da ∞ Ze20 2 I(n, l) = − dr . (8.6) Pnl (r) Vc (r) + r 0 Ovviamente, l’espressione esplicita di I(n, l) pu` o essere calcolata solo qualora sia stato assegnato il potenziale Vc (r) e si siano successivamente determinate le funzioni radiali ridotte Pnl (r). Riassumendo, i risultati del capitolo precedente e quelli test´e ottenuti permettono di scrivere l’energia di una data configurazione, dovuta all’Hamiltoniana H0 e alla parte F dell’Hamiltoniana H1 , nella forma
230
CAPITOLO 8
W =
qnl [W0 (n, l) + I(n, l)] ,
(8.7)
sottozone
dove qnl `e il numero di elettroni presenti nella sottozona nl. Tale energia `e la stessa per tutti i g stati della configurazione. La parte F dell’Hamiltoniana H1 non rimuove quindi la degenerazione.
8.4 Elementi di matrice dell’interazione Coulombiana Per quanto riguarda l’interazione Coulombiana, `e necessario calcolare due tipi diversi di elementi di matrice, quelli diretti e quelli di scambio, per i quali tradizionalmente si utilizzano le notazioni J e K. Tali integrali sono definiti da e20 e2 | a, b , K(a, b) = a, b | 0 | b, a , r12 r12 dove, con a e b, si intendono due set diversi di numeri quantici, ovvero J(a, b) = a, b |
a = (na , la , ma , msa ) ,
b = (nb , lb , mb , msb ) .
Pi` u in generale, andiamo a calcolare un elemento di matrice del tipo a, b |
e20 | c, d r12
.
Esplicitando le autofunzioni, si ha ∞ ∞ e20 | c, d = δ(msa , msc ) δ(msb , msd ) dr1 dr2 r12 0 0 π 2π π × Pna la (r1 )Pnb lb (r2 )Pnc lc (r1 )Pnd ld (r2 ) dθ1 dθ2 dφ1 a, b |
0
0
0
2π
dφ2
0
e20 sin θ1 sin θ2 , r12 dove le due delta di Kronecker sono dovute ai prodotti scalari delle autofunzioni di spin. Per eseguire l’integrale conviene ricordare l’Eq. (7.9) che qui riscriviamo × Yl∗a ma (θ1 , φ1 )Yl∗b mb (θ2 , φ2 )Ylc mc (θ1 , φ1 )Yld md (θ2 , φ2 )
∞
rl 1 < = P (cosΘ) , l+1 l r12 r l=0 > dove r< e r> sono, rispettivamente, il minore e il maggiore fra r1 e r2 e dove Θ `e l’angolo compreso fra i raggi vettori r1 e r2 . Per il teorema dei tre coseni si ha
231
ENERGIE DEI TERMINI
cosΘ = cosθ1 cosθ2 + sinθ1 sinθ2 cos(φ1 − φ2 ) , e la funzione di Legendre di argomento cosΘ pu`o essere espressa, attraverso il cosiddetto teorema di addizione, nella forma Pl (cos Θ) =
l 4π ∗ Ylm (θ1 , φ1 )Ylm (θ2 , φ2 ) . 2l + 1 m=−l
Si ha quindi ∞ l l r< 1 4π ∗ = Ylm (θ1 , φ1 )Ylm (θ2 , φ2 ) . l+1 2 l + 1 r12 r > l=0 m=−l
Sostituendo questa espressione nell’elemento di matrice, si ottiene ∞
a, b |
4π e20 | c, d = e20 δ(msa , msc ) δ(msb , msd ) r12 2l +1 l=0
×
∞
dr1 0
×
∞
0
l
×
π
sinθ1 dθ1
0
m=−l
l r< dr2 l+1 Pna la (r1 )Pnc lc (r1 )Pnb lb (r2 )Pnd ld (r2 ) r>
0
π
sinθ2 dθ2 0
0
2π
2π
∗ dφ1 Yl∗a ma (θ1 , φ1 )Ylc mc (θ1 , φ1 )Ylm (θ1 , φ1 )
dφ2 Yl∗b mb (θ2 , φ2 )Yld md (θ2 , φ2 )Ylm (θ2 , φ2 )
.
Gli integrali sugli angoli solidi possono essere eseguiti tenendo conto delle propriet`a di coniugazione delle armoniche sferiche (Eq. (6.11)) e del cosiddetto teorema di Weyl, secondo il quale si ha, in termini di simboli 3-j
π
sinθ dθ 0
$
=
2π
dφ Yl1 m1 (θ, φ)Yl2 m2 (θ, φ)Yl3 m3 (θ, φ) = 0
(2l1 + 1)(2l2 + 1)(2l3 + 1) 4π
l1 0
l2 0
l3 0
l1 m1
l2 m2
l3 m3
.
(8.8)
Si ottiene quindi, per quanto riguarda la parte angolare, l’espressione seguente 2l + 1 # (2la + 1)(2lb + 1)(2lc + 1)(2ld + 1) (−1)ma +m+mb 4π lb ld l la lb lc l ld la lc l × 0 0 0 0 0 0 −ma mc −m −mb md
l m
,
232
CAPITOLO 8
espressione che pu`o essere resa leggermente pi` u simmetrica cambiando l’indice di somma m in −m, e tenendo presenti le propriet`a di simmetria dei simboli 3-j (Eq. (7.19) e (7.20)). Osservando inoltre che, essendo mb = md + m, si ha (−1)ma +m+mb = (−1)ma +2m+md = (−1)ma +md , si ottiene, sempre per la parte angolare 2l + 1 # (2la + 1)(2lb + 1)(2lc + 1)(2ld + 1) (−1)ma +md 4π ld lb l la ld lc l l l l × a c 0 0 0 0 0 0 −ma mc m −md
lb mb
l m
.
Osserviamo adesso che questa espressione `e nulla a meno che i due numeri interi (la + lc + l) e (lb + ld + l) siano pari e a meno che m non sia uguale sia a (ma − mc ) che a (md − mb ). Questo significa, inoltre, che i due interi (ma − mc ) e (md − mb ) devono essere uguali. La stessa espressione della parte angolare viene generalmente scritta in maniera pi` u compatta introducendo il simbolo ck (a, b) definito da # ck (a, b) = ck (la , ma ; lb , mb ) = (−1)ma (2la + 1)(2lb + 1) la lb l l l k . × a b 0 0 0 −ma mb m Si ottiene allora ∞
a, b | ×
e20 | c, d = e20 δ(msa , msc ) δ(msb , msd ) ck (a, c) ck (d, b) r12
∞
dr1 0
k=0
∞
dr2 0
k r< P (r )Pnc lc (r1 )Pnb lb (r2 )Pnd ld (r2 ) , k+1 na la 1 r>
dove la somma su k, formalmente estesa fra 0 e ∞, `e in effetti limitata dalle disuguaglianze triangolari implicitamente contenute nei simboli ck (a, c) e ck (b, d). Da questa espressione generale `e poi facile ricavare, per semplice sostituzione, le corrispondenti espressioni per gli elementi di matrice diretti e di scambio, che vengono tradizionalmente scritte nella forma seguente ∞
J(a, b) = a, b |
e20 | a, b = ak (a, b) F k (a, b) , r12 k=0
∞
K(a, b) = a, b |
e20 | b, a = δ(msa , msb ) bk (a, b) Gk (a, b) , r12 k=0
dove
233
ENERGIE DEI TERMINI
ak (a, b) = ck (a, a) ck (b, b) = (−1)ma +mb (2la + 1)(2lb + 1) lb lb k la lb la la k la k lb k , × 0 0 0 0 0 0 −ma ma 0 −mb mb 0 2 2 2 la lb k l l k bk (a, b) = ck (a, b) = (2la + 1) (2lb + 1) a b , 0 0 0 −ma mb m ∞ ∞ k r< F k (a, b) = e20 dr1 dr2 k+1 Pn2a la (r1 )Pn2b lb (r2 ) , (8.9) r 0 0 > ∞ ∞ k r< k 2 dr1 dr2 k+1 Pna la (r1 )Pnb lb (r1 )Pna la (r2 )Pnb lb (r2 ) . G (a, b) = e0 r> 0 0 (8.10) Le quantit` a F k e Gk possono essere calcolate a partire dalle autofunzioni Pnl (r), le quali dipendono dal potenziale centrale Vc (r). I coefficienti ak e bk , invece, possono essere calcolati direttamente. Essi godono delle seguenti propriet`a di simmetria rispetto agli argomenti ak(la , ma ;lb , mb ) = ak(lb , mb ;la , ma ) = ak(la , −ma ;lb , mb ) = ak(la , ma ;lb , −mb ), bk (la , ma ; lb , mb ) = bk (lb , mb ; la , ma ) = bk (la , −ma ; lb , −mb ) . I risultati ottenuti permettono in definitiva di esprimere gli elementi di matrice diagonali dell’interazione Coulombiana nella forma
Ψ(a1 , a2 , . . . , aN )|
=
coppie a,b
∞ k=0
e20 |Ψ(a1 , a2 , . . . , aN ) = r12
[J(a, b) − K(a, b)] =
coppie a,b
ak (a, b) F k (a, b) − δ(msa , msb )
∞
bk (a, b) Gk (a, b)
, (8.11)
k=0
dove a e b sono due qualsiasi degli stati (a1 , a2 , . . . , aN ) e dove la somma va estesa a tutte le N (N − 1)/2 coppie distinte.
8.5 Somme su sottozone chiuse Le somme che esprimono gli elementi di matrice dell’interazione Coulombiana si semplificano notevolmente nel caso che la configurazione contenga delle sottozone chiuse. Riferendoci prima al caso degli integrali diretti, consideriamo un elettrone appartenente a una data sottozona (nb , lb ) e andiamo a calcolare
234
CAPITOLO 8
il contributo all’elemento di matrice dell’interazione Coulombiana proveniente da tutte le possibili coppie formate da tale elettrone e da uno qualsiasi degli elettroni di una sottozona (na , la ) chiusa. Per far questo dobbiamo calcolare la seguente somma S= J(a, b) = ak (a, b) F k (a, b) . zona a
ms a ma
k
k
Sostituendo l’espressione di a (a, b) del paragrafo precedente si ottiene
S = (−1)
mb
(2 la + 1)(2 lb + 1)
la
(−1)ma
ms a ma
k 0
la ma
k 0
0
k
× F k (a, b)
la 0
la −ma
lb 0
lb 0
k 0
lb −mb
lb mb
k 0
.
Per eseguire la somma su ma contenuta in questa espressione `e sufficiente rifarsi alle propriet` a dei simboli 3-j. Poich´e si ha, per l’Eq. (7.16) 1 la la 0 = (−1)la +ma √ , (8.12) −ma ma 0 2 la + 1 si pu` o scrivere
ma
(−1)
ma
la −ma
la ma
k 0
=
la # = (−1) 2 la + 1 × −ma la
ma
la ma
0 0
la −ma
la ma
k 0
,
e tenendo presente la propriet`a dei simboli 3-j espressa dall’Eq. (7.18) # la la k = δk,0 (−1)la 2 la + 1 . (−1)ma −ma ma 0 ma
Tenendo infine conto che la somma su msa porta semplicemente un fattore 2, si ottiene lb lb 0 l l 0 S = (−1)la +mb 2 (2 la + 1)3/2 (2 lb + 1) a a 0 0 0 0 0 0 lb lb 0 × F 0 (a, b) , −mb mb 0 e tenendo ancora conto dell’Eq. (8.12) per esprimere il simbolo 3-j con l’ultima colonna nulla, si ottiene
235
ENERGIE DEI TERMINI
J(a, b) = 2 (2 la + 1) F 0 (a, b) ,
(8.13)
zona a
dove, ricordando le precedenti posizioni 0
0
F (a, b) = F (na , la ; nb , lb ) =
∞
e20
∞
dr1 0
dr2 0
1 2 P (r1 )Pn2b lb (r2 ) . r> na la
Come si pu` o notare, questa espressione non dipende dai numeri quantici mb e msb dell’elettrone nella sottozona b. Si ha quindi, se la sottozona b `e anch’essa chiusa J(a, b) = 4 (2 la + 1)(2 lb + 1) F 0 (na , la ; nb , lb ) . (8.14) zone a,b
Calcoli analoghi possono essere eseguiti per gli integrali di scambio. Di nuovo, consideriamo un elettrone che si trovi nella zona (nb lb ) e andiamo a considerare il contributo di scambio all’elemento di matrice dell’interazione Coulombiana proveniente da tutte le possibili coppie formate da tale elettrone e da uno qualsiasi degli elettroni di una sottozona (na , la ) chiusa. Per far questo dobbiamo calcolare la somma K(a, b) = δ(msa , msb ) bk (a, b) Gk (a, b) = zona a
=
ms a ma
ma
(2 la + 1)(2 lb + 1)
k
k
la 0
lb 0
k 0
2
la −ma
lb mb
k m
2 Gk (a, b) .
La somma su ma si pu` o eseguire tenendo presente che, essendo m = ma − mb , ed essendo mb fissato, si pu` o formalmente estendere tale somma anche a m. Tenendo allora presente la propriet`a espressa dall’Eq. (7.18), si ottiene zona a
K(a, b) = (2 la + 1)
la
lb 0
0
k
k 0
2 Gk (a, b) ,
(8.15)
e poich´e questo contributo non dipende n´e da mb , n´e da msb , si ottiene, se la sottozona b `e anch’essa chiusa zone a,b
K(a, b) = 2 (2 la + 1)(2 lb + 1)
la k
0
lb 0
k 0
2 Gk (na , la ; nb , lb ) .
(8.16) Con queste considerazioni abbiamo esaminato il caso delle coppie di elettroni appartenenti a zone a e b diverse. I risultati ottenuti possono per` o essere estesi
236
CAPITOLO 8
anche al caso di coppie di elettroni appartenenti alla stessa zona chiusa. Si ottiene zona a
[J(a, a ) − K(a, a )] = 2 (2 la + 1)2
1 × F 0 (na , la ; na , la ) − 2 k
la 0
la 0
k 0
2
F k (na , la ; na , la )
,
dove abbiamo sfruttato il fatto che Gk (na , la ; na , la ) = F k (na , la ; na , la ) . La stessa espressione pu`o anche essere scritta nella forma equivalente
[J(a, a ) − K(a, a )] = (2 la + 1)(4 la + 1) F 0 (na , la ; na , la )
zona a
−(2 la + 1)2
la k>0
0
la 0
k 0
2 F k (na , la ; na , la ) .
(8.17)
Tutte le quantit` a che abbiamo calcolato, relativamente alle somme su sottozone chiuse, risultano indipendenti dai numeri quantici degli elettroni appartenenti alle sottozone aperte. Abbiamo quindi ottenuto l’importante risultato che i contributi di energia Coulombiana provenienti dalle sottozone chiuse non rimuovono la degenerazione di un’assegnata configurazione. Tale degenerazione pu` o essere rimossa solo da una parte molto ristretta di tutte le possibili coppie (a, b), ovvero da quelle coppie in cui entrambi gli elettroni appartengono a sottozone aperte. Un esempio di calcolo relativo alla configurazione normale dell’atomo di Silicio, 1s2 2s2 2p6 3s2 3p2 , `e riportato nell’App. 8.
8.6 Struttura dei termini Come abbiamo visto, le sottozone chiuse sono del tutto ininfluenti nel rimuovere la degenerazione di una configurazione. Esse danno soltanto un contributo all’energia uguale per tutti i termini. La struttura vera e propria del cosiddetto multipletto, ovvero l’ordine con il quale i termini si dispongono per energia crescente, e i valori degli intervalli fra termine e termine, sono stabiliti soltanto dagli elettroni appartenenti alle sottozone aperte e possono essere valutati, caso per caso, per mezzo dei risultati contenuti nelle Tab. 8.1 e 8.2 e nell’Eq. (8.11). Nel seguito ci limitiamo a sviluppare i calcoli soltanto per la configurazione p2 , osservando che, per questo caso di due soli elettroni equivalenti, esiste una sola coppia possibile. Inoltre, le quantit` a F k (a, b) e Gk (a, b) che compaiono
237
ENERGIE DEI TERMINI
l1
m1
l2
m2
a0
a2
b0
b2
1 1 1 1
1 1 1 0
1 1 1 1
0 1 -1 0
1 1 1 1
-2/25 1/25 1/25 4/25
0 1 0 1
3/25 1/25 6/25 4/25
Tab. 8.3. Valori dei coefficienti ak e bk , per i soli valori possibili k = 0, 2, relativamente alla configurazione p2 .
nell’Eq. (8.11) coincidono, per cui la stessa equazione pu`o essere scritta nella forma Ψ(a1 , a2 )| =
∞
e20 |Ψ(a1 , a2 ) = r12
ak (a1 , a2 ) − δ(ms1 , ms2 ) bk (a1 , a2 ) F k (a1 , a2 ) .
k=0
I risultati della Tab. 8.2 mostrano che l’Eq.(8.11) deve essere valutata per varie combinazioni dei numeri quantici dei due elettroni. Questo implica la determinazione di un certo numero di simboli 3-j che portano ai valori delle quantit` a ak e bk riportate nella Tab. 8.3. Attraverso tali valori si ottengono i seguenti risultati per le energie dei termini P = F0 −
3
1 5
F2 ,
1
D = F0 +
1 25
F2 ,
1
S = F0 +
2 5
F2 .
Come si vede, siccome la quantit`a F 2 `e positiva, la struttura dei termini verifica la prima regola di Hund, gi` a illustrata nel Par. 7.12, secondo la quale il termine avente energia minore `e quello che ha molteplicit`a pi` u elevata (il termine 3P in questo caso). Gli altri termini seguono poi nell’ordine 1D, 1S, per energie crescenti. Inoltre, si ottiene un ulteriore risultato per il rapporto fra gli intervalli energetici. Si ha infatti R=
3 S − 1D = . 3 − P 2
1
1D
Questa propriet`a teorica pu`o essere messa alla prova dei fatti mediante l’osservazione degli spettri di vari elementi o ioni aventi come configurazione esterna p2 (C I, N II, O III, Si I, Ge I, Sn I, etc.). I risultati mostrano che il rapporto R per tali ioni varia fra 1.13 e 1.50 in discreto accordo con la previsione teorica. Le discrepanze devono essere attribuite al fenomeno dell’interazione fra configurazioni e alle correzioni relativistiche dell’Hamiltoniana, di cui parleremo nel capitolo seguente.
Capitolo 9
Maggiori dettagli sugli spettri L’elevata precisione con cui possono essere eseguite le misure spettroscopiche fa s`ı che l’approssimazione non relativistica introdotta nel capitolo precedente non sia sufficiente, nella stragrande maggioranza dei casi, a dare una descrizione quantitativamente adeguata degli spettri atomici. In particolare, non `e possibile spiegare, in base a tale approssimazione, la presenza negli spettri atomici di un fenomeno importantissimo quale la struttura fine. Tale fenomeno pu` o essere adeguatamente descritto considerando il contributo all’energia dell’atomo dovuto al momento angolare intrinseco dell’elettrone. Il risultato `e la rimozione della degenerazione dell’Hamiltoniana non relativistica e la conseguente separazione dei termini (individuati dai numeri quantici L e S) in livelli atomici caratterizzati dal numero quantico J. In questo capitolo ci proponiamo di analizzare in dettaglio questo fenomeno insieme ad altri fenomeni di tipo analogo che danno luogo alla rimozione della degenerazione degli stati atomici sia a causa di agenti esterni (come ad esempio un campo magnetico) che interni (spin nucleare). Questo ci porter` a alla descrizione di altri effetti caratteristici degli spettri atomici quali l’effetto Zeeman, l’effetto Paschen-Back e la struttura iperfine.
9.1 L’interazione spin-orbita Le considerazioni svolte nei Cap. 7 e 8 sono basate sull’approssimazione non relativistica dell’Hamiltoniana. Adesso `e necessario introdurre le correzioni relativistiche e analizzare in dettaglio quale sia il loro effetto sui livelli atomici. Tenendo presenti i risultati che abbiamo ottenuto nel Par. 5.5, quando abbiamo considerato il limite non relativistico al primo ordine dell’equazione di Dirac, e in particolare l’Eq. (5.13), assumeremo che, in prima approssimazione, le correzioni relativistiche siano semplicemente descritte dall’Hamiltoniana H2 data da1 H2 =
N
ξ(ri ) i · si ,
(9.1)
i=1
dove la somma `e estesa a tutti gli elettroni e dove la funzione ξ(r) `e data da 1
Si tratta del quinto termine nella parentesi quadra dell’ Eq.(5.13), quello dell’interazione spin-orbita, nel quale abbiamo effettuato la sostituzione σi = 2si .
240
CAPITOLO 9
ξ(r) =
h ¯2 1 d Vc (r) . 2 m2 c2 r dr
(9.2)
In effetti, nell’Eq. (5.13) sono presenti altri due termini di correzione non relativistica, il termine in p4 e il termine di Darwin. Tuttavia si pu` o pensare che gli effetti dovuti a tali termini, che non contengono esplicitamente gli operatori di momento angolare e che dipendono solamente dalla variabile r e dall’operatore ∂/∂r, possano ragionevolmente essere inglobati nel potenziale centrale ` anche necessario aggiungere che l’Hamiltoniana H2 descrive soltanto Vc (r). E l’interazione spin-orbita, ovvero l’interazione fra momento angolare orbitale e momento angolare intrinseco dell’elettrone, e trascura quindi l’interazione reciproca fra momenti angolari intrinseci, come ad esempio l’interazione spin-spin. Tali termini di interazione risultano tuttavia particolarmente importanti solo per l’atomo di Elio (e per la sua sequenza isoelettronica) che necessiterebbe una trattazione separata. In definitiva, l’Hamiltoniana H2 data dall’Eq. (9.1) fornisce in pratica una buona approssimazione per tutti gli atomi ad eccezione dell’atomo di Elio. Vediamo adesso le propriet` a di commutazione dei vari operatori di momento angolare con l’Hamiltoniana H2 . Iniziamo dal calcolo del commutatore del & = N momento angolare orbitale totale L j=1 j ]= [H2 , L
N N
[ ξ(ri ) i · si , j ] .
i=1 j=1
Poich´e gli operatori relativi a una particella commutano con tutti gli operatori relativi a particelle diverse, la somma doppia si restringe a una somma singola. Inoltre, osservando che l’operatore momento angolare orbitale i commuta sia con la funzione ξ(ri ) (che dipende solo dalla coordinata radiale ri ), che con l’operatore di spin si , e ricordando le propriet` a di commutazione delle componenti cartesiane dell’operatore i , si ottiene, con facili passaggi ]=i [H2 , L
N
ξ(ri ) i × si .
i=1
= Analogamente si trova che il commutatore del momento di spin totale, S &N sj , vale j=1 ] = −i [H2 , S
N
ξ(ri ) i × si ,
i=1
+ S, `e nullo per cui il commutatore del momento angolare totale, J = L [H2 , J ] = 0 .
241
MAGGIORI DETTAGLI SUGLI SPETTRI
In generale, quando si introducono le correzioni relativistiche, i numeri quantici L e S cessano di essere buoni numeri quantici (in quanto i corrispondenti operatori L2 e S 2 non commutano con l’Hamiltoniana). L’unico numero quantico che rimane “buono”, in tutta generalit` a, `e il numero quantico J (momento angolare totale). Tuttavia, se si pu`o supporre che l’Hamiltoniana H2 sia una perturbazione dell’Hamiltoniana non relativistica, ossia che valga la catena di disuguaglianze H0 H1 H2 , allora si pu` o utilizzare la teoria delle perturbazioni per la quale L e S conservano il loro valore di numeri quantici e si pu` o andare a valutare l’azione dell’Hamiltoniana relativistica calcolandone gli elementi di matrice entro il sottospazio individuato da una particolare coppia di valori (L, S) e diagonalizzando poi la matrice risultante. Questo schema di ragionamento `e noto come lo schema di accoppiamento di Russell-Saunders, o accoppiamento L-S. In tale schema si ha una gerarchia di Hamiltoniane che vengono per cos`ı dire “applicate una per volta”. Si inizia col risolvere l’equazione di Schr¨odinger per l’Hamiltoniana H0 dell’Eq. (7.3) trovando cos`ı le energie delle configurazioni. Per una configurazione assegnata, si considera l’azione dell’Hamiltoniana H1 dell’Eq. (7.4) come una perturbazione, trovando l’energia dei termini, ciascuno caratterizzato dalla coppia di valori L e S. Infine, per un termine assegnato, si considera l’azione dell’Hamiltoniana H2 come una perturbazione trovando l’energia dei livelli, ciascuno caratterizzato dal valore di J. Nello schema di accoppiamento di Russell-Saunders, dobbiamo quindi andare a valutare gli elementi di matrice di H2 sullo spazio di degenerazione di un termine assegnato. Nel Par. 7.11 abbiamo visto che le autofunzioni sono del tipo ΨA (α, L, S, ML , MS ) (si ricordi che il simbolo α rappresenta la configurazione), e che la degenerazione dello spazio `e (2L + 1)(2S + 1). Come abbiamo gi` a visto in precedenti occasioni, piuttosto di valutare gli elementi di matrice di H2 su questa base, `e pi` u opportuno introdurre una nuova base, ovvero la base sulla quale il momento angolare totale J `e diagonale. Cos`ı facendo l’Hamil Le autofunzioni toniana H2 risulta diagonale in quanto essa commuta con J. della nuova base saranno indicate coi simboli ΨA (α, L, S, J, M ) e si ottengono attraverso opportune combinazioni lineari delle ΨA (α, L, S, ML , MS ) che coinvolgono i coefficienti di Clebsh-Gordan oppure i simboli 3-j (si veda il Par.7.9 e in particolare l’Eq. (7.13)). Attraverso i coefficienti di Clebsh-Gordan si ha ΨA (α, L, S, J, M ) =
LSML MS |LSJM ΨA (α, L, S, ML , MS ) ,
ML MS
oppure, in notazione di Dirac pi` u compatta LSMLMS |LSJM |αLSML MS |αLSJM = ML MS
.
242
CAPITOLO 9
Per valutare l’effetto dell’Hamiltoniana H2 `e quindi sufficiente andare a considerare gli elementi di matrice diagonali αLSJM |H2 |αLSJM
.
Questi calcoli verranno svolti nel Par. 9.3, dopo che avremo premesso alcune considerazioni a proposito degli elementi di matrice di particolari operatori.
9.2 Il teorema di Wigner-Eckart e il teorema della proiezione Gli operatori di carattere vettoriale che si incontrano comunemente nelle applicazioni teoriche della spettroscopia soddisfano delle particolari regole di commutazione rispetto al momento angolare. Tali regole sono intimamente connesse con le propriet`a di trasformazione delle componenti cartesiane di un vettore per rotazioni nello spazio ordinario e sono della forma [Jl , vk ] = i
lkm vm ,
m
dove v `e un operatore vettoriale e dove J `e il momento angolare totale del sistema fisico che si sta considerando, oppure del sottosistema sul cui spazio agisce l’operatore v . Questa regola di commutazione si applica a un’estesa classe di operatori vettoriali (in realt` a a tutti gli operatori vettoriali che si possono considerare, pur di inglobare in J il momento angolare totale relativo a ciascun sottosistema che compone il sistema fisico). Alcuni esempi sono dati nel seguito; le relative dimostrazioni sono banali e non sono riportate esplicitamente. (a) Il momento angolare totale soddisfa la regola di commutazione rispetto a se stesso. (b) Per un sistema composto da pi` u sottosistemi, se J = J1 + J2 + · · ·, e se ciascun momento angolare commuta con tutti gli altri momenti angolari, allora ciascun addendo soddisfa la regola di commutazione rispetto a se stesso e rispetto a J. (c) Per un sistema composto di una sola particella, sia la coordinata r che l’impulso p soddisfano la regola di commutazione sia rispetto al momento angolare orbitale che rispetto al momento angolare totale j = + s, dove s `e lo spin. (d) Sempre per un sistema composto da una sola particella, s soddisfa la regola di commutazione sia rispetto a se stesso che rispetto a j. (e) Per un sistema composto di N particelle, se J = 1 + 2 + · · · + N + s1 + s2 + · · · + sN , la coordinata ri , l’impulso pi , il momento angolare orbitale i , il momento di spin si , il momento angolare totale ji , tutti relativi alla particella i-esima, soddisfano la regola di commutazione rispetto a J.
243
MAGGIORI DETTAGLI SUGLI SPETTRI
(f) La regola `e soddisfatta da una qualsiasi combinazione lineare di operatori vettoriali che soddisfano la regola medesima. (g) La regola `e soddisfatta dal prodotto vettoriale di due operatori vettoriali che soddisfano la regola medesima. Infine si pu` o osservare che, se v e w sono due operatori vettoriali che soddisfano la regola, il loro prodotto scalare v · w commuta con J. Una conseguenza importante della regola di commutazione sopra illustrata `e il cosiddetto teorema di Wigner-Eckart attraverso il quale `e possibile trovare un’espressione particolarmente semplice per gli elementi di matrice delle cosiddette componenti sferiche degli operatori vettoriali fra autostati del momento angolare. Le componenti sferiche di un operatore vettoriale, vq (q = −1, 0, 1), sono definite, a partire dalle componenti cartesiane, attraverso le relazioni 1 v−1 = √ (vx − i vy ) , 2
v0 = vz ,
1 v1 = − √ (vx + i vy ) . 2
(9.3)
Per gli elementi di matrice di tali componenti si ha (teorema di Wigner-Eckart) αJM | vq |α J M = J 1M q|JM
αJ||v||α J
,
dove J 1M q|JM `e un coefficiente di Clebsh-Gordan e dove αJ||v||α J `e il cosiddetto elemento di matrice ridotto (indipendente da M , M e q) dell’operatore vettoriale v . Introducendo i simboli 3-j in luogo dei coefficienti di Clebsh-Gordan, il teorema di Wigner-Eckart pu` o anche essere espresso nella forma
αJM | vq |α J M
J +M+1
= (−1)
√ 2J + 1
J −M
J M
1 q
αJ||v||α J .
(9.4) Tenendo conto delle propriet` a dei simboli 3-j, si vede che l’elemento di matrice pu` o risultare diverso da zero solo se sono verificate le “regole di selezione” ΔJ = ±1, 0 ,
0 −→ / 0 ,
ΔM = ±1, 0 .
Il teorema di Wigner-Eckart, che `e stato qui enunciato senza darne la dimostrazione formale, `e effettivamente pi` u generale, in quanto esso esprime, in termini di simboli 3-j ed elementi di matrice ridotti, gli elementi di matrice fra autostati del momento angolare di operatori tensoriali irriducibili di rango k qualsiasi (k = 0, 1, 2, . . .). Gli operatori vettoriali, una volta espressi attraverso le componenti sferiche, sono operatori tensoriali irriducibili di rango 1. Attraverso il teorema di Wigner-Eckart `e possibile dimostrare un altro importante teorema che prende il nome di teorema della proiezione e che riguarda gli elementi di matrice diagonali rispetto al numero quantico J. Per dimostrare
244
CAPITOLO 9
questo teorema, consideriamo l’elemento di matrice dell’operatore J · v . Come `e facile verificare, tale prodotto scalare, introducendo le componenti sferiche, pu` o esprimersi nella forma J · v =
(−1)q J−q vq ,
(9.5)
q
da cui si ottiene αJM |J · v |α JM =
(−1)q αJM |J−q vq |α JM
.
q
a scritto nella forma Inserendo fra gli operatori J−q e vq l’operatore identit` 1=
α
J
|α J M
α J M | ,
M
tenendo conto che l’operatore J−q `e diagonale rispetto ai numeri quantici α e J e applicando due volte il teorema di Wigner-Eckart, si ottiene αJM |J · v |α JM =
(−1)q+(J+M+1)+(J+M
+1)
(2J + 1)
qM
×
J −M
J M
1 −q
J −M
J M
1 q
αJ||J||αJ
αJ||v||α J
.
Si pu` o poi osservare che l’esponente di (−1) pu` o essere posto nella forma q+(J +M +1)+(J +M +1) = q+(J +M +1)−(J +M +1) = q+M −M = 0 . Inoltre, cambiando di segno la seconda riga del secondo 3-j, invertendo le prime due colonne dello stesso simbolo e tenendo presente la propriet` a di ortonormalit` a dei simboli 3-j (Eq. (7.19), (7.20) e (7.18)) si ottiene αJM |J · v |α JM = αJ||J||αJ
αJ||v||α J δMM .
permette di valutare l’elemento di Questa formula, nel caso particolare v = J, matrice ridotto di J. Tenendo infatti presente che l’autovalore di J 2 `e J(J + 1) e immedesimando α con α , si ha J(J + 1) = αJM |J · J |αJM
= ( αJ||J||αJ )2 .
Consideriamo adesso il seguente elemento di matrice αJM |Jq (J · v )|α JM
.
245
MAGGIORI DETTAGLI SUGLI SPETTRI
z
J v x vefficace
y Fig. 9.1. Il vettore v precede rapidamente intorno a J dimodoch´e le sue componenti in direzione perpendicolare a J sono in media nulle.
Inserendo di nuovo l’identit` a fra gli operatori Jq e (J · v ), applicando due volte il teorema di Wigner-Eckart (una volta nella forma diretta e una in quella inversa) e tenendo conto dei risultati precedenti, si ottiene αJM |Jq (J · v )|α JM = αJM |Jq |αJM √ = (−1)J+M+1 2J + 1
J −M
= J(J + 1) αJM |vq |α JM
J M
1 q
αJM |J · v |α JM =
J(J + 1) αJ||v||α J =
.
Si pu` o quindi concludere che, al fine di valutare gli elementi di matrice diagonali rispetto a J, vale l’identit` a operatoriale J 2 v = J (J · v ) , ovvero, quando J = 0 v =
J (J · v ) . J2
(9.6)
Questa equazione si interpreta fisicamente dicendo che il vettore v precede rapidamente intorno al momento angolare J in modo tale che le componenti di v perpendicolari a J sono in media nulle e la sola componente “efficace” ri come esemplificato nella Fig. 9.1. Dal punto di mane quella diretta lungo J,
246
CAPITOLO 9
vista storico, bisogna sottolineare che il teorema della proiezione `e stato comunemente utilizzato, seppur in maniera intuitiva, fin dalle prime applicazioni della meccanica quantistica alla fisica atomica. Il fatto che esso possa essere dimostrato in maniera rigorosa costituisce una prova formale della correttezza di tali applicazioni.
9.3 La regola degli intervalli di Land´ e Nello schema di accoppiamento di Russell-Saunders, le correzioni alle energie dei termini, ΔEJ , dovute all’Hamiltoniana H2 dell’Eq. (9.1), sono date da elementi di matrice diagonali della forma ΔEJ =
N
αLSJM |ξ(ri ) i · si |αLSJM
.
i=1
Per calcolare questi elementi di matrice `e conveniente passare alla base degli autovettori di L2 , S 2 , Lz e Sz mediante la consueta trasformazione di similitudine in termini dei coefficienti di Clebsh-Gordan (Eq. (7.13))
ΔEJ =
LSJM |LSMLMS
M ML MS ML S
×
N
αLSML MS |ξ(ri ) i · si |αLSML MS
LSML MS |LSJM
.
i=1
Nell’elemento di matrice centrale, l’operatore ξ(ri ) i agisce solo sulle variabili angolari, mentre l’operatore si agisce solo su quelle di spin. Ricordando quindi che l’autofunzione |αLSML MS pu` o anche scriversi nella forma di prodotto diretto |αLML |SMS , si ottiene per tale elemento di matrice αLSML MS |ξ(ri ) i · si |αLSML MS = = αLML |ξ(ri ) i |αLML · SMS |si |SMS
.
Gli elementi di matrice del secondo membro possono essere valutati mediante il teorema della proiezione (Eq. (9.6)). Si ottiene αLSML MS |ξ(ri ) i · si |αLSML MS = |αLM · SMS |S |SM = = ζi (α, LS) αLML |L L S ·S |αLM M = ζi (α, LS) αLSML MS |L L S
,
247
MAGGIORI DETTAGLI SUGLI SPETTRI
dove abbiamo introdotto la quantit` a ζi (α, LS) (indipendente dai numeri quantici ML e MS ) definita da · i |αLML SMS |S · si |SMS αLML | ξ(ri ) L L(L + 1) S(S + 1)
ζi (α, LS) =
Si pu` o quindi scrivere
.
(9.7)
αLSML MS | ξ(ri ) i · si |αLSML MS =
i
·S |αLSML MS = ζ(α, LS) αLSML MS | L
,
(9.8)
dove si `e posto ζ(α, LS) =
N
ζi (α, LS) .
(9.9)
i=1
Introducendo l’espressione trovata nell’equazione per ΔEJ e sommando sui coefficienti di Clebsh-Gordan, si ottiene infine ·S |αLSJM ΔEJ = ζ(α, LS) αLSJM |L
.
Attraverso questa serie di passaggi siamo quindi riusciti a mostrare che, al fine del calcolo degli elementi di matrice diagonali sulla base degli autovettori |αLSJM , l’Hamiltoniana H2 equivale, a parte un fattore di proporzionalit` a, · S. Osservando poi che all’operatore L 2 +S ·S , = L2 + S 2 + 2 L J2 = L si ottiene ·S = L
1 2
(J 2 − L2 − S 2 ) ,
per cui ΔEJ =
1 2
ζ(α, LS) [J(J + 1) − L(L + 1) − S(S + 1)] .
La formula ottenuta permette di valutare con relativa semplicit` a la struttura fine dei termini, ovvero le energie del “multipletto di livelli” in cui si scinde un termine a causa delle correzioni relativistiche dell’Hamiltoniana, cio`e, sostanzialmente, a causa dell’interazione spin-orbita. In particolare, per l’intervallo di energia fra due livelli adiacenti, si ottiene ΔEJ − ΔEJ−1 = ζ(α, LS) J ,
248
CAPITOLO 9
J=0 J=1
|ζ| 2| ζ |
J=2 3| ζ | 5
D
J=3 4| ζ | J=4
Fig. 9.2. Il termine fondamentale dell’atomo di Ferro, a5D, che presenta un valore di ζ negativo, si separa in cinque livelli distinti di struttura fine, ciascuno caratterizzato da un particolare valore di J. Gli intervalli fra i livelli soddisfano la regola di Land´e.
un risultato che si enuncia dicendo che l’intervallo fra una coppia di livelli adiacenti di un multipletto `e proporzionale al valore J pi` u elevato della coppia. Questo fatto `e noto come la regola degli intervalli di Land´e. Tale regola pu`o essere convenientemente utilizzata per verificare a posteriori, per mezzo degli intervalli osservati, quanto sia valido lo schema dell’accoppiamento L-S per la descrizione di un particolare termine di un atomo (o di uno ione). Per illustrare questi concetti consideriamo il caso particolare del termine fondamentale del Ferro, denominato spettroscopicamente a5D, il simbolo a rappresentando la configurazione 1s2 2s2 2p6 3s2 3p6 3d6 4s2 . Essendo L = 2 e S = 2, si possono avere cinque valori diversi di J, ovvero J = 0, 1, 2, 3, 4. Poich´e la costante ζ(α, LS) `e negativa, il multipletto `e, come si dice, invertito, i valori pi` u piccoli di J corrispondendo a valori pi` u elevati dell’energia. La struttura fine del multipletto `e mostrata nella Fig. 9.2 insieme alla corrispondente regola degli intervalli. Assumendo uguale a 1 l’intervallo fra i livelli J = 0 e J = 1, la teoria d` a per gli intervalli successivi i valori 2, 3, e 4, rispettivamente. L’analisi spettroscopica mostra invece che tali intervalli sono pari a 2.05, 3.20, e 4.62 e se ne pu` o concludere che lo schema dell’accoppiamento L-S `e ragionevolmente valido per descrivere questo termine. Infine, `e opportuno osservare che se si considera l’energia baricentrica di un multipletto, definita da ΔEJ
=
J
si ottiene
(2J + 1) ΔEJ ,
249
MAGGIORI DETTAGLI SUGLI SPETTRI
ΔEJ
= ζ(α, LS)
L+S
(2J + 1) [J(J + 1) − L(L + 1) − S(S + 1)] .
J=|L−S|
Per mezzo delle formule elementari che danno le somme delle potenze dei primi n interi (o semi-interi) si pu` o facilmente verificare che ΔEJ
=0 ,
il che significa che l’interazione spin-orbita scinde un termine in un multipletto senza per` o alterarne l’energia media. L’applicazione del teorema della proiezione ci ha consentito di ottenere direttamente la regola degli intervalli di Land´e e ci ha fornito un’espressione per la costante ζ(α, LS) che quantifica la separazione fra i livelli (Eq. (9.9) e (9.7)). In alcuni casi semplici, tale espressione pu`o essere ulteriormente sviluppata con metodi elementari, qualora si ammetta, cosa per altro intuitiva, che gli elettroni appartenenti a sottozone chiuse non portino alcun contributo al calcolo di ζ(α, LS). Questo comporta che la somma sugli elettroni che compare nell’Eq. (9.9) pu` o essere ristretta ai soli elettroni ottici. Se si considera ad esempio il caso di un solo elettrone nella sottozona nl, il valore di ζ(α, LS) si pu` o facilmente determinare a partire dall’Eq. (9.7). = s e ricordando l’espressione della funzione ξ(r) Osservando che L = e che S (Eq. (9.2)), si ottiene ζ(α, LS) = ζnl , dove ζnl
h ¯2 = 2 m 2 c2
0
∞
2 Pnl (r)
1 d Vc (r) dr . r dr
(9.10)
Poich´e la funzione Vc (r) `e una funzione prevalentemente crescente2 di r, la quantit` a ζnl risulta essere positiva. Essa pu` o essere direttamente valutata qualora si conosca l’espressione del potenziale centrale Vc (r) e quella delle corrispondenti funzioni d’onda Pnl (r). Nel caso poi che si abbiano due elettroni (equivalenti o non equivalenti), si · pu` o osservare che gli operatori L 1 (e operatori simili) possono essere espressi − 1 attraverso operatori diagonali. Si ha infatti, essendo 2 = L 2 − 22 = L 1 , 2
Per atomi complessi si pu` o verificare che esistano degli intervalli ristretti in r in cui la funzione Vc decresce.
250
CAPITOLO 9
da cui si ottiene · L 1 =
1 2
(L2 + 21 − 22 ) .
s1 = S·
1 2
(S 2 +s21 −s22 ) ,
Analogamente si ottiene L· 2 =
1 2
(L2 +22 −21 ) ,
s2 = S·
1 2
(S 2 +s22 −s21 ) .
Per un termine proveniente dalla configurazione dei due elettroni n1 l1 e n2 l2 , ricordando che s21 = s22 = 34 , ed escludendo il caso dei singoletti (per S = 0 non ha senso parlare di struttura fine e le formule restano indeterminate), dalle Eq. (9.9) e (9.7) si ottiene ζ(n1 l1 n2 l2 ,3L) =
1 4
ζn1 l1
+ 14 ζn2 l2
L(L + 1) + l1 (l1 + 1) − l2 (l2 + 1) L(L + 1) L(L + 1) + l2 (l2 + 1) − l1 (l1 + 1) . L(L + 1)
(9.11)
In particolare, se i due elettroni sono equivalenti (ma non riempiono la sottozona), ζ(nl2 ,3L) =
1 2
ζnl .
Quando si hanno tre o pi` u elettroni, equivalenti o non, il calcolo di ζ(α, LS) non pu` o pi` u essere effettuato con metodi elementari ma deve essere impostato attraverso la regola della traccia, come illustrato dettagliatamente per un caso particolare nell’App. 9. In base alla regola della traccia si pu`o poi dimostrare facilmente che, per le configurazioni di elettroni equivalenti, il segno di ζ(α, LS) `e positivo quando il numero di elettroni che occupano la sottozona aperta `e inferiore alla met` a del numero massimo di elettroni che possono occupare la sottozona medesima, ovvero se qnl < Ql /2 = (2l + 1), nelle notazioni impiegate nel Par. 7.6. Se invece qnl > Ql /2, il valore di ζ(α, LS) risulta negativo. Nei casi in cui ζ(α, LS) `e positivo l’energia dei livelli aumenta con J, mentre l’opposto accade quando ζ(α, LS) `e negativo. Nel primo caso si dice che si ha a che fare con multipletti regolari, mentre, nel secondo caso, si dice che si ha a che fare con multipletti invertiti, come nella Fig. 9.2. Quanto detto `e riassunto dalla regola empirica che prende il nome di seconda regola di Hund. Tale regola afferma che i multipletti derivanti da elettroni equivalenti sono regolari quando risulta occupata meno della met`a della sottozona, invertiti quando risulta occupata pi` u di met` a della sottozona3 . Ad esempio, se si considerano le 3
Il caso in cui ` e occupata esattamente met` a della sottozona `e “indecidibile”, nel senso che la teoria prevede risultato nullo per ζ. In effetti, i valori sperimentali di ζ risultano molto piccoli per queste configurazioni. Il fatto che il loro valore non sia rigorosamente nullo deve essere ascritto al venir meno delle approssimazioni introdotte.
MAGGIORI DETTAGLI SUGLI SPETTRI
251
J=3 3
D
J=2 J=1
J=2 3
P
J=1 J=0
Fig. 9.3. Delle nove possibili transizioni fra i livelli J disegnati in figura, solo sei sono permesse dalle regole di selezione ΔJ = 0, ±1.
configurazioni di elettroni p equivalenti, le configurazioni p e p2 danno luogo a multipletti regolari, la configurazione p3 `e indecidibile, le configurazioni p4 e p5 danno luogo a multipletti invertiti, mentre la configurazione p6 , corrispondendo a una sottozona chiusa, d` a origine al solo termine 1S che non si separa in un multipletto. I livelli di struttura fine di un multipletto possono combinare con i livelli di struttura fine di un altro multipletto obbedendo alle regole di selezione ΔJ = 0, ±1 ,
0 −→ / 0 ,
che vanno ovviamente aggiunte a quelle gi` a viste nel Par. 7.13 e che concernono le intercombinazioni fra configurazioni e fra termini. L’insieme delle righe cos`ı ottenuto costituisce un cosiddetto multipletto di righe e ciascun multipletto (che corrisponde a una coppia di termini) riceve un’opportuna numerazione nelle tabelle spettroscopiche (la numerazione `e praticamente arbitraria e deriva sostanzialmente da ragioni storiche). Come esempio illustrativo si pu` o considerare il multipletto numero 1 del C I che deriva dalla transizione fra il termine 2p 3s 3P e il termine 2p 3p 3D. Il termine 3P consta di tre livelli di struttura fine, 3P0 , 3P1 e 3P2 , cos`ı come il termine 3D consta dei tre livelli, 3D1 , 3D2 e 3D3 . Tenendo conto delle regole di selezione si ottiene un multipletto di sei righe, come illustrato nella Fig. 9.3.
252
CAPITOLO 9
9.4 L’accoppiamento j-j e l’accoppiamento intermedio I risultati dei paragrafi precedenti sono stati ottenuti nello schema di accoppiamento L-S che `e basato sulla “gerarchia” di Hamiltoniane sintetizzata dalle disuguaglianze H0 H1 H2 . Sebbene l’accoppiamento L-S sia appropriato per descrivere gli spettri di numerosi elementi e ioni (e in particolare gli elementi pi` u semplici, aventi numero di carica Z basso), esistono numerose situazioni nelle quali esso cessa di essere valido in quanto le due Hamiltoniane H1 e H2 risultano confrontabili, oppure, in alcuni casi, addirittura “invertite”, nel senso che l’Hamiltoniana di spin-orbita predomina sull’Hamiltoniana di interazione Coulombiana. Per trattare questi casi limite, in cui H0 H2 H1 , si ricorre a un nuovo schema di accoppiamento detto accoppiamento j-j. e S ma, come `e faL’Hamiltoniana H2 non commuta con gli operatori L cile verificare, commuta con i momenti angolari totali ji dei singoli elettroni, L’effetto dell’Hamiltoniana H2 oltre che con il momento angolare totale J. sugli stati degeneri dell’Hamiltoniana H0 , ovvero sulle configurazioni, `e quindi quello di suddividere una configurazione in tanti termini caratterizzati, invece che dai numeri quantici L e S, dall’insieme dei numeri quantici ji . Al solito, per determinare l’azione di H2 sugli autostati degeneri di H0 , `e conveniente introdurre una base sulla quale H2 sia gi`a diagonale. Per questo, partendo dalle funzioni di particella singola ψnlmms , consideriamo delle loro combinazioni lineari (ottenute per mezzo dei coefficienti di Clebsh-Gordan), che siano autostati degli operatori j 2 e jz . Indicando con mj l’autovalore dell’operatore jz , tali autofunzioni sono del tipo ψnljmj =
lsmms |lsjmj ψnlmms .
mms
A partire da queste autofunzioni di particella singola, `e possibile costruire delle autofunzioni antisimmetrizzate (ovvero del tipo di determinante di Slater) per il sistema complessivo di N elettroni. Indicando con b1 il set di numeri quantici (n, l, j, mj ) del primo elettrone, con b2 l’analogo set di numeri quantici del secondo elettrone, e cos`ı via, si ottengono le autofunzioni ΨA (b1 , b2 , . . . , bN ), in maniera del tutto analoga a quanto avevamo visto a suo tempo per le autofunzioni ΨA (a1 , a2 , . . . , aN ). Mentre queste ultime sono le pi` u appropriate per trattare il caso dell’accoppiamento L-S, le prime sono pi` u appropriate per trattare il caso dell’accoppiamento j-j. L’Hamiltoniana H2 `e diagonale su questa base, in quanto essa pu`o essere posta nella forma
253
MAGGIORI DETTAGLI SUGLI SPETTRI
H2 =
N
ξ(ri ) i · si =
i=1
N
ξ(ri ) 12 (ji2 − 2i − s2i ) ,
i=1
e si ottiene quindi
ΨA (b1 , b2 , . . . , bN |H2 |ΨA (b1 , b2 , . . . , bN ) =
1 2
N
ζni li [ji (ji +1)−li (li +1)− 34 ] ,
i=1
dove le quantit` a ζnl sono le stesse di quelle introdotte nell’Eq. (9.10). Consideriamo adesso una configurazione assegnata. Innanzitutto si pu` o osservare che il contributo proveniente dalle sottozone chiuse `e nullo. Infatti, per una sottozona nl chiusa, i possibili valori di j sono, se l = 0, (l − 12 ) e (l + 12 ), e si ha, come `e facile verificare
l+1/2
(2j + 1) [ j(j + 1) − l(l + 1) −
3 4
]=0 .
j=l−1/2
Ad esempio, se si considera la configurazione p6 , i due possibili valori di j sono 21 e 32 e si hanno due elettroni aventi j = 12 (ciascuno con una delle due possibili proiezioni mj = ± 12 ) e quattro elettroni aventi j = 32 (ciascuno con una delle quattro possibili proiezioni mj = ± 12 , ± 23 ). Questo esempio illustra il significato della somma che appare nell’equazione precedente. Restano quindi da considerare soltanto gli elettroni appartenenti a sottozone aperte. Senza sviluppare i calcoli in generale, rifacciamoci semplicemente al caso in cui si abbiano due elettroni p non equivalenti, ovvero consideriamo la configurazione np n p (con n = n ). Poich´e entrambi gli elettroni possono avere j = 12 oppure j = 32 , si ottengono quattro stati aventi energie E(j1 , j2 ) date da E( 32 , 32 ) = E( 12 , 32 )
1 2
(a + b) ,
= −a +
1 2
b ,
E( 32 , 12 ) = E( 12 , 12 )
1 2
a−b ,
= −a − b ,
dove a = ζnp ,
b = ζn p .
Si ottiene quindi per la configurazione pp una struttura di termini che `e profondamente diversa dall’analoga struttura del caso dell’accoppiamento L-S (che consta, fra l’altro, di sei termini invece che di quattro). Lo stesso tipo di ragionamento si pu` o anche utilizzare per la configurazione np2 di due elettroni equivalenti. In questo caso si ottengono tre termini aventi energie E( 32 , 32 ) = a ,
E( 32 , 12 ) = − 21 a ,
E( 12 , 12 ) = −2 a ,
254
CAPITOLO 9
dove a = ζnp . I termini di accoppiamento j-j che cos`ı si ottengono sono degeneri. Ad esempio, nel caso della configurazione p2 , i tre termini che abbiamo ottenuti sono rispettivamente degeneri 6 volte, 8 volte e 1 volta. Su tale spazio di degenerazione si potrebbero poi andare a calcolare gli elementi di matrice dell’Hamiltoniana H1 , ovvero sostanzialmente dell’interazione Coulombiana. Si tratta di un argomento piuttosto complesso sul quale per` o non ci addentriamo oltre. Come abbiamo gi` a detto, in molti casi le due Hamiltoniane H1 e H2 sono confrontabili per cui non si pu` o applicare n´e lo schema di accoppiamento L-S, n´e quello j-j. In questi casi si parla di accoppiamento intermedio e i calcoli di struttura atomica risultano molto pi` u complessi in quanto le due Hamiltoniane devono essere diagonalizzate contemporaneamente e non una alla volta. In generale si preferisce lavorare sulla base degli autostati dell’accoppiamento L-S (la base cio`e in cui sono diagonali gli operatori L2 , Lz , S 2 e Sz ). Gli stati atomici, caratterizzati in ogni caso dai numeri quantici J e M (si ricordi che l’Hamiltoniana totale commuta con l’operatore J ), possono allora essere espressi, in generale, da combinazioni lineari della forma |αJM
=
CLS |αLSJM
,
(9.12)
LS
dove la somma `e estesa a tutti i valori di L e S compatibili con la configurazione α e con il valore di J, e dove i CLS sono i coefficienti dello sviluppo, che possono essere ottenuti mediante la diagonalizzazione di cui sopra, e che soddisfano la condizione di normalizzazione
|CLS |2 = 1 .
LS
Nella maggior parte dei casi esiste un particolare valore della coppia di numeri quantici (L, S) tale che il relativo coefficiente `e molto maggiore di tutti gli altri. Se si indica con (L0 , S0 ) tale coppia di valori, `e consuetudine, nella pratica spettroscopica, assegnare allo stato in questione i numeri quantici L 0 , S0 , anche se, in effetti, si tratta sempre di un’assegnazione approssimata. Una cosa del tutto simile avviene anche per la configurazione quando si presenta il fenomeno dell’interazione fra configurazioni. I numeri quantici α, L, S che vengono assegnati a un particolare stato atomico, codificati nelle tabelle spettroscopiche o nei relativi diagrammi di Grotrian, devono quindi essere sempre pensati come approssimati. L’ordine di approssimazione dipende dal rapporto fra i coefficienti dei termini dello sviluppo che vengono trascurati e il coefficiente del termine preponderante.
MAGGIORI DETTAGLI SUGLI SPETTRI
255
9.5 L’effetto Zeeman classico Questo effetto fu scoperto nel 1896 dal fisico olandese Pieter Zeeman il quale osserv` o che, in presenza di un campo magnetico relativamente intenso (dell’ordine del migliaio di gauss nelle esperienze originali), le righe spettrali di alcuni elementi si separano in vari componenti aventi particolari caratteristiche di intensit` a e polarizzazione. I risultati delle esperienze di Zeeman possono essere cos`ı riassunti: a) Osservando la radiazione proveniente da una lampada di scarica immersa in un campo magnetico, una riga spettrale si separa, nei casi pi` u semplici, in tre componenti. Indicando con ν0 la frequenza della riga imperturbata, le tre componenti si trovano alle frequenze ν0 − νL , ν0 , e ν0 + νL , dove νL `e la cosiddetta frequenza di Larmor4 data da νL =
e0 B = 1.3996 × 106 B s−1 , 4π m c
(9.13)
essendo B l’intensit` a del campo magnetico espressa in gauss. b) Osservando in direzione parallela al campo magnetico la componente centrale scompare mentre le altre due componenti risultano polarizzate circolarmente, una con polarizzazione destra, l’altra con polarizzazione sinistra. c) Osservando in direzione perpendicolare al campo magnetico, le tre componenti risultano polarizzate linearmente; quella centrale in direzione parallela al campo magnetico (componente π) e quelle laterali in direzione perpendicolare al campo magnetico (componenti σ). Le osservazioni di Zeeman furono rapidamente interpretate dallo stesso Zeeman e da Lorentz in base alla teoria classica dell’elettrone (la Meccanica Quantistica non era ancora nata). In base a tale teoria, si schematizzano gli atomi come oscillatori classici costituiti da una carica elettrica che si muove sotto l’azione di una forza di richiamo elastica, e, per interpretare l’emissione di una riga atomica alla frequenza ν0 , si assume fenomenologicamente che la costante elastica sia tale da dare una frequenza di risonanza dell’oscillatore pari proprio a ν0 . Indicando con x la coordinata della carica, si assume quindi che, in assenza di perturbazioni esterne, l’equazione di moto della carica sia d2 x = −4π 2 ν02 x . dt2 l’equazione di moto risulta modificata Introducendo un campo magnetico B, per la presenza della forza di Lorentz. Assumendo che la carica oscillante sia un elettrone con massa m e carica −e0 , l’equazione di moto risulta 4
Tradotta in termini di frequenze angolari, la frequenza di Larmor risulta ω L = 2π νL = e0 B/(2mc). Essa ` e quindi pari a un mezzo della frequenza di ciclotrone che abbiamo introdotto nel Cap. 3 (si veda l’Eq. (3.30)).
256
CAPITOLO 9
d2 x e0 dx . ×B = −4π 2 ν02 x − dt2 m c dt Se si descrive il vettore x attraverso le sue componenti cartesiane, le equazioni differenziali che abbiamo ottenute risultano accoppiate. Per disaccoppiarle `e conveniente introdurre le componenti di x sui tre vettori unitari u −1 , u0 e u1 definiti da 1 u−1 = √ (ı + i j ) , 2
u0 = k ,
1 u1 = √ (−ı + i j ) , 2
dove (ı, j, k ) `e una terna cartesiana ortogonale con l’asse k diretto lungo il & campo magnetico. Ponendo allora x = α xα uα , e osservando che = B uα × u0 = −i B α uα , uα × B
(α = −1, 0, 1) ,
si ottengono per le componenti xα le seguenti equazioni disaccoppiate d2 xα dxα . = −4π 2 ν02 xα + 4π i α νL dt2 dt Cercando una soluzione di questa equazione della forma xα = Aα e−2πi να t , con Aα costante, si ottiene per να l’equazione di secondo grado να2 + 2 α νL να − ν02 = 0 , e osservando infine che per campi magnetici tipici di laboratorio (B < 10 5 G) si ha νL ν0 , si ottiene να = ν0 − α νL . Attraverso la teoria classica dell’elettrone si `e quindi ottenuto un risultato che spiega perfettamente le osservazioni di Zeeman: sotto l’azione di un campo magnetico si ottengono tre oscillatori distinti aventi frequenze ν0 − νL , ν0 e ν0 + νL . L’oscillatore alla frequenza ν0 `e un oscillatore lineare diretto lungo il campo magnetico, mentre gli altri due sono oscillatori circolari perpendicolari al campo magnetico e di senso opposto, come illustrato nella Fig. 9.4. Attraverso tali oscillatori si spiegano facilmente le caratteristiche di frequenza e le propriet`a di polarizzazione dei vari componenti osservati nell’effetto Zeeman. Ulteriori osservazioni dell’effetto Zeeman, effettuate su un numero sempre crescente di righe spettrali e con apparati spettroscopici aventi potere risolutivo mano a mano pi` u elevato, mostrarono tuttavia l’esistenza di una fenomenologia pi` u complessa (dovuta in ultima analisi allo spin dell’elettrone) che non poteva
257
MAGGIORI DETTAGLI SUGLI SPETTRI
Oscillatore lineare
Campo magnetico
Oscillatori circolari
Fig. 9.4. Modello classico degli oscillatori. La frequenza ` e ν 0 per l’oscillatore lineare e ν0 ± νL per gli oscillatori circolari.
essere interpretata attraverso la teoria classica sviluppata da Zeeman e Lorentz. Per descrivere i casi pi` u complessi si inizi` o a parlare di effetto Zeeman anomalo per distinguerlo dall’effetto Zeeman normale, caratterizzato dai fatti sperimentali enunciati sopra e descrivibile mediante la teoria classica. Oggi, alla luce della moderna teoria quantistica, la distinzione fra effetto Zeeman normale e effetto Zeeman anomalo appare superata e l’interpretazione si effettua con la teoria quantistica, capace di inglobare coerentemente i due casi.
9.6 L’effetto Zeeman quantistico L’effetto di un campo magnetico uniforme su un sistema atomico pu`o essere descritto aggiungendo all’Hamiltoniana “imperturbata” un termine che descrive l’interazione fra il sistema stesso e il campo magnetico. Tale termine `e stato determinato, per un elettrone singolo, considerando il limite non relativistico dell’equazione di Dirac. Generalizzando l’Eq. (5.11) al caso di N elettroni, e ricordando la definizione di μ0 (Eq. (5.17)), l’Hamiltoniana magnetica risulta +2S )·B + HM = μ0 (L
N e20 B 2 2 r , 8 m c2 i=1 i⊥
dove ri⊥ `e la componente del vettore di posizione dell’elettrone i-esimo nel Il secondo termine che appare in questa equazione, piano perpendicolare a B. il cosiddetto termine diamagnetico, `e di importanza trascurabile rispetto al primo. Osserviamo infatti che i due termini risultano confrontabili per un valore “critico” del campo magnetico dato da
258
CAPITOLO 9
Bc
h ¯c 2 e0 r⊥
,
e, assumendo per r⊥ un valore dell’ordine del raggio della prima orbita di Bohr, si ottiene, con facili trasformazioni Bc
e30 m2 c = 2.351 × 109 G . h ¯3
Il valore che abbiamo ottenuto `e molto elevato ed `e ben al di sopra dei tipici valori di campo magnetico realizzabili in laboratorio. Anche negli oggetti astronomici, un campo magnetico dell’ordine di Bc costituisce una rarit`a. Si pensa infatti che valori di B cos`ı elevati possano trovarsi soltanto su stelle nane bianche magnetiche oppure su stelle di neutroni (pulsar). D’altra parte si pu` o osservare che l’energia magnetica associata a Bc , μ0 Bc , risulta esattamente pari all’energia di ionizzazione dell’atomo di Idrogeno e, per tali valori di campo magnetico, i calcoli di struttura atomica dovrebbero essere reimpostati ab initio. Trascurando quindi il secondo termine, assumiamo per l’Hamiltoniana magnetica l’espressione + 2S )·B = μ0 (J + S )·B , HM = μ0 (L ovvero, introducendo un sistema di coordinate cartesiane in modo che l’asse z sia diretto lungo la direzione del campo magnetico HM = μ0 B (Jz + Sz ) . L’Hamiltoniana magnetica obbedisce alle seguenti regole di commutazione [HM , Jz ] = 0 ,
[HM , Jx ] = 0 ,
[HM , Jy ] = 0 ,
il che significa che, in generale, il numero quantico J perde il suo significato di buon numero quantico, mentre tale propriet` a `e conservata dal numero quantico magnetico M . L’effetto dell’Hamiltoniana magnetica sui livelli atomici pu` o essere valutato con semplicit`a quando si supponga che tale Hamiltoniana possa essere considerata una perturbazione rispetto all’Hamiltoniana imperturbata H = H0 + H1 + H2 . In tal caso, indipendentemente dal tipo di accoppiamento valido per gli autostati di H, `e sufficiente calcolare gli elementi di matrice diagonali αJM |HM |αJM
= μ0 B αJM |Jz + Sz |αJM
,
in quanto gli elementi di matrice non diagonali sono nulli (HM commuta con Jz ). Applicando il teorema della proiezione (Eq. (9.6)) si ottiene, per J = 0,
259
MAGGIORI DETTAGLI SUGLI SPETTRI
μ0 B αJM |Jz + Sz |αJM
= μ0 BM
|αJM αJM |J · S 1+ J(J + 1)
,
e, per J = 0, μ0 B αJM |Jz + Sz |αJM
=0 .
Il livello (aJ) si separa quindi, per effetto dell’energia magnetica, in (2J + 1) sottolivelli (detti sottolivelli magnetici o sottolivelli Zeeman), ciascuno caratterizzato dal numero quantico magnetico M e avente un’energia supplementare (rispetto al caso non magnetico) data da ΔEM = μ0 B M gJ , dove gJ , definito dall’espressione (indipendente da M ), |αJM αJM |J · S J(J + 1)
gJ = 1 +
,
`e una quantit` a adimensionale che prende il nome di fattore di Land´e. Il fattore di Land´e pu` o essere calcolato con facilit`a solo nel caso in cui valga lo schema di accoppiamento L-S. Infatti, in tale caso, scrivendo l’autovettore |αJM nella forma |αLSJM , e osservando che = J · S
1 2
[J 2 + S 2 − L2 ] ,
si ha
|αLSJM αLSJM |J · S
=
1 2
[J(J + 1) + S(S + 1) − L(L + 1)] ,
per cui
gJ (LS) = 1 +
J(J + 1) + S(S + 1) − L(L + 1) = 2 J(J + 1)
3 2
+
S(S + 1) − L(L + 1) . 2 J(J + 1)
Quando vale l’accoppiamento intermedio, il calcolo del fattore di Land´e risulta pi` u complesso e fa intervenire i coefficienti CLS definiti implicitamente dall’Eq. (9.12). Attraverso tali coefficienti si pu` o scrivere, in generale gJ =
LS
|CLS |2 gJ (LS) ,
260
CAPITOLO 9
dove gJ (LS) ha il valore dato dall’espressione precedente e dove la somma va estesa a tutti i valori di L e S compatibili con la configurazione e con il valore di J. Poich´e i fattori di Land´e sono facilmente accessibili all’osservazione, essi permettono di stabilire in maniera quantitativa quanto lo schema di accoppiamento L-S sia appropriato per la descrizione di un determinato termine. Basta infatti confrontare i fattori di Land´e osservati nei vari livelli del termine con quelli calcolati supponendo valido l’accoppiamento L-S. Ad esempio, per il termine fondamentale del Ferro, a5D, i fattori di Land´e osservati spettroscopicamente sono 1.498 (J = 1), 1.494 (J = 2), 1.497 (J = 3), e 1.496 (J = 4), mentre il valore di gJ (LS) `e pari a 1.5 per tutti e quattro i livelli. Consideriamo adesso due livelli, un livello inferiore avente numeri quantici (αJ) e fattore di Land´e gJ e un livello superiore avente numeri quantici (α J ) e fattore di Land´e gJ . La riga spettrale originaria, avente frequenza ν0 in assenza di campo, si separa, sotto l’effetto del campo magnetico, in varie componenti, ciascuna caratterizzata dalla coppia di numeri quantici M e M , aventi frequenza ν(M, M ) = ν0 + νL (gJ M − gJ M ) , dove abbiamo introdotto la frequenza di Larmor, νL , gi` a definita nell’Eq. (9.13), anche data da μ0 B/h. Le componenti sono in numero ridotto (rispetto a quelle possibili a priori) in quanto vale la regola di selezione su M ΔM = ±1, 0 , che ne riduce notevolmente il numero. Ciascuna componente `e inoltre caratterizzata da una opportuna “forza” e da una definita propriet` a di polarizzazione. Anticipando un risultato che sar` a dimostrato in maniera formale in seguito, osserviamo che la forza di una riga spettrale risulta proporzionale (nell’approssimazione di dipolo) alla quantit` a 1
| ψi |rq |ψf |2 ,
q=−1
dove |ψi e |ψf sono le funzioni d’onda degli stati iniziale e finale fra i quali avviene la transizione, e dove rq `e la componente sferica del vettore r definito da r =
N
ri .
i=1
Applicando il teorema di Wigner-Eckart (dal quale scaturiscono naturalmente le regole di selezione), si ha che la transizione fra il sottolivello inferiore caratterizzato dal numero quantico M e il sottolivello superiore caratterizzato dal
261
MAGGIORI DETTAGLI SUGLI SPETTRI
numero quantico M risulta associata a un particolare valore di q (q = M −M ) e la sua forza `e proporzionale a
| αJM |rq |α J M |2 = (2 J + 1)
J M
J −M
1 q
2
| αJ||r||α J |2 .
Eliminando da queste espressioni tutte le quantit` a che non dipendono dai numeri quantici magnetici, si ottiene per la “forza relativa” delle componenti
Sq (M, M ) = 3
J −M
J M
1 q
2 ,
dove il fattore 3 `e stato introdotto per fare in modo che le forze siano normalizzate all’unit`a. Infatti, per l’Eq.(7.18) si ha
Sq (M, M ) =
MM
MM
3
J −M
J M
1 q
2 =1 .
(9.14)
Si pu` o inoltre dimostrare che le componenti aventi q = 0 sono componenti π, mentre le componenti aventi q = ±1 sono componenti σ nel senso attribuito a queste denominazioni nel paragrafo precedente. Queste propriet`a stabiliscono il carattere di polarizzazione di tutte le componenti in osservazione parallela o perpendicolare al campo magnetico. Una volta note le forze e le separazioni in frequenza di tutte le componenti, si pu` o procedere a costruire un diagramma, detto diagramma Zeeman (Zeeman pattern), nel quale si riportano, in funzione della frequenza, tanti tratti verticali quante sono le componenti. Ogni tratto `e di lunghezza proporzionale alla forza della singola componente ed `e riportato alla frequenza che gli compete. Le frequenze sono espresse in unit`a di νL (unit` a di Lorentz) e i tratti sono riportati verso l’alto per le componenti π e verso il basso per le componenti σ. Si consideri ad esempio la transizione fra un livello inferiore 3D2 e un livello superiore 3P1 . Se i due livelli possono essere entrambi descritti nello schema di accoppiamento L-S, i corrispondenti fattori di Land´e sono dati da gJ (3D2 ) =
7 6
,
gJ (3P1 ) =
3 2
.
Le forze e le separazioni delle singole componenti sono riportate nella Tab 9.1, mentre le possibili transizioni e il diagramma Zeeman risultante sono illustrati nella Fig. 9.5. Se si considera in particolare un livello in accoppiamento L-S proveniente da un termine di singoletto, il fattore di Land´e `e uguale a 1, come si vede dall’espressione di gJ (LS) sostituendo S = 0 e L = J. Per una transizione fra due di tali livelli, le frequenze delle componenti sono date da
262
CAPITOLO 9
q
M
M
Separazione
Forza
1
1 0 -1
2 1 0
− 56 − 76 − 96
6 10 3 10 1 10
0
1 0 -1
1 0 -1
2 6
0
− 26
3 10 4 10 3 10
-1
1 0 -1
0 -1 -2
9 6 7 6 5 6
1 10 3 10 6 10
Tab. 9.1. Separazioni in frequenza (espresse in unit` a della frequenza di Larmor ν L ) e forze relative delle transizioni fra i sottolivelli Zeeman appartenenti al livello superiore 3P1 e quelli appartenenti al livello inferiore 3D2 .
ν(M, M ) = ν0 + νL (M − M ) , e si ottiene che tutte le componenti con q = M − M = 1 si trovano alla frequenza ν0 − νL , tutte quelle con con q = 0 a ν0 , e tutte quelle con q = −1 a ν0 + νL . D’altra parte, la somma delle forze delle componenti di ciascun tipo d` a per risultato 1 (si veda l’equazione di normalizzazione (9.14)), per cui si ottiene un diagramma Zeeman molto semplice come quello riportato nel riquadro c) della Fig. 9.5. In questo caso si parla di effetto Zeeman normale mentre altrimenti si parla di effetto Zeeman anomalo. Il caso dell’effetto Zeeman normale, che corrisponde ad assenza di spin, `e l’unico che pu` o essere trattato anche classicamente. Osserviamo infine che le separazioni in frequenza (o in lunghezza d’onda) introdotte dall’effetto Zeeman sono relativamente piccole e che sono necessari strumenti di potere risolutivo elevato per poter mettere in evidenza tale effetto anche per valori di campo magnetico dell’ordine del migliaio di gauss. Indicando con Δν la separazione in frequenza fra due componenti Zeeman, si ha, come ordine di grandezza, Δν νL , e assumendo un campo di 103 G si ottiene, per una riga a 5000 ˚ A (ν0 = 6 × 1014 s−1 ), Δν 2.3 × 10−6 . ν0 ` quindi necessario disporre di uno spettroscopio avente potere risolutivo delE l’ordine di 106 per poter osservare l’effetto Zeeman indotto da un campo di 1000 G su una riga dello spettro visibile.
263
MAGGIORI DETTAGLI SUGLI SPETTRI
3
P1
1 0 −1
M
b)
1
−1 0
a)
3
D2
2 1 0 −1 −2
M
c) 1
−1 0
Fig. 9.5. Nel riquadro a) sono illustrate le transizioni fra sottolivelli Zeeman appartenenti al livello superiore 3P1 e quelli appartenenti al livello inferiore 3D2 . Nel riquadro b) `e mostrato il pattern Zeeman risultante, con le componenti π riportate verso l’alto e quelle σ verso il basso. Il riquadro c) mostra il pattern relativo al caso dell’effetto Zeeman normale.
9.7 L’effetto Paschen-Back La teoria dell’effetto Zeeman sviluppata nel paragrafo precedente si basa sull’ipotesi che l’Hamiltoniana magnetica HM sia una perturbazione rispetto all’Hamiltoniana totale (non magnetica) H. Affinch´e questo si verifichi `e ovviamente necessario che HM sia una perturbazione sia rispetto a H0 che a H1 che a H2 . Rivestono tuttavia un ruolo di particolare importanza alcune situazioni fisiche in cui il campo magnetico `e sufficientemente intenso da produrre una separazione dei sottolivelli magnetici paragonabile alla separazione fra i diversi livelli provenienti da un termine (struttura fine). Riferendoci al caso pi` u comune in cui valga lo schema di accoppiamento L-S, si parla, in tali situazioni fisiche, di effetto Paschen-Back e si distingue fra effetto Paschen-Back completo quando vale la diseguaglianza H2 HM ,
264
CAPITOLO 9
μ0 B
( 1, 1) ( 0, 1) ( 1, 0) (−1, 1)
3
P
( 0, 0) (−1, 0) ( 1,−1) ( 0,−1) (−1,−1)
Fig. 9.6. Separazione di un livello 3P dovuta al campo magnetico nel regime dell’effetto Paschen-Back completo. Ciascun sottolivello magnetico `e caratterizzato dalla coppia di valori (ML , MS ). Si noti l’esistenza di due sottolivelli degeneri.
ed effetto Paschen-Back incompleto quando si ha invece H2 HM . Per fissare le idee, osserviamo che il caso dell’effetto Zeeman corrisponde invece alla diseguaglianza H2 HM . All’aumentare del campo magnetico si passa con continuit` a dall’effetto Zeeman all’effetto Paschen-Back incompleto, all’effetto Paschen-Back completo. I valori del campo magnetico a cui si verifica il passaggio fra i vari regimi dipendono dal particolare termine atomico che si sta considerando. Se tale termine `e caratterizzato da un certo valore della quantit` a ζ(α, LS), si pu` o definire un valore caratteristico del campo magnetico, BPB , tale che μ0 BPB = ζ(α, LS) . I tre diversi regimi (Zeeman, Paschen-Back incompleto e Paschen-Back completo) si ottengono allora per B BPB , B BPB e B BPB , rispettivamente. Consideriamo prima il caso dell’effetto Paschen-Back completo. Per trovare l’effetto dell’Hamiltoniana magnetica sulla struttura di un termine conviene lavorare sulla base degenere |αLSML MS nella quale HM `e diagonale. Per gli elementi di matrice di HM si ottiene αLSMLMS |HM |αLSML MS = μ0 B αLSML MS |Lz + 2Sz |αLSML MS = = μ0 B (ML + 2MS ) . 3
Per un termine P , ad esempio, applicando l’equazione di sopra si vede che il termine risulta suddiviso dal campo magnetico in sette componenti di cui due doppiamente degeneri (si veda la Fig. 9.6).
MAGGIORI DETTAGLI SUGLI SPETTRI
265
Andiamo adesso a considerare la transizione fra due termini diversi e indichiamo con (αLSML MS ) i numeri quantici relativi al termine inferiore e con (α L S ML MS ) quelli relativi al termine superiore. La riga spettrale, avente frequenza ν0 in assenza di campo magnetico, si separa in un certo numero di componenti ciascuno caratterizzato dalla frequenza ν(ML MS , ML MS ) = ν0 + νL [ML − ML + 2(MS − MS )] . Le intensit` a relative dei vari componenti si possono dedurre attraverso considerazioni analoghe a quelle viste a proposito dell’effetto Zeeman. In questo caso bisogna calcolare una quantit` a della forma 1
| αLSML MS | rq |α L S ML MS |2 .
q=−1
Osservando che rq `e un operatore che agisce soltanto sulle variabili orbitali e non su quelle di spin, si ottiene 1
| αLSML MS |rq |α L S ML MS |2 =
q=−1
=
1
| αLML |rq |α L ML |2 δSS δMS MS ,
q=−1
e applicando il teorema di Wigner-Eckart si arriva a esprimere la forza relativa dei diversi componenti attraverso la formula Sq (ML MS , ML MS ) = 3
L −ML
L ML
1 q
2 δSS δMS MS ,
la quale mostra che per l’effetto Paschen-Back completo valgono le regole di selezione ΔMS = 0 ,
ΔML = ±1, 0 .
A causa della regola di selezione su MS l’espressione per le frequenze dei componenti si semplifica e risulta ν(ML MS , ML MS ) = ν0 + νL (ML − ML ) . Le transizioni aventi lo stesso valore per ΔML si trovano tutte alla stessa frequenza e la somma delle loro forze relative d`a per risultato l’unit` a. Si ritrova quindi per l’effetto Paschen-Back completo lo stesso diagramma Zeeman della Fig. 9.5, riquadro c), ovvero il diagramma dell’effetto Zeeman normale.
266
CAPITOLO 9
Il caso dell’effetto Paschen-Back incompleto `e notevolmente pi` u complesso in quanto l’Hamiltoniana di spin-orbita, H2 , e l’Hamiltoniana magnetica, HM , devono essere diagonalizzate simultaneamente. Mentre H2 `e diagonale sulla base dei vettori |αLSJM , HM lo `e sulla base |αLSML MS . Una volta scelta una delle due basi, si calcolano tutti gli elementi di matrice (diagonali e non) e si diagonalizza la matrice cos`ı ottenuta. Il problema `e parzialmente semplificato dal fatto che, poich´e entrambe le Hamiltoniane commutano con Jz [H2 , Jz ] = [HM , Jz ] = 0 , la matrice risulta diagonale a blocchi, ciascun blocco essendo caratterizzato da un particolare valore di M = ML + MS . I calcoli devono, in generale, essere eseguiti numericamente e portano, all’aumentare del campo magnetico, a una transizione continua fra una struttura dei livelli tipica dell’effetto Zeeman a una struttura tipica dell’effetto Paschen-Back completo5 .
9.8 La struttura iperfine, effetto isotopico Esaminando le righe spettrali con dispositivi spettroscopici dal potere risolutivo molto elevato, `e stato trovato, a partire dagli anni 1920, che in molti spettri atomici le righe spettrali risultano suddivise in un certo numero di componenti, estremamente vicine fra loro, aventi separazione tipica, in termini di numero d’onda, dell’ordine del centesimo di cm−1 , ovvero, in termini di lunghezza d’onda, dell’ordine di qualche m˚ A (per righe dello spettro visibile). Oggi sappiamo che la struttura iperfine `e dovuta all’influenza del nucleo atomico sui livelli energetici dell’atomo, essendo stata ampiamente confermata un’ipotesi originariamente proposta da Pauli. Tale influenza `e di duplice natura essendo dovuta, da un lato, al fatto che gli isotopi di un elemento hanno massa e volume nucleare diversi (effetto isotopico) e, dall’altro, alla presenza dello spin del nucleo (effetto di spin nucleare). Ovviamente il primo effetto `e presente solo quando si analizza spettroscopicamente un elemento composto da due o pi` u isotopi, mentre il secondo effetto `e presente anche per un elemento isotopicamente puro (purch´e il suo spin nucleare sia non nullo). In questo paragrafo analizzeremo il primo effetto; il secondo effetto `e trattato nel paragrafo seguente. L’analisi dell’effetto isotopico dovuto alla differenza di massa fra pi` u isotopi `e facilmente analizzabile solo nel caso degli atomi idrogenoidi. Abbiamo visto infatti nel Par. 6.1 che l’energia dell’n-esimo livello dell’atomo idrogenoide `e data da (cfr. Eq. (6.4)) 5
Per un approfondimento di questo argomento si veda, ad esempio E.U. Condon & G.H. Shortley, The Theory of Atomic Spectra, Cambridge Univ. Press, Cambridge, 1935, oppure E. Landi Degl’Innocenti & M. Landolfi, Polarization in Spectral Lines, Kluwer, Acad. Publ., Dordrecht, 2004.
MAGGIORI DETTAGLI SUGLI SPETTRI
En = −
267
mr e40 Z 2 1 , 2h ¯ 2 n2
dove mr `e la massa ridotta, ovvero m Mn , (9.15) m + Mn con m massa dell’elettrone e Mn massa del nucleo. Se si hanno quindi due isotopi aventi rispettivamente masse M1 e M2 , e se si indicano con ν1 e ν2 le frequenze di due righe corrispondenti, si ha mr =
ν1 (mr )1 M1 m + M2 = = , ν2 (mr )2 M2 m + M1 ovvero, sviluppando in serie (m M1 , M2 ), ν1 1 1 . =1+m − ν2 M2 M1 Se si considera ad esempio il caso dell’Idrogeno e del Deuterio e si ricorda che la massa del nucleo del Deuterio `e doppia di quella dell’Idrogeno, si ottiene νD m =1+ 1+ νH 2 Mp
1 3672
,
dove Mp `e la massa del protone. Le frequenze delle righe del Deuterio sono quindi tutte maggiori delle corrispondenti frequenze delle righe dell’Idrogeno, il loro rapporto essendo dell’ordine di 1.0003. Ovviamente la cosa opposta accade per le lunghezze d’onda. La riga Hα del Deuterio, ad esempio, si trova spostata di 1.79 ˚ A verso le lunghezze d’onda minori (verso il blu) rispetto alla riga Hα dell’Idrogeno. Per gli atomi non idrogenoidi l’effetto di massa pu` o essere valutato mediante le seguenti considerazioni. L’energia cinetica totale, T , di un sistema di N elettroni che orbitano intorno a un nucleo di massa Mn `e data da T =
N P2 p2i + , 2 m 2 Mn i=1
dove pi `e l’impulso dello i-esimo elettrone e P `e l’impulso del nucleo. D’altra parte, nel sistema di riferimento in cui l’atomo `e a riposo si deve avere P +
N
pi = 0 ,
i=1
per cui, ricavando P da questa equazione e sostituendo nell’espressione dell’energia cinetica, si ottiene, con semplici trasformazioni algebriche
268
CAPITOLO 9
T =
N pi · pj p2i + , 2 mr i<j Mn i=1
dive mr `e la massa ridotta definita nell’Eq. (9.15). Come si vede, l’effetto della massa finita del nucleo `e duplice. Da un lato, la massa dell’elettrone viene sostituita dalla massa ridotta. Dall’altro, compaiono tanti termini aggiuntivi dell’energia quante sono le possibili coppie di elettroni. L’effetto di questi termini pu` o essere valutato quantitativamente aggiungendo all’Hamiltoniana atomica un termine correttivo (di massa nucleare) dato da Hm.n. =
p i · pj , Mn i<j
e poi andando a determinare l’effetto di questa Hamiltoniana sui livelli atomici per mezzo della teoria delle perturbazioni. In ogni caso, si trova che per atomi pesanti l’effetto di massa diminuisce rispetto al caso dell’Idrogeno, soprattutto per il fatto che diminuisce la differenza relativa fra le masse degli isotopi. All’effetto di massa si sovrappone poi l’effetto di volume nucleare che pu` o essere valutato, almeno come ordine di grandezza, nel modo seguente. Nella teoria atomica sviluppata nei capitoli precedenti abbiamo sempre supposto che il nucleo sia puntiforme. In effetti questa `e un’approssimazione di ordine zero che porta a un potenziale divergente nell’origine. Un’approssimazione migliore, sebbene grossolana, `e quella di considerare il nucleo come una sferetta uniformemente carica avente raggio r0 dell’ordine delle dimensioni nucleari (r0 10−13 cm). Il potenziale nel quale si muovono gli elettroni differisce quindi, in prossimit` a del nucleo, dal potenziale puramente Coulombiano dovuto al nucleo puntiforme. Per calcolare tale potenziale, utilizziamo il teorema di Gauss che, per r ≤ r0 , porta all’equazione 4π r2 E(r) = 4π Q(r) = 4π Z e0
r3 , r03
dove E(r) `e il campo elettrico, Q(r) `e la carica contenuta entro la sfera di raggio r, e Z `e il numero di carica nucleare. Il campo elettrico vale quindi, per r ≤ r0 E(r) = Z e0
r , r03
e discende dal potenziale φ(r) = −
Z e0 r 2 +C , 2 r03
269
MAGGIORI DETTAGLI SUGLI SPETTRI
V(r) r
r0
Carica puntiforme Carica distribuita Fig. 9.7. L’energia potenziale dell’elettrone, V (r), dovuta alla carica del nucleo differisce a seconda che si consideri il nucleo puntiforme oppure con carica distribuita. Il grafico illustra schematicamente la differenza. Le dimensioni del nucleo, r0 , sono notevolmente esagerate nella figura.
dove C `e una costante che pu`o essere determinata imponendo che per r = r0 si abbia φ = Z e0 /r0 . Applicando questa condizione di continuit`a si ottiene Z e0 φ(r) = 2 r0
r2 3− 2 , r0
r ≤ r0 .
L’effetto del nucleo finito `e quindi quello di introdurre nell’Hamiltoniana un termine correttivo (di volume nucleare) dato da
Hv.n.
N Z e20 ri2 Z e20 − 3− 2 + , = 2 r0 r0 ri i=1
ri ≤ r0 .
Tale termine `e rappresentato schematicamente nella Fig. 9.7. Possiamo adesso calcolare la variazione di energia di una configurazione, ΔE, dovuta a questa correzione da apportare all’Hamiltoniana. Il calcolo si esegue attraverso la teoria delle perturbazioni osservando che l’Hamiltoniana Hv.n. , commutando con gli operatori i e si , `e diagonale sulla base delle autofunzioni della forma dell’Eq. (7.1), ΨA (a1 , a2 , . . . , aN ). Si ottiene
270
CAPITOLO 9
ΔE =
N Z e20 I(ai ) , 2 r0 i=1
dove r2 2 r0 d3 x . I(ai ) = |ψni li mi msi (x)| −3 + 2 + r0 r r≤r0
2
Per valutare questo integrale si pu` o osservare che r0 `e molto minore delle scale caratteristiche sulle quali varia la funzione d’onda, per cui si ha r2 2 r0 d3 x , −3 + 2 + I(ai ) = |ψni li mi msi (0)|2 r0 r r≤r0 e valutando l’integrale con metodi elementari si ottiene I(ai ) =
4π 3 r |ψni li mi msi (0)|2 . 5 0
Sostituendo infine nell’espressione per ΔE si arriva al risultato ΔE =
N 2π Z e20 r02 |ψni li mi msi (0)|2 . 5 i=1
Come si vede, la correzione all’energia `e positiva e ad essa contribuiscono solo gli elettroni s (gli unici per cui ψ(0) = 0). Inoltre, la correzione dipende da r0 per cui si ottengono valori diversi di ΔE per isotopi diversi.
9.9 La struttura iperfine, effetto di spin nucleare Un nucleo (pi` u propriamente un nuclide) avente numero di massa A e numero di carica Z `e composto da A nucleoni, di cui Z protoni e A − Z neutroni. Sia i protoni che i neutroni sono particelle aventi spin 12 e tali spin si sommano fra loro (secondo le regole del momento angolare) per dare lo spin totale I del nucleo. Il numero quantico associato, I, risulta necessariamente semi-intero se A `e dispari e intero se A `e pari. Il valore di I che compete a un nucleo assegnato 6 pu` o essere dedotto dall’esperienza o, in alcuni casi, pu`o essere ottenuto in base a modelli di struttura nucleare. L’esperienza mostra che tutti i nuclei paripari (ovvero quelli composti da un numero pari di protoni e un numero pari di 6
Ci riferiamo qui allo spin del nucleo nel suo stato fondamentale. Nelle reazioni nucleari il nucleo pu` o portarsi su livelli eccitati ai quali competono, in generale, valori di I diversi.
MAGGIORI DETTAGLI SUGLI SPETTRI
271
neutroni) hanno spin nullo. I nuclei che non rientrano in questa classe hanno, in generale, I = 0. Allo spin nucleare `e sempre associato un momento magnetico nucleare che viene espresso nella forma μ I = gN μN I . In questa formula, μN `e il cosiddetto magnetone nucleare definito attraverso una formula del tutto analoga a quella del magnetone di Bohr μ0 (Eq. (5.17)), con la differenza che la massa del protone sostituisce quella dell’elettrone μN =
¯ m e0 h = μ0 2 Mp c Mp
1 1836
μ0 .
a La quantit` a gN `e invece un fattore puramente numerico dell’ordine dell’unit` che dipende da nucleo a nucleo e che viene chiamato rapporto giromagnetico nucleare. Per il protone (isolato) il valore di gN `e 2.79290, mentre per il neutrone (isolato) `e −1.91315. Per il nucleo del Deuterio (composto da un protone e un neutrone e avente I = 1) si ha gN = 0.85741, il che mostra che il valore di gN di un nucleo non si ottiene per semplice somma dei gN dei nucleoni che lo compongono. Il momento magnetico nucleare interagisce con la nuvola elettronica e l’interazione `e descritta, in prima approssimazione, da un’Hamiltoniana, detta di struttura iperfine, del tipo7 Hs.i. = A(α, J) J · I ,
(9.16)
dove A(α, J) `e una quantit` a che dipende dai numeri quantici dello stato |αJM considerato. Senza entrare nei dettagli della teoria attraverso la quale `e possibile ricavare il valore di A(α, J), si pu` o semplicemente fornire per tale quantit` a una stima di ordine di grandezza. Per questo si pu` o pensare che il momento magnetico nucleare interagisca col momento magnetico associato alla nuvola elettronica e, poich´e l’energia di interazione di due dipoli `e proporzionale al prodotto dei moduli dei dipoli stessi e inversamente proporzionale al cubo della loro distanza, si ha, come ordine di grandezza (a0 `e il raggio della prima orbita di Bohr) A(α, J) 7
μN μ0 e80 m2 = 1.264 × 10−18 erg , a30 c2 h ¯ 4 Mp
L’equazione (9.16) `e il primo termine di uno sviluppo multipolare e rappresenta l’interazione di dipolo fra lo spin del nucleo e quello della nuvola elettronica. Talvolta si rende necessario aggiungere il termine successivo che descrive l’interazione di quadrupolo. Tale termine porta un contributo supplementare all’Eq. (9.17) della forma B[K(K+1)−4I(I+1)J(J +1)/3], dove B ` e una nuova costante e dove K = F (F + 1) − I(I + 1) − J(J + 1).
272
CAPITOLO 9
un valore di energia che corrisponde a 6.37 × 10−3 cm−1 oppure a 191 MHz. Confrontando questa espressione con quella analoga valida per la struttura fine (si veda l’Eq. (5.14)), si arriva alla conclusione che le energie tipiche della struttura iperfine sono circa 2000 volte inferiori a quelle della struttura fine. Il momento angolare intrinseco del nucleo introduce un ulteriore grado di libert` a che deve essere descritto da opportuni numeri quantici. Un livello atomico che in assenza di spin nucleare `e rappresentato dal vettore di stato |αJM deve adesso essere descritto da un nuovo autovettore della forma |αJIM M I , dove I `e il numero quantico di spin nucleare (nel senso che l’autovalore dell’operatore I 2 vale I(I +1)), e dove MI `e il numero quantico relativo all’operatore Iz . In luogo di questa base `e per` o pi` u opportuno considerare la base |αJIF M F dove F = J + I `e il momento angolare totale (elettronico + nucleare) dell’atomo. L’Hamiltoniana di struttura iperfine `e diagonale sulla base |αJIF M F . Osservando che J · I =
1 2
(F 2 − J 2 − I 2 ) ,
si ottiene, per la correzione in energia dovuta allo spin nucleare, ΔE(F ) = αJIF MF | Hs.i. |αJIF MF =
1 2
=
A(α, J) [F (F + 1) − J(J + 1) − I(I + 1)] .
(9.17)
Per i livelli di struttura iperfine si ottiene quindi una separazione in energia simile a quella data dalla regola degli intervalli di Land´e per la struttura fine. Consideriamo ad esempio il caso dello stato fondamentale dell’atomo di Idrogeno. Per esso si ha J = 12 e I = 12 per cui si hanno le due possibilit` aF =0e F = 1, cui corrispondono, rispettivamente, le energie ΔE(F = 0) = − 34 A ,
ΔE(F = 1) =
1 4
A .
L’intervallo fra i due livelli di struttura fine vale A e risulta sperimentalmente pari a 1.420 GHz (ovvero circa 7 volte il valore da noi stimato come ordine di grandezza). La transizione fra questi due livelli di struttura iperfine d` a luogo a una riga dello spettro radio la cui lunghezza d’onda `e 21.1 cm e che viene tradizionalmente detta “la riga a 21 cm”. L’osservazione di tale riga `e d’importanza fondamentale in astrofisica per lo studio della nostra Galassia, delle galassie in generale e delle regioni d’Idrogeno neutro (regioni H I). Un altro esempio particolarmente rilevante `e quello del livello fondamentale, 6s 2S1/2 , dell’isotopo 133 del Cesio. Poich´e tale isotopo ha spin nucleare pari a 7/2, si hanno due livelli di struttura iperfine, caratterizzati dai numeri quantici F = 3 e F = 4, rispettivamente. La separazione in energia fra tali livelli `e nota con tale precisione che su di essa `e basata, a partire dal 1967, la definizione dell’unit` a di tempo nel Sistema Internazionale. Il secondo `e infatti definito come la durata di 9 192 631 770 periodi della radiazione emessa nella transizione fra i due livelli di struttura iperfine sopraddetti.
Capitolo 10
Leggi di equilibrio termodinamico Dopo aver passato in rassegna nei capitoli precedenti le propriet`a fondamentali del campo di radiazione e quelle dei sistemi atomici, prima di passare a trattare il problema dell’interazione quantistica fra tali sistemi, `e opportuno andare a studiare, in tutta generalit` a, le loro caratteristiche fisiche nel caso particolare dell’equilibrio termodinamico. Da un lato, questo studio `e interessante in s´e, in quanto in molti casi i sistemi fisici, siano essi l’oggetto di esperienze di laboratorio o di osservazioni astronomiche, possono essere considerati, almeno in prima approssimazione, in condizioni vicine a quelle dell’equilibrio termodinamico. Dall’altro lato, le leggi che si possono dedurre all’equilibrio termodinamico, essendo basate sul primo e secondo principio della Termodinamica, sono di estrema generalit`a e possono quindi fornire dei metodi di controllo utilissimi per mettere alla prova qualsiasi teoria, pi` u o meno approssimata, che si possa utilizzare nella descrizione dei sistemi e delle loro interazioni.
10.1 I principi della statistica Sia dato un sistema fisico a N gradi di libert` a descritto in meccanica classica dalle variabili dinamiche qi e dai corrispondenti momenti cinetici coniugati pi (i = 1, 2, . . . , N ), e sia H(qi , pi ) l’Hamiltoniana del sistema. Le propriet`a statistiche del sistema all’equilibrio termodinamico possono essere dedotte attraverso un principio di estrema generalit` a. Sebbene tale principio possa essere pi` u o meno giustificato mediante considerazioni probabilistiche1 , talvolta si preferisce assumerlo direttamente come postulato. Il principio afferma che la probabilit` a dP di trovare il sistema nella celletta elementare dΓ dello spazio delle fasi `e data dall’espressione dP = A e−βH(qi ,pi ) dΓ ,
(10.1)
dove dΓ = dq1 dq2 · · · dqN dp1 dp2 · · · dpN ,
β=
1 , kB T
con kB costante di Boltzmann (kB = 1.3806 × 10−16 erg K−1 ), e T temperatura 1
Una semplice deduzione formale `e presentata nell’App. 10. Per un’analisi pi` u approfondita si veda ad esempio E. Schr¨ odinger, Termodinamica Statistica, Boringhieri, Torino, 1961.
274
CAPITOLO 10
assoluta, e dove A `e una costante di normalizzazione da determinare imponendo che l’integrale su tutto lo spazio delle fasi del dP sia uguale a 1, A e−βH(qi ,pi ) dΓ = 1 . A proposito della costante A bisogna osservare che il suo valore risulta connesso al valore di zero (del resto arbitrario) che si assume per l’energia. Se si esegue infatti la trasformazione H(qi , pi ) → H(qi , pi ) + E0 , con E0 costante, si ottiene A → A e βE0 , e l’espressione per dP risulta invariante rispetto a E0 . Lo stesso principio si generalizza direttamente ai sistemi quantistici. Sia H l’Hamiltoniana quantistica del sistema fisico, e siano E1 , E2 , . . . , En , . . . le energie degli stati quantici (supposti non degeneri2 ) ottenute risolvendo l’equazione di Schr¨ odinger stazionaria. La probabilit`a Pj di trovare il sistema nello stato j di energia Ej `e data da Pj = A e−βEj ,
(10.2)
dove A `e di nuovo una costante di normalizzazione da determinare in modo che
A e−βEj = 1 .
j
La costante di normalizzazione `e quindi data da A=
1 , Z
dove la quantit` a Z, detta somma sugli stati, vale Z=
e−βEj .
j
Tutte le leggi della termodinamica possono essere dedotte da queste semplici considerazioni se si ammette, in base all’ipotesi fondamentale di Boltzmann, che l’entropia del sistema sia data dall’espressione 2
Nel caso che la soluzione dell’equazione di Schr¨ odinger stazionaria conduca ad autovalori degeneri, i corrispondenti stati devono essere tutti enumerati distintamente nella serie E1 , E2 , . . . , En , . . ..
LEGGI DI EQUILIBRIO TERMODINAMICO
S = −kB
275
Pj ln Pj .
j
Vediamo adesso alcune conseguenze delle ipotesi introdotte. Sostituendo l’espressione per Pj in questa equazione, si ottiene A e−βEj (ln A − βEj ) , S = −kB j
che, ricordando le equazioni precedenti risulta ⎡ ⎤ A Ej e−βEj ⎦ . S = kB ⎣ln Z + β j
Osserviamo adesso che l’energia interna del sistema, tradizionalmente indicata col simbolo U , `e ovviamente data da & & −βEj −βEj j Ej e j Ej e = U = & −βEj = A Ej e−βEj , Z je j e pu` o anche essere espressa dall’equazione U =−
∂ ln Z . ∂β
D’altra parte, sostituendo nell’equazione che esprime l’entropia si ha S = kB [ln Z + β U ] , dalla quale si ottiene ln Z =
S − β U = β (S T − U ) = −β F , kB
(10.3)
dove F = U − T S `e l’energia libera di Helmholtz. Infine, questa relazione permette di esprimere l’energia interna nella forma U =−
∂ ∂ ∂F ln Z = (β F ) = F + β . ∂β ∂β ∂β
Per stabilire un collegamento pi` u completo con le leggi della termodinamica, bisogna anche considerare il fatto che le traformazioni termodinamiche implicano in molti casi delle variazioni del sistema legate non solo alla temperatura ma anche ad altre variabili macroscopiche, quali, ad esempio, il volume, la pressione o il numero di particelle. Nel formalismo generale introdotto sopra, tali variazioni provocano delle variazioni nei livelli energetici Ej , per cui la formula precedente deve essere pi` u convenientemente scritta nella forma
276
CAPITOLO 10
U =F +β
∂F ∂β
. V,N
Se consideriamo ad esempio una trasformazione termodinamica infinitesima in cui un fluido (a numero di particelle costanti) subisce una variazione di temperatura δT e una variazione di volume δV , l’energia libera subisce la variazione δF = δ(U − T S) = δU − S δT − T δS . D’altra parte, secondo il primo principio della termodinamica, la variazione di energia interna `e data da δU = δQ − P δV , dove δQ = T δS `e la quantit` a di calore assorbita dal sistema e dove P `e la pressione. Per la variazione dell’energia libera si ha quindi δF = −S δT − P δV , e si ottengono le equazioni ∂F S=− , ∂T V,N
P =−
∂F ∂V
. T,N
La seconda di queste equazioni definisce direttamente la pressione che, in base all’Eq. (10.3), risulta
P =
1 β
∂ ln Z ∂V
β,N
⎞⎤ ⎛ 1 ⎣ ∂ ⎝ −βEj ⎠⎦ = e βZ ∂V j
&
⎡
j
=−
∂Ej e−βEj ∂V N & −βE . j je
β,N
Le equazioni che abbiamo derivato sono, allo stesso tempo, estremamente semplici ed estremamente generali. Tuttavia, la loro applicazione a casi concreti risulta spesso complessa, soprattutto quando bisogna tener conto dell’indistinguibilit` a delle particelle oppure del principio di esclusione di Pauli. Inoltre, bisogna anche dire che la determinazione delle energie Ej degli stati quantici di un sistema rappresenta, salvo casi schematici, un problema praticamente insolubile. Tuttavia esistono casi sufficientemente semplici in cui il principio enunciato porta rapidamente a interessanti conseguenze. Tali casi sono quelli in cui l’Hamiltoniana totale del sistema si esprime attraverso la somma di tante Hamiltoniane indipendenti, ciascuna relativa a gradi di libert` a diversi. Il caso semplice di un sistema di N particelle libere non interagenti `e analizzato nel paragrafo seguente.
277
LEGGI DI EQUILIBRIO TERMODINAMICO
10.2 La distribuzione Maxwelliana delle velocit` a Consideriamo un sistema fisico costituito da N particelle libere, non interagenti. Per fissare le idee possiamo supporre che le particelle siano elettroni, sebbene tutti i risultati che otterremo facciano astrazione dalla natura intrinseca delle particelle (eccettuato che per il carattere fermionico oppure bosonico che resta di fondamentale importanza). Per N elettroni non relativistici mobili in un plasma elettricamente neutro (in modo da poter considerare nulla l’energia di interazione Coulombiana), l’Hamiltoniana del sistema si scrive H=
N p2i , 2m i=1
dove pi `e l’operatore impulso dell’elettrone i-esimo. Poich´e l’Hamiltoniana `e la somma di N Hamiltoniane indipendenti, gli autostati del sistema complessivo possono essere costruiti attraverso gli autostati delle singole Hamiltoniane, ovvero attraverso le autofunzioni di particella singola. Come `e ben noto, queste sono caratterizzate dai numeri quantici p, autovalore dell’impulso e m s , proiezione dello spin lungo l’asse di quantizzazione. Applicando il principio fondamentale nella forma dell’Eq. (10.2), possiamo allora esprimere la probabilit` a P che l’elettrone 1 si trovi nello stato ( p1 , ms1 ), l’elettrone 2 nello stato ( p2 , ms2 ), . . . , l’elettrone N nello stato ( pN , msN ) attraverso l’equazione & 2 P = Ae
−β
p i i 2m
p2 1
p2 2
p2 N
= A e−β 2m e−β 2m · · · e−β 2m .
Possiamo adesso chiederci quale sia la probabilit`a, che indichiamo con P , che un elettrone, diciamo l’elettrone 1, occupi lo stato ( p, ms ) indipendentemente dagli stati occupati dagli altri elettroni. Se non si hanno complicazioni dovute all’indistinguibilit` a delle particelle, tale probabilit` a si ottiene attraverso le regole probabilistiche consuete, ovvero fissando nell’equazione precedente il valore di ( p1 , ms1 ) a ( p, ms ) e sommando su tutti i possibili valori ( p2 , ms2 ), ( p3 , ms3 ), . . . , ( pN , msN ). Attraverso questo metodo, che `e giustificato solo quando le probabilit` a sono indipendenti, si ottiene l’espressione p2
P = A e−β 2m , dove A `e una nuova costante di normalizzazione. Bisogna notare che questo risultato poteva ottenersi direttamente applicando il principio fondamentale del paragrafo precedente (Eq. (10.2)) a un sistema composto da un solo elettrone (l’elettrone 1) e disinteressandosi di tutti gli altri. Questo tipo di approccio, anche se pu` o portare in alcuni casi al risultato corretto, non `e per` o giustificato in generale.
278
CAPITOLO 10
Le complicazioni dovute all’indistinguibilit` a delle particelle, cui accennavamo sopra, e che abbiamo ignorato per ottenere l’equazione precedente, sono di duplice natura. In primo luogo, essendo gli elettroni indistinguibili, lo stato del sistema in cui l’elettrone 1 occupa lo stato ( p1 , ms1 ), l’elettrone 2 occupa lo stato ( p2 , ms2 ), . . . , l’elettrone N occupa lo stato ( pN , msN ), non `e fisicamente distinguibile da un qualsiasi altro stato del sistema ottenuto dal primo permutando in maniera arbitraria l’ordine delle particelle che occupano i diversi stati. A questo fatto si pu` o ovviare sia introducendo il numero di occupazione degli stati di particella singola e imponendo che tale numero sia uguale a 0 oppure a 1, sia, pi` u semplicemente, dividendo il volume delle spazio delle fasi a disposizione del sistema per N !, ovvero eseguendo la sostituzione dΓ →
dΓ . N!
Il fattore 1/N ! si ripercuote sulla costante di normalizzazione A e la sua introduzione `e inessenziale se non si devono considerare fenomeni fisici che comportino trasformazioni che alterano il numero di particelle che compongono il sistema. In secondo luogo bisogna tener conto del principio di esclusione di Pauli. Le complicazioni derivanti da tale principio cominciano a verificarsi a densit` a molto elevate, quando il numero di elettroni inizia a essere confrontabile col numero di stati quantici a disposizione degli elettroni stessi. In tali casi non `e pi` u possibile procedere secondo lo schema di ragionamento sviluppato sopra in quanto la probabilit` a che un elettrone occupi un determinato stato non `e pi` u indipendente dalla probabilit` a che un altro elettrone occupi lo stesso stato, o uno stato diverso. In altre parole, le probabilit` a non sono pi` u indipendenti fra loro ed `e indispensabile introdurre il formalismo dei numeri di occupazione. Con tale formalismo si possono ottenere i risultati della statistica di Fermi-Dirac, sempre lavorando col principio enunciato precedentemente, come illustrato in seguito nel Par. 10.6. Quando siamo lontani dalla situazione descritta sopra, ovvero, come si dice, quando siamo lontani dalla degenerazione, la formula ottenuta per P `e corretta. Come applicazione, cerchiamo la distribuzione delle velocit`a degli elettroni, ovvero cerchiamo la probabilit` a dΠ che un elettrone abbia il vettore velocit`a compreso nell’elemento di volume d3v (dello spazio delle velocit`a) centrato intorno al vettore v . Per far questo basta contare il numero di stati quantici corrispondenti al d3v e utilizzare l’espressione per P ottenuta sopra. Il numero di stati si conta pi` u facilmente nello spazio degli impulsi utilizzando il principio secondo il quale l’estensione in fase di un singolo stato quantico `e h3 , con h costante di Planck. Se V `e il volume fisico a disposizione degli elettroni, il numero di stati dN aventi impulso nel d3 p `e dato da dN =
2V 3 d p , h3
LEGGI DI EQUILIBRIO TERMODINAMICO
279
dove il fattore 2 `e stato introdotto per tener conto delle due possibili orientazioni dello spin. Osservando inoltre che p = m v , per cui d3 p = m3 d3v , si ottiene 1
2
dΠ = B e− 2 β m v d3v , dove B `e una nuova costante data da 2 V m3 A . h3 La costante di normalizzazione B si determina imponendo che l’integrale del dΠ su tutto lo spazio delle velocit`a sia 1 (alternativamente si potrebbe imporre che tale integrale sia N –numero totale di elettroni– oppure N /V –numero di elettroni per unit` a di volume– col che, ovviamente, cambia il significato fisico del dΠ). Ricordando che ∞ √ 2 e−x dx = π , B=
−∞
la costante B pu` o essere facilmente calcolata. In definitiva, ponendo dΠ = P(v ) d3v , si ottiene P(v ) =
βm 2π
3/2
1
e− 2 β m v
2
.
(10.4)
Da questa probabilit`a si pu` o poi trovare la probabilit` a, ad essa associata, che l’elettrone abbia modulo di velocit` a compresa fra v e v + dv. Indicando quest’ultima quantit` a con P (v) dv e osservando che d3v = 4π v 2 dv, si ha $ 2 (β m)3 2 − 1 β m v2 v e 2 P (v) = . π Questa distribuzione prende il nome di distribuzione Maxwelliana delle velocit`a, ma lo stesso nome `e anche utilizzato per la distribuzione del vettore velocit`a, P(v ), data sopra (Eq. (10.4)).
10.3 La legge di Saha-Boltzmann Consideriamo un sistema fisico, costituito da un atomo neutro e da N elettroni, contenuto in una cavit` a di volume V che si trovi all’equilibrio termodinamico alla temperatura T . I livelli energetici dell’atomo possono essere caratterizzati da due indici discreti r e k. Con r si indica il grado di ionizzazione che pu` o assumere i valori r = 0, 1, 2, . . . , rmax , dove rmax `e 1 per l’Idrogeno, 2 per l’Elio, e cos`ı via. Fissato r, ovvero fissato il grado di ionizzazione, k numera i livelli energetici ordinati in energia crescente a partire dal livello fondamentale
280
CAPITOLO 10
dello ione, per il quale si assume k = 0. A ciascun livello compete un’energia Tr,k e una degenerazione gr,k . Indichiamo con I1 il potenziale di prima ionizzazione, con I2 il potenziale di seconda ionizzazione, e cos`ı via. Inoltre, indichiamo con Er,k l’energia del livello k-esimo dell’atomo r-volte ionizzato e supponiamo che tale energia sia misurata a partire dal corrispondente livello fondamentale (Er,0 = 0, qualsiasi sia r). L’energia del livello (r, k), riferita all’energia del livello fondamentale dell’atomo neutro, `e data da Tr,k = Er,k +
r
(r ≤ rmax ) ,
Ii ,
i=0
dove abbiamo posto per definizione I0 = 0. Ovviamente, quando l’atomo `e ionizzato r volte, nella cavit` a vengono a essere presenti (N + r) elettroni. Applicando al nostro sistema fisico il principio fondamentale nella forma dell’Eq. (10.2), la probabilit` a P che l’atomo si trovi nello stato (r, k) e che gli (N + r) elettroni abbiano energie cinetiche 1 , 2 , . . ., N +r `e data da P = A gr,k e−β Tr,k e−β 1 e−β 2 · · · e−β N +r . Tuttavia, se ci interessa semplicemente la probabilit` a Pr,k che l’atomo si trovi nello stato (r, k) e ci disinteressiamo del particolare stato nel quale si trovano gli elettroni liberi, `e necessario eseguire la somma della P su tutti i possibili stati di tali elettroni. Questa somma pu` o essere eseguita con facilit`a soltanto se siamo lontani dalla degenerazione. In questo caso, infatti, l’unico effetto dell’indistinguibilit` a degli elettroni `e la riduzione del volume dello spazio delle fasi di un fattore (N + r)! e si ottiene quindi
Pr,k = A gr,k e−β Tr,k
1 (N + r)!
e−β 1
dΓ1 h3
e−β 2
dΓ2 ... h3
e−β N +r
dΓN +r , h3
dove dΓi `e l’elemento di volume dello spazio delle fasi a disposizione dell’i-esimo elettrone. Gli integrali che compaiono a secondo membro sono tutti uguali fra loro e, limitandoci al caso non relativistico in cui = p2 /(2 m), sono della stessa forma dell’integrale valutato nel paragrafo precedente per trovare la costante di normalizzazione della distribuzione Maxwelliana delle velocit`a. Ripetendo gli stessi ragionamenti si trova che il singolo integrale, che indichiamo con Nq (T ), vale 2V Nq (T ) = 3 h
2π m β
3/2 ,
(10.5)
dove il fattore 2 proviene, al solito, dallo spin. A proposito di questo integrale, `e opportuno osservare che esso ha un significato fisico molto preciso. Esso rappresenta infatti il numero di stati quantici a disposizione di un elettrone
LEGGI DI EQUILIBRIO TERMODINAMICO
281
libero all’equilibrio termodinamico alla temperatura T . Un valore di ordine di grandezza per la stessa quantit` a potrebbe essere trovato mediante un semplice ragionamento di questo tipo: alla temperatura T un elettrone pu` o avere un impulso massimo, pmax , dell’ordine di p2max 1 = . 2m β Tenendo conto delle due possibili orientazioni dello spin, il numero di stati quantici a disposizione dell’elettrone `e quindi dato da 2 43 π p3max V 8π V = h3 3 h3
2m β
3/2 .
L’espressione corretta si ottiene da quella √ cos`ı trovata per semplice moltiplicazione di un fattore numerico pari a 3 π/4 1.3. Attraverso la quantit` a Nq (T ) la probabilit` a Pr,k risulta Pr,k = A gr,k e−β Tr,k
1 [ Nq (T )]N +r . (N + r)!
dalla quale si vede che la probabilit` a `e proporzionale al numero di stati quantici a disposizione di tutti gli (N + r) elettroni. Questa probabilit`a pu` o essere posta in una forma pi` u significativa inglobando nella costante di normalizzazione il numero di stati quantici a disposizione di N elettroni (si osservi che N `e una costante). Ponendo A = A
1 [ Nq (T )]N , N!
si ottiene Pr,k = A gr,k e−β Tr,k
N! [ Nq (T )]r . (N + r)!
Se il numero di particelle `e molto elevato, il rapporto N !/(N + r)! `e uguale a N −r . Indicando allora con Ne la densit` a elettronica (Ne = N/V), e ricordando l’Eq. (10.5), si arriva all’espressione finale 3/2 r 2 2π m −β Tr,k Pr,k = A gr,k e . N e h3 β Questa equazione contiene sia l’equazione (o legge) di Saha che l’equazione (o legge) di Boltzmann ed `e spesso denominata equazione (o legge) di SahaBoltzmann. Per ottenere l’equazione di Boltzmann si esprime il rapporto fra le probabilit` a Pr,k e Pr,j relative a due livelli, k e j, dello stesso grado di ionizzazione r. Si ha
282
CAPITOLO 10
Pr,k gr,k −β (Tr,k −Tr,j ) = e . Pr,j gr,j Ricordando l’espressione per Tr,k , e introducendo la temperatura T in luogo di β, si ottiene Pr,k gr,k −(Er,k −Er,j )/(kB T ) = e . Pr,j gr,j
(10.6)
L’equazione di Saha si ricava andando preliminarmente a calcolare la probabilit` a Pr che l’atomo si trovi nel grado di ionizzazione r, indipendentemente dal livello k. Ricordando la definizione di Tr,k , si ha Pr =
Pr,k = A ur (β) e
−β Tr,0
k
2 N e h3
2π m β
3/2 r ,
dove si `e introdotta la quantit` a ur (β), detta funzione di partizione, definita da ur (β) =
gr,k e−βEr,k .
k
Se si esprime adesso il rapporto fra le probabilit` a che l’atomo si trovi in due gradi di ionizzazione successivi si ottiene Pr+1 ur+1 (β) −β (Tr+1,0 −Tr,0 ) 2 = e Pr ur (β) N e h3
2π m β
3/2 ,
ovvero, ricordando che Tr+1,0 − Tr,0 = Ir+1 , e introducendo la temperatura in luogo di β Pr+1 ur+1 (T ) −Ir+1 /(kB T ) 2 e = (2π m kB T )3/2 . Pr ur (T ) N e h3
(10.7)
Questa equazione prende il nome di equazione di Saha o equazione della ionizzazione. Scoperta dal fisico indiano M.N. Saha all’inizio degli anni 1920, essa si rivel` o di importanza fondamentale per la comprensione degli spettri stellari. A proposito delle equazioni di Saha e di Boltzmann, bisogna dire che i primi membri di tali equazioni si trovano spesso espressi in termini di rapporti di popolazioni, invece che in termini di rapporti di probabilit` a. Tali rapporti sono uguali fra loro, come ovvia conseguenza dell’interpretazione probabilistica della termodinamica. Ad esempio, l’equazione di Saha pu` o anche scriversi, con simboli evidenti, Nr+1 Ne ur+1 (T ) −Ir+1 /(kB T ) 2 e = (2π m kB T )3/2 , Nr ur (T ) h3
283
LEGGI DI EQUILIBRIO TERMODINAMICO
e, osservando che il secondo membro `e funzione unicamente della temperatura, si pu` o anche porre nella forma Nr+1 Ne = K(T ) . Nr Scritta in questa forma, l’equazione di Saha diviene un caso particolare di un’equazione pi` u generale, detta equazione di azione di massa o equazione di Guldberg-Waage, che viene utilizzata, soprattutto in chimica, per mettere in relazione le densit`a (o concentrazioni) dei reagenti di una reazione all’equilibrio termodinamico. Ad esempio, per la reazione chimica A+B → ← AB , con A e B elementi qualsiasi, si ha, all’equilibrio termodinamico N A NB = K(T ) . NAB Ovviamente, nel caso dell’equazione di Saha, si ha una “reazione di ionizzazione”, piuttosto che una reazione chimica, ovvero, con simboli evidenti → Ar . Ar+1 + e− ← Come applicazione dell’equazione di Saha, calcoliamo il grado di ionizzazione di un plasma di puro Idrogeno che si trovi alla temperatura di equilibrio T e alla pressione Pg . Indicando con NH e con NH+ le densit` a di atomi di Idrogeno neutri e ionizzati, rispettivamente, il grado di ionizzazione x (con 0 ≤ x ≤ 1) `e definito dall’equazione x=
N H+ . N H + N H+
Dall’equazione di Saha si ha 2 x N H+ = e−IH /(kB T ) = (2π m kB T )3/2 , NH 1−x uH (T ) Ne h3 dove IH `e il potenziale di ionizzazione dell’Idrogeno e uH (T ) `e la funzione di partizione dell’Idrogeno neutro (la funzione di partizione dell’Idrogeno ionizzato `e, per definizione, uguale a 1). La densit` a elettronica si pu`o esprimere attraverso la pressione totale del gas Pg . Per un plasma non degenere si ha
Pg = kB T (NH + NH+ + Ne ) = kB T (NH + 2Ne ) = kB T Ne che d` a
1+x , x
284
CAPITOLO 10
Fig. 10.1. Grado di ionizzazione di un plasma di puro Idrogeno in funzione della temperatura T (in K) e della pressione gassosa Pg (in dyne cm−2 ). Le tre curve si riferiscono a valori fissati del grado di ionizzazione x. I punti A, B, e C rappresentano rispettivamente le condizioni fisiche della fotosfera solare, del centro del Sole e della corona solare.
Ne =
Pg x . 1 + x kB T
Sostituendo nell’equazione di Saha il valore di Ne cos`ı trovato, si ottiene la seguente equazione di secondo grado in x x2 =C , 1 − x2 dove la quantit` a adimensionale C `e data da C=
(π m)3/2 (2 kB T )5/2 −IH /(kB T ) e . uH (T ) h3 Pg
Risolvendo l’equazione si trova $ x=
C . 1+C
Sostituendo in C i valori numerici delle costanti e supponendo uH = 2 (un’approssimazione brutale che non altera tuttavia in maniera significativa i risultati), si ha, numericamente 5
C = 0.3334 T 5/2 Pg−1 e−1.5777×10 /T , con T espressa in K e Pg in dyne cm−2 . I risultati numerici ottenuti dalla soluzione dell’equazione sono riportati in grafico nella Fig.10.1
LEGGI DI EQUILIBRIO TERMODINAMICO
285
10.4 La radiazione di corpo nero Consideriamo il sistema fisico costituito dalla radiazione elettromagnetica racchiusa in una cavit` a all’equilibrio termodinamico alla temperatura T . Un tale sistema fisico `e chiamato corpo nero e pu` o essere realizzato sperimentalmente praticando un piccolo foro –tanto piccolo da non alterare sostanzialmente la condizione di equilibrio termodinamico– nella parete di un forno rivestito internamente di nero-fumo e portato a temperature elevate. Analizzando spettroscopicamente la radiazione proveniente dal foro, si pu`o determinare la quantit` a Iν , ovvero l’intensit` a specifica della radiazione di corpo nero. Per tale quantit` a `e invalso l’uso di utilizzare il simbolo Bν . o essere trovata utilizzando i principi Come vedremo, l’espressione per Bν pu` generali della termodinamica statistica enunciati nel Par. 10.1. Tale espressione conferma un certo numero di propriet` a che possono dedursi classicamente applicando il primo e secondo principio della termodinamica e sulle quali `e interessante soffermarsi, soprattutto per l’importanza storica che ha rivestito il problema della radiazione di corpo nero nello sviluppo della fisica moderna. La prima affermazione che si pu` o fare classicamente a proposito della radiazione di corpo nero `e che la funzione Bν deve essere una funzione universale della temperatura. Si deve cio`e avere, come si pu`o dimostrare in base al secondo principio della termodinamica, Bν = Bν (T ), senza ulteriori dipendenze da altri parametri (come ad esempio la natura delle pareti del forno, l’eventuale sostanza che si trova nel suo interno, etc.). Sempre attraverso il secondo principio della termodinamica `e anche possibile dimostrare che la radiazione di corpo nero `e omogenea, isotropa e non polarizzata. Se cos`ı non fosse sarebbe infatti possibile ideare una macchina lavorante in ciclo che potrebbe produrre lavoro a spese di un’unica sorgente e questo, come `e noto, contraddice il secondo principio. Un’altra conseguenza dei principi della termodinamica `e la dipendenza della densit` a totale di energia dalla quarta potenza della temperatura. Per vedere questo, consideriamo il sistema costituito dalla radiazione elettromagnetica contenuta in un cilindro munito di un pistone mobile avente la superficie interna perfettamente riflettente (si veda la Fig. 10.2). Per una trasformazione termodinamica infinitesima dovuta all’espansione di un volume dV si ha, in base al primo principio della termodinamica dU = δQ − δL = δQ − P dV , dove U `e l’energia interna del sistema, δQ la quantit` a di calore assorbita dal sistema nella trasformazione, δL il lavoro compiuto dal sistema sull’ambiente e P la pressione. Se si indica con u la densit` a di energia interna, si ha evidentemente U = u V e quindi, poich´e u `e funzione solo della temperatura T dU = V
du dT + u dV . dT
286
CAPITOLO 10
φ
θ
dV Fig. 10.2. Il campo di radiazione contenuto nel pistone viene assoggettato a un’espansione infinitesima con scambio di calore da o verso l’ambiente esterno.
Per valutare il δL bisogna calcolare la pressione esercitata sul pistone. Tenendo conto che la radiazione `e isotropa, e che quindi la densit`a di energia della radiazione che si propaga entro l’angolo solido dΩ `e data da u dΩ/(4π) e che inoltre la superficie del pistone `e perfettamente riflettente si ha, dall’Eq. (1.13) P =
2π
π/2
dφ
2
0
0
u cos2 θ sinθ dθ , 4π
dove θ e φ sono gli angoli polari definiti nella Fig. 10.2. Risolvendo l’integrale si ottiene, con facili passaggi P =
u , 3
e quindi u dV . 3 Sostituendo le espressioni per dU e per δL nell’equazione che esprime il primo principio e risolvendo per δQ si ha δL =
du 4 dT + u dV . dT 3 Ricordiamo adesso che se la trasformazione `e reversibile (il che implica l’assenza di attrito nel moto del pistone e l’uguaglianza di temperatura fra radiazione e ambiente), il secondo principio della termodinamica impone che la quantit`a δQ = V
δQ V du 4 u = dT + dV T T dT 3 T sia un differenzaile esatto. Per questo bisogna che sia soddisfatto il cosiddetto criterio di Schwarz, ovvero ∂ V du ∂ 4 u = , ∂V T dT ∂T 3 T
LEGGI DI EQUILIBRIO TERMODINAMICO
287
dalla quale si ottiene, con facili passaggi du u =4 . dT T Risolvendo questa equazione differenziale si ottiene infine u = aT4 , dove a `e una costante di integrazione. Si pu` o osservare che le considerazioni ora svolte permettono anche di determinare l’entropia del campo di radiazione. Sostituendo infatti l’espressione per u ora trovata si ha dS =
δQ 4 = 4 a V T 2 dT + a T 3 dV , T 3
ovvero, per integrazione 4 aT3 V , 3 dove abbiamo utilizzato il terzo principio della termodinamica, che stabilisce che l’entropia `e nulla a T = 0, per fissare la costante di integrazione. Per una trasformazione adiabatica del campo di radiazione si ha quindi S=
T V 1/3 = cost. , oppure, ricordando che P = u/3 = a T 4 /3, p V 4/3 = cost. , che `e la familiare legge delle trasformazioni adiabatiche con l’esponente γ = 43 . Oltre la legge integrale dedotta sopra per u, la teoria classica permette anche di determinare l’espressione della funzione Bν (T ). Vedremo per`o che l’espressione che cos`ı si ottiene `e incongruente fisicamente e non conforme ai valori sperimentali (salvo che nel limite delle basse frequenze). Come abbiamo visto nel Par. 4.3, il sistema fisico costituito dal campo di radiazione in una cavit`a di volume V `e descritto quantisticamente da un’Hamiltoniana pari alla somma di tante Hamiltoniane di oscillatore armonico, indipendenti fra loro, una per ciascun modo del campo. Ragionamenti simili a quelli ivi sviluppati possono essere effettuati anche classicamente e si ottiene che, supponendo di numerare i modi con l’indice intero k, l’Hamiltoniana classica pu` o essere posta nella forma H= H(pk , qk ) = γk p2k + δk qk2 , k
k
dove qk `e la coordinata canonica relativa al modo k, pk `e il relativo momento cinetico coniugato e dove γk e δk sono quantit` a che dipendono dall’indice k e che
288
CAPITOLO 10
non `e necessario specificare ulteriormente3 . In base al principio fondamentale espresso dall’Eq. (10.1), la probabilit` a dP che la variabile q1 sia compresa fra q1 e q1 + dq1 , la variabile p1 sia compresa fra p1 e p1 + dp1 , e cos`ı via, `e data da dP = A e−βH(p1 ,q1 ) e−βH(p2 ,q2 ) · · · e−βH(pk ,qk ) · · · dq1 dp1 dq2 dp2 · · · dqk dpk · · · , dove A `e la costante di normalizzazione. Poich´e le Hamiltoniane sono tutte indipendenti fra loro, la probabilit` a ridotta, dΠ, che la variabile q1 sia compresa fra q1 e q1 + dq1 e la variabile p1 sia compresa fra p1 e p1 + dp1 , si pu` o ottenere integrando su tutte le possibilit` a per le altre variabili q2 , p2 , . . ., qk , pk , . . . Si ottiene dΠ = A e−βH(p1 ,q1 ) dq1 dp1 , dove A `e una nuova costante di normalizzazione data da A = .
dq1
.
1 . dp1 e−βH(p1 ,q1 )
L’energia media relativa al modo 1 `e quindi data da . . dq1 dp1 H(p1 , q1 ) e−βH(p1 ,q1 ) . . , 1 = dq1 dp1 e−βH(p1 ,q1 ) e pu` o anche essere espressa nella forma d −βH(p1 ,q1 ) ln dq1 dp1 e 1 = − . dβ Sostituendo l’espressione dell’Hamiltoniana ed eseguendo le integrazioni si ottiene con facili passaggi 1 =
1 = kB T . β
Questo risultato, ottenuto per il modo 1, `e indipendente dalle particolari caratteristiche del modo stesso e vale quindi per tutti i modi. In altre parole, l’energia media di un oscillatore armonico classicamente `e sempre data da kB T , qualsiasi siano le propriet`a fisiche dell’oscillatore. Per mezzo di questa propriet` a, e ricordando le Eq. (4.16) e (4.13), si ottiene per le funzioni Bν e uν [Bν (T )]class =
2 ν2 kB T , c2
3
[uν (T )]class =
2 ν2 kB T . c3
Ricordando le considerazioni svolte nel Par. 4.2, tali quantit` a possono essere espresse in funzione dei coefficienti c e c∗ , oltre che della frequenza o del numero d’onde. kλ
kλ
LEGGI DI EQUILIBRIO TERMODINAMICO
289
Il risultato che abbiamo ottenuto `e in flagrante contraddizione coi risultati sperimentali alle alte frequenze, e, per di pi´ u, quando si integra la funzione u ν su tutte le frequenze si ottiene un integrale divergente, il che significa che l’energia per unit` a di volume del campo di radiazione dovrebbe essere infinita. Questo fatto `e solitamente conosciuto col nome di catastrofe dell’ultravioletto. Fu proprio per risolvere queste contraddizioni che Planck fu condotto a introdurre le ipotesi quantistiche. Si pu` o infatti ripetere lo stesso ragionamento probabilistico tenendo sempre conto del fatto che i modi sono indipendenti ma introducendo il risultato quantistico che gli autovalori del generico modo k, relativo alla frequenza ν, sono dati da n h ν, con n intero arbitrario. La probabilit` a Π(n) che il modo si trovi nello stato avente autovalore n h ν, ovvero che si abbiano n fotoni, `e allora data da Π(n) = A e−β n h ν , dove A `e una costante di normalizzazione data da A = &∞ n=0
1 . e−β n h ν
L’energia media contenuta nel modo `e quindi data da (ν) =
∞
Π(n) n h ν =
n=0
&∞ n h ν e−β n h ν n=0 &∞ −β n h ν , n=0 e
che pu` o anche esprimersi nella forma ∞ d −β n h ν ln . e (ν) = − dβ n=0 La somma si esegue facilmente ricordando che, per un numero q arbitrario di modulo minore di 1 (|q| < 1), si ha ∞
qn =
n=0
1 . 1−q
Si ottiene quindi, con facili passaggi (ν) =
hν , −1
(10.8)
eβ hν
dalla quale risulta Bν (T ) =
1 2 h ν3 , 2 β h c e ν −1
uν (T ) =
1 2 h ν3 . 3 β h c e ν −1
290
CAPITOLO 10
Le espressioni cos`ı trovate sono in accordo coi fatti sperimentali e la funzione Bν (T ) viene detta funzione di Planck (anche se tale nome `e talvolta utilizzato per la uν (T ), oppure per le funzioni ad esse associate Bλ (T ) e uλ (T )). Dall’espressione della uν si pu` o determinare, per semplice integrazione sulle frequenze e sugli angoli, la densit`a totale di energia u. Si ha " ∞ 2 h ν3 1 u = dΩ dν . 3 β hν − 1 c e 0 Ponendo x = β h ν, si ottiene, mediante un cambiamento di variabile ∞ x3 8π dx . u= 4 3 3 β h c 0 ex − 1 L’integrale vale π 4 /15 e si ottiene cos`ı la cosiddetta legge di Stefan u = aT4 ,
(10.9)
dove la costante a, detta costante della densit`a di radiazione, `e data da a=
4 8π 5 kB = 7.566 × 10−15 erg cm−3 K−4 . 3 15 h c3
Come si vede, si `e cos`ı riottenuta la legge della densit` a di radiazione, dedotta precedentemente in base a considerazioni puramente classiche. La meccanica quantistica `e in grado di fornire anche il valore della costante a che rimane invece indeterminata nella deduzione classica. Se si considera l’integrale in frequenza della funzione di Planck, ovvero se si considera la quantit` a B(T ) definita da ∞ B(T ) = Bν (T ) dν , 0
si ottiene, con un calcolo del tutto simile a quello precedente, B(T ) =
ac 4 T . 4π
La quantit` a πB(T ) rappresenta il flusso della radiazione di corpo nero, ovvero la quantit` a di energia che fluisce, nell’unit` a di tempo, attraverso l’unit` a di superficie di un corpo nero (in tutte le direzioni e a tutte le frequenze). Introducendo infatti un sistema di coordinate polari con l’asse z diretto lungo la normale alla superficie, il flusso F `e dato, con notazioni evidenti, dall’espressione F =
dν 0
per cui si ha
∞
2π
π/2
dφ 0
cosθ Bν (T ) sinθ dθ = πB(T ) , 0
291
LEGGI DI EQUILIBRIO TERMODINAMICO
F = π B(T ) =
ac 4 T . 4
La quantit` a ac/4 viene tradizionalmente indicata col simbolo σ e viene chiamata costante di Stefan-Boltzmann. Si ha quindi F = σ T4 ,
(10.10)
dove σ=
4 2π 5 kB ac = = 5.670 × 10−5 erg cm−2 s−1 K−4 . 4 15 h3 c2
10.5 Propriet` a della radiazione di corpo nero Lo spettro della radiazione di corpo nero, descritto dalla funzione di Planck Bν (T ) =
1 2 h ν3 , c2 e hν/(kB T ) − 1
(10.11)
gode di un certo numero di propriet` a che `e importante mettere in evidenza. Consideriamo il limite della funzione alle basse frequenze, ovvero supponiamo che sia hν 1 . kB T Sviluppando l’esponenziale in serie di potenze si ottiene Bν (T ) =
2 ν2 kB T . c2
Questa espressione, che prende il nome di legge di Rayleigh e Jeans, non contiene pi` u la costante di Planck ed `e in effetti la legge del corpo nero che si ottiene attraverso la teoria classica (come abbiamo visto nel paragrafo precedente). La condizione hν kB T implica che l’energia dei fotoni `e molto minore dell’energia termica dimodoch´e si pu`o trascurare la natura quantistica del campo di radiazione. In altre parole, l’energia dei fotoni si comporta come un continuo e l’applicazione della teoria classica risulta pienamente giustificata. Negli oggetti astrofisici, la legge di Rayleigh e Jeans `e in generale ben verificata alle radiofrequenze e alle microonde. Se si considera invece il limite alle alte frequenze, ovvero per
292
CAPITOLO 10
Fig. 10.3. Il grafico illustra l’andamento della funzione di Planck con la frequenza (in scala lineare) per cinque valori diversi della temperatura. Bν e ν sono espresse in unit` a c.g.s.. La temperatura ` e in K.
hν 1 , kB T l’equazione di Planck assume la forma 2 h ν 3 −hν/(kB T ) e . c2 Questa equazione era stata dedotta da Wien in base ad argomentazioni ad hoc non del tutto corrette e avrebbe dovuto rappresentare lo spettro del corpo nero nella sua completezza e non nel solo limite delle alte frequenze. In effetti Wien aveva correttamente dimostrato, in base a considerazioni basate sull’effetto Doppler e sulla termodinamica, che lo spettro della radiazione di corpo nero `e descritto da un’equazione del tipo (equazione di Wien) ν Bν (T ) = Kν 3 f , T con K costante e f (x) funzione arbitraria. Sebbene il ragionamento fosse corretto, l’ipotesi che la funzione f (x) fosse del tipo exp(−x) (invece che del tipo 1/[exp(x) − 1]) si dimostr` o in seguito valida solo alle alte frequenze. Un’importante propriet` a della radiazione di corpo nero `e il fatto che, fissata una frequenza, l’intensit`a della radiazione aumenta in maniera monotona all’aumentare della temperatura. La dimostrazione `e banale e deriva semplicemente dall’equazione Bν (T ) =
LEGGI DI EQUILIBRIO TERMODINAMICO
293
Fig. 10.4. Il grafico illustra l’andamento della funzione di Planck con la frequenza (in scala logaritmica) per cinque valori diversi della temperatura. Si noti che l’intervallo di temperatura `e molto maggiore di quello di Fig. 10.3. Bν e ν sono espresse in unit` a c.g.s.. La temperatura ` e in K.
∂Bν (T ) e h ν/(kB T ) 2 h2 ν 4 = 2 > 0 . 2 ∂T c kB T e h ν/(kB T ) − 1 2 In conseguenza di questo fatto, il grafico di Bν (T ) in funzione di ν (a T fissato) d` a luogo a delle curve che, all’aumentare di T , inviluppano completamente le curve relative a valori di T inferiori (si vedano le Fig. 10.3 e 10.4). Un’altra propriet` a importante della radiazione di corpo nero `e connessa col valore della frequenza, νmax , alla quale l’intensit` a specifica della radiazione di corpo nero `e massima per una temperatura assegnata. Introducendo la variabile ridotta x = h ν/(kB T ), l’equazione di Planck assume la forma Bν (T ) =
3 3 T 2 kB b(x) , 2 h c2
dove x3 . ex − 1 Il punto di massimo della funzione b(x) si ottiene risolvendo l’equazione trascendente b(x) =
x = 3 (1 − e−x ) ,
294
CAPITOLO 10
che ha per soluzione xmax 2.82. Si ha allora h νmax = 2.82 kB T , ovvero, numericamente νmax = 5.88 × 1010 T Hz , dove T `e in K. Questa equazione mostra che la frequenza del massimo aumenta linearmente all’aumentare della temperatura, una legge che `e nota come legge dello spostamento di Wien. Infine `e importante osservare che, in alcuni casi, si preferisce descrivere l’intensit` a specifica della radiazione di corpo nero attraverso la funzione Bλ (T ) (invece che attraverso la funzione Bν (T )). Le due funzioni sono legate attraverso la relazione (si veda l’Eq.(4.12)) Bλ (T ) =
c ν2 Bν (T ) . B (T ) = ν λ2 c
Esprimendo la funzione in termini della lunghezza d’onda (in luogo della frequenza), si ha Bλ (T ) =
1 c1 , 5 c /(λT )−1 2 πλ e
dove le costanti c1 e c2 , dette rispettivamente prima costante della radiazione e seconda costante della radiazione, sono date da
c1 = 2π h c2 = 3.742 × 10−5 erg cm2 s−1 ,
c2 =
hc = 1.439 cm K . kB
o cercare il valore della lunAnalogamente a quanto fatto per la Bν (T ), si pu` ghezza d’onda, λmax , alla quale si trova il massimo della funzione Bλ (T ) per una temperatura assegnata. Ponendo y = c2 /T , si ottiene Bλ (T ) =
5 5 T ˜ 2 kB b(y) , 4 h c3
dove ˜b(y) =
y5 . ey − 1
Il punto di massimo della funzione ˜b(y) si ottiene risolvendo l’equazione trascendente y = 5 (1 − e−y ) ,
LEGGI DI EQUILIBRIO TERMODINAMICO
295
che ha per soluzione ymax 4.97. Si ha allora λmax T =
c2 , 4.97
ovvero, numericamente λmax T = 0.290 cm K . Bisogna notare che il punto in cui si trova il massimo della funzione Bλ (T ) non corrisponde al punto in cui si trova il massimo della funzione Bν (T ). La cosa non deve sorprendere in quanto in un caso si considera l’energia raggiante per unit` a di intervallo di frequenza e nell’altro per unit` a di intervallo di lunghezza d’onda. Le espressioni per νmax e λmax trovate sopra mostrano che il prodotto νmax λmax vale circa 0.568 c.
10.6 La statistica di Fermi-Dirac Consideriamo un sistema fisico macroscopico, S, all’equilibrio termodinamico alla temperatura T , composto da un numero elevatissimo, N , di particelle indistinguibili, non interagenti, che obbediscono al principio di esclusione di Pauli (gas di fermioni). Supponiamo di avere numerato gli stati di particella singola con un indice discreto e indichiamo con i l’energia dello stato i-esimo. Fissiamo l’attenzione su un particolare stato di particella singola, contrassegnato dall’indice k e avente energia k . In base al principio generale dell’Eq. (10.2), la probabilit` a p0 (k) che nello stato k-esimo non siano presenti particelle, ovvero che il numero di occupazione di tale stato sia 0, `e data dall’espressione
p0 (k) = A
n1 ,n2 ,...,nk−1 ,nk+1 ,...
e−β(n1 1 +n2 2 ···+nk−1 k−1 +nk+1 k+1 +···) ,
dove A `e una costante, β = 1/(kB T ), e dove la somma `e estesa a tutte le soluzioni dell’equazione n1 + n2 + · · · + nk−1 + nk+1 + · · · = N , i numeri di occupazione n1 , . . . , nk−1 , nk+1 , . . . potendo assumere soltanto i valori 0 oppure 1. La probabilit` a p1 (k) che nello stato sia presente una particella `e invece data da p1 (k) = A e−βk
n1 ,n2 ...,nk−1 ,nk+1 ,...
e−β(n1 1 +n2 2 ···+nk−1 k−1 +nk+1 k+1 +···) ,
dove la somma `e ora estesa a tutte le soluzioni dell’equazione
296
CAPITOLO 10
n1 + n2 + · · · + nk−1 + nk+1 + · · · = N − 1 , n1 , . . . , nk−1 , nk+1 , . . . potendo assumere soltanto i valori 0 oppure 1. Consideriamo adesso il rapporto p0 (k)/p1 (k). Per esso si ha p0 (k) Z(β, N ) = e βk , p1 (k) Z(β, N − 1) dove Z(β, N ) `e la somma sugli stati del sistema fisico fittizio, S’, ottenuto dal sistema S sopprimendo concettualmente lo stato elementare k-esimo, e nel quale sono presenti N particelle, mentre Z(β, N −1) ha significato analogo, con la differenza che in S’ sono invece presenti (N − 1) particelle. Poich´e il sistema fisico contiene un numero estremamente grande di stati elementari, la distinzione fra S’ e S `e del tutto inessenziale, dimodoch´e le quantit` a Z(β, N ) e Z(β, N −1) possono essere considerate a tutti gli effetti le somme sugli stati relative al sistema fisico “iniziale” S. Indicando allora con x il rapporto Z(β, N )/Z(β, N − 1) e prendendone il logaritmo naturale, si ha ln x = ln[Z(β, N )] − ln[Z(β, N − 1)] . Inoltre, considerando che N `e un numero molto grande, e che stiamo lavorando a valori fissati delle energie Ej , ovvero a volume costante, si pu` o scrivere ∂ ln[Z(β, N )] . ln x = ∂N β,V Questa derivata parziale `e legata al potenziale chimico μ, definito in termodinamica dall’equazione ∂F μ= , ∂N β,V dove F `e l’energia libera di Helmholtz. Essendo infatti per l’Eq. (10.3) ln[Z(β, N )] = −β F , si ha ln x = −β
∂F ∂N
= −β μ . β,V
Ricordando la definizione di x, si ottiene quindi p0 (k) = e β (k −μ) . p1 (k)
LEGGI DI EQUILIBRIO TERMODINAMICO
297
Il numero di occupazione medio dello stato elementare k `e d’altra parte dato dall’espressione n ¯k =
1 p1 (k) = , p0 (k) p0 (k) + p1 (k) +1 p1 (k)
e si ottiene quindi n ¯k =
1 . e β (k −μ) + 1
Questa `e l’equazione fondamentale della statistica di particelle che obbediscono al principio di esclusione di Pauli, ovvero, come si dice, della statistica di Fermi-Dirac. Essa esprime il numero medio di occupazione dello stato di particella singola di energia k in funzione dell’energia stessa e del potenziale chimico μ. Poich´e il ragionamento che abbiamo sviluppato pu` o essere ripetuto per un qualsiasi stato di particella singola, l’indice k pu` o essere omesso nella formula precedente e si ottiene quindi n ¯ () =
1 . e β (−μ) + 1
10.7 La statistica di Bose-Einstein Analogamente a quanto fatto nel paragrafo precedente, consideriamo un sistema fisico macroscopico, all’equilibrio termodinamico alla temperatura T , composto da N particelle indistinguibili, non interagenti, di tipo bosonico (gas di bosoni). Supponiamo di nuovo di aver numerato gli stati di particella singola con un indice discreto e indichiamo con i l’energia dello stato i-esimo. Fissiamo l’attenzione su uno stato particolare, contrassegnato dall’indice k e avente energia k . In base al principio generale dell’Eq. (10.2), la probabilit` a pn (k) che nello stato k-esimo siano presenti n particelle `e data dall’espressione pn (k) = A e−nβk
n1 ,n2 ,...,nk−1 ,nk+1 ,...
e−β(n1 1 +n2 2 +···+nk−1 k−1 +nk+1 k+1 +···) ,
dove A `e una costante, β = 1/(kB T ), e dove la somma `e estesa a tutte le soluzioni dell’equazione n1 + n2 + . . . + nk−1 + nk+1 + . . . = N − n , i numeri n1 , n2 , . . . potendo assumere i valori arbitrari 0, 1, 2, . . . (e non solo i valori 0 e 1 come nel caso dei fermioni).
298
CAPITOLO 10
Consideriamo adesso il rapporto p0 (k)/pn (k). Per esso si ha Z(β, N ) p0 (k) = en β k , pn (k) Z(β, N − n) dove il significato delle quantit`a Z(β, N ) e Z(β, N − n) `e lo stesso di quello discusso nel paragrafo precedente per il caso dei fermioni. Indicando con x il rapporto Z(β, N )/Z(β, N − n) e prendendone il logaritmo naturale, si ha ln x = ln[Z(β, N )] − ln[Z(β, N − n)] , e considerando che N `e un numero molto grande, e che stiamo lavorando a volume costante, si pu` o scrivere ∂ ln x = n ln[Z(β, N )] , ∂N β,V ovvero ln x = −n β μ , dove μ `e il potenziale chimico. Ricordando la definizione di x, si ha allora p0 (k) = e n β (k −μ) , pn (k) ovvero pn (k) = e−n β (k −μ) . p0 (k) Il numero di occupazione medio dello stato k `e d’altra parte dato da & n pn (k) n ¯ k = &n , n pn (k) ovvero, dividendo numeratore e denominatore per p0 (k) & n e−n β (k −μ) n ¯ k = &n −n β ( −μ) . k ne Il rapporto fra le due somme pu` o essere facilmente calcolato mediante lo stesso procedimento che ci ha condotto all’Eq. (10.8). Ponendo z = β(k − μ), si ha & n e−nz d −nz n ln , e n ¯ k = & −nz = − dz ne n e se z > 0, il che implica μ < k , si ottiene
LEGGI DI EQUILIBRIO TERMODINAMICO
n ¯k =
299
1 d ln 1 − e−z = z . dz e −1
Ripetendo le considerazioni finali del paragrafo precedente, si ottiene l’equazione fondamentale della statistica di Bose-Einstein n ¯ () =
1 . e β (−μ) − 1
C’`e da notare che, nel caso del campo di radiazione, i fotoni si comportano effettivamente come bosoni, ma il loro numero totale non `e fissato a priori. Il potenziale chimico, μ, `e quindi nullo e l’equazione precedente si semplifica per dare n ¯ () =
1 , eβ − 1
che coincide con la formula ottenuta per il numero medio di fotoni per modo di frequenza ν quando si immedesimi con h ν.
Capitolo 11
Interazione fra materia e radiazione Dopo aver provveduto nei capitoli precedenti a dare una descrizione quantistica del campo di radiazione nel vuoto (Cap. 4) e dei sistemi atomici isolati (Cap. 5-9), ci proponiamo adesso di passare a descrivere la loro mutua interazione, sviluppando dei metodi generali, anch’essi basati sulla meccanica quantistica, con i quali saremo capaci di trattare i molteplici fenomeni connessi con l’assorbimento, l’emissione e la diffusione della radiazione, tipici dei plasmi di laboratorio e dei plasmi astrofisici. L’insieme di tali metodi `e oggi comunemente indicato col nome di Elettrodinamica Quantistica e rappresenta una delle realizzazioni pi` u riuscite della fisica teorica, sia dal punto di vista della precisione dei risultati ottenuti che dell’eleganza del formalismo impiegato. In questo capitolo ne esporremo i concetti fondamentali e ci interesseremo delle sue applicazioni pi` u semplici, trattando, come si dice, i fenomeni del primo ordine, ovvero i fenomeni che coinvolgono l’emissione e l’assorbimento di un solo fotone. Questo ci porter`a a dedurre in maniera formale le equazioni di evoluzione delle popolazioni di un sistema atomico in presenza del campo di radiazione (equazioni dell’equilibrio statistico) e le equazioni di evoluzione del campo di radiazione in presenza di un sistema atomico (equazione del trasporto radiativo). I fenomeni pi` u rilevanti del secondo ordine, nei quali sono coivolti due fotoni, saranno trattati nel Cap. 15.
11.1 L’Hamiltoniana d’interazione Consideriamo un sistema fisico costituito da un atomo, descritto quantisticamente dall’Hamiltoniana HA , e dal campo di radiazione, descritto quantisticamente dall’Hamiltoniana HR . In assenza di interazione, l’Hamiltoniana del sistema `e ovviamente H0 = HA + HR . dove, ricordando l’Eq. (4.9), HR =
h ¯ ωk (a† a + 21 ) , kλ kλ
kλ
con la somma estesa a tutti i possibili modi del campo di radiazione.
(11.1)
302
CAPITOLO 11
Per ottenere l’Hamiltoniana d’interazione fra il sistema atomico e il campo di radiazione utilizziamo il principio dell’accoppiamento minimale descritto nel Par. 5.2, ovvero effettuiamo nell’Hamiltoniana atomica, per ciascun elettrone, la sostituzione formale dell’Eq. (5.5) pi → pi +
e0 AR (ri ) , c
(i = 1, 2, . . . , N ) ,
R (ri ) `e il dove l’indice i numera gli N elettroni appartenenti all’atomo e dove A potenziale vettore del campo di radiazione valutato nel punto in cui si trova l’elettrone i-esimo. L’altra sostituzione implicita nel principio dell’accoppiamento minimale, ovvero Ei → Ei + e0 φR (ri ) , non ha in questo caso alcun effetto perch´e per il campo di radiazione il potenziale scalare φR `e nullo. Se si assume per HA l’espressione non relativistica (Eq. (7.2)), il principio dell’accoppiamento minimale porta alla nuova Hamil toniana HA data da HA =
N 2 Ze2 e2 e0 1 0 0 pi + + . AR (ri ) − 2m c r r i i=1 i<j ij
Ponendo HA = HA + HI ,
R = 0, si ottiene con HI Hamiltoniana di interazione, e osservando che div A HI =
N N 2 e0 R (ri ) + e0 R (ri )]2 . pi · A [A m c i=1 2 m c2 i=1
(11.2)
Nello spirito di ottenere uno sviluppo perturbativo nell’Hamiltoniana di inteR) razione, trascuriamo il secondo termine (quadratico nel potenziale vettore A 1 rispetto al primo . Ricordando lo sviluppo del potenziale vettore in termini di operatori di creazione e distruzione (si veda l’Eq. (4.5)), l’Hamiltoniana di interazione risulta e0 HI = m kλ
1
%
2π¯ h ωk V
akλ
i
pi · ekλ e
i k· ri
+
a†kλ
∗ p i · ekλ e
−i k· ri
. (11.3)
i
2 descrive processi del secondo ordine, in Come vedremo nel Cap. 15, il termine in A R particolare la diffusione Thomson.
INTERAZIONE FRA MATERIA E RADIAZIONE
303
11.2 Le equazioni cinetiche Sia dato un sistema fisico avente Hamiltoniana H = H0 + HI , dove H0 `e l’Hamiltoniana imperturbata e HI l’Hamiltoniana di perturbazione (nel nostro caso l’Hamiltoniana d’interazione). Il sistema evolve nel tempo secondo l’equazione di Schr¨odinger ∂ |ψ(t) = (H0 + HI )|ψ(t) . ∂t Per risolvere questa equazione utilizziamo il cosiddetto “metodo della variazione delle costanti”. Supponiamo di aver preliminarmente risolto l’equazione di Schr¨ odinger stazionaria per H0 , trovandone gli autovettori |α e i corrispondenti autovalori Eα che obbediscono all’equazione ih ¯
H0 |α = Eα |α
.
(11.4)
Sviluppiamo la funzione d’onda |ψ(t) in serie di tali autovettori (col relativo fattore temporale) ottenendo |ψ(t) = cβ (t) |β e−i Eβ t/¯h . β
I coefficienti cβ sono funzioni del tempo e si riducono a delle costanti in assenza di perturbazione (ovvero quando HI = 0)2 . Sostituiamo poi questo sviluppo nell’equazione di Schr¨odinger per ottenere ih ¯ c˙β (t) |β e−i Eβ t/¯h = cβ (t) HI |β e−i Eβ t/¯h , β
β
dove abbiamo utilizzato la notazione del punto per indicare la derivata rispetto al tempo (c˙β = dcβ /(dt)). Moltiplicando scalarmente ambo i membri per α| e tenendo conto della propriet`a di ortonormalit` a degli autovettori |β , si ha I cβ (t) Hαβ ei ωαβ t , ih ¯ c˙α (t) = β
dove si `e posto I = α|HI |β Hαβ
,
e dove si sono introdotte le cosiddette frequenze angolari di Bohr definite da 2
Questo fatto giustifica il nome di metodo della variazione delle costanti per denotare il procedimento qui seguito per la soluzione dell’equazione di Schr¨ odinger.
304
CAPITOLO 11
Eα − Eβ . (11.5) h ¯ Se si assume adesso che l’Hamiltoniana d’interazione non dipenda dal tempo, l’equazione precedente pu`o essere integrata fra l’istante iniziale (t = 0) e l’istante t generico. Si ha t 1 I cα (t) = cα (0) + Hαβ cβ (t ) ei ωαβ t dt . ih ¯ 0 ωαβ =
β
Questa stessa equazione pu`o essere poi riutilizzata per esprimere il coefficiente cβ (t ) che compare entro il segno di integrale. Cos`ı facendo siamo condotti all’equazione t 1 I cα (t) = cα (0) + Hαβ cβ (0) ei ωαβ t dt ih ¯ 0 β
t t 1 I I i ωαβ t + Hαβ Hβγ dt e dt cγ (t ) ei ωβγ t . (i h ¯ )2 0 0
(11.6)
βγ
Il procedimento pu`o essere ripetuto ad libitum e si ottiene, cos`ı facendo, uno sviluppo perturbativo il cui termine n-esimo contiene a fattore n elementi di matrice dell’Hamiltoniana di interazione. Se si arresta la somma al termine k-esimo, sostituendo il coefficiente c(t) che ivi compare con c(0), si dice che si sviluppa una teoria perturbativa all’ordine k nell’ampiezza di probabilit` a. Consideriamo inizialmente il caso particolare della teoria all’ordine pi` u basso che riduce l’Eq. (11.6) alla sua sola prima riga, e assumiamo che il sistema si trovi, all’istante t = 0, nello stato puro |γ . Tutti i cβ (0) sono nulli, eccettuato cγ (0) che `e uguale a 1. Risolvendo l’integrale si ottiene cα (t) =
1 I 1 − ei ωαγ t H , h ¯ αγ ωαγ
per cui |cα (t)|2 =
2 1 I 2 4 sin (ωαγ t/2) |H | . αγ 2 ωαγ h ¯2
La funzione del tempo che compare in questa espressione si comporta, al limite per t → ∞, come una delta di Dirac (si veda l’Eq. (2.9)). Questo fatto, rigorosamente giustificato nell’ambito della teoria delle distribuzioni, `e illustrato dal grafico della funzione riportato in Fig. 11.1. Si ottiene 4 sin2 (ωαγ t/2) = 2π t δ(ωαγ ) , 2 t→∞ ωαγ lim
305
INTERAZIONE FRA MATERIA E RADIAZIONE
Fig. 11.1. La funzione qui rappresentata si comporta, per t → ∞, come 2π t δ(ω αγ ).
e quindi 2π I 2 |Hαγ | t δ(ωαγ ) . (11.7) h ¯2 L’espressione che abbiamo trovato mostra che il modulo quadro del coefficiente cα (t), che rappresenta fisicamente la probabilit`a di trovare il sistema ` ovvio tuttavia che, nello stato |α all’istante t, cresce linearmente col tempo. E nello stesso tempo, il coefficiente cγ deve diminuire. Questo effetto di retroazione non `e per` o contenuto nell’Eq. (11.7) e, per determinarlo, conviene seguire un procedimento pi` u sofisticato che ci condurr` a a dedurre le equazioni cinetiche di evoluzione del sistema. Per questo, riprendiamo l’Eq. (11.6) e sostituiamo in essa cγ (t ) con cγ (0) (secondo ordine perturbativo nell’ampiezza di probabilit` a). Gli integrali sul tempo possono essere valutati con metodi elementari e si ottiene |cα (t)|2 =
1 I ei ωαβ t − 1 Hαβ cβ (0) h ¯ ωαβ β i ωαγ t 1 I − 1 ei ωαβ t − 1 e I . + 2 Hαβ Hβγ cγ (0) − ωαγ ωβγ ωαβ ωβγ h ¯
cα (t) = cα (0) −
(11.8)
βγ
Passando al calcolo del modulo quadro di cα (t) si ottengono da questa equazione nove termini distinti. Di questi nove termini andiamo per` o a considerare soltanto quelli che sono al massimo quadratici negli elementi di matrice di H I
306
CAPITOLO 11
per essere consistenti con lo sviluppo perturbativo al secondo ordine nell’ampiezza di probabilit` a. Tenendo conto che HI `e un operatore Hermitiano, per I ∗ I cui (Hαβ ) = Hβα , con alcuni passaggi algebrici si ottiene ⎤ ⎡ i ωαβ t − 1 1 e I |cα (t)|2 = |cα (0)|2 − ⎣ Hαβ cβ (0) c∗α (0) + C.C.⎦ h ¯ ωαβ β
ei ωαβ t − 1 e−i ωαδ t − 1 1 I I Hαβ Hδα cβ (0) c∗δ (0) + 2 ωαβ ωαδ h ¯ βδ ⎤ ⎡ i ωαγ t i ωαβ t − 1 − 1 1 ⎣ I e e I + C.C.⎦ , + 2 Hαβ Hβγ cγ (0) c∗α (0) − ωαγ ωβγ ωαβ ωβγ h ¯ βγ dove il simbolo [· · · + C.C.] significa che bisogna aggiungere al termine in parentesi il suo complesso coniugato. Questa espressione pu`o essere notevolmente semplificata quando si adottino alcune approssimazioni riguardo alle condizioni iniziali del sistema. L’approssimazione generalmente introdotta `e quella di supporre che le quantit` a bilineari nei coefficienti cα (0) siano in media nulle quando i due coefficienti si riferiscono a stati diversi, ovvero cα (0) c∗β (0) = |cα (0)|2 δαβ . La media che eseguiamo sul sistema fisico va intesa come media temporale da eseguire rispetto all’istante iniziale, oppure, se si preferisce, come una media statistica su tante possibili realizzazioni diverse del sistema stesso 3 . Le quantit` a |cα (t)|2 rappresentano allora gli elementi di matrice diagonali di un opportuno operatore, detto matrice densit` a, e sono comunemente indicati col simbolo ρα (t). Questa approssimazione, talvolta detta approssimazione delle fasi casuali, equivale a dire che il sistema non si trova in uno stato puro ma, piuttosto, in una miscela di stati tale che gli elementi non diagonali della matrice densit`a (anche detti interferenze quantistiche, oppure coerenze) sono nulli. L’approssimazione delle fasi casuali conduce a risultati validi per un’ampia classe di fenomeni fisici. Essa non `e per` o applicabile quando le relazioni di fase fra stati diversi svolgono un ruolo importante nel fenomeno fisico in studio. Un esempio particolare `e quello nel quale si vuole studiare l’interazione della radiazione con un sistema atomico tenendo conto anche dei fenomeni di polarizzazione. In tale caso, le relazioni di fase diventano essenziali e l’approssimazione delle fasi casuali non `e pi` u applicabile ma deve essere sostituita da 3
La dimostrazione che i due tipi di media siano uguali non `e affatto banale. In meccanica statistica ci si riferisce ad affermazioni di questo genere invocando il cosiddetto teorema ergodico.
INTERAZIONE FRA MATERIA E RADIAZIONE
307
ipotesi meno stringenti. Un approfondimento di questo argomento `e sviluppato nell’App. 11 nella quale viene derivata l’equazione di evoluzione per le coerenze di un sistema fisico4 . Introducendo l’approssimazione delle fasi casuali nell’equazione per la |cα (t)|2 e osservando che il termine lineare in HI non porta alcun contributo perch´e gli I elementi di matrice diagonali Hαα sono (o possono essere supposti) nulli5 , nelle nuove notazioni si ottiene l’equazione ρα (t) = ρα (0) + −
1 I 2 4 sin2 (ωαβ t/2) |Hαβ | ρβ (0) 2 ωαβ h ¯2 β 1 I 2 4 sin2 (ωαβ t/2) |Hαβ | ρα (0) . 2 ωαβ h ¯2 β
Passando al limite per t → ∞, ricordando la definizione delle frequenze angolari di Bohr (Eq. (11.5)), e osservando che tutti i termini nel secondo membro vengono a dipendere linearmente dal tempo, si pu` o scrivere in definitiva l’equazione cinetica per le quantit` a ρα nella forma dρα 2π 2π I 2 I 2 = ρβ |Hαβ | δ(Eα − Eβ ) − ρα |Hαβ | δ(Eα − Eβ ) . (11.9) dt h ¯ h ¯ β
β
11.3 La regola aurea di Fermi L’equazione cinetica (11.9) esprime la variazione temporale della quantit` a ρα , ovvero della probabilit` a di trovare il sistema nello stato |α . Nell’equazione compaiono due termini: un termine col segno positivo che descrive l’aumento della ρα per effetto delle transizioni da stati |β = |α verso lo stato |α e un termine negativo che descrive la diminuzione della ρα per effetto delle transizioni dallo stato |α a stati |β = |α . L’equazione si pu` o semplicemente interpretare dicendo che esiste una probabilit`a di transizione per unit` a di tempo fra gli stati |α e |β data da Pαβ = Pβα = 4
2π I 2 |Hαβ | δ(Eβ − Eα ) . h ¯
(11.10)
Per ulteriori approfondimenti sui fenomeni di polarizzazione si veda E. Landi Degl’Innocenti & M. Landolfi, Polarization in Spectral Lines, Kluwer Acad. Publ., Dordrecht, 2004. 5 Nelle applicazioni che considereremo in seguito, in cui l’Hamiltoniana di interazione ` e quella dell’Eq. (11.3), gli elementi di matrice diagonali HIαα sono effettivamente nulli. In casi diversi essi possono essere formalmente “annullati” aggiungendo il loro contributo a quello dell’Hamiltoniana imperturbata H0 .
308
CAPITOLO 11
Questa formula, dovuta a Fermi, prende il nome di regola aurea di Fermi. La presenza della delta di Dirac fa s`ı che la probabilit` a di transizione sia diversa da zero solo fra stati isoenergetici, una ovvia manifestazione del principio di conservazione dell’energia. C’`e da osservare che la formula `e sostanzialmente gi` a contenuta nell’Eq. (11.7) e, in principio, non `e quindi necessario considerare l’Eq. (11.6) al secondo ordine per ottenerla. Come abbiamo gi` a notato, tuttavia, l’Eq. (11.7) non `e sufficiente a determinare le equazioni cinetiche per la mancanza del termine di retroazione. Scrivendo l’equazione cinetica in termini della probabilit` a di transizione per unit` a di tempo, si ha dρα = ρβ Pβα − ρα Pαβ , dt β
β
dalla quale, sommando su α, si ottiene d ρα = (ρβ Pβα − ρα Pαβ ) = 0 . dt α αβ
Si ottiene cos`ı il risultato
ρα = cost. ,
α
come dovevamo ovviamente aspettarci in base all’interpretazione probabilistica delle ρα . La costante, che rappresenta il valore al quale viene normalizzata la somma delle probabilit` a, `e in genere fissata all’unit`a. Le equazioni cinetiche costituiscono un sistema di N equazioni differenziali omogenee di primo grado, dove N `e il numero degli stati che intervengono nel particolare fenomeno fisico che si sta considerando. In linea di principio, una volta note le probabilit` a di transizione, il sistema pu` o essere risolto a partire dalle appropriate condizioni al contorno. In situazioni stazionarie, ovvero quando sia, per ogni stato α dρα =0 , dt il sistema di equazioni differenziali si riduce a un sistema lineare omogeneo di N equazioni in N incognite. La condizione vista precedentemente, ovvero
(ρβ Pβα − ρα Pαβ ) = 0 ,
αβ
implica che il determinante del sistema `e nullo e le quantit` a ρα vengono cos`ı determinate a meno di un fattore di proporzionalit` a che resta fissato dalla condizione di normalizzazione.
309
INTERAZIONE FRA MATERIA E RADIAZIONE
Osserviamo infine che, per il calcolo della probabilit` a di transizione, la quantit` a essenziale da determinare risulta l’elemento di matrice dell’Hamiltoniana di interazione fra gli autostati dell’Hamiltoniana imperturbata. Il calcolo di tale quantit` a `e affrontato nel paragrafo successivo per il caso di nostro interesse dell’interazione materia-radiazione.
11.4 L’elemento di matrice Applichiamo adesso le considerazioni generali svolte nei due paragrafi precedenti all’interazione fra un sistema atomico e il campo di radiazione. L’Hamiltoniana imperturbata e quella di interazione sono date, rispettivamente, dalle Eq. (11.1) e (11.3). Gli autostati dell’Hamiltoniana imperturbata, definiti dall’Eq. (11.4), sono il prodotto diretto degli autostati del sistema atomico per gli autostati del campo di radiazione. Indicheremo i primi col simbolo |un e i corrispondenti autovalori dell’energia col simbolo n , supponendo di aver risolto, per il sistema atomico, l’equazione di Schr¨odinger stazionaria HA |un = n |un
.
Per il campo di radiazione, alleggeriamo le notazioni rispetto a quelle utilizzate nel Cap. 4. Pensando di aver numerato i modi con un indice j, che sostituisce la coppia di indici (k, λ), e trascurando l’energia di vuoto, scriviamo l’Hamiltoniana HR nella forma HR = h νj a†j aj . j
Indichiamo i relativi autovettori col simbolo |n1 , n2 , . . . , nl , . . . , o, pi` u sinteticamente, col simbolo |{nl } . Si ha quindi, con queste nuove notazioni h νj nj |{nl } . HR |{nl } = j
Inoltre, nelle nuove notazioni, l’Hamiltoniana di interazione (11.3) diventa e0 H = m j I
% h 2π νj V
aj
pi · ej e
i
i kj · ri
+
a†j
pi · ej∗ e−i kj ·ri
.
i
I risultati ottenuti nel paragrafo precedente possono essere particolarizzati al caso dell’interazione materia-radiazione attraverso le sostituzioni formali |α → |un , {nl }
,
ρα → ρn,{nl } ,
Eα → En,{nl } = n +
j
hνj nj ,
310
CAPITOLO 11 I → un , {nl }|HI |um , {nl } Hαβ
.
Per eseguire il calcolo dell’elemento di matrice, si introduce comunemente un’approssimazione, detta approssimazione di dipolo, che consiste nel sostituire gli esponenziali che compaiono nell’espressione di HI con l’unit` a, ovvero ei kj ·ri e−i kj ·ri 1 .
Per renderci conto del grado di approssimazione introdotto, sviluppiamo l’esponenziale in serie. Si ha ei kj ·ri = 1 + i kj · ri − 12 (kj · ri )2 + · · · ,
(11.11)
e l’approssimazione risulta tanto pi` u corretta quanto meglio `e verificata la diseguaglianza kj · ri 1 . D’altra parte, come ordine di grandezza si ha kj · ri a0 , λj dove λj `e la lunghezza d’onda del modo considerato e a0 `e il raggio della prima orbita di Bohr. Si vede quindi che l’approssimazione di dipolo `e ben giustificata alle lunghezze d’onda della radiazione visibile. Ad esempio, per λj = 5000 ˚ A, il rapporto a0 /λj vale circa 10−4 . Nell’approssimazione di dipolo, ponendo p =
p i ,
i
l’Hamiltoniana di interazione assume la forma semplificata e0 HI = m j
%
h aj p · ej + a†j p · ej∗ . 2π νj V
Osservando poi che gli operatori aj e a†j agiscono solo sugli autostati del campo di radiazione, mentre l’operatore p agisce solo sugli autostati del sistema atomico, l’elemento di matrice si pu` o porre nella forma
un , {nl }|H ×
I
|um , {nl }
{nl }|aj |{nl }
e0 = m j
% h 2πνj V
un | p |um · ej + {nl }|a†j |{nl }
un | p |um · ej∗
.
311
INTERAZIONE FRA MATERIA E RADIAZIONE
Interessiamoci prima del calcolo dell’elemento di matrice atomico e trasformiamolo da un elemento di matrice per l’operatore p in un elemento di matrice per l’operatore r. Per far questo, consideriamo il seguente commutatore
[ HA , r ] = HA , ri , i
e supponiamo, tralasciando le correzioni relativistiche, che l’Hamiltoniana atomica sia quella data dall’Eq. (7.2). In questa approssimazione si ottiene
[ HA , r ] =
p2 p2 h ¯ h ¯ i k , , ri = −i ri = pi = −i p , 2m i 2 m m m i i k
per cui,
un | p |um = i
m m un |[ HA , r ]|um = 2π i (n − m ) un | r |um h ¯ h
.
Introducendo poi le notazioni νnm =
n − m , h
rnm = un | r |um
,
si ottiene un | p |um = 2π i m νnm rnm . Le quantit` a νnm sono dette frequenze (cicliche) di Bohr e sono semplicemente connesse alle frequenze angolari di Bohr introdotte nell’Eq. (11.5) dalla relazione νnm = ωnm /(2π). La quantit` a rnm prende il nome di elemento di matrice di dipolo (fra gli stati |un e |um ), anche se tale denominazione dovrebbe essere a rigore utilizzata per l’elemento di matrice dell’operatore d = −e0 r, che rappresenta il momento di dipolo della nuvola elettronica. Passando a considerare gli elementi di matrice relativi al campo di radiazione, dobbiamo ricordare i risultati ottenuti nel Par. 4.3 per gli elementi di matrice degli operatori di creazione e distruzione. Dalle Eq. (4.10) e (4.11) si deduce che l’elemento di matrice dell’operatore {nl }|aj |{nl } `e sempre nullo a meno che i numeri di occupazione contenuti nel “bra” siano tutti uguali ai numeri di occupazione contenuti nel “ket”, salvo per il modo j, per il quale si deve avere nj = nj + 1. In altre parole, affinch´e l’elemento di matrice sia non nullo, si deve avere n1 = n1 , n2 = n2 , . . . , nj−1 = nj−1 , nj = nj + 1 , nj+1 = nj+1 , . . . .
312
CAPITOLO 11
Dato un certo insieme {nl } di numeri di occupazione, indichiamo col simbolo {nl + 1j } l’insieme ottenuto dal precedente aumentando di un’unit` a il numero di occupazione del modo j e lasciando inalterati tutti gli altri. Si ottiene allora {nl }| aj |{nl + 1j } =
# nj + 1 ,
e, con considerazione del tutto analoghe {nl }| a†j |{nl − 1j } =
√
nj .
Sostituendo i risultati ottenuti per gli elementi di matrice atomici e per quelli del campo di radiazione, si ottiene in definitiva, per gli elementi di matrice non nulli dell’Hamiltoniana di interazione, % 2π h (nj + 1) rnm · ej , νj V
un , {nl }| H |um , {nl + 1j } = i νnm e0 I
(11.12)
% 2π h nj rnm · ej∗ . νj V
un , {nl }| H |um , {nl − 1j } = i νnm e0 I
(11.13)
La differenza di energia fra gli stati fra cui si calcola l’elemento di matrice risulta, rispettivamente, En,{nl } − Em,{nl +1j } = n − m − hνj = h (νnm − νj ) , En,{nl } − Em,{nl −1j } = n − m + hνj = h (νnm + νj ) .
11.5 Processi elementari Come applicazione del formalismo sviluppato nel paragrafo precedente, andiamo a trattare il processo elementare dell’emissione spontanea. Come stati iniziale e finale del sistema complessivo (atomo pi` u radiazione) consideriamo gli stati descritti dai vettori di stato
|Ψi = |ua ; 0, 0, . . . , 0, . . .
,
|Ψf
= |ub ; 0, 0, . . . , 1k , . . .
.
(11.14)
Lo stato iniziale, |Ψi , `e lo stato in cui l’atomo si trova nel livello energetico |ua , di energia a , e il campo di radiazione si trova nello stato di vuoto. Lo stato finale, |Ψf , `e quello in cui l’atomo si trova nel livello energetico |ub , di
313
INTERAZIONE FRA MATERIA E RADIAZIONE
k
b
a
k a
b
Fig. 11.2. Diagrammi di Feynman relativi ai processi elementari di emissione spontanea (a sinistra) e di assorbimento (a destra). Nel primo caso il sistema atomico passa dal livello “alto” a al livello “basso” b e viene emesso un fotone nel modo k. Nel secondo caso, il sistema passa dal livello b al livello a e viene assorbito un fotone dal modo k.
energia b , mentre il campo di radiazione si trova nello stato in cui `e presente un solo fotone nel modo contrassegnato dall’indice k. Per individuare in maniera schematica il processo che stiamo trattando, `e utile introdurre un diagramma quale quello del riquadro di sinistra della Fig. 11.2. Un tale diagramma prende il nome di diagramma di Feynman, dal nome del fisico statunitense che per primo introdusse tali rappresentazioni schematiche dei processi elementari nell’ambito dell’Elettrodinamica Quantistica. In un diagramma di Feynman, le linee continue rappresentano gli elettroni, mentre le linee ondulate rappresentano i fotoni. Ogni interazione fra gli elettroni e i fotoni `e rappresentata da un “vertice” nel quale confluiscono due linee continue (elettroniche) e una linea ondulata (fotonica). Pensando che il tempo “scorra” da sinistra verso destra nel diagramma, l’elettrone, raggiunto il vertice, “salta” dal livello “alto” a al livello “basso” b, mentre nel vertice stesso viene emesso un fotone nel modo k. La probabilit` a per unit` a di tempo che si verifichi il processo di emissione spontanea `e data dalla regola aurea di Fermi Pf i =
2π | Ψf |HI |Ψi |2 δ(E f − E i ) . h ¯
L’elemento di matrice dell’Hamiltoniana di interazione pu`o essere calcolato mediante l’Eq. (11.13). Per semplice sostituzione si ha
| Ψf |HI |Ψi |2 = e si ottiene quindi
2 2π h e20 νab |rba · ek∗ |2 , νk V
E f − E i = h (νk − νab ) ,
314
CAPITOLO 11
Pf i =
8π 3 e20 νab |rba · ek∗ |2 δ(νk − νab ) . hV
(11.15)
` adesso necessario precisare che i livelli atomici a e b, autostati dell’HamiltoE niana atomica, presentano in generale il fenomeno della degenerazione spaziale e devono essere caratterizzati da dei numeri quantici interni che indicheremo, rispettivamente, con α e β. Ad esempio, la funzione d’onda del livello energetico a, che abbiamo semplicemente indicato, in notazione di Dirac, con |u a , `e in realt` a del tipo |αa Ja Ma , dove αa `e una collezione di numeri quantici che descrivono la configurazione e il termine, Ja `e il numero quantico di momento angolare totale e Ma il numero quantico magnetico. Poich´e Ma pu` o assumere uno qualsiasi dei valori che vanno da −Ja a Ja in passi di uno, il livello risulta degenere ga volte, con ga = 2 Ja + 1. La funzione d’onda di uno qualsiasi dei ga sottolivelli del livello energetico a pu` o quindi essere indicata col simbolo |uaα e, analogamente, uno qualsiasi dei gb sottolivelli del livello energetico b col simbolo |ubβ . Una volta che sia specificato anche il sottolivello, sia per lo stato iniziale che per quello finale, la probabilit` a di transizione per unit` a di tempo dell’Eq. (11.15) assume la forma Pf i =
8π 3 e20 νab |rbβ,aα · ek∗ |2 δ(νk − νab ) , hV
(11.16)
dove rbβ,aα = ubβ |r |uaα
.
Se adesso eseguiamo una media dell’elemento di matrice modulo quadro che compare nell’Eq. (11.16) su tutte le possibili “orientazioni” dell’atomo rispetto al versore ek∗ , ovvero se ne consideriamo la media su tutti i valori dei parametri interni di degenerazione α e β, `e possibile dimostrare per mezzo del teorema di Wigner-Eckart che vale la relazione6 1 |rbβ,aα · ek∗ |2 = ga gb
1 3
|rba |2 ,
(11.17)
α, β
dove
|rba |2 = |rab |2 =
1 1 |rbβ,aα |2 = ubβ |r |uaα · uaα |r |ubβ ga gb ga gb α, β
6
,
α, β
Questa propriet` a ` e formalmente dimostrata nell’App. 12. Intuitivamente si pu` o pensare che il fattore 13 sia il risultato della media sull’angolo solido di un fattore del tipo cos 2 θ, dove θ` e l’angolo formato fra il vettore rba e il versore di polarizzazione.
INTERAZIONE FRA MATERIA E RADIAZIONE
315
dimodoch´e, si pu` o concludere che, mediando sulla degenerazione spaziale, la probabilit` a per unit` a di tempo che l’atomo decada da un qualsiasi sottolivello del livello a verso un qualsiasi sottolivello del livello b e che contemporaneamente venga emesso un fotone nel modo k `e data da Pf i =
8π 3 e20 νab |rba |2 δ(νk − νab ) . 3hV
(11.18)
a per unit` a di Da questa espressione di Pf i si possono dedurre sia la probabilit` tempo che l’atomo decada dal livello a al livello b, che indicheremo con πab , sia la probabilit` a per unit` a di tempo che venga emesso un fotone in uno qualsiasi dei due modi (caratterizzati da polarizzazioni diverse) aventi frequenza ν e che indicheremo con π (e) (ν, Ω). Per ottenere πab osserviamo che la direzione Ω, Pf i d` a la probabilit` a congiunta che l’atomo decada da un qualsiasi sottolivello del livello a a un qualsiasi sottolivello del livello b e che, allo stesso tempo, venga emesso un fotone nel modo particolare contrassegnato dall’indice k. Per le note leggi delle probabilit`a si deve quindi sommare la Pf i su tutti i possibili sottolivelli inferiori e su tutti i possibili modi, e si ha quindi πab = gb
Pf i ,
k
con la somma estesa a tutti i possibili modi del campo di radiazione. Per eseguire la somma, ricordiamo che il numero di modi con frequenza compresa fra ν e ν + dν e direzione compresa nell’angolo solido dΩ `e dato dall’Eq. (4.14), ovvero dN =
2 V ν2 dν dΩ . c3
Trasformando la somma sui modi k in integrale sulla frequenza e sull’angolo solido, e ricordando l’Eq. (11.18), si ha allora " πab = gb
∞
dΩ 0
16π 3 e20 νab ν 2 |rba |2 δ(ν − νab ) dν . 3 h c3
(11.19)
Eseguendo infine l’integrale, si ha πab = Aab , dove Aab =
3 64π 4 e20 νab gb |rba |2 . 3 3hc
(11.20)
La quantit` a Aab prende il nome di coefficiente di Einstein per diseccitazione (o per emissione) spontanea dal livello a al livello b. Come aiuto mnemonico
316
CAPITOLO 11
`e utile osservare che la sua espressione pu`o essere ricavata mediante un ragionamento semiclassico di questo tipo. Applicando il modello di Lorentz, si schematizzi l’atomo come un elettrone oscillante alla frequenza ν. Se x `e l’ampiezza istantanea dell’oscillazione, l’accelerazione dell’elettrone vale in modulo 4π 2 ν 2 x, e l’elettrone emette radiazione con una potenza media, W , data dall’equazione di Larmor (3.22) W
=
2 e20 a2 3 c3
=
32π 4 e20 ν 4 x2 3 c3
,
dove x2 `e la media di x2 rispetto al tempo. Se si ammette poi che l’oscillatore armonico abbia energia 12 hν, il tempo caratteristico, τ , che esso impiega a perdere la sua energia `e dato da τ=
hν 2 W
,
e se ne deduce un tasso di diseccitazione per unit`a di tempo dato da 1 2 W = τ hν
=
64π 4 ν 3 e20 x2 3 h c3
.
Come si vede, questa espressione coincide con quella dell’Eq. (11.20) pur di immedesimare la frequenza dell’oscillatore, ν, con la frequenza della transizione, νab , e la quantit` a classica x2 con la quantit` a gb |rba |2 . ovvero la probabiOccupiamoci adesso di determinare la quantit` a π (e) (ν, Ω), lit` a per unit` a di tempo che venga emesso un fotone in un modo avente frequenza Per questo `e sufficiente moltiplicare l’Eq. (11.18) per il fattore ν e direzione Ω. gb per tener conto che l’atomo pu`o decadere in uno qualsiasi dei sottolivelli del livello inferiore. Si ottiene = π (e) (ν, Ω)
8π 3 e20 νab gb |rba |2 δ(ν − νab ) . 3hV
Come si pu` o notare, questa espressione contiene al denominatore il volume V, ovvero il volume della cavit`a nella quale abbiamo quantizzato il campo di radiazione. Questa dipendenza da V risulta dal fatto che stiamo considerando l’interazione fra il campo di radiazione e un solo sistema atomico, che abbiamo supposto trovarsi in un sottolivello arbitrario del livello a. Se consideriamo la situazione pi` u realistica in cui nella cavit` a sono effettivamente presenti N a atomi nel livello a e se supponiamo che ciascuno di tali atomi emetta in maniera indipendente dagli altri, il secondo membro dell’equazione precedente deve essere moltiplicato per Na e si ottiene = Na π (e) (ν, Ω)
8π 3 e20 νab gb |rba |2 δ(ν − νab ) , 3h
(11.21)
INTERAZIONE FRA MATERIA E RADIAZIONE
317
dove abbiamo introdotto la quantit` a Na = Na /V che d` a la densit` a numerica degli atomi che si trovano nel livello a. I risultati che abbiamo trovato per il coefficiente di Einstein (Eq. (11.20)) e (Eq. (11.21)) sono legati alla scelta che abbiamo per la probabilit` a π (e) (ν, Ω) effettuato per gli stati iniziali e finali, |Ψi e |Ψf , dell’Eq. (11.14). Bisogna osservare che tali risultati non cambiano se si suppone che nei modi diversi dal modo k siano presenti, invece di zero fotoni, dei numeri arbitrari di fotoni, purch´e il numero di tali fotoni sia uguale negli stati iniziale e finale. Questo significa che un processo elementare quale quello descritto dal diagramma di Feynman della Fig. 11.2 (riquadro di sinistra) non `e influenzato dall’eventuale presenza di fotoni nei modi diversi dal modo k. Se invece si suppone che in tale modo siano presenti nk fotoni (invece che zero fotoni) nello stato iniziale |Ψi e (nk + 1) fotoni (invece che un fotone) nello stato finale |Ψf , la probabilit` a di transizione P f i risulta ancora data dall’espressione dell’Eq. (11.18) moltiplicata per` o per il fattore (nk +1) che proviene dall’elemento di matrice modulo quadro dell’Hamiltoniana di interazione (si veda l’Eq. (11.13)). Questo fattore moltiplicativo `e molto importante perch´e descrive un fenomeno di tipo particolare che `e noto col nome di emissione stimolata. La presenza di fotoni in un determinato modo “stimola” l’atomo a emettere ulteriori fotoni nel modo stesso e tale effetto di stimolazione `e tanto maggiore quanto maggiore `e il numero di fotoni presenti nel modo. Il fenomeno dell’emissione stimolata costituisce il principio di funzionamento del laser7 ed `e oggi alla base di innumerevoli applicazioni tecnologiche. Se si tiene conto dell’emissione stimolata, i ragionamenti che abbiamo svolto precedentemente per trovare le probabilit` a per unit` a di tempo di diseccitazione dell’atomo, πab , e di emissione devono essere modificati e portano all’apparizione di terdel fotone, π (e) (ν, Ω), mini supplementari. Riprendendo l’Eq. (11.19) si ottiene infatti, per l’aggiunta del termine di stimolazione " πab = gb
∞
dΩ 0
16π 3 e20 νab ν 2 + 1 ] δ(ν − νab ) dν , |rba |2 [nν (Ω) 3 h c3
per indicare il numero di fotoni predove abbiamo introdotto il simbolo nν (Ω) supposto indipendente senti nel generico modo di frequenza ν e direzione Ω, dallo stato di polarizzazione. Il termine proveniente dall’addendo 1, presente nella parentesi quadra entro il simbolo di integrale, `e gi` a stato valutato e porta al coefficiente di Einstein Aab . La valutazione dell’altro termine si esegue introducendo la media del numero di fotoni per modo, n ¯ ν definita da " 1 dΩ . nν (Ω) n ¯ν = (11.22) 4π 7
La parola laser ` e un acronimo (ovvero una sigla che acquisisce nel linguaggio comune il ruolo di un nome) proveniente da Light Amplification by the Stimulated Emission of Radiation.
318
CAPITOLO 11
Si ottiene ¯ νab ) . πab = Aab ( 1 + n
(11.23)
L’effetto della stimolazione `e quindi quello di aumentare la probabilit`a di diseccitazione dell’atomo. Analogamente, andando a valutare la probabilit`a per unit` a di tempo di emissione del fotone, si trova che l’Eq. (11.21) deve essere sostituita, per effetto dell’emissione stimolata, dalla seguente 3 2 = Na 8π e0 νab gb |rba |2 [ 1 + nν (Ω)] δ(ν − νab ) . π (e) (ν, Ω) (11.24) 3h Come ulteriore applicazione, trattiamo adesso il processo elementare dell’assorbimento. Come stati iniziale e finale del sistema complessivo (atomo pi` u radiazione) consideriamo gli stati descritti dai vettori di stato
|Ψi = |ub ; 0, 0, . . . , 1k , . . .
,
|Ψf
= |ua ; 0, 0, . . . , 0, . . .
.
Lo stato iniziale, |Ψi , `e lo stato in cui l’atomo si trova nel livello energetico |ub mentre il campo di radiazione si trova nello stato in cui `e presente un solo fotone nel modo contrassegnato dall’indice k. Lo stato finale, |Ψf , `e quello in cui l’atomo si trova nel livello energetico |ua , e il campo di radiazione si trova nello stato di vuoto. Il processo che stiamo trattando, `e rappresentato nel riquadro di destra della Fig. 11.2 e la corrispondente probabilit` a per unit` a di tempo `e sempre data dalla regola aurea di Fermi. L’elemento di matrice dell’Hamiltoniana di interazione fra gli stati |Ψi e |Ψf pu` o essere calcolato mediante l’Eq. (11.12) e si ottiene, per la probabilit` a di transizione per unit`a di tempo, l’analogo dell’Eq. (11.15) relativa al processo elementare dell’emissione spontanea, ovvero 8π 3 e20 νab |rab · ek |2 δ(νk − νab ) . hV Questa espressione e quella dell’Eq. (11.15) possono essere portate a coincidere osservando che, essendo l’operatore r Hermitiano, per gli elementi di matrice ∗ si ha rab = rba , e quindi Pf i =
|rab · ek |2 = |rba · ek∗ |2 . Osservando che il processo elementare che stiamo considerando `e esattamente il processo inverso di quello considerato all’inizio del paragrafo, abbiamo cos`ı verificato la propriet` a importante che un processo elementare e il suo processo inverso hanno la stessa probabilit` a per unit` a di tempo di verificarsi. Questo `e d’altra parte ovvio tenendo conto del fatto che, secondo la regola aurea di Fermi, si deve avere Pf i = Pi f . Il risultato ottenuto per il processo elementare pu` o essere generalizzato considerando il caso in cui nello stato iniziale si hanno nk fotoni (invece di un
INTERAZIONE FRA MATERIA E RADIAZIONE
319
fotone) e in quello finale (nk − 1) fotoni (invece di zero). Sempre per mezzo dell’Eq. (11.12) si trova facilmente che l’espressione per la probabilit` a Pf i data sopra deve essere semplicemente moltiplicata per nk , per cui si ha 8π 3 e20 νab |rab · ek |2 nk δ(νk − νab ) . hV In maniera simile a quanto fatto precedentemente, possiamo andare a calcolare la probabilit` a per unit` a di tempo, πba , che l’atomo passi dal livello b al livello a per assorbimento di un fotone da un modo qualsiasi e la probabilit` a per unit` a di tempo, π (a) (ν, Ω), che venga sottratto un fotone in un modo Ripetendo ragionamenti simili a quelli svolti avente frequenza ν e direzione Ω. precedentemente si trova Pf i =
πba =
ga Aab n ¯ νab , gb
3 2 = Nb 8π e0 νab ga |rba |2 nν (Ω) δ(νab − ν) , π (a) (ν, Ω) 3h dove Nb `e la densit`a numerica di atomi che si trovano nel livello b.
(11.25) (11.26)
11.6 Le equazioni dell’equilibrio statistico La discussione dei processi elementari che abbiamo svolto nel paragrafo precedente permette di ottenere delle equazioni generali che regolano l’evoluzione temporale delle popolazioni atomiche in un ambiente fisico arbitrario, sia esso un plasma di laboratorio o un plasma astrofisico. Consideriamo per questo una collezione di atomi, tutti della stessa specie, e supponiamo, per semplicit` a, che ciascuno di essi abbia due soli livelli energetici, un livello di energia maggiore (o livello alto), per il quale utilizzeremo l’indice a e un livello di energia minore (o livello basso) per il quale utilizzeremo l’indice b. Supponiamo inoltre che i due livelli siano degeneri e indichiamo con ga e gb le rispettive degenerazioni. Nell’ambiente sia poi presente un campo di radiazione che, alla frequenza νab corrispondente alla transizione fra i due livelli (νab = (a − b )/h), abbia un numero medio di fotoni per modo dato da n ¯ νab . Indicando con Na e Nb il numero di atomi presenti nell’ambiente che si trovano, rispettivamente, nei livelli a e b, ovvero le cosiddette popolazioni, e tenendo conto delle probabilit`a elementari πab e πba che abbiamo trovato nel paragrafo precedente, le popolazioni evolvono nel tempo secondo le equazioni dNa dNb = −πab Na + πba Nb , = −πba Nb + πab Na . dt dt Sostituendo i valori di πab e πba dati dalle Eq. (11.23) e (11.25) si ottengono le cosiddette equazioni dell’equilibrio statistico, ovvero
320
CAPITOLO 11
dNa ga = −Aab ( 1 + n ¯ νab ) Na + Aab n ¯ νab Nb , dt gb dNb ga = − Aab n ¯ νab Nb + Aab ( 1 + n ¯ νab ) Na . dt gb Come si vede, le due equazioni sono ridondanti, in quanto dNb dNa + =0 . dt dt Questo significa che il numero totale di atomi si conserva e le equazioni fissano unicamente il rapporto fra le due popolazioni. Le equazioni dell’equilibrio statistico vengono tradizionalmente scritte in maniera diversa introducendo, in luogo del numero medio di fotoni per modo, il valore medio dell’intensit` a del campo di radiazione. Ricordando l’Eq. (4.15), che collega il numero di fotoni con l’intensit`a specifica del campo di radiazione e l’Eq. (11.22), che definisce il numero medio di fotoni per modo, e definendo la media sull’angolo solido dell’intensit` a del campo di radiazione mediante l’equazione " 1 dΩ , Jν = Iν (Ω) 4π si ha Jνab =
3 2 h νab n ¯ νab . c2
Attraverso quest’ultima quantit` a, le equazioni dell’equilibrio statistico possono essere espresse nella forma dNa = −Aab Na − Bab Jνab Na + Bba Jνab Nb , dt dNb = −Bba Jνab Nb + Aab Na + Bab Jνab Na , dt dove si `e posto Bab =
c2 32π 4 e20 gb |rba |2 , Aab = 3 2 h νab 3 h2 c
(11.27)
Bba =
c2 g a ga 32π 4 e20 ga |rba |2 . A = B = ab ab 3 g 2 h νab gb 3 h2 c b
(11.28)
Le quantit` a Bab e Bba prendono il nome di coefficiente di Einstein per emissione stimolata e coefficiente di Einstein per assorbimento, rispettivamente.
INTERAZIONE FRA MATERIA E RADIAZIONE
321
s 2
3
6
n 1
4
5
i Fig. 11.3. Rappresentazione schematica dei vari processi che contribuiscono alle equazioni dell’equilibrio statistico di un livello n fissato. 1) assorbimento da livelli inferiori; 2) emissione spontanea da livelli superiori; 3) emissione stimolata da livelli superiori; 4) emissione spontanea verso livelli inferiori; 5) emissione stimolata verso livelli inferiori; 6) assorbimento verso livelli superiori. Le linee ondulate descrivono processi indotti dal campo di radiazione mentre le linee continue descrivono processi spontanei.
Introdotte queste notazioni, siamo adesso in grado di scrivere le equazioni dell’equilibrio statistico per un atomo con un numero arbitrario di livelli energetici. Per la popolazione di un generico livello n, indicando con l’indice i i livelli inferiori (cio`e aventi energia minore) e con l’indice s i livelli superiori (cio`e aventi energia maggiore), l’equazione di evoluzione della popolazione si scrive dNn = Bin Jνni Ni + Asn Ns + Bsn Jνsn Ns dt s s i − Ani Nn − Bni Jνni Nn − Bns Jνsn Nn . i
i
(11.29)
s
I sei termini che compaiono nell’equazione precedente sono rappresentati schematicamente nella Fig. 11.3 nella quale le linee continue rappresentano transizioni spontanee (proporzionali ai coefficienti di Einstein A) mentre quelle ondulate rappresentano transizioni indotte dal campo di radiazione (proporzionali ai prodotti di coefficienti di Einstein B per l’intensit` a media del campo di radiazione J). In particolare, le linee ondulate che terminano con una freccia diretta verso l’alto rappresentano fenomeni di assorbimento, mentre quelle che terminano con una freccia diretta verso il basso rappresentano fenomeni di emissione stimolata. I numeri riprodotti entro i cerchi nella figura sono in connessione con l’ordine dei vari termini dell’Eq. (11.29). In altre parole, i termini 1 e 6 rappresentano processi di assorbimento prodotti dal campo di radiazione; quelli 2 e 4 rappresentano processi di emissione spontanea; infine, i termini 3 e 5 rappresentano processi di emissione indotta o stimolata. Si noti che i processi 1, 2, e 3 contribuiscono a popolare il livello n e sono preceduti nell’equazione
322
CAPITOLO 11
da un segno pi` u, mentre i processi 4, 5, e 6 contribuiscono a depopolarlo e sono preceduti da un segno meno.
11.7 I coefficienti di Einstein I coefficienti di Einstein, da noi dedotti nei paragrafi precedenti per un sistema atomico arbitrario per mezzo dei metodi dell’Elettrodinamica Quantistica, furono introdotti dal celebre fisico tedesco, molto tempo prima della formalizzazione di questa teoria, attraverso un ragionamento fisico di questo tipo. Consideriamo due livelli energetici di un sistema atomico e indichiamo con a e b le energie dei livelli superiore e inferiore, rispettivamente, e con ga e gb le relative degenerazioni. Sia poi νab la frequenza della transizione fra i due livelli, con h νab = a − b . Se il sistema atomico si trova immerso in un campo di radiazione avente, alla frequenza νab , intensit` a media Jνab , allora si ha una probabilit` a di transizione per unit` a di tempo dal livello inferiore a quello superiore data πba = Bba Jνab . Questa espressione `e conforme all’esperienza in quanto essa prevede, essendo per ipotesi Bba indipendente dal campo di radiazione, che la probabilit` a di transizione sia proporzionale all’intensit` a media del campo di radiazione, una legge che corrisponde al ben noto fenomeno dell’assorbimento. D’altra parte, per la probabilit` a di transizione dal livello superiore a quello inferiore, le leggi fisiche –note al momento del lavoro di Einstein– portavano semplicemente a un’equazione del tipo πab = Aab , con Aab indipendente dal campo di radiazione. Infatti, al momento, era noto soltanto il fenomeno dell’emissione spontanea e non quello dell’emissione indotta (o stimolata). Einstein osserv`o che le due espressioni per πba e πab erano incompatibili con le leggi della termodinamica. Se si suppone infatti che il sistema atomico si trovi in una cavit` a all’equilibrio termodinamico alla temperatura T , siccome i coefficienti Aab e Bba sono indipendenti dal campo di radiazione, si ottiene che al limite T → ∞ il rapporto πba /πab tende anch’esso all’infinito, col risultato che tutti gli atomi verrebbero a trovarsi nel livello superiore, in palese contraddizione con quanto specificato dalla legge di Boltzmann che invece prevede un rapporto di popolazioni uguale al rapporto dei pesi statistici (si veda l’Eq. (10.6)
INTERAZIONE FRA MATERIA E RADIAZIONE
323
e se ne consideri il limite per T → ∞). Per risolvere questa contraddizione, Einstein postul` o allora che nell’equazione per la probabilit` a di transizione πab si dovesse aggiungere un nuovo termine, anch’esso proporzionale al campo di radiazione cos`ı da ottenere πab = Aab + Bab Jνab . Con un semplice ragionamento termodinamico Einstein riusc`ı quindi a prevedere l’esistenza dell’emissione stimolata, un meccanismo fisico che non era noto al momento. Sempre in base a considerazioni termodinamiche `e poi possibile determinare le relazioni esistenti fra i vari coefficienti introdotti. In base alle equazioni precedenti la popolazione del livello superiore, Na , obbedisce all’equazione differenziale dNa = −(Aab + Bab Jνab ) Na + Bba Jνab Nb . dt In situazioni stazionarie si ottiene allora Na Bba Jνab = . Nb Aab + Bab Jνab Supponendo di essere all’equilibrio termodinamico, e facendo il limite T → ∞, si ottiene lim
T →∞
Na Bba = . Nb Bab
D’altra parte, per l’equazione di Boltzmann, si deve avere lim
T →∞
Na ga = , Nb gb
per cui si ottiene Bba =
ga Bab . gb
In generale, per T arbitrario, sostituendo per Na /Nb il valore dato dall’equazione di Boltzmann, esprimendo Bba in termini di Bab e ricordando che all’equilibrio termodinamico l’intensit` a media del campo di radiazione `e data dalla funzione di Planck (Jνab = Bνab (T ), con Bν (T ) data dall’Eq. (10.11)), si ottiene, con un alcuni passaggi algebrici Aab =
3 2 h νab Bab . 2 c
324
CAPITOLO 11
Con questo ragionamento termodinamico si arriva quindi a stabilire la corretta relazione fra i coefficienti di Einstein. Le equazioni precedenti contengono infatti gli stessi risultati, gi` a espressi nelle Eq. (11.27) e (11.28), che abbiamo ottenuto attraverso i principi dell’Elettrodinamica Quantistica. Bisogna tuttavia notare che la sola termodinamica non `e sufficiente a determinare l’espressione esplicita dei coefficienti di Einstein, analogamente a quanto abbiamo visto nel capitolo precedente per la costante a che compare nella legge di Stefan (Eq.(10.9)).
11.8 L’equazione del trasporto radiativo Riferendoci allo stesso ambiente fisico che abbiamo introdotto all’inizio del Par. 11.6, andiamo a considerare l’evoluzione temporale del numero di fotoni contenuti in un modo del campo di radiazione caratterizzato dalla frequenza Per mezzo delle Eq. (11.24) e (11.26) che esprimono, ν e dalla direzione Ω. rispettivamente, la probabilit` a che venga aggiunto oppure sottratto un fotone nel modo stesso, si ottiene dnν (Ω) + π (e) (ν, Ω) , = −π (a) (ν, Ω) dt ovvero ! 8π 3 e20 νab dnν (Ω) + Na gb [ 1 + nν (Ω)] = |rba |2 δ(ν − νab ) −Nb ga nν (Ω) . dt 3h La derivata temporale che compare in questa equazione deve essere interpretata come derivata totale (o Euleriana), in quanto esprime la variazione del numero di fotoni nel tempo pensando di seguire i fotoni stessi nel loro movimento. Se si indica quindi con s la coordinata spaziale misurata lungo la direzione di propagazione e si considera che la radiazione si propaga con velocit`a c, si ha d ∂ d = +c . dt ∂t ds Eseguendo questa sostituzione e supponendo di essere in situazioni stazionarie (il che equivale a sopprimere il termine ∂/(∂t)), si ottiene ! 8π 3 e20 νab dnν (Ω) + Na gb [ 1 + nν (Ω)] = |rba |2 δ(ν − νab ) −Nb ga nν (Ω) . ds 3hc L’equazione che abbiamo ottenuto `e la cosiddetta equazione del trasporto. Consistentemente con le nostre ipotesi, essa `e stata ottenuta per un atomo a due livelli.
INTERAZIONE FRA MATERIA E RADIAZIONE
325
Tradizionalmente l’equazione del trasporto viene formulata in maniera diversa facendo intervenire l’intensit` a specifica del campo di radiazione invece del numero di fotoni per modo. Per ottenere la formulazione standard, basta allora ricordare l’Eq. (4.15) che esprime la relazione fra queste due quantit` a. Moltiplicando l’equazione precedente per il fattore (2 h ν 3 /c2 ) e riarrangiando i diversi termini, si ottiene, con semplici passaggi algebrici d = −k (a) Iν (Ω) + k (s) Iν (Ω) + ν , Iν (Ω) ν ν ds (a)
(s)
dove le tre quantit`a kν , kν , e ν , dette rispettivamente coefficiente di assorbimento, coefficiente di emissione stimolata (o di assorbimento negativo), e coefficiente di emissione, sono date da kν(a) = Nb
8π 3 e20 νab ga |rba |2 δ(ν − νab ) , 3hc
kν(s) = Na
8π 3 e20 νab gb |rba |2 δ(ν − νab ) , 3hc
4 16π 3 e20 νab gb |rba |2 δ(ν − νab ) . (11.30) 3 c3 Le espressioni che abbiamo trovato per i tre coefficienti valgono per un atomo a due livelli (il livello “alto” a e il livello “basso” b). La loro generalizzazione al caso di un atomo a molti livelli `e banale e si ottiene semplicemente sommando su tutte le possibili coppie di livelli. Fissato un livello n, indicando come in Fig. 11.3 con l’indice i un qualsiasi livello di energia minore e con l’indice s un qualsiasi livello di energia maggiore e sommando su n, si ha
ν = Na
kν(a) =
n
kν(s) = ν =
Nn
8π 3 e20 νni gi |rin |2 δ(ν − νni ) , 3hc
Nn
4 16π 3 e20 νni gi |rin |2 δ(ν − νni ) . 3 3c
i
n
8π 3 e20 νsn gs |rns |2 δ(ν − νsn ) , 3hc
s
n
Nn
i
(11.31)
Osserviamo infine che l’equazione del trasporto pu`o anche essere posta nella forma semplificata d = −kν Iν (Ω) + ν , Iν (Ω) ds dove kν = kν(a) − kν(s) .
326
CAPITOLO 11
Il coefficiente kν cos`ı introdotto `e chiamato coefficiente di assorbimento corretto per l’emissione stimolata8 . Ponendo poi Sν =
ν ν = (a) , (s) kν kν − kν
l’equazione del trasporto assume la forma d = −kν [Iν (Ω) − Sν ] . Iν (Ω) (11.32) ds La funzione Sν prende il nome di funzione sorgente. Come vedremo in seguito, per un sistema atomico che si trovi all’equilibrio termodinamico alla temperatura T , vale la cosiddetta legge di Kirchhoff Sν = Bν (T ) , dove Bν (T ) `e la funzione di Planck.
11.9 I coefficienti di assorbimento e di emissione Una semplice analisi dimensionale dell’equazione del trasporto mostra che il coefficiente di assorbimento e quello di emissione stimolata hanno le dimensioni del reciproco di una lunghezza e sono quindi espressi (nel sistema di unit`a c.g.s.) in cm−1 . Il coefficiente di emissione ha invece le dimensioni di un’energia per unit` a di volume e per unit` a di tempo e risulta espresso (sempre nel c.g.s.) in erg cm−3 s−1 . Integrando in frequenza, `e possibile mettere in relazione il contributo di ciascuna transizione atomica a tali coefficienti con i coefficienti di Einstein precedentemente introdotti. Facendo riferimento al caso di un atomo a due livelli e integrando in frequenza le Eq. (11.30), si ha 8π 3 e20 νab (a) kR = kν(a) dν = Nb ga |rba |2 , (11.33) 3hc 8π 3 e20 νab (s) gb |rba |2 , kR = kν(s) dν = Na 3hc 4 16π 3 e20 νab gb |rba |2 . R = ν dν = Na 3 3c Confrontando queste espressioni con quelle dei coefficienti di Einstein date nelle Eq. (11.20), (11.27) e (11.28), si ha 8
Spesso ` e anche chiamato, impropriamente, coefficiente di assorbimento tout court. In (a) effetti, quest’ultima denominazione dovrebbe essere riservata a k ν .
INTERAZIONE FRA MATERIA E RADIAZIONE
327
(c)
stati liberi
E
limite di ionizzazione
stati legati
(b)
(a)
Fig. 11.4. In questo diagramma di Grotrian schematico, gli stati liberi sono rappresentati dall’area tratteggiata. Le possibili transizioni si distinguono in: (a) transizioni legato-legato; (b) transizioni legato-libero; (c) transizioni libero-libero.
(a)
kR =
h νab Nb Bba , 4π
(s)
kR =
h νab Na Bab , 4π
R =
h νab Na Aab . 4π
Queste equazioni esprimono le ovvie relazioni che devono esistere fra quantit`a che compaiono nelle equazioni dell’equilibrio statistico e quantit`a che compaiono nell’equazione del trasporto. Riferendoci ad esempio al caso del coefficiente di emissione, si ha ovviamente che l’energia emessa per unit`a di tempo e per unit` a di volume `e data dal numero di atomi per unit` a di volume presenti nel livello superiore, Na , moltiplicato per la probabilit` a di diseccitazione dell’atomo per unit` a di tempo, Aab , moltiplicato ancora per l’energia emessa nella transizione, h νab . Il fattore 4π a denominatore `e dovuto al fatto che il coefficiente di emissione `e definito per unit`a di angolo solido, mentre il prodotto dei tre termini precedenti d`a l’energia emessa in tutto l’angolo solido. In generale, i coefficienti di assorbimento e di emissione risultano espressi da una doppia somma su tutti i livelli atomici (si vedano le Eq. (11.31)). Poich`e i livelli possono essere sia liberi che legati, contribuiscono ai singoli coefficienti:
328
CAPITOLO 11
(a) le transizioni legato-legato, (b) le transizioni legato-libero (o libero-legato), e (c) le transizioni libero-libero, come illustrato in Fig.11.4. Le transizioni legato-libero (e quelle libero-libero) danno luogo a un andamento continuo con la frequenza del coefficiente di assorbimento. Se si considera infatti il contributo al coefficiente di assorbimento dovuto alla transizione fra lo stato legato b e lo stato del continuo c, si pu` o trasformare la somma sugli stati superiori s che (a) compare nell’espressione per kν delle Eq. (11.31) in una somma sugli stati liberi. Indicando con dnc il numero di stati liberi aventi energia compresa fra e + d, si ha dnc = Dc () d , dove Dc () `e la densit` a in energia degli stati del continuo. Per il coefficiente di assorbimento alla frequenza ν si ha allora 8π 3 e20 ν (a) kν = Nb |rbc |2 δ(νcb − ν) Dc () d . 3hc Tenendo conto della delta di Dirac, l’integrale si esegue immediatamente e porta all’espressione kν(a) = Nb
8π 3 e20 ν |rbc |2 Dc (b + h ν) , 3c
che si scrive anche nella forma kν(a) = σν Nb ,
(11.34)
dove σν , la sezione d’urto per fotoionizzazione dal livello b, `e data da σν =
8π 3 e20 ν |rbc |2 Dc (b + h ν) . 3c
La funzione σν ha un andamento continuo con la frequenza. Essa presenta una soglia in corrispondenza della frequenza νs tale che b + h νs = I , dove I `e il potenziale di ionizzazione dell’atomo. Per frequenze ν < νs la sezione d’urto per fotoionizzazione `e nulla (effetto fotoelettrico). Per le transizioni libero-libero si ottiene un’espressione del coefficiente di assorbimento del tutto analoga a quella derivata sopra, con la sola differenza che adesso Nb rappresenta il numero di atomi per unit` a di volume che si trova nel livello libero b. Per quanto riguarda infine le transizioni legato-legato, il formalismo che abbiamo sviluppato porta a un andamento discontinuo del coefficiente di assorbimento del tipo di un “pettine” di funzioni delta di Dirac. Questo risultato
329
INTERAZIONE FRA MATERIA E RADIAZIONE
proviene dal fatto che abbiamo supposto gli atomi isolati (cio`e non interagenti con altre particelle “perturbatrici”) e statici (cio`e non in movimento); per di pi` u ci siamo arrestati al secondo ordine nello sviluppo perturbativo dell’ampiezza di probabilit` a. Come vedremo nel prossimo paragrafo, quando si rilasciano queste approssimazioni di ordine zero si ottiene che le funzioni delta di Dirac devono essere sostituite da opportuni profili di riga, normalizzati a 1 in frequenza, che indicheremo col simbolo ϕ. Ad esempio, per la transizione fra i livelli a e b, i vari coefficienti possono essere posti nella forma9 (a)
(s)
kν(a) = kR ϕ(νab − ν) ,
kν(s) = kR ϕ(νab − ν) ,
ν = R ϕ(νab − ν) , (11.35)
con ϕ(νab − ν) dν = 1 . Con queste posizioni, la funzione sorgente nella riga pu` o essere posta nella forma Sν =
ν (a) kν
−
(s) kν
=
R (a) kR
(s)
− kR
(a)
, (s)
e, ricordando le espressioni per i coefficienti R , kR e kR Sν =
Na Aab . Nb Bba − Na Bab
Ricordando poi le relazioni fra i coefficienti di Einstein, si ottiene infine Sν =
1 2 h ν3 . 2 ga Nb c − 1 gb Na
(11.36)
All’equilibrio termodinamico alla temperatura T , le popolazioni sono date dall’equazione di Boltzmann (Eq. (10.6)) e la funzione sorgente risulta Sν =
2 h ν3 1 , 2 h ν /(k BT ) − 1 ab c e
che praticamente coincide con la funzione di Planck Bν (T ) essendo νab ν. Questo risultato dimostra, nel caso particolare dell’atomo a due livelli, la validit` a della legge di Kirchhoff. 9
In linea di principio i profili relativi all’emissione e all’emissione stimolata possono essere diversi fra loro e diversi da quello relativo all’assorbimento. L’ipotesi di considerarli uguali, contenuta nelle Eq. (11.35), `e nota come approssimazione della ridistribuzione totale in frequenza. Per un approfondimento di questo argomento si veda, ad esempio, D. Mihalas, Stellar Atmospheres, 2nd Ed., W.H. Freeman, San Francisco, 1978.
330
CAPITOLO 11
11.10 Profilo del coefficiente di emissione Il profilo del coefficiente di emissione (o di assorbimento) dovuto a una transizione atomica non `e infinitamente sottile in quanto esistono un certo numero di cause che contribuiscono al suo allargamento. Escludendo gli effetti dovuti alla presenza di eventuali campi elettromagnetici esterni (effetto Zeeman, effetto Stark, etc.), e l’effetto della struttura iperfine, si hanno in generale tre tipi diversi di allargamento, ovvero: allargamento naturale, allargamento collisionale, e allargamento dovuto ai moti termici, detto anche allargamento Doppler. L’allargamento naturale deriva in ultima analisi al principio d’indeterminazione. Si consideri ad esempio la transizione fra il livello superiore a e il livello inferiore b. Se Aab `e il coefficiente di Einstein per diseccitazione spontanea, il tempo di vita media del livello superiore `e dato da 1/Aab . Per il principio d’indeterminazione tempo-energia, si ha allora che l’energia di tale livello presenta un allargamento ΔE dato da ΔE
1 h , Aab
dove h `e la costante di Planck. La transizione ha quindi un allargamento in frequenza, Δν, dato da Δν =
ΔE Aab . h
A questa causa di allargamento si sovrappone quella dovuta alle collisioni che perturbano l’atomo durante il processo di emissione. Sebbene esistano varie teorie quantistiche che sono in grado di trattare, in maniera pi` u o meno soddisfacente, questi fenomeni, preferiamo qui dedurre la forma del profilo risultante dall’allargamento naturale e da quello collisionale mediante un ragionamento semiclassico semplificato. Schematizziamo per questo l’atomo in emissione come un oscillatore armonico di frequenza ν0 la cui ampiezza di oscillazione decade esponenzialmente nel tempo con costante di decadimento β. Se l’oscillatore non `e perturbato dalle collisioni, esso emette un campo elettrico della forma E(t) = A e−β t cos(2π ν0 t − φ) ,
(t ≥ 0) ,
dove A e φ sono l’ampiezza e la fase dell’oscillazione. L’effetto delle collisioni con gli elettroni (o altre particelle cariche presenti nel mezzo) pu`o essere schematizzato pensando che le collisioni siano dei processi che avvengano istantaneamente (approssimazione d’impatto) e che ciascuna collisione introduca nel campo elettrico emesso dall’atomo uno sfasamento di ampiezza aleatoria. Per effetto delle collisioni il campo elettrico `e quindi descritto dalla funzione E(t) = A e−β t cos[2π ν0 t − φ(t)] ,
(t ≥ 0) ,
INTERAZIONE FRA MATERIA E RADIAZIONE
331
Fig. 11.5. Andamento col tempo della funzione E(t) per una particolare realizzazione dei processi di collisione. In questo caso particolare si verificano circa 10 collisioni in 5 periodi di oscillazione del campo elettrico. Sia il tempo t che la funzione E(t) sono espressi in unit` a arbitrarie.
dove φ(t) `e una funzione a carattere stocastico che presenta delle discontinuit`a in corrispondenza di ciascun istante a cui si verifica una collisione. Una possibile realizzazione di tale funzione `e riportata nella Fig. 11.5. Lo spettro della radiazione emessa dal dipolo si ottiene, secondo quanto abbiamo visto nel Cap. 2, valutando la trasformata di Fourier della funzione E(t). Introducendo la frequenza ν in luogo della frequenza angolare ω, si ha, per l’Eq. (2.1) 1 ˆ E(ν) = 2π
∞
E(t) e2π i ν t dt .
−∞
Sostituendo l’espressione di E(t) e limitandoci a considerare la trasformata di Fourier alle sole frequenze positive, si ha A ˆ E(ν) = 4π
∞
e 2π i (ν−ν0 )t−β t+i φ(t) dt .
0
Per il modulo quadro della trasformata di Fourier si ha allora
A2 2 ˆ |E(ν)| = 16π 2
∞
dt1 0
0
∞
dt2 e 2π i (ν−ν0 )(t1 −t2 )−β(t1 +t2 )+i [φ(t1 )−φ(t2 )] .
332
CAPITOLO 11
t2
A B
t1 Fig. 11.6. La regione A ` e quella in cui t1 < t2 , mentre nella regione B si ha t2 < t1 .
La quantit` a Δφ = φ(t1 ) − φ(t2 ) ha carattere stocastico. Se durante l’intervallo di tempo che intercorre fra t1 e t2 (oppure fra t2 e t1 ) non avvengono collisioni, allora Δφ = 0, e si ha e i Δφ = 1 . Se invece nello stesso intervallo avvengono molte collisioni, tenendo conto del fatto che le fasi introdotte dalle singole collisioni sono aleatorie, si ottiene, mediando su tutte le possibili “storie collisionali”, e i Δφ = 0 . Se si indica quindi con f la frequenza delle collisioni (numero di collisioni per unit` a di tempo), si pu` o ragionevolmente assumere che valga la seguente approssimazione e i Δφ = e−f |t1 −t2 | . Sostituendo questa espressione nell’integrale si ha quindi
2 ˆ = |E(ν)|
A2 16π 2
∞
dt1 0
∞
dt2 e 2π i (ν−ν0 )(t1 −t2 )−β(t1 +t2 )−f |t1 −t2 | .
0
L’integrale doppio che compare in questa espressione si pu` o calcolare distinguendo nel piano (t1 , t2 ) le due regioni A e B illustrate nella Fig. 11.6. Osservando che l’integrale relativo alla regione B si pu` o ottenere da quello relativo alla regione A cambiando di segno la quantit` a (ν − ν0 ), si ottiene
INTERAZIONE FRA MATERIA E RADIAZIONE
333
2 ˆ =A+B , |E(ν)|
dove A2 A= 16π 2
∞
∞
dt1
dt2 e 2π i(ν−ν0 )(t1 −t2 )−β(t1 +t2 )−f (t2 −t1 ) ,
t1
0
e dove B si ottiene da A mediante la sostituzione (ν −ν0 ) → (ν0 −ν). L’integrale doppio si calcola con metodi elementari e, aggiungendo B ad A, si ottiene 2 ˆ |E(ν)| =
A2 β + f 64π 4 β
1
2 . β + f (ν − ν0 + 2π La quantit` a β viene in generale espressa nella forma β = γ/2, col che γ viene a rappresentare la costante di decadimento del modulo quadro dell’oscillazione del dipolo e pu` o quindi essere interpretata come l’inverso della vita media del livello superiore (γ = Aab ). Introducendo γ si ha allora 2 ˆ |E(ν)| =
A2 γ + 2f 64π 4 γ
)2
1 , γ + 2f 2 2 (ν − ν0 ) + 4π
e, ponendo γ + 2f , 4π si ottiene per il profilo normalizzato in frequenza l’espressione Γ=
1 Γ . π (ν − ν0 )2 + Γ2 La funzione che descrive l’andamento del profilo con la frequenza `e detta funzione di Lorentz (o funzione Lorentziana). La quantit`a Γ, detta costante di smorzamento (o costante di damping), contiene un contributo naturale e un contributo collisionale. Essa pu` o essere posta nella forma φ(ν − ν0 ) =
Γ = Γn + Γc , dove γ f , Γc = . 4π 2π Come abbiamo detto, esiste un’ulteriore causa di allargamento del coefficiente di emissione (o di assorbimento) dovuta all’agitazione termica degli atomi. Indichiamo con P (w) dw la probabilit` a che la componente della velocit`a dell’atomo lungo la direzione della radiazione emessa sia compresa fra w e w + dw. Attraverso l’Eq. (10.4), tale probabilit` a si pu` o esprimere nella forma Γn =
334
CAPITOLO 11
2 1 P (w) = √ e−(w/wT ) , π wT
dove abbiamo introdotto la velocit` a termica wT definita dall’equazione $ 2 kB T , wT = M essendo M la massa dell’atomo. Per effetto Doppler, un atomo che si muova con la componente di velocit`a w presenta (all’ordine relativistico pi` u basso) un profilo di emissione centrato intorno alla frequenza ν0 data da w . ν0 = ν0 1 + c Il profilo di emissione dovuto all’insieme degli atomi `e quindi dato da ϕ(ν − ν0 ) =
∞
−∞
2 1 1 Γ √ e−(w/wT ) dw . π (ν − ν0 − ν0 w/c)2 + Γ2 π wT
Questa espressione viene comunemente semplificata introducendo le quantit` a ΔνD = ν0
wT , c
a=
Γ , ΔνD
v=
ν − ν0 , ΔνD
che rappresentano, rispettivamente, la larghezza Doppler del coefficiente di emissione (in unit` a di frequenza), la costante di smorzamento ridotta (o costante di damping ridotta), e la distanza in frequenza dal centro della riga normalizzata alla larghezza Doppler. Attraverso il cambiamento di variabile y = w/wT , l’integrale precedente pu`o essere posto nella forma 1 H(v, a) , ϕ(ν − ν0 ) = √ π ΔνD
(11.37)
dove la funzione H(v, a), detta funzione di Voigt, `e definita da a H(v, a) = π
∞ −∞
2
e−y dy . (v − y)2 + a2
La funzione di Voigt gode di alcune propriet` a che possono essere dedotte dalla sua espressione generale: ∞ √ 2 H(v, a) dv = π , lim H(v, a) = e−v , a→0
−∞
a 1 . lim H(v, a) = √ π v 2 + a2
a→∞
INTERAZIONE FRA MATERIA E RADIAZIONE
335
Fig. 11.7. Grafico della funzione di Voigt H(v, a) per a = 0 (linea continua), a = 0.2 (linea punteggiata) e a = 1 (linea tratteggiata).
La prima propriet` a permette di dimostrare con facili trasformazioni che il profilo ϕ(ν − ν0 ) `e normalizzato a 1 in frequenza ∞ ϕ(ν − ν0 ) dν = 1 . −∞
Le altre due propriet` a mostrano che, nel caso limite di smorzamento trascurabile, la funzione di Voigt assume la forma Gaussiana, mentre, nel caso limite opposto, in cui l’allargamento termico `e trascurabile, la funzione di Voigt degenera in una Lorentziana. In generale, la funzione di Voigt presenta un andamento Gaussiano intorno a v = 0 e un andamento Lorentziano nelle ali. Casi tipici sono illustrati nella Fig. 11.7.
Capitolo 12
Regole di selezione e forze delle righe I risultati presentati nel capitolo precedente mostrano che per effetto dell’interazione col campo di radiazione la probabilit` a di transizione fra due livelli energetici di un sistema atomico `e, in prima approssimazione, proporzionale al modulo quadro dell’elemento di matrice di dipolo valutato fra le autofunzioni atomiche relative ai livelli stessi. In questo capitolo vedremo come da questa propriet` a scaturiscano in maniera del tutto naturale le varie regole di selezione che abbiamo a suo tempo enunciato e ne discuteremo i limiti di validit`a. Vedremo inoltre come sia possibile valutare in maniera quantitativa le forze relative delle diverse righe di un multipletto di struttura fine che si origina dalla transizione fra due termini. Nel Par. 12.5 `e presentata un’applicazione riguardante i principi fisici che giustificano la presenza di righe proibite negli spettri di alcuni oggetti astronomici di particolare rilevanza (corona solare, nebulose gassose, nebulose planetarie, etc.).
12.1 Regole di selezione sui numeri quantici La probabilit` a di transizione fra due stati quantici descritti dai vettori di stato |um e |un risulta proporzionale, nell’approssimazione di dipolo, al modulo quadro dell’elemento di matrice1 um | r | un . Quando tale elemento di matrice `e nullo si dice che si ha a che fare con una transizione proibita. Viceversa, se l’elemento di matrice `e diverso da zero, la transizione si dice permessa. Nella quasi totalit` a dei casi (fa eccezione il caso dell’effetto Paschen-Back), le autofunzioni atomiche possono scriversi nella forma |αJM , dove α `e un set di numeri quantici che specificano la configurazione e, eventualmente, altre grandezze fisiche interne (come i valori di L e S nel caso valga l’accoppiamento L-S, oppure i valori di j dei singoli elettroni nel caso dell’accoppiamento j-j, etc.), J `e l’autovalore del momento angolare totale (elettronico) e M `e il numero quantico magnetico. Il calcolo dell’elemento di matrice fra due di tali stati pu`o essere eseguito con facilit`a se si considerano, invece delle componenti cartesiane del vettore r, le sue componenti sferiche definite nell’Eq. (9.3). Applicando il teorema di Wigner-Eckart nella forma dell’Eq. (9.4) si ha 1
Poich´ e | um |r | un |2 = | un |r | um |2 , la probabilit` a di transizione non dipende da quale dei due stati quantici compaia nel “bra” e quale nel “ket”.
338
CAPITOLO 12
αJM | rq |α J M = (−1)J
+M+1
√ 2J + 1
J −M
J M
1 q
αJ|| r ||α J ,
dove αJ|| r ||α J `e l’elemento di matrice ridotto dell’operatore di dipolo. L’elemento di matrice `e non nullo, e quindi la transizione `e permessa, solo se `e verificata la diseguaglianza triangolare fra i momenti angolari della prima riga del simbolo 3-j e se la somma dei simboli della seconda riga `e nulla. Devono quindi valere le regole di selezione J = 0 −→ / J = 0 ,
ΔJ = ±1, 0 ,
ΔM = ±1, 0 .
Nel caso in cui gli stati atomici siano descritti dall’accoppiamento L-S, l’elemento di matrice da calcolare `e il seguente αLSJM | rq |α L S J M
.
Cambiando base, gli autovettori |αLSJM e |α L S J M possono esprimersi, per mezzo di opportuni coefficienti di Clebsh-Gordan, nella forma |αLSJM = LSMLMS |LSJM |αLSML MS , ML MS
|α L S J M =
L S ML MS |L S J M |α L S ML MS
.
M ML S
Sostituendo si ottiene αLSJM | rq |α L S J M =
LSMLMS |LSJM
ML MS ML MS
×
L S ML MS |L S J M
αLSML MS | rq |α L S ML MS
(12.1) .
L’operatore rq agisce solamente sulle coordinate orbitali e non sullo spin. L’elemento di matrice di rq a secondo membro risulta allora dato dall’espressione αLSMLMS | rq |α L S ML MS = = αLML | rq |α L ML
SMS |S MS = αLML | rq |α L ML δSS δMS MS ,
e, utilizzando di nuovo il teorema di Wigner-Eckart, √ αLSML MS | rq |α L S ML MS = (−1)L +ML +1 2L + 1 L L 1 × αL|| r ||α L δSS δMS MS . −ML ML q
(12.2)
339
REGOLE DI SELEZIONE E FORZE DELLE RIGHE
Sostituendo questa espressione nell’Eq. (12.1), risulta che affinch´e tale elemento di matrice sia non nullo devono essere soddisfatte le regole di selezione ΔL = ±1, 0 ,
L = 0 −→ / L = 0 ,
ΔS = 0 .
Infine, se si considera il caso di un atomo con struttura iperfine, si deve andare a considerare l’elemento di matrice αJIF MF | rq |α J IF MF
.
Per mezzo di calcoli del tutto analoghi a quelli sviluppati sopra, si ottengono facilmente le regole di selezione ΔF = ±1, 0 ,
F = 0 −→ / F = 0 ,
ΔMF = ±1, 0 .
12.2 Regole di selezione sulle configurazioni Consideriamo due configurazioni distinte di un atomo assegnato. Per quanto visto nei Par. 7.1 e 7.6, uno dei g stati degeneri appartenenti a una configurazione pu`o essere descritto da una funzione d’onda del tipo di quelle dell’Eq. (7.1), ovvero 1 ΨA (a1 , a2 , . . . , aN ) = √ (−1)P P [ψa1 (x1 )ψa2 (x2 ) · · · ψaN (xN )] , N! P dove (a1 , a2 , . . . , aN ) `e una ennupla di set di numeri quantici che specificano gli stati di particella singola. L’elemento di matrice di dipolo fra due stati assegnati, il primo appartenente a una configurazione e il secondo a un altra, `e quindi dato da ΨA (a1 , a2 , . . . , aN )| r |ΨA (a1 , a2 , . . . , aN ) =
N 1 (−1)P +Q N! i=1 P
Q
× P [ψa1 (x1 )ψa2 (x2 ) · · · ψaN (xN )]| ri | Q[ψa1 (x1 )ψa2 (x2 ) · · · ψaN (xN )]
.
Questa somma contiene N × (N !)2 termini, il generico dei quali risulta proporzionale al prodotto ψa¯1 |ψa¯1
ψa¯2 |ψa¯2 · · · ψa¯i | ri |ψa¯i · · · ψa¯N |ψa¯N
,
¯2 , . . . , a ¯N ) una permutazione data della ennupla (a1 , a2 , . . . , aN ) essendo (¯ a1 , a e (¯ a1 , a ¯2 , . . . , a ¯N ) una permutazione data dell’altra ennupla (a1 , a2 , . . . , aN ).
340
CAPITOLO 12
Questo termine `e nullo a meno che tutti i set a ¯ k siano uguali ai corrispondenti set a ¯k , eccetto per a ¯i che pu` o essere diverso da a ¯i . Si deve cio`e avere a ¯1 = a ¯1 , a ¯2 = a ¯2 , . . . , a ¯i−1 = a ¯i−1 , a ¯i+1 = a ¯i+1 , . . . , a ¯N = a ¯N . Affinch´e l’elemento di matrice ΨA (a1 , a2 , . . . , an )| r |ΨA (a1 , a2 , . . . , an ) sia diverso da zero bisogna quindi che (N − 1) dei set appartenenti alla ennupla (a1 , a2 , . . . , aN ) coincidano con (N − 1) dei set appartenenti alla ennupla (a1 , a2 , . . . , aN ). Questo implica che se k `e l’indice per cui il set ak non ha il corrispondente fra gli aj , la funzione d’onda del secondo stato deve essere della forma ΨA (a1 , a2 , . . . , aN ) = ±ΨA (a1 , a2 , . . . , ak , . . . , aN ) , dove il fattore di segno ± `e in connessione col numero (pari oppure dispari) degli scambi necessari per ordinare la ennupla (a1 , a2 , . . . , aN ) nella forma voluta. Si ha allora (quando l’elemento di matrice `e non nullo) ΨA (a1 , a2 , . . . , aN )| r |ΨA (a1 , a2 , . . . , an ) = = ± ΨA (a1 , . . . , ak , . . . , aN )| r |Ψ(a1 , . . . , ak , . . . , aN ) = =±
N 1 (−1)P +Q N! i=1 P
Q
× P [ψa1 (x1 ) · · · ψak (xk ) · · · ψaN (xN )]| ri |Q[ψa1 (x1 ) · · · ψak (xk ) · · · ψaN (xN )] . Affinch´e il singolo addendo di questa somma dia risultato non nullo, bisogna che Q sia la stessa permutazione di P e inoltre, fissato i, bisogna che la permutazione sia tale da portare i set di numeri quantici “non pareggiati” ak e ak in corrispondenza della i-esima posizione. Cos`ı facendo si ottengono N (N − 1)! = N ! termini che portano tutti lo stesso contributo, e si ha ΨA (a1 , a2 , . . . , aN )| r |ΨA (a1 , a2 , . . . , an ) = ± ψak (xk )| rk |ψak (xk )
,
una formula che mostra che l’elemento di matrice fra le due configurazioni `e semplicemente dato dall’elemento di matrice di particella singola valutato per il singolo elettrone che “salta” dallo stato ak allo stato ak . Le transizioni di dipolo sono quindi possibili solo fra stati di configurazioni diverse che differiscono fra loro per i numeri quantici di uno ed un solo elettrone. Inoltre, affinch´e la transizione sia permessa, `e necessario che, indicando con (n, l, m, m s ) e (n , l , m , ms ) i set dei numeri quantici di tale elettrone negli stati iniziale e = 0, dove finale della transizione, si abbia I ∗ ψnlm I = δms ms (r ) r ψn l m (r ) d3r .
341
REGOLE DI SELEZIONE E FORZE DELLE RIGHE
Ricordando l’espressione delle funzioni d’onda di particella singola (Eq. (7.10)) e le Eq. (9.3), le componenti sferiche Iq di questo integrale risultano Iq = δ
ms ms
"
∞
Pnl (r) P
n l
∗ Ylm (θ, φ) Yl m (θ, φ)fq (θ, φ) dΩ ,
(r) r dr 4π
0
dove fq , (q = −1, 0, 1), sono le tre componenti sferiche del versore di r, ovvero 1 1 f−1 = √ sinθ (cosφ − i sinφ) , f0 = cosθ , f1 = − √ sinθ (cosφ + i sinφ) . 2 2 Per calcolare la parte angolare dell’integrale si possono ricordare le espressioni esplicite delle armoniche sferiche Y1q (θ, φ) dell’Eq. (6.13), per le quali si ha $ 4π Y1q (θ, φ) , fq = 3 e sfruttare la propriet` a integrale delle armoniche sferiche espressa dal teorema di Weyl (Eq. (8.8)). Ricordando anche la propriet`a di coniugazione delle armoniche sferiche (Eq. (6.11)), si ottiene " # ∗ Ylm (θ, φ) Yl m (θ, φ)fq (θ, φ) dΩ = (−1)m (2l + 1)(2l + 1) 4π
×
l l 0 0
1 0
l −m
l m
1 q
l 0
1 0
,
e quindi
Iq = δ
ms ms
# (−1) (2l + 1)(2l + 1) m
l 0
l l −m m
1 q
R ,
dove R `e l’integrale radiale dato da ∞ R= Pnl (r) Pn l (r) r dr . 0
L’equazione che abbiamo ottenuto contiene tutte le regole di selezione per le transizioni fra configurazioni. Se si ricorda infatti la propriet` a di cui gode il simbolo 3-j per inversione di segno dei numeri quantici che compaiono nella sua seconda riga (si veda l’Eq. (7.19)), si ha l l 1 =0 , 0 0 0
342
CAPITOLO 12
per cui, dalla delta di Kronecker e dai simboli 3-j contenuti nell’espressione di Iq , si ottengono le regole di selezione Δl = ±1 ,
Δm = ±1, 0 ,
Δms = 0 .
Le transizioni di dipolo sono quindi possibili solo fra configurazioni che differiscono per i numeri quantici l e l di uno e un solo elettrone, tali numeri quantici dovendo essere tali che Δl = l − l = ±1. Se si considera la parit` a P delle due configurazioni, si vede che, essendo & li i P = (−1) , la parit` a delle due configurazioni connesse da una transizione di dipolo `e diversa. Si pu` o quindi enunciare la cosiddetta regola di Laporte pari −→ / pari ,
dispari −→ / dispari .
La regola di Laporte `e molto generale in quanto essa si applica anche in quei casi in cui `e presente il fenomeno dell’interazione fra configurazioni. In tali casi uno stato del sistema atomico `e descritto da un’autofunzione che risulta dalla combinazione lineare di autofunzioni del tipo ΨA (a1 , a2 , . . . , an ), tutte della stessa parit` a. La regola di Laporte mantiene quindi la sua validit` a anche nel caso che sia presente il fenomeno dell’interazione fra configurazioni.
12.3 Transizioni proibite Le regole di selezione che abbiamo determinato nel paragrafo precedente valgono, tutte e soltanto, per le transizioni di dipolo elettrico. Il sistema atomico presenta tuttavia altri tipi di multipoli elettromagnetici (dipolo magnetico, quadrupolo elettrico, etc.) che abbiamo trascurato nel formalismo sviluppato nel Cap. 11. Ricordiamo infatti che, oltre all’approssimazione di dipolo propria mente detta (che consiste nell’eseguire la sostituzione e i k·r → 1), abbiamo introdotto altre due approssimazioni assumendo per l’Hamiltoniana atomica la sua espressione non relativistica (una prima volta per ottenere l’espressione dell’Hamiltoniana di interazione attraverso il principio dell’accoppiamento minimale e una seconda volta per connettere gli elementi di matrice dell’operatore p agli elementi di matrice dell’operatore r ). Poich´e queste due ultime approssimazioni consistono nel trascurare le correzioni relativistiche all’Hamiltoniana atomica, c’`e da aspettarsi che i contributi multipolari di ordine superiore al dipolo elettrico svolgano un ruolo pi` u importante negli atomi complessi che negli atomi semplici. Per stimare tali contributi multipolari alla probabilit` a di transizione, iniziamo col calcolare l’ordine di grandezza del coefficiente di Einstein per emissione spontanea relativo a una transizione di dipolo elettrico. Ricordando l’Eq. (11.20), introduciamo due quantit` a adimensionali ξ e ζ ponendo
REGOLE DI SELEZIONE E FORZE DELLE RIGHE
|rba |2 = ξ 2 a20 ,
νab = ζ
343
e20 . 2 h a0
Cos`ı facendo, l’elemento di matrice di dipolo `e espresso in termini del raggio della prima orbita di Bohr, mentre la frequenza della transizione `e espressa in termini della frequenza che corrisponde alla ionizzazione dell’atomo di Idrogeno. Con facili trasformazioni si ottiene Ad.e. =
α4 c 3 2 ζ ξ gb 2.677 × 109 ζ 3 ξ 2 gb s−1 , 6 a0
dove α `e la costante della struttura fine. Poich´e il fattore adimensionale ζ 3 ξ 2 che compare in questa equazione risulta in generale minore o dell’ordine di 0.1, i coefficienti di Einstein per le righe che cadono nella regione visibile dello spettro risultano tipicamente dell’ordine di 107 − 108 s−1 . Quando l’elemento di matrice di dipolo fra due stati `e nullo, pu` o invece risultare diverso da zero l’elemento di matrice di dipolo magnetico, oppure l’elemento di matrice di quadrupolo elettrico, e cos`ı via. In questi casi la transizione `e proibita e il coefficiente di Einstein, che risulterebbe nullo nell’approssimazione di dipolo, `e di alcuni ordini di grandezza pi` u basso del corrispondente coefficiente relativo a una transizione permessa. Senza addentrarci in derivazione formali, ma ricordando i risultati classici che abbiamo ottenuto per gli sviluppi multipolari nel Par. 3.10, accenniamo semplicemente al fatto che il coefficiente di Einstein relativo a una transizione di dipolo magnetico si ottiene attraverso la stessa formula valida per il dipolo elettrico con la differenza che l’operatore dipolo elettrico, e0 r , va sostituito con l’operatore dipolo magnetico, μ . Ne consegue che, come ordine di grandezza, si ha (con simboli evidenti) Ad.m. Ad.e.
μ0 e 0 a0
2 =
α2 = 1.331 × 10−5 , 4
dove μ0 `e il magnetone di Bohr definito dall’Eq. (5.17). Le transizioni di dipolo magnetico risultano quindi avere coefficienti di Einstein circa 105 volte pi` u piccoli di quelle di dipolo elettrico. Per quanto riguarda invece le transizioni di quadrupolo elettrico, ricordando la discussione del Par. 11.4 relativa allo sviluppo in serie dell’esponenziale e i k·r , in particolare l’Eq. (11.11), si ha a 2 Aq.e. 0 , Ad.e. λ dove λ `e la lunghezza d’onda della transizione. Nella regione ottica dello spettro, le transizioni di quadrupolo elettrico risultano avere coefficienti di Einstein circa 108 volte pi` u piccoli di quelle di dipolo elettrico.
344
CAPITOLO 12
Le transizioni di dipolo magnetico e di quadrupolo elettrico hanno regole di selezione diverse da quelle di dipolo elettrico. Per le prime, ad esempio, la regola di selezione ΔS = 0 cessa di essere valida, cos`ı come cessa di essere valida la regola di Laporte. Per le seconde invece, `e la regola di selezione su J che cambia, risultando ΔJ = 0, ±1, ±2, con esclusione delle transizioni 0 → 0, 0 → 1, 1 → 0, e 12 → 12 che risultano proibite.
12.4 Transizioni semiproibite Vengono chiamate semiproibite quelle transizioni che violano alcune delle regole di selezione che abbiamo visto nei paragrafi precedenti (12.1 e 12.2) a causa del fatto che la denominazione spettroscopica che viene assegnata a uno degli stati (oppure a entrambi) `e approssimata. Riferiamoci ad esempio alla transizione fra due stati atomici e supponiamo che per il primo di essi valga rigorosamente l’accoppiamento L-S mentre per il secondo valga l’accoppiamento intermedio. Il primo stato sar`a quindi descritto da un autovettore della forma |α L S J M , mentre il secondo sar` a descritto da un autovettore della forma (si veda l’Eq. (9.12) e la relativa discussione) |αJM = CL0 S0 |αL0 S0 JM + CLS |αLSJM , LS =L0 S0
dove L0 e S0 sono i valori di L e S che danno la denominazione spettroscopica (approssimata) e dove i coefficienti dello sviluppo sono tali che |CLS | |CL0 S0 | 1 . Se una delle due regole di selezione su L e su S `e violata, ovvero se si ha ΔL = L0 − L = ±1, 0 ,
oppure
ΔS = S0 − S = 0 ,
oppure se sono violate entrambe, la transizione potrebbe essere considerata (ingenuamente) una transizione proibita, come effettivamente risulterebbe se anche per il secondo stato valesse rigorosamente l’accoppiamento L-S. In effetti, se si va a calcolare l’elemento di matrice | α L S J M | r |αJM |2 , si trova che esso pu`o risultare non nullo in quanto, nello sviluppo in serie di |αJM , possono figurare uno o pi` u vettori di stato |αLSJM per i quali si ha ΔL = L − L = ±1, 0 ,
ΔS = S − S = 0 .
L’elemento di matrice risulta proporzionale alla corrispondente quantit`a |CLS |2 ed `e quindi, in generale, molto minore dell’elemento di matrice relativo a una transizione permessa. Valori tipici del coefficiente di Einstein per tali transizioni semiproibite risultano dell’ordine di 103 − 106 s−1 .
REGOLE DI SELEZIONE E FORZE DELLE RIGHE
345
1
S0
1
D2
N1 λ 5007
N2 λ 4959
3
P2 P1 3 P0
3
Fig. 12.1. Diagramma di Grotrian schematico relativo alla configurazione 1s 2 2s2 2p2 dell’Ossigeno due volte ionizzato. La configurazione da luogo ai tre termini 1S, 1D e 3P (si veda la Tab. 7.4), l’ultimo dei quali si divide in tre livelli di struttura fine. Le due righe N 1 e N2 sono le cosiddette righe proibite del “Nebulio”.
Considerazioni simili, sviluppate qui per il caso di uno stato per il quale valga l’accoppiamento intermedio, possono essere ripetute, riguardo alle regole di selezione per le configurazioni, per stati nei quali sia presente il fenomeno dell’interazione fra configurazioni.
12.5 Righe proibite in oggetti astronomici Alcune righe proibite, appartenenti a elementi cosmicamente abbondanti, risultano particolarmente prominenti negli spettri di vari oggetti astronomici di carattere nebulare, quali la corona solare, le nebulose gassose, le nebulose planetarie, le regioni H I, etc.. Un esempio tipico sono le righe N1 e N2 dello spettro2 [O III ], che sono riportate nel diagramma di Grotrian schematico della Fig. 12.1. Le due righe sono entrambe proibite in quanto esse violano sia la regola di selezione sulle configurazioni (la quale stabilisce che le configurazioni iniziale e finale devono differire per i numeri quantici di un elettrone), sia la regola di Laporte, sia infine la regola di selezione ΔS = 0. Il fatto che queste righe risultino particolarmente prominenti negli spettri delle nebulose `e intimamente connesso con la bassissima densit`a di questi oggetti astronomici (da 10−20 a 10−17 g cm−3 ) e pu` o essere adeguatamente spie2
Il simbolo [O III ] ` e comunemente utilizzato per indicare lo spettro di righe proibite dell’Ossigeno due volte ionizzato. Questa convenzione della parentesi quadra vale per lo spettro di righe proibite di qualsiasi elemento o ione.
346
CAPITOLO 12
a
m
b Fig. 12.2. Modello atomico schematico che illustra la possibilit` a di osservare righe proibite negli oggetti nebulari. La riga proibita si origina dalla transizione, tratteggiata in figura, fra il livello metastabile m e il livello fondamentale b. L’atomo ` e pompato dal campo di radiazione verso il livello a dal quale pu` o decadere spontaneamente sia verso il livello b che verso il livello m.
gato in base a un modello atomico semplificato, quale quello illustrato nella Fig. 12.2, che riproduce nei punti essenziali la fisica dell’eccitazione atomica nelle nebulose. Dal livello fondamentale (livello b), l’atomo pu` o essere eccitato verso un livello d’energia elevata (livello a) per assorbimento di radiazione (in genere radiazione ultravioletta dovuta a una delle stelle giovani e calde che illuminano la nebulosa). Dal livello a l’atomo pu` o poi ritornare al livello fondamentale oppure pu` o decadere al livello metastabile m attraverso una transizione permessa, entrambi i processi avvenendo per diseccitazione spontanea. Infine, dal livello m, l’atomo pu` o ritornare al livello fondamentale, sempre per diseccitazione spontanea, attraverso una transizione proibita. Si noti che in questo semplice modello vengono trascurati i processi di emissione stimolata e i processi di assorbimento nella riga proibita e nella riga subordinata. Questo `e giustificato in quanto nelle nebulose il campo di radiazione dovuto alla stella calda centrale `e molto diluito e, inoltre, esso risulta molto pi` u intenso nell’ultravioletto che nel visibile. Applicando le equazioni dell’equilibrio statistico (11.29) all’evoluzione temporale della popolazione del livello a, si perviene, in condizioni stazionarie, alla seguente equazione dNa = Nb Bba Jνab − Na (Aab + Aam ) = 0 , dt dove si sono introdotti, con simboli evidenti, i coefficienti di Einstein per le singole transizioni e l’intensit` a media del campo di radiazione alla frequenza della transizione fra i livelli a e b. Risolvendo l’equazione si ottiene Na =
Bba Jνab Nb . Aab + Aam
REGOLE DI SELEZIONE E FORZE DELLE RIGHE
347
Per l’evoluzione della popolazione del livello m si ha poi, sempre in condizioni stazionarie dNm = Na Aam − Nm Amb = 0 , dt
(12.3)
dalla quale si ottiene Aam Na . Amb Poich´e la transizione fra i livelli m e b `e proibita, si ha Aam Amb , e quindi Nm Na , ovvero la popolazione del livello metastabile `e molto maggiore di quella del livello eccitato a. Il numero di fotoni emesso per unit` a di tempo nella transizione fra i livelli m e b `e dato da Nm Amb , mentre il numero di quelli emessi nella transizione fra i livelli a e m `e dato da Na Aam . Indicando tale rapporto con R si ha Nm =
Nm Amb , Na Aam e tenendo conto dell’equazione precedente, si vede immediatamente che il rapporto R vale 1. Questo significa che il numero di fotoni emessi nella riga proibita `e uguale a quello dei fotoni emessi nella riga permessa. Si pu` o eseguire un calcolo pi` u preciso, che tenga conto anche conto dell’assorbimento nella riga subordinata. Questo porta a modificare l’Eq. (12.3), che, introducendo simboli evidenti, assume la forma R=
dNm = Na Aam − Nm (Amb + Bma Jνam ) = 0 . dt Risolvendo per il rapporto Nm /Na , e sostituendo il risultato nella definizione di R si ottiene −1 Bma Jνam R= 1+ , Amb ovvero, tenendo conto delle relazioni fra i coefficienti di Einstein −1 Aam ga n ¯ν , R= 1+ Amb gm am dove n ¯ νam `e il numero medio di fotoni per modo alla frequenza νam . Consideriamo il caso di una stella calda che illumini col suo flusso di radiazione un mezzo gassoso diffuso. Il numero medio di fotoni per modo alla distanza d dalla stella `e dato da n ¯ νam = n ¯∗
R∗ d
2 ,
348
CAPITOLO 12
dove n ¯ ∗ `e l’analoga quantit`a alla superficie della stella e dove R∗ `e il raggio stellare. Sostituendo, l’espressione per R pu` o essere posta nella forma
R= 1+
dc d
2 −1 ,
dove la “distanza critica”, dc `e data da % dc = R∗
n∗
Aam ga . Amb gm
Ad esempio, se la stella centrale ha una temperatura efficace di 2 × 10 4 K, a frequenze caratteristiche del visibile si ha n ¯ ∗ 0.3, ed assumendo un rapporto 108 fra i due coefficienti di Einstein, si ottiene dc 5 × 103 R∗ . A distanze superiori a circa 5000 raggi stellari, il rapporto fra i fotoni emessi nelle due righe `e sostanzialmente uguale all’unit` a, come si `e ottenuto nel caso semplificato analizzato precedentemente. Il ragionamento sviluppato sopra cessa per`o di valere quando esistono altri tipi di processi, oltre a quelli radiativi, che contribuiscono a popolare o a depopolare i livelli atomici. Come vedremo nel capitolo seguente, sono i processi collisionali (qui giustamente trascurati a causa della bassissima densit`a del mezzo) che provocano una drastica diminuzione della popolazione dei livelli metastabili. Nei plasmi di laboratorio e nelle atmosfere stellari, dove le densit`a sono di ordini di grandezza superiori a quelle degli oggetti nebulari, l’emissione nelle righe proibite risulta effettivamente molto minore rispetto all’emissione nelle righe permesse e tali righe sono sostanzialmente assenti negli spettri. Dal punto di vista storico `e importante sottolineare che l’interpretazione delle due righe N1 e N2 costitu`ı per lungo tempo un vero e proprio rompicapo tanto che tali righe, in mancanza di una spiegazione pi` u appropriata, furono attribuite a un ipotetico elemento chiamato “Nebulio”. La loro identificazione quali righe dello spettro [O III] fu dovuta all’astronomo statunitense Bowen (1928). In maniera del tutto analoga furono successivamente identificate quali righe proibite dello spettro dell’Ossigeno neutro [O I] le cosiddette righe aurorali, la riga verde e 5577 ˚ A e la riga rossa a 6300 ˚ A, responsabili della luminosit` a del cielo nelle aurore polari. Tali righe sono dovute rispettivamente alle transizioni 1 S0 →1D2 e 1D2 →3 P2 che si verificano entro i termini cui d`a luogo la configurazione fondamentale dell’Ossigeno neutro3 1s2 2s2 2p4 . Lo stesso discorso vale anche per varie righe osservate nello spettro della corona solare (anch’esse 3
Si ricordi che le configurazioni p2 e p4 , essendo complementari, danno luogo alla stessa struttura di termini (si veda la Tab. 7.8). Il diagramma di Grotrian della configurazione fondamentale dell’Ossigeno neutro `e quindi strutturalmente uguale a quello della Fig. 12.1, a parte ovvie differenze nelle separazioni fra i livelli e l’inversione in energia dei tre livelli J = 0, 1, 2 del termine 3P , dovuta alla seconda regola di Hund.
349
REGOLE DI SELEZIONE E FORZE DELLE RIGHE
attribuite inizialmente a un ipotetico elemento, detto “Coronio”). Tali righe corrispondono a transizioni proibite tra i termini pi` u bassi di vari ioni pi` u volte ionizzati quali Fe X, Fe XI, Fe XIII, Fe XIV, Fe XV, Ni XII, Ni XIII, Ni XV, Ni XVI, Ca XII, Ca XIII, Ca XV, Ar X, Ar XIV, etc.. La presenza di righe proibite negli spettri aurorali e coronali `e dovuta a un meccanismo fisico del tutto analogo a quello visto per gli spettri nebulari, con la sola differenza che il meccanismo di pompaggio dal livello b al livello a `e dovuto, nel primo caso, all’eccitazione degli atomi dell’alta atmosfera ad opera di particelle cariche di alta energia provenienti dal Sole (vento solare), e, nel secondo caso, all’eccitazione degli atomi della corona da parte degli elettroni che, in tale ambiente, hanno temperature cinetiche dell’ordine di 10 6 K. L’interpretazione delle righe aurorali fu data da McLennan (1929) e quella delle righe coronali da Edl´en (1930).
12.6 Forze relative entro multipletti in accoppiamento L-S Si consideri un multipletto di righe di struttura fine proveniente dalla transizione tra due termini, entrambi in accoppiamento L-S. Lo spin totale dei termini sia S e il momento angolare orbitale totale sia L per il termine inferiore e L per il termine superiore. Partendo dalle considerazioni svolte nel primo paragrafo di questo capitolo, `e possibile ottenere delle relazioni che collegano fra loro gli elementi di matrice di dipolo relativi alle transizioni fra uno qualsiasi dei livelli inferiori, caratterizzato dal numero quantico di momento angolare totale J, e uno qualsiasi dei livelli superiori, caratterizzato dall’analogo numero quantico J . Riprendendo le Eq. (12.1) e (12.2) e introducendo i simboli 3-j in luogo dei Clebsh-Gordan (Eq. (7.15)), si ha per l’elemento di matrice di dipolo √ αLSJM |rq |α L SJ M = (−1)L−S+M 2J + 1 ×
L ML
S MS
L +ML +1
× (−1)
J −M √
M ML ML S
L −S+M
(−1)
2L + 1
L −ML
√ 2J + 1
L ML
1 q
L ML
S MS
αL|| r ||α L
J −M
.
D’altra parte, applicando direttamente il teorema di Wigner-Eckart allo stesso elemento di matrice si ha, per l’Eq. (9.4) √ αLSJM |rq |α L SJ M = (−1)J +M+1 2J + 1 J J 1 αLSJ|| r ||α L SJ . × −M M q
350
CAPITOLO 12
Attraverso queste due equazioni `e possibile trovare una relazione fra gli elementi di matrice ridotti. Con facili trasformazioni si ottiene
J −M
J M
1 q
αLSJ|| r ||α L SJ = # L S = (−1)L+M−M +ML +1 (2J + 1)(2L + 1) M M L S M ML ML S L L L 1 S J × αL ||r ||α L . −ML ML q ML MS −M
(−1)J
+M+1
J −M
Moltiplichiamo adesso entrambi i membri per il seguente simbolo 3-j
J −M
J M
1 q
,
e sommiamo su M e M . Ricordando la propriet` a dei simboli 3-j espressa dall’Eq. (7.18), per la quale J −M
MM
J M
1 q
2 =
1 , 3
si ottiene 1 αLSJ|| r ||α L SJ = (−1)L−J −M +ML 3 M MM ML ML S # L S J 1 J J × (2J + 1)(2L + 1) ML MS −M −M M q L L S J 1 L × αL|| r ||α L . −ML ML q ML MS −M La somma sui quattro simboli 3-j che compare a secondo membro pu`o essere espressa introducendo i coefficienti di Racah, oppure gli equivalenti simboli 6-j di Wigner, legati ai primi da un semplice fattore di segno. Tali quantit` a intervengono in maniera naturale nella teoria del momento angolare in connessione col problema dell’addizione di tre momenti angolari4. Il fattore di segno che compare nell’equazione precedente, moltiplicato per il prodotto dei quattro simboli 3-j, altro non `e che il coefficiente di Racah W (LS1J ; JL) moltiplicato per il fattore 13 , per cui si ottiene 4
Si veda ad esempio D.M. Brink & G.R. Satchler, Angular Momentum, Clarendon Press, Oxford, 1968.
351
REGOLE DI SELEZIONE E FORZE DELLE RIGHE
αLSJ|| r ||α L SJ =
# (2J + 1)(2L + 1) W (LS1J ; JL) αL|| r ||α L
.
Alternativamente, in termini di simboli 6-j, tenendo conto della definizione a b e , W (abcd ef ) = (−1)a+b+c+d d c f si ha
αLSJ|| r ||α L SJ = ×
# (2J + 1)(2L + 1) (−1)L+S+J +1 αL|| r ||α L
L J
S 1
J L
.
Per una generica transizione fra due livelli, si definisce forza della riga (oppure forza della transizione) la quantit` a5 S = e20 (2J + 1) | αJ|| r ||α J |2 . Tenendo conto del teorema di Wigner-Eckart e delle propriet` a dei simboli 3-j si pu` o facilmente dimostrare che la forza della riga `e simmetrica nello scambio dei livelli, essendo (2J + 1)| αJ|| r ||α J |2 = (2J + 1)| α J || r ||αJ |2 . Per mezzo dei risultati precedenti, la forza della riga appartenente a un multipletto pu` o quindi essere espressa dalla seguente equazione SJJ = e20 (2J + 1) | αLSJ|| r ||α L SJ |2 = e20 (2J + 1)(2J + 1)(2L + 1) ×
L J
S 1
J L
2
| αL|| r ||α L |2 ,
oppure SJJ = sJJ Smult , dove Smult `e la forza del multipletto Smult = e20 (2L + 1) | αL|| r ||α L |2 , e dove la forza relativa della riga, sJJ , `e data da 5
La forza della riga `e proporzionale alla quantit` a |rab |2 = |rba |2 introdotta nel Cap. 11. Come mostrato nell’App. 12 si ha S = e20 (2Ja + 1) (2Jb + 1) |rab |2 .
352
CAPITOLO 12
sJJ = (2J + 1) (2J + 1)
L J
L J
1 S
2 .
Tenendo presente la seguente relazione valida per i simboli 6-j a b k a b k = δf g , (2k + 1) (2f + 1) c d g c d f k
si ottiene
sJJ =
J
2J + 1 , 2L + 1
sJJ =
J
2J + 1 . 2L + 1
Queste due formule esprimono la cosiddetta regola della somma, scoperta empiricamente da Ornstein, Burger e Dorgelo, che si enuncia dicendo che “la somma delle forze delle righe di un multipletto che si originano da un dato livello inferiore `e proporzionale al peso statistico di tale livello e, analogamente, la somma delle forze delle righe che si originano da un dato livello superiore `e proporzionale al peso statistico del livello stesso”. Le forze relative delle diverse righe di un multipletto possono essere facilmente determinate mediante la conoscenza dei relativi simboli 6-j o dei coefficienti di Wigner. Spesso, si preferisce cambiare leggermente la definizione della forza relativa osservando che JJ
sJJ =
2J + 1 (2L + 1) (2S + 1) = = 2S + 1 . 2L + 1 2L + 1 J
La forza relativa normalizzata, (sJJ )norm , pu` o quindi essere definita da
(sJJ )norm =
(2J + 1) (2J + 1) 2S + 1
L J
L J
1 S
2 , con
(sJJ )norm = 1 . JJ
Le formule per le forze relative di un multipletto che abbiamo test´e determinato prendono il nome di formule di Kronig, Sommerfeld e H¨ onl. Esse furono originalmente dedotte mediante considerazioni basate sul principio di corrispondenza. Per illustrare queste formule su un esempio, riferiamoci al multipletto relativo alla transizione 3P →3D della Fig. 9.3. Il termine inferiore `e composto da tre livelli di struttura fine aventi J = 0, 1, 2, mentre il termine superiore `e composto da tre livelli con J = 1, 2, 3. In totale si hanno sei righe corrispondenti alle transizioni J → J della forma 0 → 1, 1 → 1, 1 → 2, 2 → 1, 2 → 2 e 2 → 3, le tre rimanenti transizioni essendo vietate dalle regole di selezione su J. Per trovare le forze relative del multipletto bisogna calcolare i relativi simboli 6-j, cosa che pu`o effettuarsi mediante la seguente formula 6 6
La formula `e dovuta a G. Racah (Physical Review 62, 438, [1942]).
353
REGOLE DI SELEZIONE E FORZE DELLE RIGHE
Transizione
Forza relativa normalizzata 1 9 1 12 1 4 1 180 1 12 7 15
3
P0 −3D1 P1 −3D1
3
P1 −3D2
3
P2 −3D1
3
P2 −3D2
3
P2 −3D3
3
Tab. 12.1. Forze relative normalizzate delle transizioni del multipletto 3P −3D.
a b d e
c f
= Δ(abc) Δ(aef ) Δ(dbf ) Δ(dec)
(−1)z (z + 1)!
z
×[(z − a − b − c)! (z − a − e − f )! (z − d − b − f )!(z − d − e − c)! ×(a + b + d + e − z)! (b + c + e + f − z)! (a + c + d + f − z)! ]−1 , dove il simbolo Δ(abc) `e definito nell’Eq. (7.17). Con semplici calcoli si ottiene
1 1
1 1
2 1 0 1 2 1 2 1
=
1 , 3
=
1 , 30
1 1
2 1 1 1 1 2 2 2
= 1 1
1 , 6
=−
1 , 10
1 2
1 =− √ , 2 5 1 1 2 1 = . 3 2 1 5 2 1 1 1
Da questi valori si determinano le forze relative date nella Tab 12.1, dalle quali si pu` o facilmente verificare la correttezza della regola della somma. Per i multipletti di struttura iperfine valgono delle formule, del tutto analoghe a quelle che abbiamo dedotto per i multipletti di struttura fine, che si ottengono da quest’ultime eseguendo le seguenti trasformazioni formali L→J ,
S→I ,
J →F .
Le forze relative delle righe di un multipletto di struttura iperfine sono quindi date dall’equazione
(sF F )norm
(2F + 1) (2F + 1) = 2I + 1
J F
J F
1 I
2 , con
FF
(sF F )norm = 1 .
Capitolo 13
Plasmi in condizioni di non-equilibrio Nei plasmi di laboratorio e nei plasmi astrofisici le condizioni di eccitazione degli atomi sono determinate, oltre che dalle interazioni col campo elettromagnetico, anche dai processi di collisione che gli atomi stessi subiscono con le particelle del plasma. In questo capitolo vedremo come sia possibile descrivere questo tipo di processi e quali siano le loro conseguenze sulle popolazioni atomiche.
13.1 La temperatura cinetica degli elettroni Abbiamo visto nel Cap.10 che, all’equilibrio termodinamico, gli elettroni di un plasma elettricamente neutro hanno una distribuzione di velocit`a descritta da una funzione gaussiana (la cosiddetta distribuzione Maxwelliana delle velocit`a). La condizione di equilibrio termodinamico `e tuttavia una condizione limite che, in pratica, pu` o realizzarsi solo con un certo grado di approssimazione. Sia i plasmi astrofisici che i plasmi di laboratorio che vengono comunemente osservati nella pratica spettroscopica devono –per il fatto stesso di essere osservabili– emettere radiazione verso l’ambiente esterno, il che comporta necessariamente una situazione di non-equilibrio, almeno per gli strati pi` u esterni del plasma stesso. In tali situazioni, il concetto di temperatura perde significato, cos`ı come tutte le leggi di equilibrio termodinamico. Considerando ad esempio la distribuzione delle popolazioni di una specie atomica fra i diversi stati di ionizzazione e di eccitazione, essa non pu`o pi` u essere determinata per mezzo della legge di Saha-Boltzmann ma deve invece essere determinata risolvendo le equazioni dell’equilibrio statistico. In linea di principio ci si deve quindi anche attendere che in condizioni di non-equilibrio la distribuzione delle velocit`a degli elettroni si discosti dalla distribuzione Maxwelliana. Esiste tuttavia un ampio intervallo di condizioni fisiche nelle quali, malgrado la situazione complessiva di non-equilibrio, la distribuzione delle velocit`a degli elettroni risulta effettivamente Maxwelliana. Questo `e dovuto al fatto che i processi collisionali, che provocano la ridistribuzione di energia cinetica fra i vari elettroni e tendono quindi a stabilire una condizione di equilibrio, risultano molto pi` u efficaci dei processi che si oppongono allo stabilirsi della condizione di equilibrio stessa. I processi del primo tipo sono le collisioni elastiche elettrone-elettrone (e anche le collisioni elastiche elettrone-atomo che sono,
356
CAPITOLO 13
per` o, meno efficaci). I processi del secondo tipo sono invece le collisioni anelastiche elettrone-atomo nelle quali un elettrone cede parte della propria energia cinetica che viene convertita in energia interna (di eccitazione o di ionizzazione) del sistema atomico, oppure le collisioni superelastiche elettrone-atomo nelle quali si verificano i processi inversi (l’elettrone acquista energia cinetica per diseccitazione o ricombinazione dell’atomo). Senza pretendere di dare una dimostrazione rigorosa di questo fatto, ci limitiamo qui a sviluppare delle considerazioni di ordine di grandezza mostrando che, in generale, i tempi liberi medi che intercorrono fra due successivi processi del primo tipo sono di gran lunga pi` u brevi dei tempi liberi medi relativi ai processi del secondo tipo. Questo giustifica, anche se in maniera non del tutto rigorosa, che la distribuzione delle velocit`a degli elettroni risulti con buona approssimazione Maxwelliana. Indicando con Ne la densit` a elettronica e con σE la sezione d’urto per collisioni elastiche elettrone-elettrone, il tempo libero medio fra due collisioni elastiche, τE , `e dato da 1 , Ne σE v dove v `e la velocit`a tipica degli elettroni. Analogamente, indicando con N a la densit` a degli atomi e con σA la sezione d’urto per collisioni anelastiche (o superelastiche) elettrone-atomo, il tempo libero medio fra due collisioni di questo tipo `e dato da τE
1 . Na σA v Dalle due formule precedenti si ottiene τA
Na σA τE . τA Ne σE o essere stimata nella seguente maniera. Supponiamo La sezione d’urto σE pu` che un elettrone, di energia cinetica , si avvicini a un altro elettrone a riposo. Si pu` o pensare che i due elettroni subiscano un urto solo se l’elettrone incidente si trovi a passare a una distanza dall’altro elettrone inferiore a un valore critico, bc , dato dall’equazione e20 = . bc In questo caso, infatti, l’energia dovuta alla repulsione Coulombiana diviene confrontabile con l’energia cinetica dell’elettrone e si ha un apprezzabile scambio di energia fra le due particelle. Risolvendo per bc e mediando sulle energie delle particelle si ottiene σE b2c
e40 2
e40 . 2
PLASMI IN CONDIZIONI DI NON-EQUILIBRIO
357
Introduciamo il parametro Te , temperatura cinetica degli elettroni (o temperatura elettronica), attraverso la relazione kB Te . Sostituendo si ottiene, come ordine di grandezza, σE
e40 −6 −2 Te cm2 , 2 T 2 2.8 × 10 kB e
con Te espressa in K. Se consideriamo ad esempio un intervallo di temperatura tipico delle atmosfere stellari (4×103 K < Te < 2×104 K), la sezione d’urto σE varia fra 10−13 e 10−14 cm2 . Il calcolo della sezione d’urto σA `e pi` u complesso e deve essere impostato in base a considerazioni quantistiche. Il risultato `e che, per lo stesso intervallo di temperature, σA `e grosso modo compreso fra 10−21 e 10−22 cm2 . Sempre come stima di ordine di grandezza si ottiene quindi τE Na 10−8 , τA Ne e anche ammettendo di essere in presenza di un plasma debolmente ionizzato con Ne /Na = 10−4 , si ottiene sempre un valore dell’ordine di 10−4 per tale rapporto. Si pu` o quindi concludere che un elettrone subisce un elevatissimo numero di collisioni elastiche prima di subirne una anelastica (o superelastica) e tale collisione non sar` a quindi in grado di alterare apprezzabilmente la distribuzione Maxwelliana delle velocit`a. Le considerazioni svolte ci portano quindi alla conclusione che in un punto assegnato di una tipica atmosfera stellare `e possibile definire in maniera univoca un parametro Te (temperatura cinetica degli elettroni) che caratterizza la distribuzione delle velocit`a degli elettroni. Tale parametro conserva una definizione operativa ben definita, a differenza della temperatura termodinamica T che perde totalmente di significato in condizioni di non-equilibrio.
13.2 Collisioni elettrone-atomo Consideriamo la collisione fra un elettrone di energia cinetica e un atomo di una determinata specie atomica. Se l’atomo si trova, prima della collisione, nel livello energetico |ub , esso potr` a essere eccitato dalla collisione elettronica al livello |ua di energia maggiore1. Affinch´e questo processo possa aver luogo `e 1
Come nel Cap. 11, utilizziamo qui gli indici b e a per denotare rispettivamente il livello “basso” e il livello “alto”.
358
CAPITOLO 13
s 2
4
n 1
3
i Fig. 13.1. Rappresentazione schematica dei processi collisionali che contribuiscono alle equazioni dell’equilibrio statistico di un livello fissato (il livello intermedio della figura). 1) collisioni anelastiche da livelli inferiori; 2) collisioni superelastiche da livelli superiori; 3) collisioni superelastiche verso livelli inferiori; 4) collisioni anelastiche verso livelli superiori.
per` o necessario che valga la relazione ≥ (a −b ). Dopo la collisione, l’elettrone si trova a possedere un’energia cinetica data da = − (a − b ) . Ovviamente `e possibile anche il processo inverso in cui la collisione `e accompagnata dalla diseccitazione atomica dal livello |ua verso il livello |ub . In questo caso, l’energia dell’elettrone collidente `e data, dopo l’urto, da = + (a − b ) . I processi del primo tipo sono detti collisioni anelastiche elettrone-atomo, mentre quelli del secondo tipo sono detti collisioni superelastiche elettrone-atomo (anche se alcuni autori preferiscono parlare di collisioni di prima e di seconda specie, rispettivamente). L’effetto delle collisioni sulle popolazioni atomiche pu`o essere convenientemente descritto per mezzo di equazioni dell’equilibrio statistico, simili a quelle che abbiamo introdotto nel Cap. 11 relativamente all’interazione di un atomo col campo di radiazione. Per la popolazione di un generico livello n, indicando con l’indice i i livelli inferiori (cio`e aventi energia minore) e con l’indice s i livelli superiori (cio`e aventi energia maggiore), l’equazione di evoluzione, in presenza delle sole collisioni, si scrive nella forma dNn (A) (S) (S) (A) = Ni Cin + Ns Csn − Nn Cni − Nn Cns . (13.1) dt s s i i I quattro termini che compaiono in questa equazione sono schematizzati nel (A) (S) diagramma della Fig. 13.1. Le quantit`a Cba e Cab che compaiono in questa
PLASMI IN CONDIZIONI DI NON-EQUILIBRIO
359
equazione prendono il nome di rates collisionali (oppure, in lingua italiana, tassi collisionali) dovute, rispettivamente, alle collisioni anelastiche e alle collisioni superelastiche. Tali quantit`a risultano ovviamente proporzionali alla densit` a delle particelle collidenti e dipendono inoltre dalla distribuzione di velocit`a di tali particelle e da propriet`a atomiche, connesse con le funzioni d’onda dei due livelli fra i quali avviene la transizione. Per collisioni elettroniche, la rate per collisioni anelastiche dal livello b al livello a pu` o essere espressa per mezzo della relativa sezione d’urto attraverso l’equazione ∞ (A) Cba = Ne σba (v) f (v) v dv , v0
dove Ne `e la densit` a degli elettroni, f (v) `e la distribuzione di velocit`a degli elettroni stessi, e σba (v) `e la sezione d’urto per eccitazione collisionale relativa alla velocit`a v. Il limite di integrazione, v0 , `e la velocit`a di soglia al di sotto della quale l’elettrone non `e in grado di eccitare l’atomo dal livello b al livello a. Essa `e data da 1 m v02 = a − b . 2 Analogamente, la rate per collisioni superelastiche `e data da ∞ (S) Cab = Ne σab (v) f (v) v dv , 0
dove σab (v) `e la sezione d’urto per diseccitazione collisionale.
13.3 Le relazioni di Milne-Einstein Quando la distribuzione di velocit` a degli elettroni collidenti `e Maxwelliana, si pu` o dimostrare, attraverso un ragionamento termodinamico, che le due rates collisionali introdotte nel paragrafo precedente sono collegate tra loro da una semplice relazione. Tale ragionamento termodinamico, dovuto a Milne, `e molto simile a quello precedentemente sviluppato da Einstein per determinare le relazioni esistenti fra i coefficienti che intervengono nelle equazioni dell’equilibrio statistico per l’interazione atomo-radiazione (coefficienti di Einstein, si veda il Par. 11.7). Per questa ragione le relazioni che si ottengono sono dette relazioni di Milne o di Milne-Einstein. Si consideri un atomo composto da due soli livelli, a e b, soggetto a collisioni da parte di un plasma di elettroni aventi densit` a Ne . Se il sistema `e in equilibrio termodinamico alla temperatura T , possiamo invocare il cosiddetto principio del bilancio dettagliato per asserire che il numero di transizioni collisionali (dovute agli elettroni) che avvengono fra il livello a e il livello b `e esattamente bilanciato dal numero di transizioni collisionali (anch’esse dovute agli elettroni)
360
CAPITOLO 13
che avvengono fra il livello b e il livello a. In altre parole, all’equilibrio termodinamico la condizione di equilibrio deve valere per qualsiasi processo che contribuisca a popolare o depopolare i livelli atomici indipendentemente dal numero e dalle caratteristiche fisiche dei processi che sono simultaneamente in operazione (processi radiativi, processi collisionali sempre con elettroni, ma fra altre coppie di livelli, processi collisionali con altre specie atomiche, etc.). In caso contrario, infatti, sarebbe possibile costruire una macchina ideale, lavorante in ciclo, che potrebbe produrre lavoro a spese di un’unica sorgente, il che contraddirebbe il secondo principio della termodinamica. Se indichiamo quindi ˜a e N ˜b le popolazioni dei livelli a e b all’equilibrio termodinamico, si deve con N avere, scrivendo l’equazione di evoluzione per la popolazione del livello a, dNa ˜b C (A) − N ˜a C (S) . =N ba ab dt
0=
Risolvendo questa equazione e utilizzando l’equazione di Boltzmann per espri˜ b /N ˜a (Eq. (10.6)), si ottiene, all’equilibrio termodinamico mere il rapporto N alla temperatura T , (S)
Cab
(A) Cba
=
˜b N gb (a −b )/(kB T ) = e . ˜a ga N
D’altra parte, le due rates collisionali dipendono soltanto da fattori atomici e dalla distribuzione delle velocit`a degli elettroni. Il risultato che abbiamo ottenuto per il loro rapporto continua quindi a valere anche quando non si sia all’equilibrio termodinamico, purch´e per` o la distribuzione delle velocit`a degli elettroni sia Maxwelliana. Se siamo in queste condizioni, di gran lunga meno restrittive dell’equilibrio termodinamico, e se indichiamo con Te la temperatura cinetica degli elettroni, si ottiene la relazione di Milne-Einstein (S)
Cab
(A) Cba
=
gb (a −b )/(kB Te ) e . ga
(13.2)
13.4 L’atomo a due livelli in condizioni di non-equilibrio Consideriamo un atomo a due livelli che interagisca con un campo di radiazione avente, alla frequenza ν corrispondente alla transizione, l’intensit` a media Jν . L’atomo sia inoltre soggetto a collisioni con una popolazione di elettroni aventi temperatura cinetica Te . Tenendo conto sia dei processi collisionali (Eq. (13.1)) che dei processi radiativi (Eq. (11.29)), l’equazione dell’equilibrio statistico per la popolazione del livello superiore risulta
PLASMI IN CONDIZIONI DI NON-EQUILIBRIO
361
dNa (S) (A) = −Na (Aab + Bab Jν + Cab ) + Nb (Bba Jν + Cba ) . dt In situazioni stazionarie, risolvendo l’equazione si ottiene (S)
Aab + Bab Jν + Cab Nb = (A) Na Bba Jν + Cba
.
Sostituiamo adesso questo risultato nell’espressione della funzione sorgente data dall’Eq. (11.36). Tenendo conto delle relazioni esistenti fra i coefficienti di Einstein (Eq. (11.27) e (11.28)) e delle relazioni di Milne fra le rates collisionali (Eq. (13.2)), mediante alcuni passaggi algebrici si ottiene Sν =
Jν + ε Bν (Te ) , 1+ε
(13.3)
dove abbiamo introdotto la quantit` a ε definita da (S)
ε=
Cab
1 − e−hν/(kB Te ) Aab
.
A parte un fattore correttivo dell’ordine dell’unit`a, ε rappresenta il rapporto fra numero di diseccitazioni del livello superiore dovute alle collisioni superelastiche e numero di diseccitazioni dovute all’emissione spontanea. L’espressione generale che abbiamo trovato per Sν permette poi di esprimere, invertendo l’Eq. (11.36), il rapporto di popolazioni Nb /Na . Si ottiene Nb gb 2 h ν 3 = + 1 , Na g a c2 S ν ¯ ν (Te ) = Bν (Te )/(2hν 3 ) ovvero, introducendo le quantit` an ¯ ν = Jν c2 /(2hν 3 ) e n che rappresentano, rispettivamente, il numero medio di fotoni per modo alla frequenza ν, e il numero medio di fotoni per modo relativi, alla stessa frequenza, alla radiazione del corpo nero di temperatura Te , Nb 1+ε gb +1 . (13.4) = Na ga n ¯ν + ε n ¯ ν (Te ) Le espressioni trovate (Eq. (13.3) e (13.4)) assumono una forma speciale in tre casi limite di importanza particolare. a) Il primo caso `e quello in cui si ha ε 1. Sostituendo nelle espressioni della funzione sorgente e del rapporto fra le popolazioni si ottiene Sν = Bν (Te ) ,
Nb gb hν/(kB Te ) = e . Na ga
362
CAPITOLO 13
In questo caso le collisioni sono estremamente efficaci e sono in grado di termalizzare alla temperatura cinetica le popolazioni atomiche. Per il rapporto di popolazioni si ottiene l’equazione di Boltzmann (Eq. (10.6)), mentre per la funzione sorgente si ottiene la funzione di Planck, entrambe relative alla temperatura Te . Questo caso limite `e noto come caso dell’equilibrio termodinamico locale (ETL). b) Il secondo caso `e quello in cui ε 1 e, allo stesso tempo, εBν (Te ) Jν . Sostituendo nelle solite equazioni si ottiene Nb gb 1 S ν = Jν , = +1 . Na ga n ¯ν Adesso le collisioni svolgono un ruolo completamente trascurabile e la funzione sorgente non `e altro che la media sull’angolo solido della radiazione incidente. L’atomo si comporta semplicemente come un centro diffusore della radiazione. Per quanto riguarda le popolazioni atomiche, se definiamo una opportuna “temperatura di radiazione” Tr per mezzo dell’equazione n ¯ν =
1 ehν/(kB Tr )
−1
,
si ottiene Nb gb hν/(kB Tr ) = e , Na ga il che mostra che le popolazioni atomiche si mettono in equilibrio con la temperatura della radiazione. Il parametro Tr che abbiamo cos`ı definito `e tuttavia un parametro del tutto ad hoc. Basta pensare infatti che, per un campo di radiazione arbitrario, esiste un valore diverso di Tr per ogni frequenza. c) Il terzo caso infine corrisponde alle disuguaglianze ε 1 e εBν (Te ) Jν . Di nuovo sostituendo si ottiene 1 Nb gb Sν = ε Bν (Te ) , +1 . = Na ga ε n ¯ ν (Te ) Questo `e un caso intermedio in cui, pur essendo le collisioni poco efficaci nel depopolare il livello superiore, la temperatura cinetica `e talmente elevata e il campo di radiazione `e talmente diluito che sono proprio le collisioni (e non i processi radiativi) che contribuiscono a popolare il livello superiore. Le tre situazioni schematiche che abbiamo qui illustrato sono adatte a descrivere, in maniera qualitativa, le condizioni di eccitazione di un atomo che si trovi, rispettivamente, nella fotosfera, nella cromosfera e nella corona solare. Per il caso dei plasmi di laboratorio, le situazione fisiche pi` u comuni sono quelle descritte dal caso a) (plasmi di alta densit`a, tipo lampade a scarica) o dal caso b) (plasmi di bassa densit` a per esperimenti di pompaggio ottico con laser).
Capitolo 14
Trasporto radiativo La radiazione che si propaga in un mezzo esteso `e soggetta a continui processi di emissione e di assorbimento che ne modificano l’intensit` a e la distribuzione spettrale. Tali fenomeni sono regolati dall’equazione del trasporto radiativo che abbiamo formalmente dedotto nel Cap. 11 a partire dai principi dell’Elettrodinamica Quantistica. Risolvendo questa equazione, `e possibile mettere in relazione le propriet`a osservate della radiazione emergente da un mezzo esteso con le propriet`a intrinseche del plasma responsabile della sua emissione. In questo capitolo affronteremo tale problematica analizzando in dettaglio il caso prototipo per il quale la teoria del trasporto radiativo `e stata sviluppata, ovvero il caso delle atmosfere stellari. Le considerazioni qui svolte possono essere facilmente estese per trattare problemi specifici che si incontrano nell’analisi della propagazione della radiazione in ambienti non astrofisici, quali ad esempio i plasmi di laboratorio o l’atmosfera terrestre.
14.1 Soluzione formale dell’equazione del trasporto radiativo Nel Par. 11.8 abbiamo visto che l’equazione del trasporto radiativo per l’intensit` a del campo di radiazione che si propaga, alla frequenza ν e lungo la all’interno di un plasma, assume la forma (Eq. (11.32)) direzione Ω d = −kν [Iν (Ω) − Sν ] , Iν (Ω) ds kν `e il coefficiente dove s `e la coordinata spaziale misurata lungo la direzione Ω, di assorbimento (corretto per l’emissione stimolata) e Sν `e la funzione sorgente. In generale, kν e Sν sono funzione del punto e, se si suppone che tali quantit` a siano note, l’equazione del trasporto pu`o essere facilmente risolta. Introduciamo, in luogo della coordinata geometrica s, la cosiddetta profondit`a ottica specifica (funzione di ν), attraverso l’equazione dτν = −kν ds . Come mostra l’equazione, la profondit`a ottica `e definita in direzione opposta a quella di propagazione della radiazione, il che riflette il punto di vista di un osservatore che riceve la radiazione nel proprio strumento. Considerando il plasma contenuto entro uno spessore geometrico fissato, ad esempio fra i punti
364
CAPITOLO 14
τν(1) τν τν(2)
O
s2
P2
P
P1
A
s s1 Fig. 14.1. La radiazione si propaga nella direzione che va dal punto P 2 al punto P1 . La coordinata spaziale `e misurata a partire dal punto O mentre la profondit` a ottica ` e misurata a partire dal punto A nella direzione contraria alla propagazione.
P1 e P2 della Fig. 14.1, caratterizzati dalle coordinate s1 e s2 (con s1 > s2 ), lo spessore ottico risulta, per semplice integrazione dell’equazione precedente
s1
τν (P1 , P2 ) =
kν (s) ds . s2
Lo spessore ottico dipende dalla frequenza e uno spessore geometrico fissato si definisce otticamente sottile quando τν 1 oppure otticamente spesso quando τν 1. In termini fisici, un mezzo `e otticamente sottile alla frequenza ν quando un fotone di quella frequenza ha una probabilit` a trascurabile di essere assorbito nell’attraversarlo. Viceversa, se il mezzo `e otticamente spesso, il fotone ha una probabilit` a praticamente uguale a uno di essere assorbito nel mezzo stesso. possiamo semplificare le notazioni omettendo tale Fissata una direzione Ω, argomento nella notazione per l’intensit`a. Dividendo l’equazione del trasporto per kν e cambiando di segno, si ottiene dIν = Iν − Sν . dτν Per risolvere questa equazione moltiplichiamo ambo i membri per il fattore e−τν . Si ottiene e−τν
dIν = e−τν Iν − e−τν Sν , dτν
ovvero d −τν e Iν = − e−τν Sν . dτν
365
TRASPORTO RADIATIVO
Facendo riferimento alla Fig.14.1, integriamo questa equazione fra i punti P2 e P1 del cammino percorso dal raggio ai quali corrispondono le profondit` a ottiche (1) (2) (1) (2) τν e τν , con τν < τν . Si ottiene e
−τν(1)
Iν τν(1)
−e
−τν(2)
Iν τν(2)
=−
τν(1) (2)
Sν (τν ) e−τν dτν ,
τν
ovvero (2) (1) Iν τν(1) = Iν τν(2) e− τν −τν +
τν(2) (1)
Sν (τν ) e−
τν −τν(1)
dτν .
(14.1)
τν
Questo risultato si interpreta facilmente osservando che l’intensit`a nel punto P1 `e data dall’intensit` a presente nel punto P2 (la condizione al contorno) moltiplicata per il fattore di attenuazione dovuto all’assorbimento fra i punti P2 e P1 , alla quale si aggiunge il contributo dovuto all’emissione nell’intervallo compreso fra i due punti. Il contributo relativo all’intervallo infinitesimo dτν , situato nell’intorno del punto generico P, `e moltiplicato per il relativo fattore di attenuazione dovuto all’assorbimento fra i punti P e P1 . In particolare, se (1) si considera la radiazione emergente da un plasma e si pone quindi τν = 0, l’equazione precedente si pu`o anche porre nella forma τν Iν (0) = Iν (τν ) e−τν + Sν (τν ) e−τν dτν . 0
In molti casi, soprattutto in astrofisica, si ha a che fare con plasmi che risultano praticamente infiniti in una direzione (si pensi ad esempio a un’atmosfera stellare della quale interessi esprimere l’intensit` a emergente in funzione delle propriet` a locali dell’atmosfera stessa). In tali casi, si deve considerare il limite dell’equazione precedente per τν → ∞, e, supponendo matematicamente che si abbia lim Iν (τν ) e−τν = 0 ,
τν →∞
si ottiene Iν (0) =
∞
Sν (τν ) e−τν dτν .
(14.2)
0
Il limite matematico di cui sopra `e sempre soddisfatto in pratica perch´e, nel caso opposto, si troverebbe il risultato assurdo che l’intensit` a emergente dal mezzo assume un valore infinito. L’equazione (14.2) esprime in tutta generalit`a l’intensit` a emergente da un mezzo semi-infinito, ovvero da un mezzo indefinito nella direzione opposta a quella sotto la quale si riceve la radiazione. Essa `e alla base dell’interpretazione quantitativa degli spettri stellari.
366
CAPITOLO 14
14.2 Trasporto radiativo nelle atmosfere stellari Per determinare l’intensit` a specifica del campo di radiazione emesso da un’atmosfera stellare vengono spesso introdotte un certo numero di approssimazioni che servono a semplificare il problema e a renderlo trattabile dal punto di vista matematico in modo da ottenere alcuni risultati analitici validi come approssimazione di ordine zero. La prima di tali approssimazioni `e quella detta dell’atmosfera piana che consiste nel trascurare la curvatura degli strati superficiali della stella dovuta alla forma sferica della stella stessa. Tale approssimazione `e in generale ben giustificata in quanto lo spessore dell’atmosfera (definita come lo strato superficiale dal quale proviene la radiazione osservata) `e molto minore del raggio della stella. Per il Sole, ad esempio, lo spessore H `e minore o dell’ordine di un migliaio di km, per cui si ha (R rappresenta il raggio solare) H 103 km 1.4 × 10−3 . ≤ R 7 × 105 km Si suppone poi che le propriet` a fisiche dell’atmosfera dipendano soltanto dalla quota z (misurata da un’origine che non `e necessario per il momento specificare) e non anche dalle altre due coordinate x e y. Il campo di radiazione, che in situazioni stazionarie dipende, oltre che dalla frequenza, dal punto P e dalla viene cos`ı a dipendere unicamente dalla quota z e dall’angolo θ direzione Ω, (detto angolo eliocentrico nel caso del Sole), definito come in Fig. 14.2. Quando si introduce questa ulteriore approssimazione si dice che si ha a che fare con un’atmosfera piano-parallela. Indicando con Iν (z, μ) l’intensit` a specifica della radiazione che si propaga nella direzione individuata dall’angolo θ (con μ = cosθ), l’equazione del trasporto risulta d Iν (z, μ) = −kν [Iν (z, μ) − Sν ] , dz e, se si suppone valida l’ipotesi dell’Equilibrio Termodinamico Locale (ETL), μ
d Iν (z, μ) = −kν [Iν (z, μ) − Bν (T )] , dz dove Bν (T ) `e la funzione di Planck che dipende solo dalla temperatura locale. L’equazione del trasporto pu`o essere formalmente risolta introducendo la profondit` a ottica specifica, tν , misurata lungo la verticale nel senso delle profondit` a crescenti (si noti che questa quantit` a differisce da quella definita col simbolo τν nel paragrafo precedente e che si riferisce alla profondit`a ottica misurata lungo un raggio generico). Ponendo μ
dtν = −kν dz ,
367
TRASPORTO RADIATIVO
z
Ω
θ
Fig. 14.2. Schematizzazione di un’atmosfera piano-parallela nella quale le propriet` a fisiche dipendono solo dalla quota z e il campo di radiazione da z e dall’angolo θ.
e utilizzando i risultati del paragrafo precedente si ha, per l’intensit` a emergente ∞ dtν . (14.3) Iν (0, μ) = Bν (T ) e−tν /μ μ 0 Questa espressione pu`o essere convenientemente approssimata al fine di dedurre alcuni risultati di tipo qualitativo. Se si suppone ad esempio che la funzione di Planck abbia un andamento lineare con tν , ovvero che valga un’espressione del tipo Bν (tν ) = aν + bν tν , si ottiene, con facili integrazioni Iν (0, μ) = aν + bν μ = Bν (tν = μ) . La cosiddetta approssimazione di Eddington-Barbier consiste nel supporre che questa identit` a, rigorosamente valida nel caso di una funzione di Planck lineare con tν , sia valida in generale. Si ha quindi, in questa approssimazione Iν (0, μ) Bν (tν = μ) . Se si pensa che la temperatura nell’atmosfera stellare sia un’assegnata funzione della quota geometrica z, ovvero che sia descritta da una funzione del tipo T = T (z), per determinare l’intensit` a emergente attraverso l’approssimazione di Eddington-Barbier `e sufficiente calcolare la quota z˜ alla quale si ha tν = μ e si ottiene Iν (0, μ) Bν [T (˜ z)] .
368
CAPITOLO 14
Poich´e in generale nelle atmosfere stellari la temperatura decresce con z, ci si devono attendere due fenomeni diversi: a) Fissata la frequenza, l’intensit` a emessa dalla stella `e maggiore al centro (μ = 1) che non al bordo (μ → 0). Questo fenomeno, che prende il nome di oscuramento al bordo, `e osservabile soltanto sul Sole (in quanto `e impossibile con le tecnologie attuali risolvere spazialmente la radiazione proveniente dalle stelle). In ultima analisi, tale fenomeno `e dovuto al fatto che, osservando al centro del Sole, si riesce a penetrare pi` u in profondit` a entro l’atmosfera solare. Osservando al bordo, invece, si vedono gli strati pi` u superficiali che sono anche pi` u freddi (e quindi meno luminosi). b) Fissato μ, poich`e il coefficiente di assorbimento `e funzione della frequenza, si ottiene un’intensit` a minore a quelle frequenze per le quali il coefficiente di assorbimento `e pi` u elevato e un’intensit`a maggiore alle frequenze per le quali il coefficiente di assorbimento `e pi` u basso. Ovviamente, “minore” e “maggiore” vanno qui intesi in senso relativo, ovvero rispetto a una funzione di Planck “media” non meglio specificata. In altre parole, si pu` o pensare che uno spettro stellare sia costituito da una funzione di Planck “modulata” con una tendenza all’aumento alle frequenze dove il coefficiente di assorbimento `e basso e una tendenza alla diminuzione dove il coefficiente di assorbimento `e alto. In questo modo si spiegano facilmente le discontinuit`a del continuo che si osservano ai limiti delle serie (tipica l’improvvisa diminuzione del continuo a lunghezze d’onda minori di 3647 ˚ A, la cosiddetta discontinuit` a di Balmer). Analogamente, se si considera un intervallo di frequenza centrato intorno a una riga spettrale, il coefficiente di assorbimento ha qui una variazione rapida, passando da un valore molto elevato al centro della riga a un valore molto minore nelle ali della riga stessa. Questo spiega, qualitativamente, la presenza di righe di assorbimento negli spettri stellari e induce a ritenere che, nei casi in cui si osservino righe di emissione, la temperatura debba invece avere un andamento crescente con la quota (cromosfere stellari). Per quanto riguarda le stelle, come abbiamo detto, non `e possibile effettuare osservazioni dell’andamento dell’intensit` a in funzione di μ. Quello che si osserva `e invece l’intensit` a media della radiazione sul disco stellare, I¯ν , definita da (si veda la Fig. 14.3), con R∗ raggio stellare πR∗2 I¯ν
=
π/2
2π
dφ Iν (0, θ) R∗2 cosθ sinθ ,
dθ 0
0
ovvero I¯ν (0) = 2
1
Iν (0, μ) μ dμ . 0
Sostituendo in questa equazione la soluzione formale trovata precedentemente, e invertendo l’ordine delle integrazioni, si ottiene
369
TRASPORTO RADIATIVO
θ R*
all’osservatore
θ
Fig. 14.3. La radiazione emessa dall’elemento di superficie stellare individuato dall’angolo al centro θ ` e inclinata dello stesso angolo rispetto alla verticale.
∞
I¯ν (0) = 2
1
dtν Bν (T ) 0
e−tν /μ dμ .
0
L’integrale in dμ pu` o essere espresso in termini di funzioni note. Attraverso la sostituzione w = 1/μ si ha
1
e
−tν /μ
dμ =
0
1
∞
e−w tν
1 dw . w2
Ricordando la definizione delle funzioni integro-esponenziali ∞ −xt e dt , (n ≥ 1) , En (x) = tn 1
(14.4)
si ottiene
1
e−tν /μ dμ = E2 (tν ) ,
0
per cui I¯ν = 2
∞
Bν (T ) E2 (tν ) dtν .
(14.5)
0
L’analogo dell’approssimazione di Eddington-Barbier si ottiene supponendo che Bν (T ) sia una funzione lineare di tν . In questo caso, tenendo conto che ∞ ∞ 1 1 , , En (x) dx = x En (x) dx = n n + 1 0 0
370
CAPITOLO 14
si ottiene I¯ν = Bν (tν = 23 ) . L’approssimazione di Eddington-Barbier per l’intensit` a media emessa da un’atmosfera stellare risulta quindi I¯ν Bν (tν = 23 ) .
14.3 Il modello di atmosfera grigia Consideriamo un’atmosfera piano-parallela in equilibrio termodinamico locale. Come mostrato dalle Eq. (14.3) e (14.5), l’intensit`a emergente pu` o essere espressa attraverso un integrale che implica la conoscenza della funzione di Planck (ovvero della temperatura) alle diverse profondit`a ottiche. Quando si conosce l’andamento con la profondit` a della temperatura e, eventualmente, delle altre grandezze fisiche (quali ad esempio la pressione), si dice che si dispone di un “modello di atmosfera stellare”. Si possono costruire modelli di atmosfera pi` u o meno sofisticati, a seconda della quantit` a di informazioni fisiche che si introducono nella descrizione dell’atmosfera stessa. Il pi` u semplice di tali modelli, e anche il primo dal punto di vista storico, `e il cosiddetto modello dell’atmosfera grigia. In tale modello si considera, come punto di partenza, un’atmosfera piano-parallela in equilibrio termodinamico locale e in equilibrio radiativo. Riguardo a quest’ultimo concetto bisogna osservare che l’energia pu`o fluire attraverso un’atmosfera stellare per mezzo di tre meccanismi fisici distinti, irraggiamento, convezione, e conduzione, il terzo essendo in molti casi tarscurabile. Un’atmosfera stellare si dice in equilibrio radiativo quando l’energia fluisce solo per irraggiamento. Consideriamo una quota assegnata, z, nell’atmosfera stellare. L’energia netta che fluisce per unit`a di tempo, attraverso l’unit` a di superficie, alla frequenza ν, `e data da Fν (z) = 2π
1
−1
μ Iν (z, μ) dμ .
La quantit` a Fν (z) viene detta flusso monocromatico. Ad essa contribuisce la radiazione proveniente dall’interno col segno positivo (μ > 0) e quella proveniente dall’esterno col segno negativo (μ < 0). In particolare, il flusso monocromatico alla superficie `e connesso alla quantit` a I¯ν , introdotta precedentemente, dalla relazione Fν (0) = π I¯ν .
371
TRASPORTO RADIATIVO
La condizione dell’equilibrio radiativo implica che l’integrale del flusso monocromatico su tutte le frequenze sia costante, cio`e indipendente da z. In formule, definendo il flusso totale F attraverso l’equazione
∞
F =
Fν dν = 2π 0
∞
1
dν −1
0
μ Iν (z, μ) dμ ,
(14.6)
l’ipotesi dell’equilibrio radiativo implica dF =0 . dz Il valore di F viene in genere parametrizzato attraverso la temperatura efficace (o effettiva), Teff , definita dalla relazione (si veda l’Eq. (10.10)) 4 , F = σ Teff
dove σ `e la costante di Stefan-Boltzmann. Essa rappresenta la temperatura che dovrebbe avere un corpo nero per irradiare lo stesso flusso della stella. Il flusso `e anche connesso alla luminosit`a, L∗ , e al raggio, R∗ , della stella attraverso la relazione F =
L∗ . 4π R∗2
Nel caso del Sole, ad esempio, per cui L = 3.845 × 1033 erg s−1 ,
R = 6.9626 × 1010 cm ,
si ha F = 6.312 × 1010 erg cm−2 s−1 ,
Teff = 5776 K .
L’ulteriore ipotesi che viene introdotta nel modello dell’atmosfera grigia (che ne giustifica il nome) `e quella di assumere il coefficiente di assorbimento kν indipendente dalla frequenza. Questa ipotesi semplifica notevolmente il problema dal punto di vista matematico ma non `e affatto realistica dal punto di vista fisico. Ovviamente il modello che cos`ı si ottiene deve essere considerato come una sorta di modello di ordine zero per una vera e propria atmosfera stellare. Nell’atmosfera grigia si pu` o definire, in luogo della profondit` a ottica specifica, tν , una profondit` a ottica “universale”, t, e l’equazione del trasporto si scrive d Iν (t, μ) = Iν (t, μ) − Bν (t) . dt Integrando l’equazione del trasporto in dν e definendo ∞ ∞ Iν (t, μ) dν , B(t) = Bν (t) dν , I(t, μ) = μ
0
0
372
CAPITOLO 14
si ottiene μ
d I(t, μ) = I(t, μ) − B(t) . dt
Come si vede, l’ipotesi del coefficiente di assorbimento indipendente dalla frequenza permette di scrivere un’unica equazione del trasporto per le quantit` a integrate in frequenza. Questa `e la semplificazione fondamentale dell’atmosfera grigia. A partire dalla I(t, μ) si possono definire i relativi momenti integrando sulle direzioni. Il momento di ordine n, Mn (t) `e definito da Mn (t) =
1 4π
" μn I(t, μ) dΩ =
1 2
1
μn I(t, μ) dμ . −1
Il momento di ordine zero `e l’intensit` a media (sulle direzioni) del campo di radiazione ed `e indicato col simbolo J(t) J(t) = M0 (t) =
1 2
1
I(t, μ) dμ .
(14.7)
−1
Il momento di ordine uno `e proporzionale al flusso di energia raggiante. Infatti si ha, ricordando l’Eq. (14.6) F (t) = 4π M1 (τ ) = 2π
1
μ I(t, μ) dμ . −1
Infine il momento di ordine due `e proporzionale alla pressione di radiazione ed `e indicato col simbolo K(t) K(t) = M2 (t) =
1 2
1
μ2 I(t, μ) dμ . −1
Integrando in dμ l’equazione del trasporto divisa per 2, si ottiene 1 dF (t) = J(t) − B(t) , 4π dt e sfruttando l’ipotesi dell’equilibrio radiativo (F = cost.) si ha J(t) = B(t) .
(14.8)
Moltiplicando poi l’equazione del trasporto per μ/2 e integrando in dμ si ha dK(t) F = , dt 4π che risolta d` a
373
TRASPORTO RADIATIVO
K(t) =
Ft +C , 4π
dove C `e una costante da determinare attraverso le condizioni al contorno. Osserviamo che per t → ∞, ovvero alla base dell’atmosfera, dobbiamo aspettarci che il campo di radiazione tenda a divenire isotropo. Sotto questa ipotesi, e anche sotto l’ipotesi meno restrittiva che la dipendenza da μ dell’intensit` a possa essere rappresentata da una funzione lineare del tipo I(t, μ) = a(t) + b(t) μ , con a(t) e b(t) indipendenti da μ, le quantit` a J e K possono essere collegare fra loro, avendosi K(t) =
1 3
J(t) .
Se si suppone che questa relazione sia valida per qualsiasi valore di t (e non solo per t → ∞) si adotta la cosiddetta approssimazione di Eddington con la quale il problema dell’atmosfera grigia pu` o essere risolto analiticamente. Infatti, attraverso le relazioni trovate precedentemente si ha 3 F t + C , 4π
B(t) = J(t) = 3K(t) =
con C = 3 C. Per determinare la costante C sfruttiamo le condizioni al contorno relative alla superficie della stella (t = 0). Se la stella `e isolata (cio`e se non appartiene a un sistema doppio o multiplo), il flusso alla superficie si pu` o calcolare attraverso l’equazione (ottenuta per mezzo della soluzione formale dell’equazione del trasporto)
1
F = 2π
μ I(0, μ) dμ = 2π 0
1
dμ μ 0
∞
B(t) e−t/μ
0
dt . μ
Sostituendo l’espressione per B(t) e svolgendo il calcolo si ottiene facilmente C =
F , 2π
dimodoch´e si ha per B(t) B(t) =
3F t + 23 . 4π
Ricordando infine che B(t) =
σ 4 T (t) , π
4 F = σ Teff ,
374
CAPITOLO 14
Fig. 14.4. Confronto fra la legge dell’oscuramento al bordo relativa all’atmosfera grigia (linea continua) e i valori solari osservati (punti).
si ottiene l’andamento della temperatura con t per l’atmosfera grigia (nell’approssimazione di Eddington) T (t) = Teff
, 4 3 4
t+
2 3
.
(14.9)
In particolare si vede che alla superficie dell’atmosfera si ha T (0) = 0.841 Teff , e che, per t = 23 , si ottiene T = Teff . Dall’espressione di B(t) si pu` o anche determinare l’andamento centro-lembo dell’intensit` a emergente dalla stella. Si ha infatti I(0, μ) = 0
∞
3F dt 3F t + 23 e−t/μ = μ + 23 . 4π μ 4π
Definendo il rapporto di oscuramento al lembo, r(μ), attraverso l’equazione r(μ) =
I(0, μ) , I(0, 1)
r(μ) =
3μ + 2 . 5
si ottiene
375
TRASPORTO RADIATIVO
Questa legge di oscuramento al bordo pu` o essere confrontata coi risultati osservativi disponibili per il Sole. La differenza fra il valore di r(μ) teorico e quello osservato si mantiene sempre al di sotto del 5% (si veda la Fig. 14.4).
14.4 L’equazione di Hopf Il problema dell’atmosfera grigia pu` o essere risolto esattamente dal punto di vista matematico, sebbene la soluzione comporti la necessit`a di dover risolvere numericamente un’equazione integrale. La soluzione esatta si ottiene scrivendo la funzione B(t) nella forma 3F [ t + q(t) ] , 4π
B(t) =
(14.10)
dove q(t) `e un’opportuna funzione, detta funzione di Hopf, per la quale dobbiamo attenderci una leggera variazione intorno al valore 23 che risulta dall’approssimazione di Eddington. Fissiamo un determinato valore di t nell’atmosfera ed esprimiamo l’intensit` a del campo di radiazione per raggi che si propagano verso l’alto e verso il basso. Ricordando la soluzione formale dell’equazione del trasporto (Eq. (14.1)), si ha
∞
dt , μ t t dt , I(t, μ) = B(t ) e−(t−t )/(−μ) −μ 0 I(t, μ) =
B(t ) e−(t −t)/μ
(μ > 0) , (μ < 0) .
Per mezzo di queste espressioni si pu`o trovare il valore medio dell’intensit` a del campo di radiazione sull’angolo solido, J(t), definito nell’Eq. (14.7). Ricordando inoltre che nell’atmosfera grigia B(t) = J(t) (si veda l’Eq. (14.8)), si ottiene
1 B(t) = 2
1
dμ
∞
B(t ) e
−(t −t)/μ
t
0
dt + μ
t −(t−t )/(−μ) dt . dμ B(t ) e −μ −1 0 0
Questa equazione pu`o essere trasformata scambiando l’ordine delle integrazioni ed eseguendo la sostituzione w = 1/μ nel primo integrale e w = −1/μ nel secondo integrale. Si perviene cos`ı alla relazione
1 B(t) = 2
∞
∞
dt B(t ) t
e 1
−w(t −t)
dw + w
t
dt B(t ) 0
∞
e 1
−w(t−t )
dw w
,
376
CAPITOLO 14
t
q(t)
t
q(t)
t
q(t)
0. 0.01 0.03 0.05 0.1 0.2
0.577 0.588 0.601 0.611 0.628 0.650
0.3 0.4 0.5 0.6 0.8 1.0
0.663 0.673 0.680 0.686 0.694 0.699
1.5 2.0 2.5 3.0 5.0 ∞
0.705 0.708 0.709 0.710 0.710 0.710
Tab. 14.1. Valori della funzione di Hopf, q(t), a diversi t.
dalla quale, ricordando la definizione delle funzioni integro-esponenziali data nell’Eq. (14.4), si ottiene 1 ∞ B(t) = B(t ) E1 (|t − t |) dt . 2 0 Introducendo adesso la funzione di Hopf attraverso l’Eq. (14.10), si trova la seguente equazione integrale, detta equazione di Hopf 1 ∞ t + q(t) = [t + q(t )] E1 (|t − t |) dt . 2 0 L’equazione pu`o essere risolta numericamente per dare i risultati contenuti nella Tab. 14.1. Come si vede, la funzione di Hopf `e monotona e cresce dal valore 0.577 per t = 0 fino al valore 0.710 per t → ∞. Essa differisce molto poco dal valore approssimato, pari a 23 , risultante dall’approssimazione di Eddington. Attraverso la funzione di Hopf si pu` o esprimere la soluzione esatta per la funzione T (t) nell’atmosfera grigia. Ripetendo i ragionamenti che hanno portato all’Eq. (14.9) si trova facilmente che tale equazione deve essere sostituita dalla seguente , T (t) = Teff 4 34 [t + q(t)] . Questa funzione `e riportata in grafico nella Fig. 14.5 (curva continua) insieme alla funzione dell’Eq. (14.9) ottenuta nell’approssimazione di Eddington (curva tratteggiata). Le due curve differiscono di molto poco con una variazione percentuale massima pari al 3.5% a t = 0.
14.5 Modelli realistici di atmosfere stellari Il modello dell’atmosfera grigia che abbiamo sviluppato nei due paragrafi precedenti costituisce un’approssimazione grossolana delle atmosfere stellari in
TRASPORTO RADIATIVO
377
Fig. 14.5. Andamento della temperatura in funzione di t in un’atmosfera grigia. La linea continua ` e la soluzione esatta mentre la linea punteggiata `e la soluzione ottenuta per mezzo dell’approssimazione di Eddington.
quanto il coefficiente di assorbimento `e in realt` a una funzione variabile della frequenza e pu` o essere supposto costante soltanto in intervalli di frequenza estremamente ridotti. Il vantaggio del modello dell’atmosfera grigia `e unicamente quello di fornire un’approssimazione analitica (o semi-analitica) della struttura fisica dell’atmosfera. Da questo punto di vista esso pu`o essere paragonato ai modelli politropici degli interni stellari. Con l’avvento dei moderni elaboratori elettronici `e stato possibile, a partire dalla fine degli anni 1950, costruire dei modelli pi` u realistici delle atmosfere stellari. Tali modelli implicano la soluzione autoconsistente di un insieme di equazioni differenziali e sono basati, in generale, sulla solita approssimazione dell’atmosfera piano-parallela in equilibrio termodinamico locale. Accanto all’equazione del trasporto radiativo per l’intensit` a specifica μ
d Iν (z, μ) = −kν [Iν (z, μ) − Bν (z)] , dz
si considerano l’equazione dell’equilibrio radiativo, l’equazione dell’equilibrio idrostatico e l’equazione di stato dei gas perfetti, ovvero ∞ 1 dF d = dν 2π μ Iν (z, μ) dμ = 0 , dz dz 0 −1 ρ dP kB T . = −ρ g , P = dz μ ¯ mH
378
CAPITOLO 14
In queste equazioni, P `e la pressione del gas atmosferico, ρ `e la sua densit`a, g `e la gravit` a alla superficie della stella, μ ¯ `e il peso molecolare medio e m H `e l’unit`a di peso atomico. Considerando P e T come variabili indipendenti, e supponendo di conoscere le relazioni che collegano kν e μ ¯ a P e T (si veda il paragrafo successivo per l’espressione di kν in funzione di queste due variabili), le equazioni possono essere risolte numericamente tenendo conto delle opportune condizioni al contorno. Tali condizioni sono le seguenti 4 F = σ Teff ,
che fissa l’entit` a del flusso radiativo; Iν (0, μ < 0) = 0 , che traduce il fatto che la stella `e isolata e quindi non illuminata dall’esterno. Dalla soluzione delle equazioni si ricava il modello dell’atmosfera stellare, ovvero una tabella di numeri che danno l’andamento delle due funzioni P (z) e T (z). Il modello viene a dipendere esplicitamente da tre soli parametri, ovvero dalla temperatura efficace Teff , dalla gravit` a superficiale g e da un insieme di numeri {Ai } che stabiliscono le abbondanze chimiche relative dei vari elementi. La dipendenza da quest’ultimo parametro `e contenuta nelle funzioni kν (P, T ) eμ ¯(P, T ).
14.6 Lo spettro continuo Per l’analisi degli spettri stellari `e spesso necessario calcolare, in funzione della frequenza, il valore dell’intensit` a specifica che emerge da un’atmosfera stellare descritta da un adeguato modello teorico 1. Assegnate le funzioni P (z) e T (z) si tratta quindi di valutare degli integrali della forma di quelli delle Eq. (14.3) e (14.5). La difficolt` a maggiore del calcolo consiste nell’esprimere la relazione esistente fra tν e la quota, ovvero nel trovare la funzione tν = tν (z) . Poich´e, d’altra parte, questa relazione deriva dall’integrazione dell’equazione differenziale dtν = −kν (z) dz , 1
Nel caso solare, data la notevole vicinanza e la possibilit` a di eseguire osservazioni molto dettagliate, sono anche disponibili opportuni modelli empirici. In tali modelli si tiene esplicitamente conto del fatto che l’atmosfera non `e rigorosamente in equilibrio radiativo. Per un approfondimento si veda E. Landi Degl’Innocenti, Fisica Solare, Springer-Verlag Italia, Milano, 2008.
TRASPORTO RADIATIVO
379
il problema `e ricondotto, in ultima analisi, a trovare l’espressione del coefficiente di assorbimento, kν , per una quota z assegnata. Nelle zone dello spettro nelle quali non sono presenti righe spettrali, il coefficiente d’assorbimento (detto anche, in astrofisica, opacit`a) `e dovuto ai soli processi fisici del tipo legato-libero e libero-libero, oltre ai processi di diffusione. Quelli che contribuiscono maggiormente all’opacit` a nelle atmosfere stellari sono i seguenti: a) fotoionizzazione dell’atomo di Idrogeno; un atomo di Idrogeno che si trova in un livello legato assorbe un fotone e viene cos`ı ionizzato. Un tale processo pu` o essere schematizzato come una “reazione” del tipo H + hν → H+ + e− ; b) transizioni libero-libero fra stati a energia positiva dell’atomo di Idrogeno, cio`e processi di Bremsstrahlung inversa: H+ + e− + hν → H+ + e− ; c) fotoionizzazione dello ione negativo di Idrogeno: H− + hν → H + e− ; d) processi di tipo a) e b) per atomi di Elio e altri elementi relativamente abbondanti nelle atmosfere stellari (O, C, N, Si, Mg, Ne, Fe, etc.); e) diffusione Thomson su elettroni liberi e diffusione Rayleigh su atomi o ioni. Il contributo al coefficiente di assorbimento relativo a ciascun processo pu` o essere calcolato attraverso i metodi generali descritti nel Par. 11.9, con l’eccezione dei processi relativi al punto e) per i quali si possono utilizzare i risultati classici del Cap. 3. Senza analizzare in dettaglio tutti i processi elencati, ci limitiamo a considerare esplicitamente solo il contributo al coefficiente d’assorbimento dovuto allo ione H− che pu` o essere considerato come il prototipo dei vari processi e che in ogni caso risulta il pi` u importante per l’atmosfera del Sole e delle stelle di tipo solare. Come abbiamo gi` a osservato nel Par. 7.5, un atomo di Idrogeno e un elettrone libero possono, per cos`ı dire, “combinare” per dare uno ione negativo stabile avente un’energia di legame dell’ordine di 0.75 eV. Lo stato che ne deriva, in analogia allo stato fondamentale dell’Elio, `e uno stato del tipo 1s2 1S0 . La stabilit` a di questo ione fu prevista teoricamente da Bethe nel 1929 mediante un calcolo variazionale simile a quello descritto nel Par. 7.5 ma contenente un maggior numero di parametri liberi. Il valore attualmente accettato per l’energia di legame dello ione H− `e pari a 0.75416 eV. Un fotone avente lunghezza d’onda inferiore al valore di soglia di 1.6438 μm `e in grado di ionizzare lo ione H− e il relativo coefficiente di assorbimento `e dato dall’Eq. (11.34), ovvero kν(a) = σν NH− , a degli ioni H− (numero di ioni per unit` a di volume) e σν dove NH− `e la densit` `e la sezione d’urto del processo. Il calcolo teorico della sezione d’urto implica, come abbiamo visto, la valutazione dell’elemento di matrice di dipolo fra gli stati iniziali e finali della transizione e questo, a sua volta, implica la conoscenza delle autofunzioni dello stato legato e degli stati liberi dello ione H− . I calcoli
380
CAPITOLO 14
Fig. 14.6. Sezione d’urto per fotoionizzazione dello ione negativo dell’atomo di Idrogeno. La sezione d’urto `e in unit` a di a20 , mentre la lunghezza d’onda `e espressa in μm.
dettagliati, eseguiti da Chandrasekhar e collaboratori negli anni 1950, danno per σν i valori riportati nella Fig. 14.6. La sezione d’urto presenta un massimo intorno a 8500 ˚ A (dove vale circa 1.4 a20 , essendo a0 il raggio della prima orbita di Bohr) e risulta di poco inferiore a tale valore in tutta la regione dello spettro visibile (la regione dove l’intensit` a del campo di radiazione `e massima per stelle di tipo solare). Noto σν , il problema di trovare il valore del coefficiente di assorbimento si riconduce al problema di determinare la densit` a degli ioni H− in un punto dell’atmosfera caratterizzato da valori assegnati di P e di T . Questo `e, a sua volta, un problema molto generale che, come vedremo, coinvolge l’equilibrio di ionizzazione di tutti gli elementi presenti nell’atmosfera stessa. Il calcolo dettagliato, sviluppato nel seguito, pu` o essere considerato come un esempio caratteristico di calcoli analoghi che devono essere effettuati per determinare le densit` a di tutte le specie chimiche presenti in un’atmosfera stellare. Supponiamo di conoscere le abbondanze relative di tutti gli elementi rispetto all’Idrogeno e indichiamo tali abbondanze con il simbolo AHe per l’Elio, e con AMi per il generico elemento caratterizzato dall’indice i. Se si suppone inoltre, per semplicit` a, che nell’atmosfera il grado di ionizzazione massimo dell’Elio e di tutti gli altri elementi sia 1 e si trascura il contributo delle specie “minori” (quali le molecole e lo ione H− stesso, il che costituisce generalmente una buona approssimazione2), si ha per la legge di Dalton 2
Fanno eccezione le stelle di tardo tipo spettrale (stelle fredde) per le quali le molecole svolgono un ruolo importante.
381
TRASPORTO RADIATIVO
P = Pe + (PH + PH+ ) + (PHe + PHe+ ) +
(PMi + PM+ ) , i
i
dove Pe `e la pressione elettronica, PH la pressione dovuta agli atomi di Idrogeno neutri, PH+ la pressione dovuta agli atomi di Idrogeno ionizzati, e cos`ı via. D’altra parte, affinch´e sia soddisfatta la condizione di neutralit` a del plasma, si deve anche avere Pe = PH+ + PHe+ + PM+ . i
i
Introduciamo adesso i rapporti di ionizzazione per le singole specie x=
PH+ , PH + PH+
y=
PHe+ , PHe + PHe+
zi =
PM+ i
PMi + PM+
,
i
che, in base alla formula di Saha (Eq. (10.7)), sono funzioni note di T e Pe . Sostituendo nelle equazioni precedenti e introducendo le abbondanze relative all’Idrogeno si ha P = Pe + (PH + PH+ ) 1 + AHe + , AMi i
Pe = (PH + PH+ )
x + y AHe +
zi AMi
,
i
dalle quali, eliminando (PH + PH+ ), si ottiene & 1 + AHe + i AMi & P = Pe 1 + . x + y AHe + i zi AMi A proposito di questa equazione si pu`o osservare che, essendo tutte le abbondanze AMi praticamente trascurabili rispetto alle abbondanze dell’Idrogeno e dell’Elio, al numeratore della frazione la somma su i pu` o essere omessa. Al denominatore per` o la somma non si pu`o omettere in quanto, dato il basso potenziale di ionizzazione dei metalli, in molti casi si pu` o avere che alcuni degli zi siano molto vicini all’unit` a mentre x e y sono praticamente nulli. In questo senso P risulta una funzione di Pe molto sensibile alle abbondanze AMi , cosa che `e del resto intuitiva dal punto di vista fisico. Ritornando all’equazione di sopra, e ricordando che x, y e zi sono funzioni di T e Pe , si ha P = P (T, Pe ) . Questa equazione pu`o essere invertita mediante calcoli numerici cos`ı da ottenere Pe = Pe (T, P ) .
382
CAPITOLO 14
Nota Pe , le pressioni parziali delle singole specie possono essere facilmente ottenute. Ad esempio, per la pressione parziale dell’Idrogeno neutro si ha PH = (1 − x) (PH + PH+ ) = (1 − x)
P − Pe & . 1 + AHe + i AMi
Infine, si pu` o determinare, sempre attraverso l’equazione di Saha, il rapporto r fra la pressione parziale dello ione H− e la pressione parziale dell’Idrogeno neutro, e si ottiene N H− =
r PH r (1 − x) P − Pe PH− & = = . kB T kB T kB T 1 + AHe + i AMi
Bisogna osservare che questo risultato `e stato ottenuto supponendo che la densit` a degli ioni di Idrogeno negativo sia molto minore delle densit` a degli atomi di Idrogeno neutri o ionizzati (altrimenti il contributo esplicito della pressione parziale degli H− avrebbe dovuto essere incluso nelle equazioni di partenza per P e Pe ). Questa approssimazione `e del tutto giustificata per le atmosfere stellari nelle quali l’Idrogeno si trova nella forma di ione negativo per una frazione trascurabile dell’Idrogeno totale (nell’atmosfera solare, ad esempio, il rapporto NH− /NH varia fra 10−9 e 10−7 ). Il problema della determinazione del contributo al coefficiente di assorbimento kν dovuto allo ione H− `e cos`ı risolto. In effetti bisogna tener conto anche del (a) fatto che il coefficiente di assorbimento che abbiamo calcolato `e kν e non (a) (s) kν = kν − kν . Tuttavia, quando valga l’equilibrio termodinamico locale, si ha semplicemente
kν = kν(a) 1 − e−hν/(kB T ) , per cui la correzione dovuta all’emissione stimolata `e facilmente introdotta. Per mezzo di calcoli analoghi si possono poi ottenere tutti gli altri contributi a kν e il coefficiente di assorbimento risulta determinato in funzione di T e P , ovvero in funzione della quota z. Questo permette di risolvere l’equazione del trasporto e di determinare lo spettro continuo della radiazione emessa dalla stella.
14.7 Righe spettrali in equilibrio termodinamico locale Nell’intorno di una riga spettrale in equilibrio termodinamico locale, l’equazione del trasporto assume la forma μ
dI(ν, μ) = −[kν + kR ϕ(ν − ν0 )] [I(ν, μ) − Bν (T )] , dz
383
TRASPORTO RADIATIVO
dove kR `e il coefficiente di assorbimento della riga corretto per l’emissione stimolata e integrato in frequenza3 , e dove ϕ(ν − ν0 ) `e il profilo (normalizzato all’unit` a in frequenza) dato dall’Eq. (11.37). Il coefficiente di assorbimento del continuo, kν `e praticamente costante nell’intorno della riga (la larghezza di una riga spettrale `e, tipicamente, dell’ordine della frazione di ˚ A mentre kν varia su scale dell’ordine del centinaio di ˚ A). Poniamo quindi kν = kc e definiamo la profondit` a ottica nel continuo, tc con l’equazione dtc = −kc dz . Con questa definizione l’equazione del trasporto assume la forma μ
dI(ν, μ) = [1 + η0 H(v, a)] [I(ν, μ) − Bν (T )] , dtc
dove abbiamo posto η0 =
kc
kR √ . π ΔνD
Assegnato un modello atmosferico, questa equazione pu` o essere risolta numericamente. Il calcolo della quantit` a η0 pu` o essere impostato in maniera del tutto analoga a quanto fatto nel paragrafo precedente per il calcolo del coefficiente di assorbimento del continuo. Basta per questo calcolare la densit`a degli atomi assorbenti (atomi di Ferro ionizzato, ad esempio, per il caso di una riga appartenente allo spettro del Fe II) e dedurre, attraverso l’equazione di Boltzmann, la frazione di tali atomi presenti nel livello inferiore della transizione. La conoscenza di tale quantit`a, unita a quella dei coefficienti di Einstein per la transizione, alla conoscenza di kc e a quella di ΔνD , permettono di ricavare η0 a tutte le quote. Per quanto riguarda il profilo di Voigt, ovvero la funzione H(v, a), `e poi necessario conoscere il valore della costante di damping ridotta, a, e il valore della larghezza Doppler ΔνD . In generale anche queste quantit`a variano con z in quanto variano la pressione (e quindi la frequenza delle collisioni) e la temperatura. Il profilo di Voigt `e quindi funzione di z e ci`o deve essere tenuto in dovuto conto nel calcolo numerico. Sebbene l’analisi quantitativa dei profili di righe richieda, in molti casi, una soluzione numerica dell’equazione del trasporto, `e possibile trovare una soluzione analitica introducendo una serie di ipotesi semplificatrici. Tali ipotesi, pur non essendo strettamente verificate nelle atmosfere stellari, riescono comunque a dare un’idea qualitativa dei meccanismi che contribuiscono a caratterizzare la forma dei profili di riga osservati negli spettri stellari. Supponiamo quindi che: 3
(a)
(a)
All’equilibrio termodinamico locale si ha kR = kR {1−exp[−hν0 /(kB T )]}, con kR definito nell’Eq. (11.33).
384
CAPITOLO 14
a) il rapporto η0 fra il coefficiente di assorbimento della riga e il coefficiente di assorbimento del continuo sia costante con tc ; b) il profilo di Voigt, H(v, a), sia costante con tc ; c) la funzione di Planck, Bν (T ), sia esprimibile linearmente in funzione della profondit` a ottica tc Bν (T ) = B0 (1 + β tc ) , con β costante. Quando si introducono queste ipotesi si dice che si ha a che fare con un’atmosfera di Milne-Eddington. Sostituendo l’espressione di Bν (T ) nella soluzione formale dell’equazione del trasporto si ottiene per l’intensit` a emergente Iν (0, μ) = B0
βμ 1+ 1 + η0 H(v, a)
.
Osserviamo che, se siamo molto lontani dal centro della riga, la funzione H(v, a) tende a zero e l’intensit` a tende a un valore costante, che rappresenta l’intensit`a del continuo adiacente la riga, dato da Ic = B0 (1 + β μ) . Viceversa, se si considera il limite di una riga molto intensa (η0 → ∞), l’intensit` a tende a un valore di saturazione (al di sotto della quale non pu` o mai spingersi) dato da Is = B0 . Si pu` o quindi definire una sorta di “profilo universale”, rν , sottraendo dall’intensit` a il valore di saturazione e normalizzando poi all’intensit` a del continuo. Si ottiene rν =
1 Iν (0, μ) − Is βμ . = Ic 1 + β μ 1 + η0 H(v, a)
Il fattore βμ/(1+βμ) `e connesso alle caratteristiche termodinamiche dell’atmosfera (attraverso β) e al valore dell’angolo eliocentrico (attraverso μ). Il fattore restante d` a invece la forma del profilo di riga. Esso dipende dalla frequenza solo attraverso il parametro v (si ricordi che v = (ν − ν0 )/ΔνD ). Indicando tale fattore con p(v), ovvero ponendo p(v) =
1 , 1 + η0 H(v, a)
TRASPORTO RADIATIVO
385
Fig. 14.7. Grafico del profilo p(v) in funzione della lunghezza d’onda ridotta, v, per vari valori della forza della riga η0 . Il grafico `e ottenuto per un valore della costante di smorzamento a = 0.1.
possiamo osservare che per righe deboli (η0 1) si ottiene, sviluppando in serie p(v) 1 − η0 H(v, a) . In questo caso siamo lontani dalla saturazione e il profilo di riga risulta una sorta di “negativa” del profilo del coefficiente di assorbimento. Per righe forti, invece, (η0 1), si ottiene che p(v) tende a zero per tutto un intervallo di valori di v tali che η0 H(v, a) 1. Qui siamo in una situazione di saturazione estrema. Il profilo della riga risulta molto diverso da quello di assorbimento presentando una zona praticamente piatta al centro (nel cosiddetto core della riga) e ali molto estese (dipendenti in forte misura dal valore della costante di damping a). La Fig. 14.7 mostra la forma del profilo p(v) per diversi valori di η0 e per a = 0.1.
14.8 Righe spettrali in condizioni di non-equilibrio L’ipotesi dell’equilibrio termodinamico locale permette di determinare con una certa semplicit`a i profili delle righe che si originano in un’atmosfera stellare di cui si conosca il modello. Tale ipotesi non `e tuttavia sempre verificata perch´e le righe pi` u intense si formano negli strati pi` u alti dell’atmosfera stellare
386
CAPITOLO 14
Collisioni
si scrivono
Equazioni dell’equilibrio statistico
Intensita‘ del campo di radiazione
si risolvono
auto− consistenza
Equazioni del trasporto radiativo
si risolvono
Popolazioni atomiche
si scrivono
Fig. 14.8. Per risolvere le equazioni accoppiate dell’equilibrio statistico e del trasporto radiativo si segue il loop di autoconsistenza qui schematizzato.
laddove la densit` a `e pi` u bassa e le collisioni con gli elettroni del plasma non sono sufficienti a termalizzare le popolazioni atomiche (cromosfera). Nel caso dell’atmosfera solare, ad esempio, l’ipotesi dell’equilibrio termodinamico locale non pu` o essere applicata per il calcolo dei profili delle righe H e K del Ca II, delle righe dello spettro dell’Idrogeno (quali ad esempio la Hα), delle righe D del Na I, e di numerose altre righe dello spettro visibile e ultravioletto. In questi casi l’equazione del trasporto `e la stessa di quella scritta nel paragrafo precedente con la differenza che, in luogo della funzione di Planck Bν (T ) si deve considerare la funzione sorgente Sν . Come mostrato dall’Eq. (13.3) per il caso di un atomo a due livelli, la funzione sorgente dipende tuttavia dal campo di radiazione stesso e la soluzione formale dell’equazione del trasporto non `e pi` u sufficiente a risolvere il problema. In questi casi si ricorre a calcoli pi` u complessi attraverso la cosiddetta teoria del non-ETL (non-LTE theory)4 . Semplificando al massimo le cose, il problema pu` o essere affrontato nel modo seguente. Supponiamo di conoscere un approssimazione di ordine zero per le popolazioni, in funzione della quota z, dei livelli di una determinata specie atomica (ad esempio le popolazioni dei livelli dell’atomo di Calcio ionizzato, se interessa calcolare i profili delle righe H e K). Si pu` o partire, ad esempio, dalle popolazioni ricavate per mezzo delle equazioni di Saha-Boltzmann utilizzando i valori di P e T dati dal modello di atmosfera. Note le popolazioni, si possono calcolare localmente i coefficienti che compaiono nell’equazione del trasporto radiativo (scritta per ciascuna direzione nell’atmosfera stellare). Risolvendo con metodi numerici l’equazione 4
Per un approfondimento si veda, ad esempio, D. Mihalas, Stellar Atmospheres, 2nd Ed., W.H. Freeman, San Francisco, 1978.
TRASPORTO RADIATIVO
387
del trasporto si pu` o cos`ı determinare (in funzione della frequenza e della direzione) il campo di radiazione presente in un punto qualsiasi dell’atmosfera. A questo punto si considerano le equazioni dell’equilibrio statistico per le popolazioni atomiche tenendo conto sia dei processi radiativi che di quelli collisionali. Queste equazioni formano, per ogni quota z, un sistema a coefficienti noti (in quanto il campo di radiazione `e noto) e il sistema pu`o essere risolto attraverso opportuni metodi numerici. Si ottiene quindi un’approssimazione di ordine uno per le popolazioni e si ripete il procedimento finch´e si arriva alla convergenza della soluzione come esemplificato nella Fig. 14.8. La soluzione per il campo di radiazione alla superficie dell’atmosfera stellare fornisce i profili delle righe spettrali di interesse. Sebbene il metodo sia, in linea di principio, semplice e diretto, esso richiede la conoscenza di un certo numero di tecniche numeriche sulle quali non possiamo qui addentrarci. Tali tecniche sono state sviluppate a partire dagli inizi degli anni 1950 e sono tuttora in fase di evoluzione.
Capitolo 15
Processi del secondo ordine Nel Cap. 11 abbiamo visto come si possa descrivere quantisticamente l’interazione fra campo di radiazione e sistemi materiali. Per questo abbiamo fatto ricorso a un’opportuna struttura teorica, nota sotto il nome di Elettrodinamica Quantistica, che ci ha permesso, mediante uno sviluppo all’ordine perturbativo pi` u basso, di ottenere un certo numero di risultati riguardo ai processi pi` u elementari che si verificano nell’interazione fra radiazione e sistemi atomici, ovvero i processi di assorbimento e di emissione (spontanea e stimolata) di fotoni. L’Elettrodinamica Quantistica ha per` o un campo di applicazione molto pi` u vasto. Lo scopo di questo capitolo `e quello di dedurne ulteriori conseguenze che si ottengono estendendo la teoria al secondo ordine perturbativo. Queste conseguenze riguardano l’interazione della radiazione con elettroni, liberi o legati, sia non relativistici che relativistici. In particolare andremo ad analizzare i processi di diffusione su elettroni liberi non relativistici (effetto Thomson), su elettroni legati non relativistici (effetti Rayleigh e Raman) e su elettroni liberi relativistici (effetto Compton). Lo studio di quest’ultimo effetto ci condurr` a a dedurne le propriet` a relativamente alla sezione d’urto (equazione di Klein-Nishina) e alla polarizzazione della radiazione emessa e ci permetter`a di sviluppare alcune considerazioni nei riguardi degli scambi di energia fra fotoni ed elettroni relativistici che sono alla base dell’effetto Compton inverso. Gli argomenti trattati in questo capitolo costituiscono un valido complemento di quelli che abbiamo gi` a sviluppato nel Cap. 3 basandoci esclusivamente sull’Elettrodinamica Classica (non quantistica).
15.1 Considerazioni introduttive Nell’ambito dell’Elettrodinamica Quantistica abbiamo affrontato nel Par. 11.5 lo studio dei processi elementari di interazione fra radiazione e sistemi materiali. In tale paragrafo abbiamo visto come l’Hamiltoniana di interazione fra un sistema atomico e il campo di radiazione porti alla comparsa di particolari transizioni descritte dai diagrammi di Feynman della Fig. 11.2. Tali diagrammi si riferiscono a processi di assorbimento o di emissione nei quali `e coinvolto un singolo fotone e, per questa ragione, sono a buon diritto chiamati processi del primo ordine. La relativa probabilit` a di transizione per unit` a di tempo `e data dalla regola aurea di Fermi (Eq. (11.10)) ed `e nulla se non `e verificata la conservazione dell’energia fra lo stato iniziale e lo stato finale della
390
CAPITOLO 15
transizione stessa. La conservazione dell’energia, e il fatto che un solo fotone possa essere implicato nel processo, limita considerevolmente il numero di fenomeni fisici che possono essere descritti da processi del primo ordine. Se si considera ad esempio l’interazione fra fotoni ed elettroni liberi, si vede facilmente che i processi del primo ordine non sono possibili. Si consideri infatti l’ipotetico assorbimento di un fotone da parte di un elettrone libero e, in un primo momento, supponiamo che le energie in gioco siano non relativistiche. Quando si va a valutare la probabilit` a di transizione per unit`a di tempo, l’elemento di matrice risulta non nullo solo se `e verificata la conservazione dell’impulso (si veda l’App. 13), per cui si deve avere p f = p i + h ¯ k , dove p i e p f sono, rispettivamente, l’impulso iniziale e finale dell’elettrone libero e dove k `e il vettore d’onda del fotone assorbito. D’altra parte per la conservazione dell’energia, implicita nella regola aurea di Fermi, si deve anche avere p2f p2 = i +h ¯ω , 2m 2m dove ω = c k. Sostituendo la conservazione dell’impulso in questa equazione e introducendo l’angolo θ, formato dalle direzioni dei vettori p i e k, si ottiene la seguente relazione cinematica p i cosθ . h ¯ ω = 2 m c2 1 − mc Il risultato che abbiamo cos`ı ottenuto non `e per` o accettabile, in quanto l’energia del fotone risulta dell’ordine dell’energia di riposo dell’elettrone, il che `e in contraddizione con la nostra ipotesi non relativistica. Possiamo allora provare a rilasciare tale ipotesi facendo ricorso per la conservazione dell’energia alla formula relativistica, ovvero , , c2 p2f + m2 c4 = c2 p2i + m2 c4 + h ¯ω . Sostituendo di nuovo la conservazione dell’impulso, dopo alcuni passaggi algebrici si ottiene l’equazione p2i sin2 θ + m2 c2 = 0 , che non pu` o in alcun modo essere soddisfatta. L’esempio che abbiamo considerato illustra chiaramente le limitazioni implicite nell’elettrodinamica quantistica quando ci si arresti a considerare soltanto i processi del primo ordine. Un altro esempio riguarda l’interazione di un fotone di frequenza assegnata con un sistema atomico i cui livelli energetici hanno energie n . Se si suppone
PROCESSI DEL SECONDO ORDINE
391
ad esempio che l’atomo si trovi inizialmente nel livello energetico pi` u basso, di energia 0 , e se la frequenza ω `e tale da non soddisfare ad alcuna delle relazioni h ¯ ω = n − 0 ,
(n = 1, 2, . . .) ,
allora l’atomo `e completamente “trasparente” alla radiazione stessa, in quanto non `e possibile alcun processo di assorbimento che conservi l’energia. Negli esempi precedenti, `e possibile valutare le conseguenze dell’interazione fra il sistema atomico e il campo di radiazione andando a considerare, nello spirito della teoria delle perturbazioni, processi di ordine pi` u elevato del primo. Si possono ad esempio considerare processi del secondo ordine, che implicano la comparsa nell’ampiezza della probabilit` a di transizione di due operatori del R , processi del terzo ordine, e cos`ı via. Naturalmente, mano a mano che tipo1 A si sale nell’ordine dell’interazione, la probabilit` a di transizione diminuisce e i processi fanno intervenire un numero sempre crescente di fotoni (tanti quanto `e l’ordine del processo che si sta considerando). In questo capitolo ci soffermeremo sui processi del secondo ordine, osservando che nella teoria non covariante che abbiamo sviluppato nel Cap. 11, esistono due possibilit`a diverse di prendere in considerazione tali processi. La prima possibilit` a consiste nel ricordare che l’Hamiltoniana di interazione R , e uno quadratico contiene in effetti due termini, uno lineare nell’operatore A nello stesso operatore. Quest’ultimo termine `e stato sempre trascurato nel Cap. 11, proprio perch´e intendevamo considerare solo i processi di ordine pi` u basso. Esso `e dato dall’espressione (si veda l’Eq. (11.2)) I Hquad =
N e20 [AR (ri )]2 , 2 m c2 i=1
(15.1)
dove ri (i = 1, . . . , N ) `e la coordinata dell’elettrone i-esimo del sistema atomico. Per i processi fisici indotti da tale termine, la probabilit` a di transizione per unit`a di tempo `e data dalla consueta regola aurea di Fermi (Eq. (11.10)) Pαβ =
2π '' I ''2 ' Hquad αβ ' δ(Eα − Eβ ) . h ¯
La seconda possibilit` a `e invece quella di considerare sempre il termine dell’Ha R e di andare per` o al secondo miltoniana di interazione lineare nell’operatore A ordine dello sviluppo perturbativo nell’ampiezza di probabilit` a. Riprendiamo quindi l’Eq. (11.6) e supponiamo che i processi del primo ordine non diano contributo e che, all’istante iniziale, t = 0, il sistema fisico si trovi nello stato |γ (cγ (0) = 1). Per semplice integrazione si ottiene 1
` Si ricordi che A R e l’operatore quantistico associato al potenziale vettore del campo di radiazione. La sua espressione esplicita in termini di operatori di creazione e distruzione `e data dall’Eq. (4.5).
392
CAPITOLO 15
i ωαγ t − 1 e iωαβ t − 1 e 1 I I . Hαβ Hβγ cα (t) = 2 − ωαγ ωβγ ωαβ ωβγ h ¯ β Il primo dei due termini in parentesi prevale di gran lunga rispetto all’altro quando si prendano in considerazione stati finali α per cui ωαγ → 0, ovvero stati isoenergetici rispetto allo stato iniziale. Si pu`o quindi scrivere cα (t) =
1 e i ωαγ t − 1 Mαγ , h ¯ ωαγ
dove Mαγ =
I I Hαβ Hβγ β
h ¯ ωβγ
.
(15.2)
Andando a considerare il modulo quadro di cα (t), ovvero la probabilit` a che all’istante t il sistema si trovi nello stato |α , si ottiene |cα (t)|2 =
2 1 2 4 sin (ωαγ t/2) |M | . αγ 2 ωαγ h ¯2
D’altra parte, come abbiamo pi` u volte visto in questo volume, si ha 4 sin2 (ωαγ t/2) = 2π t δ(ωαγ ) , 2 t→∞ ωαγ lim
per cui si ottiene una probabilit` a per unit` a di tempo per la transizione dallo stato |γ allo stato |α data da Pαγ =
2π |Mαγ |2 δ(Eα − Eγ ) , h ¯
(15.3)
u dove l’elemento di matrice Mαγ `e dato dall’Eq. (15.2), oppure, in forma pi` significativa Mαγ =
I I Hαβ Hβγ β
Eα − Eβ
=
I I Hαβ Hβγ β
Eγ − Eβ
.
(15.4)
L’equazione (15.3) pu` o essere considerata una diretta generalizzazione della regola aurea di Fermi al caso dei processi del secondo ordine. Di nuovo, la presenza della funzione delta di Dirac fa s`ı che la probabilit` a di transizione sia diversa da zero solo fra stati aventi la stessa energia. La struttura dell’equazione, e pi` u in particolare quella dell’elemento di matrice Mαγ , permette poi di interpretare il processo di transizione come la successione di due eventi successivi. Prima si ha una transizione in cui il sistema passa dallo stato iniziale |α
393
PROCESSI DEL SECONDO ORDINE
allo stato intermedio |β . In tale stato l’energia non `e conservata, e lo stato deve essere considerato come una sorta di “stato virtuale” nel quale il sistema pu` o trovarsi solo durante un intervallo di tempo Δt piccolissimo (ricordando il principio di indeterminazione si ha che Δt ΔE h ¯ , con ΔE pari alla differenza di energia fra lo stato iniziale, o lo stato finale, e lo stato intermedio). Successivamente, il sistema fisico transita nello stato finale |γ . Si pu` o cos`ı pensare che la transizione avvenga “per tramite” dello stato intermedio. Nel seguito, ci riferiremo all’Eq.(15.3) col nome di regola aurea di Fermi generalizzata. Prima di passare alle applicazioni, resta da vedere in cosa dobbiamo modificare il formalismo introdotto nel Cap. 11 per poter trattare anche i processi di interazione fra radiazione ed elettroni relativistici. L’unica differenza consiste nel fatto che, al fine di trovare l’Hamiltoniana di interazione, bisogna applicare il principio dell’accoppiamento minimale (Eq. (5.5)) all’Hamiltoniana di Dirac per la particella libera invece che all’Hamiltoniana di Schr¨ odinger. Ricordando che l’Hamiltoniana di Dirac, HD , `e data da (si veda l’Eq. (5.1)) HD = c α · p + β m c2 , I , e considedenotando la nuova Hamiltoniana di interazione col simbolo Hrel rando il caso dell’interazione del campo di radiazione con un insieme di N elettroni, si ha
I Hrel = e0
N
R (ri ) , α ·A
(15.5)
i=1
dove α sono le matrici di Dirac e ri `e la coordinata dell’elettrone i-esimo.
15.2 La diffusione Thomson (teoria quantistica) Si abbia un fotone di frequenza ω che interagisce con un elettrone libero a riposo e consideriamo il limite in cui il fotone ha energia ¯h ω molto minore di m c2 , l’energia di riposo dell’elettrone. Come vedremo in maggiore dettaglio in seguito quando tratteremo la diffusione Compton, sotto questo limite il processo di diffusione avviene in maniera coerente, ovvero il fotone diffuso ha la stessa energia del fotone incidente e l’elettrone subisce un rinculo la cui entit`a pu` o senz’altro essere trascurata. Ci proponiamo di calcolare la sezione d’urto del processo in cui un fotone, avente numero d’onda k (con k = ω/c), e polarizzazione individuata dal versore e (in generale complesso), viene diffuso di un angolo Θ dando luogo a un fotone avente numero d’onda k , frequenza ω e polarizzazione individuata dal versore e (anch’esso in generale complesso).
394
CAPITOLO 15
Per far questo, calcoliamo la probabilit`a di transizione per unit` a di tempo utilizzando la regola aurea di Fermi nella forma Pf i =
'2 2π '' I Ψf |Hquad |Ψi ' δ(Ei − Ef ) , h ¯
dove |Ψi e |Ψf sono, rispettivamente, gli autostati iniziale e finale del sistema I complessivo costituito dall’elettrone e dal campo di radiazione e Hquad `e l’Hamiltoniana di interazione “quadratica” data dall’Eq. (15.1), particolarizzata al caso di un solo elettrone (N = 1). Tenendo conto dello sviluppo del potenziale vettore AR (r ) in termini di operatori di creazione e distruzione (Eq. (4.5)), l’Hamiltoniana risulta I = Hquad
1 πh ¯ e20 ∗ −i a ekλ e i k·r + a† ekλ e k ·r √ kλ kλ mV ωk ωk kλ k λ
· a ek λ e i k ·r + a† ek∗ λ e−i k ·r . k λ
k λ
Gli stati iniziale e finale della transizione sono i seguenti: dal punto di vista del campo elettromagnetico, nello stato iniziale `e presente un fotone di frequenza ω, numero d’onde k (con ω = c k), e polarizzazione individuata dal versore e, mentre nello stato finale `e presente un fotone di frequenza ω , numero d’onde k (con ω = c k ), e polarizzazione individuata dal versore e . Dal punto di vista del sistema atomico (costituito da un singolo elettrone) supporremo che nello stato iniziale l’elettrone sia descritto dalla funzione d’onda ψ i (r ) e nello stato finale dalla funzione d’onda ψ f (r ). Utilizzando il formalismo introdotto nel Cap. 11, si ha |Ψi = |ψ i (r ); 0, 0, . . . , 1ke , . . . , 0, . . . |Ψf
= |ψ f (r ); 0, 0, . . . , 0, . . . , 1k e , . . .
, .
Dalla struttura dei vettori di stato e dall’espressione dell’Hamiltoniana di interazione si deduce che, degli infiniti termini della somma doppia che compare I nell’espressione di Hquad , soltanto due danno contributo non nullo all’elemento I di matrice Ψf |Hquad |Ψi . Il primo termine `e quello che contiene nella prima parentesi quadra l’operatore di distruzione relativo al modo (ke ) e nella seconda parentesi quadra l’operatore di creazione relativo al modo (k e ), mentre il secondo termine `e quello in cui l’ordine degli stessi operatori `e invertito. In altre parole, al fine del calcolo dell’elemento di matrice, si pu` o eseguire sull’HamilI toniana Hquad la seguente sostituzione formale
I → Hquad
πh ¯ e2 √ 0 a e ei k·r · a† e ∗ e−i k ·r + a† e ∗ e−i k ·r · a e ei k·r . k e e e k k mV ω ω ke
395
PROCESSI DEL SECONDO ORDINE
L’elemento di matrice pu`o adesso essere facilmente calcolato. Tenendo conto delle Eq. (4.10) e (4.11) per valutare gli elementi di matrice degli operatori di creazione e di distruzione, si ottiene I Ψf |Hquad |Ψi =
2π h ¯ e2 √ 0 (e · e ∗ ) ψ f (r )| ei (k−k )·r |ψ i (r ) mV ωω
.
Resta adesso da valutare l’elemento di matrice sulle funzioni d’onda dell’elettrone. Se l’elettrone `e libero, tali funzioni d’onda sono del tipo di onda piana, ovvero 1 ψ i (r ) = √ e i p i ·r/¯h , V
1 ψ f (r ) = √ e i p f ·r/¯h , V
dove p i e p f sono gli impulsi dell’elettrone negli stati iniziale e finale, rispettivamente. Si ottiene allora 1 i ( k− k )· r e i (−p f /¯h +k−k +p i /¯h)·r d3r . ψ f (r )| e |ψ i (r ) = V Questo integrale vale V se l’impulso finale dell’elettrone, p f , `e tale da conservare l’impulso totale del sistema, ovvero se p f = p i + h ¯ k − h ¯ k , e vale zero altrimenti. Abbiamo quindi ottenuto, come era logico attendersi, che nel processo di diffusione l’impulso totale deve essere conservato. D’altra parte, l’elettrone `e inizialmente a riposo ( p i = 0) e tenendo conto del fatto che l’energia del fotone `e molto minore dell’energia di riposo dell’elettrone, la variazione di impulso dell’elettrone, Δ p = p f pu` o essere senz’altro trascurata per quanto riguarda il suo effetto sulla conservazione dell’energia e quindi sulla frequenza finale del fotone. Da un punto di vista pi` u formale, si pu` o anche pensare che l’elettrone non cambia il suo stato durante il processo di diffusione, in modo tale che si abbia ψ f (r ) = ψ i (r ), e, utilizzando l’approssimazione di dipolo per cui )· r
e i (k−k
1 ,
si ottiene )· r
ψ f (r )| ei (k−k
)· r
|ψ i (r ) ψ i (r )| ei (k−k
|ψ i (r ) ψ i (r )|ψ i (r ) = 1 .
Queste ultime considerazioni possono essere ripetute anche per il caso di un elettrone legato in un atomo (o una molecola). Qui si deve necessariamente imporre che lo stato elettronico iniziale sia uguale allo stato elettronico finale. Si ottiene in definitiva, sia per un elettrone libero che per un elettrone legato
396
CAPITOLO 15
I Ψf |Hquad |Ψi =
2π h ¯ e2 √ 0 (e · e ∗ ) , m V ω ω
e quindi, per la probabilit` a di transizione per unit` a di tempo ¯ e40 8π 3 h |e · e ∗ |2 δ(¯ hω −h ¯ ω) . m2 ω ω V 2 Dobbiamo adesso passare da questa espressione alla sezione d’urto per diffusione del fotone iniziale. Per questo utilizziamo il solito procedimento di dividere innanzitutto la probabilit` a di transizione per unit`a di tempo per il flusso di particelle entranti. Siccome si ha un singolo fotone nel volume di normalizzazione V, il flusso `e dato da c/V. Poi dobbiamo compiere una somma sugli stati finali e tale somma dipende dalla sezione d’urto che vogliamo definire. A noi interessa la sezione d’urto a polarizzazione fissata, σ(Θ, e, e ), per diffusione di un fotone nell’angolo solido dΩ centrato intorno a una direzione che forma un angolo Θ con la direzione del fotone iniziale. Il numero di stati Ω fotonici finali aventi direzione compresa nel dΩ e frequenza angolare compresa fra ω e ω + dω `e dato dal secondo membro dell’Eq. (4.3) diviso per 2, ovvero Pf i =
dN =
V ω 2 dω dΩ , 8π 3 c3
e si ottiene quindi σ(Θ, e, e ) dΩ =
h ¯ e40 |e · e ∗ |2 dΩ m 2 c4 ω
ω δ(¯ hω −h ¯ ω ) dω .
La presenza della delta di Dirac porta alla ovvia conseguenza ω = ω e conduce all’espressione finale della sezione d’urto differenziale σ(Θ, e, e ) =
e40 |e · e ∗ |2 , m 2 c4
ovvero, ricordando la definizione del raggio classico dell’elettrone (Eq. (3.26)) σ(Θ, e, e ) = rc2 |e · e ∗ |2 .
(15.6)
Come si vede, la sezione d’urto differenziale dipende esplicitamente solo dalla direzione dei versori di polarizzazione e non dalla direzione del fotone finale, la dipendenza da quest’ultimo parametro essendo implicitamente contenuta nei versori stessi. La formula adesso trovata permette di ricavare sia le caratteristiche di polarizzazione della radiazione diffusa, sia l’andamento del diagramma di radiazione, sia la sezione d’urto totale di diffusione. Tutti i risultati coincidono con quelli ottenuti a suo tempo per mezzo dell’elettrodinamica classica nel Par. 3.5. Guardiamo ad esempio come si possa manipolare l’equazione precedente per
PROCESSI DEL SECONDO ORDINE
397
ottenere la sezione d’urto, σ(Θ), relativa alla diffusione del fotone sotto l’angolo Θ facendo astrazione dalle propriet` a di polarizzazione sia del fotone iniziale che di quello finale. Per ottenere questa quantit` a bisogna sommare sulle polarizzazioni finali e mediare sulle polarizzazioni iniziali. Introduciamo quindi due versori di polarizzazione reali, e1 e e2 , perpendicolari alla direzione del fotone iniziale e perpendicolari fra loro, e, analogamente, due versori reali e 1 e e2 perpendicolari alla direzione del fotone finale e perpendicolari fra loro. Si ha σ(Θ) =
1 r2 σ(Θ, ei , ej ) = c S , 2 i=1,2 j=1,2 2
dove S=
(ei · ej )2 .
i=1,2 j=1,2
Per valutare questa somma, osserviamo preliminarmente che, dati due vettori v e w arbitrari, e costruito attraverso di essi il prodotto diadico T = v w, si ha Tr(T) = (v w) ii = vi wi = v · w . i
i
Per questa propriet` a, la somma S pu` o scriversi nella forma S = Tr [(e1e1 + e2e2 ) · (e1 e1 + e2 e2 )] . Teniamo inoltre presente che, introducendo i versori u e u paralleli, rispettivamente, alla direzione del fotone iniziale e a quella del fotone finale, le due terne (e1 , e2 , u ) e (e1 , e2 , u ) sono due terne cartesiane ortogonali, per cui si ha e1 e1 + e2 e2 + u u = U ,
e1 e1 + e2 e2 + u u = U ,
(15.7)
dove U `e il tensore unitario (Uij = δij ). Sostituendo nell’espressione per S e tenendo conto che Tr(U) = 3, si ottiene S = Tr [(U − u u ) · (U − u u )] = = Tr( U ) − Tr( u u ) − Tr( u u ) + (u · u ) Tr( u u ) = 1 + cos2 Θ , e sostituendo questo risultato nell’espressione per σ(Θ) rc2 (1 + cos2 Θ) . (15.8) 2 Infine, integrando sull’angolo solido, si riottiene il risultato classico del Par. 3.6 8π 2 r = σT . σ(Θ) dΩ = 3 c σ(Θ) =
398
CAPITOLO 15
15.3 La diffusione Rayleigh quantistica e la diffusione Raman Passiamo adesso a trattare i fenomeni della diffusione Rayleigh e della diffusione Raman. Consideriamo un sistema atomico che si trovi inizialmente nello stato descritto dalla funzione d’onda2 ψ i (r ). Sul sistema incide un fotone di frequenza ω, numero d’onde k, e polarizzazione caratterizzata dal versore e. Il fotone viene diffuso dando luogo a un nuovo fotone di frequenza ω , numero d’onde k , e polarizzazione caratterizzata dal versore e . Il sistema atomico viene a trovarsi, dopo il processo di diffusione, nello stato descritto dalla funzione d’onda ψ f (r ). Se lo stato finale coincide, o, pi` u in generale, ha la stessa energia dello stato iniziale, si parla del fenomeno di diffusione Rayleigh. Se invece lo stato finale ha energia diversa dallo stato iniziale, si parla invece di diffusione Raman. In ogni caso, indicando rispettivamente con i e con f l’energia del sistema atomico negli stati iniziale e finale, la frequenza del fotone diffuso `e connessa a quella del fotone incidente dalla relazione ω = ω +
i − f . h ¯
Ovviamente, per l’effetto Rayleigh si ha ω = ω, mentre, per l’effetto Raman, ω pu` o essere sia minore che maggiore di ω. Se ω < ω si parla di transizioni Stokes, mentre se ω > ω si parla di transizioni anti-Stokes. La probabilit` a di transizione del processo pu`o essere calcolata mediante la regola aurea di Fermi generalizzata (Eq. (15.3) e (15.4)). Indicando al solito con |Ψ i e |Ψ f gli stati iniziale e finale del sistema fisico complessivo, costituito dal sistema atomico e dal campo di radiazione, e con |Ψ n uno stato qualsiasi del sistema fisico stesso (stato intermedio, o virtuale), la probabilit`a di transizione per unit` a di tempo `e data da Pf i =
2π |Mf i |2 δ(Ef − Ei ) , h ¯
dove Mf i =
Ψf |HI |Ψn Ψn |HI |Ψi Ei − En n
.
Gli stati iniziali e finali del sistema complessivo sono descritti dai vettori di stato |Ψi = |ψ i (r ); 0, 0, . . . , 1ke , . . . , 0, . . . , |Ψf 2
= |ψ f (r ); 0, 0, . . . , 0, . . . , 1k e , . . .
.
Per non appesantire troppo le notazioni, supponiamo che il sistema atomico sia costituito da un solo elettrone ottico.
399
PROCESSI DEL SECONDO ORDINE
Tenendo conto dell’espressione dell’Hamiltoniana di interazione, si deduce che gli unici stati intermedi che contribuiscono alla somma sono del tipo |Ψn = |ψ n (r ); 0, 0, . . . , 0ke , . . . , 0k e , . . .
,
|Ψn = |ψ n (r ); 0, 0, . . . , 1ke , . . . , 1k e , . . .
,
oppure
dove |ψ n `e un qualsiasi stato del sistema atomico, la cui energia indichiamo con n . Analogamente a quanto visto in precedenza per la diffusione Thomson, si hanno, dal punto di vista del campo di radiazione, due possibili stati intermedi, corrispondenti, rispettivamente, alla distruzione del fotone (k e ) da parte della seconda Hamiltoniana e alla creazione del fotone (k e ) da parte della prima Hamiltoniana, e al caso inverso in cui le Hamiltoniane agiscono “a rovescio”. Per quanto riguarda le differenze di energie che compaiono al denominatore nell’espressione di Mf i , esse sono date, nei due casi, da Ei − En = i − n + h ¯ω ,
e
Ei − En = i − n − h ¯ ω .
Il calcolo dell’elemento di matrice segue adesso in maniera diretta dall’espres R (r ). Utilizsione dell’Hamiltoniana d’interazione e da quella dell’operatore A zando l’approssimazione di dipolo per gli elementi di matrice relativi al sistema atomico, si ottiene p · e ∗ |ψ n ψ n | p · e |ψ i 2π h ¯ e20 ψ f | √ Mf i = 2 i − n + h ¯ω m V ωω n ψ f | p · e | ψ n ψ n | p · e ∗ |ψ i . + i − n − h ¯ ω Il calcolo della sezione d’urto procede poi secondo lo schema sviluppato precedentemente per la diffusione Thomson. La probabilit` a di transizione per unit` a di tempo deve essere divisa per il flusso dei fotoni entranti e si deve poi provvedere a eseguire la somma sugli stati fotonici finali. La sezione d’urto differenziale dipende adesso anche dagli stati elettronici iniziale e finale (oltre che dalle direzioni e dalla polarizzazione dei fotoni), e richiede quindi nella sua definizione gli indici supplementari f e i. Si ottiene, con semplici trasformazioni ' ' ω ψ f | p · e ∗ |ψ n ψ n | p · e |ψ i '1 2 σf i (Θ, e, e ) = rc ' ' ω m n i − n + h ¯ω ψ f | p · e |ψ n ψ n | p · e ∗ |ψ i + i − n − h ¯ ω
'2 ' ' ' . '
(15.9)
400
CAPITOLO 15
Questa equazione prende il nome di equazione di Kramers-Heisenberg e descrive sia la diffusione Rayleigh che la diffusione Raman. Nel caso particolare dell’effetto Rayleigh, in cui lo stato elettronico finale coincide con lo stato elettronico iniziale (e quindi la frequenza ω coincide con la frequenza ω ), `e per` o necessario aggiungere un secondo contributo che proviene dall’Hamiltoniana di I interazione quadratica Hquad . Il contributo `e esattamente lo stesso di quello che abbiamo calcolato a proposito della diffusione Thomson (Eq. (15.6)), dimodoch´e l’espressione dell’equazione di Kramers-Heisenberg risulta
[σf i (Θ, e, e )]Ray =
rc2
' ' 1 ψ f | p · e ∗ |ψ n ψ n | p · e |ψ i ' ∗ ' (e · e ) δf i + ' m n i − n + h ¯ω
ψ f | p · e |ψ n ψ n | p · e ∗ |ψ i + i − n − h ¯ ω
'2 ' ' ' . '
(15.10)
L’equazione di Kramers-Heisenberg `e molto generale, ma, per le approssimazioni che abbiamo introdotto nel ricavarla, essa pu` o essere utilizzata solo quando si sia lontani, come si dice, dalle risonanze. Queste si verificano per i particolari valori di ω (e ω ) tali da annullare l’uno o l’altro dei denominatori delle frazioni contenute entro le parentesi quadre delle Eq. (15.9) e (15.10). Per tali valori, l’equazione porta a delle divergenze dovute al fatto che abbiamo trascurato i fenomeni di smorzamento (damping), ovvero, in termini classici, la cosiddetta forza di smorzamento dovuta alla reazione sull’atomo della radiazione emessa. L’introduzione in maniera coerente di tali fenomeni nell’Elettrodinamica Quantistica `e un argomento complesso che esula dagli scopi del presente volume. Nello stesso spirito bisogna notare che quando si `e prossimi alle risonanze di cui sopra, uno dei due addendi in parentesi quadra prevale nettamente sull’altro (e anche sul termine in (e · e ∗ ) dell’Eq. (15.10)). Nel caso pi` u comune in cui lo stato atomico iniziale `e lo stato fondamentale dell’atomo, `e il primo termine che prevale e l’equazione di Kramers-Heisenberg pu`o essere scritta nella seguente forma semplificata ' rc2 ω '' ψ f | p · e ∗ |ψ n ψ n | p · e |ψ i σf i (Θ, e, e ) = 2 ' m ω ' n i − n + h ¯ω
'2 ' ' ' . '
15.4 La diffusione Compton: aspetti cinematici Dopo aver analizzato i processi di diffusione nel caso non relativistico, passiamo adesso al caso relativistico. Consideriamo un fotone che interagisce con
401
PROCESSI DEL SECONDO ORDINE
un elettrone libero a riposo. Se il fotone `e sufficientemente energetico, una parte della sua energia viene trasferita all’elettrone e la sua frequenza risulta quindi diminuita. Nello stesso tempo il fotone risulta deviato di un angolo Θ rispetto alla direzione iniziale, come illustrato nella Fig. 15.1. Le relazioni cinematiche esistenti fra le varie grandezze in gioco possono essere facilmente determinate in base alle leggi di conservazione dell’impulso e dell’energia. Indichiamo rispettivamente con k e ω il numero d’onde e la frequenza del fotone prima dell’urto e con k e ω le analoghe quantit` a dopo l’urto. Indichiamo inoltre con p e , rispettivamente, l’impulso e l’energia dell’elettrone dopo l’urto. Ovviamente si ha # ω = ck , ω = c k , = c2 p2 + m2 c4 . In base alle leggi di conservazione si deve avere, essendo l’elettrone inizialmente a riposo h ¯ k = h ¯ k + p ,
h ¯ ω + mc2 = h ¯ ω + .
Eliminando e quadrando si ottiene ¯ 2 (ω − ω )2 + 2 m c2 h ¯ (ω − ω ) . c2 p2 = h mentre ricavando p dall’equazione della conservazione dell’impulso e quadrando si ha c2 p2 = h ¯ 2 (ω 2 + ω 2 − 2 ω ω cosΘ) . Confrontando le due ultime equazioni si ottiene infine, con facili passaggi m c2 (ω − ω ) , h ¯ che permette di esprimere ω in funzione di ω attraverso l’equazione ω ω (1 − cosΘ) =
(15.11)
ω m c2 = . ω m c2 + h ¯ ω (1 − cosΘ) La relazione cinematica che collega ω con ω `e solitamente scritta in una forma pi` u significativa. Dividendo ambo i membri dell’Eq. (15.11) per il prodotto ω ω si ha h ¯ 1 1 − = (1 − cosΘ) , (15.12) ω ω m c2 e introducendo in luogo delle frequenze angolari ω e ω le rispettive lunghezze d’onda, λ e λ , definite da λ=
2π c , ω
λ =
2π c , ω
402
CAPITOLO 15
elettrone interazione fotone incidente
Θ fotone diffuso
Fig. 15.1. Geometria dell’effetto Compton. Un fotone di frequenza ω incide su un elettrone a riposo e viene diffuso, alla frequenza ω , lungo la direzione individuata dall’angolo Θ. L’elettrone subisce un rinculo e acquista energia cinetica. Il piano che contiene le tre direzioni ` e detto piano di diffusione.
si ottiene λ − λ = λC (1 − cosΘ) , dove la quantit` a λC , detta lunghezza d’onda Compton dell’elettrone, `e data da λC =
h 2.426 × 10−10 cm . mc
Come si vede, l’aumento di lunghezza d’onda del fotone, Δλ = λ − λ, `e sempre compreso fra 0 e 2 λC , indipendentemente dalla lunghezza d’onda del fotone incidente. La variazione relativa, Δλ/λ, risulta dell’ordine di 5 × 10 −6 per la radiazione visibile ed `e quindi difficilmente rilevabile. In questo limite di grandi lunghezze d’onda, la diffusione `e praticamente coerente, come abbiamo anticipato nel Par. 15.2 parlando della diffusione Thomson. Variazioni relative apprezzabili si ottengono solo a lunghezze d’onda minori, quando l’energia del fotone comincia a essere paragonabile all’energia di riposo dell’elettrone. Non a caso l’effetto Compton fu scoperto sperimentalmente mediante bombardamento di elettroni con raggi X. Infine, `e necessario osservare che nell’urto l’elettrone, inizialmente a riposo, guadagna energia. L’energia ΔE ceduta dal fotone all’elettrone `e ovviamente data da ΔE = − m c2 = h ¯ (ω − ω ) , che pu` o anche essere espressa, con facili passaggi, nella forma ΔE = h ¯ω
h ¯ ω (1 − cosΘ) . m c2 + h ¯ ω (1 − cosΘ)
403
PROCESSI DEL SECONDO ORDINE
15.5 La diffusione Compton: aspetti dinamici Dopo aver trattato nel paragrafo precedente gli aspetti cinematici del fenomeno della diffusione Compton, passiamo adesso a esaminare lo stesso fenomeno nell’ambito dell’Elettrodinamica Quantistica. Questo ci porter` a non solo a ritrovare le leggi di conservazione dell’impulso e dell’energia, ma anche a determinare l’espressione generale per la sezione d’urto del processo. Riprendendo le considerazioni sviluppate nel paragrafo introduttivo di questo capitolo, utilizziamo la regola di Fermi generalizzata (Eq. (15.3)) per esprimere la probabilit`a di transizione per unit` a di tempo dallo stato iniziale |Ψi , di energia Ei , allo stato finale |Ψf , di energia Ef . Inoltre, per trattare questo problema in cui i fenomeni relativistici svolgono un ruolo fondamentale, utilizziamo quale Hamiltoniana di interazione l’espressione relativistica dell’Eq. (15.5). La probabilit` a per unit` a di tempo `e quindi data da Pf i =
2π 2 |Mf i | δ(Ei − Ef ) , h ¯
(15.13)
(HI )f n (HI )n i rel rel . Ei − En n
(15.14)
dove Mf i =
In questa equazione, gli elementi di matrice sono dati da I I (Hrel )f n = Ψf |Hrel |Ψn
,
I I (Hrel )n i = Ψn |Hrel |Ψi
,
|Ψn essendo un qualsiasi stato intermedio (o virtuale) del sistema complessivo e la somma essendo estesa a tutti i possibili stati intermedi. Utilizzeremo questa equazione per valutare la sezione d’urto dell’effetto Compton nel caso generale relativistico, in cui l’energia del fotone `e confrontabile con quella di riposo dell’elettrone. Nel caso non relativistico, gi` a analizzato precedentemente, abbiamo visto che la sezione d’urto totale del processo vale σT , la sezione d’urto Thomson. Iniziamo col calcolare la probabilit` a per unit` a di tempo che si verifichi una transizione fra lo stato iniziale, in cui, dal punto di vista del campo di radiazione, `e presente un fotone di frequenza ω, numero d’onde k (con ω = c k), e polarizzazione individuata dal versore e, e lo stato finale, in cui `e presente un fotone di frequenza ω , numero d’onde k (con ω = c k ), e polarizzazione individuata dal versore e . Dal punto di vista del sistema atomico, costituito in questo caso da un elettrone libero, supporremo che nello stato iniziale l’elettrone abbia impulso p, energia , e spin individuato dall’indice r, mentre nello stato finale esso abbia impulso p , energia e spin individuato dall’indice s. Ovviamente si ha
404
CAPITOLO 15
=
# c 2 p 2 + m 2 c4 ,
=
# c2 p2 + m2 c4 .
Gli stati iniziale e finale sono quindi descritti dai vettori di stato (r)
|Ψi = |ψp (x ); 0, 0, . . . , 1ke , . . . , 0, . . . |Ψf (r)
(s)
= |ψp (x ); 0, 0, . . . , 1ke , . . . , 0, . . .
, ,
(s)
dove ψp (x ) e ψp (x ) sono autofunzioni dell’Hamiltoniana di Dirac relative, rispettivamente, all’elettrone nello stato iniziale e finale, del tipo degli spinori introdotti nel Par. 5.1. L’Hamiltoniana d’interazione `e data dall’Eq. (15.5) che, considerando il caso di un solo elettrone e ricordando l’espressione dell’operatore potenziale vettore data dall’Eq. (4.5), risulta % 2π h ¯ I ∗ −i Hrel = α · a ekλ eik·x + a† ekλ e0 c e k·x , kλ kλ ωk V kλ
dove α sono le matrici di Dirac. Le energie degli stati iniziale e finale sono date da Ef = + h ¯ ω ,
Ei = + h ¯ω ,
e la presenza della delta di Dirac nell’espressione della probabilit` a di transizione gi` a assicura la conservazione dell’energia. Andiamo adesso a considerare quali sono i possibili stati intermedi che contribuiscono alla somma, ovvero quegli stati per i quali gli elementi di matrice I I (Hrel )f n e (Hrel )n i sono non nulli. Riguardo al campo di radiazione, poich´e l’Hamiltoniana d’interazione `e lineare negli operatori di creazione e distruzione, si vede immediatamente che esistono solo due stati fotonici che portano contributo alla somma, ovvero |0, 0, . . . , 0ke , . . . , 0ke , . . .
,
|0, 0, . . . , 1ke , . . . , 1k e , . . .
.
Nel primo caso la seconda Hamiltoniana (ovvero quella che opera per prima su |Ψi ) distrugge il fotone (k, e ), mentre la prima crea il fotone (k , e ). Nel secondo caso invece la seconda Hamiltoniana crea il fotone (k , e ), mentre la prima distrugge il fotone (k, e ). Tenendo conto di questo fatto, e ricordando le formule che esprimono gli elementi di matrice degli operatori di creazione e distruzione, si ottiene per l’elemento di matrice Mf i dell’Eq. (15.14) Mf i = dove
¯ 2π e20 c2 h √ (A + B) , V ω ω
405
PROCESSI DEL SECONDO ORDINE
A=
(t)
(r)
1 +h ¯ ω − q
ψp (x )|( α · e ∗ ) e−i k ·x |ψq (x ) (s)
qt (t)
× ψq (x )|( α · e ) ei k·x |ψp (x ) B=
(s)
(t)
ψp (x )|( α · e ) ei k·x |ψq (x )
qt
,
1 −h ¯ ω − q
× ψq (x )|( α · e ∗ ) e−i k ·x |ψp (x ) (t)
(r)
.
Teniamo adesso conto che le funzioni d’onda normalizzate degli elettroni liberi sono della forma 1 (r) ψp = √ ei p·x/¯h Wr( p) , V
1 (s) ψp = √ ei p ·x/¯h Ws( p ) , V
1 (t) ψq = √ ei q·x/¯h Wt ( q) , V dove le quantit` a W sono gli spinori, introdotti nel Par. 5.1, che qui riscriviamo ⎛
⎞ q + mc2 0 ⎜ ⎟ W1( q)= C⎝ ⎠ , cqz cq+ ⎛ ⎞ −cqz ⎜ −cq+ ⎟ q)=C⎝ W3( ⎠ , q + mc2 0
⎛
⎞ 0 2 ⎜ + mc ⎟ q ) = C ⎝ q W2( ⎠ , cq− −cqz ⎛ ⎞ −cq− ⎜ cqz ⎟ q)= C⎝ W4( ⎠ , 0 q + mc2
con 1 , C= # 2 q (q + mc2 )
q =
# c 2 q 2 + m 2 c4 .
q ) e W2( q ) sono gli spinori a energia positiva mentre Ricordiamo anche che W1( W3( q ) e W4( q ) sono quelli a energia negativa. Gli integrali in d3 x sulle funzioni d’onda, implicitamente contenuti negli elementi di matrice, sono banali e portano alla conservazione dell’impulso. La somma su q che compare nel termine A d` a contributo non nullo solo se q = ( p+h ¯ k ) e inoltre q = ( p + h ¯ k ), mentre l’analoga somma che compare nel termine B d` a contributo non nullo solo se q = ( p−h ¯ k ) e inoltre ¯ k ). In ogni caso, si deve avere q = ( p −h ¯ k . p + h ¯ k = p + h
406
CAPITOLO 15
k
k’
k’
g
k h
p’
p
p’
p
(a)
(b)
Fig. 15.2. Diagrammi di Feynman dell’effetto Compton. Il diagramma (a) illustra il processo in cui prima viene assorbito (distrutto) il fotone di impulso k e poi viene emesso (creato) quello di impulso k . Il diagramma (b) illustra il processo in cui gli stessi fenomeni avvengono nell’ordine inverso. Nello stato intermedio virtuale, l’elettrone ha impulso g nel caso (a) e h nel caso (b).
Nel seguito utilizzeremo i simboli g e h per indicare l’impulso dell’elettrone nello stato intermedio corrispondente, rispettivamente, ai termini A e B. Poniamo quindi g = p +h ¯ k ,
h = p − h ¯ k .
(15.15)
Le corrispondenti energie dell’elettrone negli stati intermedi, sono date da ±g e ±h , dove , g = c2 ( p+h ¯ k)2 + m2 c4 ,
, h = c2 ( p−h ¯ k )2 + m2 c4 ,
(15.16)
e dove il segno ± va scelto a seconda che si vadano a considerare stati a energia ` facile verificare che, positiva (t = 1, 2) o stati a energia negativa (t = 3, 4). E in ogni caso, nello stato intermedio non si ha conservazione dell’energia. Come abbiamo gi` a visto precedentemente, lo stato intermedio va quindi considerato come uno stato virtuale nel quale l’elettrone viene a trovarsi solo per un tempo piccolissimo, Δt, tale che Δt ΔE h ¯ , dove ΔE = Ei − En `e la differenza di energia fra lo stato iniziale (o finale) e lo stato intermedio. Talvolta, e soprattutto nell’Elettrodinamica Quantistica, ci si riferisce agli stati virtuali dicendo che si tratta di stati che non conservano l’energia e che si trovano quindi al di fuori della cosiddetta energy shell. I processi fisici che stiamo qui analizzando sono convenientemente illustrati dai due tipici diagrammi di Feynman della Fig. 15.2. Ritornando al nostro problema, e osservando che gli integrali in d3 x degli esponenziali danno per risultato V quando `e soddisfatta la conservazione dell’impulso, l’espressione per Mf i risulta
407
PROCESSI DEL SECONDO ORDINE
¯ 2π e2 c2 h Mf i = √0 V ω ω +
Ws† ( p )( α · e ∗ )Wt (g )
t
Ws† ( p )( α · e )Wt (h )
t
1 −h ¯ ω ∓ h
1 W † (g )( α · e )Wr( p) +h ¯ ω ∓ g t † W (h )( α · e ∗ )W ( p ) , (15.17) t
r
dove, davanti ai fattori g e h , bisogna assumere il segno meno per t = 1, 2 e il segno pi` u per t = 3, 4. A questo proposito `e importante sottolineare che la somma sugli stati virtuali deve essere estesa anche agli stati di energia negativa, malgrado tali stati siano completamente occupati secondo l’ipotesi del mare di Fermi. Facendo riferimento, ad esempio, al primo diagramma di Feynman, nel caso in cui sia t = 3, 4, bisogna pensare che lo stato intermedio sia in effetti quello in cui il fotone (k, e ) viene assorbito da un elettrone del mare di Fermi e si crea cos`ı una coppia virtuale elettrone-positrone. Nello stato intermedio si hanno quindi due elettroni (quello originario e quello “nuovo”) e un positrone. Nella transizione allo stato finale, l’elettrone originario decade nella lacuna del mare di Fermi annichilando cos`ı il positrone ed emettendo il fotone (k , e ). I risultati che si ottengono sono gli stessi sia che si estenda la somma sugli stati intermedi anche agli stati elettronici a energia negativa (come nella nostra trattazione), sia che si introducano come stati intermedi anche gli stati positronici (il che per`o richiederebbe una trattazione formalmente pi` u approfondita che esula dagli scopi di questo volume). Eseguiamo adesso la somma sugli stati di spin dell’elettrone intermedio. Facendo riferimento al primo dei due pezzi, bisogna valutare la matrice S data dalla somma S=
Wt (g )
t=1,2
1 1 Wt† (g ) + Wt (g ) Wt† (g ) . +h ¯ ω − g + h ¯ ω + g t=3,4
Per esprimere questa matrice in forma pi` u conveniente, definiamo le matrici P+ e P− , dette proiettori, attraverso le equazioni Wt (g )Wt† (g ) , P− = Wt (g )Wt† (g ) . (15.18) P+ = t=1,2
t=3,4
Per mezzo di tali matrici si ha S=
P− P+ + . +h ¯ ω − g +h ¯ ω + g
(15.19)
Osserviamo inoltre che, poich´e gli spinori sono gli autovettori normalizzati di una matrice Hermitiana, si ha P+ + P− = 1 .
408
CAPITOLO 15
D’altra parte si ha anche Hg P− = −g P− ,
Hg P+ = g P+ ,
dove Hg `e l’Hamiltoniana di Dirac corrispondente all’impulso g, ovvero Hg = c α · g + β m c2 . Sommando le equazioni precedenti si ottiene Hg (P+ + P− ) = g (P+ − P− ) , da cui si ricava, essendo P+ + P− = 1, P+ − P− =
Hg . g
Questa equazione, unita a quella per (P+ + P− ), permette di esprimere le due matrici P+ e P− nella forma P+ =
g + Hg , 2 g
P− =
g − Hg . 2 g
(15.20)
Sostituendo questo risultato nell’Eq. (15.19), la somma S, solitamente indicata col nome di propagatore, pu`o, con facili passaggi algebrici, essere espressa dall’equazione S=
Hg + + h ¯ω . ( + h ¯ ω)2 − 2g
Mediante un ragionamento del tutto analogo eseguito per la somma sugli stati di spin contenuta nel secondo addendo dell’Eq. (15.17), l’elemento di matrice Mf i pu` o essere espresso nella forma Mf i =
¯ 2π e20 c2 h √ Rf i , V ω ω
(15.21)
dove Rf i = Ws† ( p )( α · e ∗ ) + Ws† ( p )( α · e )
Hg + + h ¯ω ( α · e )Wr( p) ( + h ¯ ω)2 − 2g
Hh + − h ¯ ω ( α · e ∗ )Wr( p) . ( − h ¯ ω )2 − 2
(15.22)
h
L’espressione che abbiamo trovato per Mf i `e molto generale e, considerandone il modulo quadro, permette di determinare la probabilit` a di transizione
PROCESSI DEL SECONDO ORDINE
409
per qualsiasi combinazione di parametri cinematici, stati di spin, e stati di polarizzazione degli elettroni e dei fotoni iniziali e finali. Prima di procedere `e per` o importante sottolineare una propriet` a fondamentale delle quantit` a che ivi compaiono. Tale propriet` a, che `e connessa con l’invarianza dei fenomeni fisici per trasformazioni di gauge, consiste nel fatto che, se si esegue la trasformazione α · e → α · e + C( α · u − 1) , dove C `e una costante arbitraria e u `e il versore della direzione del fotone iniziale (u = k/k), la quantit` a Rf i non cambia. Analogamente, se si esegue la trasformazione α · e ∗ → α · e ∗ + C ( α · u − 1) , dove C `e una nuova costante arbitraria e u `e il versore della direzione del fotone finale (u = k /k ), la quantit` a Rf i non cambia. La propriet` a `e dimostrata nell’App. 14. Ritornando alla valutazione della quantit` a Mf i dell’Eq. (15.21), osserviamo che gli stati di spin degli elettroni sono delle quantit` a che, in generale, rivestono ` quindi opportuno provvedere a eseguire, sul modulo scarso interesse fisico. E quadro dell’elemento di matrice, la somma sugli stati di spin dell’elettrone finale e la media sugli stati di spin dell’elettrone iniziale. Questa quantit`a sar` a nel seguito indicata con |Mf i |2 e, per calcolarla, `e conveniente introdurre due matrici, A e B, definite da A = ( α · e ∗ ) B = ( α · e )
Hg + + h ¯ω ( α · e ) , ( + h ¯ ω)2 − 2g
Hh + − h ¯ ω ( α · e ∗ ) . ( − h ¯ ω )2 − 2
(15.23)
h
Attraverso queste posizioni, l’elemento di matrice Mf i risulta Mf i =
¯ † 2π e20 c2 h √ Ws ( p ) (A + B) Wr( p) , V ω ω
e si ottiene quindi
|Mf i |2 =
¯2 1 4π 2 e40 c4 h W † ( p ) (A+B) Wr( p )Wr† ( p) (A† +B † ) Ws( p ) . 2 V ωω 2 r,s=1,2 s
Per eseguire le somme su r e su s si possono utilizzare i risultati sui proiettori ottenuti precedentemente (si vedano le Eq. (15.18) e (15.20)). Tenendo conto che
410
CAPITOLO 15
Wr( p )Wr† ( p) =
r=1,2
+ Hp , 2
Ws( p )Ws† ( p ) =
s=1,2
+ Hp , 2
e utilizzando la definizione di traccia di una matrice, per la quale un prodotto scalare della forma W † X W pu` o essere posto nella forma Tr(W W † X ), con X matrice arbitraria, si ottiene |Mf i |2 = dove
¯2 1 4π 2 e40 c4 h T , V 2 ω ω 8
(15.24)
T = Tr ( + Hp ) (A + B) ( + Hp ) (A† + B † ) .
(15.25)
Il calcolo di questa espressione `e, in generale, piuttosto laborioso, anche se non presenta particolari difficolt` a concettuali. Alcune semplificazioni di carattere formale possono essere ottenute utilizzando il formalismo dei quadrivettori e delle cosiddette matrici γ, come illustrato nell’App. 15 . Senza introdurre questo formalismo, vedremo nel paragrafo successivo come il calcolo della traccia T possa essere eseguito nel caso semplificato in cui l’elettrone `e supposto inizialmente a riposo. Questo ci porter` a alla deduzione della ben nota equazione di Klein-Nishina.
15.6 L’equazione di Klein-Nishina Consideriamo il caso in cui l’elettrone iniziale sia a riposo e, per semplificare ulteriormente i calcoli, supponiamo anche che i versori di polarizzazione e e e siano reali. Per i vari termini che compaiono nell’Eq. (15.25), ricordando anche le Eq. (15.15), si ha = m c2 ,
= m c2 + h ¯ (ω − ω ) ,
g = h ¯ k ,
h = −¯ h k ,
dalle quali, per le Eq. (15.16), si ottengono le espressioni che compaiono al denominatore nelle definizioni delle matrici A e B delle Eq. (15.23), ovvero ( + h ¯ ω)2 − 2g = 2 m c2 h ¯ω ,
( − h ¯ ω )2 − 2h = −2 m c2 h ¯ ω .
Esplicitando inoltre le espressioni di Hg e Hh si ottiene A = ( α · e )
( α · k ) h ¯ c + (1 + β) m c2 + h ¯ω ( α · e ) , 2 m c2 h ¯ω
411
PROCESSI DEL SECONDO ORDINE
B = ( α · e )
¯ c − (1 + β) m c2 + h ¯ ω ( α · k ) h ( α · e ) . 2 2mc h ¯ω
Osservando poi che Hp = β m c2 (in quanto l’elettrone `e inizialmente a riposo, e quindi p = 0) la traccia dell’Eq. (15.25) risulta T = Tr ( + Hp ) (A + B) (1 + β) m c2 (A† + B † ) .
(15.26)
Nelle formule precedenti si pu` o subito effettuare una prima semplificazione osservando che la quantit` a (1 + β) m c2 che compare al numeratore nelle espressioni di A e di B (e delle loro aggiunte) pu` o essere semplicemente omessa. Questo si deduce dal fatto che le matrici α anticommutano con la matrice β, per cui si ha, per un vettore v arbitrario (1 + β) ( α · v ) (1 + β) = ( α · v ) (1 − β) (1 + β) = ( α · v ) (1 − β 2 ) = 0 , l’ultimo passaggio risultando dal fatto che β 2 = 1. Andando poi a considerare la somma A + B, tenendo conto della semplificazione ora enunciata si ha, con facili passaggi 1 [( α · e ) ( α · u ) ( α · e ) + ( α · e ) ( α · u ) ( α · e )] 2 m c2 1 + [( α · e ) ( α · e ) + ( α · e ) ( α · e )] , 2 m c2 dove u e u sono i versori diretti, rispettivamente, lungo k e lungo k . D’altra parte, per le propriet` a di anticommutazione delle matrici α, si ha A+B =
( α · e ) ( α · e ) + ( α · e ) ( α · e ) = 2 (e · e ) , per cui si ottiene 1 (2a + E + F ) , 2 m c2 dove si sono introdotte le quantit` a A+B =
a = e · e ,
E = ( α ·e ) ( α ·u ) ( α ·e ) ,
(15.27)
F = ( α ·e ) ( α ·u ) ( α ·e ) . (15.28)
Tenendo conto di questi risultati, e scrivendo per convenienza la matrice ( + Hp ) nella forma · d , (15.29) + Hp = m c2 b + β + α dove le quantit` a adimensionali b e d sono definite da
412
CAPITOLO 15
b=1+
h ¯ω−h ¯ ω , m c2
h ¯ h ¯ω h ¯ ω (k − k ) = d = u − u , 2 mc mc m c2
(15.30)
si ottiene, per sostituzione delle Eq. (15.27) e (15.29) nella (15.26)
T =
! 1 Tr ( b + β + α · d ) (2 a + E + F) (1 + β) (2 a + E † + F † ) . 4
Consideriamo adesso il prodotto P definito da P = (2 a + E + F) (1 + β) (2 a + E † + F † ) . Tenendo conto delle propriet` a di anticommutazione delle matrici di Dirac, esso pu` o essere trasformato nella seguente maniera P = (2 a + E + F) (2 a + E † + F † ) + β (2 a − E − F) (2 a + E † + F † ) = = 4 a2 + 2 a (E † + F † + E + F) + EE † + FF † + EF † + FE † + β 4 a2 + 2 a (E † + F † − E − F) − EE † − F F † − EF † − FE † . Si pu` o adesso osservare che i due prodotti EE † e FF † danno per risultato la matrice unit`a. Questo si ottiene a partire dalle propriet` a di anticommutazione delle matrici α per le quali, se v e w sono due vettori arbitrari, si ha ( α · v ) ( α · v ) = v 2 ,
(15.31)
( α · v ) ( α·w ) = −( α·w ) ( α · v ) + 2 v · w ,
(15.32)
per cui, ad esempio, applicando tre volte l’Eq. (15.31) α · e ) ( α · u ) ( α · e ) ( α · e ) ( α · u ) ( α · e ) = EE † = ( α · u ) ( α · u ) ( α · e ) = ( α · e ) ( α · e ) = 1 . = ( α · e ) ( Tenendo conto di questo risultato, la traccia T risulta 1 Tr ( b + β + α · d ) 4 a2 + 2 + 2 a (E † + F † + E + F) + EF † + FE † 4 ! + (b + β + α · d ) β 4 a2 − 2 + 2 a (E † + F † − E − F) − EF † − FE † .
T =
Conviene adesso osservare che le tracce di matrici ottenute attraverso prodotti di matrici α e β sono tutte nulle, a meno che tale prodotto non contenga un numero pari (o nullo) di matrici α e un numero pari (o nullo) di matrici β.
PROCESSI DEL SECONDO ORDINE
413
Tenendo conto di questa propriet`a, del fatto che le matrici E e F risultano dal prodotto di tre matrici α, e che β 2 = 1, si ottiene T =
1 Tr 4 (b + 1) a2 + (b − 1) (2 + EF † + FE † ) 4 ! + 2 a ( α · d ) (E † + F † + E + F) .
Ricordiamo adesso alcune propriet` a della traccia. Per una matrice M arbitraria si ha Tr(M ) = [Tr(M † )]∗ , e per due matrici M e N arbitrarie si ha Tr(M N ) = Tr(N M ). Se si ricorda anche che le matrici α sono Hermitiane, che la traccia della matrice unitaria vale 4, e che le quantit` a b e d sono reali, si ottiene
! 1 T = 4 (b+1) a2 + (b−1) 4 + Re Tr(EF † ) +a Re Tr ( α · d )(E † + F † ) . 2 (15.33) Valutiamo le tracce delle matrici che rimangono in questa espressione. Ricordando le Eq. (15.28), si ha Tr(EF † ) = Tr[( α · e ) ( α · u ) ( α · e ) ( α · e ) ( α · u ) ( α · e )] . Tenendo presente che il versore u `e ortogonale al versore e e che il versore u `e ortogonale al versore e , tenendo inoltre conto dell’Eq. (15.32), e sfruttando successivamente la propriet` a ciclica della traccia, si ha Tr(EF † ) = Tr[( α · e ) ( α · e ) ( α · u ) ( α · u ) ( α · e ) ( α · e )] = α · e ) ( α · e ) ( α · e ) ( α · u ) ( α · u )] . = Tr[( α · e ) ( In questa espressione, eseguiamo per la prima coppia di prodotti scalari la sostituzione ( α · e ) ( α · e ) = −( α · e )( α · e ) + 2 a , dove abbiamo ricordato di nuovo l’Eq. (15.32) e la definizione di a data nelle Eq.(15.28). Utilizzando anche l’Eq. (15.31) si ottiene Tr(EF † ) = 2 a Tr[( α · e ) ( α · e ) ( α · u ) ( α · u )] − Tr[( α · u ) ( α · u )] . (15.34) Passiamo all’altra traccia da valutare. Per essa si ha α · d ) ( α · e ) ( α · u ) ( α · e )] Tr[( α · d )(E † + F † )] = Tr[( + Tr[( α · d ) ( α · e ) ( α · u ) ( α · e )] . Ricordando la definizione del vettore d (Eq. (15.30)), si ottengono quattro pezzi, ovvero
414
CAPITOLO 15
h ¯ω Tr[( α · u ) ( α · e ) ( α · u )( α · e )] Tr[( α · d )(E † + F † )] = m c2 ! h ¯ ω + Tr[( α · u ) ( α · e ) ( Tr[( α · u ) ( α · u ) ( α · e )] − α · e ) ( α · u ) ( α · e )] 2 m c ! + Tr[( α · u ) ( α · e ) ( α · u ) ( α · e )] . Utilizzando l’Eq. (15.32), tenendo conto dell’ortogonalit` a dei versori di polarizzazione rispetto alla direzione di propagazione e della propriet` a ciclica della traccia, si ottiene Tr[( α · d )(E † + F † )] =
¯ω h ¯ ω − h Tr[( α · e ) ( α · e )] mc2
! + Tr[( α · e ) ( α · e ) ( α · u ) ( α · u )] .
(15.35)
Siamo adesso in grado di valutare l’espressione di T . Ricordando la definizione di b (Eq.(15.30)), e sostituendo le Eq. (15.34) e (15.35) nell’Eq. (15.33), si ottiene, con alcuni passaggi algebrici T = 8 a2 +
h ¯ω − h ¯ ω 1 α · u ) ( α · u )] 4 a2 + 2 − Re Tr[( mc2 2 ! −a Re Tr[( α · e ) ( α · e )] .
Tenendo inoltre presente che, per due vettori arbitrari, v e w, si ha Tr[( α · v ) ( α·w )] = 4 v · w , si ottiene Tr[( α · u ) ( α · u )] = 4 cosΘ ,
Tr[( α · e ) ( α · e )] = 4 e · e = 4 a ,
dove Θ `e l’angolo definito nella Fig. 15.1 e dove abbiamo ricordato la definizione di a (Eq. (15.28)). Per semplice sostituzione di questi risultati si ha T = 8 a2 + 2
h ¯ω − h ¯ ω (1 − cosΘ) . mc2
Infine, osservando che in base alle relazioni cinematiche la quantit`a (1 − cosΘ) pu` o scriversi nella forma (si veda l’Eq. (15.12)) 1 m c2 1 , − 1 − cosΘ = h ¯ ω ω
PROCESSI DEL SECONDO ORDINE
415
e ricordando che a = e · e , l’espressione di T pu` o anche essere posta, pi` u significativamente, nella forma ω ω 2 − 2 + 4 (e · e ) . T =2 + ω ω Per terminare il calcolo della probabilit` a di transizione, l’espressione di T deve essere sostituita nell’Eq. (15.24). Ricordando che = m c2 , si ottiene |Mf i |2 =
¯2 ω π 2 e40 c2 h ω 2 − 2 + 4 ( e · e , + ) V 2 m ω ω ω ω
e ricordando poi l’Eq. (15.13), la probabilit` a per unit` a di tempo della transizione risulta ¯ ω 2π 3 e40 c2 h ω 2 − 2 + 4 (e · e ) δ(Ei − Ef ) . Pf i = 2 + V m ω ω ω ω Il calcolo della sezione d’urto procede secondo lo schema che abbiamo gi`a utilizzato nel Par. 15.2 per trovare la sezione d’urto Thomson e nel Par. 15.3 per le sezioni d’urto Rayleigh e Raman. La probabilit` a di transizione per unit` a di tempo deve essere divisa per il flusso dei fotoni incidenti, dato dalla solita espressione c/V, e dobbiamo compiere una somma sugli stati finali. Quello che interessa `e la sezione d’urto a polarizzazione fissata (ovvero a e e e fissati), σ(Θ, e, e ), per diffusione di un fotone nell’angolo solido dΩ centrato intorno che forma un angolo Θ con la direzione del fotone iniziale. a una direzione Ω Il numero di stati fotonici finali aventi direzione compresa nel dΩ e frequenza angolare compresa fra ω e ω + dω `e dato dal secondo membro dell’Eq. (4.3) diviso per 2, ovvero dN =
V ω 2 dω dΩ . 8π 3 c3
Si ottiene quindi
σ(Θ, e, e ) dΩ =
¯ e40 h dΩ 4 m c2 ω
ω ω ω 2 − 2 + 4 ( e · e δ(Ei − Ef ) dω . + ) ω ω
La presenza della delta di Dirac porta alla ovvia conseguenza che tutte le quantit` a dentro l’integrale devono essere valutate in modo da conservare l’energia. Inoltre, la stessa delta porta alla comparsa di un fattore moltiplicativo dovuto al cambiamento di variabile da ω a Ef , che risulta ' ' ' ∂ω ' 1 ' ' ' ∂Ef ' = |∂Ef /∂ω | .
416
CAPITOLO 15
D’altra parte, essendo # # ¯ 2ω2 + h ¯ 2 ω 2 − 2 h ¯ 2 ω ω cosΘ , = m2 c4 + c2 p 2 = m2 c4 + h si ha Ef = h ¯ ω + = h ¯ ω +
# m 2 c4 + h ¯ 2 ω2 + h ¯ 2 ω 2 − 2 h ¯ 2 ω ω cosΘ ,
per cui ∂Ef ¯ ω − h ¯ ω cosΘ h ¯ 2 (ω − ω cosΘ) + h = h ¯ + = h ¯ . ∂ω Ricordando le relazioni cinematiche, secondo le quali ¯ ω = m c2 + h ¯ω , + h
m c2 + h ¯ ω (1 − cosΘ) =
m c2 ω , ω
si ottiene h ¯ m c2 ω ∂Ef = . ∂ω ω Sostituendo questo risultato e ricordando la definizione del raggio classico dell’elettrone (rc = e20 /(m c2 )), si giunge infine all’espressione dell’equazione di Klein-Nishina r2 ω 2 ω ω 2 σ(Θ, e, e ) = c 2 − 2 + 4 ( e · e . (15.36) + ) 4 ω ω ω In molti casi si `e piuttosto interessati alla sezione d’urto, σ(Θ), relativa alla diffusione del fotone sotto l’angolo Θ facendo astrazione dalle propriet` a di polarizzazione sia del fotone iniziale che di quello finale. Per ottenere questa quantit` a bisogna sommare sulle polarizzazioni finali e mediare sulle polarizzazioni iniziali, secondo la stessa procedura che abbiamo gi`a seguito nel Par. 15.2 a proposito della sezione d’urto Thomson. Introdotti due versori di polarizzazione reali, e1 e e2 , perpendicolari alla direzione del fotone iniziale e perpendicolari fra loro, e, analogamente, due versori reali e1 e e2 perpendicolari alla direzione del fotone finale e perpendicolari fra loro, si deve calcolare la quantit` a. σ(Θ) =
1 σ(Θ, ei , ej ) . 2 i=1,2 j=1,2
Il risultato di questa somma (si veda il Par. 15.2 per il calcolo della somma su i e j della quantit` a (ei ·ej )2 ) porta a una nuova espressione della sezione d’urto di Klein-Nishina che fa astrazione dai fenomeni di polarizzazione dei fotoni rc2 ω 2 ω ω 2 σ(Θ) = − sin Θ . + (15.37) 2 ω2 ω ω
PROCESSI DEL SECONDO ORDINE
417
Fig. 15.3. Il diagramma illustra l’andamento della sezione d’urto σ(Θ) in funzione dell’angolo Θ per vari valori di ε. Ciascuna curva corrisponde al valore di ε indicato al suo lato. La sezione d’urto nella direzione individuata dall’angolo Θ `e proporzionale al segmento che unisce l’origine del diagramma alla curva.
In questa formula (cos`ı come in quella trovata precedentemente), la dipendenza da Θ `e effettivamente contenuta anche nei rapporti ω /ω e ω/ω che, ricordando le relazioni cinematiche, sono dati in funzione di Θ dalle espressioni ω 1 = , ω 1 + ε (1 − cosΘ)
ω = 1 + ε (1 − cosΘ) , ω
(15.38)
dove abbiamo introdotto la quantit` a ε, ovvero l’energia del fotone iniziale espressa in termini dell’energia di riposo dell’elettrone ε=
h ¯ω . m c2
(15.39)
La Fig. 15.3 illustra, per mezzo del diagramma di radiazione, l’andamento della sezione d’urto in funzione di Θ per vari valori del parametro ε. Come si vede, la sezione d’urto per diffusione in avanti resta costante al variare dell’energia del fotone, mentre la sezione d’urto nelle altre direzioni diminuisce significativamente, in maniera monotona, all’aumentare dell’energia. Al limite, per energie molto elevate, la sezione d’urto si “concentra” sempre di pi` u intorno a Θ = 0. Ovviamente, per → 0 i due rapporti ω/ω e ω /ω tendono a 1 e l’Eq. (15.37) riproduce esattamente il risultato per la sezione d’urto Thomson che abbiamo ottenuto sia classicamente, nel Par. 3.5, sia quantisticamente, ma in approssimazione non relativistica, nel Par. 15.2 (Eq. (15.8)).
418
CAPITOLO 15
15.7 La sezione d’urto totale della diffusione Compton Esplicitando la dipendenza dall’angolo Θ tramite le Eq. (15.38), l’equazione di Klein-Nishina per la sezione d’urto differenziale (Eq. (15.37)) risulta 1 2 1 1 2 σ(Θ) = rc + 1 + ε(1 − cosΘ) − sin Θ , 2 [1 + ε(1 − cosΘ)]2 1 + ε(1 − cosΘ) dove ε `e l’energia del fotone incidente divisa per l’energia di riposo dell’elettrone. Quello che ci interessa calcolare `e la sezione d’urto totale, ovvero l’integrale " π σC = σ(Θ) dΩ = 2π σ(Θ) sinΘ dΘ . 4π
0
Sostituendo l’espressione per σ(Θ) e introducendo la variabile x = 1 + ε(1 − cosΘ) , si ottiene
1 σC = π rc2 ε
1+2 ε 1
1 x2
1 +x+ x
x−1 ε
2
x−1 −2 ε
dx ,
ovvero, per mezzo di semplici trasformazioni algebriche
σC = π rc2
1 ε3
1+2 ε
1 + (ε2 − 2 ε − 2)
1
1 1 ε2 + (2 ε + 1) 2 + 3 x x x
dx .
Gli integrali che compaiono in questa espressione sono elementari e possono essere facilmente valutati. Si ottiene ε2 − 2 ε − 2 4 2 (1 + ε) 2 σC = π rc + + ln(1 + 2 ε) , ε2 (1 + 2 ε2 ) ε3 e, normalizzando la sezione d’urto al suo valore non relativistico (sezione d’urto Thomson) dato da σT = 8π rc2 /3, si ha σC = σT A(ε) , dove
1 1+ε ε2 − 2 ε − 2 A(ε) = 3 + + ln(1 + 2 ε) 2 ε2 4 (1 + 2 ε)2 8 ε3
.
PROCESSI DEL SECONDO ORDINE
419
Fig. 15.4. Andamento della sezione d’urto totale dell’effetto Compton, normalizzata al suo valore non relativistico (sezione d’urto Thomson), in funzione dell’energia del fotone incidente, normalizzata alla massa a riposo dell’elettrone.
La funzione A `e una funzione monotonicamente decrescente del suo argomento ed `e riportata in grafico nella Fig. 15.4. Il suo sviluppo in serie per energie basse (ε 1) risulta 26 2 ε + ··· . 5 Viceversa, per alte energie, la funzione tende asintoticamente a zero secondo la legge A(ε) = 1 − 2 ε +
3 3 (ln ε + ln 2 + 16 ) . 8ε Un calcolo numerico mostra inoltre che il valore critico, εc , al quale la sezione d’urto `e pari a met`a del suo valore non relativistico `e dato da ε c = 0.69016. A(ε)
15.8 Propriet` a di polarizzazione della diffusione Compton Riprendiamo l’equazione di Klein-Nishina per la sezione d’urto a polarizzazione fissata, σ(Θ, e, e ), data dall’Eq. (15.36) rc2 ω 2 ω ω 2 σ(Θ, e, e ) = − 2 + 4 (e · e ) . + 4 ω2 ω ω
420
CAPITOLO 15
Analizziamo le propriet`a di polarizzazione dei fotoni diffusi supponendo che i fotoni incidenti costituiscano una miscela “naturale” fatta, per il 50%, da fotoni polarizzati lungo il versore reale e1 e, per l’altro 50%, da fotoni polarizzati lungo il versore reale e2 ortogonale al precedente. La sezione d’urto di diffusione dipende adesso unicamente dalla polarizzazione del fotone diffuso e, indicando tale sezione d’urto con il simbolo σn (θ, e ), si ha rc2 ω 2 ω ω −2+4S , σn (Θ, e ) = + 4 ω2 ω ω dove S=
1 (ei · e )2 . 2 i=1,2
La quantit` a S pu` o essere calcolata mediante un procedimento simile a quello che abbiamo utilizzato nel Par. 15.2. Si ottiene S=
1 2
[1 − (e · u )2 ] .
Esprimiamo adesso il versore di polarizzazione e come combinazione lineare dei due versori di polarizzazione reali, e1 e e2 , definiti in modo tale che e1 sia perpendicolare al piano di diffusione mentre e2 sia contenuto nel piano di diffusione (si veda la Fig. 3.7)3 . Poniamo quindi e = c1 e1 + c2 e2 con c21 + c22 = 1 . Osservando che e1 · u = 0 e che e2 · u = − sinΘ, si ottiene S=
1 2
(1 − c22 sin2 Θ) .
La sezione d’urto per diffusione di un fotone polarizzato in direzione perpendicolare al piano di diffusione (c22 = 0) `e quindi data da rc2 ω 2 ω ω , σn (Θ, e1 ) = + 4 ω2 ω ω mentre quella per diffusione di un fotone polarizzato lungo il piano di diffusione (c22 = 1) `e data da r2 ω 2 ω ω 2 σn (Θ, e2 ) = c 2 − 2 sin + Θ . 4 ω ω ω 3
Si noti che nella Fig. 3.7 la denominazione dei versori `e invertita rispetto a quella qui utilizzata.
PROCESSI DEL SECONDO ORDINE
421
Fig. 15.5. Andamento della polarizzazione lineare della radiazione diffusa per effetto Compton nel caso di radiazione incidente non polarizzata. In ascissa `e riportata l’energia dei fotoni incidenti espressa in termini della massa a riposo dell’elettrone. Le curve si riferiscono a vari valori dell’angolo di diffusione Θ. Per valori di Θ compresi fra 90 ◦ e 180◦ , le curve (non riportate in figura) decadono pi` u rapidamente, all’aumentare di ε, rispetto alle curve corrispondenti all’angolo supplementare (con le quali coincidono per ε 1).
La radiazione diffusa `e quindi polarizzata linearmente nella direzione perpendicolare al piano di diffusione. La polarizzazione `e data da sin2 Θ σn (Θ, e1 ) − σn (Θ, e2 ) = . ω ω σn (Θ, e1 ) + σn (Θ, e2 ) 2 + ω − sin Θ ω L’andamento di p in funzione del parametro ε per vari valori dell’angolo di diffusione `e rappresentato nella Fig. 15.5. La polarizzazione lineare della radiazione diffusa decresce monotonicamente all’aumentare dell’energia del fotone incidente e tende a zero per ε → ∞. Per eseguire un’analisi pi` u dettagliata delle caratteristiche di polarizzazione dell’effetto Compton `e necessario rilasciare l’ipotesi, introdotta all’inizio del Par. 15.6, consistente nel supporre che i versori di polarizzazione e e e siano reali. Nel caso pi` u generale in cui si introducano versori complessi, si pu` o dimostrare che l’Eq. (15.36) per la sezione d’urto a polarizzazione fissata deve essere sostituita dalla seguente (che ovviamente coincide con la (15.36) per e ed e reali) p=
r2 ω 2 σ(Θ, e, e ) = c 2 4 ω
ω ω ∗ 2 2 ∗ 2 − 2 1 + |e · e | − |e · e | + 4 |e · e | . + ω ω
422
CAPITOLO 15
In base a questa equazione si pu` o poi mostrare che i parametri di Stokes della radiazione diffusa sono connessi a quelli della radiazione incidente attraverso una matrice che generalizza quella che abbiamo ottenuto per la diffusione Thomson (Eq. (3.27)) e che, nella consueta geometria della Fig. 3.7 e con le solite convenzioni per la definizione dei parametri di Stokes, `e data da ⎛ ⎞ ω ω 2 2 + Θ sin Θ 0 0 − sin ω ⎜ ω ⎟ ⎜ ⎟ 2 2 ⎜ ⎟ 1 + cos Θ 0 0 sin Θ ⎜ ⎟ . ⎜ ⎟ 0 0 2 cosΘ 0 ⎜ ⎟ ⎝ ⎠ ω ω + cosΘ 0 0 0 ω ω Come si pu` o facilmente verificare, nel limite non relativistico (ω = ω) tale matrice coincide con quella della diffusione Thomson. La struttura della matrice mostra che la polarizzazione circolare, che pu`o esistere nella radiazione diffusa solo quando `e gi` a presente in quella incidente, persiste anche a grandi valori di ε. Questa propriet` a `e connessa con la conservazione del momento angolare 4.
15.9 Scambio di energia fra fotoni ed elettroni Nel processo che abbiamo analizzato in dettaglio nei paragrafi precedenti, l’elettrone, inizialmente a riposo, subisce un rinculo e acquista energia cinetica. L’energia acquistata dall’elettrone pu` o essere facilmente calcolata tenendo presente l’espressione per la sezione d’urto σ(Θ) dell’Eq. (15.37) e considerando che tale energia risulta pari a ¯h (ω − ω ). Se indichiamo quindi col simbolo σE la sezione d’urto per il trasferimento relativo di energia dal fotone all’elettrone, tale quantit` a `e espressa dall’integrale " 1 σE = σ(Θ) h ¯ (ω − ω ) dΩ . h ¯ ω 4π Ricordando le Eq. (15.37) e (15.38), introducendo la variabile ε (Eq. (15.39)), ed effettuando il cambiamento di variabile x = 1 + ε (1 − cos Θ), si ottiene
σE =
π rc2
1 ε
1
1+2 ε
1 x2
1 +x+ x
x−1 ε
2
x−1 −2 ε
1 1− x
dx ,
ovvero, per mezzo di semplici trasformazioni algebriche 4
Per un approfondimento si veda, ad esempio, l’articolo: U. Fano, Journal of the Optical Society of America, 39, 859, (1949).
PROCESSI DEL SECONDO ORDINE
423
Fig. 15.6. Andamento della sezione d’urto per il trasferimento relativo di energia dal fotone all’elettrone (supposto inizialmente a riposo) nella diffusione Compton. Il massimo della curva si verifica per ε = 0.9821.
σE =
π rc2
1 ε3
1
1+2ε
1 1 1 + (ε2 − 2ε − 3) − (ε2 − 4ε − 3) 2 x x + (ε2 − 2ε − 1)
1 ε2 dx . − x3 x4
Eseguendo gli integrali, e normalizzando la sezione d’urto alla sezione d’urto Thomson, si ottiene σE = σT E(ε) , dove
E(ε) =
9 + 51 ε + 93 ε2 + 51 ε3 − 10 ε4 3 − 3 (3 + 2 ε − ε2 ) ln(1 + 2 ε) . 2 3 4 ε (1 + 2 ε) 8ε
L’andamento della funzione E(ε) `e rappresentato nella Fig. 15.6. Gli sviluppi asintotici risultano: per ε 1 E(ε) = ε − e, per ε 1,
21 2 ε + ··· , 5
424
CAPITOLO 15
3 (ln ε + ln 2 − 56 ) . 8ε L’andamento della σE (ε) in funzione di ε `e facilmente interpretabile osservando che, per ε piccoli, i fotoni praticamente “rimbalzano” elasticamente sull’elettrone senza cedergli energia. Viceversa, per ε grandi, l’elettrone finisce per essere praticamente “trasparente” al fotone. Da queste considerazioni si deduce che la funzione σE debba presentare un massimo. Tale massimo si verifica a ε 1, ovvero quando l’energia del fotone `e uguale all’energia di riposo dell’elettrone. Nel caso dell’elettrone a riposo, il trasferimento di energia `e sempre dal fotone all’elettrone. Tuttavia, quando l’elettrone `e in moto, possono avvenire trasferimenti di energia nei due sensi, a seconda dei parametri cinematici. In particolare, quando l’energia cinetica dell’elettrone `e alta rispetto all’energia del fotone, l’energia viene trasferita dall’elettrone al fotone. Questo fenomeno `e comunemente chiamato effetto Compton inverso. E(ε)
15.10 L’effetto Compton inverso Senza eseguire una trattazione sistematica, cerchiamo di determinare in maniera approssimata l’energia che viene mediamente trasferita per effetto Compton inverso da un elettrone, mobile con velocit`a v , a un insieme di fotoni che supponiamo monocromatici e isotropi. Per questo, eseguiamo una trasformazione di Lorentz dal “sistema del laboratorio”, dove i fotoni hanno tutti frequenza ω0 e direzione distribuita isotropicamente, mentre l’elettrone ha velocit`a v , al sistema di riposo dell’elettrone. In questo sistema i fotoni perdono la loro propriet` a di isotropia e di monocromaticit`a. La loro distribuzione in frequenza si ottiene ricordando la formula dell’effetto Doppler ω = ω0 γ (1 − β cosα) , dove β = v/c, γ = (1 − β 2 )−1/2 , e α `e l’angolo compreso fra la direzione dell’elettrone e quella del fotone nel sistema di laboratorio. La distribuzione delle frequenze dei fotoni nel sistema di riposo dell’elettrone si ottiene ricordando l’ipotesi della loro isotropia nel sistema di laboratorio, la quale implica f (ω) dω =
1 1 dΩ = sinα dα , 4π 2
e poich´e dω = ω0 γ β sinα dα , definendo le frequenze ω1 e ω2 con le equazioni
425
PROCESSI DEL SECONDO ORDINE
f (ω)
ω1 ω0
ω1 = ω0
1−β 1+β
ω2 = ω0
1+β 1−β
f (ω)
ω
ω2
ω−
ω− = ω0
1−β 1+β
ω+ = ω0
1+β 1−β
ω+ ω
ω0
(a)
(b)
Fig. 15.7. Funzione di distribuzione dei fotoni nel sistema di riposo dell’elettrone (a), e funzione di distribuzione dei fotoni diffusi nel sistema di laboratorio (b). Prima della diffusione, la funzione di distribuzione in questo sistema `e una delta di Dirac alla frequenza ω0 . Le distribuzioni si riferiscono al caso β = 0.7.
% ω1 = ω0
1−β , 1+β
% ω2 = ω 0
1+β , 1−β
si ottiene, per ω1 ≤ ω ≤ ω2 f (ω) =
1 . 2 ω0 γ β
Il risultato `e una distribuzione uniforme di valori di ω in un intervallo finito, come illustrato nella Fig 15.7, riquadro (a). Supponiamo adesso che la frequenza ω0 sia sufficientemente bassa, in modo tale che tutto l’intervallo di valori di ω in cui la funzione f (ω) `e diversa da zero venga a cadere nel regime della sezione d’urto Thomson. Nel processo di diffusione, la distribuzione f (ω) non viene alterata perch´e ogni fotone mantiene la propria frequenza. Se si suppone poi di trascurare anche la dipendenza della sezione d’urto Thomson dall’angolo di diffusione (ovvero se si suppone che la diffusione Thomson avvenga in maniera isotropa), si ottiene il risultato che, dopo la diffusione, i fotoni sono distribuiti isotropicamente anche nel sistema di riposo dell’elettrone. Si pu` o allora eseguire una nuova trasformazione di Lorentz in modo da ritornare nel sistema del laboratorio. Il risultato per la distribuzione in frequenza dei fotoni diffusi, f (ω), `e illustrato nella Fig. 15.7, riquadro (b). La distribuzione `e nulla ovunque fuorch´e nell’intervallo ω− ≤ ω ≤ ω+ , dove ω− = ω 0
1−β , 1+β
ω+ = ω 0
1+β . 1−β
426
CAPITOLO 15
La funzione cresce linearmente per ω compreso fra ω− e ω0 , raggiunge il massimo per ω = ω0 e poi decresce linearmente per ω compreso fra ω0 e ω+ . Il valore medio della distribuzione, ω , si ottiene valutando l’ascissa del baricentro del triangolo di Fig. 15.7, riquadro (b), il che d` a ω =
1 + 13 β 2 1 . (ω− + ω+ + ω0 ) = ω0 3 1 − β2
La frazione di energia trasferita in media dall’elettrone ai fotoni per singolo evento di diffusione risulta quindi 4 2 β ω − ω0 = 3 2 = ω0 1−β
4 3
γ2 β2 .
Un elettrone che si propaga in un mezzo in cui siano presenti dei fotoni si comporta quindi come se emettesse energia elettromagnetica. In effetti, non si tratta di una vera e propria emissione ma soltanto del fatto che i fotoni acquistano energia a causa dell’urto subito da parte dell’elettrone. Se vogliamo calcolare la potenza “emessa” in questo processo, possiamo osservare che, in base alla formula precedente, il guadagno relativo di energia dei fotoni `e indipendente da ω0 . Se indichiamo quindi con ufot la densit` a di energia dei fotoni (energia per unit` a di volume) prima dell’urto, e se ricordiamo che nel limite che abbiamo considerato la sezione d’urto `e σT , possiamo esprimere la potenza emessa nella forma 4 c σT γ 2 β 2 ufot . 3 Questa formula permette a sua volta di definire una sezione d’urto elettronica (i) per effetto Compton inverso, σC . Tenendo conto che l’elettrone si muove con velocit`a v = c β e che esso “spazza” per unit`a di tempo l’energia fotonica c β ufot , si ottiene W =
(i)
σC =
4 2 γ β σT . 3
Appendici A.1 Unit` a di misura dell’elettromagnetismo Le unit` a di misura che intervengono nei fenomeni elettromagnetici sono state introdotte attraverso un processo storico lungo e tortuoso. Senza entrare nei dettagli di tale processo, cerchiamo qui di riassumerne i punti fondamentali alla luce di una visione moderna dei fenomeni stessi, sottolineando che queste note sono dirette a un lettore che sia gi` a a conoscenza della fenomenologia di base dell’elettromagnetismo. Per quanto riguarda l’elettrostatica, la legge fondamentale `e quella di Coulomb che si scrive, nel vuoto, nella forma generale q1 q2 F = kC 2 vers r , r dove F `e la forza che la carica puntiforme q1 esercita sulla carica puntiforme q2 posta alla distanza r = r2 − r1 , e dove kC `e una costante –che pu`o essere scelta sia dimensionale che adimensionale– e che implicitamente definisce l’unit`a di misura della carica (assumendo, ovviamente, che le unit`a di misura delle `e grandezze meccaniche siano gi`a state fissate). Il vettore campo elettrico, E, definito in un punto arbitrario attraverso l’equazione = F , E qp dove F `e la forza elettrica che si esercita sulla carica “di prova” qp disposta nel punto stesso. Da questa definizione e dalla legge di Coulomb si deduce l’espressione del campo elettrico dovuto alla carica puntiforme q, che risulta = kC q vers r , E r2 dalla quale segue poi il teorema di Gauss in forma integrale, ovvero · n dS = 4π kC Q , E Φ(E) = Σ
Q essendo la carica contenuta entro la superficie Σ, oppure, in forma differenziale = 4π kC ρ , divE dove ρ `e la densit`a di carica elettrica (carica contenuta nell’unit` a di volume).
428
APPENDICI
A proposito della definizione del vettore campo elettrico, bisogna osservare che essa non `e l’unica possibile, in quanto si potrebbe benissimo definire il campo elettrico creato dalla carica q come = kC δ q vers r , E r2 con δ costante arbitraria (eventualmente dimensionale), pur di esprimere la forza elettrica che il campo esercita sulla carica di prova qp nella forma 1 . F = qp E δ Fortunatamente, per quanto riguarda i fenomeni elettrici, si assume δ = 1. La cosa non `e per` o vera per i fenomeni magnetici. Riguardo alla magnetostatica, si hanno equazioni del tutto analoghe a quelle dell’elettrostatica. In tali equazioni, per ragione storiche, viene introdotto il concetto fittizio di “massa magnetica” o di “polo magnetico”. Le equazioni corrispondenti a quelle scritte precedentemente sono le seguenti (il simbolo m denotando la massa magnetica): Legge di Gilbert1 (analoga della legge di Coulomb) m1 m2 F = kG vers r . r2 Definizione del vettore induzione magnetica generato dalla massa magnetica m = kG γ m vers r , B r2 dove γ `e una costante arbitraria (eventualmente dimensionale). Forza agente sulla massa magnetica di prova mp 1 . F = mp B γ
(A1.1)
Equivalente del teorema di Gauss (forma integrale) =0 , Φ(B) in quanto non esistono masse magnetiche isolate (monopoli magnetici). Equivalente del teorema di Gauss (forma differenziale) =0 . divB 1 La denominazione “Legge di Gilbert” non ` e universalmente riconosciuta. In effetti la legge ` e stata scoperta sperimentalmente dallo stesso Coulomb e potrebbe quindi essere chiamata a buon diritto “seconda legge di Coulomb”. William Gilbert (1564-1603) era un medico inglese, ben anteriore a Coulomb, che `e ricordato soprattutto per i suoi studi sul magnetismo terrestre e che aveva intuito che la forza magnetica dovesse aumentare al diminuire della distanza.
429
APPENDICI
Le prime connessioni quantitative fra fenomeni elettrici e magnetici sono state stabilite attraverso esperimenti basati sulle correnti elettriche2 . L’intensit` a della corrente elettrica, i, che fluisce in un conduttore `e definita attraverso la semplice equazione i=
dq , dt
e, a partire da essa, si pu` o definire la densit` a di corrente, j, come un vettore diretto lungo la direzione di moto delle cariche (positive) e avente per modulo j=
i , σ
essendo σ l’area della sezione del conduttore. Gli esperimenti compiuti, nella prima met` a del XIX secolo, soprattutto ad opera di Ørsted, Amp`ere e Faraday, hanno portato all’idea che le correnti elettriche creino nel loro intorno dei campi magnetici e che, allo stesso tempo, un campo magnetico sia in grado di agire sulle correnti con delle forze. Allo stesso tempo `e emersa chiaramente l’idea che i magneti permanenti contengano, a livello microscopico, un gran numero di correnti elettriche elementari responsabili, in ultima analisi, dei fenomeni della magnetostatica. In termini moderni, le propriet` a magnetiche delle correnti possono essere riassunte da un’unica legge che si esprime dicendo che, in situazioni stazionarie, l’elemento di corrente di un circuito elementare (microscopico o macroscopico), i1 d1 , agisce sull’elemento di corrente di un altro circuito elementare, i2 d2 , con una forza infinitesima, dF , data dalla legge vers r , dF = kA i2 d2 × i1 d1 × r2 o essere indipendente da quelle gi` a dove kA `e una nuova costante (che non pu` introdotte), e dove r `e il raggio vettore che va dall’elemento di corrente i 1 d1 all’elemento di corrente i2 d2 . Questa legge permette l’introduzione del vettore induzione magnetica. Anche in questo caso si ha un’arbitrariet`a nella definizione del campo e si ammette, in generale, che l’elemento di corrente i d crei dato da (prima legge di Laplace) un campo, dB, = kA β i d × dB
vers r , r2
(A1.2)
una e che un elemento di corrente i dl subisca, in presenza di un campo B, forza dF data da (seconda legge di Laplace) 2
Tali esperimenti furono resi possibili dalla scoperta della pila elettrica da parte di Alessandro Volta.
430
APPENDICI
dF =
1 i d × B . β
La quantit` a β introdotta in queste equazioni `e arbitraria. Vediamo adesso le conseguenze matematiche dell’Eq. (A1.2) considerando un circuito chiuso. Il vettore induzione magnetica `e dato da " vers r B = kA β i d × , r2 C dove C `e la curva chiusa descritta dal circuito. Mediante metodi standard della fisica-matematica, si pu`o mostrare che valgono le equazioni =0 , divB che conferma l’analoga equazione della magnetostatica, e = 4π kA β j , rotB dove j `e la densit` a di corrente. Questa equazione, detta legge di Amp`ere, vale per`o solo in situazioni stazionarie. Seguendo un ragionamento dovuto a Maxwell, essa pu` o essere trasformata in un’equazione pi` u generale valida anche per fenomeni variabili nel tempo. Per far questo osserviamo che, considerando la divergenza di entrambi i membri, si ottiene divj = 0 , mentre, in generale, deve valere l’equazione di continuit` a ∂ρ =0 , ∂t ρ essendo la densit`a di carica. Per riaggiustare le cose, basta ricordare l’espressione differenziale della legge di Coulomb, secondo la quale, prendendone la derivata rispetto al tempo, si ha divj +
∂ρ 1 ∂ , = (divE) ∂t 4π kC ∂t per cui, in generale, vale l’equazione
1 ∂E div j + 4π kC ∂t
=0 .
Il secondo addendo in parentesi `e la cosiddetta densit`a di corrente di sposta corretta per trattare mento. Con la sua introduzione, l’equazione per rotB, anche i fenomeni non stazionari, risulta
431
APPENDICI
− rotB
kA β ∂ E = 4π kA β j . kC ∂t
Restano infine da considerare i fenomeni di induzione magnetica. La legge che li descrive pu`o essere dedotta, almeno in un caso particolare, dalla seconda legge di Laplace. Si ottiene =− rotE
1 ∂B , β ∂t
per cui, riassumendo, le leggi che regolano i fenomeni elettromagnetici possono essere tutte racchiuse nelle quattro seguenti (equazioni di Maxwell) = 4π kC ρ , divE − kA β ∂ E = 4π kA β j , rotB kC ∂t
=0 , divB + rotE
1 ∂B =0 . β ∂t
Andiamo adesso a considerare le equazioni di Maxwell nel vuoto. Prendendo il rotore della terza equazione e sostituendo la quarta, si ottiene l’equazione delle onde = ∇2 B
kA ∂ 2 B . kC ∂t2
D’altra parte sappiamo che le onde elettromagnetiche si propagano nel vuoto con la velocit` a c, per cui si deve avere kA 1 = 2 , kC c ovvero kA =
kC , c2
una relazione che collega fra loro le quantit` a kA e kC indipendentemente dal sistema di unit` a considerato. Vediamo adesso come si procede nei due sistemi di unit` a pi` u utilizzati, il sistema c.g.s. di Gauss (talvolta anche detto sistema di Gauss-Hertz) e il Sistema Internazionale. Nel sistema c.g.s. di Gauss, si assume kC = 1, dimodoch´e l’unit` a di carica `e definita come quella carica che ne respinge una uguale, posta alla distanza di un cm, con la forza di una dyne. A tale unit`a si d` a il nome di Franklin oppure statamp`ere. Essendo kC = 1, ne risulta quindi kA = 1/c2 . In questo sistema, inoltre, si assume β = c, cosicch´e le equazioni di Maxwell si scrivono (cfr. Eq. (1.1)-(1.4))
432
APPENDICI
=0 , = 4π ρ , divB divE + 1 ∂B = 0 . − 1 ∂ E = 4π j , rotE rotB c ∂t c c ∂t Inoltre, la prima e la seconda legge di Laplace e la legge che le riassume si scrivono, rispettivamente, nella forma i vers r i , d × , dF = d × B c r2 c i2 i1 vers r d1 × dF = d2 × . c c r2
= dB
Nel Sistema Internazionale, invece, si preferisce introdurre due nuove costanti, la permittivit` a elettrica del vuoto (anche detta costante dielettrica del vuoto), 0 , e la permeabilit` a magnetica del vuoto, μ0 , tali che 0 μ0 =
1 . c2
Atraverso queste quantit` a, si pone kC = dimodoch´e si ha kA =
1 , 4π 0
kC 1 μ0 . = = c2 4π 0 c2 4π
In questo sistema, inoltre, si pone β = 1, per cui le equazioni di Maxwell si scrivono = divE − rotB
ρ , 0 1 ∂E
=0 , divB + ∂B = 0 . rotE ∂t
= μ0 j , c2 ∂t Inoltre, la prima e la seconda legge di Laplace e la legge che le riassume si scrivono, rispettivamente, nella forma μ0 vers r , i d × , dF = i d × B 4π r2 vers r μ0 i2 d2 × i1 d1 × . dF = 4π r2
= dB
(A1.3)
Per quanto riguarda i valori numerici di 0 e di μ0 , viene definito l’Amp`ere (unit` a di misura della corrente) come quella corrente che, percorrendo un filo rettilineo indefinito di spessore trascurabile, ne attrae uno uguale, posto alla
APPENDICI
433
distanza di un metro nel vuoto, con una forza per unit` a di lunghezza pari a 2 × 10−7 N m−1 . Per mezzo dell’Eq. (A1.3) si ricava che in tale geometria la forza per unit` a di lunghezza che agisce su uno dei due conduttori `e attrattiva ed `e data, in modulo, dalla seguente espressione dF μ0 i2 =2 , dl 4π r per cui se ne deduce che deve essere3 μ0 = 4π × 10−7 N A−2 = 1.256637 × 10−6 N A−2 , e quindi, ricordando che il Coulomb `e la carica trasportata in un secondo dalla corrente di un Amp`ere 0 =
1 = 8.854188 × 10−12 C2 N−1 m−2 . μ0 c2
Resta infine da analizzare la relazione esistente fra masse magnetiche e correnti. Dalle leggi di Laplace, si pu` o dedurre che un circuito piano filiforme di area σ, percorso dalla corrente i, si comporta, a distanze molto grandi rispetto alle sue dimensioni, come un dipolo magnetico diretto lungo il versore n perpendicolare alla superficie stessa, il verso di n essendo specificato dalla regola del cavatappi (o della vite destra). Questo `e il cosiddetto principio di equivalenza di Amp`ere, che si esprime mediante la formula μ = kP i σ n , dove kP `e una nuova costante da collegare a quelle precedentemente introdotte. Per stabilire questo collegamento, valutiamo, ad esempio, il momento delle forze che agisce sul dipolo elementare disposto in un punto dello spazio dove `e Utilizzando l’Eq. (A1.1), si ha persente un campo B. = 1μ = 1 kP i σ n × B . M ×B γ γ Dalla seconda legge di Laplace, invece, si ha " ) , = 1 i r × (d × B M β e sviluppando questa espressione per mezzo dei metodi della fisica matematica si ottiene = 1 i σ n × B . M β 3
Con l’introduzione delle grandezze fisiche capacit` a e autoinduzione e delle relative unit` a di misura, il Farad (F) e l’Henry (H), le unit` a in cui sono espresse μ0 e 0 risultano, rispettivamente, H m−1 e F m−1 .
434
APPENDICI
si ha quindi Confrontando le due espressioni per M kP =
γ . β
Infine, considerando la forza che si esercita tra due circuiti infinitesimi, trattati, in un primo caso, come dipoli elementari e, in un secondo caso, come spire percorse da corrente, si ottiene la relazione 2 kG kP = kA ,
che permette di esprimere kG nella forma kG =
kA kC β 2 = . 2 kP c2 γ 2
Nel sistema c.g.s. di Gauss, essendo kC = 1 e β = c, e assumendo γ = 1, si ottiene 1 kP = , kG = 1 . c Il principio di equivalenza di Amp`ere risulta quindi μ =
i σ n , c
e la legge di Gilbert
m1 m2 F = vers r . r2 Nel Sistema Internazionale, invece, essendo kC = 1/(4π0 ), e β = 1, assumendo4 γ = μ0 e ricordando che c2 = 1/(0 μ0 ), si ottiene kP = μ0 ,
kG =
1 . 4πμ0
Il principio di equivalenza di Amp`ere risulta quindi μ = μ0 i σ n , e la legge di Gilbert F =
1 m1 m2 vers r . 4π μ0 r2
Bisogna infine sottolineare che, oltre ai due qui introdotti, esistono altri sistemi di unit` a che sono stati utilizzati per i fenomeni elettromagnetici. In 4
Questa convenzione non `e universalmente accettata. Alcuni autori preferiscono assumere γ = 1 anche nel Sistema Internazionale. In questo caso il principio di equivalenza di Amp`ere si scrive μ = iσ n mentre nella legge di Gilbert il fattore μ0 viene a comparire al numeratore invece che al denominatore.
APPENDICI
435
particolare `e necessario menzionare il sistema c.g.s. elettrostatico, il sistema c.g.s. elettromagnetico e il sistema c.g.s. di Heavyside.
A.2 Algebra tensoriale In questo volume `e spesso necessario trattare con enti vettoriali e tensoriali e ` quindi con loro espressioni differenziali, quali divergenze, rotori e gradienti. E utile dare una breve introduzione dell’argomento allo scopo di rendere il lettore familiare con un formalismo compatto che permette di dedurre con facilit` a una serie di identit` a vettoriali e tensoriali e varie formule di trasformazione. La definizione tradizionale di tensore che viene comunemente data in fisica `e basata sulla generalizzazione della definizione di vettore. In un sistema di riferimento cartesiano ortogonale, il vettore v si definisce come un ente a tre componenti (vx , vy , vz ) oppure (v1 , v2 , v3 ), le quali, per una rotazione arbitraria del sistema di riferimento, si modificano secondo la legge vi =
Cij vj ,
j
dove i coefficienti Cij sono i coseni direttori dei nuovi assi rispetto ai vecchi. In stretta analogia, si definisce un tensore T di rango n come un ente a 3 n componenti (Ti...j con i, . . . , j = 1, 3) le quali, per rotazione del sistema di riferimento, si trasformano secondo la legge Ti...j =
Cik · · · Cjl Tk...l .
k,...,l
Il tensore pi` u noto in fisica `e il tensore degli sforzi che caratterizza, all’interno di un mezzo materiale elastico, la forza dF che si esercita attraverso una superficie orientata, dS, avente normale n. In componenti si ha dFi =
Tij nj dS .
j
Oltre al tensore degli sforzi si possono anche menzionare, per la loro importanza in vari campi della fisica, il tensore delle deformazioni, il tensore d’inerzia, il tensore dielettrico, e cos`ı via. Un particolare tensore di rango due `e la cosiddetta diade che si ottiene a partire da due vettori u e v andando a considerare il prodotto diretto delle loro componenti. La diade si indica semplicemente col simbolo u v , e si ha, per definizione (u v )ij = ui vj ,
(i, j = 1, 2, 3) .
436
APPENDICI
Evidentemente si ha u v = v u . Una quantit` a scalare `e, per definizione, un tensore di rango zero, mentre un vettore `e, per definizione, un tensore di rango uno. Tensori di rango pi` u elevato possono essere anche ottenuti considerando il prodotto diretto di tensori di rango pi` u basso. Ad esempio, dal prodotto diretto di due tensori di rango due si ottiene un tensore di rango quattro. L’algebra tensoriale riguarda l’insieme delle operazioni che possono essere eseguite sui tensori. Diamo in seguito alcune definizioni 1. Dati due tensori T e V, il primo do rango n (n ≥ 1) e il secondo di rango n (n ≥ 1), si definisce prodotto scalare (o prodotto interno) dei due tensori un tensore di rango (n + n − 2) ottenuto mediante una somma (saturazione) che opera sull’ultimo indice del primo tensore e sul primo indice del secondo tensore. Ad esempio, se n e n sono entrambi uguali a 2, detto W il tensore ottenuto attraverso il prodotto scalare, si ha che W `e un tensore anch’esso di rango due definito da Wij = Tik Vkj . k
2. Dato un tensore di rango n (con n ≥ 1), si intende per divergenza di tale tensore un tensore di rango (n−1) ottenuto saturando la sua prima componente (detto operatore “nabla”) definito da col vettore formale ∇ ≡ ∂ , ∂ , ∂ . ∇ ∂x ∂y ∂z Ad esempio, per un tensore T di rango due, div T `e un vettore, le cui componenti sono date da (div T)i =
∂ · T)i . Tji = (∇ ∂x j j
3. Dato un tensore di rango n (con n ≥ 0), si intende per gradiente di tale tensore un tensore di rango (n + 1) la cui prima componente `e “quella di derivazione”. Ad esempio, per un tensore di rango 1, ovvero per un vettore v , si ha v )ij = (grad v )ij = (∇
∂ vj . ∂xi
Bisogna notare che questa convenzione non `e universalmente adottata. Esistono alcuni autori che preferiscono indicare col simbolo grad v la quantit` a
437
APPENDICI
(grad v )ij =
∂ vi . ∂xj
` bene quindi che il lettore verifichi attentamente le convenzioni utilizzate da E ciascun autore prima di utilizzare le identit`a vettoriali che pu` o trovare su testi diversi. Ad esempio, utilizzando le nostre convenzioni, si ha i
ui
∂vj = (u · gradv )j , ∂xi
i
ui
∂vi = [(gradv ) · u ]j . ∂xj
le quantit` Utilizzando il vettore formale ∇, a a secondo membro possono anche scriversi, rispettivamente, come
v) v ) · u u · (∇ , (∇ . j
j
4. Dato un tensore di rango n (n ≥ 1), si intende per rotore di tale tensore un tensore dello stesso rango n la cui prima componente si ottiene saturando la prima componente del tensore dato con il tensore completamente antisimme trico (detto anche tensore di Ricci) e con le componenti del vettore formale ∇. Ad esempio, per un vettore v , si ha (rot v )i =
ijk
∂vk × v )i , = (∇ ∂xj
ikl
∂Tlj × T)ij . = (∇ ∂xk
jk
e, per un tensore T di rango due, (rot T)ij =
kl
Il tensore antisimmetrico di rango tre, ijk , introdotto in queste espressioni, `e definito dall’equazione ijk = 0 se almeno due dei tre indici i, j, k sono uguali, dall’equazione ijk = 1 se la terna ordinata (i, j, k) `e una permutazione pari della terna fondamentale (1, 2, 3), e dall’equazione ijk = −1 se la terna ordinata (i, j, k) `e una permutazione dispari della terna fondamentale (1, 2, 3). In definitiva, delle 27 componenti del tensore solo 6 sono diverse da zero. Si noti che l’usuale prodotto vettoriale fra due vettori pu` o convenientemente esprimersi attraverso il tensore antisimmetrico. Se w = u × v , si ha wi = ijk uj vk . jk
Si noti anche che l’operazione prodotto vettoriale e l’operatore rotore (che coinvolgono il tensore antisimmetrico) implicano una scelta a proposito della chiralit` a del sistema cartesiano ortogonale in cui sono definite le componenti dei
438
APPENDICI
vettori (e dei tensori). La convenzione che viene oggi quasi universalmente accettata (e che anche noi adottiamo) `e quella di scegliere una terna cosiddetta destrorsa, ovvero quella di supporre che, se gli assi x e y sono diretti rispettivamente lungo il pollice e l’indice della mano destra, l’asse z `e diretto lungo il dito medio. Il tensore antisimmetrico gode di un certo numero di propriet` a. La prima riguarda la permutazione dei suoi indici. Se la permutazione `e pari il tensore resta invariato, mentre se essa `e dispari, il tensore cambia di segno. In formule ijk = jki = kij = −jik = −ikj = −kji . Inoltre valgono le seguenti propriet` a di saturazione ijk lmk = δil δjm − δim δjl , k
ijk ljk = 2 δil ,
jk
ijk ijk = 6 ,
ijk
dove δij `e la cosiddetta delta di Kronecker, ovvero il simbolo definito da δij = 1 se i = j ,
δij = 0 se i = j .
Attraverso le definizioni date e le propriet` a sopra elencate, si possono facilmente dedurre le identit` a vettoriali riportate sotto. In tali equazioni, le quantit` a f e g sono scalari, a e b sono vettori, e T `e un tensore di rango due. •
div(fa ) = a · gradf + f div a .
(A2.1)
Infatti si ha div(fa ) =
•
∂ ∂f ∂ai (f ai ) = ai +f . ∂xi ∂xi ∂xi i i i
grad(f g) = g grad f + f grad g .
(A2.2)
Infatti si ha, per la componente i-esima, [grad(f g)]i = •
∂ ∂f ∂g (f g) = g +f . ∂xi ∂xi ∂xi
rot(fa) = grad f × a + f rota .
(A2.3)
439
APPENDICI
Infatti si ha, per la componente i-esima [rot(fa )]i =
ijk
jk
∂ ijk (f ak ) = ∂xj
jk
∂f ∂xj
∂ak ak + f = ∂xj
= [(grad f ) × a ]i + f [rota ]i . •
div(a × b ) = b · rota − a · rot b .
(A2.4)
Infatti si ha ⎛ ⎞ ∂ ∂aj ∂bk ⎝ div(a × b ) = b k + aj = ijk aj bk ⎠ = ijk ∂xi ∂xi ∂xi i jk
=
ijk
•
bk kij
ijk
∂aj ∂bk − aj jik = bk (rota)k − aj (rotb)j . ∂xi ∂xi j ijk
k
grad(a · b ) = (grada ) · b + (grad b ) · a .
(A2.5)
Infatti si ha, per la componente i-esima ⎛ ⎞
∂bj ∂aj ∂ ⎝ ⎠ bj + = aj b j = aj grad(a · b ) = ∂xi ∂xi ∂xi i j j j
= (grada ) · b + (grad b ) · a i
•
.
i
rot(a × b ) = b · grada − a · grad b + a div b − b div a .
(A2.6)
Infatti si ha, per la componente i-esima
∂ ∂ rot(a × b ) = ijk (a × b )k = ijk klm (al bm ) = ∂xj ∂xj i jk jklm ∂bm ∂al = b m + al = (δil δjm − δim δjl ) ∂xj ∂xj jlm ∂ai ∂aj ∂bj ∂bi = bj = − bi + ai − aj ∂xj ∂xj ∂xj ∂xj ij
= b · grada − bi div a + ai div b − a · grad b . i
•
grad (fa ) = (gradf ) a + f grada .
i
(A2.7)
440
APPENDICI
Infatti si ha, per la componente ij ∂ ∂aj ∂f aj + f (f aj ) = = (gradf )i aj + f (grada )ij . [grad(fa )]ij = ∂xi ∂xi ∂xi •
div ( a b ) = b div a + a · grad b .
(A2.8)
Infatti si ha, per la componente i-esima
∂ ∂aj ∂bi div( a b ) = b i + aj = (aj bi ) = ∂xj ∂xj ∂xj i j j = bi div a + [a · grad b ]i . •
a × rot b = (grad b ) · a − a · grad b .
(A2.9)
Infatti si ha, per la componente i-esima
∂bm a × rot b = ijk aj (rot b )k = ijk klm aj = ∂xl i jk
=
jklm
(δil δjm − δim δjl ) aj
jlm
= •
∂bm = ∂xl
∂bj ∂bi aj = (grad b ) · a − a · grad b − aj . ∂xi ∂xj i i j
div(f T) = (gradf ) · T + f div T .
(A2.10)
Infatti si ha, per la componente i-esima ∂ ∂f ∂Tji Tji + f = [div(f T) ]i = (f Tji ) = ∂xj ∂xj ∂xj j j = [(gradf ) · T ]i + f (div T)i . •
rot (rota ) = grad div a − ∇2a .
(A2.11)
Infatti si ha, per la componente i-esima [rot (rota ) ]i =
jk
ijk
∂ ∂ ∂ (rota )k = ijk klm am = ∂xj ∂xj ∂xl jklm
∂ 2 am (δil δjm − δim δjl ) = = ∂xj ∂xl jlm ∂ 2 aj ∂ 2 ai = = [grad div a ]i − ∇2a i . − ∂xj ∂xi ∂xj ∂xj j
441
APPENDICI
Esistono inoltre altre identit`a vettoriali che valgono per` o soltanto in forma integrale e che discendono dai teoremi di Gauss e di Stokes-Amp`ere che qui ricordiamo. Teorema di Gauss: Se Σ `e una superficie chiusa che racchiude il volume V , e se n `e la normale esterna a tale superficie, il teorema di Gauss si enuncia attraverso l’equazione • a · n dS = div a dV , V
Σ
dove a `e un vettore arbitrario funzione del punto. Teorema di Stokes-Amp`ere: se `e un circuito chiuso e se Σ `e una superficie che si appoggia su tale circuito, il teorema di Stokes-Amp`ere si enuncia attraverso l’equazione " • a · d = rota · n dS ,
Σ
essendo n la normale esterna alla superficie. A proposito di questo integrale bisogna osservare che la sua validit` a implica una convenzione a proposito del senso di percorrenza del circuito la quale dipende a sua volta dalla convenzione implicita nella definizione dell’operatore “rotore”. Quando il sistema (x, y, z) utilizzato per definire le componenti dei vettori `e un sistema destrorso, allora il senso di percorrenza del circuito `e quello che risulta dalla regola del cavatappi (o della vite destra), per la quale la direzione di n va fatta coincidere col senso di avanzamento del cavatappi. Dai teoremi di Gauss e di Stokes-Amp`ere discendono varie identit` a. Alcune di esse sono riportate nel seguito. " • f d = n × gradf dS .
Σ
Per dimostrare questa identit`a, si osserva che, se c `e un vettore costante e per il resto arbitrario, si ha " " c · f d = (f c ) · d ,
e, applicando il teorema di Stokes-Amp`ere " rot(fc ) · n dS . c · f d =
Σ
Ricordando l’identit` a vettoriale dell’Eq. (A2.3), e tenendo presente che c `e un vettore costante, si ha " c · f d = [(gradf ) × c ] · n dS = c · n × gradf dS .
Σ
Σ
442
APPENDICI
Essendo c un vettore arbitrario, da questa equazione segue l’identit` a che volevamo dimostrare. Con procedimenti del tutto analoghi e tenendo conto delle identit` a vettoriali dimostrate precedentemente si ottengono le ulteriori identit` a " • a × d = [ n div a − (grada ) · n ] dS .
Σ
n × a dS =
•
rota dV . V
Σ
•
f n dS = Σ
gradf dV . V
In particolare, se si pone in quest’ultima identit` a f = 1, si ottiene • n dS = 0 , Σ
che costituisce un’importante relazione geometrica valida per una superficie chiusa arbitraria.
A.3 La funzione delta di Dirac La funzione delta di Dirac, tradizionalmente indicata col simbolo δ(x), pu` o essere immaginata come una funzione che `e nulla per qualsiasi valore di x, fatta eccezione per un intervallo infinitesimo centrato nell’origine dove presenta un picco molto elevato tendente all’infinito, ma tale che l’integrale della funzione in dx sia uguale a 1. Ovviamente non si tratta di una vera e propria funzione ma pu` o essere pensata come il limite di una famiglia di funzioni dipendenti da un parametro che viene fatto tendere verso un valore appropriato. Ad esempio, se consideriamo la famiglia di funzioni f (x, a) cos`ı definita 1 per |x| ≤ a 2 , f (x, a) = a 0 per |x| > a 2 si ha che δ(x) = lim f (x, a) . a→0
Analogamente, se si considera la famiglia g(x, a) = √
2 1 e−(x/a) , 2π a
443
APPENDICI
ancora si ha δ(x) = lim g(x, a) . a→0
Esistono infinite possibilit`a di rappresentare la delta di Dirac come limite di opportune famiglie di funzioni. Le rappresentazioni che si incontrano pi` u comunemente in fisica-matematica sono le seguenti δ(x) = lim
1 sin(Ω x) , π x
δ(x) = lim
1 sin2 (Ω x) . π Ω x2
Ω→∞
Ω→∞
La propriet` a fondamentale della delta di Dirac `e riassunta nella seguente espressione, che ne costituisce la definizione formale ∞ F (x) δ(x) dx = F (0) , −∞
e dalla quale conseguono, per mezzo di semplici cambiamenti di variabile, le due seguenti ∞ F (x) δ(x − x0 ) dx = F (x0 ) , −∞
∞
F (x) δ(ax) dx = −∞
1 F (0) , |a|
dove a `e un numero reale qualsiasi diverso da zero. Da queste equazioni si pu`o ottenere un’importante generalizzazione che riguarda la delta di Dirac il cui argomento `e una funzione reale arbitraria g(x). Indicando tale quantit` a con la notazione δ[g(x)] e indicando con xi gli eventuali zeri della funzione g(x), si ha ∞ 1 F (xi ) , F (x) δ[g(x)] dx = (x )| |g i −∞ i dove g (x) indica la derivata della funzione g(x) rispetto al proprio argomento. Ulteriori generalizzazioni al caso della delta di Dirac tridimensionale sono illustrate direttamente nel testo (si veda il Par. 3.2). Esiste infine anche la possibilit`a di dare significato alla derivata della funzione delta di Dirac, δ (x), definita dalla usuale relazione δ (x) = lim
Δx→0
δ(x + Δx) − δ(x) . Δx
Per mezzo di questa definizione si ha, per una funzione F (x) arbitraria
444
APPENDICI
∞
∞
F (x) δ (x) dx = lim −∞
Δx→0
F (x) −∞
δ(x + Δx) − δ(x) dx , Δx
dalla quale si ottiene ∞ F (−Δx) − F (0) = −F (0) . F (x) δ (x) dx = lim Δx→0 Δx −∞
A.4 Le leggi dell’elettromagnetismo ritrovate Nel testo abbiamo calcolato, a partire dai potenziali di Li´enard e Wiechart, le espressioni del campo elettrico e del campo magnetico, valutati in un punto arbitrario dello spazio, dovuti a una singola carica mobile. I risultati sono contenuti nelle Eq. (3.19) e (3.20). Vediamo adesso come da tali equazioni si possano ricavare, nel limite non relativistico, le equazioni elementari dell’elettromagnetismo valide per fenomeni stazionari. Lo scopo di questa appendice `e una semplice verifica di consistenza in quanto `e ovvio che le equazioni da cui partiamo, essendo conseguenza delle equazioni di Maxwell, devono gi`a contenere quei risultati che, anche storicamente, stanno alla base delle equazioni di Maxwell stesse. Consideriamo una particella, avente carica elettrica e, mobile entro un conduttore elettrico a sezione costante. La sua velocit` a `e molto minore della velocit` a della luce. Per fissare le idee, possiamo pensare che tale velocit` a sia dell’ordine di 10−2 cm s−1 , che rappresenta l’ordine di grandezza delle velocit`a di drift degli elettroni che si stabiliscono all’interno di un conduttore in un tipico circuito elettrico macroscopico. Il corrispondente valore di β `e dell’ordine di 10−12 , dimodoch´e l’approssimazione β 2 1 `e sicuramente verificata. Inoltre, gli effetti di curvatura del conduttore (che provocano delle piccolissime accelerazioni) possono essere senz’altro trascurati dimodoch´e possiamo supporre che il campo elettrico sia dato soltanto dal termine Coulombiano dell’Eq. (3.19). Trascurando termini dell’ordine di β 2 tale campo si scrive nella forma e (n − β ) , κ3 R 2 dove κ, R, n sono le quantit` a introdotte nel Cap. 3 che devono essere calcolate al tempo anticipato t . Il campo magnetico `e poi dato dall’Eq. (3.20), ovvero r , t) = E(
r, t) . B(r, t) = n × E( Si pu` o subito osservare che, se si pone β = 0, ovvero se si considera una carica elettrica a riposo, non `e ovviamente necessario considerare la differenza fra tempo vero e tempo anticipato e si ottiene
445
APPENDICI
P
R’
n’ Pt’
R
n β R’
Pt
Fig. A.1. Si intende calcolare il campo elettrico nel punto P all’istante t. Pt ` e la posizione della particella al medesimo istante, mentre Pt ` e la posizione della particella all’istante anticipato.
r ) = e n , E( R2
r) = 0 . B(
Queste sono le ordinarie equazioni dell’elettrostatica che traducono, in termini di campi, la legge di Coulomb. Andiamo adesso a vedere cosa si ottiene al primo ordine in β. Con facili considerazioni si pu` o mostrare che il campo elettrico E(r, t) `e esattamente uguale a quello che si calcolerebbe in base alla legge di Coulomb supponendo, ipoteticamente, che la velocit`a della luce fosse infinita (ovvero trascurando la differenza fra tempo vero e tempo anticipato). Infatti, facendo riferimento alla Fig. A.1 e indicando con un’apice le quantit` a valutate al tempo anticipato t e senza apice le stesse quantit` a valutate all’istante t, si ha t = t −
R , c
= R + (t − t ) v = R + R β , R
dalla quale segue, dividendo per R = n − β
R . R
(A4.1)
Introducendo le nuove notazioni nell’espressione del campo elettrico, e ricor `e costante, si ottiene dando che β r, t) = E(
e eR (n − β) = 3 3 . 2 R κ R
κ3
446
APPENDICI
D’altra parte si ha, per definizione κ = 1 − β · n , e applicando il teorema di Carnot al triangolo PPt Pt , · n + β 2 . R = R 1 − 2β
(A4.2)
Sostituendo nell’espressione del campo elettrico si ottiene il risultato che avevamo anticipato, ovvero, a meno di termini dell’ordine di β 2 2 3/2 e n r , t) = e R (1 − 2β · n + β ) 2 . E( 3 3 R R (1 − β · n )
Resta da valutare il contributo del campo magnetico. Per esso si ha r, t) = n × E( r, t) = e n × n . B( R2
D’altra parte, sempre a meno di termini dell’ordine di β 2 , si ha, dalle Eq. (A4.1) e (A4.2) n = β + n (1 − β · n) , per cui r, t) = e β × n . B( R2 Applichiamo adesso questa equazione al caso di un elemento di conduttore di lunghezza d. Indicando con N la densit` a numerica delle particelle cariche mobili e con S la sezione trasversale del conduttore, nell’elemento `e contenuto un parallela al d. numero di particelle dato da N S d, dotate di velocit` a v = c β, Tale numero `e esattamente compensato da un ugual numero di particelle fisse di carica opposta, per cui il campo elettrico risultante `e nullo per la propriet` a precedentemente dimostrata. Per il campo magnetico si ha invece NSv n d × 2 . c R D’altra parte, se si indica con i l’intensit` a di corrente che fluisce nel conduttore si ha B(r, t) = e
i = eN S v , per cui l’equazione per il campo magnetico si scrive B(r, t) =
n i d × 2 . c R
447
APPENDICI
Questa non `e altro che la seconda legge di Laplace che esprime il campo magnetico generato da un elemento di corrente. Come risulta chiaro dalla nostra deduzione, sebbene le cariche elettriche si muovano entro il conduttore a bassissima velocit`a, esse sono ciononostante in grado di creare un effetto relativistico che si manifesta con la presenza del campo magnetico.
A.5 L’equazione di Larmor nel caso relativistico Nella zona di radiazione le Eq. (3.18) e (3.20) forniscono l’espressione dei campi elettrico e magnetico dovuti a una carica in movimento r , t) = E(
e n × [(n − β ) × a ] , c2 κ 3 R
r , t) = n × E( r , t) , B(
dove e `e il valore della carica elettrica, c `e la velocit`a della luce, n `e il versore del raggio vettore che va dalla carica al punto di coordinate r, R `e il modulo di tale vettore, β = v /c `e la velocit`a della carica in unit` a della velocit`a della luce, a `e la sua accelerazione, e κ `e definito dall’equazione κ = 1 − n · β . e a che compaiono nelle Bisogna anche ricordare che le quantit`a R, κ, n, β, equazioni precedenti devono essere valutate al tempo anticipato t , legato a t dall’equazione R . c Sviluppando il doppio prodotto vettoriale, si ottiene t = t −
e ) − κ a ] . [(n · a )(n − β c2 κ 3 R D’altra parte, come sappiamo, il vettore di Poynting `e dato da r, t) = E(
r, t) = c E 2 (r, t) n , S( 4π e sviluppando il quadrato del campo elettrico, si ottiene, con facili passaggi 2 2 · a ) (1 − β 2 )(n · a )2 e a ( n · a )( β r , t) = S( n . +2 − 4π c3 R2 κ4 κ5 κ6 Questa espressione mostra che, nel caso generale, la distribuzione angolare della radiazione emessa (ovvero il diagramma di radiazione) `e relativamente complicata. I casi particolari in cui l’accelerazione `e parallela o perpendicolare alla
448
APPENDICI
velocit`a sono gi` a stati analizzati nel testo. Qui `e sufficiente sottolineare il fatto che, per velocit` a e accelerazione arbitrarie, esistono sempre due direzioni per le quali il vettore di Poynting `e nullo. Questo pu` o essere visto semplicemente dall’espressione del campo elettrico. Lungo le direzioni caratterizzate dai versori sia parallelo al vettore a, il campo elettrico `e ovn0 tali che il vettore n0 − β viamente nullo, e cos`ı anche il vettore di Poynting. Le direzioni n0 sono quindi e a e sono date dalle soluzioni contenute nel piano individuato dai vettori β dell’equazione (n0 − β ) × a = 0 . Indicando con α l’angolo che il vettore velocit` a forma con il vettore accelerazione, i versori n0 sono individuati dagli angoli θ± (contati a partire dal vettore accelerazione nello stesso senso di α) dati da θ+ = arcsin(β sinα) ,
θ− = π − arcsin(β sinα) .
Ad esempio, se α = 45◦ , e β = 0.8, si ha θ+ = 34◦ .45 e θ− = 145◦ .55. Passiamo adesso al calcolo della potenza. Per questo bisogna osservare che se si eseguisse semplicemente l’integrale " r, t) · n R2 dΩ , (A5.1) I = S( esteso a una sfera di raggio R centrata sulla posizione della carica all’istante anticipato, (t − R/c), si otterrebbe il rapporto fra l’energia che traversa la sfera in un intervallo di tempo dt e il dt stesso. Questa `e per`o una quantit` a di interesse minore. Pi` u interessante `e trovare la potenza istantanea emessa dalla particella carica. Per questo bisogna tener conto del fatto che l’energia che traversa la sfera in un tempo dt `e stata emessa dalla particella in un tempo dt che dipende dalla direzione e che `e legato a dt dalla relazione dt = κ dt . Per trovare la potenza W emessa dalla particella bisogna quindi eseguire l’integrale " " dt 2 r, t) · n κ R2 dΩ . W = S(r, t) · n R dΩ = S( dt Sostituendo l’espressione del vettore di Poynting trovata precedentemente si ha quindi " 2 · a ) (1 − β 2 )(n · a )2 e2 a (n · a )(β W = dΩ . +2 − 4π c3 κ3 κ4 κ5
449
APPENDICI
Per eseguire questo integrale, introduciamo un sistema di coordinate polari (ψ, χ) con l’asse polare diretto lungo il vettore velocit`a e con l’azimut χ misurato a partire dal piano contenente la velocit`a e l’accelerazione. Con ovvie a, e n sono dati da notazioni, in questo sistema i tre vettori β, β = β k ,
a = a⊥ı + ak ,
n = sinψ cosχı + sinψ sinχ j + cosψ k ,
per cui l’integrando si pu` o scrivere nella forma a2 + a2⊥ (1 − β cosψ)3 −(1 − β 2 )
+ 2 β a
sinψ cosχ a⊥ + cosψ a (1 − β cosψ)4
sin2 ψ cos2 χ a2⊥ + 2 sinψ cosψ cosχ a⊥ a + cos2 ψ a2 (1 − β cosψ)5
,
e il dΩ risulta dato da sinψ dψ dχ. Eseguendo l’integrazione in dχ nell’intervallo (0, 2π), i fattori che non contengono nessuna funzione di χ danno per risultato 2π, quelli contenenti cosχ danno risultato nullo, mentre il fattore contenente cos2 χ d` a per risultato π. Si ottiene allora π a2 + a 2 2 β cosψ a2 e2 ⊥ + W = 2 c3 0 (1 − β cosψ)3 (1 − β cosψ)4 2 1 2 2 2 sin ψ a + cos ψ a ⊥ 2 sinψ dψ . − (1 − β 2 ) (1 − β cosψ)5 Gli integrali in dψ che compaiono in questa espressione sono elementari e possono essere eseguiti facilmente sia integrando per parti che, alternativamente, per mezzo del cambiamento di variabile x = 1 − β cosψ. Si ottiene 1 π 1 1 sinψ dψ = , 2 0 (1 − β cosψ)3 (1 − β 2 )2 cosψ β 1 π 4 sinψ dψ = , 2 0 (1 − β cosψ)4 3 (1 − β 2 )3 1 π sin2 ψ 1 2 sinψ dψ = , 5 2 0 (1 − β cosψ) 3 (1 − β 2 )3 cos2 ψ 1 π 1 1 + 5β 2 sinψ dψ = . 2 0 (1 − β cosψ)5 3 (1 − β 2 )4 Sostituendo queste espressioni e raccogliendo separatamente i termini in a2 e in a2⊥ , si ottiene
450
APPENDICI
β2 1 e2 8 1 1 + 5β 2 2 a W = + − 2 c3 (1 − β 2 )2 3 (1 − β 2 )3 3 (1 − β 2 )3 1 1 1 2 , − + a⊥ (1 − β 2 )2 3 (1 − β 2 )2 ovvero, sviluppando 2 e2 W = 3 c3
a2
a2⊥ + (1 − β 2 )3 (1 − β 2 )2
.
Ricordando la definizione del fattore relativistico γ 1 γ= # , 1 − β2 l’espressione per la potenza emessa da una carica relativistica in moto accelerato pu` o anche scriversi nella forma pi` u significativa W =
2 e2 6 2 (γ a + γ 4 a2⊥ ) . 3 c3
Questa formula generalizza l’equazione di Larmor (3.23) al caso relativistico. Ovviamente per γ = 1 si ritrova l’equazione di Larmor in quanto a2 + a2⊥ = a2 . Per concludere bisogna notare che, se avessimo eseguito l’integrale del vettore di Poynting sulla sfera senza tener conto della differenza fra il dt e il dt , ovvero l’integrale I dell’Eq. (A5.1), avremmo ovviamente ottenuto un’espressione diversa. Tenendo conto che 1 2 1 2 1 2 1 2
π
1 1 3 + β2 sinψ dψ = , (1 − β cosψ)4 3 (1 − β 2 )3
π
1 β (5 + β 2 ) cosψ sin ψ dψ = , (1 − β cosψ)5 3 (1 − β 2 )4
π
sin2 ψ 2 5 + β2 sinψ dψ = , 6 (1 − β cosψ) 15 (1 − β 2 )4
π
cos2 ψ 1 5 + 38 β 2 + 5 β 4 sinψ dψ = , (1 − β cosψ)6 15 (1 − β 2 )5
0
0
0
0
si ha infatti I=
2 e2 8 1 2 2 2 2 6 2 γ . (1 + β ) a + γ (1 + β ) a ⊥ 5 5 3 c3
451
APPENDICI
Questa differenza fra potenza emessa dalla particella, W , e potenza ricevuta sulla sfera, I, `e un semplice effetto cinematico e non ha niente a che vedere con la relativit` a. Un effetto simile `e presente anche per le onde acustiche emesse, per esempio, da un aereo che viaggi a una velocit`a prossima a quella del suono. Mentre la potenza in onde acustiche emessa dall’aereo `e fissa, la potenza ricevuta pu` o essere molto grande e al limite infinita se l’aereo viaggia esattamente alla velocit`a del suono (il cosiddetto bang sonico che accade talvolta di percepire `e proprio dovuto a tale fenomeno).
A.6 Irraggiamento di onde gravitazionali Le equazioni che abbiamo ottenuto per l’irraggiamento di onde elettromagnetiche possono anche essere applicate, con alcune leggere modifiche, per trattare l’irraggiamento di onde gravitazionali. Ovviamente questo modo di procedere non `e rigoroso, in quanto le leggi dell’irraggiamento di onde gravitazionali dovrebbero essere dedotte dalla teoria della gravitazione universale. L’approccio qui seguito `e tuttavia sufficiente per la comprensione delle propriet`a fondamentali dei meccanismi di generazione delle onde gravitazionali e conduce a formule sostanzialmente corrette (come pu`o essere verificato a posteriori). Nelle equazioni per l’irraggiamento elettromagnetico dedotte nel Par. 3.10 eseguiamo la trasformazione formale e i → mi ,
(i = 1, . . . N ) ,
ovvero sostituiamo, per ciascuna particella, la carica con la massa. Inoltre, nelle equazioni che esprimono il vettore di Poynting, ovvero in quelle che esprimono la potenza irraggiata, moltiplichiamo il secondo membro per la costante di gravitazione universale G. Notiamo, per inciso, che in tali equazioni il fattore dimensionale [e2 ] viene cos`ı sostituito dal fattore dimensionale [Gm2 ] avente le stesse dimensioni. Le varie quantit` a introdotte nel Par. 3.10, ovvero il mo (Eq. (3.31)), il momento di dipolo magnetico, M mento di dipolo elettrico, D (Eq. (3.32)), e il tensore simmetrico di ordine due (collegato al momento di quadrupolo elettrico), Q / (Eq, (3.33)), si trasformano in altrettante quantit`a G, M G, e Q per le quali utilizzeremo, rispettivamente, i simboli D / G , ovvero = D
N
G = ei si → D
i=1
N
mi si ,
i=1
= 1 G = 1 M ei si × vi → M mi si × vi , 2 c i=1 2 c i=1 N
Q / =
N i=1
ei si si → Q /G =
N
N i=1
mi si si .
452
APPENDICI
G , l’analogo del dipolo elettrico, altro Osserviamo adesso che la quantit`a D non `e, per definizione, se non la coordinata del centro di massa del sistema di N particelle, rG , moltiplicata per la massa totale. Si ha cio`e G = D
N
mi si = M rG ,
i=1
dove M=
N
mi .
i=1
Si ha quindi, per un sistema isolato 2 .. = M d rG = 0 . D G dt2
G , l’analogo del dipolo magnetico, risulta proporzionale Inoltre, la quantit` aM in quanto al momento angolare totale del sistema, J, G = 2cM
N
mi si × vi = J .
i=1
Si ottiene quindi, per un sistema isolato, . = d J = 0 , M G dt e quindi, a pi` u forte ragione .. =0 . M G In base alla nostra analogia, si conclude da queste considerazioni che per le onde gravitazionali non si ha l’analogo della radiazione di dipolo elettrico n´e l’analogo della radiazione di dipolo magnetico. Resta quindi soltanto l’analogo della radiazione di quadrupolo elettrico (oltre, ovviamente, alla radiazione dovuta a multipoli pi` u elevati). Il tensore Q / G viene tradizionalmente indicato col simbolo /I, in quanto si tratta sostanzialmente di un tensore d’inerzia. Non bisogna per` o confonderlo col tensore d’inerzia ordinario, I, che viene introdotto nello studio della dinamica del corpo rigido e che `e definito da I=
N
mi (s2i U − si si ) ,
i=1
dove U `e il tensore unitario. Si ha ovviamente
453
APPENDICI
/I = −I +
1 2
(Tr I) U ,
in quanto, per definizione di traccia di un tensore Tr I =
mi (3 s2i − x2i − yi2 − zi2 ) = 2
i
mi s2i .
i
I due tensori I e /I differiscono fra loro per una quantit` a proporzionale al tensore unitario. Questa propriet`a `e strettamente analoga a quella che sussiste fra i tensori Q e Q / dell’elettrodinamica per cui, nella nostra analogia, la potenza emessa in onde gravitazionali all’ordine pi` u basso nello sviluppo multipolare si pu` o dedurre dall’Eq. (3.34) ed `e data da G ... 2 Ijk . 20 c5
WG =
jk
Questa formula `e corretta in tutto fuorch´e nel fattore numerico. Calcoli basati sulla teoria della gravitazione universale non ne cambiano la struttura ma si li1 mitano a sostituire il fattore 20 col fattore 15 . Intuitivamente si pu` o giustificare questa moltiplicazione per un fattore 4 osservando che un’onda elettromagne e B, trasversali rispetto tica `e descritta da due vettori non indipendenti, E alla direzione di propagazione. Se z `e tale direzione, due sole componenti di uno dei due campi, ad esempio Ex ed Ey , sono sufficienti per descrivere l’onda. Un’onda gravitazionale `e invece descritta da due tensori indipendenti trasversali rispetto alla direzione di propagazione. Se si indicano tali tensori con i simboli tradizionali e+ ed e× , l’onda risulta descritta dall’ottupla di compo+ + + × × × × nenti (e+ xx , exy , eyx , eyy , exx , exy , eyx , eyy ). Ne risulta quindi un fattore 4 legato, per cos`ı dire, ai gradi di libert` a della polarizzazione. La formula corretta per la potenza emessa in onde gravitazionali `e quindi WG =
G ... 2 Ijk . 5 c5 jk
Conviene infine osservare che, se si cambia centro di riduzione ponendo si = b + si , con b vettore costante, si ottiene, per il nuovo tensore d’inerzia I ,
I = I + M (2 b · rG + b2 ) U − b b − b rG − rG b , per cui, per un sistema isolato, I¨ = I¨ ,
454
APPENDICI
... ... e, a pi` u forte ragione, I = I . Queste considerazioni autorizzano a calcolare il tensore d’inerzia a partire da un centro di riduzione arbitrario al fine di determinare la potenza di emissione di onde gravitazionali.
A.7 Calcolo dell’integrale di Thomas-Fermi Nelle applicazioni del modello atomico di Thomas-Fermi si rende necessario il calcolo del seguente integrale
∞
I= 0
(1 + χ) χ3/2 dx , x1/2
dove χ(x) `e la soluzione dell’equazione di Thomas-Fermi x1/2 χ = χ3/2 , che soddisfa le condizioni al contorno χ(0) = 1 ,
lim χ(x) = 0 .
x→∞
L’integrale si spezza nella somma di due integrali I = I1 + I2 ,
(A7.1)
dove I1 =
∞
0
χ3/2 dx , x1/2
I2 = 0
∞
χ5/2 dx . x1/2
Il primo integrale `e banale in quanto, tenendo conto dell’equazione di ThomasFermi e delle condizioni al contorno della funzione χ, si ha ∞ I1 = χ dx = −χ (0) . (A7.2) 0
Il calcolo del secondo integrale `e pi` u complesso e lo si pu`o affrontare cos`ı: da un lato si ha I2 = 0
∞
χ5/2 dx = x1/2
∞
χ χ dx ,
0
e, integrando per parti e tenendo conto che χ(0) = 1 ∞ I2 = −χ (0) − χ 2 dx . 0
(A7.3)
455
APPENDICI
D’altra parte, considerando la quantit` a x−1/2 dx come fattore differenziale, integrando di nuovo per parti e ricordando l’equazione di Thomas-Fermi, si ottiene I2 =
∞
0
χ5/2 dx = −5 x1/2
∞
1/2 3/2
x
χ dx = −5
χ
0
∞
x χ χ dx .
0
o esprimere nella forma Adesso si osserva che il prodotto χ χ si pu` 1 dχ 2 , 2 dx e, di nuovo integrando per parti, si ottiene 5 ∞ 2 I2 = χ dx . 2 0 χ χ =
Confrontando questa espressione con l’Eq. (A7.3), si ottiene ∞ 2 5 χ 2 dx = − χ (0) , ovvero, I2 = − χ (0) . 7 7 0 Infine, ricordando le Eq. (A7.1) e (A7.2)
∞
I= 0
(1 + χ) χ3/2 12 dx = − χ (0) . 7 x1/2
(A7.4)
A.8 Energia della configurazione normale dell’atomo di Silicio Come applicazione dei risultati ottenuti nel Cap. 8, valutiamo l’energia che compete alla configurazione normale dell’atomo di Silicio, ovvero alla configurazione 1s2 2s2 2p6 3s2 3p2 . Per eseguire questi calcoli `e necessario preliminarmente valutare alcuni simboli 3-j. Per mezzo della formula analitica riportata nell’Eq. (7.16), si ha
0 0
0 0 0 0
2
=1 ,
0 0
1 1 0 0
2
=
1 3
,
1 1 0 0
2 0
2 =
2 15
.
La configurazione contiene quattro sottozone chiuse e una sottozona aperta. L’Hamiltoniana H0 (definita nell’Eq. (7.3)) e la parte F dell’Hamiltoniana H1 (definita nelle Eq. (8.2) e (8.3)) portano cinque contributi, uno per ciascuna sottozona (chiusa o aperta). L’energia corrispondente, che indichiamo con E 1 , si ottiene per mezzo dell’Eq. (8.7) ed `e data da
456
APPENDICI
E1 = 2 W0 (1s) + 2 W0 (2s) + 6 W0 (2p) + 2 W0 (3s) + 2 W0 (3p) + 2 I(1s) + 2 I(2s) + 6 I(2p) + 2 I(3s) + 2 I(3p) , dove W0 `e definito dall’Eq. (7.11) e I(n, l) `e l’integrale definito nell’Eq. (8.6). L’energia di interazione Coulombiana (ovvero la parte G dell’Hamiltoniana H1 ) entro le sottozone chiuse porta quattro contributi, uno per ciascuna sottozona. Indicando con E2 l’energia corrispondente si ha, per mezzo dell’Eq. (8.17) E2 = F 0 (1s, 1s) + F 0 (2s, 2s) + 15 F 0 (2p, 2p) −
6 5
F 2 (2p, 2p) + F 0 (3s, 3s) ,
dove le quantit` a F k (na la , nn lb ) sono definite nell’Eq. (8.9). Andando poi a considerare l’energia di interazione Coulombiana fra sottozone chiuse diverse, si hanno sei contributi, tante quante le coppie distinte che si possono formare con le quattro sottozone chiuse. Indicando con E3 l’energia corrispondente si ha, per mezzo delle Eq. (8.14) e (8.16) E3 = 4 F 0 (1s, 2s) − 2 G0 (1s, 2s) + 12 F 0 (1s, 2p) − 2 G1 (1s, 2p) + 4 F 0 (1s, 3s) − 2 G0 (1s, 3s) + 12 F 0 (2s, 2p) − 2 G1 (2s, sp) + 4 F 0 (2s, 3s) − 2 G0 (2s, 3s) + 12 F 0 (2p, 3s) − 2 G1 (2p, 3s) , dove le quantit` a Gk (na la , nn lb ) sono definite nell’Eq. (8.10). Infine resta da valutare il contributo dell’interazione Coulombiana fra la sottozona aperta 3p e le quattro sottozone chiuse. Indicando con E4 l’energia corrispondente si ha, per mezzo delle Eq. (8.13) e (8.15) E4 = 4 F 0 (1s, 3p) − − 2 G0 (2p, 3p) −
2 3 4 5
G1 (1s, 3p) + 4 F 0 (2s, 3p) − G2 (2p, 3p) + 4 F 0 (3s, 3p) −
1 2 3 G (2s, 3p) + 1 2 3 G (3s, 3p) .
12 F 0 (2p, 3p)
L’energia della configurazione fondamentale dell’atomo di Silicio, che indichiamo con E, si ottiene per semplice addizione dei quattro termini, ovvero E = E 1 + E2 + E3 + E4 . I quattro contributi all’energia che abbiamo calcolato sono degeneri rispetto a tutti gli stati della configurazione e la stessa propriet`a vale ovviamente anche per E. La parte restante che resta da calcolare `e data dall’ Eq.(8.11) con la somma estesa alla sole coppia di elettroni appartenenti alla sottozona aperta 3p. Il calcolo esplicito `e svolto nel Par. 8.6. I due elettroni 3p danno luogo a tre termini, ovvero, in ordine di energia crescente, 3P , 1D, e 1S, con un rapporto pari a 3/2 fra l’intervallo (1S −1D) e l’intervallo (1D −3P ).
457
APPENDICI
A.9 Calcolo della costante di struttura fine di un termine Il calcolo della costante ζ(α, LS) che caratterizza gli intervalli di struttura fine dei termini appartenenti a una configurazione assegnata pu`o essere effettuato mediante un procedimento basato sulla regola della traccia. Un procedimento simile `e stato seguito nel Par. 8.1 per determinare l’energia dei termini. Il punto di partenza `e l’Eq. (9.8) che, particolarizzata al caso di elementi di matrice diagonali, risulta αLSML MS | ξ(ri )i · si |αLSML MS = ζ(α, LS) ML MS . i
D’altra parte, per un qualsiasi autostato della configurazione, della forma ΨA (a1 , a2 , . . . , aN ) dell’Eq. (7.1), l’elemento di matrice diagonale dello stesso operatore `e dato da
ΨA (a1 , a2 , . . . , aN )| ξ(ri )i · si |ΨA (a1 , a2 , . . . , aN ) =
i
ζni li mi msi ,
i
dove ζni li `e la quantit` a definita nell’ Eq.(9.10). Premesse queste considerazioni, consideriamo il caso particolare di una configurazione pf la quale, come risulta dalla Tab. 7.3, d` a luogo ai sei termini 1D, 1 1 3 3 3 F , G, D, F , G. Partiamo da uno stato avente i valori pi` u alti per i numeri quantici ML e MS , ovvero ML = 4, MS = 1. Questo stato pu`o provenire soltanto dal termine 3 G. In termini invece di stati di particella singola, questo stato `e del tipo m1 = 1, ms1 = 12 , m2 = 3, ms2 = 12 , dove gli indici 1 e 2 si riferiscono rispettivamente all’elettrone p e all’elettrone f . Utilizzando le stesse notazioni del Par. 8.1, si pu` o quindi scrivere l’uguaglianza5 [4, 1] = (1+ , 3+ ) , che, in base alle equazioni precedenti, risulta6 4 ζ(3G) =
1 2
ζnp +
3 2
ζnf .
Si ottiene quindi il risultato 5
Il simbolo [ML , MS ] significa la somma degli elementi di matrice diagonali dell’Hamiltoniana di interazione spin-orbita fra tutti gli stati Ψ A aventi per autovalore di Lz e Sz i valori ± ML e MS , rispettivamente. Analogamente, la notazione (m± 1 , m2 ) indica l’elemento di matrice diagonale della stessa Hamiltoniana sullo stato in cui l’elettrone 1 ha numero quantico magnetico m1 e numero quantico di spin +1/2 oppure −1/2 e, analogamente, l’elettrone 2 ha numero quantico magnetico m2 e numero quantico di spin +1/2 oppure −1/2.
6
Si noti che gli eventuali elettroni presenti in sottozone chiuse non portano alcun contributo all’equazione
458
APPENDICI
ζ(3G) =
1 8
ζnp +
3 8
ζnf .
Si procede poi diminuendo il valore di ML (e mantenendo MS = 1). Si ottengono le equazioni [3, 1] = (0+ , 3+ ) + (1+ , 2+ ) ,
[2, 1] = (−1+ , 3+ ) + (0+ , 2+ ) + (1+ , 1+ ) ,
o dalle quali si ha, osservando che la combinazione [ML = 3, MS = 1] pu` provenire dai termini 3 G e 3F , e che la combinazione [ML = 2, MS = 1] pu` o provenire dai termini 3 G, 3F , e 3D 3 [ζ(3 G) + ζ(3F )] = 3
3
3
2 [ζ( G) + ζ( F ) + ζ( D)] =
3 2
ζnf +
− 21
1 2
ζnp +
ζnp + ζnf , 3 2
ζnf + ζnf +
1 2
ζnp +
1 2
ζnf .
Risolvendo il sistema si arriva alle seguenti espressioni (anche deducibili mediante le Eq. (9.11)) ζ(3F ) =
1 24
ζnp +
11 24
ζ(3D) = − 61 ζnp +
ζnf ,
2 3
ζnf .
In principio si potrebbero poi considerare anche valori di MS = 0. Ad esempio [4, 0] = (1+ , 3− ) + (1− , 3+ ) . Tuttavia, cos`ı facendo si ottengono equazioni della forma 0 = 0 e il valore di ζ(1 G) resta indeterminato. Questo `e del tutto consistente in quanto gli stati di singoletto non presentano struttura fine e la costante ζ non `e definita. Interessanti sono anche i casi delle configurazioni di elettroni equivalenti perch´e, ripetendo gli stessi ragionamenti, si perviene direttamente alla seconda regola di Hund. Consideriamo ad esempio la configurazione p2 che porta, come risulta dalla Tab. 7.4, ai tre termini 1S, 1D, e 3P . Per i termini di singoletto, al solito, la costante della struttura fine resta indeterminata. Per il termine di tripletto si ha invece [1, 1] = (0+ , 1+ ) , dalla quale si ottiene ζ(3P ) =
1 2
ζnp .
Se si passa a considerare la configurazione complementare, ovvero p 4 , si la stessa struttura di termini. Questa volta, per trovare la costante di struttura fine del termine 3P , l’equazione da considerare `e la seguente7 7
La quantit` a (1+ , 1− , 0+ , −1+ ), relativa alla configurazione p4 , si ottiene dalla corrispondente quantit` a (0+ , 1+ ), relativa alla configurazione p2 , prendendo “la complementare” di quest’ultima, ovvero (−1+ , −1− , 0− , 1− ), e poi cambiando di segno a tutti i valori di m e a tutti i valori di ms .
APPENDICI
459
[1, 1] = (1+ , 1− , 0+ , −1+ ) , e si ottiene ζ(3P ) = − 21 ζnp , ovvero un valore esattamente uguale a quello della configurazione p 2 ma di segno opposto. Queste considerazioni possono essere ripetute per una qualsiasi configurazione di elettroni equivalenti e per la corrispondente configurazione complementare e portano alla seconda regola di Hund. Nel caso particolare delle configurazioni che riempiono per met` a la sottozona (come p3 , d5 , e f 7 ) la configurazione coincide con quella complementare e si ottiene un valore nullo per le costanti di struttura fine di tutti i termini.
A.10 Il principio fondamentale della termodinamica statistica Consideriamo, in tutta generalit` a, un sistema fisico macroscopico e pensiamo di numerare con l’indice i tutti i possibili stati microscopici nei quali tale sistema si pu` o trovare. Indichiamo inoltre con Ei l’energia dello stato i-esimo. Se il sistema `e in uno stato stazionario, possiamo pensare che esso evolva incessantemente da uno stato microscopico all’altro e possiamo introdurre una descrizione statistica indicando con pi la probabilit` a che esso si trovi nello stato microscopico i-esimo. Ovviamente deve essere valida la propriet` a di normalizzazione pi = 1 . i
Si tratta adesso di connettere la probabilit` a pi all’energia Ei . Per far questo diamo una definizione dell’entropia ponendo, secondo un’ipotesi originariamente dovuta a Boltzmann S = −kB pi ln pi , i
dove kB `e la costante di Boltzmann. Questa definizione pu`o essere giustificata ammettendo che l’entropia di un sistema misuri la quantit` a di “disordine” contenuta nel sistema stesso e osservando che la funzione sopra definita ha la propriet` a matematica di assumere il valore massimo quando tutte le probabilit`a pi sono uguali fra loro e di assumere il valore minimo (che risulta uguale a 0) quando una singola pi `e uguale a 1 e tutte le altre sono uguali a 0. La prova della seconda propriet` a `e banale. Per provare la prima propriet` a si pu` o osservare
460
APPENDICI
che dando una variazione arbitraria, δpi , alle probabilit` a, la corrispondente variazione δS dell’entropia risulta δS = −kB (ln pi + 1) δpi . i
D’altra parte, dovendo essere
δpi = 0 ,
i
ne risulta che se ln pi `e costante, cio`e indipendente da i, δS `e nullo e quindi ` poi facile verificare che tale estremo risulta l’entropia presenta un estremo. E effettivamente un massimo, in quanto d2 S 1 = −kB <0 . 2 dpi pi Giustificata cos`ı la definizione di entropia, teniamo conto che l’energia interna del sistema `e data dall’espressione U= pi Ei . i
Se si considera una trasformazione termodinamica infinitesima del sistema, l’energia interna varier` a, in generale, perch´e cambiano sia le probabilit` a p i che le energie Ei . Si ha quindi (δpi ) Ei + pi (δEi ) . δU = i
i
Se per` o si mantengono costanti le condizioni esterne del sistema, le quantit`a Ei restano fissate al valore iniziale e il secondo termine del secondo membro risulta nullo. D’altra parte, tenere costanti le condizioni esterne del sistema significa che il sistema stesso non compie lavoro, per cui si pu`o scrivere, in base al primo principio δU = (δpi ) Ei = δQ = T δS , i
e tenendo conto che δS = −kB
(δpi ) ln pi ,
i
si ottiene l’equazione i
(δpi ) Ei = −kB T
i
(δpi ) ln pi .
461
APPENDICI
Questa equazione deve essere soddisfatta per una trasformazione termodinamica arbitraria (purch´e a lavoro nullo). Se ne deduce quindi che deve valere la relazione Ei = −kB T ln pi + cost. , che porta alla relazione pi = A e−βEi , dove A `e una costante e dove abbiamo posto 1
β=
kB T
.
La costante A si determina imponendo la condizione di normalizzazione. Poich´e si deve avere pi = A e−βEi = 1 , i
i
se ne deduce che 1 , Z dove la quantit` a Z, detta somma sugli stati, `e data da Z= e−βEi . A=
i
o quindi essere scritta nella forma finale L’espressione per pi pu` pi =
1 −βEi e−βEi e = & −βEj . Z je
(A10.1)
L’espressione che abbiamo ottenuto `e di estrema generalit`a e pu` o a buon diritto essere considerata la base di tutta la termodinamica statistica. Essa pu` o essere posta in forma alternativa nel caso si supponga che gli stati microscopici del sistema non siano discreti (e quindi numerabili) ma siano identificabili mediante il punto rappresentativo nello spazio delle fasi del sistema avente dimensione pari a 2 N , dove N `e il numero di gradi di libert` a del sistema stesso. In questo caso, indicando con dP la probabilit` a che il punto rappresentativo del sistema si trovi nella celletta dΓ = dq1 dq2 · · · dqN dp1 dp2 · · · dpN dello spazio delle fasi centrata intorno ai valori (qi , pi ), e indicando con H(qi , pi ) l’Hamiltoniana del sistema, si ha dP =
1 −β H(qi ,pi ) e−βH(qi ,pi ) dΓ e , dΓ = . −β H(q ,p ) i i dΓ Z e
(A10.2)
462
APPENDICI
con l’integrale esteso a tutto il volume dello spazio delle fasi a disposizione del sistema. Le equazioni (A10.1) e (A10.2) coincidono, rispettivamente, con le Eq. (10.2) e (10.1) che, nel Cap. 10, abbiamo assunto come principi fondamentali per la deduzione di varie leggi di equilibrio termodinamico.
A.11 Probabilit` a di transizione per le coerenze Nel testo abbiamo introdotto la cosiddetta “approssimazione delle fasi a caso” e abbiamo determinato le equazioni cinetiche per gli elementi di matrice diagonali, ρα , dell’operatore matrice densit`a del sistema fisico. Il risultato che abbiamo trovato `e l’equazione cinetica (11.9) che si interpreta introducendo la probabilit` a di transizione per unit` a di tempo fra stati diversi del sistema. Tale probabilit` a `e data dalla regola aurea di Fermi espressa dall’Eq. (11.10). Vogliamo adesso generalizzare questi risultati andando a determinare le equazioni cinetiche per le cosiddette coerenze, ovvero per gli elementi di matrice non diagonali dell’operatore matrice densit` a. Riprendiamo allora l’Eq. (11.8) e introduciamo l’ipotesi, meno restrittiva di quella delle fasi casuali, che nel sistema fisico possano esistere coerenze, anche se soltanto entro coppie di stati, |α e |α , aventi lo stesso autovalore dell’energia (stati degeneri) e fra i quali l’elemento di matrice dell’Hamiltoniana di I interazione, Hαα , sia nullo. Tenendo conto di questa approssimazione, quando si va a valutare il prodotto cα (t) c∗α (t) arrestandosi a considerare i termini che sono al massimo quadratici negli elementi di matrice di HI , si ottiene cα (t) c∗α (t) = cα (0) c∗α (0) e i ωαβ t − 1 e−i ωα β t − 1 1 I Hαβ HβI α cβ (0) c∗β (0) + 2 ωαβ ωα β h ¯ ββ ⎤ ⎡ i ωαγ t i ωαβ t − 1 − 1 1 ⎣ I e e I + C.C.(α ↔ α )⎦, + 2 Hαβ Hβγ cγ (0) c∗α (0) − ωαγ ωβγ ωαβ ωβγ h ¯ βγ
dove il simbolo [. . . + C.C.(α ↔ α )] significa che bisogna aggiungere al termine in parentesi il suo complesso e coniugato con lo scambio degli indici α e α . Teniamo adesso presente l’approssimazione introdotta sulla isoenergeticit`a degli stati fra cui sono presenti le coerenze. Per quanto riguarda la seconda riga dell’equazione precedente, questo implica che ωαβ = ωα β e quindi i due fattori temporali risultano essere l’uno il complesso e coniugato dell’altro. Per quanto riguarda la terza riga, si pu` o eseguire un passaggio al limite (ω αγ → 0) e la funzione temporale entro parentesi tonde, che indichiamo con F(t), risulta
463
APPENDICI
F(t) =
e i ωαγ t − 1 e i ωαβ t − 1 it e i ωαβ t − 1 − =− + = 2 ωαγ ωβγ ωαβ ωβγ ωαβ ωαβ
=−
2 sin2 (ωαβ t/2) sin(ωαβ t) − ωαβ t +i . 2 2 ωαβ ωαβ
Passiamo a eseguire la media statistica sul sistema fisico e introduciamo la notazione della matrice densit`a ponendo8 ραα = cα (t) c∗α (t) . Cambiando inoltre l’indice di somma γ in α , l’equazione cinetica per le coerenze risulta ραα (t) = ραα (0) + ⎡ +
1 I 4 sin2 (ωαβ t/2) I H H α ρββ (0) αβ β 2 ωαβ h ¯ 2 ββ ⎤
1 ⎣ I I ⎦ Hαβ Hβα . ρα α (0) F(t) + C.C.(α ↔ α ) h ¯ 2 βα
(A11.1)
Consideriamo adesso il limite per t → ∞ di questa equazione. Per quanto abbiamo pi` u volte visto nel testo si ha (si veda anche la Fig. 11.1) 4 sin2 (ωαβ t/2) = 2π t δ(ωαβ ) = 2π h ¯ t δ(Eα − Eβ ) , 2 t→∞ ωαβ lim
dove abbiamo ricordato la definizione delle frequenze di Bohr in termini delle energie degli stati del sistema fisico. Per quanto poi riguarda la funzione F(t), mentre la sua parte reale porta di nuovo a una delta di Dirac sull’energia, la parte immaginaria si comporta, al limite per t → ∞, come illustrato nella Fig. A.2. Come pu` o essere rigorosamente dimostrato nell’ambito della teoria delle distribuzioni si ottiene 1 1 i lim F(t) = −π t δ(ωαβ )− i t PP , = −π h ¯ t δ(Eα − Eβ ) + PP t→∞ ωαβ π Eα − Eβ dove il simbolo PP `e il valore principale secondo Cauchy. Siamo adesso in grado di scrivere l’equazione cinetica che generalizza al caso delle coerenze l’Eq. (11.9) del testo, valida per gli elementi diagonali della matrice densit`a. Riprendendo l’Eq. (A11.1) e osservando che tutti i termini del secondo membro hanno, per t tendente all’infinito, un comportamento lineare in t, si pu` o scrivere 8
Si noti che nel testo abbiamo introdotto soltanto gli elementi diagonali della matrice densit` a, denotati per semplicit` a col simbolo ρα invece che con ραα .
464
APPENDICI
Fig. A.2. Andamento della parte immaginaria di F(t) in funzione di ωαβ . All’aumentare di t il comportamento della funzione si avvicina sempre pi` u a quello della funzione −t/ω αβ (curva punteggiata), eccetto nell’origine dove assume valore nullo.
d ∗ ραα = Tαα ββ ρββ − (Rαα ρα α + Rα α ραα ) , dt
(A11.2)
α
ββ
dove Tαα ββ , il tasso (rate) per trasferimento dalla coerenza ρββ alla coerenza ραα , `e dato da Tαα ββ =
2π I H HI δ(Eα − Eβ ) , h ¯ αβ β α
e dove Rαα , il tasso (rate) di rilassamento che lega la coerenza ραα alla coerenza ρα α `e dato da Rαα =
1 π I i I δ(Eα − Eβ ) + PP . Hαβ Hβα h ¯ π Eα − Eβ β
Come `e facile mostrare, l’Eq. (A11.2) coincide con l’Eq. (11.9) nel caso dell’approssimazione delle fasi casuali, ovvero quando ci si limita a considerare solo gli elementi diagonali della matrice densit` a. Si ha infatti Tααββ =
2π I 2 |Hαβ | δ(Eα − Eβ ) = Pαβ , h ¯
465
APPENDICI
dove Pαβ `e la probabilit` a di transizione per unit`a di tempo fra gli stati |α e |β (o fra gli stati |β e |α ) data dall’Eq. (11.10) (regola aurea di Fermi). Analogamente ∗ Rαα + Rαα =
2π I 2 |Hαβ | δ(Eα − Eβ ) = Pαβ . h ¯ β
β
L’equazione (A11.2) pu` o quindi a buon diritto essere considerata la generaliz` importante sotzazione al caso delle coerenze della regola aurea di Fermi. E tolineare la presenza del fattore immaginario nelle rates di rilassamento. Tale fattore `e responsabile di fenomeni caratteristici nell’interazione fra materia e campo di radiazione, quali, in particolare, i fenomeni di dispersione anomala che si verificano nel trasporto di radiazione polarizzata in un mezzo anisotropo (effetto Faraday, effetto Macaluso-Corbino, etc.).
A.12 Somme sui numeri quantici magnetici Si vuole dimostrare l’Eq. (11.17) del testo, ovvero si vuole dimostrare che, qualsiasi sia il versore di polarizzazione e, definendo le medie sui numeri quantici magnetici dei moduli quadri degli elementi di matrice di dipolo, A e A , mediante le equazioni A=
1 | rbβ,aα · e |2 , ga gb α, β
A = |rba |2 =
1 1 | rbβ,aα |2 = ubβ |r |uaα · uaα |r |ubβ ga gb ga gb α, β
,
α, β
si ha A=
1 3
A .
Nelle equazioni precedenti, gli indici a e b indicano due livelli energetici qualsiasi del sistema atomico mentre gli indici α e β numerano i rispettivi sottolivelli magnetici, degeneri rispetto all’energia. Per provare l’equazione, `e opportuno introdurre una notazione pi` u dettagliata tenendo conto del fatto che i livelli atomici sono generalmente caratterizzati, oltre che da un set di numeri quantici interni, γ, che specificano la configurazione e il termine, dal numero quantico di momento angolare, J, e dal numero quantico magnetico, M . Eseguiamo quindi le sostituzioni formali |uaα → |γa Ja Ma ,
|ubβ → |γb Jb Mb ,
ga → 2Ja + 1 ,
gb → 2Jb + 1 ,
466
APPENDICI
dalle quali consegue A=
| γb Jb Mb |r · e |γa Ja Ma |2 , (2 Ja + 1)(2 Jb + 1)
Ma Mb
A =
Ma Mb
γb Jb Mb |r |γa Ja Ma · γa Ja Ma |r |γb Jb Mb (2 Ja + 1)(2 Jb + 1)
.
Per il calcolo di A applichiamo il teorema di Wigner-Eckart osservando che il prodotto scalare r · e pu` o essere espresso in termini delle componenti sferiche dei due vettori. Si ha infatti (si veda l’Eq. (9.5)) r · e = (−1)q rq e−q . q
Per mezzo dell’Eq. (9.4) si ha γb Jb Mb | rq |γa Ja Ma = # Jb = (−1)Ja +Mb +1 2Jb + 1 −Mb
Ja Ma
1 q
γb Jb || r ||γa Ja
,
e si ottiene A=
(−1)q+q e−q (e−q )∗
qq
Jb × −Mb Ma Mb
Ja Ma
1 q
Jb −Mb
Ja Ma
1 q
| γb Jb || r ||γa Ja |2 . 2 Ja + 1
La somma su Ma e Mb del prodotto dei due simboli 3-j pu` o essere eseguita per mezzo della propriet` a dei simboli 3-j espressa dall’Eq. (7.18). Si ha Jb Jb Ja 1 Ja 1 = 13 δqq , −Mb Ma q −Mb Ma q Ma Mb & e si ottiene, essendo q eq (eq )∗ = 1 A=
1 3
| γb Jb || r ||γa Ja |2 . 2 Ja + 1
Per il calcolo della quantit` a A si procede in maniera analoga osservando preliminarmente che γa Ja Ma |r |γb Jb Mb = γb Jb Mb |r |γa Ja Ma ∗ . Si ottiene A =
Jb −Mb q
Ma Mb
Ja Ma
1 q
Jb −Mb
Ja Ma
1 q
| γb Jb || r ||γa Ja |2 , 2 Ja + 1
467
APPENDICI
e sfruttando la stessa propriet` a dei simboli 3-j e poi sommando su q, si perviene al risultato che volevamo dimostrare, ovvero A =
| γb Jb || r ||γa Ja |2 = 3A . 2 Ja + 1
I risultati che abbiamo ottenuto permettono di esprimere la quantit`a |rba |2 che abbiamo introdotto nel testo con gli elementi di matrice ridotta del tensore sferico r. Essendo |rba |2 = A , si ha |rba |2 =
| γb Jb || r ||γa Ja |2 . 2 Ja + 1
D’altra parte, essendo |rba |2 = |rab |2 , si ottiene per simmetria |rba |2 = |rab |2 =
| γa Ja || r ||γb Jb |2 | γb Jb || r ||γa Ja |2 = , 2 Ja + 1 2 Jb + 1
un’equazione che connette gli elementi di matrice ridotti per scambio del “bra” col “ket”. Nella pratica spettroscopica viene comunemente utilizzato il concetto di forza della riga (o della transizione). Tale quantit` a, invariante rispetto allo scambio fra livello superiore e livello inferiore, `e definita da S = gb | γb Jb || d ||γa Ja |2 = ga | γa Ja || d ||γb Jb |2 , a da noi introdotte nel dove d = −e0 r `e l’operatore dipolo elettrico. Le quantit` testo sono quindi connesse alla forza mediante la relazione |rba |2 = |rab |2 =
1 S . e20 ga gb
Attraverso queste relazioni `e quindi possibile esprimere i coefficienti di Einstein in termini della forza della riga invece che in termini degli elementi di matrice di dipolo. Ad esempio, ricordando l’Eq. (11.20), il coefficiente di Einstein Aab pu` o essere scritto nella forma 3 64π 4 νab S . 3 h c3 Una quantit` a alternativa, anch’essa utilizzata per caratterizzare la forza di una riga (o di una transizione), `e la cosiddetta forza d’oscillatore. Tale quantit` a viene introdotta partendo dal risultato secondo il quale il coefficiente di assorbimento integrato in frequenza di un plasma di atomi “classici”, descritti dal modello atomico di Lorentz, `e dato da
ga Aab =
(a) kR
class
=N
π e20 . mc
468
APPENDICI
dove N `e la densit` a numerica degli atomi. Confrontando questa espressione (a) con quella per kR da noi dedotta nel Par. 11.9 (Eq. (11.33)), si vede che le due quantit` a possono essere portate a coincidere immedesimando N con Nb e moltiplicando l’espressione classica per la quantit` a adimensionale fba , detta forza di oscillatore della transizione, data da fba =
8π 2 m νab ga |rba |2 . 3h
La forza di oscillatore pu`o essere considerata come un parametro di efficienza della transizione, rappresentando una sorta di “numero equivalente” di oscillatori classici. In genere si tratta di un numero relativamente piccolo che pu` o raggiungere valori dell’ordine dell’unit` a solo per le righe spettrali pi` u intense. Le relazioni esistenti fra forza di oscillatore, forza, e coefficienti di Einstein sono facilmente deducibili attraverso le relazioni precedenti. Ad esempio si ha gb fba =
8π 2 m νab S , 3 h e20
ga Aab =
2 8π 2 e20 νab gb fba . m c3
A.13 Calcolo di un elemento di matrice Si voglia calcolare la probabilit` a per unit` a di tempo che si verifichi un processo elementare in cui un elettrone libero non relativistico di impulso q compia una transizione verso uno stato libero di impulso q per assorbimento di un fotone avente vettore d’onda k. In base alla regola aurea di Fermi, ripetendo i ragionamenti sviluppati nel Par. 11.4 ma senza introdurre l’approssimazione di dipolo9 , tale probabilit` a risulta proporzionale al modulo quadro dell’elemento di matrice, M, dato da
M = u f | e i k·r p · e |u i
,
dove |u i e |u f sono gli autovettori del sistema atomico (nel nostro caso l’elettrone libero) negli stati iniziale e finale, rispettivamente, e `e il versore di polarizzazione del fotone assorbito e p `e l’operatore impulso dell’elettrone. Nella rappresentazione delle funzioni d’onda, nella quale l’operatore p `e dato da −i h ¯ grad, l’elemento di matrice M risulta M = −i h ¯ e · ψ ∗f (r ) e i k·r grad[ψ i (r )] d3r . 9
L’approssimazione di dipolo `e appropriata quando si considera l’interazione fra radiazione ed elettroni legati in un atomo. Per elettroni liberi, descritti da autofunzioni del tipo di onda piana, essa non pu` o essere applicata.
469
APPENDICI
D’altra parte, le autofunzioni ψ f e ψ i sono del tipo di onda piana, ovvero 1 ψ f (r ) = √ e i q ·r/¯h , V
1 ψ i (r ) = √ e i q·r/¯h , V
dove V `e il volume di normalizzazione. Sostituendo nell’integrale si ottiene e · q M= e−i (q −¯h k−q )·r/¯h d3r . V L’integrale `e nullo a meno che si annulli l’argomento dell’esponenziale. Questo porta all’uguaglianza q = (¯ h k + q ) che rappresenta la conservazione dell’impulso. In tale caso, l’integrale risulta semplicemente uguale a V, per cui si ottiene M = e · q = e · ( q −h ¯k ) .
A.14 Invarianza di gauge nell’Elettrodinamica Quantistica Consideriamo la quantit`a Rf i definita nell’Eq. (15.22) del testo, che qui riscriviamo nella forma Rf i = P + Q , dove P = Ws† ( p ) ( α · e ∗ ) Q = Ws† ( p ) ( α · e )
Hg + + h ¯ω ( α · e ) Wr( p) , ( + h ¯ ω)2 − 2g
Hh + − h ¯ ω ( α · e ∗ ) Wr( p) . ( − h ¯ ω )2 − 2 h
Vogliamo dimostrare che Rf i `e invariante rispetto alla trasformazione α · e → α · e + C ( α · u − 1) ,
(A14.1)
dove C `e una costante arbitraria e dove u `e il versore della direzione del fotone iniziale (u = k/k). Eseguendo tale trasformazione, le quantit`a P e Q si trasformano secondo le equazioni P → P + C P , dove
Q → Q + C Q ,
470
APPENDICI
P = Ws† ( p ) ( α · e ∗ )
¯ω Hg + + h ( α · u ) − 1 Wr( p) , 2 2 ( + h ¯ ω) − g
Hh + − h ¯ ω Q = Ws† ( p ) ( α · u ) − 1 ( α · e ∗ ) Wr( p) . ( − h ¯ ω )2 − 2h Moltiplichiamo le due quantit` a P e Q per il prodotto c h ¯ k e osserviamo che ch ¯ k ( α · u ) − 1 = c h ¯ ( α · k ) − h ¯ω . Ricordiamo poi le relazioni cinematiche dell’effetto Compton e osserviamo che le quantit` a g e h, contenute rispettivamente in P e Q , sono date da (si vedano le Eq. (15.15)) h = p − h ¯ k = p − h ¯ k ,
g = p + h ¯ k ,
per cui si pu` o sostituire, nell’espressione di P h ¯ k = g − p , e, nell’espressione di Q h ¯ k = p − h . ¯ ω, si ottiene Sostituendo, e ricordando anche che − h ¯ ω = − h ch ¯ k P = Ws† ( p ) ( α · e ∗ )
Hg + + h ¯ω cα · g − c α · p − h ¯ ω Wr( p) , 2 2 ( + h ¯ ω) − g
Hh + − h ¯ω ch ¯ k Q = Ws† ( p ) c α · p − c α · h − h ¯ω ( α · e ∗ ) Wr( p) . ( − h ¯ ω)2 − 2 h
Entro le parentesi quadre aggiungiamo e togliamo il fattore β m c2 e ricordiamo che un espressione del tipo (c α · q + β m c2 ), (con q arbitrario), `e l’Hamiltoniana di Dirac Hq . Si ottiene p ) ( α · e ∗ ) ch ¯ k P = Ws† (
Hg + + h ¯ω Hg − Hp − h ¯ ω Wr( p) , 2 2 ( + h ¯ ω) − g
Hh + − h ¯ω ch ¯ k Q = Ws† ( p ) Hp − Hh − h ¯ω ( α · vece ∗ ) Wr( p) . ( − h ¯ ω)2 − 2 h
Adesso, osservando che Hp Wr( p ) = Wr( p) ,
Ws† ( p ) Hp = Ws† ( p ) ,
471
APPENDICI
si ha
ch ¯ k P = Ws† ( p ) ( α · e ∗ )
Hg + + h ¯ω Hg − − h ¯ ω Wr( p) , 2 2 ( + h ¯ ω) − g
Hh + − h ¯ω ch ¯ k Q = Ws† ( p ) − Hh − h ¯ω ( α · e ∗ ) Wr( p) . 2 ( − h ¯ ω) − 2 h
Infine, tenendo conto che ¯ ω Hg − − h ¯ ω = 2g − ( + h ¯ ω)2 , Hg + + h − Hh − h ¯ ω Hh + − h ¯ ω = ( − h ¯ ω)2 − 2h , si ottiene ch ¯ k P = −Ws† ( p ) ( α · e ∗ ) Wr( p) ,
ch ¯ k Q = Ws† ( p ) ( α · e ∗ ) Wr( p) ,
da cui segue (P + Q ) = 0 . Questo dimostra che la quantit`a Rf i `e invariante rispetto alla trasformazione (A14.1). In tutta analogia si pu` o poi dimostrare che Rf i `e anche invariante rispetto alla trasformazione · e ∗ + C ( α · u − 1) , α · e ∗ → α dove C `e una costante arbitraria e dove u `e il versore della direzione del fotone finale (u = k /k ). Una maniera alternativa di esprimere queste propriet` a di invarianza `e quella di considerare formalmente la quantit` a Rf i come funzione della matrice ( α · e ) o, alternativamente, della matrice ( α · e ∗ ). Dalla dimostrazione precedente segue che Rf i { α · e → α · u} = Rf i { α · e → 1} ,
(A14.2)
Rf i { α · e ∗ → α · u } = Rf i { α · e ∗ → 1} .
A.15 Le matrici gamma e gli invarianti relativistici La relazione fra energia p e impulso p di una particella relativistica di massa m `e espressa dalla relazione 2p = c2 p2 + m2 c4 .
472
APPENDICI
In particolare, per un fotone (m = 0), si ha p = c p ,
con
p = | p | ,
oppure, in termini di frequenza e numero d’onda h ¯ ω = ch ¯k ,
con
k = | k | .
Queste relazioni possono essere formalmente semplificate se si adotta un sistema di unit` a in cui h ¯ = c = 1. L’introduzione di questa convenzione equivale a definire l’intervallo di tempo unitario come il tempo che impiega la luce a percorrere l’unit` a di lunghezza. Con queste definizione inoltre, l’energia, l’impulso e la massa (cos`ı come, per un fotone, la frequenza angolare e il numero d’onde) vengono tutte ad assumere le dimensioni del reciproco di una lunghezza (oppure di un tempo). La relazione fra impulso e energia si scrive, in questo sistema di unit` a, nella forma 2p = p2 + m2 ,
ovvero
2p − p2 = m2 ,
p = p ,
ovvero
ω=k .
e, per un fotone
Introduciamo adesso col simbolo Pμ (μ = 0, 1, 2, 3) il quadrivettore impulsoenergia della particella. Esso `e un ente a quattro componenti che risultano cos`ı definite
P0 = p ,
P1 = p 1 = p x ,
P2 = p 2 = p y ,
P3 = p 3 = p z ,
oppure, in forma pi` u compatta P = (p , p ) . Se definiamo il tensore metrico gμν nella forma
g00 = 1 ,
g0i = gi0 = 0
(i = 1, 2, 3) ,
gjk = −δik
il prodotto scalare di due quadrivettori P e Q risulta (PQ) =
μν
In particolare si ha
gμν Pμ Qν = p q − p · q .
(j, k = 1, 2, 3) ,
473
APPENDICI
P 2 = (PP) =
gμν Pμ Pν = 2p − p2 = m2 .
μν
Queste quantit` a, ovvero il prodotto scalare di due quadrivettori definito attraverso il tensore metrico di cui sopra e, in particolare, il quadrato di un quadrivettore, sono degli invarianti relativistici, ovvero delle quantit` a che non cambiano per trasformazioni di Lorentz. Vediamo adesso come sia possibile esprimere attraverso tali invarianti le ampiezze di probabilit` a relative alla diffusione Compton. Consideriamo la quantit`a Rf i definita nell’Eq. (15.22) del testo. Tale quantit`a consta di due termini che indichiamo coi simboli P e Q. Per il primo di essi, che qui riscriviamo tenendo conto del sistema di unit`a che abbiamo introdotto (c = h ¯ = 1), si ha Hg + + ω ( α · e )Wr( p) , ( + ω)2 − 2g
P = Ws† ( p )( α · e ∗ ) dove
Hg = α · g + β m , con g = p + k ,
g =
# g 2 + m2 .
Ricordando che la matrice β di Dirac ha per quadrato l’unit` a, si pu` o scrivere P = Ws† ( p )( α · e ∗ )β 2
Hg + + ω 2 β ( α · e )Wr( p) . ( + ω)2 − 2g
Se adesso ricordiamo anche che la matrice β anticommuta con una qualsiasi delle matrici α, si ottiene P = Ws† ( p )β( α · e ∗ )
β(Hg + + ω) β( α · e )βWr( p) . ( + ω)2 − 2g
Definiamo adesso le matrici γμ , (μ = 0, 1, 2, 3) con la posizione γ0 = β ,
γ1 = β α1 ,
γ2 = β α2 ,
γ3 = β α3 .
La propriet` a fondamentale di queste matrici concerne il loro anticommutatore che risulta, come `e facile verificare in base alle propriet` a delle matrici α e β {γμ , γν } = γμ γν + γν γμ = 2 gμν ,
(A15.1)
dove gμν `e il tensore metrico precedentemente definito. Inoltre, dato un quadrivettore V arbitrario, definiamo col simbolo V / la matrice
474
APPENDICI
V /=
γμ Vμ .
μ
Con queste definizioni, la quantit` a P si pu` o scrivere nella forma P = Ws† ( p ) /E ∗
/G + m /E γ0 Wr ( p) , G 2 − m2
(A15.2)
dove i quadrivettori G, E e E sono dati da G = (ω + , g ) ,
E = (0, e ) ,
E = (0, e ) .
Si noti che il quadrivettore G pu` o anche essere posto nella forma G =P +K , dove K = (ω, k) . Se adesso andiamo a considerare la quantit` a P ∗ , complessa e coniugata di P , bisogna procedere con attenzione perch´e le matrici γ (eccetto γ0 ) non sono hermitiane. Si ha infatti γ0† = β † = β = γ0 , γi† = (β αi)† = α†i β † = αi β = −β αi = −γi
(i = 1, 2, 3) .
Queste propriet`a possono condensarsi nell’unica γμ† = γ0 γμ γ0 , la quale comporta, per un quadrivettore arbitrario V / † = γ0 V / ∗ γ0 . Si ottiene quindi P ∗ = Wr† ( p ) γ0 γ0 /E ∗ γ0 ovvero p ) /E ∗ P ∗ = Wr† (
γ0 /G γ0 + m γ0 /E γ0 Ws( p ) , G 2 − m2
/G + m /E γ0 Ws( p ) . G 2 − m2
(A15.3)
Analoghe considerazioni possono esser ripetute per l’altro termine Q dell’Eq. (15.22), definito da Q = Ws† ( p )( α · e )
Hh + − ω ( α · e ∗ )Wr( p) , ( − ω )2 − 2 h
475
APPENDICI
dove Hh = α · h + β m , con
h = p − k ,
h =
# h 2 + m2 .
Si ottiene H / + m ∗ /E γ0 Wr( p) , H 2 − m2 dove il quadrivettore H `e definito da Q = Ws† ( p ) /E
(A15.4)
H = ( − ω , h ) = P − K , essendo
K = (ω , k ) .
Sempre in analogia a quanto visto prima, si ha anche H / +m ∗ /E γ0 Ws( p ) . (A15.5) H 2 − m2 Possiamo adesso valutare il modulo quadro della quantit`a Rf i . Esso risulta Q∗ = Wr† ( p ) /E
|Rf i |2 = (P + Q)(P ∗ + Q∗ ) = P P ∗ + P Q∗ + QP ∗ + QQ∗ , dove, utilizzando le Eq. (A15.2)-(A15.5), i quattro addendi sono dati da /G + m /G + m /E γ0 Wr( p ) Wr† ( p ) /E ∗ 2 /E γ0 Ws( p ) 2 2 G −m G − m2 /G + m H / +m ∗ p ) /E ∗ 2 /E γ0 Wr( p ) Wr† ( p ) /E 2 /E γ0 Ws( p ) P Q∗ = Ws† ( G − m2 H − m2 /G + m H / + m ∗ p ) /E 2 /E γ0 Wr( p ) Wr† ( p ) /E ∗ 2 /E γ0 Ws( p ) QP ∗ = Ws† ( 2 H −m G − m2 H / +m ∗ H / + m ∗ p ) /E 2 /E γ0 Wr( p ) Wr† ( p ) /E 2 /E γ0 Ws( p ) QQ∗ = Ws† ( H − m2 H − m2 P P ∗ = Ws† ( p ) /E ∗
, , , .
Queste espressioni possono essere semplificate quando se ne consideri la media sugli stati di spin iniziali dell’elettrone e la somma sugli stati di spin finali dell’elettrone. Tenendo conto dei risultati che abbiamo ottenuto nel Par. 15.5 (Eq. (15.18) e (15.20)) si ha r=1,2
Wr( p )Wr† ( p) =
p + Hp , 2 p
e definendo i quadrivettori
s=1,2
Ws( p )Ws† ( p ) =
p + Hp , 2 p
476
APPENDICI
P = (p , p ) ,
P = (p , p ) , si ottiene
γ0 Wr ( p )Wr† ( p) =
r=1,2
P / +m , 2 p
γ0 Ws ( p )Ws† ( p ) =
s=1,2
P / +m . 2 p
Si ha allora, indicando col simbolo · · · la media sugli stati di spin e utilizzando la definizione di traccia di una matrice, per la quale un prodotto scalare della forma W1X W2† , con W1 e W2 spinori arbitrari e X matrice arbitraria, pu` o essere posto nella forma Tr(W2W1† X ) P P ∗ =
1 1 PP∗ = 2 r=1,2 s=1,2 8 p p
/G + m /G + m × Tr (P / + m) /E /E (P / + m) /E ∗ 2 /E 2 2 G −m G − m2
∗
,
con analoghe espressioni per gli altri tre termini P Q∗ , QP ∗ e QQ∗ . Quest’ultimo risultato pu` o essere notevolmente semplificato qualora si sommi sugli stati di polarizzazione del fotone finale e si medi sugli stati di polarizzazione del fotone iniziale. La media sugli stati di polarizzazione del fotone iniziale, ad esempio, consiste nell’eseguire nella formula precedente la sostituzione formale /E (P / + m) /E ∗ →
1 2
/E(i) (P / + m) /E (i) ,
i=1,2
dove E (i) = (0, e (i) ) , e (i) (i = 1, 2) essendo due versori unitari, che possiamo senz’altro supporre reali, perpendicolari alla direzione del fotone iniziale e perpendicolari fra loro. Tenendo per` o conto dell’invarianza per trasformazioni di gauge enunciata nell’App. 14, e, in particolare, ricordando l’Eq. (A14.2), la somma pu` o essere modificata estendendola a un terzo “quadriversore”, che indichiamo con E (3) , e sottraendo poi il contributo dovuto a un ulteriore quadriversore, di tipo puramente temporale, secondo la nomenclatura della relativit`a ristretta, che indichiamo con E (0) . Definendo E (3) = (0, e (3) ) ,
E (0) = (1, 0 ) ,
477
APPENDICI
dove e (3) `e un versore diretto lungo la direzione del fotone entrante (e (3) = k/k), e ricordando la definizione del tensore metrico, eseguiamo la seguente trasformazione
∗
/E (P / + m) /E →
1 2
S ,
dove
3
S=−
gij /E(i) (P / + m) /E (j) .
i,j=0
Osserviamo che la somma S pu` o anche essere posta nella forma S = −γ0 (P / + m)γ0 + (γ · e (1) )(P / + m)(γ · e (1) ) / + m)(γ · e (2) ) + (γ · e (3) )(P / + m)(γ · e (3) ) , + (γ · e (2) )(P dove γ `e il vettore formale definito da γ = (γ1 , γ2 , γ3 ). Il secondo membro pu`o poi essere trasformato per dare
S = −γ0 (P / + m)γ0 +
3
(1) (1) (2) (2) (3) (3) . γi (P / + m)γj ei ej + ei ej + ei ej
i,j=1
D’altra parte, tenendo conto dell’Eq. (15.7), la quantit` a in parentesi quadra `e uguale alla delta di Kronecker δij , e si ottiene quindi / + m)γ0 + S = −γ0 (P
3
γi (P / + m)γi = −
gμν γμ (P / + m)γν .
μ,ν
i=1
Infine possiamo tener conto delle propriet`a delle matrici γ. Dall’Eq. (A15.1) si ha γμ γν = −γν γμ + 2 gμν . Inoltre `e facile verificare che vale la relazione gμν γμ γν = 4 , μν
e che, per le propriet` a del tensore metrico gμν gμρ = δνρ , μ
per cui
gμν gμρ γν = γρ .
μν
Sfruttando queste propriet`a, con alcuni passaggi algebrici si ottiene
478
APPENDICI
S = 2 (P / − 2 m) . Riassumendo le considerazioni svolte, la media sugli stati di polarizzazione del fotone iniziale si ottiene eseguendo la trasformazione formale /E (P / + m) /E ∗ → P / − 2m . Analogamente, la somma sugli stati di polarizzazione del fotone finale si ottiene eseguendo la trasformazione formale /E (P / + m) /E ∗ → 2 (P / − 2 m) . Indichiamo adesso col simbolo P P ∗ la quantit` a ottenuta prendendo la media di P P ∗ sugli stati di polarizzazione iniziali e la somma della stessa quantit`a sugli stati di polarizzazione finali10 . Si ha per essa 1 /G + m /G + m . Tr (P / − 2 m) 2 (P / − 2 m) 2 P P = 4 p p G − m2 G − m2 ∗
A questo punto `e necessario aprire una parentesi sulle tracce di prodotti di matrici γ. Come `e facile verificare, la traccia del prodotto di un numero dispari di matrici γ `e nullo. Quando invece il numero di matrici γ `e zero, oppure pari, il risultato `e diverso da zero. Indicando con a una costante arbitraria, con A, B, C e D quattro quadrivettori arbitrari, e ricordando la definizione di prodotto scalare fra quadrivettori si ha Tr{a} = 4 a , Tr{A /B /} = 4 (AB) , Tr{A /B / /C D /} = 4 (AB)(CD) − (AC)(BD) + (AD)(BC) . La prima relazione `e ovvia. Per la seconda si ha Tr{A /B /} = Tr{γμ γν }Aμ Bν , μν
e sfruttando le propriet` a di anticommutazione delle matrici γ Tr{γμ γν } = 8 gμν − Tr{γν γμ } . Dalla propriet` a ciclica della traccia consegue quindi Tr{γμ γν } = 4 gμν , 10
Si ricordi che la prima media, P P ∗ , ha un analogo significato nei riguardi degli stati di spin dell’elettrone.
APPENDICI
479
che prova per semplice sostituzione la seconda relazione. Per la terza relazione si ha poi Tr{A /B / /C D /} = Tr{γμ γν γρ γσ }Aμ Bν Cρ Dσ , μνρσ
e, per le propriet`a di anticommutazione delle matrici γ Tr{γμ γν γρ γσ } = 2 gμν Tr{γρ γσ } − Tr{γν γμ γρ γσ } = = 2 gμν Tr{γρ γσ } − 2 gμρ Tr{γν γσ } + Tr{γν γρ γμ γσ } = = 2gμν Tr{γρ γσ } − 2 gμρ Tr{γν γσ } + 2 gμσ Tr{γν γρ } − Tr{γν γρ γσ γμ } . Sfruttando la propriet` a ciclica della traccia si ottiene quindi Tr{γμ γν γρ γσ } = gμν Tr{γρ γσ } − gμρ Tr{γν γσ } + gμσ Tr{γν γρ } , e per mezzo del risultato precedentemente ottenuto Tr{γμ γν γρ γσ } = 4 gμν gρσ − 4 gμρ gνσ + 4 gμσ gνρ . La terza relazione si ottiene quindi per semplice sostituzione di questa identit` a. Il risultato ottenuto per P P ∗ mostra che la traccia contenuta in tale quantit` a pu` o essere espressa esclusivamente in termini di prodotti scalari di quadrivettori, ovvero in termini di invarianti relativistici. Analoghe considerazioni possono poi essere ripetute per le altre quantit` a P Q∗ , QP ∗ , ∗ e QQ che, una volta calcolate, permettono di ottenere la probabilit` a di transizione per unit` a di tempo e quindi la sezione d’urto. Ovviamente, nel caso particolare in cui l’elettrone sia inizialmente a riposo, si riottiene per la sezione d’urto l’equazione di Klein-Nishina, nella forma dell’Eq. (15.37), che si riferisce alla media sugli stati di polarizzazione del fotone iniziale e alla somma sugli stati di polarizzazione del fotone finale. Il formalismo delle matrici γ presentato in questa Appendice `e molto potente ed elegante. Esso permette di trattare con relativa facilit`a anche i problemi pi` u complicati di Elettrodinamica Quantistica. In ogni caso, `e importante sottolineare che il formalismo che abbiamo utilizzato nel testo per dedurre l’equazione di Klein-Nishina, che non fa uso delle matrici γ, `e stato il primo ad essere usato in pratica per le applicazioni.
Costanti fisiche Le costanti sono espresse in unit` a del sistema c.g.s. con al pi` u sei cifre significative. Costante della gravitazione: G = 6.67428 × 10−8 cm3 g−1 s−2 Velocit`a della luce nel vuoto: c = 2.99792 × 1010 cm s−1 Costante di Planck: h = 6.62607 × 10−27 erg s Costante di Planck ridotta: h ¯ = h/(2π) = 1.05457 × 10−27 erg s Costante di Boltzmann: kB = 1.38065 × 10−16 erg K−1 Carica dell’elettrone (in valore assoluto): e0 = 4.80320 × 10−10 u.e.s. Massa dell’elettrone: m = 9.10938 × 10−28 g Massa ridotta dell’elettrone: mr = mMp /(m + Mp ) = 9.10442 × 10−28 g Unit` a di massa atomica: mH = 1.66054 × 10−24 g Massa del protone: Mp = 1.67262 × 10−24 g Rapporto di massa protone/elettrone: Mp /m = 1.83615 × 103 Numero di Avogadro: NA = 6.02214 × 1023 mol−1 Costante della struttura fine: α = e20 /(¯ hc) = 7.29735 × 10−3 Reciproco della costante della struttura fine: 1/α = h ¯ c/e20 = 137.036 Raggio classico dell’elettrone: rc = e20 /(mc2 ) = 2.81794 × 10−13 cm Lunghezza d’onda Compton dell’elettrone: λC = h/(mc) = 2.42631 × 10−10 cm Raggio della prima orbita di Bohr: a0 = h ¯ 2 /(me20 ) = 5.29177 × 10−9 cm 3 Costante di Rydberg: R = me40 /(4πc¯ h ) = 1.09737 × 105 cm−1 Costante di Rydberg (atomo di H): RH = mr e40 /(4πc¯ h3 ) = 1.09677 × 105 cm−1 Magnetone di Bohr: μ0 = e0 h ¯ /(2mc) = 9.27401 × 10−21 erg G−1 Sezione d’urto Thomson: σT = 8πrc2 /3 = 6.65246 × 10−25 cm2 Costante di Stefan-Boltzmann1 : σ = 5.67040 × 10−5 erg cm−2 s−1 K−4 Costante della densit`a di radiazione1: a = 7.56577 × 10−15 erg cm−3 K−4 Prima costante della radiazione: c1 = 2πhc2 = 3.74177 × 10−5 erg cm2 s−1 Seconda costante della radiazione: c2 = hc/kB = 1.43877 cm K
1
σ=
4 2π 5 kB 15 h3 c2
,
a=
4σ c
=
4 8π 5 kB 15 h3 c3
Indice analitico I numeri in grassetto si riferiscono alle tabelle. Quelli in corsivo alle citazioni bibliografiche. Abbondanze chimiche, 378 Abramowitz, M., 156 Accoppiamento: — di Russell-Saunders, 241 — intermedio, 254 — j-j, 252 — L-S, 241 Adiabatica del corpo nero, 287 Allargamento: — collisionale, 333 — naturale, 330 — termico (Doppler), 334 Amp`ere, A.M., 1, 429 Ampiezza dell’onda, 14 Anderson, C.D., 119 Angolo eliocentrico, 366 Anticommutatore, 115 Antisimmetrizzazione, 173 Anti-trasformata di Fourier, 18 Approssimazione: — del campo centrale, 178 — delle fasi casuali, 306, 462 — di dipolo, 310 — di Eddington, 373 — di Eddington-Barbier, 367 — di impatto, 330 Armoniche sferiche, 151 — espressioni esplicite, 152 — propriet` a, 152 Armoniche superiori, 29, 86 Asse lento, 43 Asse veloce, 43 Atmosfera stellare: — di Milne-Eddington, 384 — grigia, 370 — piana, 366 — piano-parallela, 366 Atomo a due livelli, 360
Atomo idrogenoide, 139 Attinidi, 193, 219 Aurore polari, 348 Auto-energia dell’elettrone, 164 Autofunzioni: — atomo idrogenoide, 157 Balmer, J.J., 137 Bang sonico, 451 Beaming effect, 66, 84 Bethe, H., 165, 165, 379 Bjorken, J.D., 109 Bohr, N., 138 Boltzmann, L., 274, 459 Bosoni, 114, 173, 297 Bowen, I.S., 348 Bremsstrahlung, 72, 144 — inversa, 145, 379 Burger, H.C., 352 Camera CCD, 31, 40 Camera di Wilson, 119 Campo: — centrale, 178 — di una carica in moto, 58 — elettrico, 1, 427, 444 — magnetico, 2, 428, 444 — — critico, 257 — — quantistico, 135 Cariche di polarizzazione, 2 Catastrofe dell’ultravioletto, 78, 289 Centro del Sole, 284 Chamberlain, O., 119 Chandrasekhar, S., 380 Coefficiente: — di assorbimento, 325, 379 — — integrato in frequenza, 326, 383 — di emissione, 325
484
INDICE ANALITICO
— — stimolata, 325 Coefficienti: — binomiali, 190 — di Clebsh-Gordan: — — definizione, 198 — — interpretazione fisica, 200 — — propriet` a, 199, 200 — di Einstein: — — per assorbimento, 320 — — per emissione spontanea, 315 — — — ordine di grandezza, 343 — — per emissione stimolata, 320 — — relazioni fra, 320, 323 — di Racah, 350 Coerenze, 306 — probabilit` a di transizione, 462 Collisioni: — elettrone-elettrone, 355 — elettrone-atomo, 357 — — anelastiche e superelastiche, 358 — — — rates, 359 Colore del cielo, 72 Componente efficace, 245 Componenti: — di Fourier, 27 — sferiche di un vettore, 243 — Zeeman (σ e π), 255, 261 Condizione: — di Lorenz, 8 — di neutralit`a, 381 — di quantizzazione (orbite), 140 Condizioni: — di trasversalit`a, 103 — di periodicit`a, 102 Condon, E.U., 223, 266 Configurazioni elettroniche: — degenerazione, 190 — designazione spettroscopica, 189 — di elettroni eccitati, 195 — e termini L-S, 204 — interazione fra, 212 — normali degli atomi, 194 — parit` a, 189
Continuo di Balmer, 143 Continuo di Lyman, 143 Convenzioni sui segni (carica), 11 Coordinate sferiche, 146 Corona solare, 284, 345, 348, 362 Coronio, 349 Corpo nero, 285 — propriet` a, 291 — trattazione classica, 285 Corrente: — di spostamento, 2, 430 — di magnetizzazione, 2 — di polarizzazione, 2 Correzione: — di Rydberg, 166 — relativistica (energia cinetica), 127 Coseni direttori, 435 Costante: — del reticolo, 29 — della densit`a di radiazione, 290 — della struttura fine, 140 — di damping (smorzamento), 333 — — ridotta, 334 — di Eulero-Mascheroni, 77 — di Rydberg, 138 — di Stefan-Boltzmann, 291 Costanti della radiazione (1a e 2a ), 294 de Coulomb, C.A., 1, 428 Cristallo birifrangente, 43 Criterio di Schwarz, 286 Cromosfera solare, 362 Cromosfere stellari, 368, 386 Definizione di secondo, 272 Degenerazione: — dei livelli energetici, 158 — delle configurazioni, 190 — quantistica, 278 Delta di Dirac, 18, 442 — tridimensionale, 50, 55 Denominazioni spettroscopiche: — per singolo elettrone, 169 — per stati di pi` u elettroni, 177
INDICE ANALITICO
Densit` a: — di carica elettrica, 1, 427 — di corrente, 1, 429 — di corrente di spostamento, 430 — di energia della radiaz., 110, 286 — di energia elettromagnetica, 3, 11 — di energia interna, 285 — di energia meccanica, 2 — di flusso di energia, 3 — di impulso meccanico, 3 — di impulso elettromagnetico, 4, 11 Determinante di Slater, 174 Diade, 435 Diagonal sum rule, 224 Diagramma: — di Feynman, 313, 406 — di Grotrian, 145 — — per il Carbonio, 219 — — per il Sodio, 168 — — per l’Elio, 216 — — per l’Idrogeno, 144 — — per l’Ossigeno III, 345 — di radiazione, 65, 66, 67, 94, 417 — Zeeman, 261, 263 Difetto quantistico, 166 Diffusione: — Compton, 400, 403 — Raman, 398 — Rayleigh, 71, 379 — — quantistica, 398 — Thomson, 68, 379 — — quantistica, 393 Dirac, P.A.M., 97, 114, 118, 163 Discontinuit` a di Balmer, 368 Dispersione anomala, 465 Distanza critica (radiazione), 63 Distribuzione Maxwelliana 277, 355 Disuguaglianza di Schwarz, 45 Direzione di accettazione, 41 Doppietto del Sodio, 170 Dorgelo, H.B., 352 Drell, S.D., 109
485
Edl´en, B., 349 Effective quantum number, 167 Effetto: — beaming, 66, 84 — Compton, 400 — Compton inverso, 424 — di retroazione (eq. cinetiche), 305 — di schermo (elettroni), 166 — di spin nucleare, 270 — Doppler, 334, 424 — Faraday, 465 — faro, 83, 84 — fotoelettrico, 143, 328 — isotopico, 266 — — di massa, 267 — — di spin nucleare, 270 — — di volume nucleare, 268 — Macaluso-Corbino, 465 — Paschen-Back, 263 — Zeeman: — — anomalo, 257, 262 — — classico, 255 — — normale, 257 — — quantistico, 257 Einstein, A., 322, 323, 359 Elementi di matrice: — delle coordinate sferiche, 243 — dell’interazione Coulombiana, 230 — diagonali, 224 — — di operatori di tipo F, 226 — — di operatori di tipo G, 227 — diretti e di scambio, 228 Elemento di matrice: — di dipolo, 168, 311, 339 — ridotto, 243, 350, 467 Elettrodinamica Quantistica, 97, 301, — 389 Elettroni: — di valenza, 165, 192 — equivalenti e non equivalenti, 190 — ottici, 165, 192 Ellisse di polarizzazione, 35 Emissione spontanea, 312
486
INDICE ANALITICO
Emissione stimolata, 317 Energia: — di zero, 107 — interna, 275 — libera di Helmholtz, 275 — potenziale efficace, 153 Energy shell, 406 Entropia, 275, 459 — del campo di radiazione, 287 Equazione: — della ionizzazione, 282 — delle onde, 9 — dell’equilibrio idrostatico, 377 — dell’equilibrio radiativo, 371, 377 — del trasporto radiativo, 324 — di azione di massa, 283 — di Boltzmann, 282 — di continuit` a (carica), 2 — di Dirac, 114 — — limite non relativistico, 121 — — per la particella carica, 119 — — — in campo magnetico, 132 — di Guldberg-Waage, 283 — di Hopf, 376 — di Klein-Gordon, 114 — di Klein-Nishina, 416 — di Kramers-Heisenberg, 400 — di Larmor, 65 — — relativistica, 68, 450 — di Pauli, 124 — di Poisson, 50 — di Saha, 282 — di Saha-Boltzmann, 281 — di Schr¨ odinger: — — in coordinate sferiche, 148, 149 — — per l’atomo idrogenoide, 154 — — radiale, 153 — di stato dei gas perfetti, 377 — di Thomas-Fermi, 181 — di Wien, 292, 294 Equazioni: — cinetiche di evoluzione, 307, 464 — dell’equilibrio statistico, 319
— di Hamilton, 98, 119 — di Maxwell, 1, 432 Equilibrio: — idrostatico, 377 — radiativo, 371, 377 — termodinamico locale, 362, 366 Esponenziale complesso, 15 Fano, U., 422 Faraday, M., 1, 429 Fase dell’onda, 9, 14 Fast axis, 43 Fattore: — di attenuazione, 365 — di Land´e, 259 — — in accoppiamento L-S, 259 — — in accoppiamento interm., 259 — di Lorentz, 66 — di proiezione, 12 — relativistico γ, 66 — relativistico κ, 57 Fenomeni di smorzamento, 400 Fermi, E., 183, 308 Fermioni, 173, 295 Feynman, R., 97, 313 Filtro polarizzante, 41 Flusso di energia: — elettromagnetica, 19 — nei parametri di Stokes, 38 Flusso monocromatico, 21 — in un’atmosfera stellare, 370 — nei parametri di Stokes, 39 Fock, V.A., 187 Forza: — del multipletto, 351 — della transizione, 260, 351, 467 — di Coulomb, 3, 73 — di Lorentz, 3, 79, 255 — di oscillatore, 468 Forze relative: — dei componenti Paschen-Back, 265 — dei componenti Zeeman, 261 — delle righe di un multipletto, 352
INDICE ANALITICO
Fotoionizzazione, 143, 328, 379 Fotomoltiplicatore, 31, 40 Fotone, 107, 109 Fotosfera solare, 284, 362 Fraunhofer, J., 137 Frequenza: — angolare, 14 — angolare di Bohr, 303 — ciclica, 14 — ciclica di Bohr, 311 — delle collisioni, 332 — di ciclotrone, 79, 135, 255 — di Larmor, 255 Funzione: — di Hopf, 375 — di Lorentz, 333 — di partizione, 282 — di Planck, 289 — di trasferimento del reticolo, 31 — di Voigt, 334 — d’onda, 108 — — simmetria della, 172 — integro-esponenziale, 369 — radiale, 152 — radiale ridotta, 152, 165 — sorgente, 326, 329 Funzioni: — di Bessel, 75, 85 — di Laguerre, 156 — di Legendre, 151, 185 Galassie, 272 Gas nobili, 192 Gauge: — di Coulomb, 8 — di Lorenz, 7 — di Lorenz nel vuoto, 8 — trasformazioni di, 7 Gauss, C.F., 1 Giachetti, R., 159 Gilbert, W., 428 Grado di ionizzazione, 279 — di un plasma di Idrogeno, 283
487
Gravit` a superficiale (stella), 378 Hamiltoniana: — atomica non relativistica, 175 — correzioni relativistiche, 239 — del campo elettromagnetico, 107 — della particella carica, 119 — di Dirac, 115 — di interazione: — — atomo-radiazione, 302 — — spin-orbita, 239 — di massa nucleare, 268 — di oscillatore armonico, 98 — di struttura iperfine, 271 — di volume nucleare, 269 — magnetica, 257 Hartree, D.R., 187 H¨ onl, H., 352 Indice di rifrazione, 43 Induzione magnetica, 1 Integrale di Thomas-Fermi, 454 Integrali di interazione Coulombiana: — diretti e di scambio, 216, 228, 230 Interazione: — fra configurazioni, 212, 218, 342 — spin-orbita, 127, 239 — spin-spin, 240 Intercombinazioni: — fra configurazioni, 217 — fra termini, 217 Interferenze quantistiche, 306 Irraggiamento di cariche in moto, 63 Intensit` a: — di corrente, 429 — specifica della radiazione, 109 Interni stellari, 13 Invarianti relativistici, 473 Invarianza di gauge, 6 — nell’Elettrodinamica Quantistica, — — 409, 469 Ione Idrogeno negativo, 184, 379 — energia di legame, 379
488
INDICE ANALITICO
Irraggiamento: — di dipolo elettrico, 89 — di dipolo magnetico, 93 — di quadrupolo elettrico, 95 Jacobiano, 55 de Kronig, R., 352 Lamb, W.E., 164 Lamb-shift, 165 Lamina: — acromatica, 43 — a mezz’onda, 43 — a quarto d’onda, 43 — di ritardo, 41 Landau, L., 77, 86 Land´e, A., 170 Landi Degl’Innocenti, E., 199, 266, — 307, 378 Landolfi, M., 199, 266, 307 Lantanidi, 193, 219 Larghezza Doppler, 334 Laser, 111, 317, 362 Lastra fotografica, 31, 40 Lebedev, A., 13 Legge: — dello spostamento di Wien, 294 — di Amp`ere, 2, 430 — di Boltzmann, 282 — di Coulomb, 2, 427 — — (seconda), 428 — di Dalton, 380 — di Faraday, 2 — di Gilbert, 2, 428 — di Kirchhoff, 326, 329 — di Laplace (1a e 2a ), 429 — di Rayleigh e Jeans, 291 — di Saha, 282 — di Saha-Boltzmann, 281 — di Stefan, 290 Lifchitz, E., 77, 86 Lightman, A.P., 82
Livelli: — di Landau, 134 — energetici, 145 — metastabili, 218, 346 Lorentz, H.A., 7, 71, 255, 257 Lorenz, L.V., 7 Luce del cielo, 72 Luminosit` a (stellare), 371 Lunghezza d’onda, 14 — Compton, 402 Magnetone: — di Bohr, 132 — nucleare, 271 Mare di Fermi, 118, 407 Massa magnetica, 428 Massa ridotta, 141 Matrice densit` a, 306, 462 Matrice Jacobiana, 55 Matrici: — di Dirac, 116 — di Pauli, 116 — α e β, 117 — γ, 473 — τ , 130 Maxwell, J.C., 2, 430 McLennan, J.C., 349 Metodo: — della funzione di Green, 51 — della variazione delle costanti, 303 — di Hartree-Fock, 187 — di Thomas-Fermi, 179 — variazionale, 183 Mihalas, D., 329, 386 Milne, E.A., 359 Misure spettropolarimetriche, 39 Modello: — atomico di Lorentz, 71, 225, 316, — — 467 — dell’atmosfera grigia, 370 — di atmosfera stellare, 376 — di Bohr, 139 — empirico di atmosfera, 378
INDICE ANALITICO
— planetario dell’atomo, 139 Modi del campo di radiazione, 104 — numero di, 104, 110 Molteplicit` a (spin), 177 Momenti (campo di radiazione), 372 Momento: — angolare: — — autovalori e autovettori, 197 — — convenzioni di fase, 197 — — operatori di shift, 197 — — orbitale, 124, 148 — — regole di commutazione, 197 — — somma di j1 e j2 , 197 — — teoria del, 196 — — in coordinate sferiche, 148 — — totale, 131, 176 — di dipolo elettrico, 89 — di dipolo magnetico, 90 — di quadrupolo elettrico, 91 — magnetico elettronico, 127 — magnetico nucleare, 271 Moto Browniano, 25 Multipletti regolari e invertiti, 250 Multipletto: — di livelli, 247 — di righe, 251 — energia baricentrica, 248
489
Ørsted, H.C., 1, 429 Onde gravitazionali, 95, 451 Onde piane, 9 — sinusoidali, 14 Onde progressive e regressive, 9, 103 Opacit` a, 379 Operatore: — di scambio, 172 — Laplaciano, 50 — — in coordinate sferiche, 148 — parit` a, 177 Operatori: — di creazione e distruzione, 99, 108 — vettoriali, 242 Orbite penetranti, 167, 192 Ordine dello spettro, 31 Ornstein, L.S., 352 Ortoelio, 217 Oscillatore armonico, 97 Oscuramento al bordo, 368, 374
Paraelio, 217 Parametri di Stokes, 38, 44 Parametro d’urto, 72 Parit` a, 177, 189, 213, 342 Particelle: — di Bose-Einstein, 172, 297 — di Fermi-Dirac, 173, 295 Nane bianche magnetiche, 258 — indistinguibili, 171 Nebulio, 345, 348 Pauli, W., 174, 266 Nebulose, 345 Periodo (di un’onda), 14 Numero: Permeabilit` a magnetica del vuoto, 432 — di carica residua, 166 Permittivit` a elettrica del vuoto, 432 — di occupazione, 101, 107, 174, 278 Peso molecolare medio, 378 — — medio, 297, 298 Pila elettrica, 429 — d’onde, 14 Planck, M., 289 — quantico: Polarimetro, 44 — — azimutale, 158 Polarizzatore, 41 — — effettivo, 167 Polarizzazione: — — magnetico, 158 — circolare, 36, 38 — — principale, 158 — di un’onda monocromatica, 35 — — radiale, 158 — destrorsa (sinistrorsa), 36, 38 — ellittica, 36
490
INDICE ANALITICO
— lineare, 36, 38 Profondit` a ottica, 363 Polinomi generalizzati di Laguerre, 156— nel continuo, 383 Positrone, 119, 407 Proiettori, 407 Potenza emessa/ricevuta, 451 Propagatore, 408 Potenziale: Pulsar, 258 — centrifugo, 153 — chimico, 296 Quadriversore, 476 — di ionizzazione, 144, 186, 280 Quadrivettore, 472 — scalare, 5 Quantizzazione del campo, 97 — vettore, 5 Quantum defect, 166 Potenziali: — di Li´enard e Wiechart, 57 Racah, G., 199, 352 — elettromagnetici, 5, 49 Radiazione: — — come operatori, 103 — di ciclotrone, 79 Potere risolutivo, 34 — di corpo nero, 285 — dello spettroscopio, 33 — di frenamento, 72, 144 Pressione della radiazione, 12, 286 — — effetti quantistici, 78 Pressioni parziali, 381 — di sincrotrone, 81 Prima regola di Hund, 216, 237 — naturale, 45 Principio: Raggi UV duri, 196 — del bilancio dettagliato, 359 Raggi X, 72, 78, 196, 402 — dell’accoppiamento minimale, 120 Raggio: — della termodinamica stat., 459 — classico dell’elettrone, 69 Principio di: — della 1a orbita di Bohr, 140 — corrispondenza, 104, 121, 352 Random walk, 25 — equivalenza di Amp`ere, 125, 433 Rapporto: — esclusione, 171 — di ionizzazione, 282, 382 — Heisenberg, 165, 330, 393 — fra intervalli, 218, 237 — Huygens-Fresnel, 29 — giromagnetico, 132 — indeterminazione, 165, 330, 393 — — nucleare, 271 — Pauli, 171 Rappresentazione: — Rydberg-Ritz, 138 — della funzione d’onda, 114 Probabilit` a: — di Dirac, 117 — di assorbimento di un fotone, 319 — di Majorana, 117 — di diseccitazione spontanea, 315 Rates: — di diseccitazione stimolata, 318 — collisionali, 359 — di eccitazione, 319 — di rilassamento (coerenze), 464 — di emissione, 316 — di trasferimento (coerenze), 464 — di emissione stimolata, 318 Reattivit`a chimica, 193 — termodinamica, 459 Regioni H I, 272, 345 Profilo: Regola: — del coefficiente di emissione, 330 — aurea di Fermi, 307 — di riga, 384 — — generalizzata, 392
INDICE ANALITICO
— — per le coerenze, 464 — degli intervalli di Land´e, 247 — dell’accoppiamento minimale, 120 — della somma (multipletti), 352 — della somma sulla diagonale, 224 — della traccia, 221, 250, 457 — di Hund (prima), 216, 237 — di Hund (seconda), 250, 348, 459 — di Laporte, 217, 342 Regole: — di anticommutazione, 115, 473 — di commutazione, 98, 107, 113, 242 Regole di selezione: — fra configurazioni, 217, 342 — fra livelli J, 251, 338 — fra livelli F , 339 — fra sottolivelli Zeeman, 260, 338 — fra sottolivelli Paschen-Back, 265 — fra termini L-S, 217, 339 — nel teorema di Wigner-Eckart, 243 — per elettrone singolo, 167 — per transizioni proibite, 344 Relazione impulso-energia, 113, 114 Relazioni di Milne-Einstein, 359 Reticolo di diffrazione, 29 Ricombinazione elettronica, 144 Ridistribuzione in frequenza, 329 Riga a 21 cm, 272 Righe: — aurorali, 348 — dell’Idrogeno, 139 — di emissione, 368 — spettrali in ETL, 382 — — in non-ETL, 385 Rinormalizzazione dell’energia, 107 Ritardo (di una lamina), 43 Rutherford, E., 139 Rybicki, G.B., 82 Saha, M.N., 282 Salpeter, E.E., 165 Schr¨ odinger, E., 273 Seconda quantizzazione, 108
491
Seconda regola di Hund, 250, 348, 459 Sequenza isoelettronica, 165, 184 Serie di righe, 138, 168 — dell’atomo di Idrogeno, 138 Segr`e, E., 119 Serie geometrica, 30 Sezione d’urto: — Compton, 416 — — totale, 418 — per collisioni anelastiche, 356 — per collisioni elastiche, 356 — per diseccitazione collisionale, 359 — per eccitazione collisionale, 359 — per effetto Compton inverso, 426 — per fotoionizzazione, 328 — — dello ione H− , 379 — per radiazione di ciclotrone, 81 — per radiazione di frenamento, 78 — per radiazione di sincrotrone, 87 — Rayleigh, 72 — Thomson, 71 — — differenziale, 396, 416 Shortley, G.H., 223, 266 Simboli ak (a, b), bk (a, b), ck (a, b): — definizione, 232, 233 Simboli F k (a, b), Gk (a, b), 233 Simboli 3-j di Wigner: — definizione, 199 — propriet` a, 199, 200 — formula analitica, 199 Simboli 6-j di Wigner: — definizione, 351 — formula analitica, 353 — propriet` a, 352 Simmetrizzazione, 173 Sistema c.g.s di Gauss, 1, 431 Sistema Internazionale, 1, 272, 432 Sistema periodico: — irregolarit` a, 193 — principio di formazione, 191 — tabella, 194 — schema di “riempimento”, 195 Slow axis, 43
492
INDICE ANALITICO
Soluzioni a energia negativa, 118 Somma sugli stati, 274, 461 — — di polarizzazione, 397, 477 — — di spin, 407, 476 Somme su sottozone chiuse, 233 Sommerfeld, A., 145, 352 Sorace, E., 159 Sottolivelli magnetici, 259 Sottozona (spettroscopica), 190 Spessore ottico, 364 Spettro: — dei metalli alcalini, 165 — del Carbonio, 218 — del Deuterio, 267 — della radiazione, 17 — dell’Elio, 214 — dell’Idrogeno, 138 Spettro di un segnale periodico, 28 Spettro di un segnale stocastico, 26 Spettroscopio a reticolo, 29 Spin dell’elettrone, 124, 129 Spin del nucleo, 270 Spin elettronico totale, 175 Spinore, 117 Spostamento elettrico, 2 Stati pari e dispari, 178 Stati virtuali, 393, 406 Statistica di Bose-Einstein, 297 Statistica di Fermi-Dirac, 295 Stegun, I.A., 156 Stelle di neutroni, 258 Stelle nane bianche magnetiche, 258 Struttura fine: — atomo di Idrogeno, 164 — metalli alcalini, 169 — multipletti L-S, 248 Struttura iperfine, 266 Sviluppo multipolare, 87 Tabelle spettroscopiche, 251 Tassi: — collisionali, 359 — di rilassamento (coerenze), 464
— di trasferimento (coerenze), 464 Temperatura: — cinetica, 357 — di radiazione, 362 — efficace, 371 Tensore: — antisimmetrico, 116, 437 — degli sforzi, 5, 435 — di inerzia, 452 — di Maxwell, 4, 12 — di quadrupolo elettrico, 91 — metrico, 472 — unitario, 4 Tempo: — anticipato, 52, 53 — di campionatura, 20 — libero medio, 356 — ritardato, 53 Teorema: — dei due corpi, 141, 154 — — relativistico, 159 — dei tre coseni, 230 — della proiezione, 245 — di addizione (armoniche sf.), 231 — di Carnot, 185, 446 — di Fourier, 27 — di Gauss, 441 — di Parseval, 20 — di Poynting, 3 — di Rolle, 32 — di Stokes-Amp`ere, 441 — di Weyl, 231 — di Wigner-Eckart, 243 — ergodico, 306 Teoria classica dell’elettrone, 255 Teoria delle perturbazioni, 159 Termine: — Coulombiano (del campo elett.), 61 — diamagnetico, 125, 257 — di contatto, 128, 162 — di Darwin, 128 — di radiazione (del campo elett.), 61 Termini:
INDICE ANALITICO
— anomali, 196 — di 2 elettroni equivalenti, 206 — di 2 elettroni non equivalenti, 206 — di 3 elettroni, 207 — di n elettroni equivalenti, 211 — progentitori, 208 — spettroscopici, 138 Terre rare, 193 Terza legge di Keplero, 141 Thomas-Fermi: — equazione di, 181 — metodo di, 179 Toraldo di Francia, G., 30 Tracce di matrici γ, 478 Traccia (regola della), 221, 250, 457 Transizione elettronica, 139 Transizioni: — di dipolo magnetico, 343 — di quadrupolo elettrico, 343 — legato-legato, 328 — legato-libero, 328, 379 — libero-libero, 328, 379 — permesse, 337 — proibite, 337, 342 — semiproibite, 344
— Stokes e anti-Stokes, 398 — virtuali, 165 Trasformata di Fourier, 18 Trasformazioni di gauge, 6 — per la funzione d’onda, 121 Unit` a di Lorentz, 261 Valore di aspettazione, 106, 183 Valore principale di Cauchy, 463 Vele cosmiche, 13 Velocit` a di drift, 444 Venti stellari, 13 Versori di polarizzazione, 68, 103 Vettore di Poynting, 3, 11 Volta, A., 1, 429 Wien, W., 292 Zeeman, P., 255 Zeeman pattern, 263 Zona di radiazione, 63 Zona (spettroscopica), 190 — denominazione, 192
493
UNITEXT – Collana di Fisica e Astronomia
Adalberto Balzarotti, Michele Cini, Massimo Fanfoni Atomi, Molecole e Solidi Esercizi risolti 2004, VIII, 304 pp. Maurizio Dapor, Monica Ropele Elaborazione dei dati sperimentali 2005, X, 170 pp. Carlo M. Becchi, Giovanni Ridolfi An Introduction to Relativistic Processes and the Standard Model of Electroweak Interactions 2006, VIII, 139 pp. Michele Cini Elementi di Fisica Teorica 1a ed. 2005; ristampa corretta, 2006 XIV, 260 pp. Giuseppe Dalba, Paolo Fornasini Esercizi di Fisica: Meccanica e Termodinamica 2006, X, 361 pp. Attilio Rigamonti, Pietro Carretta Structure of Matter An Introductory Course with Problems and Solutions 2007, XVIII, 474 p.; 2a edizione 2009, XVII, 490 pp. Carlo M. Becchi, Massimo D'Elia Introduction to the Basic Concepts of Modern Physics Special Relativity, Quantum and Statistical Physics 2007, X, 155 p.
Luciano Colombo, Stefano Giordano Introduzione alla Teoria della elasticità Meccanica dei solidi continui in regime lineare elastico 2007, XII, 292 pp. Egidio Landi Degl'Innocenti Fisica Solare 2008, X, 294 pp., inserto a colori Leonardo Angelini Meccanica quantistica: problemi scelti 100 problemi risolti di meccanica quantistica 2008, X, 134 pp. Giorgio Bendiscioli Fenomeni radioattivi Dai nuclei alle stelle 2008, XVI, 464 pp. Michelangelo Fazio Problemi di Fisica 2008, XII, 212 pp., con CD Rom Giampaolo Cicogna Metodi matematici della Fisica 2008, X, 242 pp. Egidio Landi Degl'Innocenti Spettroscopia atomica e processi radiativi 2009, XII, 494 pp.