Sources et évolution
delaphysiquequantique Textesfondateurs
José LEITE LOPES et
Bruno ESCOUBÈS
Ki SCIENCES
17, ave...
124 downloads
1240 Views
14MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Sources et évolution
delaphysiquequantique Textesfondateurs
José LEITE LOPES et
Bruno ESCOUBÈS
Ki SCIENCES
17, avenue du Hoggar Parc d’activités de Courtabœuf, BP112 91944 Les Ulis Cedex A, France
Une précédente édition de ce livre a été publiée en 1994 aux Éditions Masson. Ouvrage publié avec le concours du Centre national du livre.
ISBN : 2-86883-815-4 Tous droits de traduction, d’adaptation et de reproduction par tous procédés, réservés pour tous pays. La loi du il mars 1957 n’autorisant, aux termes des alinéas 2 et 3 de l’article 41, d u n e part, que les (( copies ou reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective »,et d’autre part, que les analyses et les courtes citations dans un but d’exemple et d’illustration, <( toute représentation intégrale, ou partielle, faite sans le consentement de l’auteur ou de ses ayants droit ou ayants cause est illicite N (alinéa 1..de l’article 40). Cette représentation ou reproduction, par quelque procédé que ce soit, constituerait donc une contrefaçon sanctionnée par les articles 425 et suivants du code pénal.
@ EDP Sciences 2005
AVANT-PROPOS Nous sommes heureux de présenter une ré-impression de l’ouvrage de José Leite Lopes et Bruno Escoubès, Sources et évolution de la physique quantique. Textes fondateurs, dont la première édition, parue en 1994’, avait été très vite épuisée. La réédition était demandée par beaucoup, et les auteurs-organisateurs de ce précieux recueil de textes et leurs ayants-droits nous en ont confié la charge. Elle était particulièrement opportune en cette << Année internationale >> de la physique, décidée par l’ONU2 et lancée par l’UNESCO à l’occasion du centenaire de la publication des travaux de 1’« année d’or >> d‘Einstein, puisque les textes rassemblés s’inscrivent dans la suite directe de ces recherches pionnières, dégageant ce qui apparaissait peu à peu comme la voie royale de la physique de la matière élémentaire, atomique, nucléaire et subnucléaire. Cet ouvrage est susceptible d’aider à renouer, sur des problématiques contemporaines, le fécond et nécessaire dialogue des sciences avec la philosophie. Ces << textes fondateurs >> sont dus à la plume de physiciens importants du XXe siècle, et les organisateurs du recueil sont également physiciens. J. Leite Lopes, qui fut l’élève de Wolfgang Pauli et de José-Maria Jauch lors de ses années de doctorat aux États-Unis, ami de Richard Feynman, de David Bohm, et de nombreux autres physiciens prestigieux, est connu internationalement par ses travaux, notamment sur les interactions faibles (on lui doit une première esquisse de leur unification avec les interactions électromagnétiques dans le domaine quantique) ; il fut lui-même l’un des pionniers de la physique théorique au Brésil, grand professeur et créateur d‘institutions qui ont formé des générations de chercheurs du Brésil et d‘Amérique latine. Homme de progrès, il fut proscrit par la dictature militaire qui sévit dans son pays des années 1960 jusqu’au début des années 1980. Nourri de culture française, c’est en France qu’il trouva l’accueil qui lui permit la poursuite de ses travaux : à l’université Louis Pasteur de Strasbourg où il a enseigné jusqu’à sa retraite, reprenant ensuite ses activités au Brésil où il se trouve aujourd‘hui. Pendant son séjour en France, il engagea de fructueuses collaborations avec les physiciens expérimentateurs, et promut des dialogues riches et stimulants avec des chercheurs d’autres disciplines, et notamment des philosophes, suscitant la fondation du Séminaire sur les Fondements des Sciences de
Aux éditions Masson (Paris). Lors de sa 58eAssemblée Générale.
IV
Sources et évolution de la physique quantique
l’Université Louis Pasteur-Strasbourg-ï3. La collaboration entre José Leite Lopes et Bruno Escoubès (1938-1999), physicien expérimentateur des particules, chercheur au CNRS, également intéressé par les questions de fondements et de méthodologie4, a pris naissance dans ce cadre, enrichie par des rapports personnels d’amitié. Bruno Escoubès n’aura malheureusement pas le plaisir de voir republié le livre Sources et évolution de la physique quantique, où il s’était grandement investi, puisqu’il nous a quittés prématurément, encore en pleine activité, en 199g5. Ce livre est donc de part en part l’ouvrage de physiciens et il intéressera au premier chef les praticiens de cette discipline par les perspectives qu’il leur rappellera dans ce domaine. Mais en même temps on saisira très vite, à la lecture, comment il déborde les aspects spécialisés d u n e discipline scientifique, en faisant revivre à nos yeux toute une aventure intellectuelle et ses enjeux. I1 intéressera, à ce titre, très largement au-delà de la physique, ceux qui se préoccupent de la formation des idées scientifiques, des nouveaux concepts et des théories, de la nature et du rôle de l’expérimentation, et des implications plus générales de la nouvelle physique sur les conceptions de la connaissance et du monde matériel. À cet égard il est utile de reprendre des éléments du commentaire que l’un d’entre nous en donnait pour accueillir la première édition6. c< Pour ceux qui travaillent dans la recherche, la physique va toujours de l’avant, de sorte que le “centre de gravité” des représentations qu’ils s’en font est toujours un petit peu au-delà du présent. Avant même d’avoir terminé l’analyse expérimentale et théorique des phénomènes observés, ils sont déjà en train d e n prévoir d’autres, que la force d’entraînement des premiers réclame - car les explications ne sont jamais fermées, et nécessitent quelque chose en plus. Pour les autres, les non-spécialistes, et jusqu’à un public relativement large, les conceptions de la physique contemporaine font désormais partie de notre univers intellectuel, à tel point que les descriptions et les commentaires qu’on
Fondé, au début des années 1970, et animé par J. Leite Lopes, Hervé Barreau et l’un d’entre nous (MP), ce séminaire eut un rôle important pour favoriser les dialogues interdisciplinaires. I1 nourrit la publication de Cahiers et, jusqu’au début des années 1990, de la revue Fundamenta Scientiz. C’est sur l’initiative de J. Leite Lopes que fut organisé, en 1974, le Colloque Un demi-siècle de Mécanique Quantique, qui compta, essentiellement grâce à son intermédiaire, avec des collaborations prestigieuses ; voir la publication : J. Leite Lopes et M. Paty (eds.), Quantum mechanics, a halfcentury later, Reidel, Dordrecht, 1977. (I1 en existe une version préliminaire avec une partie des textes en français. publiée comme Cahiers Fundamenta Scientile (ULP, Strasbourg), nos25 à 4 i : cette publication peut être consultée dans diverses bibliothèques, notamment la Bibliothèque Universitaire de Strasbourg et la Bibliothèque Nationale de France). Il a notamment donné un ouvrage apprécié sur les méthodes statistiques en physique : B. Escoubès, Probabilités et statistiques à l’usage des physiciens, éditions Ellipses, Paris, 1998. La vie, les travaux et les engagements de Bruno Escoubès sont évoqués dans la brochure à Bruno Escoubès. Hommages et témoignages, CNRS, Strasbourg, 29 septembre 1999. M. Paty, [C-r de lecture] c< J. Leite Lopes et B. Escoubès, Sources et évolution de la physique quantique. Textes fondateurs N, Lettre des Départements scientifiques du CNRS. Physique nucléaire et corpusculaire, IN2P3, no 19, oct.-déc. 1994, 26-27.
Avant-propos
V
en donne sont toujours actualisés, formulés dans des termes d‘aujourd’hui, comme s’ils l’avaient toujours été, participant d u n e connaissance intemporelle et énoncés une fois pour toutes, bien que l’on sache que la physique évolue et que l’on attende toujours son fin mot. En sorte que l’on en oublie les tâtonnements anciens et les surgissements périodiques d‘idées nouvelles qui ont marqué toute son histoire. Cela vaut d’ailleurs pour les accomplissements relativement récents : tendus vers la recherche du sixième quark ou des bosons de Higgs, l’on en oublie presque que ce qui les a motivés, les symétries de jauge, ont fait un jour leur apparition, ellesmêmes suscitées dans la pensée théorique par des problèmes antérieurs... Si nous dévidons, à partir de ce que nous savons aujourd‘hui de la physique des particules élémentaires et des champs quantifiés, le fil des questions et des découvertes, qui sont inextricablement d’ordre expérimental et d’ordre théorique, c’est tout le développement de la physique atomique et quantique qui se présente nous. Telle est l’aventure que nous proposent J. Leite Lopes et B. Escoubès - comme une cure de rajeunissement pour une discipline déjà riche et quelque peu âgée, plutôt qu’un simple album de souvenirs - en nous donnant à lire et en nous présentant l’ensemble de textes fondateurs réunis dans ce livre. Quelle fraîcheur, en effet - et quel plaisir intellectuel - de lire, dans les termes mêmes de leurs inventeurs, dans le halo parfois incertain, parfois déjà étrangement précis, de leur apparition, de leur nouveauté, les énoncés de cette physique qui s’élabore peu à peu, de la découverte de la radioactivité à la recherche de la symétrie des champs unifiés. I1 était, bien entendu, nécessaire de faire un choix parmi l’abondante production d’idées et de résultats couvrant tout un siècle - depuis la découverte faite par Becquerel -, et portant sur un vaste domaine. Celui-ci inclut, en effet, la physique des rayonnements et de l’atome, la physique quantique sous sa première forme, semi-classique, puis comme mécanique quantique, prolongée en théorie quantique des champs, les physiques atomique et nucléaire, celle du rayonnement cosmique, enfin la physique des particules élémentaires, prolongée dans 1’« astroparticule >> actuelle et la cosmologie des premiers instants de l’Univers. Le choix proposé par J. Leite Lopes et B. Escoubès se fonde sur le fait que la théorie des particules élémentaires s’identifie aujourd’hui à la théorie quantique des champs, et que l’axe théorique de tous ces développements - très bien indiqué par le titre de leur ouvrage - est celui de l’élaboration de la théorie quantique, qui culmina un temps avec la mécanique quantique non relativiste, mais qui a pris décidément depuis la direction - relativiste - de la théorie quantique des champs, de l’électrodynamique quantique aux champs de jauge unifiés. Une fois prise la décision de privilégier la physique théorique sous son aspect fondamental, dans la ligne indiquée, le choix des textes apparaît judicieux. Ceux qui ont été retenus comptent parmi les plus significatifs de l’élaboration de la physique quantique, de la radioactivité à la mécanique quantique et à la théorie quantique des champs, tout en restant généralement accessibles au-delà des jargons techniques - et ne serait-ce pas là, d’ailleurs, la définition de ce que l’on pourrait appeler désormais les grands classiques >> ? Ils sont répartis en chapitres, introduits par un commentaire, toujours éclairant, qui les ((
VI
Sources et évolution de la physique quantique
situe dans leur contexte et évoque les autres travaux qui les ont rendus possibles ainsi que ceux, également importants, mais qui ne pouvaient trouver leur place dans ce précieux recueil. Le résultat est une présentation de tout un pan de la physique contemporaine, à travers la lecture directe de certains de ses textes fondateurs, telle qu’elle s’est constituée grâce à l’invention d‘idées nouvelles conçues pour la formulation et la résolution des problèmes posés par la structure de la matière. La plupart des textes choisis sont des articles originaux - souvent d‘accès difficile, notamment en langue française. Quelques-uns sont de nature expérimentale, comme ceux de Becquerel sur la radioactivité, de Rutherford sur l’existence du noyau atomique, de Uhlenbeck et Goudsmit sur la mise en évidence du spin de l’électron. D’autres sont plus (< phénoménologiques »,comme celui de Pauli sur le principe d’exclusion, ou celui de Fermi sur la statistique qui porte son nom. D’autres, enfin, sont de nature plus (c fondamentale >> d u point de vue théorique, et ce sont les plus nombreux, en raison du principe qui a présidé à la sélection. Ils concernent tout d‘abord l‘hypothèse des quanta de Max Planck et d’Albert Einstein. De la période intermédiaire entre les premières idées sur les quanta et l’élaboration de la mécanique quantique, les auteurs ont retenu l’article de S.N. Bose sur la statistique des particules de spin entier. L’absence des articles fondamentaux d‘Einstein de cette période intermédiaire, celui de synthèse de 1915 (((Vers une théorie quantique du rayonnement », republié en 1916), qui fut le point de départ de tous les travaux ultérieurs, vers la mécanique ondulatoire comme vers la mécanique quantique, et ceux de 1924-1925 sur ce qui devait s’appeler la (< statistique de BoseEinstein », s’explique par le fait que ces textes sont devenus des classiques, republiés et plus faciles à trouver7. L’élaboration des mécaniques ondulatoire et quantique est présente par des articles de Louis de Broglie, Erwin Schrodinger, Werner Heisenberg, ainsi que celui de Max Born établissant à la fois 1’ (( approximation de Born N en théorie des perturbations et l’interprétation probabiliste de la fonction d’onde. Celle de la mécanique quantique relativiste nous est donnée avec l’article original de Paul A.M. Dirac. Les questions d’interprétation au sens général, caractéristiques de la mécanique quantique, ne sont pas absentes, représentées par Niels Bohr et la complémentarité, ainsi que par les considérations de Fritz London et Edmond Bauer sur la réduction du paquet d‘ondea. L‘élaboration de la théorie quantique des champs et les développements récents sont confiés à des rétrospectives, plus accessibles et synthétiques que les contributions originales - telles la découverte par Richard Feynman des intégrales de chemin, contée par son auteur de la manière la plus vivante, ou l’invention de la théorie électrofaible évoquée par Steven Weinberg dans son Les Annales de la Fondation Louis de Broglie (1979, 1982) en ont donné naguère des traductions, et l’édition en français des CEuvres choisies d’Einstein (6 vols., Seuil, Paris, 1989-1993) a incorporé de nouvelles traductions de ces articles dans le premier volume, sur Les Quanta (1989). I1 aurait fallu un autre volume entier pour couvrir tout ce domaine, comme par exemple le livre de recueil de textes de John A. Wheeler et Wojcieh H. Zurek, Quantum the0 y of measurement, Princeton University Press, Princeton, 1983.
Avant-propos
VI1
Discours de réception du Prix Nobel - ; ils sont aussi l’objet de prospectives, par la reprise d’un texte de Pierre Fayet, qui sert de conclusion ouverte sur l’avenir, avec les perspectives offertes aujourd’hui à l’unification. Un appendice sur la physique: nucléaire au cours des années 30 dans différents pays et une bibliographie complètent l’ensemble. Au total, on ne peut que se féliciter de l’heureuse initiative prise par José Leite Lopes et Bruno Escoubès en mettant sous nos yeux un ensemble aussi riche d’idées et aussi exemplaire dinventivité, qui témoigne à l’évidence pour la créativité du travail scientifique, avec ceci de remarquable que les formes inventées nous rendent intelligible la constitution matérielle du monde où nous vivons. >> Ces textes représentent des moments marquants de l’histoire de la physique contemporaine et de son développement, tant par le mouvement de la pensée qu’ils rendent manifeste pris dans leur ensemble, que par leurs incidences implicites ou explicites sur les problèmes de la philosophie de la connaissance. Cette réédition, qui se présente SOUS la forme d’un fac-similé, n’appelait pas de changement particulier par rapport à la première, et nous avons également jugé bon de garder la préface, tout à fait pertinente, que Jean-Marc Lévy-Leblond, professeur émérite à l’université de Nice, avait donnée pour la première édition à la demande des auteurs. Nous remercions vivement José Leite Lopes et Salomé de Unamuno Escoubès, légataire de son époux décédé, de nous avoir confié cet ouvrage, de nous avoir fourni tous les éléments pour sa publication, et de ne pas avoir désespéré au vu des difficultés éditoriales rencontrées. Michel PAW et Jean-Jacques SZCZECINIARZ
TABLE DES MATIÈRES Préface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
XI
Chapitre 1 : De l’atomisme grec à la découverte de la radioactivité 1.1 Les intuitions grecques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 L‘atomisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3Ladynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 La cosmologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 La synthèse newtonienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Les découvertes du XIXe siècle .............................
4 6
Article I - H . Becquerel :Découverte de la radioactivité
11
...........
1
3
7 9
Chapitre 2 : De la relativité à la première quantification 2.1 La théorie de la relativité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Planck et la quantification de l’énergie ; Einstein et les photons . . 2.3 Les modèles atomiques, de Thomson à Bohr . . . . . . . . . . . . . . . . . .
13 16 18
Article II - M . Planck :Quant3catioiî de l’interaction rayonnementmatière . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
Article III - A . Einstein :Le photon
28
Article IV
-
E . Rutherford
........................... : La mise en évidence du noyau . . . . . . . . .
41
Chapitre 3 : La construction de la nouvelle mécanique 3.1 Le principe d‘exclusion et le spin de l’électron. La condensation de Bose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
57
Article V - W. Pauli :Le principe d’exclusion
63
....................
Article VI - G.E. Uhlenbeck et S . Goudsmit :Le spin de l’électron . . . .
78
Article VI - E . Fermi :La statistique des fermions
...............
81
Article VIII - S . Bose :La statistique des bosons
................. .................................
85
3.2 La mécanique quantique
89
Article I X - L. de Broglie :La longueur d’onde associée à la matière
92
Article X - E . Schrodinger :L’équation non relativiste des ondes de DeBroglie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
.......... 2.3 L’interDrétation Drobabiliste de la mécanique quantique . . . . . . . . _-
Article XI ....
~
I . .
W . Heisenberg ~
I
:La mécanique des matrices I
-
112 126
X
Sources et évolution de la physique quantique
............... Article XIII - N . Bohr :Le principe de complémentarité . . . . . . . . . . . Article XIV . F. London et E . Bauer :Le problème de la mesure enphysique . . . . . . . . . . ......................... Article XII . M . Born :Lfndéterminisme quantique
129
133
153
Chapitre 4 : De la mécanique quantique relativiste à la théorie quantique des champs
............. Article XV . P A M . Dirac :L’équation d’onde relativiste de l’électron . . 4.2 L’électrodynamique quantique ............................. 4.3 La quantification par l’intégrale de chemin . . . . . . . . . . . . . . . . . . . 4.1 La mécanique quantique relativiste : l’anti-matière
189 194 209 210
4.4 Les diagrammes de Feynman pour les propagateurs de l’électron 212 etduphoton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Le positon et la marche de l’électron vers le passé . . . . . . . . . . . . . . . 215 4.6 La renormalisation des théories quantiques des champs . . . . . . . . 217 Article XVI - R.P. Feynman : L’électrodynamique quantique
.......
219
Chapitre 5 : Les grandes heures de la physique des particules 5.ïLeneutrinodePauli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2Leneutron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Le champ de mésons de Yukawa ...........................
241 242 243
Article M I - H . Yukawa :La prédiction du méson
246
................
5.4 Les accélérateurs et les détecteurs de particules . . . . . . . . . . . . . . . 255 5.5 La découverte des mésons : la désintégration des pions 256 et desmuons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Chapitre 6 : Vers l’unification des interactions 6.1 Les particules élémentaires et le modèle SU(3) de Gell-Mann . . . . . 261 6.2 Les champs de jauge et les interactions fortes . . . . . . . . . . . . . . . . . 270 6.3 Le modèle standard d‘unification des interactions électromagnétique 275 etfaible . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.......... 6.4 La super-unification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Article XIX - P. Fayet :L’unification de toutes les interactions ? . . . .
Article X W I I - S. Weinberg :L’unification électro-jiaible
279 296 299
Appendice . La physique nucléaire dans les années 30 aux ÉtatS.unis, en France. au Japon et au Brésil . . . . . . . . . 307 Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
311
Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
313
PREFACE Pourquoi (re)lire les classiques ? On n’imagine pas un écrivain qui n’aurait pas lu Proust et Faulkner, un philosophe qui n’aurait pas travaillé Husserl et Sartre, un musicien qui n’aurait pas écouté Stravinski et Messiaen, un peintre qui n’aurait pas regardé Picasso et Malevitch. Mais on ne s’étonne pas qu’un physicien n’ait pas lu Einstein ni Heisenberg - pour nous en tenir à ce siècle : la comparaison entre la fréquentation par leurs successeurs respectifs de Rabelais et Cervantes, Descartes et Kant, Monteverdi et Mozart, Titien et Goya d’une part et Galilée et Newton de l’autre, n’est que trop éloquente. On a même théorisé cette amnésie constitutive : “ une science qui hésite à oublier ses fondateurs est condamnée ” a pu écrire Whitehead au début de ce siècle. I1 est vrai que la science se laissait encore prendre pour le parangon du progrès. Nous abandonnons à peine cette belle mais naïve vision. C’est le développement même de la science qui nous y contraint. On aurait bien surpris les jeunes chercheurs d’il y a trente ans en leur annonçant qu’à la fin de ce siècle, l’un des domaines les plus actifs et les plus prestigieux de la physique théorique serait la dynamique non-linéaire, héritière directe de la “ vieille ” mécanique du l g e , pardessus trois quarts de siècle de physique “ moderne ”, quantique et relativiste. On les aurait choqués plus encore en leur apprenant que la physique des particules et interactions fondamentales, après 50 ans de domination peu contestée sur la physique de pointe ”, allait probablement connaître à son tour une phase de récession. Aussi pourrait-on voir avec quelque malice le présent recueil des grands textes originaux qui ont jalonné le développement de la physique atomique, puis nucléaire et subnucléaire, comme ces albums de souvenir nostalgiques que les grandes stars feuillettent au soir de leur carrière pour se rappeler leurs succès passés. La physique contemporaine a bien sûr d’autres sources et a connu d’autres évolutions, ne serait-ce que dans les domaines de l’astrophysique et de la cosmologie, de la physique des solides et des matériaux, de la physique statistique et de la dynamique des fluides, par exemple, pour se retrouver toute entière dans cette histoire. 11n’en demeure pas moins que cette physique, celle de la plongée vers l’élémentaire de la matière et le fondamental de sa pensée (même si l’un et l’autre sont toujours plus élusifs, d’ailleurs), a connu au cours de ce siècle des succès majeurs et qui resteront dignes d’admiration. La lutte des théoriciens pour rompre avec des représentations trop familières et pour construire de nouveaux concepts adéquats à la compréhension du monde dans ces cantons nouveaux de notre expérience ne saurait être sous-estimée. I1 est bon de pouvoir revivre “ en direct ” ces efforts admirables, et d’en retrouver la vigueur et la complexité, trop souvent affadies ou aseptisées dans les manuels d’enseignement et les livres de vulgarisation.
XII
Sources et évolution de la physique quantique
On peut d’ailleurs formuler le vœu qu’un second volume de cette entreprise vienne bientôt rendre hommage au travail des expérimentateurs qui ne fut pas moindre : Bohr sans Rutherford, de Broglie sans Davisson et Germer, Fermi (thée ricien) sans Fermi (expérimentateur), Feynman sans Lamb, ne peuvent illustrer qu’une face des médailles commémoratives des triomphes de cette physique. Que ces travaux pratiques n’aient pas connu, hors du milieu professionnel, la même notoriété que les recherches théoriques, et n’aient pas fait i’objet d’autant d‘exégèses philosophiques et métaphysiques souvent douteuses ne fait que renforcer la nécessité de corriger une vision par trop désincarnée de la science contemporaine. A propos de ces exégèses d’ailieurs, la vulgate des commentaires épistémologiques et historiques sur la théorie quantique, et beaucoup d’idées reçues sur son interprétation et ses implications, seront sérieusement mises à mai par le retour aux sources que nous offre ce livre ; ce n’est pas l’un de ses moindres mérites. On constatera ainsi, non sans un étonnement porteur d’intéressantes questions, qu’Einstein n’utilise pas le terme de “ photon ”,ni Rutherford celui de noyau ” : plus surprenant encore, les articles fondateurs de de Broglie ne font aucune mention de la “ longueur d’onde en tant que telle, et celui d’Heisenberg élimine d’emblée la position de l’électron des grandeurs “ observables ”. Quant à Born, c’est dans une note de repentir ajoutée lors de la correction des épreuves qu’il interprète comme probabilité le carré de la fonction d’onde ! En d‘autres termes, les idées nouvelles une fois découvertes, il reste à les dégager de leur gangue et à les polir, à les transformer en paradigme, comme on dirait aujourd’hui. Mais c’est une autre histoire - à suivre . . . Le présent ouvrage, cependant, s’il est certes un monument à la gloire d’une noble discipline, n’est pas pour autant un cénotaphe. C’est que la physique fondamentale, si elie n’est plus seule au faite de la renommée, reste encore vivante et riche de problèmes et de promesses. La difficulté même des tâches qu’elle affronte désormais rend certainement nécessaire le développement d’idées neuves. Rien de plus utile dans ces conditions qu’un retour au passé. L’histoire des sciences abonde en situations où l’innovation a surgi d‘œuvres anciennes dont certaines potentialités sont restées incomprises ou négligées (ainsi de la récente relecture des travaux de Poincaré, après plusieurs décades d’oubliettes). I1 est tout à fait plausible que nombre de textes fondateurs, comme ceux ici rassemblés, recèlent, dans la confusion inéluctable des commencements, d’utiles indications pour aujourd’hui ou demain. Il faut donc lire ces textes, non seulement comme des témoignages du pas&, mais comme des appels du futur. C’est dire que, de fait, nous devons considérer Einstein et Heisenberg comme Proust et Faulkner, Husserl et Sartre, Stravinski et Messiaen, Picasso et Malevitch. Physiciens, encore un effort pour être cultivés ! Jean-Marc Lévy-Leblond Nice, février 1994
AVANT-PROPOS Remonter aux sources, aborder les évènements - découvertes et interrogations - qui fondèrent la physique du XXc siècle, comme le firent ceux qui s’intéressèrent les premiers aux dimensions du monde quantique, et par là reaéèrent l a nature à travers ses particules et les forces s’exerçant entre elles, voici le but de ce livre. U propose, en effet, la lecture d’articles originaux choisis depuis la découverte de la radioactivité, et replacés dans leur cadre historique, allant de la vision des philosophes présocratiques à celle des physiciens d’aujourd’hui, ces derniers basant leur connaissance d u monde sur l’étude des leptons, des quarks et de leurs interactions. Quels articles ? Si, bien sûr, les plus importants n’y figurent pas tous, ceux qui ont été choisis eurent et ont toujours une importance capitale. Les uns furent à l’origine de percées théoriques et expérimentales qui bouleversèrent nos conceptions de la structure de la matière. D’autres, comme l’exposé de F. London et E. Bauer, furent considérés par leurs collègues comme essentiels en tant que mises au point sur des problèmes âprement disputés comme le fut - et comme l’est - le problème de la mesure en mécanique quantique. Les deux conférences Nobel de R.P. Feynman et S. Weinberg sont, en plus du témoignage personnel de la démarche de chacun vers la découverte, des résumés de “ l’état de l’art ” à leur époque dans les domaines de l’électrodynamique quantique et des théories d’unification. Ce faisant, nous sommes conscients que nous nous privons de de la contribution d’auteurs aussi importants que E. Wigner ou C.N. Yang, pour ne citer qu’eux. Tout choix entraîne des regrets. En quelle langue ? A quelques éclatantes exceptions près, la langue de la physique avant 1933 fut l’allemand. Quand Einstein reçut, pour donner son avis, l’article de Bose ici reproduit, il le traduisit en allemand afin de lui assurer une meilleure diffusion. Pour faciliter l’accès à des textes parfois ardus, nous avons adopté le français pour tous les textes, y compris ceux écrits en anglais et en italien. Nous mentionnerons pour chaque article le nom de son traducteur. E t nous avons pu indirectement bénéficier pour cette tâche, de collaborateurs aussi prestigieux que A. Proca ou L. Rosenfeld. Ce livre se présente donc comme une séries d‘étapes historiques, pourvues des jalons nécessaires à la compréhension des textes choisis dans l’anthologie, textes donnés quant à eux sans commentaires. L’approche privilégie celle du physicien théoricien, même si on a pris soin de signaler les principales découvertes expérimentales. Des approches complémentaires sont présentées d a n s la bibliographie à la fin de l’ouvrage, parmi lesquelles l’on peut souligner le très beau livre de E. Segrè, et, plus spécifique, celui de R.N. Cahn et G. Goldhaber.
XIV
Sources et évolution de la physique quantique
Nous vouions remercier ici tous ceux qui ont rendu ce livre possible. Et tout d’abord les physiciens de Strasbourg qui ont participé à la traduction des articles : MM. Henri Braun, Georges Fridr, Jean Klein, Georges Oberlechtner pour I’ailemand ; et Mme Clara Matteuzzi-Cundy, de Milan et du CERN, pour l’italien. Nous remercions également la Fondation Nobel de nous avoir permis de r e produire les Conférences Nobel choisies, les Editions du Seuil et Latfont pour les traductions d’Einstein et de Feynman, les éditeurs des revues où furent publiés les articles choisis ; le Niels Bohr Archive ; les Presses Universitaires de France, les éditions Hermann et la Société Française de Physique. Nous tenons aussi à remercier M. Georges Weil, du Centre de Calcul du CNRS de Strasbourg et Mme Alice Tissier, du Centre de Recherches Nucléaires, pour leur précieuse aide lors de la saisie du texte.
Chapitre 1
De l’atomisme grec à la découverte de la radioactivité 1.1 Les intuitions grecques Quelle est l’image physique du monde aujourd’hui ? Comment a-t-elle évolué à travers l’histoire ? Les spéculations sur la structure de l’Univers constituèrent toujours une part importante des systèmes philosophiques et des modèles cosmogoniquesdes anciennes civilisations. En Asie, au Moyen Orient, en Afrique, dans les Amériques, les sociétés anciennes ont produit de belles réalisations dans leur approche mythique de la nature, dans leurs monuments, dans leur génie artistique et technologique, dans leurs observations astronomiques, dans leur philosophie de l’espace, du temps, de la matière, de la vie et de la mort, dans toutes ces créations qui reflètent leur rapport au monde. Si, durant des milliers d’années, existèrent des éléments de culture avancée dans d’autres civilisations, il revint aux Grecs d’inventer les mathématiques comme représentation des principes permanents du monde, de pratiquer la philosophie mmme spéculation scientifique SUT la nature des choses, des corps célestes, de l’univers, tout en développant leur propre imaginaire mythique, religieux et artistique. Bertrand Russel écrivait : Dom toute 1 ’histoire, n’en n’est p l w surprenant ni plus dificile à ezpliquer que l’éclosion subite de la civilbation en Grèce n. Et dans son beau livre sur la philosophie des mathématiques et des sciences de la nature, Nous devom auz Grecs une comprthemion claire Hermann Weyl affirmait : de la nature intime de la structure de l’espace qui se manifeste dans les relations entre configurntiom et datu ses lois de relatiom mutuelles, ef qui est quelque chose d’entièrement rationnel n . Avant les Grecs, les Babyloniens et les Egyptiens avaient déjà fait, pendant des siècles, des observations du mouvement du soleil et de la lune par rapport aux étoiles fixes, et savaient comment prédire les éclipses lunaires et solaires. Mais les Grecs tentèrent les premiers de comprendre l’Univers en tant que tel. Alors que leur mythologie assimilait les corps célestes à des dieux, Anaxagore affinna que le Soleil était semblable à une pierre chauffée au rouge et que la Lune était faite mmme la Terre. Pour les disciples de Pythagore, à la fin du 5’ siècle avant J.-C., la Terre était sphérique ; Aristarque de Samos, au 3‘ siècle avant J.-C.découvrit le système i
Bertrand Russel, History
western philosophy, Unwin Paperbacks, London 1979. E. We 1, Philosophy of mathematics and naturalsciences, Princeton University Press, Princeton i k 9 . O/
Sources et évolution de la physique quantique
2
héliocentrique, et Erathostène, aux environs de 200 ans avant J.-C., calcula, d’après Claudius Ptolémée, la distance maximale entre le Soleil et le Terre. A Pythagore on attribue l’origine du mot théorie, un état de contemplation rempli de passion et d’&dé, origine de la connaissance mathématique et de la physique théorique. Chez Thalès, fondateur de 1’Ecole de Milet, qui prédit une éclipse de Soleil survenue en 585-584 avant J.-C., nous trouvons l’idée de l’existence d’une substance primordiale, un élément fondamental dont seraient faites toutes les choses, et qu’il identifie avec l’eau. ‘L C’est, pense-i-on, pour l’avoir appris des Egyptiena, qu’Homère et Thalès posaient l’eau comme le principe et l’origine de toutes choses ” 3 . Anzdmandre, de Milet, af€irme que toutes les choses sont faites d’une dubstance fondamentale, qui n’est ni l’eau, ni aucun des corps que n o w connaissotu : elle est infinie, éternelle, elle est la matière de tous les mondes, notre monde n’étant qu’un monde parmi beaucoup d’autres. Il existerait, suivant Anaximandre, une proportion définie de feu, de terre et d’eau ; chacun de ces éléments, conçus comme des dieux, tente de dominer les autres, mais sa proportion obéit à une fatalité, à une certaine nécessilé : cette nécessité d’une proportion entre les éléments annonce la notion de loi de la nature. Pour Anaximène, un autre penseur de Milet (antérieur à 494 avant J.-C.), la substance primordiale est l’air, le f e u étant l’air raréfié, l’air se condensant se transforme en eau, celle-ci se condensant en pierres, en terre ; la cohésion du monde serait assurée par une espèce de respiration - une notion qui sera substituée au XIX‘ siècle par l’éther, substance dont le rôle serait de transmettre à travers l’espace les actions physiques. Cette approche matérialiste de la nature s’accompagne d’une intuition qui se révèlera féconde. Pour Pythagore, toutes les choses Jont des nombres. Aristote décrivait ainsi les Pythagoriciens : “ . .comme, e n plw ils voyaient que les nombres ezpn’maient les propriétés et les proportions muaicales ; comme enfin toutes les autres choses leur paraissaient, datu leur nature, formées à l’image des nombres, et comme les nombres parausaient être les réalités primordiales de l’Univers : dans ces conditiotu, iLc considéraient que les principes des nombres sont les éléments de tow les êtres et que IC Ciel entier est harmonie et nombres ‘. Ce principe, qui situe les mathématiques au m u r de la réalité, évoluera sous différentes formes jusqu’à Galilée, Newton, puis Maxwell, Einstein et Dirac, et enfin jusqu’aux physiciens contemporains créant les théories et les modèles d’unification. Que disons-nous aujourd’hui ? Les premiers éléments de toutes les choses se constituent en familles de particules, les leptotu (comme l’électron), les q u a r b (constituants du proton, du neutron) et certains champs de jauge (comme le champ électromagnétique) qui déterminent leurs interactions et obéissent à des structures abstraites : des symétries ; une violation spontanée de certaines de ces symétries engendre la masse des particules et les forces se produisent à travers les quanta
.
‘ 1981.
Plutarque, .cité dans Les Présocmtiques, p 14, Gallimard, Paris 1988. Aristote, La Métaphysique, A, 5, 985b, 25, Librairie Philosophique J. Vrin, Paris
De l’atomisme grec à la découverte de la radioactivité
3
des champs, gluons, gravitons, photons et bosons intermédiaires. Des quarks pro+ ennent les hadrons, parmi lesquels les baryons ; les baryons (comme le proton, le neutron) donnent lieu aux noyaux des atomes ; des leptons (électrons) et des noyaux forment les atomes des corps que nous percevons. Des leptons, quarks, bosons, noyaux et atomes résulte une multitude de structures physiques (dont une structure pensante), l’ensemble formant un cosdos, devenu intelligible grâce à l’étude de ses éléments premiers constitutifs. Autre conception antique qui préfigurait une approche moderne : paraliélement aux Milésiens et à leur recherche des principes unificateurs du monde, apparaît Héraclite qui, lui, pense cette unité du monde comme le résultat de la combinaison des contraires ; de plus il pense que l’un est formé de toutes les choses, et toutes les choses proviennent de l’un ’. Le feu est une substance primordiale, car il possède les propriétés de la matière, au moins la matière corporelle, mais il est p l u subtil. Héraclite h a i t que les êtres mortels sont immortels, les immortels sont mortels, l’un vit de la mort de l’autre et meurt de la vie de l’autre Les photons, nous le savons aujourd’hui, peuvent naître d’une annihilation de paires d’électron-positon, des paires de particuleantiparticule naissent de la mort d’un photon. L’opposition des contraires, l’harmonisation de tensions opposées, comme pour l’arc e f la lyre, telle est l’idée qui semble avoir longuement cheminé à travers de nombreux systèmes conceptuels, depuis la pensée d’Héraclite jusqu’au cœur de la science moderne : le principe fondamental de la conjugaison de charge en est un exemple.
‘.
1.2 L’atomisme Les philosophes grecs fondateurs de l’atomisme furent Leucippe (vers 440 av
J.-C.)et Démocrite (420 av J.-C.),influencés par le monisme de Parménide et de Zénon. Effectuant une sorte de synthèse des systèmes de Parménide et d’Empédocle, ils postulèrent que toutes les choses sont composées d’atomes en incessant mouvement datu le vide ; que les atomes sont indivisibles, qu’ils ont toujours été et qu’ils seront toujours animés de mouvement. Les atomistes admettaient le vide que refusera Aristote, ainsi que le déterminisme : rien n’arrive par haard. La constitution atomique rend compte des différences de densité des corps, les transformations qui se produisent dans le monde sont conséquence des changements dans le temps des distances entre les atomes. Ceux-ci sont invisibles, rigides et impénétrables. La doctrine de Démocrite et de Leucippe fut reprise par Epicure, et, ensuite, par Lucrèce au le’ siècle avant J.-C. Lucrèce écrivait dans son ouvrage De la Nature : Un est le savoir. II connait la pensée par qui sont ouvernées toutes chosw au moyen de toutes choses ”, Diogène de Laerce cité dans Les $résocmtiques, p 155, Gallimard, Paris 1988. Voyez le fragment : Immorteb morteb, mortels, immortelr ;vivant de ce=-là la mort, mourant de ceuz-l0 la uie ”. Ci. Les Prbocratipes, Héraclite, Fragmenta, p 160, Gallimard, Paris 1988. Garnier-Flammarion, Paris 1964.
‘ ’
Sources et évolution de la physique quantique
4
Les corps sont, d’une part les principes simples des choses, les atomes, et d’autre part, les composés formés par ces élémenfs premiers. Quant à ceuz-ci, aucune force n’est capable de les détruire ;à toute tentative dans ce sens, i L résistent avec solidité. Du reste, si l’on n’admettait pas dam la nature un terme ultime de petitesse, les corps les p l u pet& seraient formés d’une infinité de parties, puisque chaque moitié possédera toujours une moitié, et airui de suite jusqu’d l’infini. Quelle différence aurait4 entre l’Univers lui-même et les corps les plus petits ? Aucune différence ne pourrait être établie : aussi petit ou aussi grand que l’on suppose i’univers, les corps les plus petits seraient, euz aussi, composés d’une infinité de parties. La raison se révolte contre cette conséquence et n’admet pas que l’esprit l’accepte ;pour cela, il est nécessaire que tu t’avoues vaincu et que tu reconnaisses qu’il ezUte des particules irréductibles à toute division et qui atteignent le degré ultime de petitesse ; et comme elles ezistent, il te faut reconnaître aussi qu’elles sont solides et éternelles n, I1 est important de signaler que les atomistes n’adoptèrent pas l’idée de finalité, c’est-à-dire l’idée qu’un événement dans le futur détermine I’occurence d’un événement du présent. Leur conception mécaniste des phénomènes, non téléologique, annonçait ainsi une dynamique qui se prêtera à une formulation mathématique, condition sine qua non d’une description exacte du mouvement. Mais entretemps, cette approche sera supplantée par la physique d’Aristote, essentiellement qualitative mais intégrkà la philosophie de la nature la plus cohérente et complète qu’ait produite la pensée antique.
1.3 La dynamique Pour Aristote, les corps célestes et terrestres n’obéissent pas aux mémes lois. Le ciel se caractérise par la réguiarité et l’invariance des mouvements. Sur Terre, les corps se transforment et tendent vers leur fin naturelle. Du point de vue dynamique, la force motrice d’un objet terrestre est directement proportionnelle à sa masse et inversement proportionnelle à la résistance opposée à son mouvement. Un objet mobile est donc soumis à une force motrice permanente durant son mouvement. Qu’un corps terrestre se meuve par sa propre inertie - idéal dynamique ne correspondant à aucune situation réelle - était pour Aristote une impossibilité logique et physique. La pensée d’Aristote est systématisée durant les siècles qui suivent par les philosophes de la civilisation musulmane, notamment, au XI‘ siècle, par Avicenne. Médecin et philosophe perse, auteur de La Philosophie illuminative, il développe la pensée d’Aristote et est de ceux qui contribuent à préserver et à transmettre la culture grecque. Pour lui *, comme pour Aristote ’ Le temps est la m e s u n du mouvement ”. Dans le Randil, une encyclopédie de 51 volumes, connue cornme le Coran après le Coran, on trouve une liste des distances aux planètes (en fonction du rayon de la Terre) et des tailles de celles-ci ; il y est affirmé que l’espace ’ est ~-
~
~~
Cf. C.W. Misner K.S. Thorne,.J.A. Wheeler, Gravitation, p 753, W.H. Freeman and Co, San Francism 1973, d’où est tirée la citation.
De l‘atomisme grec à la découverte de la radioactivité
une forme abstraite de la matière et qui n’a d’ezistence que pour la conscience Cette conception anticipe de nombreux systèmes philosophiques à venir.
5
”.
’La physique aristotélicienne n’est remise en question dans ses principes fondamentaux qu’au VI“ siècle aprk J.-C. par Jean Philippon, puis au XN’ siècle par Jean Buridan et Nicolas Oresme, de l’fiole des Nominalistes de Paris, et par L&nard de Vinci et Jean-Baptiste Benedetti Leurs travaux, ainsi que de nombreuses autres contributions, ont rendu possible l’éclosion de la physique moderne symbolisée par les travaux de Galileo Gaiilei au XVII” siècle. Jean Buridan propose la première formulation du concept de la quantité de mouvement, à laquelle est associée une notion primitive d’inertie, tandis q u ’ O r m e met en évidence une première corrélation entre l’accélération uniforme et une série croissante d’unités de temps (équivalente au carré du temps). La rupture avec la physique d’Aristote est consommée lorsqu’au XVIP siècle Galilée énonce la première relation dynamique correcte permettant de définir la force comme fonction non de la vitesse - proportionnelle à la résistance au mouvement - mais d’un changement de vitessel’, c’est-à-dire d’une accélération - relative à l’inertie du mobile : LI Nous apportotu sur le sujet le plus ancien une science absolument nouvelle. Ii n’est peut-être rien datu la nature d’antérieur au mouvement, et les traités que lui ont consacré les philosophes ne sont petits ni par le nombre, ni par le volume ; pourtant, parmi ses propriétés, nombreuses et dignes d’être connues sont celles qui, à ma connaissance, n’ont encore été ni observées, n i démontrées. Certaines, plus apparentes, oni été remarquées, tel le fait que le mouvement naturel des graves, e n chute libre, est continuellement accéléré ; selon quelles proportions, toutefois, se produit cette accélération, o n ne l’a pas établi jusqu’ici ;nul, e n effet, que j e sache, n’a démontré que les espaces parcounu e n des temps égauz par u n mobile partant du repos ont entre e m même rapport que les nombres impairs successifs à partir de l’unité. On a démontré que les corps lancés, ou projectiles, décrivent une courbe d’un certain type ; mais que cette courbe soit une parabole personne n e l’a mis e n évidence. Ce sont ces faits, et d’auires non moins nombreuz et dignes d’être connus, qui vont être démontrés, e t aimi, ce que j’estime beaucoup plus important, ouvrir l’accès à une science aussi vaste qu’éminente, dont mes propres travauz marqueront le commencement et dont les esprits plus perspicaces que le mien ezploreront les parties les plus cachées ” ll.
’.
Le principe d’inertie se précise ensuite avec Descartes qui le définit comme rectiligne et universel. Les concepts fondamentaux de la future mécanique newtonienne étaient ainsi prêts à être intégrés au plus vaste édifice théorique qu’aura wnnu la physique jusqu’alors. Entretemps, la cosmologie aristotélicienne était, elle aussi, appelée à disparaitre. Cf. A. Koyré, Du monde clos à I’uniuers infini, Gallimard, Paris 1973. lo
Marie.Frsnçoise. Biarnais, in Postface, ZSOQC Newton, Ptincipia Mathematics, C. Bourgois Editeur, Paris, 1985. l1 Galilée, Ducours concernant deuz sciences nouvelles, Armand Colin, Paris 1970.
Sources et évolution de la physique quantique
6
1.4 La cosmologie La conception aristotélicienne qui prévalait au Moyen Age, celle d‘un Cosmos constitué d’un certain nombre de sphères concentriques, ordonnées de manière hiérarchique, fut remplacée par l’idée d’un Cosmos ouvert, d’un Univers infini. Selon Aristote, le ciel consiste en sphères concentriques, celle de la Lune étant celle de plus petit rayon, la Terre étant immobile au centre. Dans la sphère sub-lunaire, tout est soumis à, la désintégration et à la corrup tion. Les mouvements terrestres obéissent à des lois téléologiques, chaque corps tendant à occuper une position privilégiée. Les corps célestes, au contraire, se meuvent indéfiniment, de manière absolument régulière. Au-delà des sphères de Mercure, de Vénus, du Soleil, de Mars, de Jupiter et de Saturne se situe la sphère des étoiles fixes, le Primum Mobile. Au-delà du Primum Mobile, il n’y a pas de mouvement, ni de temps, ni de lieu. Dieu, le Moteur Primordial, l’immobilité propre, impulse la rotation au Primum Mobile, lequel transmet son mouvement aux autres sphères. Dans le nouveau système du monde qui prend une forme précise èr partir de Galilée, cette distinction entre mouvements célestes et terrestres disparaît. Les lo& physiques sont unherselies, elles s’appliquent partout, l’espace physique est identifié à l’espace i d n i de la géométrie euclidienne, dans lequel il est possible d’isoler par la pensée un corps du reste de l’univers, et de lui appliquer le principe d’inertie : le mouvement et le repos sont alors considérés comme des états équivalents, représentations du même concept, l’inertie. Ce sont les deux premières unifications en physique, celle des lois physiques et celle du repos et du mouvement, cette dernière formaliséepar le groupe de Galilée. En 1543, Copernic abolit le géocentrisme. Entre 1609 et 1619,Kepler, formulant les lois du mouvement des corps célestes, met fin définitivement à la hiérarchie des sphères du Cosmos aristotélicien. Enfin, en 1609,Galilée observant le ciel avec un télescope construit d’après une invention hollandaise, découvre de nouveaux objets célestes tels que les montagnes lunaires, les satellites de Jupiter, et les étoiles de son voisinage, objets qu’excluait le modèle aristotélicien, préétabli par Dieu. Ce qui lui valut un procès le 22 juin 1633 par le Saint-Office, l’Inquisition de 1’Eglise Catholique ”. Le principe d‘inertie, la loi de la chute libre des corps et la nouvelle mécanique céleste, ouvrent la voie à la grande synthèse de Newton. A l’instar de Pythagore et de Platon, Galilée déclare que le livre de la nature est écrit en langage mathématique. Par ailleurs, pendant la maturation de la science occidentale, d’autres cultures progressent. Au XVI“ siècle, les navigateurs européens découvrirent l’existence, en Amérique Centrale et en Amérique du Sud, du plateau central mexicain à la
&,
N o w disons nmonçoru, sentencions et déclamru que toi, Galilée, pour les muons déduites au procès tu os confessées ci-dessus, tu t’es nndu envers ce Saint-Ofice vChémentement a y l e c d’hérésie, ayant tenu cette fausse doctrine et contraire à I’Emtun Sainte et Diune uc le Soleil 80d le cmtn du monde et qu’il n e se meut p a de I’ORent à l’occident (. .).‘R.Jean-Pierre Maury, Galilée, le messager d u étoiles, p 136, Gallimard, Paris (1986).
;!p.
.
De l’atomisme grec à la découverte de la radioactivité
7
région des Andes en passant par l’île de Maraj6, des civilisations précolombiennes avancées. Fertiles à coup sûr e n événements dont n o w ignorons à peu près tout, ces siècles engloutk ont heureusement en témoignage des ( ~ u u r ed’art s qui portent la marque des civilisations successives dont elles sont issues ” l3 comme les Olmèques et les Toltèques, les civilisations de Teotihuacan, de Xochicalco, de Monte Alban et de Tula, les Mayas et les Aztèques au Mexique et en Amérique Centrale ; les Chibchas,les Mochiques, la culture Nazca, l’empire Wari et, aux environs du XVe siècle, l’empire inca en Amérique du Sud. On trouve aussi, entre le VIP et le XIVe siècles, la culture Marajoara dans le delta de l’Amazone I‘.
1.5 La synthèse newtonienne Le début de la science moderne recevra d’Isaac Newton, en 1666 et 1667,une impulsion extraordinaire. Beaucoup d’historiens en viendront à appeler ces deux années les années admirables l5 et les physiciens considèreront longtemps Newton comme le plus grand des physiciens théoriciens. En 1666 et 1667,Newton s’éloigna de Cambridge et rentra chez lui en raison de la peste. Pendant ces deux années, il put réfléchir et élaborer les fondements de ses découvertes. L’invention du calcul infinitésimal qu’il partagea (sans le reconnaître) avec Leibnitz, la découverte de l’existence de l’accélération dans le mouvement circulaire uniforme, la force centripète vue comme sa cause, l’importance donnée au principe d’inertie, le conduisirent à la formulation de l’équation fondamentale de la mécanique, base de la physique jusqu’à l’avènement de la mécanique quantique en 1925. L’égalité de la force à la variation de la quantité de mouvement par unité de temps rendait compte à la fois du mouvement des planètes et du mouvement des corps terrestres : celui d’une pomme qui quitte sa branche, d’un project.& qui avance, infléchit sa trajectoire et tombe, est décrit de manière identique à celui de la Lune autour de la Terre. Tous sont soumis à la force de la gravitation. Le fait que cette force exerce une action transmise instantanément à distance perturbait Newton, mais il se garda de formuler la moindre hypothèse sur la nature de cette force ( Hypothesis non fingo ”) : “ (Ainsi), la gravité qui s’ezerce sur le Soleil se compose des gravités qui s’ezercent sur chacune de ses particules et quand on s’éloigne du Soleil, elle décroît ezactement e n raison double des distances jusqu’à l’orbe de Saturne comme le repos des aphélies des planètes le montre manifestement et jusqu’à la dernière aphélie des comètes, si du moins ces aphélies sont en repos. Quant à la raison de ces propriétés de la gravité, j e n’ai pu encore la déduire des phénomènes et j e ne forge p l w d’hypothèses. E n effet, tout ce qui n’est pas déduit des phénomènes doit être appelé hypothèse et les hypothèses, qu’elles soient métaphysiques, physiques, se l3
J. Soustelle, Encyclopedia Universalis, Corpus 1, p 1133, Paris (1985). H. Andrillat, L’Uniuers s o w IC regard du temps, Masson, Paris (1993). L’auteur y décrit notamment les efforts des civilisations chaldéennes, chinoises et mayas pour établir des calendriers à des fins tant astronomiques qu’astrologiques. l5 P. Costabel, Encyclopedia Ilniversalis, Corpus 12, Paris (1985). I‘
Sources et évolution de la physique quantique
8
rapportant auz qualités occultes ou mécaniques, n’ont pas de place en philosophie expérimentale. En cette philosophie, les propositions sont déduites des phénomènes et rendues génémles par induction. C’est ainsi que l’impénétrabilité, la mobilité, a l’impetw des corps et les lou des mouvemenh et de la gmvité se sont fait wnnaitre. Et il s u f i t que la gravité ezi.stc réellement et agisse selon les lob que n o w a v o w ezposées, et soit sufisante pour ezpliquer tous les mouvements des corps célestes et de notre mer * Is.
En concluant son livre sur l’optique conceptions atomiques.
”,
Newton incorpora à son s y s t b e les
Tenant compte de toutes ces choses, il m e parut que Dieu, au commencement, forma la Matière de Particules solides, massives, dures, impénétrables, mobiles, d’une taille telle, de jgures telles, de Propriétés telles, de Proportion à IIEspace telle qu’elles conviennent le mieuz 8 la Fin pour laquelle Il les a formées ; il m e parait a w s i que ces Particules primitives étant Solides, elles sont incomparablement plus dures que n’importe quel corps poreuz composé d’elles, aucun Pouvoir ordinaire n’étant capable de diviser ce que Dieu, lui même, fit dans la Création première. Et plus loin : “
Il m e semble encore que ces Particules ont non seulement une Vis inertiae, accompagnée des lois passives du Mouvement qui résultent naturellement de cette Force, ma& qu’elles sont mues par certains Principes actifs, comme celui de la Gmuitation et celui qui produit la Fermeniation et la Cohésion des Corps. Ces principes, j e ne les considère pas comme des Qualités occu~tes,supposées résulter de Formes spécifiques des Choses, mais comme des Lois génémles de la Nature, grâce auzquelles les propres Choses sont formées. De leur cohésion, j ’ e w Pour Newton, les atomes sont des centres de force : tendance à inférer que leur3 particules s’attirent l’une l’autre grâce à une sorte de Force eztrémement intense lorsqu ’elles sont en contact immédiat, force responsable des propriétés chimiques mentionnées plus haut lorsqu’elles se trouvent à petites distances, force sans effet sensible dès qu’elles s’écartent quelque peu les unes des autres.
Le succés de la mécanique newtonienne, son développement par Huygens contemporain d e Newton, par Euler, Maupertuis, d’Alembert, Lagrange, Laplace, Hamilton, permirent d’esquiver la difficulté d’interprétation de la gravitation ; suivant Ernst Mach,l’attraction gravitationnelle perdit son caractère d’incompréhension eztmordinaire pour passer au stade d’incompréhension ordinaire. Les Philosophiae Naturalis Principio Mathematica, publiés en 1686-1687, conduiront, grâce à la philosophie de John Locke et aux lettres de Voltaire Is, entre autres, à consacrer la physique newtonienne comme base de la science moderne, comme fondement et dogme du système d u monde. l6
I. I.
Principfa Mathematica, p 117, C. Bourgois, Paris, 1985. Optique, C. Bourgois, Paris 1985. Voltaire, Lettres philosophiques, Larousse, Paris 1972. Newton,
Newton,
De l’atomisme grec à la découverte de la radioactivité
9
1.6 Les découvertes d u XIXe siècle Ce ne fut qu’au début du XIX” siecle, avec John Dalton, que l’hypothèse de la constitution atomique de la matière commença à s’imposer pour interpréter les réactions chimiques et leurs lois fondamentales, la loi de conservation de la masse, la loi des proportions définies, la loi des proportions multiples et la loi de Gay-Lussac. Les atomes se combinent chimiquement pour former les molécules et lea réactions chimiques sont décrites comme le résultat de l’échange d’atomes entre les molécules, au cours de leurs collisions. L’acceptation de ces idées fut contrariée par une tradition anti-atomiste, qui se. manifesta vers la fin du siècle par l’opposition de physiciens éminents comme Ernst Mach, Pierre Duhem et Max Planck dans sa jeunesse 19, ainsi que de physiciensContrairement à eux, Ludwig Boltzmann chimistes comme Wilheim Ostwald fut un défenseur infatigable des modèles atomiques qui lui permirent de contribuer, avec James Clerk Maxwell et Josiah Willard Gibbs, à la formulation de la théorie cinétique des gaz et de la mécanique statistique. On admit que les particules d’un gaz devaient obéir aux lois de la mécanique de Newton. Ces;lois étant réversibles, invariantes par rapport au renversement du temps, comme l e fit justement observer Ostwaid, il était nécessaire d’introduire des postulats qui justifient l’irréversibilité des processus décrits par la thermodynamique ; la solution du problème résidait dans Ie fait que le nombre de configurations atomiques, microscopiques, accessibles à un état macroscopique donné est si grand que devient hautement improbable, pratiquement irréalisable, l’évolution d’un système inversée dans le temps. La théorie permit de décrire des variables macroscopiques, comme la température, en fonction de paramètres atomiques, comme la valeur moyenne du carré des vitesses moléculaires. En outre Jean Perrin put mesurer le nombre de molécules rencontrées dans une molécule-gamme. A la fin du XIX‘ siècle, d’importantes découvertes ouvrirent de nouvelles voies à la physique du XX“ siècle. Lorsque Maxwell synthétisa en 1865 les lois
*’.
En 1883 Planck, influencé par son professeur, Hermann Kolbe un chimiste qui accusait la thdorie atomique de donner une fausse inter rétation des lois de la chimie écrivit : y En dépit des grands succès remportés ar la t h o n e atomique @qu’à résen4 il faudra en dernier rusort l’abandonner ou profit $e l’hypolhèae d’une matière confinue : Max Planck, PhysiWuche Abhandiungen und Vortrige 1, 163 (1882)cité par J.L. Heilbron, Planck 1858-1947, p 23, Belin, Paris (1988). ‘O Ainsi s’exprima W. Ostwald en 1895 : y La proposition aiivant laquelle t o w les phénomènes naturels cuvent être finalement réduits auz phénomènes mécaniques, ne peut même p w être aJmise comme une hypothèse de travai utale : elle est simplement une e m u r . Cette e m i r se montre plw clairement par IC fait suivant. Toutes les é aiions de la mécanique ont la propriété d’admettre le renversement de signe des p a n ti% temporelles. C’est-à-dire, des processus en théorie parfaitement mécaniques peuvent se développer également en avant ou en amère (dans le temps). Ainsi, dans un monde purement mécanique il ne poumit y avoir un avant et un après comme n o w avons tow dans notre monde : l’arbre poumat 4 nouveau devenir une pousse et une graine, le papillon pounuit redevenir une chenille, le vieil homme, un enfanf. Aucune explication n ut donnée or la doctRne mécanwte du fait que cela n’amve et elle ne peut la donner e n mwon d! la pro riété fondamentale d u tquatiow mécaniques. L’irrtvemibilité réelle d u phénomènes naLrela prouve ainai l’aistence de processus qui ne peuvent p w être décrits par lu tquatiow mécaniques. Et wee cela, k verdict du m a t é r i a l ~ esnentifique est ttabli. W. Ostwald, Verh. Ges. Deutsch. Naturf. Artzte, 1 155 (1895), Rev. Gm. Sci. 6,956 (1895).
10
Sources et évolution de la physique quantique
de l’électromagnétisme dans un système d’équations différentielles, il fut capable Le sude déduire de ces équations I’ezidence des ondes électromagnétiques. j e t ie pl- fwcinant lorsque ]’étais étudiant ce fut la théorie de Mazwell. c e qui fit apparaître cette théorie révolutionnaire f i t le passage des forces à dwîance auz champs comme variables fondamentales. L’incorporation de l’optique à la théorie de l’électromagnétisme (...) f i t comme une révélation écrivit Einstein ‘l. Vingt ans plus tard, en 1887, Heinrich Hertz produisit ces ondes et les identifia avec des ondes lumineuses, de fréquences différentes, mais susceptibles, comme celles-ci, d’être réfléchies par des corps métalliques et diélectriques, et de se propager à la vitesse de la lumière, qui fut mesurée dans le vide et trouvée approximativement égale à : c cx
3 x iû’Ocm/sec
En 1887, Heinrich Hertz découvrit l’efet photoélectrique ; en 1879, Wiliiam Crookes découvrait les rayotu cathodiques et W. Rœntgen en 1895 les rayotu X. En 1896, Henri Becquerel établit que les sels d’uranium, même sans avoir été exposés aux rayons du soleil, sont fluorescents et impressionnent des plaques photographiques. C’était la naissance de la radioactiuifé. Finalement, en 1897, Joseph John Thomson, se basant sur les expériences de différents physiciens et sur celles de sa propre équipe, montra que les rayons cathodiques sont constitués de particules possédant une charge électrique négative, baptisées par G. Stoney Clectroru en 1891. Ces rayons cathodiques n’étaient donc ni des manifestations de l’éther, ni des faisceaux moléculaires, mais des faisceaux de particules nouvelles. Les recherches se poursuivirent pour déterminer les propriétés de l’électron, sa masse et sa charge, dont les valeurs sont actuellement :
’’
m ( e ) = 9,1083 x
kg
(énergie au repos : mc2 = O, 5109760 MeV) q(e) = e = -4,80286 x lo-’’
= -1,602 x
lo-’’
u.e.s. C
où u.e.s. désigne l’unité électrostatique de charge et C représente le Coulomb c o m e unité de charge dans le système MKS. Le cadre d’une généralisation de la mécanique newtonienne, la théorie de la relativité, était désormais en place. Tandis que sera ensuite élaborée une mécanique fondamentalement nouvelle, à même de rendre compte des phénomènes expérimentaux irréductibles Q la dynamique classique : la mécanique quantique.
Autobiogm hical Notes in P.A. Schilpp, Albert Einstein Philosopha ’! A. Einstein, Saenfut, p 32, The library of fiving Philosophers, Evanston 1949. 22 H. Becquerel, Comptes Rendw de L’Académie des Sciences (C.R.) 123,420 (1896) [Article I page suivante 1.
Article I
Découverte de la radioactivité Sur les radiations émises par phosphorescence
HENRIBECQUEREL Comptes rendus de l'Académie des Sciences (Gauthier- Villars)
122,420-421 (1896)
Dans une précédente séance, M.Ch. Henry a annoncé que le sulfure de zinc phosphorescent interposé sur le trajet de rayons émanés d'un tube de Crookes augmentait l'intensité des radiations traversant i'aluminium. D'autre part, M. Niewenglowski a reconnu que le sulfure de calcium phosphorescent du commerce émet des radiations qui traversent les corps opaques. Ce f a i t s'étend à divers corps phosphorescents et, en particulier, aux sels d'urane dont la phosphorescence a une très courte durée. Avec le sulfate double d'uranium et de potassium, dont je possède des cristaux formant une croOte mince et transparente, j ' a i pu faire l'expérience suivante : On enveloppe une plaque photographique Lumière, au gélatino-bromure. avec deux feuilles de papier noir très épais, tel que la plaque ne se voile pas par une exposition au Soleil, durant une journée. On pose sur la feuille de papier. à l'extérieur. une plaque de la substance phosphorescente, e t l'on expose le tout au Soleil, pendant plusieurs heures. Lorsqu'on developpe ensuite la plaque photographique, on reconnait que la silhouette de la substance phosphorescente apparaît en noir sur le cliché. SI l'on interpose entre la substance phosphorescente e t le papier une pièce de monnale, ou un écran métallique percé d'un dessin a jour, on voit l'image de ces objets apparaitre sur le cllché. O n peut répéter les memes expériences en interposant entre la substance phosphorescente e t le papier une mince lame de verre, ce qui exclut la possibilité d'une action chimique due à des vapeurs qui pourraient émaner de la substance échauffée par les rayons solaires. O n doit donc conclure de ces expériences que la substance phosphorescente en question émet des radiations qui traversent le papier opaque à la lumière e t réduisent les sels d'argent.
12
Sources et évolution de la physique quantique
N e w t , Einstein. Planck, Von Laue auz enviroru de 1920. (Source :Internationes ed., Bad Godesberg, t o m droib rbemés).
Chapitre 2
De la relativité à la première quantification 2.1 La théorie de la relativité En 1905, Albert Einsteinz3 publia un articlez3“ dans les Annalen der Physik qui allait révolutionner et couronner la physique classique. En introduisant des concepts nouveaux pour l’espace et le temps, il formula les b a s s de la théorie qui décrit la physique des hautes énergies. Le problème de la propagation des ondes de lumière dans l’espace avait suggéré la notion d’éther au XIX‘ siècle, une substance qui remplirait l’espace et qui serait la responsable de cette propagation et des phénomènes de chaleur, d’électricité, de magnétisme. L’invariance de l’équation de Newton
? = -dp‘ dt
’
d?(t) dt
U=-
p = m -+ u,
+
quand on passe d’un système de référence d‘inertie, S (où par définition cette équation est valable) à un autre, S’, animé d’un mouvement rectiligne et uniforme, était connue depuis des années et le groupe de transformations qui assure ce passage est le groupe de Galilée : 5‘
=2 -ut,
y’= y ,
z’
= z,
t’ = t
(1)
relatif à une translation de S’par rapport à S parallèle à l’axe Oz avec une vitesse constante u. Des transformations de Galilée résulte la loi de composition des vitesses, suivant laquelle la vitesse de la lumière dépend de l’état de mouvement de sa source. Les transformations (1) consacrent encore la notion de temps absolu de Newton ; la simultanéité de deux événements serait valable pour tous les observateurs, indépendamment de leur état de mouvement. En 1S98, Henri Poincaré remet en question cette notion de simultanéité. Il écrit deux ans plus tard : O n sait d’oG n o w ment la croyance à l’éther : si la lumière n o w a m v e d’une étoile éloignée, pendant plusieurs années elle n’esf p l u sur l’étoile e f elle n’esf pas encore sur la 23
A. Einstein, @urns Choisies, Vol. 2
: Relativités nstninte et générale (édité par
F. Balibar, B. Jech et O . Darrigol), Seuil et CNRS, Paris (1989). z3“ A. Einstein, 891 (1905).
De l’électrodynamique des
corps e n
mouvement n, Ann. d. Phys. 17,
Sources et évolution de la physique quantique
14
T e r n , il faut bien qu’alors elle soit quelque part, e t soutenue, pour ainsi dire, par quelque support maiériei ”24. En 1887, Woldemar Voigt établit, pour la première fois, que l’équation des ondes :
n’est invariante pour une transformation des coordonnées que si le temp3 subit également une transformation. Il démontra ainsi que l’équation ci-dessus garde sa forme lorsque les nouvelles coordonnées x’, y‘, 2 , et un nouveau temps t‘, obéissent aux équations : 5)
avec
= z - ut,
y‘ = y/y,
2 = 217, t‘ = t
1
y=------(I-!gl)l/l,
P = v/c
- vx/c2
}
(3)
au lieu des transformations de Galilée (1). En 1906, dans les Rendiconti del Cire010 Matematico di Palermo, Poincaré établit les équations du groupe de transformations qui laissent invariantes les équations de Maxwell, groupe aujourd’hui connu sous le nom de groupe de Lorentz inhomogène ou groupe de Poincaré. Les équations de Voigt (3) sont équivalentes à ceiles du groupe de Lorentz homogène. Ces transformations ont également été établies indépendamment par Einstein et par Lorentz. Mais si Lorentz et Poincaré ont apporté des contributions importantes à la découverte de la théorie de la relativité, sa formulation précise, en tant que corpus théorique complet, ses postulats, l’analyse de la notion physique de temps, les transformations de Lorentz, la relativité de la simultanéité et de la notion de longueur, la contraction des longueurs - déduite du groupe de Lorentz et non pas admise comme un postulat à part (Poincaré) - la dilatation des durées, les transformations du champ électromagnétique, du courant et de la densité de charge, l’effet Doppler, l’ensemble de ces principes a été formulé d’une façon définitive par Einstein dans cet article de 1905. I1 établit que l’énergie a une inertie, et construisit la cinématique relativiste qui contient les célèbres formules de la masse, de l’énergie, de l’impulsion d’une particule en fonction de sa vitesse :
E=mc2,
m=ymo,
+ p =m?.
Pour la première fois, contrairement à ce qu’admettait la physique newtonienne, on introduit la vitesse de la lumière comme une constante universelle, indépendante de l’état de mouvement de sa source et comme la limite supérieure des vitesses de toutes les actions physiques possibles. La loi de composition des vitesses, déduite des formules de Lorentz, attribue toujours à la lumière la vitesse c, ce que confirme l’expérience. Et surtout, la notion d’éther, pleine de contradictions, fut écartée par 24
H. Poincaré, Lo science et i’hypothése, p 180, Flammarion, Paris (1968).
De la relativité a la première quantification
15
Einstein : l’expérience de Michelson et Morley, entreprise pour détecter la vitesse de la Terre par rapport à l’éther, montra que cette notion était superflue et que le champ électromagnétique ne requiert pas un support matériel, comme le voulaient Lorèntz et Poincaré. Les champs physiques ezistent dans le vide et se propagent d travers l’espace physique, ttatuportés, nous le sauotu aujourd’hui, par leurs quanta : les photons transportent le champ électromagnétique, les gravitons transportent le champ de gravitation, les gluons transportent le champ des forces fortes (tous à la vitesse de la lumière e), les bosons vectoriels W + ,W-,2’ transportent eux le champ des forces faibles (à une vitesse inférieure à c). Ce fut le mathématicien Hermann Minkowski” qui établit le formalisme de l’espace à quatre dimensions - l’espace-temps ou espace de Minkowski - pour formuler la théorie de la relativité : le temps devient la quatrième dimension de cet espace, et l’analyse tensorielle permet aux équations de la physique qui satisfont le principe de la relativité d’être écrites d’une façon explicitement covariante. Ce principe postule que les équations de la physique sont invariantes par rapport au groupe de Poincaré propre et orthochrone (c’est-à-dire que les transformations de réflexion spatiale et de renversement du temps sont exclues de ce groupe) : les lois physiques sont alors indépendantes de l’instant et du point où on les observe, et aussi de l’orientation spatiale et du mouvement rectiligne uniforme du laboratoire d’observation. Covariance veut dire validité de la loi dans tous les systèmes d‘inertie ; la covariance ou invariance relativiste explicite exige que les coordonnées d’espace et le temps figurent dans les équations sous la même forme : l’instant t auquel un phénomène arrive au point 3 = (z’,z’, z3)de l’espace à trois dimensions pour l’observateur d’un laboratoire S se mélange aux coordonnées z i , i = 1’2’3, pour donner et l’instant t‘ auquel un observateur d’un autre système d’inertie S‘ observe le même phénomène et le point transformé = (~“,z’’,z‘~) de S‘ de manière à ce que cet observateur trouve les mêmes lois dans ces variables que l’observateur de S dans ses coordonnées 1’2. Dans ce sens, on peut dire que l’espace se transforme dans le temps et vice-versa. Toute la physique classique fut reformulée dans le cadre de la théorie de la relativité restreinte et des conséquences spécifiques de cette théorie, par exemple, la dilatation des durées (vie moyenne des particules instables), l’équivalence masse-énergie, furent vérifiées expérimentalement. Des années furent néanmoins nécessaires pour que les mentalités des philosophes et de nombre de physiciens s’adaptent à ces nouvelles idées. Mais Einstein ne s’arrêta pas là. Après avoir unifié un si grand nombre de concepts physiques - temps et espace comme composantes du quadrivecteur d’espace-temps z ” , p = 0,1,2,3 ; énergie et impulsion, composantes du quadrivecteur p’, p = O, 1’2,s ; champ électrique et champ magnétique, composantes du tenseur antisymétrique, à six composantes FP”,p, v = O, 1’2’3 ; densité de charge et de
2”
“ ’Les. vues sur l’espace et le t e m p s y je voudrais v o w ezposer ont surgi du terreau de la physrque elpérimentale et là rest e leur force. Elles sont radicales. Dorénavant l’espace en soi-meme et le temps par lui-même, sont condamnés à se faner et à devenir de aim les ombres, et seule une sorte d’union des d e w préservera une realité indépendante. H. &inkowski in : A. Einstein, H.A Lorentz, H. Minkowski and H. Weyl, The principle of relativity, p 75, Dover, New York (1923).
16
Sources et évolution de lu physique quantique
courant, composantes du quadrivecteur j ’ , p = O, 1’2’3 - il voulut comprendre pourquoi la covariance n’existe que pour des mouvements rectilignes et uniformes des systèmes de référence. Quand un laboraloire est en mouvement non uniforme, une rotation par exemple, il n’est plus un système d’inertie ; dans l’équation de Newton apparaissent ce que l’on appelait les forces fictives, la force centrifuge et la force de Coriolis. Entre 1905 et 1915, ses recherches l’amenèrent B la découverte du principe d’équivalence (’ la répezion la p l w heureuse de ma vie ”) : il est impossible, au moyen d’observatiom physiques, de distinguer un système d’inertie où régne un champ de gramtation uniforme avec une accélération de la gravité constante g dirigée vers le bas, d’un système non inertiel, sans champ de gramtation, mais doué d’un mouvement uniformément accéléré avec une accélération dirigée vers le haut et égaie à g, en grandeur. En tombant en chute libre, un observateur élimine le champ de gravitation. Comme tous les corps tombent égaiement avec lui, il n’a aucun moyen de contredire sa certitude d’être au repos avec l’ensemble de ces corps : il ne sent pas son propre poids ”. De la même façon que, en passant d’un laboratoire en rotation à un autre au repos, l’observateur élimine la force centrifuge et celle de Coriolis, la gravité peut être éliminée dans un ascenseur en chute libre. Par cette découverte, Einstein donnait une signification plus profonde l’égalité entre la masse gravifique et la masse inertielle découverte par Galilée et établie expérimentalement par Eotvk. Les forces fictives sont donc des forces réelles, des champs de gravitation particuliers. A partir de ces réflexions, Einstein fut conduit à chercher des équations qui généralisent l‘équation de Poisson pour le champ newtonien, dans un espace de Riemann. Le postulat fondamental de sa théorie fut finalement l’identification du tenseur de la métrique de l’espace de Riemann avec le potentiel du champ de gravitation. Les équations du champ furent définitivement établies en 1915 : les propriétés géométriques de l’espace de Riemann décrites par les solutions de ces équations sont les propriétés physiques du champ de gravitation correspondant. Telle fut la fameuse géométrisation de la physique qu’il réalisa pour la gravitation et qui resta pour lui l’idéal de la théorie physique fondée sur ces principes premiers. L’article qu’il publia cette année-là constitue l’une des plus belles contributions théoriques concernant le monde physique qui aient été formulées à ce jour.
2.2 Planck et la quantification de l’énergie ;
Einstein et les photons En 1900, Max Planck s’interrogeait sur le rayonnement enclos dans une cavité vide de matière et en équilibre thermique, et étudiait plus précisémentz6 la distribution de son énergie en ses composants monochromatiques. En 1897, Kirchhoff établit un théorème selon lequel la densité d’énergie du rayonnement u ne dépend que de la fréquence v et de la température T, u = u(v,T ) . Une tentative pour déduire une formule pour u(v,T) basée sur la physique 26
M. Planck, Ann.
d. Phys. 4, 561 (1901) [Article II, page 201.
De la relatiuité à la première quanhpcation
17
classique fut menée par les physiciens anglais Lord Rayleigh et Sir James Jeans mais le résultat se trouva en désaccord avec l’expérience. Les constantes physiques disponibles, c, la vitesse de la lumière et k, la constante de Boltzmann, donnaient une loi de la forme u = ( A / c 3 )vZkT : ce fut d’ailleurs l’argument de Lorentz pour appuyer la loi de Rayleigh-Jeans. Une autre expression fut proposée par Wien : u exp(-av/T). Le problème était le suivant : les mesures très précises de u ( v , T )n’étaient d’accord avec la loi de Rayleigh-Jeans que pour les basses fréquences, alors qu’elles ne suivaient la loi de Wien que pour les hautes fréquences. Ce fut le mérite de Planck de trouver une interpolation entre l’expression de Rayleigh-Jeans et celle de Wien. Ii réussit en 1900 en publiant ce que l’on appelle aujourd’hui la loi du rayonnement de Planck :
-
rigoureusement vérifiée par les mesures. Pour justifier cette formule, Planck fut obligé d’abandonner l’hypothèse de la physique classique suivant laquelle l’énergie e d’un oscillateur et de tout système physique n’est susceptible que de changements continus. I1 supposa au contraire que cette énergie ne change que par des multiples entiers d’une énergie minimale, c’est-&dire que e est plutôt de la forme : e = nhv
où n est un nombre entier et l’énergie minimale d’un oscillateur électromagnétique de fréquence v est égale à hv, h étant une nouvelle constante universelle. h s’appelle le quantum d’action et hv, le quantum d’énergie. Cette constante, une nouveauté à l’époque, a les dimensions d’une énergie multipliée par un temps, d’une action. Néanmoins, Planck n’acceptait pas la révolution conceptuelle que la notion de variation d’énergie par multiples entiers de hv a entraînée en physique : il fut malgré lui le découvreur de la théorie quantique. Les quanta de lumière absorbés ou émis par l’atome d’après Bohr furent introduits en théorie de la lumière par Einstein en 1905”. L’hypothèse des corpuscules de lumière déjà introduite par Newton ne pouvait décrire aucun phénomène spécifique autre que la propagation de la lumière et fut rejetée dès le succès de la théorie ondulatoire, postulée pour expliquer les interférences et la diffraction. Les quanta de lumière furent proposés par Einstein pour comprendre les lois de l’effet photoélectrique que la théorie ondulatoire elle-même était incapable d’expliquer. Contrairement aux ondes lumineuses qui transportent une énergie dont la densité décroît comme le carré de l’inverse du rayon R de l’onde, en l / R z , les quanta de lumière transportent de l’énergie lumineuse concentrée en portions égales à hv, v étant la fréquence de lumière en question. C’est cette notion que Bohr utilisa dans son modèle atomique, l’énergie du photon é m i s ou absorbé par l’atome étant égale à la différence des énergies de l’électron dans son orbite finale, E f , et initiale, Ei : 27
A. Einstein, Ann. d. Phys. 17,132 (1905) [Article III, page 281.
Sources et évolution de la physique quantique
18
hv = A E = Ef - E; Douze ans plus tard, en 1917, Einstein affirma qu’un quantum de lumière possède en plus de son énergie une quantité de mouvement égale à hk/27r, où I. = 27rv/c, c étant la vitesse de la lumière. Ceci complète, pour le photon, le caractère d’une particule (il possède également un spin, ou moment angulaire propre). La période comprise entre 1913 et 1924 se caractérise par les efforts des physiciens pour perfectionner le modèle de Bohr. Arnold Sommerfeld prit en compte la relativité dans le modèle de Bohr et introduisit des orbites elliptiques pour l’électron dans l’atome. Nieis Bohr à Copenhague mena les débats sur la nécessité de nouvelles idées dans ce domaine et formula le principe de correspondunce comme un guide pour la nouvelle théorie atomique - le modèle de Bohr admettait une mystérieuse superposition de théories contraires, la théorie classique et les postulats de quantification. La nouvelle théorie qui restait à trouver devait tendre vers la théorie classique dans la limite des nombres quantiques élevés.
2.3 Les modèles atomiques, de Thomson à Bohr La découverte de l’électron annoncée par Thomson en 1897 impliquait que le dogme de l’indivisibilité de l’atome était erroné car il était évident que les électrons observés devaient provenir des atomes. C’est au physicien hollandais H. A. Lorentz qu’il revint de développer la théorie classique de l’électron. H. Nagaoka suggéra déjà en 1904 que l’atome devait être constitué d’électrons tournant en cercle autour d’un noyau central. Comme ceux-ci, d’après la théorie classique, devraient émettre continuellement de l’énergie et finir par tomber dans le noyau, Thomson proposa que l’atome fût plutôt une sphère chargée positivement à l’intérieur de laquelle vibreraient les électrons (modèle du pain aux raisins ”) ; mais les expériences de Ernest Rutherford sur la diffusion de particules alpha par la matière, effectuées en vue de déterminer la distribution des charges positives dans l’atome, rétablirent les idées de Nagaoka, perfectionnées dans le modèle indépendamment proposé par Rutherford. Alors que le rayon de l’atome est de l’ordre de lO-’cm, Rutherford trouva” que le rayon de la distribution de charges positives de l’atome est dix milie fois plus petit : elles sont donc concentrées dans ce qu’on appelle le noyau afomique. Rutherford trouva ce résultat en distinguant, parmi les diffusions élastiques de particules a et p sur des atomes lourds, celles qui avaient lieu à grand angle. Ce sont les diffusions où la particule incidente, lancée directement vers le centre de l’atome, revient en arrière aprés s’être arrêtée à la distance b du noyau, b étant la distance à laquelie la répulsion coulombienne entre les charges Z1 du projectile et 2, du noyau l’emporte SUI l’énergie cinétique El du projectile :
28
E. Rutherford, Phil. Mag. 21,669 (1911) [Article IV, page 411.
De la relativité à la première quantification
19
Avec des énergies incidentes de l’ordre de quelques MeV, Rutherford put mettre en évidence des dimensions du noyau de l’ordre de lo-’’ cm. Cette même technique (Rutherford Backward Scattering) est encore employée de no8 jours pour analyser les surfaces de matériaux en les bombardant de faisceaux d’ions de quelques MeV : elle permet ainsi de déterminer la nature et la concentration des atomes lourds de la couche analysée. Elle a aussi permis, lorsque les projectiles furent accélérés à des énergies de plusieurs centaines de MeV - comme dans les expériences de diffusion e - p de Hotstadter à Stanford (1958) - la mise en évidence des dimensions du proton. Elle permit encore - lorsque l’énergie des faisceaux atteinrent des dizaines de GeV, comme dans les diffusions de e - p de 7 à 17 GeV au SLAC de Stanford, puis dans les diffusions profondément inélutiques de neutrinos et de muons au CERN2”, et dans les diffusions pp à grand moment perpendiculaire effectuées aux ISR au CERN (1970-1985)28’- la mise en évidence, à des dimensions de l’ordre de cm,de la structure en quarh des protons et des neutrons. Aux énergies de 2000 GeV disponibles au FermiLab, près de Chicago, cette même technique permettra de sonder la matière à des dimensions de l’ordre de 5 x 10-18cm,nous laissant peut-être apercevoir des sous-stnictures communes aux quarks et aux leptons. Deux années plus tard, en 1913, Niels Bohr fit un pas très important dans la compréhension du modèle atomique, en admettant qu’aux lois classiques de la mécanique et de l’électrodynamique devraient se superposer deuz nouueauz posfulab, l’un utilisant l’idée de quantification de I’énergie proposée par Planck en 1900 lors de l’étude du rayonnement du corps noir, l’autre, l’idée d’Einstein, de 1905, suivant laquelle la lumière se propage concentrée en des corpuscules dont l’énergie est proportionnelle à sa fréquence, les photons ou quanta de lumière. En contradiction avec la théorie classique, Bohr postula que ies éiecfmru ne décrivent que certaitu orbites définies par un nombre entier ” (quantification du moment angulaire), et, lorsqu’ils les décrivent, ils n’émettent ni n’absorbent aucune énergie. Cette émission (ou absorpîion) n’a lieu que lorsque l’éiecîron parse brusquement d’une orbite sfationnaire d une autre (sans parcowir les positions intermédiaires), et alors, la fréquence du rayonnement émis (ou absorbé) est donnée par la différence des énergies de l’électron sur les deux orbites, divisée par une constante, la constante de Planck h ou quantum d’action. Bohr fut alors capable de reproduire théoriquement les spectres de l’atome d’hydrogène et put calculer une constante empirique, la constante de Rydberg, en fonction de h, c, m, q ( e ) : un succès éclatant pour ses idées. Ces états stationnaires, et leurs séquences discontinues, furent mis en évidence dans les célèbres expériences de James Ran& et Gustav Hertz en 1914.
28a Voir R. Cahn et G. Goldhaber, The Ezpaimental Foundations of Parîicle Physics, Cambrjdge University Press (1989). W.M. Geist et al, Physics Reports 197 263-374 (1990).
”‘
Article II
La quantification de l'interaction rayonnement-matière A propos de la loi de distribution de l'énergie dans le spectre normal
MAX PLANCK Annalen der Physik 4,553-563
(1901)
(Springer-Verlag)
(remis le 7 janvier 1901) [traduit par Ci. Frick] Communiqué sous une forme différente aux sessions du 19 octobre e t du 14 décembre 1900 de la Société Allemande de Physique, Comptes rendus 2. p 202 et p 237 (1900)
Introduction
'
Les récentes mesures spectrales de O. Lummer et E. Pringsheim et celles, encore plus remarquables, de H. Rubens et F. Kurlbaum confirmant toutes un resultat précédemment établi paf H. Beckmann montrent que, ni la loi d'abord établie par W. Wien à partir de considérations de cinétique moléculaire, ni celle établie ensuite par moi-même a partir de la théorie du rayonnement électromagnétique - qui toutes deux concernent la distribution d'énergie dans le spectre normal - n'avaient de validité universelle. Dans chacun des cas, la théorie nécessite une amélioration : j e tenterai dans ce qui suit d'en proposer une en me fondant sur la théorie du rayonnement électromagnétique que J'ai moi-même établie. II sera alors nécessaire de repérer, dans la suite des ralsonnements qui conduisent à la loi de distribution d'énergie de Wlen, l'argument à modifier ; cet argument devra alors être abandonné e t remplacé de manière appropriée. J'ai montré, dans mon dernier exposé sur ce sujet ', que les bases physiques de la théorie du rayonnement électromagnétique, y compris l'hypothèse du I' rayonnement naturel " (du corps noir, NdT), résistent aux critiques les plus dures. Comme à ma
'
'
O. Lummer et E. Pringsheim, Verhandlungen der Deutsch. Physikal. Geselfsch. 2. p 163 (1900). H. Rubens et F. Kuribaum, Sitzungber. d. k. Akad. d. Wisensch. (Comptes rendus des sessions de l'Académie Royale des Sciences) de Berlin, session du 25 octobre 1900, p 929.
'
H. Beckmann, Thèse, Tübingen 1898. Voir aussi H. Rubens, Wied. Ann. 69, p 582 (1899).
'
M. Planck, Ann. d. Phys. 1 p 719 (1900).
De la relativité a la première quanh5cation
21
connaissance les calculs ne présentent pas d’erreur, il demeure que la loi de dlstrlbutlon d’énergie du spectre normal est entièrement déterminée lorsqu’on peut calculer l’entropie d’un résonateur rayonnant, oscillant de manière monochromatique, en fonction de son énergie d’oscillation O n obtient alors à partir de la relation dS/dU = I/@ la dépendance de l’énergie en fonction de la température 0 ; comme d’autre part une et la denslté du rayonnement à la fréquence d’oscillation relation simple a lie l’énergie correspondante, il en est de meme de la dépendance de la densité du rayonnement en fonctlon de la température. La distribution en énergie normale est alors celle pour laquelle les différentes densités de rayonnement correspondant aux différentes fréquences d’osclllatlon possèdent la même température. Ainsi tout le problème se ramène à trouver en fonction de et i’esentlel de la recherche qui suit est consacré à la solution de cette question. Dans ma première étude sur ce sujet. j’avais, sans autre justification, posé par définition comme étant une expression simple de et m’étais ensuite contenté de prouver que cette forme de l’entropie satisfait toutes les exigences de la thermodynamique. Je pensais alors qu’elle était la seule de sa sorte, et donc que la loi de Wien, qui suivait aussi cette forme, possédait nécessairement une validité universelle. Un examen ultérieur plus approfondi m’a montré qu’il doit y avoir d’autres expressions satisfaisant cette exigence, e t qu’une condition supplémentaire est nécessaire pour calculer sans ambiguné. Je croyais avoir trouvé cette condition en affirmant ce qui, à cette époque, m’apparaissait plausible et évident la chose suivante : lors de petites et constantes perturbations irréversibles, un système composé de N résonateurs identiques placés dans un même champ stationnaire de rayonnement, se trouvant quasiment en équilibre thermique verra augmenter son entropie totale SN = N S en fonction de sa seule énergie totale UN = NU et de ses modifications, sans qu’intervienne l’énergie des rbonateurs individuels. Cette amrmation conduit nécessairement à la loi de distribution d’energie de Wien. Comme celle-ci n’est pas vérifiée par l’expérience, on est amené à conclure que cette loi ne peut etre correcte dans son intégralité, et que la théorie doit s’en écarter IIfaut donc introduire une autre condition pour permettre le calcul de et pour cela, il faut analyser plus profondément la signhication de la notion d’entropie. Une indication sur la marche à suivre nous est donnée en regardant i’inconsistance des suppositions antérieures. Dans ce qui suit, on explore une voie conduisant à une expression simple de l’entropie et par conséquent à une nouvelle formule pour le rayonnement, laquelle ne semble en contradiction avec aucun des faits expérimentaux observés à ce jour. ’
s
u. u
u
u,
s
s
u,
s
-
-
u
’.
1.
s.
Calcul de l’entropie d’un résonateur en fonction d e son énergie
$1. L’entropie conditionne le désordre, et ce désordre intervient en théorie du rayonnement électromagnétique dans les oscillations monochromatiques d’un résonateur - même lorsqu’il se trouve dans un champ de rayonnement durablement stationnaire - à Voir ci-dessous l’équation (8). I?
M. Planck,
O.C.
pp 730 e t sq.
’ On comparera a cela les critiques déjà soulevées par cette affirmation : voir W. Wien au Congrès de 2. p et O. Lommer 2. p 92, (Rapport
Paris
40. 1900)
(id.
1900).
Sources et éuolution de la physique quantique
22
travers l'irrégularité des variations continuelles d'amplitude et de phase, lorsqu'on s'lnt4resw à des intervalles de temps grands par rapport à la durée d'une oscillation, mais petits par rapport au temps d'une mesure. SI amplltude et phase étalent absolument constants, les oscillations deviendraient parfaitement homogènes, l'entropie ne pourrait exister et l'énergie d'oscillation devrait pouvoir se transformer librement et complètement en travail. L'énergie constante d'un résonateur individuel oscillant de manière stationnaire doit alors etre considérée comme une valeur moyenne dans le temps, ou, ce qui revient tout à fait au même, comme la valeur moyenne des énergies d'un grand nombre N d'oscillateurs identiques, se trouvant dans le même champ stationnaire de rayonnement, suffisamment éloignés les uns des autres pour ne pas s'influencer mutuellement. Alors à l'énergie totale
u
UN = N U d'un tel système formé de
N
résonateurs correspond une certaine entropie totale
s
du meme système, où représente l'entropie moyenne d'un résonateur partlculier. Cette entropie SN représente le désordre avec lequel l'énergie totale U N se répartit entre les différents résonateurs 52. Ecrivons maintenant que l'entropie SN du système est, à une constante arbltralre additive près, proportionnelle au logarithme de l a probabilité que les N résonateurs aient tous ensemble i'énergle totale U N ,donc :
w
SN = k log W + const.
(3)
Au fond, cette relatlon revient, me semble-t-il. à une définition de la probabilité
w,car, dans les hypothèses sur lesquelles se fonde la théorie du rayonnement électro-
magnétique, aucune indication ne nous permet de donner à à cette probabilité un sens ou un autre. II convient d'utiliser cette définition pour sa simplicité, et aussl pour la parenté avec sa définltion dans la théorie cinétique des gaz 53. II importe malntenant de trouver la probabilité que N résonateurs possèdent ensemble l'énergie totale UN.Pour cela 11 est nécessaire que UN ne soit pas une quantité continue, Infiniment divisible, mais plutot une grandeur discrète, composée d'un nombre entier de parties finalement égales. Appelons une telle partie l'élément d'énergie e, partant nous avons :
'.
U N = P.€
w
(4)
où P représente un nombre entier, grand en général ; nous Ialsserons pour l'instant la valeur de c indéterminée. II est évident maintenant que la distribution des P éléments d'énergie entre les N résonateurs ne peut se faire que d'un nombre fini e t déterminé de façons. Nous appelerons chacune de ces répartitions une " complexion ", suivant le terme utilise par Boltzmann pour une notion semblable. Si l'on désigne les resonateurs par les nombres 1,2,3.. N ,
.
'
L. Boltmann,Sitzungbef. d. k. Akad. d. Wissensch. zu Wien (Comptes rendus des sessions de l'Académie impériale des Sciences de Vienne), (Il) 70. p 428 (1877).
De la relativité à la première quanh3cation
23
et si on les écrit les uns à la suite des autres ; si en dessous de chaque résonateur on inscrit le nombre d'éléments d'énergie qui lui sont attribués lors d'une répartition arbitraire, on obtient pour chaque complexion un symbole de la forme sulvante :
1 2 3 4 5 6 7 8 9 1 0 7 3 8 1 1 0 9 2 2 0 4 4 5 que N = 10,P = 100. Le nombre % de toutes
Ici on a supposé les complexions possibles est visiblement 6gal au nombre de toutes les configurations de chiffres possibles que l'on peut obtenir de cette manière pour ia rangée inférieure, lorsque N et P sont fix&. Pour être précis, notons que deux complexions sont à considérer comme distinctes si présentant la même configuration de chiffres, ceux-ci sont rangés dans un ordre différent. L'analyse combinatoire nous dit que le nombre de complexions possibles est :
N.(N
IR=
+ 1).(N+ 2 ) . . . ( N+ P - 1) -- (N + P -
l)! (N - l)!P!
1 . 2 . 3 ... P
D'après la formule de Stirling on a, en première approximation :
N!=N N , et Dar suite, avec cette approxima'tion :
31=
+
(N P)NtP NN.PP *
$4. L'hypothèse sur laquelle nous voulons fonder les calcuis à venir s'énonce comme suit : la probabilité pour que les N résonateurs possèdent ensemble l'énergie d'oscillation UN est proportionnelle au nombre [R de toutes les complexions posslbles lors de la répartition de l'énergie UN ; en d'autres termes, une complexion donnée quelconque est aussl probable que n'importe quelle autre. En dernier lieu, seule l'expérience peut vérifier si cette hypothèse est vraiment réalisée dans la nature. Si, de fait, l'expérience tranche en sa faveur, la validité de cette hypothèse devrait entraîner de nouvelles conclusions au sujet de la nature spécifique des oscillations des résonateurs. notamment sur le caractère " indifférencié des cellules de l'espace des phases de grandeur au départ comparable '* qui apparaissent ici. pour reprendre les termes de J. v. Kries Poursuivre dans cette voie la réflexion parait cependant prématuré dans l'état actuel de la question. $5. Après l'introduction de cette hypothèse, e t compte tenu de l'équation (J), l'entropie du système de résonateurs envisagé s'écrit, en choisissant judicieusement la constante additlve :
w
'.
{ SN
:~~+P)log(N+P)-NlogN-PlogP)
(5)
et, en tenant compte de (4) e t de (1) :
U
Ainsi, tenant compte de ( 2 ) , l'entropie s'écrit :
s=k
{ (1+);
s d'un résonateur en fonction de son énergie
log (1
+
t)
- ;log
:}.
Joh. v. Kries, Die Prlncipien der Wahrschleinlichkeitsrechnung (Les principes du
cakul des probabilités), p 36, Freiburg (1886).
Sources et évolution de la physique quantique
24
2. Introduction de la loi de déplacement de Wien 56. Immédiatement après la loi de Kirchoff établissant ia proportionnalité entre le pouvoir d'émission e t le pouvoir d'absorption, la loi de déplacement trouvée par W. W e n - et portant depuis son nom représente la contribution la plus importante à l'établissement des solides fondements de la théorie du rayonnement de la chaleur : eile inclut comme cas particulier la loi de Stefan-Boltzmann sur la dépendance de la quantité totale de rayonnement émis en fonction de la température. D'après la formulation de M. Thiesen lo elle s'énonce :
-
E.dX = 65$(X6).dX, A est la longueur d'ondes, EdX est la densité spatiale d'énergie émise dans la tranche A, X + dX, par le rayonnement '' noir " l1 correspondant, 8 la température, et $(I) une
où
certaine fonction du seul argument I. $7. II nous fait maintenant examiner ce que dit la loi de déplacement de Wien sur de notre résonateur en fonction de son énergie e t de la dépendance de l'entropie sa période propre, et ceci dans le cas général où le résonateur se trouve dans un milieu diathermique ordinaire. A cet evet, nous généraiiserons d'abord la forme donnée par Thiesen a la loi du rayonnement dans un milieu diathermique arbitraire à l'aide de la vitesse de propagation de la lumière c. Comme nous observons non le rayonnement dans son ensemble, mais seulement un rayonnement monochromatique, il sera nécessaire, en vue de comparer les différents milieux diathermiques, de substituer la longueur d'onde A par le nombre d'onde Y . Désignons par udv la densité spatiale d'énergie du rayonnement correspondant aux fréquences Y , Y dv : udv remplace EdX, c / u rem.piace X e t c d v / v 2 remplace dX. II vient alors :
u
s
+
);(
u = e5.C.lj Y=
Or, l a loi bien connue de Kirchoff-Clausius nous dit que l'énergie émise par unité de temps par une surface noire dans un milieu diathermique est, pour une température 19 et un nombre d'onde Y donnés, inversement proportlonnelle au carré c2 de la vitesse de propagation de la lumiere : la densité spatiale d'énergie est donc inversement proportionnelle à c3 e t nous obtenons :
u = - f (e55 ) , YZC3
où les constantes de la fonction f sont indépendantes de c. Au lieu de ceci nous pouvons écrire, si f désigne constamment dans ce qui va suivre
une nouvelle fonction d'un seul argument :
u = -f Y3
(!).
c3 lo
(7)
M. Thiesen, Verhandl. d. Deutsch. Phys. Geseiisch. 2. p 66 (1900).
O n pourrait parier de manière peut-être plus adaptée d'un rayonnement " blanc ",en généralisant convenablement ce que l'on entend habituellement par lumière parfaitement blanche.
De la relativité à la première quantification
25
où nous retrouvons le résultat bien connu que l'énergie rayonnante contenue dans le cube d'une longueur d'ondes à température e t à nombre d'onde donnés : UA3 est la meme pour tous les milieux diathermiques. $8. Pour passer maintenant de la densité spatlale de rayonnement II à l'énergie U d'un résonateur stationnaire synchrone avec le champ de rayonnement où II se trouve, sur les dote du nombre d'onde u, nous utiliserons la formule (34) de mon exposé processus rayonnants irréversibles :
''
(% est l'intensité d'un rayonnement monochromatique, polarisé linéairement) ; ce qui, jolnt à l'équation bien connue :
u = - 8rR C
donne la relation :
8x2
u = -u. i
où c n'apparait plus explicitement. Au lieu de cela nous pouvons aussi écrlre :
s du résonateur en posant :
$9. Introduisons finalement l'entropie
dS
1
e=E'
(9)
II en ressort que :
dU
u
et en intégrant :
S=f
(F),
c'est-&-dire que l'entropie d'un résonateur oscillant dans un milieu diathermique ne dépend que de la seule variable u / u , e t ne contient en plus que des constantes universelles. C'est à ma connaissance la forme la plus simple de la loi de déplacement de Wien. $10. Si nous appliquons la loi de déplacement de Wien sous sa dernière forme à l'expression (6) de l'entropie nous nous rendons compte que l'élément d'énergie c doit etre proportionnel au nombre d'osclllations u, et que donc :
s.
e = h.u l2
M. Planck, Ann. d. Phys. 1, p 99 (1900).
Sources et évolution de la physique quantique
26
Ainsi :
s=k où
{ (1+ E) log
(1
+
E) -
+g$}.
h e t k sont des constantes universelles. En substituant dans (9) on obtient :
hu
U=-
e#-1 et, à partir de
(e), on obtlent la loi de ditribution d'énergie recherchée :
Ou encore, si l'on substitue au nombre d'onde u la longueur d'onde relation indiquée au 97, on a :
-
8nch
à l'aide de la
1
Quant aux expressions pour l'intensité et pour l'entropie d'un rayonnement se propageant dans un milieu diathermique, et à la loi d'augmentation de l'entropie totale lors de processus de rayonnement non stationnaires, l e les développeral dans un autre article.
3.
Valeurs numériques
des deux constantes naturelles h et k peuvent se déterminer de mesures disponibles. F. Kurlbaum l3 a trouvé que, si l'on désigne par l'énergie totale rayonnée dans i'air Par 1 cmz d'un corps noir port4 a la température tdeg C pendant 1sec, on obtient : .
311. Les valeurs
façon assez précise à l'aide des
si
De là on obtlent la densité spatiale de i'énkrgie totale du rayonnement dans l'air 2 la température absolue 1 :
4 x 7,31.106 = 7,061.10-'5 3 x 10" x (373' 273') ~m~degré' *
-
D'autre part, selon (12), la densité spatiale de l'énergie totale rayonnée est, pour
e=i:
u=L
00
8xh
/-
u d u =8nh -l
=9
l3
9
u3
(e-+
u3du e+-i
+e-29
0
F. Kuribaurn. Wied. Ann. 65, p 759 (1898).
+e-'*
+ ...>du
De la relativité a la première quant$cation
27
et, par intégrations successives :
8xh u = -.6
e3
48sk' =- eJh3 .
si l'on
pose ceci
(1+ 2;+ 3 + 3 + ...
k (j-)
1
1
1
~,am.
= 7,061.10-'5, on obtient,
avec c = 3.10'' :
k4 = 1,1682.10'5. h3 $12. O.
Lummer et
E. Pringsheim
I'
ont déterminé que le produit
A@ ,,
où A,
est la longueur d'onde du maximum de la dlstributlon en E dans l'air à la température 8 , vaut 2940 p.degré. Ou encore, en unités absolues :
ûX ,
= O, 2M cm.degré.
D'autre part, il ressort de (13). lorsqu'on égale à zéro la dérivée de où X = A,, que :
E
par rapport à
A,
( l - * )5kX,B .e&=l et cette équation transcendante donne :
ch
Arne = 4,9651.k'
II s'en suit que :
h 4,9651 .0,294 -= = 4,866.10-". k 3.10'O
De là et de (14) on trouve les valeurs des constantes naturelles :
h = 6, 55.10-2'erg.sec,
(15)
k = 1,346.10-'6- mg degré' ce sont les memes valeurs que celles Indiquées dans ma communication antérieure.
O. Lumrner et
P 176 (1900).
E. Pringsheim,
VerhJndl. der Deutschen Physikal. Geselixh. 2,
Article III
Le photon Un point de vue heuristique concernant la production et la transformation de la lumière
ALBERTEINSTEIN Annalen der Physik,
XWI, 132-148 (1905)
(Springer-Verlag)
(reçu le 18 mars 1905) [Albert Einstein. Oeuvres choisies I- Le Seuil, Paris (19SS)J [traduit sous la direction de F. Balibar]
II existe une profonde différence formelle entre les représentations théoriques que
se sont forgées les physiciens à propos des gaz et des autres corps pondérables, et la théorie de Maxwell des processus éiedromagnétiques dans ce qu’il est convenu d‘appeler l’espace vide. En effet, alors que nous considérons que l’état d’un corps est parfaitement déterminé par les positions et vitesses d’un nombre d‘atomes et d’électrons, très grand certes, mais néanmoins fini, nous nous servons, pour la détermination de l’état électromagnétique d’une région de l‘espace, de fonctions d’espace continues, si bien que nous ne pouvons pas considérer qu’un nombre fini de grandeurs sumse à fixer complëtement i’ëtat ëlectromagnétique de l’espace. Selon la théorie de Maxwell, l’énergie doit etre conçue, pour tous les phénomènes purement électromagnétiques, et donc également pour la lumière, comme une fonction continue de l‘espace, alors que l’énergie d’un corps pondérable doit, selon la conception actuelle des physiciens, être décrite comme une somme portant sur les atomes et les électrons. L’énergie d’un corps pondérable ne peut pas &tre divisée en parties aussi nombreuses et aussi petites que l’on veut,’alors que l’énergie d’une radiation lumineuse émise par une source de lumière ponctuelle est, selon la théorie de Maxwell de la lumière (ou, selon toute théorie ondulatoire), distribuée de façon continue sur un volume sans cesse croissant. La théorie ondulatoire de la lumière opérant avec des fonctions d’espace continues s’est avérée parfaite pour ce qui est de la description des phénomènes purement optiques et I1 se peut qu’elle ne soit jamais remplacée par une autre théorie. II ne faut cependant pas perdre de vue que les observations optiques portent sur des valeurs moyennes dans le temps, et pas sur des valeurs instantanées ; 11 n’est pas inconcevable, bien que les théories de la diffraction, de la réflexion, de la réfraction, de la dispersion, etc., soient entigrement confirmées par l’expérience, que la théorie de la lumière qui opère sur des fonctions continues de l’espace puisse conduire à des contradictions avec l’expérience lorsqu’elle est appliquée aux phénomènes de production et de transformation de la lumière.
De la relativité a la première quantification
29
De fait, il me semble que les observations portant sur le '' rayonnement noir ' I , l a photoluminescence, la production de rayons cathodiques par ia lumière ultraviolette, e t d'autres classes de phénomènes concernant la production ou la transformation de la lumière, apparaissent comme plus compréhensibles si l'on admet que l'énergie de la lumière est distribuée de façon discontinue dans l'espace. Selon i'hypothbe envisagée ici. lors de la propagatlon d'un rayon lumineux émis par une source ponctuelle, l'énergie n'est pas distribuée de façon contlnue sur des espaces de plus en plus grands, mals est constituée d'un nombre fini de quanta d'énergie localis& en des points de l'espace, chacun se dépiacant sans se diviser e t ne pouvant €tre absorbé ou produit que tout d'un bloc. Dans ce qui suit, Je vais présenter le cours des idées e t relater les faits qui m'ont conduit au point de vue ici exposé, dans l'espoir que d'autres chercheurs pourront en tirer profit.
1.
U n e d i E c u l t é concernant l a
théorie du
"
rayonnement noir '*
Plaçons-nous d'abord dans le cadre de la théorie de Maxwell et de l a théorie des électrons, e t considérons le cas suivant. Supposons que, dans un espace clos, aux parois parfaitement réfléchissantes, se trouvent un certain nombre de molécules de gaz e t d'électrons libres de se déplacer e t exerçant entre eux, lorsqu'ils s'approchent les uns des autres, des forces de type conservatif ; autrement dit, ils peuvent entrer en collision les uns avec les autres, tout comme les molécules d'un gaz en théorie cinétique des gaz l . Soit en outre un certain nombre d'électrons liés à des points de cet espace très éloignés les uns des autres par des forces dirigées vers ces points e t proportionnelles à l'élongation. ces électrons sont susceptibles d'interagir de façon conservative avec les molécules e t les électrons libres lorsque ces derniers s'en approchent sunisamment. Nous appelons r-nateurs " ces électrons qui sont liés à des points de l'espace ; ils émettent e t absorbent des ondes électromagnétiques de période bien déterminée. Selon la manière actuelle de concevoir l'origine de la lumière, le rayonnement dans l'espace considéré, obtenu en appliquant la théorie de Maxwell dans le cas de l'équilibre dynamique, doit étre identique au " rayonnement noir " du moins si l'on considère qu'il y a des r b n a t e u r s correspondant à toutes les frdquences considérées. Faisons abstraction, provisoirement. du rayonnement émis e t absorbé par les résonateurs e t demandons-nous quelle est i a condition d'équilibre dynamique correspondant aux interactions (aux calllsions) des mol,&ules et des électrons. La théorie cinétique des gaz donne comme condition d'équlllbre que la force vive moyenne d'un électron r h n a t e u r soit égale à l'énergie cinétique moyenne de translation d'une molécule de gaz. Decomposons le mouvement d'un électron en trois mouvements oscillants. le long de trois directions perpendicuialres ; la valeur moyenne E de l'énergie de chacun de ces 'I
-
-
Cette hypothèse est équivalente a celle selon laquelle, a l'équilibre thermique, les énergies cinétiques moyennes des molécules du gaz e t des électrons sont égales. O n sait que,frace à cette hypothèse, M. Drude a pu déduire théoriquement le rafport la conductlvité électrique d'un métal.(P. Drude. Zur de la con uctivité thermique Elektronentheorie der Metalle , Anndm der Physik. vol. 111. 1900, p 566-613)
Sources et évolution de la physique quantique
30
mouvements d'oscillation rectiligne est :
où R designe la constante universelle des gat. N le nombre des '* molécules réelles '' dans un 6qulvaient-gramme et T la temperature absolue. L'énergie Ë est en effet égaie, compte tenu de I'égallté des valeurs moyennes dans le temps des énergies cinétique e t potentlelle d'un résonateur, aux deux tiers de la force vive d'une molécule libre de gaz monoatomique. Si, pour une raison ou une autre (en I'occurence, du fait des processus de rayonnement). Il se faisait que l'énergie d'un résonateur prenne une valeur moyenne dans le temps plus grande, ou Plus petite, que Ë, les collisions avec les électrons e t les molécules libres aboutiraient à ce que le gaz gagne, ou cède, une énergie non nulle en valeur moyenne. L'équilibre dynamique n'est donc possible, dans le cas qui nous intéresse, que si chaque résonateur a une énergie moyenne égale à È. Appliquons des considérations analogues à l'interaction entre les résonateurs e t le rayonnement qul se trouve dans l'espace. M. Planck' a, dans ce cas, déduit la condition d'équilibre dynamique, en faisant l'hypothèse3 que le rayonnement pouvait être considéré comme un processus aussi désordonné que possible. II a trouvé :
-E, = L3 8rvz
E,
"*
est Id l'énergie moyenne d'un résonateur de fréquence propre Y (pour chacune des composantes du mouvement oscillant), L l a vitesse de l a lumière, v l a fréquence e t pvd, I'énergle par unité de volume de la fraction du rayonnement dont l a fréquence est comprise entre v et Y dv.
+
M. Planck, Ann. d,
Phys., vol. 1. 1900, p 99.
Cette hypothêse peut etre formuSe de la façon suivante. Développons en serie de Fourier la composante de la force électrique (Z), en un point quelconque de l'espace considér6, entre les Instants t = 0 e t t = T (où T est un intervalle de temps très grand par rapport â toutes les périodes considérées) :
(au meme point de l'espace) autant de fois que l'on veut, en choislssant les instants lnltlaux au hasard ; on obtient divers systemes de valeurs pour les grandeurs A , et a". II existe alors, pour la fréquence de chaque combinaison diRérente de valeurs des grandeurs A, et P. une probabillté (statlstlque) W de l a forme :
.
W = f(Ai, A r . . a i , a l . . .)dAl dAr
...d a , , d a a ...
Le rayonnement est aussl désordonné que posslble si :
f ( A ,As ...al,ax ...) = &!Ai) Fa(Ar) ... f i ( a i ).fZ(aZ)...,
c'est-à-dlre sl la probabillte pour qu une des grandeurs ( A ou a ) prenne une valeur déterminée est indépendante des valeurs prises par les autres grandeurs A ou a. Plus on se rapproche des conditions ob les couples Individuels de grandeurs (Ap, a") dépendent des processus d'hlsslon et d'absorptlon de groupes bien particuliers de reonatcurs, plus on a le droit, dans le cas envisagé, de considérer que le rayonnement est aussi désordonné que possible
.
De la relativité a la première quantification
Si l'on exige que l'énergie du rayonnement de fréquence croisse ni ne décroisse systématiquement, il faut que :
Y
31
dans son ensemble ne
R =L3 -T E =E, = N 8nv2 pu R 8*vz T. N L3
pu=--
Cette relation, obtenue comme condition de l'équilibre dynamlque, n'est pas conforme
a l'expérience ; mals elle Indique également que, dans notre modèle. Il est hors de questlon qu'il y ait partage de l'énergie entre l'éther et la matière. En effet, plus on étend le domaine des fréquences allouées aux résonateurs, plus l'énergie du rayonnement emplissant l'espace augmente à la limite et on obtient :
-y T l m v 2 d u =m.
pudu=
2. A
propos de la détermination par Planck des quanta élémentaires
Dans ce qui suit, nous allons montrer que la détermination des quanta élémentaires donnée par M. Planck est,Jusqu'à un certain point, Indépendante da sa theorle du " rayonnement noir La formule de Planck4 vérifiëe Jusqu'à présent par toutes les expériences, donne pour
".
Pu :
a2
pu OU (I
=e@+-1'
= 6,lO
*
lo-''
j3 = 4,866 lo-". A la limite des valeurs de T / v , c'est-à-dire pour de grandes longueurs d'onde et de fortes densités de rayonnement, cette formule devient :
On constate que cette formule est conforme à celle obtenue au paragraphe 1a partir de la théorie de Maxwell et de la théorie des électrons. Par identification des coefklents de ces deux formules, IIvient :
8%- a -R- = N L3 ,8'
soit :
j3 8nR a L3
N = - -= 6,17-1023. M. Planck. Ann. d. Phys.. vol. IV. 1901, p 561.
Sources et évolution de la physique quantique
32
Limitons-nous à l'étude de la manière dont cette entropie dépend du volume occupé par le rayonnement et notons l'entropie du rayonnement lorsque son volume est 80 ; nous
so
obtenons :
E s-so=-lg
Bu
[ssol.
Cette équation montre que l'entropie d'un rayonnement monochromatique, de densité sufflsamment faible, varie en fonction du volume selon la même loi que l'entropie d'un gaz parfait ou d'une solution diluée. Nous allons dans ce qui suit interpréter l'équation ci-dessus en nous fondant sur le principe introduit dans la physique par M. Boltzmann, principe selon lequel l'entropie d'un système est une fonction de la probabilité de son état.
5.
Etude, dans le cadre d e l a théorie moléculaire. de d e l'entropie d'un gaz o u d'une solution diluée
la
dépendance e n volume
Dans le calcul de l'entropie par les méthodes de la théorie moléculaire, on emploie couramment le m o t " probabilité " dans un sens qui ne recouvre pas la définition de ce mot telle qu'elle est donnée en calcul des probabilités. En particulier, on définit souvent de façon hypothétique des " occurences d'égale probabilité ", dans des cas où les modèles théoriques utilisés sont sumsamment précis pour qu'à la place de cette définition hypothétique on ait une déduction. Je montrerai ailleurs que, dans les considérations relatives aux processus thermiques, on peut très bien se satisfaire de ce qu'il est convenu d'appeler les " probabilités statistiques J'espère ainsi éliminer une difficulté logique qui fait encore obstacle à la mise en œuvre du principe de Boltzmann. Mals ici, il ne sera donné qu'une formulation générale de ce principe qui ne sera appliqué qu'a des cas très particuliers. si parier de la probabilite d'un etat d'un systeme a un sens et si, en outre, toute augmentation d'entropie peut être conçue comme une transition vers un état de plus grande probabilité. l'entropie si d'un Système est une fonction de la probabilité de t'état indantané du système. S i donc on a affaire à deux systèmes et sa sans interaction, on peut poser
".
si
s1 =vi (Wl) s2
= y2 (W2)
.
SI l'on considère ces deux systèmes comme un seul et même système d'entropie probabilité on a : s = s1+s2 = '2 ( W )
w,
et
w1
s et de
w = w, .w,,
Cette dernière relation exprime le fait que les états des deux systèmes sont des événements indépendants les uns des autres. D e ces équations, IIdécoule que :
De la relativité à la première quantification
D'OÙ
finalement :
33
~ ( w i=)C ig(W1) + cte.
+ cte. + cte.
cpi(W2)= C lg(Wz)
p(W) = C ig(W)
c
La grandeur est donc une constante universelle ; elle vaut, d'apres la théorie cinétlque des gaz, R/N, les constantes R e t N ayant Ici la meme signification que plus haut. SI désigne l'entropie d'un système pour un certain état initial e t si est la probabilité on a donc de façon générale : relative d'un é t a t d'entropie
so
w
s,
R s - so = lg w N
.
Occupons-nous d'abord du cas particulier suivant. Soit dans un volume 80 un nombre (n) de points mobiles (des molécules par exemple), sur lesquels nous allons raisonner. II peut y avoir dans l'espace, outre ceux-ci, d'autres points mobiles, en nombre quelconque e t de n'importe quelle espke. Quant à la loi régissant le déplacement des points considérés dans l'espace, elle n'est l'objet d'aucune hypothèse SI ce n'est que pour ce mouvement, aucune région de l'espace, non plus qu'aucune direction, n'est privilégiée par rapport aux autres. On suppose, en outre, que les points mobiles considérés (les premiers nommés) sont suffisamment peu nombreux pour qu'on puisse négliger l'action qu'ils auraient les uns sur les autres. Le système consldéré (qui peut être par exemple un gaz parfait ou une solutlon diluée) a une certaine entropie. SO.Imaginons une portion du volume 80 de grandeur 8 , e t que tous les n points mobiles soient transportés dans le volume 8 , sans que rien par ailleurs ne soit modifié dans le systëme. A cet état correspond évidemment une autre valeur (S)de l'entropie ; nous nous proposons de déterminer cette dirérence d'entropie grâce au principe de Boltzmann. posons-nous alors la questlon : quelle est la probabilité de l'état imaginé en dernier par rapport a celle de l'état inltial ? Ou encore : quelle est l a probabilité pour que, en un instant choisi au hasard, les n points mobiles indépendants contenus dans le volume go se trouvent (par hasard) tous dans le volume 9 ? pour cette probabilité, qul est une " probabilité statistique ", on obtient évidemment la valeur :
w =[ f ] " .
D'où l'on déduit, par application du principe de Boltzmann. que
S-So=R[E]
lg
[i]
II faut remarquer que cette equation, d'où l'on peut, par un raisonnement thermodyna-
mique simple. déduire la lo1 de Boyle-Gay-Lussac',
'
51 E est l'énergie du systbme,
-d(E et donc : pd = R ~ T .
e t son homologue pour la pression
on a
dûT - T S ) = pd9 = T d S = R-Nn V
34
Sources et évolution de la physique quantique
1/1v
Autrement dit, un atome d'hydrogène pèse gramme, soit 1,62 lo-'' gramme. C'est exactement la valeur trouvée par M. Planck, laquelle coincide elle-même assez blen avec les valeurs de cette grandeur obtenues par d'autres voies. Nous arrivons donc à la conclusion suivante : les fondements théoriques dont nous sommes partis sont d'autant plus appropriés que la densité d'énergie et la longueur d'onde du rayonnement sont plus grandes : ils sont complètement inopérants pour de petites longueurs d'onde e t de faibles densités d'énergie. Dans la suite, ie '' rayonnement noir " sera considéré sous le rapport expérimental e t sans prendre pour base tel ou t e l modèle de la production et de la propagation du rayonnement.
3. Sur l'entropie du rayonnement Les considérations suivantes se trouvent déjà dans un travail célèbre de M. W e n e t Je ne les reproduis ici que par souci de complétude. Soit un rayonnement occupant un volume 8. Nous supposons que les propriétb observables de ce rayonnement sont parfaitement déterminées par la donnée, pour toutes les fréquences, de la densité spectrale de rayonnement ~ ( v ) Puisque ~ . l'on considère que des rayonnements de fréquences différentes peuvent être &parés les uns des autres sans travail et sans apport de chaleur, l'entropie du rayonnement peut être écrlte sous la forme :
où p désigne une fonction des varlables p e t v. On peut réduire cp à une fonction d'une seule variable en écrivant que, lors d'une compression adiabatlque à l'intérieur de parois réfléchissantes, l'entropie d'un rayonnernent reste inchangée. Nous ne le ferons cependant pas ; nous allons plutôt examiner comment la fonction cp peut être obtenue à partir de la loi du rayonnernent du corps noir. Dans le cas du " rayonnement noir ", p est une fonction de Y telle que l'entropie, énergie donnée, soit maximale, c'est-à-dire telle que :
lorsque :
6 L W pdv = o . D'où il s'ensult que pour tout choix de 6p, fonction de v :
IIs'agit d'une supposition gratuite. Naturellement, cette supposltion, la plus simple qui soit, sera maintenue tant que I'experience n'oblige pas à y renoncer.
De la relativité à la première quantification
35
où est independant de u. Dans le cas du rayonnement noir, & / o p est donc Independant de u. Pour tout accroissement dT de l a t e m p a t u r e d'un rayonnement noir occupant le volume 9 = 1, on a :
I, "=Oo
ds= soit encore, puisque
&lap
09
- dpdu, ap
ne dépend pad de
u:
a'p dS = dE.
OP
Comme dE est égal à l a chaleur fournie e t que le processus est réversible, on a égaiement :
1
dS = - dE.
T
Par comparaison, on obtient :
-aQ= - 1 op
T
qui est l'expression de ia loi du rayonnement noir. On peut donc déduire la loi du rayonnement noir de la fonction 'p et, à l'inverse, déterminer à partir de cette loi la fonction 'p par intégration, compte tenu du fait que cp s'annule pour p = O.
4. Loi l i m i t e p o u r l'entropie du rayonnement monochromatique d e faible densité Certes, il r e s o r t des observations effectueeS jusqu'à preent sur le " rayonnement noir '' que la loi du " rayonnement noir " propode initialement par M. Wien :
n'est pas tout à fait exacte. Elle est cependant parfaitement confirmée par I'expérlence pour les grandes valeurs de u/T. NOUS allons fonder notre calcul sur cette formule, gardant toutefois à l'esprit que nos résultats ne vaudront que dans certaines limites. De cette formule, il résulte d'abord que :
1 = --1 1g T Bu
P 2
7
puis, en utilisant la relation trouv& au paragraphe précédent, que :
Soit maintenant un rayonnernent d'énergie
u
E, de fréquence comprise entre
+ du. Ce rayonnement occupe un volume 9. Son entropie est :
Y
et
36
Sources et évolution de la physique quantique
osmotique, a été obtenue sans qu'il soit nécessaire de faire la moindre hypothèse 5ur l a loi qui gouverne le mouvement des molécules.
6. interprétation, selon le principe de Boltzmann, de l'expression donnant la dépendance en volume de l'entropie d'un rayonnement monochromatique Au paragraphe 4, nous avons trouvé l'expression suivante pour la dépendance en volume de l'entropie d'un rayonnement monochromatique :
S - S o = B -E ;'g
[;I.
Ecrivons cette formule sous la forme :
e t comparons-la à la formule générale qui exprime le principe de Boltzmann :
R s- so = IgW N Nous aboutissons à la conclusion suivante : SI un rayonnement monochromatique de fréquence u et d'énergie E est enfermé (grâce à des parois rméchissantes) dans un volume 00, l a probabilité pour qu'à un instant quelconque, toute l'énergie du rayonnement se trouve dans une portion 8 du volume fio est :
D'oD nous tirons cette autre conclusion : Un rayonnement monochromatique de faible densité (dans les limites du domaine de validité de la loi du rayonnement de Wien) se comporte, par rapport à l a théorie de la chaleur, comme s'il était constitué de quanta d'énergie, indépendants les uns des autres, de grandeur RBu/N. De plus, comparons, pour une même température, la grandeur moyenne des quanta d'énergie du " rayonnement noir " et la force vive moyenne du mouvement du centre de gravité d'une molécule. Cette force vive moyenne est (3/2) ( R / N ) T ; quant à l a grandeur moyenne du quantum d'énergie, elle vaut, sur la base de la formule de Wien :
O& lors qu'un rayonnement monochromatique (de densité suffisamment faible) se comporte, relativement à l a dépendance en volume de son entropie, comme un milieu discontinu constitué de quanta d'énergie de grandeur RBu/N, on est conduit à se demander si les lois de la production e t de la transformation de la lumière n'ont pas également la même structure que si la lumière était constituée de quanta d'énergie de ce type. Telle est la question dont nous allons maintenant nous occuper.
De la relativité à la première quantification
37
7. A propos de Ir règle de Stokes On considère une lumière monochromatique transformée par photoluminescence en lumière d'une autre fréquence, e t on suppose que, conformément au résultat précédent, la lumière qui produit e t celle qul est produite sont constituées de quanta d'énergie de grandeur ( R / N ) @ , où Y deigne l'une ou l'autre des deux fréquences. Le processus de transformation dolt être alors interprété de la facon suivante. Chaque quantum producteur, de fréquence u ~ est . absorbé et donne naissance à lui tout seul à un quantum de lumière de fréquence y à condition toutefois que la densité de quanta producteurs wit sufFisamment faible. Eventuellement, lors de l'absorption du quantum de lumière producteur, peuvent apparaïtre, en même temps, des quanta de lumière de fréquence us, v4, etc., ou bien toute autre forme d'énergie (telle que la chaleur, par exemple). Peu importent les processus intermédiaires par lesquels ce résultat final est obtenu. si l a substance photoluminexente n'a pas à être considérée comme une source permanente d'énergie. l'énergie d'un quantum d'énergie produit ne peut pas. en vertu du principe de conservation de l'énergie, être supérieure à l'énergie du quantum de lumière producteur ; on dolt avoir
-
soit
Y
I.vi
I
qui n'est autre que la règle bien connue de Stokes. Un point mérite d'etre souligné : selon notre manière de voir les choses, dans le cas d'un faible éclairement, la quantité de lumière produite doit, toutes choses égales par ailleurs, etre proportionnelle à l'intensité de lumière excitatrice, puisque chaque quantum d'énergie excitateur est à l'origine d'un processus élémentaire du genre décrit plus haut, et ceci indépendamment de l'met des autres quanta d'énergie excitateurs. En particulier, il n'y a pas pour I'lntendté de la lumière excltatrice de limite inférieure en dessous de laquelle la lumière serait incapable d'avoir une action excitatrice. L a conception ici exposée des phénomènes laisse à penser qu'il peut y avoir des écarts 21 la règle de Stokes dans les cas suivants : 1) quand le nombre par unité de volume des quanta d'énergie simultanément transform& est suffisamment grand pour qu'un quantum de la lumière produite puisse tenir son énergie de plusieurs quanta d'énergie producteurs : 2) quand la lumlère productrice (ou'produite) n'a pas la structure énergétique de la partie du " rayonnement nolr " qui correspond au domaine de validité de la loi de W e n ; par exemple. quand la lumière excitatrice est' produite par un corps dont la température est si élevée que la loi de W e n n'est plus valable aux longueurs d'onde considérées. Cette dernière possibilité mérite qu'on s'y intéresse tout particulièrement. En effet, selon la conception développée ici. II n'est pas exclu qu'un rayonnement " de type nonW e n *, mCmc très dilué, se comporte, du point de vue énergétique, différemment d'un '' rayonnement noir pris dans le domaine de validité de la loi de Wien.
Sources et évolution de la physique quantique
38
8.
P r o d u c t i o n d e rayons cathodiques par éclairement d'un corps solide
L a conception usuelle, selon laquelle l'énergie de la lumière est distribuée de façon continue dans l'espace où elle est rayonnée, présente, quand on tente d'expliquer les phénomenes photoélediques, de t r b serieuses difficultés qui sont exposées dans un travail déclslf de M. Lenard'. La conceptlon selon laquelle l a lumière excitatrice est constituée de quanta d'énergle (R/N)@vpermet de concevoir l a production de rayons cathodiques par la lumière de l a facon suivante. Des quanta d'énergle pénètrent dans la couche superficlelle du corps ; leur énergie est transform&, au moins en partie, en énergie cinétique des électrons. L a représentation la plus simple que l'on puisse s'en falre est celle d'un quantum de lumière cedant son énergie à un seul électron ; nous ailons supposer que c'est bien ce qui se passe. II n'est pas exclu cependant que d e s électrons ne prennent qu'une partie de l'énergie des quanta de lumière. Un électron, auquel de l'énergie cinétique a €té fournie à l'intérieur du corps, atteint la surface en ayant perdu une partie de son énergie clnétique. Nous allons supposer, de plus, que tout électron doit, pour pouvoir quitter un corps, fournir un certain travail P (caractéristique du corps). Les électrons qui quittent le corps avec la vitesse normale la plus élevée sont ceux qui se trouvent immédiatement à la surface et qui ont été excités normalement à celle-cl. L'énergie cinétique de ces électrons est :
R Npv- P. Si le corps est porté au potentiel positif E.s'il est entouré de conducteurs à un potentiel est tout juste capable d'empêcher le corps de perdre de l'électricité, on a : nul, et si
R
II€ = N p v - P , où E designe la charge électrlque de l'électron. Soit encore :
IIE=RBv-P', où E désigne la charge d'un équivalent-gramme d'ions monovalents e t P ' le potentiel, par rapport au corps, de cette quantité d'électricité négative'. Posons E = 9,6.103; E.10-' est alors le potentiel en volts du corps Illuminé dans le vide. Afin de voir d'abord si la relation ainsi déduite donne un ordre de grandeur conforme â l'expérience, posons P ' = O, v = 1,03.10's ce qul correspond à la limite ultraviolette du spectre solaire) e t = 4,866.10-". Nous obtenons n.10' = 4,3voits * ; reJultat conforme, en ordre de grandeur, à ceux de M. Lenard
B
'I
'.
P. Lenard, Ann. d. Phys., vol. V111, 1902, p 169 et 170.
SI l'on suppose que l'électron doive etre arraché par la lumière à une m o k u l e neutre, e t qu'il faille pour cela dépenser un certain travail, il n'est pas nécessaire de modifier en quoi que ce soit la relation ici déduite ; il suffit de considérer que i" est la somme de deux termes. Lire
D.lO-' = 4,3 volts, e t non D.10'. en optant pour le syame MKSA au lieu du
CGS (NIT).
'
P. Lenard, Ann. d. Phys., vol. VIII, 1902,p
165 e t 184, tableau I, fig. 2.
De la relativité à la première quan@cation
39
n
Si la formule obtenue est exacte, en fonction de la fréquence de la lumière excitatrice doit être, en coordonnées cartésiennes, une droite dont la pente ne dépend pas de la substance étudiée. Autant que je puisse en juger, notre conceptlon n'est pas en contradiction avec les propriétés de l'effet photoélectrique telles qu'elles ont été observées par M. Lenard. Si chaque quantum d'énergie de la lumière excitatrice cède son énergie à un électron Indépendamment de tous les autres, la distrlbutlon des vitesses des électrons, c'est-& dire la qualité du rayonnement cathodlque produit, est indépendante de l'intensité de la lumière excltatrlce ; en revanche, le nombre des électrons qui qulttent le corps dolt, lui, Stre, toutes choses égale d'allleurs, proportionnel à I'lntenslté de la lumière excitatrice Io. II convlendrait de faire ici, à propos des limites de validité présumées des lois mentionnées, des remarques analogues à celles qui ont été faites à propos des écarts présumés à la règle de Stokes. Dans ce qui précède, on a supposé que l'énergie, du moins celle d'une partie des quanta d'énergie de la lumière productrice, n'était jamais cédée qu'à un seul électron. Si l'on ne fait pas cette hypothèse, la plus simple à concevoir, on obtient à la place de l'équation précédente :
rIE
+ P' 5 RPY.
Pour la luminescence cathodique qui constitue le processus inverse d u précédent, on obtient, par des considérations analogues à celles développées plus haut :
Dans ie cas des substances étudiées par M. Lenard, f'E ** est toujours considérablement plus grand que RPv, puisque la tension que doivent avoir traversée les rayons cathodiques pour pouvoir tout juste produire de la lumière visible attelnt, selon les cas, des centaines ou des mllllers de volts II faut donc supposer que l'énergie cinétique d'un électron est employée à produlre de nombreux quanta d'énergie lumineuse.
9. Ionisation des g a z par l a lumière ultraviolette Nous allons supposer que. lors de l'ionisation d'un gaz par de la lumière ultraviolette, tout quantum d'énergie lumineuse absorbe est effectivement employé à l'Ionisation d'une seule molécule de gaz. O n en conclut d'abord que le travail d'ionisation (c'est-à-dlre ie travail théoriquement nbcessaire à l'ionisation) ne peut être plus grand que l'énergie d'un quantum d'énergie lumineuse absorbé et efficace. Si nous notons par J le travail (théorique) d'ionisation par équivalent-gramme, nous devons avoir :
Io
P. Lenard, /bid., p 150 et 166-168.
** ii faut lire IIE (NdT).
P. Lenard, Ann. d. Phys., vol. XII, 1903, p 469.
Sources et évolution de la physique quantique
40
Mais d'après les mesures de Lenard, la Plus grande longueur d'onde efficace est, dans le cas de l'air, de l'ordre de 1,9.10-' cm : on a donc :
RBv = 6,4.1Ol2ergs2 J. On obtient aussi une limite supérieure au travail d'ionisation à partir des tensions d'ionisation des gaz raréfie. D'après J. Stark", l a plus faible tension mesurée dans le cas de l'air (au niveau d'anodes de platine) est d'environ 10 Ce qui donne donc comme limite Supérieure de J : 9.6.1012,du meme ordre de grandeur que celle trouvée cl-dessus. On en déduit une autre conséquence. qu'il me semble três important de soumettre au verdict de l'expérience : si chaque quantum de lumière absorbé ionise une molécule, Il doit exister, entre la quantité de lumière absorbée L e t le nombre j de molécules de gaz qu'elle ionise, l a relation :
Si notre conception correspond bien â la réalité, cette relation doit être vérifiée pour tous les gaz qui (à la fréquence considérée) ne présentent pas d'absorption notable qui ne soit accompagnée d'ionlsation. Berne, le 17 mars 1905.
l2 l3
J. Stark, Die ElektrlzitSt in Gasen, Leipzlg, 1902, p 57.
A l'intérieur des gaz, le potentlel d'ionisation pour des Ions négatifs est cinq fois plus grand.
Article IV
La mise en évidence du noyau La diffusion des particules a e t p
par la matière
et la structure de l'atome
ERNESTRUTHERFORD Philosophical Magazine 21,669-688(1911) (Taylor & Francis) (avril 1911) [traduit par B. Escoub&] Envoyé par l'auteur. Un. bref apercu de cet article a été envoyé à la Société des Lettres et de Philosophie de Manchester en février 1911.
1. II est bien connu que les particules O e t /3 subissent des déviations à partir de leur parcours rectiligne lorsqu'elies rencontrent des atomes de matière. Cette diffusion est beaucoup plus marquée pour les particules p que pour les a à cause de la quantité de mouvement et de l'énergie bien moindres des premières par rapport aux secondes. II ne semble pas faire de doute que des particules se mouvant ainsi rapidement suivent un chemin passant à travers l'atome, et que les déviations observées sont dues au fort champ électrique qu'elles croisent à l'intérieur de l'atome. On suppose généralement que la diffusion d'un faisceau de rayons a ou traversant une fine lame de matière est le r e u l t a t d'une multitude de petites diffusions par les atomes de matière traversés. Cependant, les observations de Geiger et Marsden sur ia diffusion des particules a indiquent que quelques unes de ces particules a doivent subir une déviation d'un angle supérieur à l'angle droit lors d'une seule collision. Ils trouvent, par exemple, qu'une petite fraction des particules Q incidentes, environ 1 sur 20.000, est déviée en moyenne d'un angle de 90° en traversant un dépôt de feuille d'or d'environ .O0004c m d'épaisseur. ce qui est équivalent à 1.6 m m d'air en termes de pouvoir d'arrêt des particules Q. Geiger a montra plus tard que l'angle de déviation le plus probable pour un faisceau de particules a traversant une feuille d'or de cette épaisseur était d'environ 0' 87. Un simple calcul base sur la théorie des probabilités montre que, pour une particule a,la chance d'€tre déviée d'environ 90' est incroyablement petite. En outre, l'on verra plus tard que la distribution des particules (I pour d'flérents grands angles de déviation ne suit pas la loi de probabilité à laquelle l'on s'attendrait si ces grandes déviations étaient produites à partir d'un grand nombre de petites déviations. II semble raisonnable de supposer que ia Proc. ROY. Proc. Roy.
LXXXIï,p 495 (1909). Soc. LXXXIII,p 492 (1910). SOC.
Sources et évolution de la physique quantique
42
déviation à grand angle est due à une seule collision avec un atome, car la probabilité qu'une seconde collision de ce genre produise une grande déviation est sans aucun doute excessivement faible..Un calcul simple montre que l'atome doit etre le siège d'un champ électrique intense pour &tre capable de produire une déviation aussi grande lors d'une seule collision. Monsieur J.J. Thomson a récemment proposé une théorie pour décrire la diffusion d'une partkuie chargée électriquement à travers une petite épaisseur de matière. II suppose que l'atome consiste en un nombre N de corpuscules de charge negative, accompagné d'une quantité d'électricité positive égale Uniformément distribuée à l'intérieur d'une sphère. L a déviation d'une particule de charge négative à son passage à travers l'atome est attribué à deux causes : (1) l a répulsion des corpuscules distribués à travers l'atome, et (2) l'attraction de l'électricité dans l'atome. On suppose que la déviation de la particule traversant l'atome est petite, alors que la déviation moyenne aprks un grand nombre m de collisions est donnée par où 0 est la déviation moyenne due a un seul atome. II montra que le nombre N d'électrons dans l'atome pouvait etre déduit de l'observation de la diffusion de particules électrifiées. La précision de cette théorle de la diffusion compoee f u t examinée expérimentalement par Crowther dans un article ultérieur. Ses rbuitats confirment apparemment les principales conclusions de la théorie, et, supposant que I'éiectrkité positive était continue, II en déduisit que le nombre d'électrons dans un atome é t a i t environ égal à trois fois son poids atomique. La théorie de Monsieur J.J. Thomson est basée sur I'hypothkse que la diffusion due à une seule collision avec un atome est faible, e t la structure particuliëre que l'on a supposée pour l'atome ne permet pas de très grandes déviations pour une particule Q traversant un seul atome, à moins que l'on ne suppose que le diamètre de la sphère d'électricité positive soit minuscule comparé au diamètre de l a sphère d'influence de l'atome. Puisque les particules Q et traversent l'atome, il devrait être possible, à partir d'une étude fine de la nature de leurs déviations, de K faire une idée de la constitution de l'atome capable de produire les effets observe. De fait, la diffusion de particules chargées de grande vitesse par les atomes de matière est l'une des plus prometteuses méthodes d'attaque de ce problème. L e développement des méthodes de scintillation pour compter une à une les particules Q offre des avantages inhabituels d'investigation, et les recherches de H. Geiger effectuées par cette méthode ont déjà ajouté beaucoup à notre connaissance de la diffusion des rayons Q par la matière. 2. Nous examinerons d'abord théoriquement l a coliislon simple avec un atome d'une structure simple, capable de produire de grandes déviations à une particule Q , et nous comparerons les déductions de la théorie aux données expérimentalement disponibles. Considérons un atome contenant une charge &Ne en son centre entouré d'une sphère d'électrification contenant une charge F N e supposée uniformément distribuée à l'intérieur d'une sphère de rayon R. e est l'unité fondamentale de charge, qui dans cet
fi.#,
'
'
'
Crowther. Proc. Roy. Soc.
LXxm,
p 226 (1910).
La déviation d'une particule d'un très grand angle à la suite d'une collision avec un seul atome sera appelée dans cet article une diffusion "simple". L a diffusion d'une particule a résultant d'une multitude de petites déviations sera qualifiée de diffusion "composée" (nous dirions aujourd'hui diffusion "multiple", NdT).
De la relativité à la première quantification
Rutherford
- Lo découverie du noyau
43
43
article est prise égale à 4.65 x lo-'' unités ES. Nous supposerons que pour des distances inférieures à lo-'' cm la charge centrale ainsi que ia charge de la particule Q peuvent etre considérées concentrées en un point. Nous montrerons que les principales déductions tirées de l a théorle sont indépendantes du fait que l'on suppose la charge centrale positive OU négative. Par convention, nous supposerons que son signe est positif. La question de la stabilité de l'atome proposé n'a pas besoin d'être envisagée à ce niveau, car elle dépendra évidemment de l a structure de la partie minuscule de l'atome, et du mouvement des partles chargées qul le constituent. Afin de nous faire une idée des forces nécessaires Pour dévier à grand angle une particule a,consldérons un atome contenant une charge positive N e au centre, et entouré par une distribution d'électricité négative uniformément répartie à l'intérieur d'une sphere e t le potentiel à une distance r du centre d'un de rayon R. La force électrique atome pour un point à I'intérieur de l'atome sont donnés par :
x
v
supposons qu'une particule Q de masse m, de vitesse u et de charge E soit lancée directement vers le centre de l'atome. Elle sera amenée à s'arrêter à une distance b du centre donnée par
1
-mu2 2
1 3 = N ~ (b E - 2R
bz + =).
NOUSverrons que b est une quantité importante dans les calculs qui suivent. s u p posant que la charge centrale soit de 100e, on peut calculer que la valeur de b pour une particule P d'une vitesse de 2.09 x lo0 cm par seconde est d'environ 3.4 x cm. Dans ce calcul on a supposé b très petit devant R. Puisque R est supposé être de l'ordre du rayon de l'atome, c'est-à-dire lo-' cm, il est évident qu'une particule a,avant d'être renvoyée vers l'arrière, s'approche si près de la charge centrale, que le champ dO à la distribution uniforme d'électricité négative peut être négligé. Plus généralement, un calcul slmple montre que pour toutes les déviations plus grandes que un degré, on ne commet pas d'erreur notable en supposant que la déviation n'est due qu'au seul champ créé par la charge centrale. L'électricité négative, 51 elle est distribuée sous forme de corpuscules. peut être responsable de déviations simples, dont à ce niveau la théorie ne rend pas compte. NOUS montrerons plus loin que C e t effet est en général petit comparé à celui qui est dO au champ central. Considérons le passage d'une particule de charge électrique positive au voisinage du centre d'un atome. Supposons que la vitesse de la particule ne soit pas modifiée de maniare appréciable lors de son passage à travers l'atome : la trajectoire de la particule sous I'iniluence d'une force répulsive variant comme l'inverse du carré de la distance est une hyperbole dont le centre de i'atome occupe le foyer extérieur. Supposons que la particule entre dans l'atome en sulvant la direction P o (Fig. l), et que l a direction de son mouvement lorsqu'elle s'&happe de l'atome soit OP'. OP et OP' font des angles égaux avec la ligne SA, où A est le périhélie de l'hyperbole. p = S N est la distance normale du centre à la direction du mouvement
s
Sources et évolution de la physique quantique
44
initial de la particule. Soit 8 = l'angle POA. Soit la vitesse de la particule entrant dans l'atome, vitesse au point A. alors, considérant le moment angulaire :
v
pV = SA.o
u
sa
D
P'
Fig. 1 Par conservation de l'énergie :
1 -mV' =1 2
2
NeE -SA
'
Puisque i'excentricité est sec 8.
S A = S O + O A = p c ç c B ( l +cos@) = pcot 812, p2 = SA(SA - b) = pcot 8/2(pcot 812 - b), b=2pcot8. L'angle de deviation
est
5~
- 28 et COt+/2=- 2P
b Ceci donne l'angle de déviation d'une particule en fonction de b, et de la distance aba'ksée du centre de l'atome normalement à la dlrectlon de propagation. Comme Illustration, quelques valeurs de l'angle en fonction de f sont données dans la table suivante :
4
f...
+...
10 5O.7
5
11".4
2
28'
1
53'
.5
90'
.25
127"
.125 152"
Une simple considération montre que la déviation est la même que la force soit attractive au lieu d'etre répulsive.
De la relativité a la première quantification
45
3. Probabilité d'une simple déviation d'un angle quelconque Supposons qu'un faisceau de particules chargées électriquement arrive perpendiculairement sur un écran de matière d'epaisseur t . A l'exception de quelques particules qui seront déviées à grand angle, les particules sont supposées traverser la plaque presque dans ia direction normale, avec seulement une petite modification de leur vitesse. Soit n le nombre d'atomes par unité de volume du matériau. L e nombre de collisions de la particule avec l'atome de rayon R est alors de xR%t sur l'épaisseur t. La probabilité m d'entrer dans un atome à une distance p de son centre est donnée par
m = np'nt. L a chance
dm de frapper
entre les rayons p et p
dm = 2 n p n t . d ~= -ntb2 n 4
puisque
+ dp est donnée par
cot 4 12 CSC'
4 J2d4,
P
cot 412 = 2 - .
b
La valeur de dm donne la fraction du nombre total de particules qui sont déviées entre ies angles 4 et 4 f d4. La fraction p du nombre total de particules qui sont déviées d'un angle supérieur à 4 est donnée par
n
p = -ntb2 4 cot14J2 La fraction
p qui est déviée entre les angles 41 et
(3) 42
est donnée par
II convient d'exprimer l'équation (2) sous une autre forme afin de la comparer a i'expérience. Dans le cas de rayons a,le nombre de scintillations apparaissant sur une aire constante d'un &ran de sulphure de zinc est compté pour différents angles par rapport à la direction incidente des particules. Si r est la distance du point d'incidence des rayons
9,
nous voyons de cette équation que le nombre de particules a Pulsque b = (scintillations) par unité de surface de l'&cran de sulphure de zinc à une distance donnée r du point d'Incidence des rayons est proportionnel à : (1) csc4 412 ou si 4 est petit ; (2) l'épaisseur t du matériel diffuseur pourvu qu'elle soit petite ; (3) la grandeur de la charge centrale N e ;
&
Sources et évolution de la physique quantique
46
(4) et est inversement proportionnelle à (mu2)', ou à l a quatrième puissance de la vitesse si m est constant. Dans ces calculs, on a supposé que les particules Q diffus4es a grand angle ne subissent qu'une grande déviation. Pour que ceci soit valable, il est essentiel que l'épaisseur du matériau diffuseur soit suffisamment petite pour que la chance d'une seconde collision mettant encore en Jeu une grande déviation soit tr& faible. SI par exemple, la probabilité d'avoir une simple déviation en traversant une épaisseur t est de l/ioOO, la probabilité de deux déviations successives, chacune à la valeur 4, est de i/iû6, et donc tout à fait négligeable. La distribution angulaire des particules a diffusées à grand angle par une fine feuille de métal offre l'une des plus slmples méthodes de vérifier si cette théorie de la diffusion est correcte en général. Ceci a récemment été fait pour des particules Q par le Dr. Geiger ', qui trouva que la distribution des particules déviées entre 30" et 150" par une mince feuille d'or était en accord substantiel avec la théorie. Un compte rendu plus détaillé de ces expériences et d'autres effectuées pour tester la validité de cette théorie sera publié plus tard.
4. M o d i f i c a t i o n d e la vitesse lors d'une collision avec un a t o m e O n a supposé jusqu'ici que la vitesse d'une particule Q ou B ne subit pas de changement appréciable lorsqu'une collision unique avec un atome donne lieu a une grande déviation de la particule en question. Sous certaines hypothèses, on peut calculer l'effet d'une telle collision sur la modification de la vitesse de la particule. O n suppose que seuls deux systèmes interviennent, c'est-à-dire la particule en mouvement rapide et l'atome traversé considéré initialement au repos. On suppose que le principe de conservation de l'énergie et de la quantité de mouvement s'applique, e t qu'il n'y a pas de perte d'énergie appréciable par rayonnement. Soit m la masse de la particule, V I =vitesse d'approche, v2 =vitesse d'éloignement, M =masse de l'atome, =vitesse communiquée à l'atome résultant de la collision. .4 (fig.2) la grandeur e t la direction de R e p r a n t o n s par 0 la quantité de mouvement mu1 de la particule entrante et par O B celle de la particule sortante, déviée d'un angle AOB = 4. Alors B A représente la grandeur e t la directlon de l a quantité A de mouvement MV de l'atome de recul.
v
(MV)'= (mvi)'
+ ( m ~ 2 -) ~2m2u1v2 c o s 4 .
Par conservation de t'énergie
M V 2 = mu: Supposons que M/m
=K
et que vz
Manchester Lit. & Phil. Soc. 1910
- mu,2
= pu1
où p
< 1.
De la relativité a la première quantijkation
De (1) et (21,
+
(K
l)p2
47
- 2p COB q5 = K - 1,
ou
Considérons ie cas d'une particule a de poids atomique 4, déviée d'un angle de 90' par suite d'une collision avec un atome d'or de poids atomique 197. Puisque K = 49 environ,
c'est-à-dire que la vitesse de la particule ne s'est réduite que d'environ 2 pour cent lors de la collision. Dans ie cas de i'aiuminium K = 27/4 et pour 4 = 9o'p = O, 86. O n voit que la réduction de la vitesse de la particule a devient prononcée dans cette théorie lorsque ia collision a lieu avec des atomes plus légers. Puisque le parcours d'un a dans l'air ou dans d'autre matériau est approximativement proportionnel au cube de sa vitesse, il s'ensuit qu'une particule a de 7 c m de parcours voit ce parcours réduit à 4.5 cm, après n'avoir subi qu'une seule déviation de 90' en traversant un atome d'aluminium. C'est une grandeur que l'on peut facilement détecter expérimentalement. Puisque la valeur de K est très grande pour ia collision d'une particule B avec un atome, la diminution de vitesse d'après cette formule est très petite. Quelques cas très intéressants de la théorie se produisent lonqu'on considère les variations de vitesse et la distribution des particules diffusées quand une particule a rencontre un atome léger, par exemple un atome d'hydrogène ou d'hélium. La discussion de ces cas et d'autres semblables sera reportée a l'examen expérimentai du problème.
5. Comparaison des diffusions simple et composée Avant de comparer les résultats de la théorie avec i'expérience, il est souhaitable de considérer l'importance relative de ia diffusion simple e t de ia diffusion composée en calculant la distribution des particules diffusées. Dès que i'on suppose l'atome constitué d'une charge centrale entourée d'une distribution uniforme de charge opposée à l'intérieur d'une sphère de rayon R,la probabilité d'une collision donnant lieu à de petites déviations est bien plus grande que celle d'une collision simple à grande déviation. La question de la diffusion composée a été examinée par Monsieur J.J. Thomson dans l'article préalablement discuté(s1). Avec les notations de notre article. la déviation moyenne due au champ d'une sphère d'électricité positive de rayon R et de charge N e é t a i t trouvée pat lui égale à
La déviation moyenne 4 2 due à N corpuscules négatifs supposés distribués uniformément à i'intérieur de la sphère était trouvée égale à
Sources et évolution de la physique quantique
48
La déviation moyenne due à I'éleCtriCité positive et négative est prise égale à
De la même manibe, il n'est pas difficile de calculer la déviation moyenne due à l'atome pourvu d'une charge centrale discuté dans cet article. Puisque le champ électrique radlal à une distance r du centre est donné par
x
il n'est pas très difficile de montrer que la déviation (supposée petite) d'une particule électrifiée due à ce champ est donnée par
e=P
(I-- $)"".
p est la distance du centre perpendiculairement au chemin de la particule, et b a la même valeur qu'auparavant.On voit que la valeur de 6 croît lorsque p diminue, et devient grande pour de petites valeurs de Puisque nous avons déjà vu que les déviations deviennent très grandes pour une particule passant près du centre de l'atome, il est manifestement inexact de trouver la vaieur moyenne en supposant que 8 est petit. Prenant R de l'ordre de i0-8cm. les valeurs de p pour une grande déviation sont, pour des particules a et p, de l'ordre de io-'* cm. Puisque la chance de subir une collision donnant lieu à une grande déviation est petite comparée à celle de petites déviations, un simple examen montre que la moyenne (petite) des déviations ne varie pratlquement pas si on omet les grandes déviations. Cela revient à intégrer sur la partie de la section efficace de l'atome où les déviations sont petites e t à négliger une petite aire centrale. O n peut de cette manière montrer simplement que la petite déviation moyenne est donnée où
4.
par 41
=
3r b
8R.
41
La vaieur de pour l'atome avec une charge concentrée au centre a trois fois la grandeur de la déviation moyenne pour la même valeur de N e pour le type d'atome examiné par Monsieur J.J. Thomson. En combinant les déviations dues au champ électrique e t aux corpuscules, la déviation moyenne est
15,4
2R Nous verrons plus tard que la valeur de N est à peu près proportionnelle au poids atomique, et est d'environ 100 pour 1'01. L'effet dO à la diffusion par les corpuscules individuels exprimé par le second terme de l'équation est par conséquent petit pour Les atomes lourds comparé à celui qui est dO au champ électrique distribué. Négllgeant le second terme, la déviation moyenne par atome est Nous sommes maintenant en condition de considérer les effets relatifs sur la distribution des particules
$$.
De la relativité à la première quantijïcation
49
dos 2 la diffusion simple et a la diffusion composée. Suivant l'argument de J.J.Thomson, la déviation moyenne 81 après la traversée d'une épaisseur t de matière est proportionnelle à la racine carrée du nombre-de collisions e t est donnée par
3xb et = -4XZ= 8R 00
3xb -m, 8
n, comme avant,
est égal au nombre d'atomes par unité de volume. La probabilité pl pour une diffusion composée que la déviation de la particule soit Par conséquent plus grande que 4 est égaie à
9x3 4' = --b'ntlogpI. 64
supposons maintenant que seule intervienne la diVusion simple. Nous avons vu l a probabilité pz d'avoir une déviation plus grande que 4 é t a i t donnée par
pz = -b'.n.tCot' x 4
($3) que
412.
En comparant ces deux équations
q4 est sufisamment petit pour que
tan 442 = 412, p~log p i
= -0,72.
Si nous supposons pz = O, 5, alors p i = O, 24 si pz
= O, 1, aiors pl = O, O004
II est évident, d'après cette comparaison, que la probabilité, pour une déviation donnée, est toujours plus grande s'agissant d'une diffusion simple que d'une diffusion composée. L a différence est particulièrement marquée lorsqu'une petite fraction seulement des particules est diffusée à un angle donné. Ce résultat implique que la distribution des particules due à des collisions avec des atomes est principalement régie, pour des é p a w u r s minces, par la diffusion simple. II ne fait pas de doute que la diffusion composée n'alt quelque effet en uniformisant la distribution des particules diffusées ; mais l'importance relative de cet effet devient d'autant plus faible que diminue la fraction de particules diffusée à un angle donné.
6. Comparaison de la théorie avec les expériences Dans l a théorie présente, la valeur de la charge centrale N e est une constante importante, e t il est intéressant d'en estimer la valeur pour différents atomes. Ceci peut être réalisé très simplement en déterminant la petite fraction de particules a ou @ de vitesse connue tombant sur un mince écran métallique qui est diffusée entre 4 et 4 d4,
+
Sources et évolution de la physique quantique
50
4 est l'angle de dévlation. L'Influence de la dlffusion composée sera petlte SIla fraction est petite. Des expériences dans cette direction sont en cours, mais il est intéressant à ce niveau de discuter à la lumière de l a théorle actuelle les données déjà publiées sur la diffusion des partkules a et NOUS discuterons les points suivants : L a "réflexion diffuse" des particules a,c'est-Mire diffusion des partlcules a â grands angles (Geiger e t Marsden). La variatlon de la réflexion diffuse avec le .poids atomique du radiateur (Geiger e t Manden). La diffusion moyenne d'un faisceau de rayons a transmls à travers une fine plaque de métal (Geiger). Les expériences de Crowther sur la diffusion de rayons B de vitesses différentes sur différents métaux.
00
8.
(a) Dans i'article de Geiger e t Marsden (/oc. cit.) sur la réflexion diffuse de particules a tombant sur différentes substances, II est montré qu'environ 1/8000 des a du radium C arrlvant sur une plaque épaisse de platine sont diffusés vers l'arrière dans la direction Incidente. Cette fraction est déduite de l'hypothèse que les particules Q sont uniformément diffusées dahs toutes les directions, les observations étant faites pour un angle de déviation d'environ 9 0'. La forme de l'expérience ne convient pas vraiment à un calcul precis, mais des données disponibles on peut montrer que l a diffusion observée est a peu près celle que l'on attend de la théorle, si l'atome de platine a une charge centrale d'environ iûûe. (b) Dans leurs experiences sur le sujet, Geiger e t Marsden donnent le nombre relatif de particules a réfléchies de manière diffuse à partir d'épaisses couches de différents métaux, sous des conditions semblables. Les nombres qu'ils obtiennent sont donnés dans l a table ci-dessous. où z représente le nombre relatif de partlcules diffusées, mesuré par le nombre de xlntillatlons par minute sur un écran de sulfure de zinc. D'après la théorie de la diffusion simple. la fraction du nombre t o t a l de particules a diffus& à un angle donné en passant à travers une épaisseur t est proportionnelle à n.Azt, en supposant que la charge centrale est proportionnelle au poids atomique A. Dans le cas prlsent, l'épaisseur de matière à partir de laquelle les particules a sont susceptibles d'émerger e t d'atteindre l'écran de sulphure de zinc dépend du métal. Depuis que Bragg montra que le pouvoir d'arrêt d'un atome pour une particule Q est proportionnel à la racine carrée de son poids atomique, la valeur de nt pour différents éléments est proportionnelle b l/a. Dans ce cas, t représente la plus grande profondeur d'où émergent les partlcules a. Le nombre z de particules a diffusées vers I'arrkre à partir d'une couche épaisse est par conséquent proportionnel à AJ12 ; ou : z /A3/*doit être constant. Pour comparer cette deduction avec l'expérience, les valeurs correspondantes de ce quotient sont données dans l a dernière Colonne. SI l'on consfdère l a difficulté des expériences, l'accord entre la théorie et l'expérience est raisonnablement bon'. La diffusion simple à grand angle de particules u modifiera évidemment quelque peu la forme
' dans
L'effet d'une variation de la vitesse lors de la colllsion avec l'atome
cc calcul.
est
négligé
De la relativité à la première quant$cation
51
de la courbe d’Ionisation de Bragg pour un faisceau de rayons a. L’effet des grandes diffusions sera prononcé lorsque les rayons a auront traversé des écrans de métal de poids atomique élevé. mais devrait-&tre faible pour des atomes de petit poids atomique. Métal Plomb Or Platine Etain Argent Cuivre Fer Aluminium
Poids atomique
z
z/A3I1
207 197 195
62
208 242 232
108 64
67 63 34 27 14.5
56
10,2
250
27
384
243
119
226 241 225
(c) Geiger a fait une étude soignée de la diffusion de particules a traversant de fines feuilles de métal, par la méthode de scintillation, et en déduisit l’angle de déviation le plus probable pour les particules a traversant des épaisseurs connues de différentes sortes de matière. Un falsceau étroit de particules a homogènes fut utilisé comme source. Après ëtre passé à travers la feuille diffuseur, le nombre total de particules (Y déviées suivant différents angles fut mesuré dlredement. L‘angle pour lequel le nombre de partlcules diffusées passait par un maximum fut pris comme l’angle le plus probable. La variation de l’angle le plus probable avec la profondeur fut déterminée, mals les calculs à partir de ces données étaient un peu compliqués à cause de la variation de la vitesse des particules a lors de leur passage à travers le matérau diffuseur. En considérant la courbe de distribution des partlcules a donnée dans l’article (/oc. ut. p 496), on voit que l’angle jusqu’auquel la moitié des particules sont déviées est environ 20 pour cent plus grand que l’angle le plus probable. Nous avons déjà vu que la diffusion composée peut devenir importante lorsque environ la moitié des particules sont déviées jusqu’à un angle donné, et qu’il est difiicile de séparer dans ces cas les etFets relatifs dos aux deux types de diffuslon. Une estimation approximative peut être faite de la manière suivante : de $5 la relation entre les probabilités respectives pl et p1 pour les diffusions simples e t composées est donnée par
La probabilité q des deux effets combinés peut en premiere approximation être prise égale
a q=
si q = 0,5,
(pi +p;)”?
il s’ensuit que :
p1 = 0,2 et pz = 0,46 Nous avons vu que la probabilité p1 d’une déviation simple plus grande que donnée par : a pz = -n.t.bl a t Z 412. 4
4
est
52
Sources et évolution de la physique quantique
Puisque dans les expériences considérées
4 est comparativement
petit
Geiger trouva que l'angle le plus probable de diffusion des rayons a traversant une épaisseur de feuille d'or équivalente en pouvoir d'arrst à environ 0,76 crn d'air était de 1"40', L'angle 9 auquel la mottle des particules (Isont déviées correspond donc à environ
2". n = 6,07 x 10";
t = O, 00017 cm;
u
(valeur moyenne)
= 1.8 x io3,
E/m = 1,5 x 1014 unités E.S.;
e = 4,65 x
lo-'.
Prenant la probabilité d'une diffusion simple égale à 0.46 et substituant les valeurs ci-dessus dans la formule, la valeur de N qui en résulte est 97. Pour une épaisseur d'or équivalente en pouvoir d'arrêt à 2,12c m d'air, Geiger trouve que l'angle le plus probable est 3"40'. Dans ce cas t = O, 00047,$ = 4"4,et u(moyen) = 1,7 x log,N résultant valoir 114. Geiger montra que l'angle de déviation le plus probable pour un atome était approximativement proportionnel à son poids atomique. II s'ensuit que la valeur de pour les différents atomes devrait être approximativement proportionnelle à leur poids atomique, dans tous les cas pour des poids atomiques compris entre l'or et l'aluminium. Puisque le poids atomique du platine est presque égal à celui de l'or, il suit de ces considérations que la valeur de la réflexion diffuse des particules a à plus de 90" sur de l'or et la valeur moyenne du petit angle de diffusion d'un faisceau de rayons traversant une feuille d'or sont tous les deux expliquées par l'hypothèse d'une diffusion simple en supposant que l'atome d'or a une charge centrale d'environ 100e. ( d ) Expériences de Crowther sur l a diffusion de rayons p. Regardons maintenant jusqu'à quel point les résultats expérimentaux de Crowther sur la diffusion de particules B de vitesses différentes sur divers matériaux peuvent être expliqués par la théorie générale de la diffusion simple. Cette théorie donne, pour la fraction des particules @ déviées d'un angle plus grand que $ la valeur
Dans la plupart des expériences de Crowther, $ est suffisammant petit pour que l'on puisse remplacer tan $/2 par $/2 sans beaucoup d'erreur. Par conséquent
$' = 2~n.t.b'
si
p = 1/2.
A partir de la théorie de la diffusion composée nous avons vu que la probabilité pour que la déviation des particules soit supérieure à est donnée paf :
#
97r3
$'/logpi = --n.t.b2. 64
De la relativité a la première quanfi3cation
53
Puisque, dans les experiences de Crowther la profondeur t de matière était détermin& de telle sorte que p1 = 112,
-
#'=0,96zntb2.
Pour une probabilité de 1/2. les théories de la diffusion simple et compos& sont donc identiques dans leur forme générale. mais dMZrent d'une constante numérique. II est donc d a i r que les PrinclPales relations de la thCorie de la diffusion compos& de Monsieur J.J.Thomson, qui ont été vérlfieeS expCrimentalement par Crowther, sont ilaiement valables pour la théorie de ia diffusion simple. Par exemple, si fm est i ' é p a k u r pour laquelle la moitk?des partkules sont dévI4e.s à un angle 4. Crowther montra que e t aussi sont constants pour un matériel donné lorsque est fixé. Ces relations demeurent valables pour la théorie de l a diffusion simple. Malgré leur similitude formelle apparente, les deux t h h i e s sont fondamentalement différentes. Dans l'un des cas, les etrets observés sont dos aux effets cumulés de petites déviations, alors que dans l'autre, les grandes déviations sont supposeeJ résulter d'une seule collision. La dlstributbn des particules diflusées est entièrement différente suivant les deux théories lorsque la probabilité de déviation d'un angle plus grand que est petite. Nous avons déjà vu que la distribution des particules a à différents angles a été trouvée par Geiger être en accord substantiel avec la théorie de la diffusion simple, mais ne pouvait Ctre expliquée par ia théorie de la diffusion compos& seule. Puisqu'il y a de bonnes raisons de croire que les lois de la diffusion des particules a et @ sont t r b semblables, les lois de distribution des particules @ diffusées devraient être ies mêmes que pour les partkules a avec une petite épaisseur de matière. Puisque la valeur de pour les particules B est dans la plupart des cas beaucoup pius petite que la valeur correspondante pour les particules a,l a chance de grandes diffusions simples pour les partkules @ traversant une épaisseur donnée de matlère est beaucoup plus grande que pour des particules a. Puisque, dans la théorle de la difiusion simple. la fraction du nombre de particules qui sont déviées à un angle donné est proportionnelle à i f . où t est i'épaisseur supposée petite e t k une constante, le nombre de partkules qui ne sont pas d é v i b de cet angle est proportionnel à 1 kt. A partir de considérations basées sur la théorie de la dMuslon composée. Monsieur J.J.Thomson déduisit que la probabilité de où p est une constante déviation d'un angle inférieur P 9 est proportionnelle à 1 -e-*/', pour une valeur donn& de L'exactitude de cette dernière formule fut vCrifi& par Crowther en mesurant dlectriquement la fraction 1/10 des p a r t i c u b @ dévlées qui traversaient à travers une ouverture circulaire sous-tendant un angle de 3 6' avec le matériau diffuseur. Si
+/dm
$.fi,,,
6
d
$
-
d.
IlIo = 1 -e-*/(, la valeur de 1 devrait décroïtre t r b lentement au début alors que t croit. Crowther. utilisant I'alumlnlum comme matériau difiuseur, % a b r i que la variation de I/i@&taiten bon accord avec la théorie pour les petites valeurs de f. D'un autre côté, si la dMusion simpk est pr-nte, comme sans aucun doute c'est le cas pour les rayons a. la courbe montrant ia relation entre 1/10 e t t devrait être presque llnéaire pour les premierr points. Les expériences de Marsden a sur l a dMuJon des rayons @,bien qu'elles n'utllbrnt pas Phil. Mag.
xvïïï, p 909 (1909).
Sources et évolution de la physique quantique
54
une épaisseur d'aluminium aussi faible que celle employée par Crowther. appuient sans aucun doute cette conclusion. Considérant l'Importance de ce point pour le resultat, d'autres expériences sur cette questlon sont souhaitables. pour différents éléments diffuDe la table donn& par Crowther des valeurs (b/& sant des rayons de vitesses égale b 2,68 X 10'' cm par seconde, les valeurs de la charge centrale N e peuvent €tre calculées avec la théorie de la diffusion simple. O n suppose, comme dans le cas des rayons a,que pour une valeur donnée de la fractlon de particules B déviée par une simple dlffuslon d'un angle plus grand que (b est 0,46 au lieu de 0,50. Les valeurs de N calculées d'après les données de Crowther sont données dans l a
b
#/dm
table sulvante :
'
4/dm N
Element
Poids atomique
Aluminium
27
4,25
22
Cuivre
63,2
10,o
42
Argent
108
15.4
78
Platine
194
29,O
138
Ann. d. Phfi. IV, 25 p 671 (1907).
De la relativité a la première quanh3cation
7.
55
Considérations générales
En comparant la théorlé exposee dans cet artlcle avec les resultats expérimentaux, nous avons supposé que l'atome conslstait en une charge centrale, supposée concentrée en un point, e t que les grandes déflexions simples des partkules a et sont principalement dues à leur passage à travers l'intense champ centrai. L'effet de la charge égale e t de signe opposé distribu& UnifortTbSrnent à travers une sphère a été négligé. Nous allons maintenant considérer quelques Preuves à l'appui de ces hypothèses. Concrètement, considérons le passage d'une partkule a de grande vitesse à travers un atome de charge centrale positive N e , et entouré d'une charge compensatoire de N électrons. NOUS rappelant que la masse, l a quantité de mouvement e t i'énergie cinétique de l a particule O sont t r h grandes par rapport aux quantites correspondantes pour un électron en mouvement rapide, II ne semble pas possible, d'aprës des considérations dynamiques, qu'une particule a puisse etre déviée d'un grand angle en s'approchant de três p r b d'un électron, même SIce dernier est en mouvement rapide et subit les contraintes de forces électrlques intenses. II semble raisonnable de supposer que la probabilité de déviations simples à grand angle dues à cette cause, si elle n'est pas nulle, est excessivement petite par rapport à celle due à la charge centraie.
B
II est intéressant d'examiner quelle lumière peut apporter l a situation expérimentale sur la question de l'extension de l a distribution de la charge centrale. Supposons, par exemple, que l a charge centrale soit composée de N charges unitaires distribuées sur un volume t e l que les grandes déviations simples soient essentiellement dues aux charges constituant l a charge centrale, et non au champ externe produit par la distribution. Nous avons vu ($3) que la fraction des particules a diffusées à grand angle était proportlonnelle à ( N e E ) 2 , où N e est la charge centrale concentrée en un point, e t E la charge de la particule déviée. Si, cependant, la charge centrale est distribuée en unités simples, la fraction des particules a déviées à un angle donné est proportionnelle à Nea au lieu de N2e2. Dans ce cakul, l'influence de la masse de la particule constituante a été négligée, on n'a tenu compte que de soon champ électrique. Pulsqu'on a montré que la valeur de l a charge centrale ponctuelle pour l'or devait être environ 100, la valeur de la charge distribuée nécessaire pour produire la même proportion de déviations simples à grand angle devrait etre au molns de 10.000. Sous ces conditions, la masse de la particule constituante devrait Otre petite par rapport à la masse de la particule a,et que des diffusions simples puissent donner lieu à grandes dévlatlons pose problème. De plus. avec une si grande charge alnsl distribuée, l ' M e t de la dHiusion compos% est relativement plus importante que celle de la diffusion simple. Par exemple, l'angle moyen des petites déviations d'un falxeau de particules a traversant une fine feuille d'or devrait être beaucoup plus grand que celui qui a été observé expérimentalement par Geiger (§b c). La diffusion à grand angle e t à petit angle ne peuvent alors etre expliquées par l'hypothèse d'une charge centrale de même valeur. Considérant la situation dans son ensemble, II semble phis simple de supposer que l'atome contient une charge centrale distribuée à l'intérieur d'un tout petit volume, et que les grandes d6viations simples sont dues à la charge centrale vue comme un tout, et non à travers ses constituants. En même temps, la situation expérimentale n'est pas suffisamment précise pour écarter la posrlblllté qu'une petite fraction de la charge centrale puise être emportée par des satellites s'&m'tant à quelque distance du centre. Une information sur ce point pourrait être obtenue en examinant
-
Sources et évolution de la physique quantique
56
si la meme charge centrale est requise pour expliquer les grandes déviations simples des particules a et /3 ; car la particule Q doit s'approcher beaucoup plus près du centre de l'atome que la particule B de vitesse moyenne pour subir la même grande déviation. es donnes générales dlsponlbles lndiquent que la valeur de la charge centrale pour les dlfferents atomes est approximativement proportionnelle à leur poids atomique, dam tous les cas pour les atomes plus lourds que i'aluminium. il sera trës intéressant d'examlner expérimentalement si Cette Simple relation reste aussi valide pour les atomes l@gers. Dans les cas ob la masse de l'atome diffuseur (par exempk. l'hydrogène, i'héiium. le lithium) n'est pas vraiment différente de celle de la p a r t k u k u,la théorle générale de la diffusion simple exige quelque modification, car il est nCcessalre de tenir compte des mouvements de l'atome lui-même (voir&). Il est Intérusant de remarquer que Nagaoka lo avait consldéré du polnt de vue mathématique un atome "Saturnien", qu'il supposait consister en une masse centrale attractive entourée d'anneaux d'électrons en rotation. II montra qu'un tel système était stable si la force d'attractlon étalt grande. Du point de vue choisi dans cet article, la probabilité d'une grande déviation serait Pratiquement inchangée que l'on considëre l'atome comme un disque OU une sphère. On peut remarquer que la valeur approximative trouvée pour la charge centrale de l'atome d'or (ïûûe) est environ celle que l'on attendrait d'un atome d'or constitué de 46 atomes d'héliumnchacun portant une charge 2e. Ce ne peut &tre qu'une coincldence. mais elle est certainement suggestive iorsqu'on pense à l'expulsion des corps radbactifs d'atomes d'hélium portant deux charges unité. Les deductions faites D partir de la t h b r i e consldér& lusqu'ici ne dépendent pas du slgne de la charge centrale, et il n'a pas été possible lusqu'alors d'obtenir une preuve définitive de sa nature positive ou négative. On doit pouvoir r&oudre la question du slgne en considerant la différence à laquelie on s'attend sulvant les deux hypotheses pour les lois d'absorption des particules P, car l'effet de la radiation réduisant is vitde la particule devrait t t r e plus prononcé avec un centre positif qu'avec un centre négatif. SI la charge centrak est positive. on volt facilement qu'une masse chargée positivement relachée du centre d'un atome lourd acquerra une grande vitesse en se déplaçant a travers le champ électriciue. II dolt être passlble de cette mansre d'expliquer la grande vitesse d'expulsion des particules a sans supposer qu'elles étaient Initialement en mouvement rapide à l'intérieur de l'atome. D'autres considérattons concernant I'applkatlon de cette t h b r i e à ces quertlons et à d'autres seront réservées à un artkle ultérieur. iorque les principales deductions de la t h b i e auront été vérMées expérimentalement. Des experiences dans ce but m n t en cours, effectuées par Geiger et Marsden.
lo
Nagaoka, Phil. Mag.
w,p 445 (1904).
Chapitre 3
La construction de la nouvelle mécanique
Entre les premières règles de quantificationappliquées par N.Bohr aux spectres d’émission des atomes en 1913 et la construction de la nouvelle mécanique quantique de 1925, un travail considérable d’analyse fut entrepris pour décrire aux enl’ensemble des spectres expérimentaux à l’aide du modèle de Bohr. Le dédoublement de certaines raies spectrales en présence de champs magnétiques, le triplement et le quintuplement d’autree, révélaient une structure fine que la paramétrkation de Bohr s’avérait incapable de déerire. La solution de ce problème en 1925 par P a d lui permit d’avancer d’un pas de géant dans la compréhesion de la structure de la matière. Cette découverte coïncida avec l’avènement de la nouvelle mécanique quantique (1924-1926).
3.1 Le principe d’exclusion et le spin de l’électron.
La condensation de Bose 3.1.1 Le principe d’exclusion Avant 1926, l’année où Born proposa l’interprétation probabiliste de la mécanique quantique, deux découvertes importantea eurent lieu qui contribuèrent à élargir notre connaissance de l’électron et de la structure électronique des atomes : le principe d’exclusion & le spin de l’électron. Le principe d’exdusion, énoneé pap Pauli, fut découvert lors de l’étude des raies spectrales des atomes, en particulier lors de l‘analyse de l’effet Zeeman et d’une formule proposée par Alfred Landé pour un facteur (appelé facteur g de Landé) qui contenait le moment angulaire orbital de l’électron I (dans un atome alcalin, par exemple) et un moment angulaire attribué à une couche d’électrons R qui serait égal à 1/2 pour les atomes alcalins. Pauli montra que l’idée d’un moment angulaire R pour une couche n’était pas correcte ;l’effet Zeeman anormal serait dû à une propriété quantique de l’électron décrite par un nombre quantique susceptible de ne prendre que deux valeurs. De cette façon, Pauli fut amené à proposer que cette propriété ne soit pas restreinte aux atomes alcalins ; il la généralisa à tous les atomes. Il introduisit ainsi, à &té des nombres quantiques connus, le nombre quantique principal n (entier) qui apparaît dans la formule de Balmer-Bohr’ le nombre quantique du moment angulaire orbital !(entier)’ le nombre quantique ml (entier) d’une composante de œ moment, un nouveau nombre quantique mR de l’électron, ne pouvant prendre que deux valeurs +1/2, -1/2.
58
Sources et évolution de la physique quantique
On connaissait alors une règle, la règle de Stoner, suivant laquelle le nombre d’électrons d’une couche définie par une vaieur donnée de n, est égal à deux fois la somme S du nombre de valeurs possibles du nombre quantique mc ; ainsi : pour n = i , I = O ; S=i n=2, I=O,i; S=i+3=4 n=3, t?=O,l,2; S = 1 + 3 + 5 = 9 puisque pour n fixé :
t = O ’ l , . . . n - 1 et n c = -C,-C+
. - l1t
1,. .,C
Pour expliquer la règle de Stoner, Pauli introduisit le nombre mR (aujourd’hui, nous le notons na,) suceptible de prendrelea deux valeurs 1/2, -1/2. Par eonséguent, il y a, pour Pauli, dans l’atome, une duplication du nombre d’états possibles pour un électron dans l’approximation (champ magnétique fort) où l’on peut attribuer les nombres quantiques n, L,mt, mR à un tel électron. Et ce nombre double d’états impose que d a w l’atome il ne peut jamab y avoir deuz électrons Cquivalenis pour lesqueb, en champs fob, les valeurs de tous les nombres quantiques (n,C, mc,mR) coincident. S’il emte un électron dans l’atome pour lequel ces nombres quantiques ont da vaieurs définies dors l’état est occupé ””. C’est le principe d’exdusion. Il s’agit là d’une loi absolument nouveile et inattendue. L’intuition nous dit que si un atome est composé de 2 électrons, son état d’énergie minimale devrait être compod d’électrons occupant tous l’état de plus basse énergie, tous ayant les nombres quantiques n = 1, I = O et m = 1/2 ou -1/2. Le principe de Pauli interdit cela. Si un électron a les nombres quantiques n = 1, I = O, mt = O, r n = ~ 1/2, un deuxième électron, comme dans l’atome d’hélium, ne pourra avoir que les nombres quantiques n = 1, C = O, rnc = O, mR = -1/2. Et d’autres électrons venant occuper des états dans cet atome prendront lea vaieum n = 2, L = O ou 1, etc., c’est-à-dire qu’ils auront au moins un nombre quantique différent de ceux pris par les électrons antérieurs. Ce principe quantique oblige les électrons à occuper des états successifs, et cette suite donne lieu à une croissance du rayon des atomes avec le nombre de leurs électrons. C’est le principe qui établit I’atchitectun atomique.
9.1.2 Le $pin de 1Wectron Ce nouveau nombre quantique fut interprété quelques mois plus tard comme étant le spin de l’électron, conçu par George Uhlenbeck et Samuel Goudsmit30 comme une petite sphère en rotation et ayant par conséquent un moment angulaire Prop=Cette idée de spin avait, d’ailleurs, été déjà conçue par R de Kronig en janvier 1925 dès que celui-ci apprit l’énoncé du principe d’exdusion. il ne la publia pas, car il se soumit à l’autorité de Pauli à qui cette idée ne plaisait pas. Comme le 29
30
Wolfgang Pauli, Zeibchr. f. î h y s . 31, 765 (1925) [Article V, page 631. G. Uhlenbeck et S. Goudsmit, NafuruMsen. lS, 953 (1925) [Article VI, page 781.
La construction de la nouvelle mécanique
59
remarqua Uhlenbeck plusieurs a n n h plus tard : il ne fait p u de doute que Ralph Kronig trouva le premier le p l u important de no8 iddes n31. Après avoir repoussé lldée de spin avancée par de Kronig, Pauli fut néanmoins celui qui donna en 1927 la première description précise de cette variable physique. Comme le spin ne peut prendre que deux valeurs numériques, il chercha une représentation du moment angulaire propre, dam le cadre de la mécanique quantique, mus la forme d’une matrice à d e w lignes et deux colonnes et introduisit ainsi les matrices connues sou8 le nom de matrices de Pauli. L’espace des fonctions d’onde dans lequei sont définies ces matrices est donc p espace où chaque fonction possède deux composantes :
de sorte que le spin 3 s’hait :
où Û est le vecteur des matrices de Pauli
1 (5)
S3 aura dors les deux valeurs possibles, 1/2, -112, caractéristiques du spin de l’électron (de sa composante Oz, exprimée en unités de &).
Cette fonction à deux composantess’appelle un spineur (non-relativiste). Ainsi, l’électron est décrit en mécanique quantique non-relativiste par un spineur de Pauli, qui se transforme suivant une certaine loi lorsqu’on impose que l’équation de Sdirodinger soit invariante par rapport à une rotation. Avec cette théorie de Pauli on abandonne définitivement la r e p b t a t i o n du spin mmme dû à une rotation de l’électron vu a m m e une petite sphère, le spin n’est qu’un moment anguiaire particulier, représenté, comme toute observable en mécanique quantique, par un opérateur linéaire auto-adjoint, et cet opérateur particuüer est indiqué dene l’équation (5).
9.1.9 Le principe de l?indiscernabilitk de particules
identiques L’inàLtuniabdàtC d w patticuled i d c n i i p u est un principe fondamental en mécanique quantique. Il ne n’agit paa d’une tautologie : tandis qu’en physique classique on peut attribuer une trajectoire à une particule et distinguer deux électrons ou 31
G.Uhlenbeck, Phg&s Todq 29, 43 (1976).
Sources et évolution de la physique quantique
60
deux pions en suivant leurs trajectoires, cela n’est pas possible en mécanique quantique. Si un électron passe d’un état initial 11. > à un état find la2 > alors qu’un autre électron passc d’un état (b1 > à un autre état lb >, laibi
>-, Iaib >
la permutation de deux électrons donnera lieu à une transition de la forme
où l’état finalcontiendra un facteur de phase eiu dont le carré absolu est l’identité (du fait que les probabilités d’état sont les carrés absolus des fonctions d’onde, ceiks-ci ne sont détermin& qu’8 un facteur de phase près). On trouve qu’après une nouvelle permutation on doit avoir l’état de départ et donc que :
L’amplitude du processus serala somme des amplitudes partielles (lire de droite à gauche) A =< alblaibi > +eiu < baliaibi > c’est-à-dire, soit
AI =< alblaibi
> + < bzallaibi >
ou :
Al =< albla1bi > - < balla1bI >
Les particules qui obéissent au principe de Pauli ont une amplitude A, antia y m d f r i p e p a t roppori à
leur échange - électrons,quarks, et toutes les particules
8 spin demi-entier. Elles sont appelées femioru et obéissent à la statistique de Fermis1. Ainsi, si les états €inais coïncident 102 >= >, l’amplitude Al s’annulera, la transition est interdite - c’est le principe de Pauli : d e w fermioru ne peuucnt p a occuper le même ébt. Ce prinape est fondamental dans la description de l’architecture atomique et ses applications s’étendent à bus les phénomènes physiques où interviennent des ensembles de fermions. La mécanique statistique qui obéit à ces principes fut élaborée par Dirac et par Fermi. Pauli et Sommerfeld appliquèrent la statistique de Fermi au gaz d’électrons dans un métal. Tandis qu’au zéro absolu un ensemble classique d’éiectrons et d’ions seraient au repos et auraient une énergie cinétique moyenne nulle, un gaz de FermiDirac à l’énergie la plus basse aura tous les niveaux de faible énergie occupés, ce qui détermine l’impuiaion po comme ceile du dernier niveau occupé, m fonction du nombre N d’éiectrons. On détermine ainsi la distribution des éiectrons à cette température et sa Vanation au fur et à mesure qu’augmente la température. La 31
E. Fermi, Rendiconti d.
A c e d . Lincd 3,145 (1926) [Artide VII, page 811.
La construction de la nouvelle mécanique
61
description d u comportement des métaux c o m m e un gaz d‘électrons obéissant à la statistique de Fermi-Dirac fut une réussite. Le principe de Pauli a d’autres cordquences. L’une d’elles est l’existence d’une pression derépulsion entre les électrons qui joue un rôle important en astrophysique : on l’appeiie la pression de Fermi. Dans une étoile de masse M , il existe une attraction gr?vitationnelle entre les masses qui la composent, dont on. peut caiculer l’éner e potentielle en fonction de M et de son rayon Re-l’étoile étant su posée spférique. L’équilibre dans I’étoilq est atteint lorsque I’attracion gravitationnelle est ‘uste compensée par l’éner ie de la pression inverse due à la fusion dea noyaux légers, à travers un ensemhe de réactions nucléaires qui furent anaiysées par H.A.Bethes. Lorsque l’étoile a brûlé tous ses éléments combustibles, la pression de répulsion due à la fusion nucléaire cesse et 1:attraction gravitationnelle reprend sa course, obligeant l’étoile 3t réduire ses dimensions. Si sa masse n’est pas trop gr?nde, son effondrement pourra ëtre arrëté par la pression de Fermi de re ulsion entre les électrons. Elle deviendra ce gu’on a pelle une naine blancle. La masse maximale d’une naine blanche, c est-à-&re la masse au-delà de laquelle l’étoile ne pourra voir sa contraction arrêtée par la répulsion de Fermi entre les électrons, peut être estimée et on trouve la valeur
M e= 1’4 Me
C’est la masse limite de S. Chandrasekhar ui a, le premier, fait ce caicul Al, étant la masse du Soleil. Si la masse de 1’~oiIeest supérieure à la limité
de Chandrasekhar la ression de Fermi des électrons ne pourra paa stopper l’effondrementde les électrons finissent p q transformer les protons en neutrons avec l’émission de neutrinos, par la réaction bêta inverse :
l'étaie,
e-
+p
-
n
+ u.
L’étoile devient une étoile à neutronset la pression de Fermi des neutrons arrête la contraction ultérieurede l’étoile : elle possède dors un rayon très petit (d’une dizaine de km). L’évolution ultérieure de la contraction d’étoiles plus lourdes conduit enfin à la formation de trous noirs. Une autre conséquence du principe de Pauli : l’introduction de la couleur.
Comme les neutrons, les quark3 sont des fermions, et l’amplitude qui décrit un groupe de quarks doit être antisymétrique par rapport à l’&ange de CO, quarks. Au chapitre 6, nous verrollll que tous lea hadrons (particules sur lesquelles s’exerce l’interaction forte) peuvent être décrits par des groupes de 2 ou 3 quarks. Le principe de Pauli exclut donc l’existence de hadrons dont les quarks se trouveraient dans un état -symétrique par rapport à leur échange. Et pourtant on a trouvé expérimentalement des baryons formés de quarks identiques dans des états compiètement symétriquis, comme le A+ uuu, ou le R- sss. La contradiction peut être évitée en introduisant un nouveau nombre quantique, la wuleur, affecté à chaque quark, rendant différent chacun des u du A+ et chacun des s du Sl- : ils peuvent donc occuper le même état puisqu’ils ne sont pas identiques.
-
-
Avant que Bethe ne mette en Cvidence la fusion nudCaire comme source de I’lnergie rayonnée ar le Soleil, bien des hypothèses furent émises sur la nature des interactions reaponsabi>er de cette énergie. Une curieuse approche awociant la nucléosynthèse et la formation des étoiles, fut proposée tout juste après la decouverte de Becquerel par F. R4,
CR 136,393 (1903).
Sources et évolution de la physique quantique
62
9.1.4
La
condensation de Bose
Lorsque deux particules identiques sont déa-ites par des amplitudes telles que
A l , symétriques par rapport à leur échange, elles obéissent à une statistique nouvelle, la statistique de Bose-Einstein - c'est le cas de particules à spin entier, tels les pions, les photons, les molécules à spin entier3'. Dans ce cas là, on voit que, lorsque les états finals coïncident on aura pour la Probabilité de transition laiLi >-+ la2A > devenue lalbi >-+ Icaza2 > (puisque la2
>=
>) : lAz12 = I < azazla~bl>
+ < azazlaib1 > I' =
= 41 < aza2laIbi > 1' Si les deux particules sont différentes,par exemple, un pion : IT > et un méson p : Ip >, nous saurons distinguer la transition < a ~ l x> < p2lp > de la transition < &lx > < a 2 J p> et la probabilité sera la somme des probabilités partielles,
P = I < a21x >< Alp > IZ
+ I c al. >< a2Ip 7 I2
Si les deux états finais coincident on aura :
Ainsi la probabilité de trouver deux bosons identiques dans un même état final est égale à deux fois la probabilité de trouver deux bosons différents dans le même état. La généralisation de ce résultat nous amène à la conclusion que la probabilité qu'un boson Occupe un état dans lequel il existe déjà n bosons identiques est (n i) fois plus grande que si, dans cet état, il n'y avait aucun boson identique ant&eurement. Ou encore : la présence de bosons identiques dans un certain état augmente la probabilité qu'un nouveau boson identique aux premiers occupe le même état. C'est Is condensation de Bose, responsable de phénomènes comme la superiiuidité de l'hélium liquide (He') et la supraconductivité (due à la formation de paires d'électrons, les paires de Cooper à basse température) ; la supraconductivité de l'hélium-3 (qui est un gaz de fermions) étant due à la formation de paires d'atomes He3 à très basse température.
+
34
S.N. Bose, Zeifachr. f. Phgs.
26, 178 (1924) [Article VIII, page 8.51.
Article V
Le principe d'exclusion Sur la connexion entre la saturation des groupes d'électrons dans l'atome e t la structure complexe des spectres WOLFGANG PAULI JR. Zeitschrlft fiir Physik 31, 765-783 (1925) (Springer-Veriag) (reçu le 16 janvier 1925) [traduit par H.Braun et ci. Oberiechtner]
RésumB Millikan et Lande ont constaté qu'Il est possible de représenter le doublet alcalin par une formule relativiste. Partant de ce fait et compte tenu des résultats obtenus dans des travaux précédents, nous en proposons l'interprétation suivante : dans ces doublets et dans leur effet Zeeman anormal se manifeste une ambivalence ( ' I Zweidcufigkeit ") non descriptible classiquement, propriété que la théorie quantique assigne à l'électron de valence : la configuration saturée du reste de l'atome (comme celle des gaz rares) n'est plus le réceptacle du moment angulaire de l'atome, elle n'est pas non plus le slège de l'anomalie magnéto-mécanlque. O n tente ensuite, malgré la difficulté de principe qul s'y oppose, de prendre ce point de vue particulier comme hypothèse de travail provisoire et de pousser ses conséquences aussi loin que possible à d'autres atomes que les alcalins. En premier lieu, on montre que, contrairement à l'interprétation usuelle, ceci permet de calculer pour les deux systèmes, en présence d'un champ magnétique extérieur suffisamment intense pour que l'on puisse négllger les forces de couplage entre l'électron de valence et le reste de l'atome, aussi bien le nombre d'états stationnaires que la valeur de leurs nombres quantiques et de leurs énergies magnétiques, et ceci sans tenir compte d'autres propriétés que celles utilisées pour décrire le reste de l'atome libre et l'électron de valence dans le cas des Alcalins. Grâce à ces résultats. on parvlendra à une classilication génerale de chaque électron dans l'atome a l'aide du nombre quantique principal n et de deux nombres quantlques supplémentaires k1 et &l auxquels on ajoute, en présence d'un champ extérieur, un nouveau nombre quantique mi. A la suite d'un travail récent de E.C. Stoner, cette classification conduit à une formulation générale, en termes de théorie quantique, de la saturation des groupes d'electrons dans l'atome.
Sources et évolution de la physique quantique
64
1.
L a conservation des nombres quantiques (principe de construction) dans l a structure fine e t dans l'effet Zeeman
Dans un article précédent nous avions signalé que l a représentation usuelle, suivant laquelle les couche5 électroniques saturées internes de l'atome participent de manière essentielle sous forme d'un moment angulaire pris par le cœur et en tant que siège de l'anomalie magnéto-mécanique à l a structure complexe des spectres et à l'effet Zeeman anormal, conduisait à de nombreuses et graves difficultés. D'OU la nécessité de substituer à cette représentation une conception opposée, qui attribue en particulier l'origine tant de la structure en doublets du spectre alcalin que de l'effet Zeeman anormal 3 une ambivalence, non descriptible classiquement, caractéristique de la théorie quantique. Cette interprétation s'appuie par ailleurs essentiellement sur l'observation faite par Millikan e t Landé que les doublets optiques des alcalins sont analogues aux doublets relativistes de Rontgen e t que leur grandeur est déterminée par une formule relativiste. En entreprenant d'étendre ce point de vue, comme Bohr e t Coster le firent pour les spectres de Rontgen (" b y o h c "), nous classifierons les etats stationnaires propres de l'électron de valence dans les spectres d'émission des alcalins en utilisant, en plus du nombre quantique principal n, deux nombres quantiques adjoints kl et k2. Le premier, ki (que l'on désigne généralement par k) prend les valeurs 1,2,3 pour les termes 8 , p , d... et varie d'une unité lors des transitions Permises : il mesure l'intensité de l'interaction de la force centrale entre l'électron de valence e t le reste de l'atome. Le deuxième nombre quantique, k2, est, pour les deux termes du doublet (par exemple pl et p) égal à kl 1 e t k1 ; lors des processus de transition, il change de f i ou 0 et mesure la grandeur de la correction relativiste introduite par Landé pour décrire la pénétration de l'électron dans le domaine du reste de l'atome. Avec Sommerfeld, nous definirons de manière générale le nombre quantlque de moment orbital total de l'atome j comme la valeur maximale compatible avec l'etat stationnaire considéré du nombre quantique ml (d'habitude noté rn) définissant la Composante du moment orbital parallèle au champ extérieur, de sorte 1/2. Le nombre d'états stationnaires en présence que pour les alcalins on a = k2 d'un champ magnétique pour ki e t k2 donnés est 2 j 1 = 2k2, le nombre de ces états pour les deux termes du doublet avec k1 donné étant au total égal à 2(2kl 1). Lorsqu'on applique à présent un champ intense (effet Paschen-Back), on peut lntroduire. en plus de k1 e t du nombre quantique ml cité plus haut, e t en lieu et place de ks un autre nombre quantique magnétique m2 derivant directement l'énergie de l'atome dans le champ magnétique, c'est-à-dire égal à la composante du moment magnétique de l'électron de valence parallèle au champ. Pour les deux termes du doublet, il prend les valeurs et Alnsi, de la même manière que dans la structure en doublet du spectre alcalin se manifeste " I'anornu~ie de c o r n f i o n nZafi&fe '' (dont la grandeur est décrite par un autre nombre quantique que celui déterminant l'intensité de l'interaction créée par l a force centrale s'exertant entre l'électron de valence et te reste de l'atome), de même. dans la déviation Zeeman du triplet normal de Lorentz, te produit '' i'unomalk magnéto-mécanique (ob la grandeur du moment magnétique de l'électron de valence est décrite par un autre nombre quantique que celui du moment orbital). Manifestement, l'introduction de ces deux nombres quantiques (effectifs) e t la
-
-
x
...
-
-
-
-
+
9.
I'
Zeitschr. f. Phys. S t , 373 (1925).
-
La construction de la nouvelle mécanique
65
valeur en elle-même formelle g = 2 du facteur de doublement du terme (niveau) 8 des alcalins ont un rapport très étroit avec le dédoublement de ces niveaux. Nous ne tenterons cependant pas d'entreprendre ici une analyse théorlque plus poussée et prendrons, dans les considérations qui suivent l'effet Zeeman comme un fait expérimental. Sans nous soucier pour i'instant des diftïcultés s'opposant à l'interprétation courante et des discusslons que celle-ci entrame, nous allons tenter d'étendre cette classification formelle de l'électron de valence utilisant les 4 nombres quantiques n. ka. k2, ml à des atomes encore plus compliqués que les alcalins. On montre alors que, Contrairement a l'interprétation usuelle, nous pouvons nous baser sur cette classification pour assurer la conservation des nombres quantiques (principe de construction) aussi bien pour la structure complexe des spectres que pour l'effet Zeeman anormal. Selon ce principe, élaboré par Bohr, lors de l'adjonction d'un électron supplémentaire à un atome (pouvant être complètement chargé), les nombres quantiques définissant les états stationnaires des électrons déjà liés conservent les mêmes valeurs que celles qu'ils avalent lorsque le reste de l'atome était libre. Concentrons-nous d'abord sur les alcalino-terreux. Le spectre se compose ici d'un système singlet et d'un triplet. Aux états quantiques ayant une valeur définie du nombre quantique k1 pour l'électron de valence correspond au total un nombre d'états stationnaires égal à 1.(2ki -1) - pour le premier système e t à 3.(2k1-1) - pour le deuxième en présence d'un champ magnétique extérieur. O n a jusqu'ici interprété cela en disant que dans un champ fort, dans tous les cas. les 2kl 1 états correspondaient à l'électron de valence, alors que le reste de l'atome était susceptible de prendre 1 état dans le premier cas, et 3 états dans le second. Le nombre de ces états est manifestement différent du nombre 2 des états du reste de l'atome (terme s alcalin) dans un champ. Bohr désignalt zwung ") qui n'aurait pas d'analogie cet état de choses sous le nom de coercition avec l'action du champ extérieur. NOUS pouvons malntenant interpréter l'ensemble des 4.(2kl - i ) états de l'atome de la manière simple suivante : deux états sont toujours attribués au reste de l'atome dans le champ, et 2.(2k1 - 1) états le sont à l'électron de valence correspondant, comme pour les Alcalins.
-
(I'
Plus généralement, d'après une règle d'embranchement énoncée par Heisenberg et Landé un état stationnaire du reste de l'atome avec N états dans le champ extérleur donne ileu, par adjonctlon d'un électron supplémentaire, à deux systèmes de termes auxquels correspondent respectivement, pour une valeur donnée du nombre quantique kl de l'électron associê, un total de ( N +1)(2ki - 1) états pour l'un et de (N 1)(2kl 1) pour l'autre, en presence d'un champ. D'après notre interprétation, ces 2N(2kl 1) états de l'atome complet dans des champs intenses sont produits par les h' états du cœur de l'atome et les 2(2kl 1) états de l'électron de valence. En admettant la classincatlon avancée par la théorie quantique pour l'électron, la multiplicité des termes demandée par la règle d'embranchement apparaît comme une simple consequence du principe d'édification. En outre, d'après l'interprétation proposée Ici, la '' coenifion " de Bohr ne se manifeste pas par la violation de la conservation des nombres quantiques
'
-
-
-
'
Nous ne discuterons pas Ici des limites de validité de cette règle, ni, en partkulier, de la signification théorique de ce que l'on appelle les termes éliminés, dont l'interprétation suggère, suivant ia règle d'embranchement, qu'Il existe peut-être une différence entre l'état lié et l'état libre du cœur de l'atome. O n devra néanmoins être très attentif aux règles de combinaison qui s'écartent des règles normales.
Sources et évolution de la physique quantique
66
10- d u couplage de l'électron '' en serie " au reste de l'atome, mals par I'amblvalence sp.&ifique que les propriétés de la théorie quantique confèrent aux électrons individuels dans les états statlonnalres de l'atome.
Nous pouvons cependant grâce à cette Interprétation, conformément au principe d'édilicatlon, calculer non seulement le nombre d'états statlonnaires. mals aussi, dans le cas de champs intenses, ies valeurs de l'énergie (la partie proportionnelle à l'intensité du champ) à partir de celle du reste de l'atome libre et de l'électron de valence de manière additive, en extrayant ces dernières des spectres alcalins. C'est notamment ie cas aussi bien de la composante totale du moment angulaire de l'atome parallèle au champ (mesurée en unlté h/27r) que de la composante Xj du moment magnétique de l'atome dans la même direction (mesurée en unités de magnéton de Bohr), qui sont égales à la somme des nombres quantiques ml (respectivement rnz) des électrons individuels :
Dans ces formules, ml et m2 doivent, indépendamment les uns des autres, prendre toutes les valeurs permises par les nombres quantiques de moment angulaire kl et k2 de ces électrons dans l'état stationnaire considéré de l'atome. (La partie de l'énergie de l'atome proportionnelle au champ est alors -oh, où O est la fréquence de Larmor). Prenons par exemple les deux termes en s des alcalina-terreux (terme en S slnglet et terme en s triplet). IIsufiit. en premier Ileu, de ne considérer que les deux électrons de valence, étant donné que la contributlon des électrons restants disparaît complètement dans les sommes (1). Pour chacun de ces deux électrons de valence, il faut, suivant notre définition générale (Indépendance de l'un par rapport à l'autre) prendre les valeurs ml = -1/2,mz = -1 e t ml = i/2,m2 = 1 du terme s des alcalins. D'après (1). nous obtenons donc les valeurs suivantes pour les nombres quantiques et de l'atome entier : r n l = -112 - 112, -112 -I-112, 112 - 112, i ( 2 1/2
-
mz=
-1-1,
-1
+ 1,
+
1-1,
1+1
ou
(correspondant dans le cas des champs faibles a un terme j = 0 et à un terme j = l)3. Pour les termes p.d des alcalino-terreux. le deuxième électron doit, de facon analogue, prendre dans (1) les valeurs rnl, m2 des termes p , d des alcalins, la contribution du premier électron (terme en demeurant inchangée. Plus généralement, la prescription (1) donne exactement les memes résultats que la méthode proposée récemment par
...
s)
'
...
On voit qu'ici deux termes différents doivent être comptés, par rapport à la valeur de l'énergie indépendante de l'intensité du champ, l'un avec mi = -1/2 pour le premier électron, ma = 1/2 pour ie deuxième électron d'une part, l'autre avec rn1 = 1/2 pour le premier, rnl = -1/2 pour le second électron d'autre part. Peut-&tre s'aglt-il ià d'un défaut de la classification développée Ici. On montrera cependant plus loin que, par suite de l'équivalence entre les electrons de valence Interne e t externe, ces deux termes sont identiques.
La construction de lu nouvelle mécanique
67
Lande' pour le calcul des valeurs de l'énergie dans les champs intenses ; cette méthode, comme l'a montré Landé, dome aussi des résultats corrects dans des cas plus compliqués. Ainsi, toujours d'après Landé. elle donne (dans le cas de champs intenses. d'abord) les termes de Zeeman du spectre du néon lorsqu'on suppose que. dans le reste de l'atome, un électron efficace se trouve dans un terme en p (au lieu d'être dans un terme en s comme ci-dessus), et lorsqu'on laisse à nouveau l'électron excité parcourir les termes
s.p,d.f. ..
Ce résultat nous pousse donc à caractériser, en général, chaque électron dans l'atome à l'aide du nombre quantique principal n, deux nombres quantiques auxilialres kl et k2, qu'il s'agisse de plusieurs électrons équivalents ou de couches d'électrons saturées. De plus, nous lmagnerons (dans les cas cités à l'instant), un champ magnetique si fort qu'il soit possible d'attribuer à chaque électron, indépendamment des autre électrons, et en plus des nombres quantique n et kl, les deux nombres quantiques rn1 et rn2 (ces derniers mesurant la contribution de l'électron à l'énergie magnétique de l'atome). L e rapport entre k2 et r n 2 pour kl et rn1 donnés s'obtient à partir des spectres alcalins. Avant d'appliquer cette classification quantique aux électrons des atomes lorsque les couches d'électrons sont saturées, ce que nous ferons au paragraphe suivant, il nous faut encore discuter de manière plus approfondie des difficultés qui s'opposent à I'lnterpretation proposée Ici pour la structure complexe e t les M e t s Zeeman anormaux, alnsi que des limites de leur signlfication. Tout d'abord, cette Interprétation ne donne pas une explication simple de I'exlstence et de la séparation des différents systèmes de termes (par exemple, pour les alcalinoterreux I'cpparition du système singlet et triplet), qui se manifeste également dans la position des termes de ces systèmes et dans la règle des intervalles de Landé. O n ne peut sûrement pas, pour les alcalino-terreux, donner deux explications différentes pour les différences d'énergie des niveaux du triplet, comme dues à l'anomalie de la correctlon relativiste de l'électron excité et à la dépendance de son énergie d'interaction en fonction de l'orientation réciproque de l'électron et du reste de l'atome. Une difficulté de fond encore plus grave est aussi soulevée par la relation entre l'interprétation proposée et le principe de correspondance, lequel est encore le seul capable d'expliquer les règles de sélection des nombres quantiques k1, j et m, ainsi que la polarisation des composantes de Zeeman. En fait, ce principe n'exige pas d'attribuer à chaque électron dans un état stationnaire donné, une trajectoire deflnie avec la préclsion que donne la cinématique normale : mals Il faut quand même qu'à l'ensemble des états stationnaires de l'atome corresponde une classe de trajectoires pourvues d'un certain type de propriétés de périodicité. Ainsi, dans notre cas, les règles citées de sélection et de polarisatlon exigent, d'après le principe de correspondance, un type de mouvement de la trajectoire centrale Comportant une précession, autour d'un axe particulier de l'atome, du pian des trajectoires superposées ; dans le cas de champs magnétiques extérieurs de faible Intensité, s'y ajoute une autre précession autour d'un axe traversant le noyau dans la direction du champ. L'explication dynamique admise jusqu'lcl de ce type de mouvement pour l'électron de valence reposait sur le fait que les forces s'exerçant sur
*
Ann. d. Phys. 76, 273 (1925) ; voir en particulier 52.
L'équivalence supposée ICI entre la septième couche (le reste de l'atome de néon) et un électron recevra une Justification théorique au paragraphe suivant.
68
Sources et évolution de la physique quantique
cet électron n'ont plus la symétrie centrale qu'elles pr&entent pour le reste de l'atome : cette explication semble incompatible avec la représentation des doublets alcalins à l'aide des formules relativistes (et par là meme avec la grandeur de la fréquence de précession correspondante). Une constatation semblable vaut aussi pour ce type de mouvement dans ie cas des champs intenses. Ici naTt donc le dimcile problème : comment peut être interprété, physiquement, l'apparition du type de mouvement de l'électron de valence exigé par le principe de correspondance, indépendamment de sa signification dynamique spéciflque Jusqu'lci admise e t qui ne peut plus guère être maintenue ? A ce problème semble être étroitement liée la question de la grandeur des valeurs des termes de l'effet Zeeman (spécialement ceux des spectres alcalins). Aussi longtemps que ce problème n'aura pas été résolu, l'interprétation que nous proposons Ici de la structure complexe et de l'effet Zeeman anormal ne pourra être considérée comme suffisante pour donner une base physique à l'explication satisfaisante de ces phénomènes, alors même que ceux-ci peuvent, d'une certaine manière, être mieux reproduits par l'interprétation couramment adrnbe. On ne peut exclure, dans le futur, qu'une fusion de ces deux interprétations puisse réussir. Dans l'état actuel de la question, il nous a paru intéressant également de pousser la première interprétation jusqu'au bout de ses conmuences. Dans cet esprit, on comprendra pourquoi nous allons au paragraphe suivant, à titre d'essai, appliquer le point de vue adopté ici comme point de départ sans tenir compte des difficultés qui s'y opposent dans le problème de la saturation des couches d'électrons dans les atomes. Nous n'en tirerons les conséquences que sur le nombre d'états stationnaires possibles de l'atome en présence de plusieurs électrons équivalents, sans nous prononcer sur la position et l'ordre des termes.
2. Une règle générale de la théorie quantique en cas d'apparition d'électrons équivalents dans les atomes il est bien connu que la présence de plusieurs électrons équivalents dans l'atome, c'est-%dire d'électrons totalement équivalents quant aux valeurs de leurs nombres quantiques et de leurs énergies de liaison, n'est possible que dans des conditions spéciales qui sont très étroitement liées aux lob de la structure complexe des spectres. Ainsi, par exemple, chez les alcalino-terreux, l'état normal dans lequel deux électrons de valence sont équivalents correpond à un singlet du terme s. alors que dans les états stationnaires de l'atome appartenant au système triplet, les électrons de valence ne sont jamais lies de façon équivalente, tandis que le plus grand terme en u du trlplet possede un nombre quantique principal supérieur de un à celui de l'état normal. Prenons comme deuxième exemple le spectre du néon. Celul-cl est composé de deux groupes de termes, avec des limites de d r i e s différentes, correspondant à différents états du cœur de l'atome. Le premier groupe, qui appartient à ceux où un électron est extrait du cœur de l'atome avec les nombres quantiques kl = 2, kz = 1, peut être considéré comme compose d'un système singlet e t d'un système trlplet, alors que le deuxième groupe, appartenant à ceux où un électron est arraché du cœur de l'atome avec kl = kz = 2, peut être désigné système Quintet. Les raies de résonance ultra-violettes du comme système Triplet neon n'ont en effet pas encore été observées, mais nul doute que l'état normal du néon
+
La construction de la nouvelle mécanique
69
doive être considéré comme un terme en p en ce qui concerne ses combinaisons avec les états excités de l'atome ; et en vérité. sans équivoque possible, et en accord avec le comportement diamagnétique de la configuration des gaz rares, il ne peut y avoir qu'un Comme les seuls termes p avec j = O sont les seul terme de ce type, le terme j = 0 termes (les plus bas) du Triplet po des deux groupes, nous pouvons en conclure que pour le néon, seuls ces deux termes du triplet existent pour la valeur 2 du nombre quantique princlpal, et que de plus I l s sont Identiques pour les deux groupes de terme. En général on peut donc s'attendre à ce que certslns termes de multlplet des spectres manquent o u corncldent pour des valeurs n e t ki de nombres quantlques prls par des électrons duà prÉrents dans l'atome. Et se repose la question : quelles règles la t h h r i e quantique assigne-t-elle au comportement de ces termes ? Comme il ressort déjà de l'exemple de spectre du néon, cette question est étroitement liée au problème de la saturation des couches d'électrons dans l'atome déterminant les longueurs 2,8, 1 8 . 3 2 des périodes dans le système naturel des éléments. Cette saturation conslste en ce qu'un groupement d'électrons de nombre quantique principal n n'accepte au plus que 2n2 électrons, soit par émission, soit par absorption de rayonnement, soit encore par d'autres influences extérieures. Comme on salt, Bohr introduisit dans sa théorie du système naturel une subdlvlsion de ces groupements d'électrons d'électrons en sous-groupes ; cette théorie présente une synthèse des aspects spectroxoplques et chimiques et, en partie. une justification quantique de l'apparition d'éléments chimiquement semblables, comme les métaux fer e t platine, e t comme les terres rares dans les périodes ultérieures du système. Partant des états stationnaires d'un mouvement central, 11 caractérise chaque électron des états stationnaires de l'atome, par un symbole nk avec k n : il obtient ainsi en général. pour un groupement d'électrons, nombre quantique principal n. n sous-groupes. C'est de cette façon que Bohr a été conduit au schéma de la construction des gaz rares reproduit dans le tableau 1. Cependant, lui-même inslste sur le fait que I'égallté supposée du nombre d'électrons dans les dMérents sous-groupes d'un groupe principal est hautement hypothétique et' qu'une explication théorique totale et satisfaisante de la saturation des couches d'électrons dans l'atome, en particulier une expikation. des longueurs des périodes 2,8, 18, 32 dans le système naturel, ne pouvait être donnée pour l'instant Cependant, un progrès essentiel a récemment éte r é a l i s par les refluions de E.C. Stoner concernant le problème de la saturation des couches d'électrons dans l'atome. Cet auteur propose, tout d'abord, un schéma pour la construction de l'atome des gaz rares dans lequel, contrairement à Bohr, aucune sous-couche saturée ne peut s'ouvrir par adjonction d'autres électrons du même groupe principal. de façon à ce que le nombre d'électrons dans une sous-couche saturée ne dépende que de la valeur de k. e t non de la valeur de n,c'est-à-dire de la présence d'autres sous-groupes du m€me groupe principal. Cela représente déjà. en sol, une grande simplification qui, de plus, permet de rendre
-<
'.
Comme on l'a déjà dit, la valeur de j ici e t presque partout dans la suite, sera définie comme la valeur maximale de mi. 'I Voir N. 80hr, Orci Aufjdfze über Spektra und Atombau (Trois artides sur les spectres e t la structure atomique) 2. Aufi. Braunxhweig 1924, Anhang.
*
Phil. Mag. 48, 719 (1924). La nouvelle édition du livre de Sommerfeld "Atombau und Spektfallnkn" (Structure atomique e t raies spectrales) fait déjà allusion à cet important article.
Sources et évolution de la physique quantique
70
compte de dlfférents faits expérimentaux. Afin de rester en harmonie avec les nombres d'électrons empiriquement connus des atomes des gaz rares, il faut alors admettre, dans l'état saturé des sous-groupes concernés,pour k = 1. deux ; pour k = 2, six : pour k = 3, dix, e t en général, pour une valeur %, 2(2k i) électrons. stoner remarque en outre que ces nombres d'électrons correspondent au nombre d'états stationnaires des atomes alcalins dans un champ extérieur pour une valeur donnee de k. c'est pour cela qu'il continue à poursuivre l'analogie avec les états stationnaires des spectres alcalins en admettant une subdivision ultérieure (comme le veut la structure d'assemblage de ces spectres, e t des spectres X), du sous-groupe en deux sous-groupes partiels caractérisés par les deux nombres kl,kz, où k1 correspond au nombre de Bohr k e t ob t i pose kz = k1 1. ou kz = k1 (cependant pour hi, = 1, i'unlcité du terme s donne kl = 1). Conformément au nombre 2k.z des états stationnaires, dans lequel se décompose un état stationnaire des atomes alcalins pour certaines valeurs des nombres quantlques k1 e t kz dans le champ extérieur, Stoner admet 2152 électrons dans le sousgroupe partiel saturé correspondant aux nombres quantiques n, kl et kz. Le schéma pour la construction des gaz rares auquel Stoner aboutit de cette facon est repreenté sur la tableau 2. Nous pouvons donc maintenant préciser et généraliser cette représentation de Stoner en appliquant l'Interprétation de l a structure d'assemblage des spectres et de l'effet Zeeman anormal dlscut& au paragraphe précedent au cas où sont présents des électrons équivaients. Supposant vérifiée la conservation des nombres quantiques, nous sommes arrlvés à caractériser chaque électron dans l'atome, en plus du nombre quantlque principal n, par les deux nombres quantiques secondaires kl e t kz. Dans des champs magnétiques Intenses, il s'y raJoute encore pour chaque électron un nombre quantique de moment orbital ml et, en plus de kl e t ml on peut utillser à la place de 62 un nombre quantique mz lié au moment magnétique. Nous voyons tout d'abord, que l'utilisation des deux nombres quantlques k1 e t kz pour chaque électron est en accord parfait avec la subdivision à la Stoner des termes en s des sous-groupes de Bohr Ainsi, en considérant le cas de champs magnétiques Intenses. nous pouvons ramener îe résultat de Stoner d'aprës lequel le nombre d'électrons dans une souicouche saturée coïncide avec le nombre des termes correspondants de l'effet Zeeman des spectres alcalins, à la regie générale concernant la présence d'electrons équivalents dans l'atome : I Ine peut jamais exister dans l'atome deux ou plus de deux électrons Bquivalents, pour lesquels dans des champs Intenses les valeurs de tous les nombres quantiques n, kl, ks, ml (ou, ce qui est pareil. n. kl, mi, mz) coïncident. SI un électron est présent dans l'atome pour lequel ces nombres quantlques (dans le champ extérieur) ont des valeurs définies, cet état est alors " occupé On ne doit pas perdre de vue que, dans cette rëgle, le nombre quantlque principal n a un role capital ; il va de sol que dans l'atome plusieurs électrons (non équivalents) peuvent etre présents avec des valeurs des nombres quantiques kl, k?, ml qui cohcldent,
-
-
'.
".
'
Cette subdivision e t le f a i t de savoir SIle nombre d'électrons dans chaque partie des sous-groupes a aussi un sens pour les couches saturées d'électrons découlent dlrectement du constat de Millikan et de Landé sur les doublets relatlvistes des spectres de Rontgen. Ces nombres prennent une si nification évidente iorsqu'on exprime l'énergie du groupe tout entier en fonction du nom%re d'arrangements comme le facteur du nombre d'occupations (à travers k1) et de la correctlon relativiste (8 travers k2) dans l'expression due à Moseley e t Sommerfeld.
La construction de la nouvelle mécanique
Tableau 1. Schéma original de Bohr pour la configuration des gaz rama Nombre d’électrons n i Element
pgk: 11 21
Helium
2
2
-
Néon
10
2
4
Argon
18
2
4
Krypton
36
2
4
Xenon
54
2
4
,Emanation
86
2 4
71
Sources et évolution de la physique quantique
72
mais qui se différencient par la valeur du nombre quantique principal n. II ne nous est pas possible de donner une justification plus profonde de cette règle, mals elle semble se présenter de façon toute naturelle. Elle se rapporte tout d'abord, comme nous l'avons mentionné, au cas de champs Intenses. Pour des raisons de thermodynamique (invariance des poids statistiques lors de transformations adiabatiques du système) lo, le nombre des états stationnaires de l'atome pour des valeurs données des nombres kl e t k2 pour les électrons individuels. et de l a valeur de mi = [voir (I)] pour l'atome entier dans des champs intenses et faibles doit colncider. C'est pourquoi il est également possible, dans ce dernier cas, de faire certaines amrmations sur le nombre d'etats stationnaires e t les valeurs correspondantes de j (en fixant par avance le nombre des électrons équivalents appartenant aux différentes valeurs de k l e t 4). On peut alors évaluer le nombre des possibilités de réalisation des différentes couches saturées d'électrons et la question soulevée en début de paragraphe concernant le manque ou la coincidence de certains termes de multiplets dans les spectres pour des valeurs du nombre quantique principal pour lesquelles plusieurs électrons équivalents sont présents dans l'atome, peut être r h l u e de façon analogue e t pour chaque cas individuel. Nous ne pouvons cependant nous prononcer que sur le nombre de termes et les valeurs de leurs nombres quantiques, non sur leur grandeur ni sur les rapports des intervalles". II nous faut maintenant montrer que les conséquences de cette rêgle s'appliquent aux cas les plus simples de notre expérience. Cette règle fait-elle aussi ses preuves dans des cas plus compliqués ? Des modifications de cellecl s'avèreront-elles nécessaires ? Attendons pour le savoir les prochaines analyses de spectres plus compliqués. Observons tout d'abord que le résultat de Stoner e t donc la longueur des périodes 2, 8, 18, 32, dans le système naturel sont directement contenus dans notre règle. II ne peut donc évidemment avoir dans l'atome, pour k 1 e t kz donnés, plus d'électrons équivalents que n'en donne le nombre de valeurs pouvant être prises par rnl (à savoir 2kz) e t chacune de ces valeurs de m l ne peut etre celle que d'un électron. Deuxlëmement, IIen r e u l t e que notre règle a comme consequence directe l'absence du terme en 8 dans le triplet avec le même nombre quantique principal que l'état fondamental des akalino-terreux. Car lorsque nous analysons les possibilités pour la liaison équivalente de deux électrons dans le terme 8 (nous avons donc ici hi1 = 1, de même kl ne peut prendre que la valeur 1). alors dans les champs Intenses, selon notre rbgle, sont exclus les cas où les deux electrons ont ml = 1/2, ou celul OU les deux électrons ont m l = -1/2 ; id on ne peut avoir que le premier électron avec m l = 1/2 et le deuxième avec rn1 = -1/2. ou inversement12, de sorte que le nombre quantique ml = ml de l'atome total ne peut prendre que la valeur O. La valeur j = û est aussi la seule possible dans le cas des champs faibles ou en l'absence de champ (terme singlet
Cm1
-
-
s).
lo
Cette Invariance est Indépendante de la validlté de de la mécanique classique vis-à-vk de cette transformation. l1 Note : dans un article paru au moment des correctlons, A. Sommerfeld (Phys. ZeltKhr.. 26,70 (1925)) discute en partkulier de l a question de l'état normal d'un atome en relation avec le résultat de Stoner. l2 Le cas Inverse correspond b un échange entre les deux électrons équivalents, e t ne fournit donc aucun fXat stationnaire nouveau (voir la note 1 en page 5). Dans cette matérialisation du doublement des états quantiques considérés, on tient compte du fait que le poids statistique doit être multiplié par deux, en considération de l'échange possible entre les deux électrons (voir là-dessus les consldératlons de Stoner sur les poids statistiques dans l'article cité).
La construction de la nouvelle mécanique
73
Nous analyserons donc le cas où un électron est arraché à une couche saturée, comme cela arrive dans les spectres de rayons X. De toute évidence, ie cas ob un électron est absent dans l'un des sous-groupes partiels de Stoner est toujours possible, lorsqu'aucun électron correspondant à la valeur de mi n'est présent : nous appelerons cette valeur la I' valeur de lacune Les autres électrons se répartiront alors de façon évidente entre les autres valeurs de m1 de telle manière qu'à chacune de ces valeurs est assigné un électron. L a somme de ces autres valeurs e t donc le nombre quantique mi de l'atome entier est alors évidemment égal et OPPOSI! à la valeur de lacune de mi. Laissons m1 prendre toutes les valeurs possibles, et considérons que l'on peut enlever un électron de chaque sous-groupe partiel : nous voyons alors que, dans le cas de champs Intenses. I'ensembk des valeurs de lacune de ml et par suite celle des valeurs de mi est le même que celui des valeurs de ml pour un seul électron. A cause de l'invariance des poids statistlques, II résulte que, même dans le cas de champs faibles, le nombre d'états stationnalres et des valeurs j des couches saturées, une fois ionisées (spectres X), est égal à celui des spectres alcalins, comme l'expérience le montre.
".
Ceci est un cas partkulier d'une loi générale de réciprocité. A chaque configuration d'électrons, correspond une configuration réciproque, dans laquelle les " valeurs de lacune " de mi e t les valeurs d'occupation de ml sont interchangées. Cette échange peut concerner un sous-groupe partiel individuel, sans changement de configuration des autres sous-groupes partiels, ou un sous-groupe de Bohr. ou un groupe principal entier, étant donné que les sous-groupes partiels pris individuellement sont totalement indépendants les uns des autres en ce qui concerne les configurations possibles. Les nombrer d'é/ectrons des deux configurations co&gueeJ se complètent l'un l'autre pout donner le nombre d'électrons dans l'état saturé du groupe (ou du sous-groupe) considéré, a l o n que les valeurs j des deux configurations sont égales. Cette dernière considération résulte du fait que la somme des valeurs de lacune de mi d'une configuration est toujours égale e t oppos& a la somme des valeurs des valeurs mi occupées. C'est aussi pour cette raison que les nombres quantiques de l'atome entier de configurations conjuguées sont égales et opposées l'un l'autre. Puisque les valeurs j ont été définies plus haut comme les différentes llmltes de i'ensemble des valeurs K. II en r&ulte, à cause de la symétrie de cet ensemble par rapport à la valeur zéro, leur égaiiié dans ce cas (voir les exemples d k r i t s ci-dessous). Ce théorème de réciprocité ramène les conditions exlstant à la fin d'une période du systême naturel à celles du début d'une période. dans une certaine mesure. Mais IIfaut souligner que cela vaut surtout pour le nombre d'états stationnaires des couches concernées et pour 1es.valeurs de leurs nombres quantiques. Nous ne pouvons rien dire au sujet de la grandeur des valeurs de l'énergie ni de celk des intervalles la. Comme autre application de notre règle à des cas partkuiiers, nous allons étudler le remplissage progressif de la couche à huit électrons. 00 aucun électron de nombre quantique prindpal k > 2 n'est pr-nt dans l'état normal. C'est egalcment un nouvel exemple du théorème de réclprodté évoqué ci-dessus. La l i a b n des deux premiers +trans de cette couche a déjà été discutée, et nous supposerons maintenant, par raison de slmplkité. qu'aucun des deux électrons ne sera enlevé du sous-groupe k = 1. celui-ci l3 c'est une conséquence de l'égalité entre la multlplldté des valeurs de rnl dans un sens ou dans l'autre, puisque., même dans le cas des champs faibles. les sommes g vont toutes deux jusqu'au meme e t comportent toutes deux les mêmes termes.
74
Sources et évolution de la physique quantique
étant donc saturé (d le schéma de Stoner ci-dessus). D'après Stoner, donc, dans les éléments qui se suiventjusqu'à saturation de l a couche de5 8 électrons (du Bore au néon, par exemple), dolt toujours figurer un terme en p , ce qul est en accord avec I'expérlence Jusqu'à aujourd'hul. En particulier, le spectre de doublet qui suit. semblable à celui des alcalins, correspond à la liaison du trolslème électron de la couche des huit, et, dans l'état normal, le terme en s de même nombre quantlque principal est supprimé. Nous pouvons donc passer Immédiatement à la liaison du quatrième électron de la couche à 8 électrons. comme elle apparaft par exemple dans le spectre d'arc du carbone non encore analysé e t dans le spectre d'arc du plomb qui, lui, est partiellement analysé. Selon la règle de branchement de Landau-Heisenberg ( d le 8 précédent), le spectre correspondant devrait en général avoir la meme structure que celui du néon, à savoir être compos4 d'un groupe Singlet-Triplet, e t d'un groupe Triplet-Quintet avec des limites de série différentes, correspondant aux termes des doublets 2p1 e t 2pz des lons considér6~'~. Nous voulons cependant montrer que, d'après notre règle ces spectres, contrairement à la structure analogue attendue pour leurs états excites. doivent se différencier notablement, en ce qul concerne le nombre et la valeur de j des termes en p du nombre quantique maximal (pour C n = 2, pour Pb n = 6), du spectre du Ne, 00, à part l'état normal avec la valeur j = O, aucun autre terme en p n'existe avec le nombre quantique principal n = 2, comme nous l'avons mentionné au début de ce f. Nous avons ICI distingué trois cas, correspondant au nombre d'électrons des deux sous-groupes partiels avec kl = 2,kz = 1 e t avec kl = 2,kz = 2. dans lesquels nous devrons placer les deux électrons (les deux premiers électrons devant &tie liés, comme convenu, par des termes en 8 k~ = kz = 1). a) Deux électrons équivalents nil. Pour ces sous-groupes, ml peut seulement prendre deux valeurs ml = f1/2, conformément au terme p l des alcalins. On est Ici dans le cas considéré saturé avec El = O e t j = O. b) Un électron n z l e t un électron nzz. Pour ce dernier sous-groupe. conformément au terme p des alcalins, ml peut prendre les quatre valeurs f 1 / 2 , f 3 / 2 , et celles-ci pourront être combinées à volonté aux vaieurs ml = f1/2 déjà indiquées pour le premier électron, étant donné que les deux électrons se trouvent dans deux sous-groupes partiels dlfférents, e t par conséquent ne sont pas équl~alents'~.Nous avons donc :
ml = (-3/2,
+
-1/2,1/2,3/2) (-1/2,1/2) = f ( 3 / 2 1/2), f ( 3 / 2 - 1/2), f ( 1 / 2 = f 2 , f l , f l , O, o.
+
+ 1/2),f(1/2 - 1/2)
l4 L'analyse incomplète des spectres concernés ne permet pas encore aujourd'hul une vérification définitive des prédktions théoriques ci-dessus. A. Fowler a récemment trouvé (Ploc. Roy. Soc. 107, 31, 1925) dans le spectre de l'azote (Nt) des termes Singlet e t Triplet à c8té des termes manquants (sur l'apparition desquels la théorie ne nous permet pas encore de dire quoi que ce soit). De plus, Kless (Sclence 60, 249 (1924)) trouva dans ce spectre un terme Quintet. Ces résultats, qui se referent aux passionnants états du Nt , ne contredisent en aucune façon les prédictions théoriques. Pour la même raison, on doit compter séparément le cas ml = +1/2 pour le premier, ml = -l/Z pour le deuxleme électron, et le cas ml = -1/2 pour le premier, ml = +1/2 pourle second. Voir la quatrième note de l'article.
La construction de la nouvelle mécanique
75
O n voit immédiatement que les termes se séparent en deux parties, l'une avec mi 5 2 e t i'autre avec mi 5 1. Dans le cas d'absence de champ, ces deux parties correspondent à deux termes-: un terme avec j un terme avec j
=2 = 1.
c) Deux électrons équivalents razz. Dans ce cas, les valeurs de ml des deux electrons doivent être différentes, suivant notre règle, et nous obtenons les valeurs possibles suivantes pour mi :
ml = *(3/2
+ 1/2), f ( 3 / 2 - 1/2), f ( 3 / 2 - 3/2), f ( 1 / 2 - 1/2)
= *2, f l , O, o. II en résulte, en présence d'un champ magnétique, un terme avec j un terme avec j
=2 = O.
En résumé. nous obtenons pour une couche à quatre électrons, cinq termes en p différents avec le nombre quantique maximal, soit deux avec j = 2, un avec j = 1 e t deux avec j = Nous ne pouvons faire aucune prédiction concernant la grandeur de ces termes, ainsi que les rapports des intervalles. Par contre, il nous est possible de donner quelques indications sur les séparations attendues par effet Zeeman pour ces termes. En introduisant les valeurs de mz appartenant aux valeurs rnl indiquées cl-dessus pour l'électron individuel (celles qui sont à considérer pour l'effet Zeeman dans le cas des champs intenses). on arrive, suivant ia prescription (1) à la table suivante qui donne les séparations Zeeman des cinq termes en p de la couche à quatre électrons dans le cas de champs intenses.
o.
-
mi
-2
E5j
-3,-2
-1 -2,-1,-1
O O,O,O,O,O
II en résulte
c g 2 = 512, gi = 312 l6
A. Landé, Ann. d. Phys. 1925, 1. c.
1 -1,-1,-2
2 2,3
Sources et évolution de la physique quantique
76
Une vérification de ce résultat théorique pour la couche à quatre électrons est facilement réalisable dans le cas du plomb. Ici, les quatre termes en p o n t été mis en évidence par des observations, alors que l'existence d'un cinquième terme (en p ) est encore douteuse". Des résultats de E. Back non encore publMs de mesure de l'effet Zeeman de quelques raies du plomb rendent en outre très probable que les valeurs de j (2,2,1,0) soient dévolues aux quatre termes en p cités en premier, et que les valeurs de g soient aussi en accord avec les valeurs théoriques attendues'*. Revenons une fois encore à la discussion concernant la construction progressive de la couche à hult électrons. A l'alde du théorème de réciprocité que nous appliquons au sous-groupe de Bohr avec k = 2 contenant délà dans son état saturé six électrons, nous pouvons, à partir des résultats obtenus pour la couche des quatre, trouver directement le nombre de possibilités de réalisation de la couche des six (quatre électrons avec k 1= 2, comme cela se réalise pour l'oxygène par exemple. Les cas a).b),c) de la couche des quatre électrons se transposent aisément à ceux de la couche des six avec cette proposition : a) Quatre électrons équivalents n22 (deux places vides dans ie groupe n2l). Ce sous-groupe partiel est saturé ; nous avons donc, comme en a) ci-dessus, un terme avec
-
j=O. b) Un électron n21, trois électrons équivalents n22 (une place vide dans le sousgroupe raz', une place vide dans ie sous-groupe n22. Comme ci-dessus : un terme avec j = 2
un terme
avec j
= 1.
c) Deux électrons équivalents n21, deux électrons équivalents n22 (deux places vides dans le sous-groupe n22) L e premier sous-groupe partiel est saturé. Comme ci-dessus : un terme avec j
=2
un terme avec j
= O.
Nous nous attendons donc, pour l'oxygène par exemple, à avoir cinq termes en p avec les nombres quantiques principaux les plus petits. On n'a jusqu'ici observé que trois l7
V. Thorsen. Natumissenschafiefl 11.78 (1923) ; W. Gottrian, Zeitschr. f. Phys.
18. 169 (1923). Ces Indications m'ont été fournies grâce à la courtoisie de Mr Back, qui m'a aimablement permis de prendre connaissance des résultats de ses mesures bien avant leur publication. C'est pourquoi 'aimerais lui dire d'ici un chaleureux merci. Mr Back publiera sous peu en un autre endrdt l'ensemble de ses mesures concernant le problème capital
de la confi uratlon des termes dans le spectre du plomb. Remafquc%rs de la correction des épreuves: les configurations des termes des spectres du plomb et de l'étain ont été a n a m sur ces entrefaites par Fri. Sponer, e t ses principaux résultats présentés à la rCunbn de la Société R ionale de Basse Saxe, à G6ttlngen le 9 février (1925, N I T ) . Pour l'étain, on trouve $ nq t e r m p avec la valeur maxlmak du nombre quantique prlncipal, et les valeurs de J correspondant exactement aux valeurs théoriques attendues. Pour le plomb, les valeurs de j obtenues des quatre termes p connus ks plus importants coïncident avec ceux donnes dans ie texte. L'existence d'un cinquième terme p avec = O, comme celui present dans ie cas de l'étain, peut aussi s'appuyer sur le spectre plomb.
7
du
La construction de la nouvelle mécanique
77
termes de ce type, avec en effet les valeu? j = 2,1,0". II faut attendre pour savoir s'il sera possibk de déduire des expériences les deux autre termes en p des nombres quantiques principaux conccrnCs, ou si notre règle devra ctre modMée dans ce cas. Aucune observation expérimentak n'existe encore pour la couche des cinq (3 électrons avec kl=2), et c'est pourquoi nous ne voulons pas donner le résultat de la discussion, laquelle suivant notre règk devrait conduire à cinq termes en p , dont un avec j = 5/2, trois avec j = 3/2,e t un avec j = 1/2. Pour les couches de sept réalisées dans les spectres de rayons X, les termes se trouvent ressembler à ceux des alcalins, comme cela a déjà été mentionné. Nous ne voulons pas discuter d'autres cas spéciaux avant qu'il n'existe d'observations experimentales plus complètes. Mais à partir des uernples traités, Il devrait être clair que notre règle permet de répondre sans équivoque dans tous les cas à la question des réalisations possibles des dlfférentes couches pour un nombre donné d'électrons équivaients. C'est uniquement jusqu'id dans les cas simples que l'on a p u constater que les r a u i t a t s ainsi obtenus sont en accord avec l'expérience. En générai, on dolt encore remarquer que les considérations effectuées ici concernant le passage de champs forts aux champs faibles (ou des champs qui disparaissent) reposent en principe sur l'invariance des poids statistiques des états quantiques. En ce qui concerne l'existence d'un rapport entre le problème de la saturation des groupes d'électrons dans l'atome avec le principe de correspondance, comme l'a supposé Bohr, les reultats obtenus jusqu'id ne semblent pas en fournir d'lndlce. Le problème d'une meilleure Justffication de la règle générale, prlse ici comme base, traitant de l'apparition d'électrons équivalents dans l'atome ne pourra être réellement pris en compte avec succès qu'après un approfondisement plus pousSe des principes de base de la théork quantique. Hambourg, Institut de Physique Théorique.
*'
J.J Hopfield, Astrophys. Journ. 69, 114. 1924 : O. Laporte. Naturwks. 12, 598, 1924. Voir aussi A. Sommerfeld, Atornbau und Spektralilnkn. 4' édition, 1924, chap. 8. pp 598 e t 599.
Article VI
Le spin de l'électron Remplacement de l'hypothèse d'une contrainte non mécanique par une présomption relative au comportement interne de l'électron individuel
G.E.UHLENBECKet S.GOUDSMIT Naturwissenschaft
13,953-954 (1925)
(Springer-Verlag)
(17 octobre 1925) [traduit par G. Frick]
1. O n décrit habituellement de manière complète la structure et le comportement magnétique des spectres ZI l'aide du modèle de Landé et des quantités R,K,J et m l . Ici R représente le moment cinétique de l'atome restant c'est-à-dire, de l'atome sans l'électron de valence - K le moment cinétique de l'électron de valence, 7. leur résultante et rn la projection de J sur la direction d'un champ magnétique extérieur, toutes grandeurs exprimées dans les u n i t e quantiques usuelles. On doit de plus admettre dans ce modèle : a) que, pour l'atome restant, le rapport du moment magnétique au moment mécanique est le double de ce qu'on attendait d'une description classique. K2, J2,il convient de remplacer ces b) que, dans les formules où apparaissent RZ, quantit6s par R' $,I<' - f (la Moyenne de Heisenberg) Ce modèle s'est révélé particulièrement fécond et a conduit, entre autres, à la résolution des spectres les plus complexes.
-
-
- i,J'
'.
2. On se heurte cependant à des diflcultés dès que l'on essaie de confronter le modèle vectoriel de Landé à nos représentations de la construction des atomes à partir des électrons. Par exemple : a) Pauli a déJà montré que pour les alcalins, l'atome restant doit etre neutre d u point de vue magnétique, sinon l'influence de la correction relativiste devrait faire dépendre l'effet Zeeman de la charge du noyau, dépendance qui n'est pas observée dans ces spectres.
'
Voir E. Back et Landé, l'effet Zeeman et la structure en multiplet des raies spectrales.
W. Heisenberg, Zeitschr. f. Phys. 26, 2 9 1 (1925). W. Paul1 Jr, feitschr. f. Phys. 51,373 (1925).
79
La construction de la nouvelle mécanique
b) Dans le modèle de Landé, on ne doit pas identifier le moment cinétique de l'atome restant avec celui de l'ion positif, comme on pourrait l'attendre de la définition de l'atome restant. D'où le concept de-contralnte (Zwang) non mecanlque proposé par Landé et Heisenberg I . c) Dans certains spectres (ex : vanadium, titane) récemment analysés à l'aide du schéma de Landé, la valeur K du terme fondamental ne correspondait pas à celle que l'on pouvait attendre à partir d u système périodique de Bohr-Stoner.
3. Les dimcultés énumérées ci-dessus pointent toutes dans la même direction, à savoir que la signification que l'on attribue aux vecteurs de Landé n'est vraisemblablement pas la bonne. Pauli a déjà emprunté une nouvelle direction t o u t spécialement liée à la dimculté (a). D'où sa proposition que, pour les alcalins, tous les nombres quantiques se rapportent au seul électron de valence. Suivant Pauli, dans un champ magnétique, chaque électron se voit attribuer 4 nombres quantiques indépendants. A l'aide du principe de construction de Bohr e t de quelques autres propositions générales, l'auteur pouvait de manière simple arriver aux memes résultats que Landé Les difficultés mentionnées en $2 disparaissent complètement dans l'approche de Pauli. La relation avec le système périodique de Bohr-Steiner est établie. et de nouvelles perspectives sont ouvertes
'.
'.
4. Dans les deux approches cependant, des doublets relativistes dans les spectres X et les spectres des alcalins posent encore problème. Pour éluclder cet état de fait, on a été conduit ces derniers temps à admettre une ambivalence (Zweideutlgkeit) pour les propriétes quantiques de l'électron, une propriété qui ne peut être décrite classiquement8. 5. Pour nous, une autre voie parait encore ouverte. Pauli ne s'assuJetit pas à un modale. Les 4 nombres quantiques attribués à chaque électron ont perdu leur signification originelle liée à la représentation de Landé. II convient donc d'attribuer en plus à chaque électron caractérisé par 4 nombres quantiques, 4 degrés de liberté. O n pourrait alors donner à chaque nombre quantique la signification suivante : n et k sont comme touJours jusqu'ici les nombres quantiques prlnclpal et azimutal de l'électron sur son orbite, à R on associera toutefois une rotation propre de l'électron Les autres nombres quantiques conservent leur ancienne signification. Dans notre representation, les approches de Landé et de Pauli conjuguent leurs avantages lo. L'électron doit maintenant répondre des propriétés encore inexpliquées (décrites en $1 a), propriétés que Landé attribue à l'atome restant. Un développement quantitatif de cette
-
'.
Voir E. Back e t A. Landé, op cité pp 55. 5
w. Pauli Jr, Zeitschr.
r.
phys. 51. 765 (1925).
Comparer : S. Goudsmit, Zeitschr. f. Phys. 53, 794 (1925) ; W. Heisenberg Zeitschr. f. Phys. 52, 841 (1925) ; F. Hund Zeitschr. f. Phys. 5 5 , 345 (1925).
' *
Voir W. Pauli'Jr, Zeitschr. f. Phys. 51, 765 (1925). W. Heisenberg Zeitschr.
L
Phys. 52, 8 4 1 (1925).
On remarquera que les nombres quantiques de l'électron qui apparaissent ici sont
ceux que l'on tire du spectre des alcalins. valeur 1(dans la normalisation de Landé).
R
ne prend alors pour chaque électron que la
lo Elle rend aussi plus compréhensible la signification du schéma 111 de Helsenberg, où l'on est amené à combiner les R et les K de l'électron pour l'atome dans son entier.
Sources et évolution de la physique quantique
80
représentation devra très fortement dépendre du cholx du modèle de l'électron. Ann de respecter les faits, on dolt Imposer à ce modèle les conditions suivantes : a) Le rapport du moment magnétique de l'électron à son moment mécanique doit être deux fols plus grand que pour son moment orbital 'I. b) Les différentes orlentations de R par rapport au plan de l'orbite (ou K) dolvent permettre d'expllquer les doublets relativistes, peut-être en reiatlon avec le précepte de moyennement avancé par Heisenberg e t Wentzel 12. lnstltuut voor Theoretische Natuurkunde, Leyde
Je me dois de signaler que le Prof. W. J. de Haas m'a montré, il y a déjà quelques mols, un appareil destiné à une expérience très Intéressante, qui se rapporte également au problëme de la rotation Interne de l'électron. Blen que les Idées du Prof. de Haas me fussent connues depuis quelque temps, MM. Uhlenbeck et Goudsmlt n'en avaient aucune connalssance Iwsqu'lls m'ont récemment communiqué les réflexions ci-dessus. Paul Ehrenfest
Par exemple, pour un électron de forme sphérique. porteur d'une charge supeflclelle en rotation, on établit, en partant de la formule d'Abraham (Ann. O. Phys. io, 105 (19031) : . L'énergie de rotatlon étant le rayon de l'électron)
__
donc pv =
L e moment magnétique : 0 =
i$
La masse : m = 2 e'
3;ro
soitk=&=2x& ce q u k t en réalit6 le double de la ValeUr Correspondant au mouvement orbital. O n remarquera cependant que, si l'on quantiie ce mouvement de rotation. la vitesse périphérique de l'électron dépasserait largement la vitesse de la lumière. W. Heisenberg loc. cit.. G. Wentzel, Ann. d. Phys. 76. 803 (1925).
Article VI1
La statistique des fermions Sur la quantification du gaz parfait monoatomique ENRICOFERMI Rendiconti della Accademia dei Lincel3,
145149 (1926)
Note présentée par M. Carbasso [traduit par C. Matteuzzi]
1. En thermodynamique classique, on prend pour chaleur spécifique à volume constant d'un gaz parfait monoatomique (en se référant à une seule molécule) c = 3k/2. Mais il est clair que si l'on veut, même dans le cas d'un gaz idéal, admettre la valldité du principe de Nernst, il faut noter que l'expression de c précéâente n'est qu'une approximation pour les hautes températures, e t qu'en réalité c tend vers zéro lorsque 2' = O, de sorte que l'on peut étendre lusqu'au zéro absolu l'intégrale exprimant la valeur de l'entropie et lever I'indétermlnation de la constante [d'intégration]. Et pour se rendre compte de la manière dont peut se produire cette variation de c, il est nécessaire d'admettre que les mouvements du gaz parfait doivent eux aussi etre quantiflés. On comprend donc qu'une telle quantification ait une influence non seulement sur le contenu en énergie du gaz, ma& encore sur son équation d'état, et donne ainsi lieu à ce que l'on appelle les phénomènes de dégénérescence du gaz parfait à basses températures. Le but de ce travail est d'exposer une méthode permettant d'effectuer la quantification du gaz parfait qui =It, à notre avis, la plus indépendante possible d'hypoth&es non justifiées sur le comportement statistique des molécules du gaz. Reemment ont eu lieu plusieurs tentatives pour arriver à établir l'équation d'état du gaz parfait Les formules données par différents auteurs e t la nôtre ne dimrent entre elles et de l'équation d'état classique que pour les três basses températures e t pour les densit& assez élevées. Malheureusement, ce sont justement les circonstances 00 les écarts entre les lois des gaz réels e t celles des gaz parfaits deviennent particuierement importantes ; et comme, dans les conditions que l'on peut facllement réaliser experlmentalement, les écarts par rapport à l'équation d'état pv = 12' dus à la dégénérescence du gaz, blen qu'en aucune façon négligeables, sont toujours plus petits que ceux qui sont dus au caractère réél e t non parfait du gaz, les premiers ont Jusqu'à maintenant été masqués par les derniers. Mais il n'est aucunement exclu qu'avec une connaissance plus approfondie des forces qul agissent entre les moiécules d'un gaz rééi, on puisse, dans un avenir plus ou moins proche, séparer les [contributions des] deux écarts, et arriver ainsi à choisir m péri mentalement entre les diverses théories de la dégénérescence des gaz parfaits.
'.
Voir par exemple A. Einstein, Sitzber. d. Pr. Akad. d. Ws., 22 261 (1924) ;23 3, 18 (1925). M. Planck, Sitzber. d. Pr. Akad. d. Wiss., 23 49 (1925).
Sources et évolution de la physique quantique
82
2. Pour pouvoir effectuer la quantification du mouvement des molécules d'un gaz parfait, il est nécessaire de se placer dans des conditions où l'on puisse appliquer à leur mouvement les règles de Sommerfeld : et ceci peut naturellement se faire d'une infinité de manières qui, du reste, conduisent toutes au mëme résultat. On peut, par exemple, supposer que le gaz est enfermé dans un récipient parailélipipèdique à parois élastiques, et quantifier le mouvement, trois fois périodique, de la molécule qui rebondit sur les six faces du réclpient : ou, plus généralement, on peut assujettir les molécules à un système de forces quelconque tel que leur mouvement devienne périodique, et par conséquent puisse ëtre quantifié. L'hypothèse que le gaz soit parfait nous autorise dans tous ces cas à négliger la force ag'ksant entre les molécules, de sotte que le mouvement mécanique de chacune d'entre elles s'effectue comme si les autres n'existaient pas. On doit toutefois remarquer que la simple quantification, avec les règles de Sommerfeld, du mouvement des molécules considérées comme complètement indépendantes les unes des autres, n'est pas suffisante pour obtenir le résultat correct. De sorte que, pour trouver ainsl une chaleur spécifique qui tende vers zéro pour T = o. II faut que sa valeur dépende, en plus de la température et de la denslté, de la quantité totale de gaz, et tende, pour n'importe quelle température, vers la limite 3k/2 lorsque, l a densité restant constante, la quantité totale de gaz tend vers l'infini. II apparaït donc nécessaire d'admettre un complément aux règles de Sommerfeld, lors du calcul des systèmes qui. comme ie nôtre, contiennent des éléments non dlscernables entre eux Pour avoir une idée de I'hypothêse la plus plausible que l'on puisse faire, II convient d'examiner comment se passent les choses dans d'autres systèmes qui, comme notre gaz parfait, contiennent des éléments indiscernables ; et précisément, examinons le comportement des atomes plus lourds que l'hydrogène, lesquels contiennent tous plus d'un électron. SI nous consldérons la partie la plus interne d'un atome lourd, nous nous trouvons dans des conditions telles que les forces agissant entre les électrons sont très petltes comparées a celles exercées Par le noyau. Dans ces clrconstances, l'application pure et simple des règles de Sommerfeld Condulralt à prévoir que, dans l'ëtat normal de l'atome, un nombre considérable d'électrons devrait se trouver sur une orbite de ,nombre quantique principal 1. Au lieu de cela, on observe en réalité que ia couche I< est déJa saturée lonqu'elie contient 2 électrons, et de même la couche 1; est saturée lorsqu'elle contient 8 électrons, etc Ce fait a été interprété par Stoner ', e t de manlere encore plus précise par Pauli ', de la manlkre SuIvante : caractérisons une orbite électronique possible dans un atome complexe au moyen de 4 nombres quantiques, n,k,j,m qui ont la signification respectlve de nombre quantique principal, azimuthal, interne e t magnétique. Etant donné les inégalltés que ces 4 nombres doivent vérifier, on trouve que, pour n = 1, Il n'existe
'.
...
...
Pour que deux ensemble de valeurs Pour k,j,m : pour n = 2. il en existe 8, etc rendre compte du fait observé précédemment, il sumt donc d'admettre que dans l'atome ne peuvent exister deux électrons dont les orbites soient caractérisees par les memes nombres quantiques ; il faut, en d'autres termes, admettre qu'une orblte électronique est déjà " occupée " lorsqu'elle contient un seul électron.
'
E. Fermi, N. CImento ï 145 (1924).
E.C.Stoner, Ph//. Mag. 48 719 (1924).
W. Paull, Z S . ~Phys. Si 765 (1925).
La construction de la nouvelle mécanique
83
3. Nous nous proposons maintenant de chercher si une hypothèse semblable ne pourrait pas donner également de bons résultats pour le problème de la quantification du gaz pariait : nous admettrons donc que dans notre gaz il ne peut y avoir au maximum qu'une molécule dont le mouvement soit caractérisé par certains nombres quantiques, et nous montrerons que cette hypothèse conduit à une théorie parfaitement conséquente de la quantification des gaz parfaits, et qu'en particulier elle rend compte de la diminution de la chaleur spécifique prévue pour les basses températures, et qu'elle conduit à la valeur exacte de la constante de l'entropie des gaz parfaits. En attendant de publier. à une prochaine occasion, les détails mathématiques de la théorie présente, nous nous limiterons dans cette note à exposer les principes de la méthode suivie, et ses résultats. Nous devons avant tout mettre notre gaz dans des conditions telles que le mouvement de ses molécules soit quantifiable. Comme on l'a vu, ceci peut se faire d'une infinité de manières. Mais puisque le résultat est indépendant de la manière particulière choisie, nous prendrons celle qui est la plus commode pour le calcul et concrètement nous supposerons que notre molécule subit une attraction vers un point fixe O,d'intensité proportionnelle à la distance r entre la molécule et 0 ; de sorte que chaque molécule constituera un oscillateur harmonique spatial, dont nous noterons la fréquence par v . L'orbite de la molécule sera caractérisée par ses trois nombres quantiques ~ 1 ~ ~ 2 qui ~ 8 3 , sont reliés à son énergie au moyen de la relation
L'énergie d'une molécule peut donc prendre toutes les valeurs multiples entiers de peut être obtenue de = $(a l)(s 2) manières. L'énergie zéro peut donc etre obtenue d'une seule manière, l'énergie hv de 3 manières, l'énergie 2hv de 6 manières, etc. Pour se rendre compte de l'Influence de l'hypothèse que nous avons faite qu'à des nombres quantiques déterminés ne peut correspondre plus d'une molécule -, considérons le cas extreme où nous avons N molécules au zéro absolu. A cette température, le gaz doit se trouver dans l'état d'énergie minima. Si donc II n'y avait pas de limitation au nombre de moiécules que l'on peut trouver avec une certaine énergie, toutes les molécules se trouveraient dans l'état d'énergie zéro, et les trois nombres quantiques de chacune d'entre elles seraient nuls. Au contraire, suivant notre hypothêse, il ne peut y avoir plus d'une molécule avec ses trois nombres quantiques nuls ; si donc N = 1. la molécule unique occupera la niveau d'énergie zéro ; si à son tour N = 4, l'une des molécules occupera la niveau d'énergie zéro, et les trois autres les niveaux d'énergie hv ; SI N = 10. i'une des molécules occupera la niveau d'énergie zéro, trois autres les niveaux d'énergie hv, et les six restantes les six niveaux d'énergie 2hv. Supposons maintenant que l'on doive distribuer entre nos N moiécules l'énergie totale W = Ehv ( E = nombre entier) ; et appelons N. Q. le nombre de molécules d'énergie shv. On trouve'facilement que la valeur la plus probable de N, est
9,
hv, et l a valeur shv
-
+
+
..
<-
NI= aQ,/(e**
+ a) w
où a et B sont des constantes dépendant de et de N. Pour trouver la relation entre ces constantes et la température, observons que, sous l'effet de l'attraction vers O, la densité de notre gaz sera une fonction de ri qui doit tendre vers zéro pour r = 00. Par
84
Sources et évolution de la physique quantique
conséquent, pour r = 00, le phénomène de dégénérescence doit cesser, et en particulier, la distrlbution des vitesses. que l'on peut facilement deduire de l'équation (2). doit se transformer en la loi de Maxwell. On trouve que cela implique :
B =hv/kT.
(3)
Nous sommes en mesure maintenant de déduire de (2) la fonction n(L)dL, qui r e p r k n t e , pour une valeur donnée de r, la densité des molécules d'énergie comprise entre L et t + d L (analogue à la lo1 de Maxwell), et de là nous pouvons déduire l'énergie cinétlque moyenne de la molécule à l a distance r, laquelle est fonction, en plus de la température. de la densité n. On trouve précisement
E
P ( z ) désigne ici une fonction, de définition analytique un peu compliquée. qui, suivant que z est très grand ou très petit, peut se calculer avec les formules asymptotiqu&
P(,) = z (1 + 2 - i z - f
+ ...)
;
P(z)=
;E{
I + g5 J
34n.4 f 2
+ ...} (5)
Pour déduire de (4) l'équation d'état, appliquons la relation du viriel. On trouve alors que la pression est donnée par
A la limite des hautes températures, c'est-à-dire pour les petites dégénérescences, l'équation d'état prend donc la forme
p=nkT
{ 1+- 1 ( ~ mh3nk T ) ~+...} /2
(7)
16 II s'en suit que la pression est plus grande que celle prévue par l'équation d'état classique. Pour un gaz parfait du poids atomique de l'hélium, à la température de 5" absolus, et à la pression de 10 atmosphères, la dirérence serait de 15%. De (4) et (5) on peut aussi déduire l'expression de la chaleur spécifique à basse température. On trouve
De manière similaire, nous pouvons trouver la valeur absolue de l'entropie. En faisant les calculs on trouve, pour les hautes températures :
qui coincide avec la valeur de l'entropie donnée par Tetrode e t Stern.
Article VI11
La statistique des bosons La
loi de Planck et l’hypothèse des quantas de lumière
SATYANDRANATH BOSE Zeitschrilt fiir Physik 26
17û-181 (1924)
(Springer-Verlag)
(reçu le 2 Juillet 1924) [traduit par G. Frick]
On divlse l’espace des phases d’un quantum de lumière correspondant à un volume donné en ‘I cellules” de grandeur h3. Le nombre de répartitions possibles des quanta de lumière d’un rayonnement défini macroscopiquement parmi toutes ces cellules donne l’entropie, et par conséquent toutes les propriétés thermodynamiques du rayonnement.
La formule de Planck relative à l a répartition de l’énergie pour le rayonnement du corps noir constitue le point de départ de la théorie quantique ; celle-ci s’est développée durant ces vingt dernières années, e t s’est révélée extrêmement fructueuse dans tous les domaines de la physique. Depuis sa publication en 1901, de nombreuses manières de démontrer cette loi ont été proposées. On sait que les présupposés fondamentaux de la théorie quantique sont incompatibles avec les lois de l’électrodynamique classique. Jusqu’à aujourd’hui, toutes les démonstrations utilisalent la relation :
8w2dv
pv
=E,
CJ
c’est-à-dire la relation entre le flux d’un rayonnement et l’énergie moyenne d’un osclllateur. Ces démonstrations font des hypothèses sur le nombre de degrés de liberté de l’éther, nombre entrant dans la formule ci-dessus (premier facteur du membre de droite). Cependant, ce facteur devait toujours être déduit de la théorie classique. Ce point, commun à toutes les démonstrations, n’est pas satisfaisant, e t on ne s’étonnera pas qu’il y eut toujours des tentatives de démontrer cette formule en s’affranchissant de ce manque de logique. Une démonstration remarquablement élégante fut donnée par Einstein. II reconnut le manque de logique des démonstrations faites auparavant, e t m a y a de déduire cette formule indépendamment de la théorie classique. Partant d‘hypothèses t r b slmples sur l’échange d’énergie entre les molécules et le champ de rayonnement, Il trouve la relation :
Sources et évolution de la physique quantique
86
Toutefois, afin de relier cette formule à celle de Planck, il lui faut utiliser la loi de déplacement de Wlen, et le principe de correspondance de Bohr. La loi de Wien est basée sur la physique classique, et le principe de correspondance de Bohr suppose qu'à certaines limites, la théorie quantique e t la théorie classique se superposent. Dans tous les cas, les démonstrations ne me semblent pas suffisamment justifiées logiquement. Par contre, il me semble que I'hypothke des quantas de lumière, en liaison avec la mécanlque statistlque (telle que Planck l'envisagea pour les besoins de la théorie quantique) doit être suffisante pour démontrer cette loi indépendamment de la théorie classique. Je vais brièvement décrire la méthode dans ce qul suit. supposons que le rayonnement soit enfermé dans un volume et que son énergie totale soit E . II existe différentes sortes de de quantas en nombre N , e t d'énergie hv,, oci s va de s = 0 jusqu'à s = m. L'énergie totale est alors :
v
Pour résoudre le problème, ii faut déterminer Na, qui déterminera p u . Si nous pouvions exprimer la probabilité de chacune des distributions caractérisée par un nombre N, arbitraire, alors la solution sera obtenue en prenant le critpre de rendre cette probabilité maximale, compte tenu de la condition (1). Recherchons donc cette probabilité. Le quantum a une quantité de mouvement ëgale a dans sa direction de propagation. L'état instantané du quantum est caractérisé par ses coordonnées 2, y, z et sa quantité de mouvement p z , p,, p , ; ces six quantita peuvent étre prises comme les coordonnées d'un point dans un espace à six dimensions. O& nous avons la relation
e
hZu2 P:+P;+P:=T. Dans cet espace, le point representatif se trouve assujetti à se trouver sur la surface d'un cylindre déterminé par la fréquence du quantum. Au domaine de fréquence dv. correspond alnsl l'espace de phase
J
dz dy d z dp. dp, dp, = v.4~
si nous divisons cet espace des phases en cellules de taille h3, il existe 47rSdu cellules dans l'espace des fréquences du. La manière d'effectuer cette distribution n'est pas définie. II convlent par contre de considérer que le nombre total de cellules est équivalent au nombre de dispositions possibles d'un quantum dans ce volume. Pour tenlr compte de la polarkation, Il est indiqué de multiplier ce nombre par 2, de sorte que le nombre de cellules correspondant à du est trouvé égal à 8 7 r V Y . II est maintenant facile de calculer la probabilité thermodynamique (définie macro' le nombre de quantas appartenant au domaine xopiquement) d'un état donné. Soit N de fréquences du'. De combien de manières peut-on les distribuer entre les cellules appartenant à du' 1 Soit p i le nombre de cellules vides, pf le nombre de celles contenant un quantum, p i le nombre de celles en contenant deux, etc. Le nombre de dlstributlons possibles est alors :
87
La construction de la nouvelle mécanique
et où
N' = 0.p:
+ 1.p; + 2.p:.
*
est le nombre de quanta appartenant à dvJ. La probabilité de l'état défini par l'ensemble des p: est alors :
Considérant que nous pouvons regarder les p: comme de grands nombres, nous avons :
où r
Cette expression doit €tre maximum avec les conditions de liaison
:
L e calcul des variations donne les conditions :
CC6p:(l+Igp:)=o,
C6NJh.J= O
II s'en suit que
De là on déduit :
p: Mais Darce aue
on a :
= B'e
-?A.'
T .
88
Sources et évolution de la physique quantique
Compte tenu de la valeur de
A' trouvée ci-dessus on a :
A l'aide des résultats ainsi trouvés, on calcule
:
$,
Si l'on tient compte du fait que = il s'en suit que /? = kT. Introduisant cela dans l'équation ci-dessus pour E on obtient :
qui est équivalente à la formule de Planck. (Universitr! de Dacca, Inde) Traduit en allemand paf A. Einstein
Remarque du traducteur (Einstein). La démonstration de la formule de Planck par Bose constitue, à mon avis, un progrès important. L a méthode utilisée ici peut conduire à la théorie quantique des gaz parfaits, comme j e l'exposerai par ailleurs.
La construction de la nouvelle mécanique
89
3.2 La mécanique quantique Les années 1924-1926-virent l’éclosion d’une théorie atomique logiquement cohérente, la mécanique quantique, la seule qui décrive correctement la matière microscopique, les molécules, lea atomes, les noyaux, la physique de la matière condensée, la supraconductivité, le magnétisme, la physique des particules élémentaires, et avant tout la stabilité de la matière et son interaction avec le rayonnement. Toute description de CU phénomènes par la théorie classique est incorrecte ; au mieuz, il s’agit d’une description approchée, bien que le modèle classique soit en général un guide heuristique valable. Deux voies conduisirent historiquement à la mécanique quantique.
3.2.1 La mécanique ondulatoire Les travaux d’Einstein (1905) sur les photons, détectés en 1923 par Arthur Compton, établirent pour la lumière la dualité onde-corpuscule : ou bien la lumière se propage en ondes, dont l’énergie se répand de façon continue dans l’espace - effets d’interférence, de diffraction, de polarisation - ou bien la propagation de la lumière est celle de corpuscules, avec une énergie concentrée et bien définie pour chaque fréquence, E = hv, et avec un moment linéaire 7 = (hv/c2)c‘ - effet photoélectrique, effet Compton. Mluencé par ces résultats, Louis de Broglie réfléchit SUT l’apparition de nombres entiers dans la quantification du mouvement des électrons dans l’atome de Bohr, et sur le fait que ces nombres apparaissent de manière naturelle dans la théorie des ondes, par exemple dans la définition des ondes stationnaires, dans les modes propres de vibration d’un système physique de dimensions finies. Je continuai, par ailleurs, à réfléchir sur l’analogie entre le formalisme de la Mécanique Analytique et celui des théories ondulatoires, analogie qui m’avait impressionné depuis m a première jeunesse. B m q u e m e n t , à la fin de l’été 1928, toutw ces idées commencèrent à c k t a l l ù e r d a m mon eJprit et j e publiai dans les Comptes Rendus de l’Académie des Sciences trow notes fondamentalesJ5 qui furent le premier point de départ de la Mécanique Ondulaioire. Au printemps, m’inspimnt de wruidératioru relativistes, j’établis une relation aujourd’hui bien connue entre le mouvement d’un corpuscule libre et la propagation d’une onde que j e proposai de lui associer et montrai que mes idées nouvelles permettaient de donner une interpréfafion simple des condifioru de stabilité quantique des mouvements intraatomiques des électrons. Daru la deuzième note, j e m’efforçai de précùer les applicatiou de mes concepts au uu des photoru et j’ébauchai une théorie des phénomènes d’interférence et de diffraction de la lumière compatible avec l’ezutence des photoru. Daru la troisième note, enfin, j e montrai comment mes concepts conduisaient d la loi de Planck pour le rayonnement du corps noir et j’établissai une correspondance, aujourd’hui classique, entre le principe de moindre action appliqué au mouvement 35 Ondw et quanta, C.R. 177, 507 (1923) ; Quanta de lumière, diflraction et interjércnce, C.R. 177, 548 (1923) ; LW quanta, la théorie cinétique des g a t et le principe de Fermat C.R. 177,630(1923) [Article IX,page 921.
Sources et évolution de la physique quantique
90
d’une particule et le principe de Femat appliqué à la propagation de son onde CU~aciée.Airui, dès les mow de septembre et d’ocfobre 1989, j’étak en possession de quelques uru des principes fondamentauz de la Mécanique Ondulatoire n36. Ces idées de Louis de Broglie conduisirent Erwin Schrodinger à découvrir l’équation différentielle de l’onde associée aux corpuscules3’. Lea solutioru propres de cette équation représentent les états stationnaires des atomes et les valeurs ~‘OPI-CJcorrespondent euz auz énergies de ces états. Cette équation a la forme suivante pour l’atome d’hydrogène :
où Q = I(Z‘,t) est la fonction d’onde exprimée en fonction des coordonnées de l’électron. A partir des travaux de Schrodinger se développa la description de la théorie quantique par la mécanique ondulatoire.
8.2.2 La mécanique des matrices L’autre chemin menant à la mécanique quantique fut découvert par Werner Heisenberg. Dans un mémoire de 1925”, Heisenberg attribue les difficultés du développement du modèle de Bohr de l’atome d’hydrogèneà l’introduction de grandeurs qui ne peuvent être observées. Ainsi Bohr parle de vitesses et d’orbites des électrons autour du noyau, mais la position de l’électron dans l’atome ne peut être déterminée sans une observation par la lumière, par exemple. La longueur d’onde de celle-ci devant être plus petite que le diamètre atomique, de l’ordre de lo-’ un, cette lumière doit plutôt être formée de rayons X pénétrants ou de rayons gamma, et l’un des photons de ce rayonnement, lorsqu’il frappe un électron, l’expulse de l’atome par &et de recul, comme celui observé dans l’&et Compton. L’obseivation de la position de l’électron dans l’atome conduirait à l’expulsion de l’électron de l’atome, celui-ci devenant alors ionisé. Heisenberg proposa que la théorie n’introduise que des grandeurs ou des variables construites à partir de données expérimentales, capables égaiement d‘être observées physiquement. Le fait que la fréquence du rayonnement émis par l’atome d’hydrogène, suivant Bohr, soit déiinie par les énergies de deux états stationnaires, E,,, Em’per la relation : Ynm
s v(n,m)
(l/h)(En -Em)
I :
conduisit Heisenberg à représenter la fréquence par une matrice : ” ” ”
L. de Broglie, dans h u i s de Broglie, physicien et penseur, Albin Michel, Paris (1953). E. Schrodinger, Ann. d. P h y d 78, 361 (1926) [Article X, page 99). W. Heisenberg, Zcilschr. f. Phys. 39,879 (1925) [Article XI, page 1121.
La construction de la nouvelle mécanique
O Vnm
=-(
?:
91
... Ulm ... . . . vim . .. ... ... ... ... ...
~ 1 2~ 1 3
O
~ 1 3
un2 ... ... V,m ... ... ... ... ... ... ...
V,l
Une généralisation de cette représentation aux amplitudes de vibration a(n, m), associées aux fréquences, conduisit au calcul de ces nouvelles grandeurs physiques, à savoir :
à partir du principe de combinaison de Rydberg-Ktz, qui donne la relation suivante entre les fréquences des rayonnements émis par un atome : Vnj
+
Vjm
= Vnm
Heisenberg, ensuite, en compagnie de Max Born et de Pascual Jordan3’, considéra ses h y p o t h è comme la base d‘une mécanique des matrices dont le postulat fondamental est la représentation de toute variable physique par une matrice d’un ensemble infini de lignes et de colonnes, telle la matrice unm ci-dessus. Born et Jordan introduisirent la théorie des matrices comme base de la mécanique quantique. En particder, étant donné deux matrices, leur produit n’est pas toujours commutatif : ils découvrirent alors que la condition de quantification de Bohr s’exprimait dans la nouvelle mécanique par la relation :
c’est-à-dire qu’une coordonnée et son moment conjugué, xj et sont des matrices qui ne commutent pas lorsque j = k. Puisque la trace (somme des éléments diagonaux) d’un produit de matrices ne dépend pas de l’ordre du produit, cette relation ne peut être vérifiée que si lea matrices repdsentant X et P ont un nombre infini de lignes et de colonnes. C’est la fameuse relation de commutation fondamentale de la mécanique quantique, base du principe d’incertitude. L’équivalence entre la mécanique ondulatoire et la mécanique des matrices fut ensuite démontrée par SchrWnger. Et les travaux de Bohr, Schrodinger, Pauli, Heisenberg,Dirac,Born parmi beaucoup d’autres, donnèrent une impulsion remarquable à la mécanique quantique.
M. Born et P. Jordan, Zeiischr. f. Phys. et P. Jordan, Zcibchr. f. Phys. 55,557 (1926).
94,838 (1925) ; M. Born, W. Heisenberg
Article IX
La longueur d'onde associée à la matière LOUISde BROGLIE Première note
Ondes e t quanta Note présentée par M. Jean Perrin Comptes rendus de l'Académie des Sciences
177 507-510 (1923)
(Gauthier-Villars)
Considérons un mobile matériel de masse propre mo se mouvant par rapport a un observateur fixe avec une vitesse u = Pc (@ < 1). D'aprês le principe de l'inertie de I'énergle, il doit posséder une énergie interne égaie à mgcl. D'autre part, le principe d e s quanta conduit à attribuer cette énergie interne à un phénomène périodique simple de fréquence vo telle que
huo = rngc', c étant toujours la vitesse limite de la théorie de relativité e t h la constante de Planck. Pour l'observateur fixe, à l'énergie totale du mobile correspondra une fréquence v= Mais. SI cet observateur fixe observe le phénomène périodique interne du
,*.
mobile, il le verra ralentl et lu1 attribuera une fréquence vi = VOphénomène varie donc comme
; pour lui ce
sin 2 x y t . Supposons maintenant qu'au temps t = O, le mobile coincide dans l'espace avec une onde de frauence v ci-dessus définie se propageant dans la même direction que lui avec la vitesse Cette onde de vitesse plus grande que E ne peut correspondre h un transport d'énergie ; nous la consldérerons seulement comme une onde fictive associée au mouvement du mobile. Je dis que, si au temps t = 0, II y a accord de phase entre les vecteurs de l'onde et le phenornene interne du mobile. cet accord de phase subslstera. En effet, au temps t le mobile est à une distance de l'origine égaie à ut = z ;son mouvement interne est alors représenté par sin 2 ~ 1 : . L'onde, en ce point, est représentée par
%.
ein2xu (t
- $) = sin2nuz (;l - );a .
Les deux sinus sont égaux, l'accord de phase est réalisé SIi'on a Vl
= v(1
-a'>,
Au sujet de la preJcnte note, voir M. Brillouln, Comptes rendus, 168, 1318 (1919).
93
La construction de la nouvelle mécanique
condition évidemment satisfaite par les définitions de v e t V I . L a démonstration de cet important résultat repose uniquement sur le principe de relativité restreinte e t sur l'exactitude de la relation des quanta tant pour l'observateur fixe que pour l'observateur entraTné. Appliquons d'abord ceci à un atome de lumière. J'ai montré ailleurs2 que l'atome gr.) se de lumière doit être considéré comme un mobile de masse très petite (< mouvant avec une vitesse tri% sensiblement égale a c (bien que légèrement inférieure). Nous arrivons donc à l'énoncé suivant : '' L'atome de lumière équivalent en raison de son énergie totale à une radiation de fréquence V est le siège d'un phénomène périodique interne qui, vu par l'observateur fixe, a en chaque point de l'espace même phase qu'une onde de fréquence v se propageant dans la m€me direction avec une vitesse sensiblement 6gak (quoique très légèrement supérieure) à la constante dite vitesse de lumière. " Passons maintenant au cas d'un électron décrivant d'une vitesse uniforme sensiblement inférieure à c une trajectoire fermée. Au temps t = O, l e mobile est en un point 0.L'onde fictive associée, partant alors de 0 et décrivant toute la trajectoire avec la rattrape i'éiectron au temps r en un point O' tel que 00' = Pcr. vitesse On a donc
j,
B
r = -lac(. C
+T,)]
ou
r =" Try 1 - j32
où T, est la période de révolution de l'électron sur son orbite. l'électron, quand celui-ci va de 0 en varie de
o',
La phase interne de
II est presque nécessaire de supposer que la trajectoire de l'électron n'est stable que
SI l'onde fictive passant en O' retrouve l'électron en phase avec elle : l'onde de fréquence v e t de vitesse doit ê t r e en résonance sur la longueur de la trajectoire. Ceci conduit a
Montrons que cette conditlon de stabilité est bien celle des théories de Bohr et Sommerfeld pour une tra]ectolre décrite à vitesse constante. Appelons p I 1 p,, p z les quantite de mouvement de l'électron suivant trois axes rectangulaires. La condition générale de stabilité énoncée par Einstein est en effet'
1
T,
'
(p,dz
+ p,dy + p&)
= nh
( n entier),
Voir Journal de Physique, 6e série, 3,422, (1922).
Le cas des mouvements quasi-périodiques ne présente aucune difficulté nouvelle. La nécessité de satisfaire à la condition énoncée au texte pour une infinité de pseudo-périodes conduit aux conditions de Sommerfeld.
Sources et évolution de la physique quantique
94
ce qui peut dans le cas présent s'écrire
comme ci-dessus. Dans le cas d'un électron tournant avec une vitesse angulaire w sur un cercle de rayon R. on retrouve pour les vlteses assez petites la formule primitive de Bohr : mowRZ=
&.
Si la vitesse varie le long de la trajectoire, on retrouve encore la formule de BohrEinsteln si fl est petit. Si fl prend de grandes valeurs, la question devient plus compliquée et nécessitera un examen special. Poursuivant dans la même voie, nous sommes parvenus a des résultats importants qui seront prochainement communiqués. Nous sommes dès aujourd'hui en mesure d'expliquer les phénomènes de diffraction e t d'interférences en tenant compte des quanta de lumière.
Deuxième note
OPTIQUE - Quanta de lumière, diffraction et interférences Note de M. Louis de Broglie présenta par M. Jean Perrin Comptes rendus de l'Académie des Sciences 177 54û-550(1923)
1. Dans une Note récente4, nous avons montré qu'un observateur, pour décrire le mouvement d'un mobile de vitesse Bc (B < 1). dolt lui associer une onde sinusoïdale
$
.*
non mat&/e//e se propageant dans l a même direction avec une vitesse = ; la fréquence de cette onde est égale à l'énergie totale, par rapport à l'observateur, du mobile consldéré. d i v u e par la constante h de Planck. O n peut du reste considérer la vitesse Pc comme la ,,vltesse de groupe " d'ondes ayant des vitesses e t des fréquences A 1-fi ' correspondant â des valeurs de B voisines mais légèrement différentes. Laissant de cbté la signhication physique de cette onde (ce sera l a tache dimclle d'un électromagnétisme élargl de l'expliquer), nous rappelons que le mobile a la même phase interne que la portion de l'onde située au M m e point ; nous l'appellerons donc " l'onde de phase Les atomes de lurniere dont nous admettons l'existence ne se propagent pas touJoursen ilgne droite, comme le prouvent les phénomènes de diffraction. II semble donc nécessaire de modlfier le prindpe de I'lnertie. Nous proposons de mettre à l a base de la dynamique du polnt matériel libre le postulat suivant : '' En chaque point de sa trajectoire. un moblle libre suit d'un mouvement uniforme le rayon de son onde de phase, En général, c'est-à-dlre (dans un milieu isotrope) la normale aux surfaces d'égale phase le mobile suivra donc la traJedolre rectiligne fixée par le principe de Fermat appliqué â l'onde de phase, qui se confond ici avec le principe de moindre actlon applique au mobile
3
".
".
'
~
~~
Comptes rendus, 177,SO7 (1923). J'ai fait dans cette Note une restrictlon inutile : on retrouve les conditions de Bohr même dans le cas des vitesses variables très élevées.
La construction de la nouvelle mécanique
95
sous la forme maupertuisienne. Mais si le mobile doit traverser une ouverture dont les dimensions sont petites par rapport à la longueur d'onde de l'onde de phase, sa trajectoire se courbera en général comme le rayon de l'onde diffractée. La conservation de l'énergie est sauve, mais non celle de la quantité de mouvement, à moins qu'il ne se transmette une pression aux atomes matériels formant le bord de l'ouverture. Le nouveau principe mis à ia base de la dynamique expliquerait la diffraction des atomes de lumière, sl petit que soit leur nombre. De plus un mobile quelconque pourrait dans certains cas se diffracter. Un flot d'électrons traversant une ouverture assez petite présenterait des phénomènes de diffraction. C'est de ce côté qu'il faudra peut-Gtre chercher des confirmations expérimentales de nos idées. Nous concevons donc l'onde de phase comme guidant les déplacements de l'énergie, et c'est ce qui peut permettre la synthèse des ondulations et des quanta. La theorie des ondes allait trop loin en niant la structure discontinue de l'énergie radiante et pas assez loin en renonçant à intervenir dans la dynamique. La nouvelle dynamique du point matériel libre est à l'ancienne dynamique (y compris celle d'Einstein) ce que l'optique ondulatoire est à l'optique géométrique. En y réfléchissant on verra que la synthèse proposée parait le couronnement logique du développement comparé de la dynamique et de l'optique depuis le XVll' siècle. II. Arrivons maintenant à l'explication des franges d'interférences.
Nous admettrons qu'un atome matériel a une probabilité d'absorber ou d'émettre un atome de lumière déterminée par la résultante de l'un des vecteurs des ondes de phase se croisant sur lui ; naturellement l'émission n'est possible que si l'atome est excité et l'absorption que si un atome de lumière se trouve à proximité. L'hypothèse précédente est au fond tout à fait analogue à celle qu'admet la théorie électromagnétique Quand elle lie l'intensité de la lumière décelable (c'est-à-dire capable d'agir photoélectriquement sur I'aeil, la plaque photographique ou le bolomètre) à l'intensité du vecteur électrique résultant. Une cause quelconque ayant déclenché l'émission d'un quantum de lumière dans une source ponctuelle ", son onde de'phase, en passant sur les atomes voisins, dedenchera d'autres émissions de quanta dont nous supposerons la vibration interne en phase avec l'onde elle-même. Tous is atomes lumineux émis auraient donc ainsi meme onde de phase que le premier ; nous dirons qu'ils sont couplés en onde'. L'onde de phase unique transporte donc avec elle une foule de petits morceaux d'énergie qui glissent d'ailleurs un peu a sa surface comme il résulte de notre dernière Note. EtuPons l'expérience des trous d'Young : quelques atomes de lumière traverseront les trous e t se diffracteront en suivant le rayon de la portion d'onde de phase qui les entoure. Dans l'espace situé derrière la paroi, leur capacité d'agir photoélectriquement variera en chaque point suivant l'état d'interférence des ondes de phase qui ont traversé en se diffractant les deux trous. II y aura donc des franges brillantes et obscures telles que les pr&oient les théories ondulatoires et cela si faible que soit l'intensité de la lumière incidente. Ce système d'explication, qui emprunte l'essentiel à la théorie des ondes en introduisant les quanta, doit se généraliser pour toutes les franges d'interférence et de diffraction. I'
Ce sont probablement de tels atomes couplés en onde qui interviennent dans la formule des fluctuations du rayonnement noir. Voir Comptes fendus, L 176,811 (1922).
96
Sources et évolution de la physique quantique
Troisième note
PHYSIQUE - Les quanta, la théorie cinétique des gaz e t le principe de Fermat Note de M. Louis de Broglie. preSentée par M. Deslandres. Comptes rendus de IMcad€rnie des Sciences 177 630-632(1923)
1. Planck et Nernst ont montré que l'idée de quantum devait être introduite dans la théorie cinétique des gaz, en vue de calculer les constantes d'entropie e t les constantes chimiques dont l'Importance est si grande en thermodynamique. Dans ce but, Planck a été amené à choisir un élément d'extension en phase égal
1 -dzdydzdpdqdr h3
= Zm: G d u r d z d y d z ,
où z,y, z,p , q, r sont les coordonnées e t les quantités de mouvement de l'atome, mo sa masse propre, to son énergie cinétique, h la constante d'action. Nous sommes aujourd'hui en mesure de justifier cette hypothese.
Chaque atome de vitesse Bc peut etre considéré comme lié à un groupe d'ondes dont les vitesses de phase sont
v = j,les fréquences t e ,e t l a vitesse du groupe
u = @c. L'état du gaz ne pourra donc être stable que si les ondes correspondant à tous les atomes forment un système d'ondes stationnaires ; suivant une méthode connue donnée par Jeans, on trouve pour le nombre des ondes stationnaires contenues dans l'unité de volume e t dont les fréquences sont comprises entre v e t v du :
+
Les quantités v et
u) sont
reliées par la relation
d'oh
n,du = %nic(l+ a)d=dto. h3 Chaque onde peut transporter zéro, un, deux ou plusieurs atomes, de telle sorte que, d'après l a loi de distribution canonique, l e nombre des atomes d'énergie totale hv dans l'élément de volume est
97
Lu construction de lu nouuelle mécanique
Considérons d'abord un gaz matériel dont les atomes ont une masse relativement grande et, par suite. des vitesses relativement petites. Nous pouvons négliger tous les termes de la série, excepté lé premier, et poser
l+a=l. Le nombre d'atomes d'énergie cinétique w est donc
résultat qui justifie la méthode de Planck et conduit 2 la forme usuelle de la loi de Maxwell. Dans le cas d'un gaz formé d'atomes de lumière, a est toujours grand et nous devons employer toute l a série. En raison de la symétrie binaire interne impode par l'analogie ondulatoire, nous devons introduire un facteur 2 e t la méthode esquissée dans notre article du Journal de Physique de novembre 1922 conduit à la loi de Planck pour la densité d'énergie :
II. Cherchons 2 préciser les idées exposées dans nos Notes précédentes. Si, dans un certain milieu, un corps décrit une trajectoire courbe, nous disons qu'il y existe un champ de force et en chaque point le principe de l'énergie permet de déduire la vitesse du corps de la valeur constante de son énergie totale. Pour assurer l'accord de phase entre l'onde et le mobile, on est conduit à supposer que l'onde de phase d'un mobile d'énergie totale donnée a en chaque point une fréquence et une vitesse fixée par la valeur qu'aurait la vitesse du corps s'il se trouvait en ce point. Sans doute, une théorie électromagnétique élargie nous donnera le mécanisme de cette propagation complexe. II semble que nous connaissions par avance sa conclusion principale : " Les rayons d& ondes de phase coïncident avec les trajectoires dynamiquement possibles En effet, les rayons se calculeront comme dans un milieu de dispersion variable par le principe de Fermat, qui s'écrit Ici
".
VdS
alors que le principe de moindre action sous la forme Maupertuisienne détermine les trajectoires par l'équation
L e lien fondamental qui unit les deux grands principes de l'Optique géométrique e t de la Dynamique est mis ainsi en pleine lumière. Parmi les trajectoires dynamiquement possibles, certaines jouiront de la propriété particulière d'€tre en résonance avec l'onde de phase ; ce sont les trajectoires stables de Bohr pour lesquelles est un nombre entier.
98
Sources et évolution de la physique quantique
Remarquons que l’intégrale de Fermat fait intervenir le produit d’une fréquence par un temps et l’action ne s’introduit que par suite de la proportionnalité de l’énergie et de la fréquence. Cette proportionnalité reste un postulat dont le sens physique n‘est pas eclairci ; elle constitue sans doute un des aspects de la liaison de l’espace et du temps et, comme notre expérience usuelle nous a habitué à dissocier ces deux notions, elle garde un caradere très peu intuitif.
Article X
L'équation non relativiste des ondes de De Broglie Quantification e t valeurs
propres
ERWXN SCHR~DXNGER Annalen der Physik (4), 79, 361-376(1926) (Springer-Veriag) (reçu l e 27 janvier 1926) [traduit par A. Proca, extrait de : Mémoires sur l a Mécanique Ondulatoire, Librairie Felix Alcan, PUF (1933)]
1. Dans cette communication, j e voudrais montrer tout d'abord, sur l'exemple le plus simple possible d'un atome d'hydrogène (sans relativité ni perturbation), que les règles habituelles de quantification peuvent être remplacées par une autre condition, dans laquelle il n'est plus du tout question de nombres entiers Ces nombres entiers s'introduisent de l a même mansre naturelle que le nombre entier des nœuds d'une corde vibrante. Cette nouvelle conception est susceptible de généralkations étendues e t j e crois qu'elle touche de très près la véritable essence des conditions de quanta. La forme habituelle de ces conditions se rattache à l'équation aux dérivées partielles de Hamilton :
".
'I
H
(q,
E)
=E.
On cherche d'habitude une solutlon de cette équation MIIS forme d'une somme de fonctions, chacune dépendant d'une seule variable Indépendante g. Introduisons maintenant à la place de une nouvelle inconnue 3 de telle facon que b?, se présente sous la forme d'un produit de fondiohs de chacune des coordonnées, c'est-à-dire posons
s
s = Klog$.
(2)
K
est une constante ayant les dimensions d'une action e t qu'il est nécessaire d'Introduire pour des raisons de dimensions. On obtient ainsi :
ET (q,
f $) = E.
Nous ne chercherons pas à résoudre I'muation (l'), mais nous l'utiliserons pour formuler la condition suivante. L'équation (1') peut etre &rite sous la forme : 'I
Une forme quadratique de
$ et de ses premieres dérivées = 0 ".
Sources et évolution de la physique quantique
100
Ce/a est toujours exact, si l'on néglige la variation de la masse avec la vitesse, et cela reste encore vrai, au moins dans le cas d'un seul électron, iorsqu'on tient compte de cette variation. Cherchons alors les fonctions $ réelles, finies, à détermination unique et deux fois dérivables dans tout l'espace de configuration, qui conduisent à un extremum pour I'inthraie de la forme quadratique que nous venons de définir'. Nous remplacons la recherche des conditions de quanta par ce problème du calcul des variations. Pour El nous prendrons tout d'abord la fonction de Hamilton d'un mouvement de Kepler et nous montrerons qu'on peut satisfaire à la condition précédente par toutes les valeurs positives de E, mais que si E est négatif il n'existe pas de solution, sauf pour une suite discrète de valeurs de cette constante. Autrement dit, le problème du calcul des variations énoncé, a un spectre discret et en même temps un spectre continu de valeurs propres. Le spectre discret correspond aux termes de Balmer. tandis que le spectre continu caractérise les énergies des trajectoires hyperboliques. Pour obtenir une concordance numérique effective il faut donner à la constante K la valeur h/27r. Le choix du systëme de coordonnées n'a aucune importance pour l'établissement des équations de notre problème ; prenons donc, pour simplifier un système cartésien de coordonnées rectangulaires. (1') s'écrit aiors dans notre cas :
(g) + (5> + (2)- g +); (E
$2
= O,
(1")
e étant la charge e t m la m a w de l'électron. Notre problème de variation est défini par
"'I
=O,
l'intégrale étant étendue à tout l'espace. On en tire par les procédés habituels
IIfaut donc écrire premièrement que
et deuxièmement,
Je me rends compte que cette manière de formuler le problème n'est pas unique.
La construction de la nouvelle mécanique
101
l'intégrale étant étendue à une surface fermée, située à l'infini dans toutes les directions. (Nous constaterons plus loin qu'à cause de cette dernière relation il faudra compléter notre problème par une conditioh fixant le comportement de 63 à l'infini, cela pour que le spectre continu de valeurs propres, mentlonné plus haut, puisse réellement exister. Pour l'instant nous laisserons ce détail de côté). O n peut écrire (par exemple) la solution de (5) en coordonnées polaires dans l'espace r, @, $O, en posant $ égal à un produit d'une fonction de r, par une fonctlon de 0 et par une fonction de p. La méthode est archi-connue. La dépendance des variables angulaires sera décrite par une fonction sphérique, tandis que dépendra de r par l'intermédiaire d'une fonction que nous appellerons x et qui satisfera à l'équation différentielle suivante, facile à établir.
4
Ainsi qu'il est bien connu, si l'on veut obtenir une dépendance univoque des angles polaires, il est indispensable de donner à n uniquement des valeurs entières. Cherchons les solutions de (7) qui restent finies pour toutes les valeurs réelles et non négatives de r. Dans le plan de la variable complexe r, l'équation (7) a deux points singuiiers', point d'indétermination " l'un pour r = O, l'autre pour r = 00 ; le second est un (point singulier essentiel) pour toutes les intégrales du problëme, tandis que le premier ne i'est pas (pour aucune intégrale). Ces deux singularités forment précisément les points frontières de notre intervalle réel. Or, on sait que dans de pareils cas la condition que la fonction x reste finie pour ces points frontières équivaut à une condition aux limites. En général, notre équation n'a pas d'intégrale qui reste finie en chacun de ces deux points ; une pareille intégrale n'existe que pour certaines valeurs particulières de constantes de l'équation donnée. II ne s'agit plus maintenant que de déterminer ces constantes. . L'analyse que nous venons de résumer, constitue le point CJpitJldU présent mémoire. Considérons d'abord le point singulier r = o. i'éguation caractéristique. qui détermine l'allure des intégrales en ce point, est 'I
p(p
- 1) + 2p - n(n + i) = O
et a comme racines
pl = n,
p2
= -(n
(8)
+ 1).
Les deux intégrales canoniques en ce point appaitiennent donc aux exposants n et -(n 1). Pour nous, seule l a première est utilisable, n ne pouvant prendre des valeurs négatives. Cette intégrale appartient au plus grand exposant ; elle' peut donc
+
être r e p r h n t é e par une série de puissances commençant par un terme en r". (La seconde intégrale, qui ne nous intéresse pas. peut contenir éventuellement un logarithme, Je suis redevable à Hermann Weyl des indications nécessaires pour le traitement de l'équation (7). Pour ce qui est des théorèmes non démontrés dont nous ferons usage par la suite, le lecteur -ut se reporter à L. Schlesinger. Direrentialgieischungen, Sammlung Schubert, Nr IS, Coschen, 1900. en particulier les chapitres 3 et 5.
Sources et évolution de la physique quantique
102
la différence entre les exposants étant un nombre entier). Le second point singulier étant rejeté à l’infini la série de puissances considérée converge e t représente une transcendante entière. Nous pouvons donc dlre : A un facteur près. qui n’a d’ailleurs aucune importance, la solution cherchée est une transcendante entière, univoquement déterminée et appartenant à /‘euposant n, pour
r =O. II s’agit maintenant d’examiner comment se comporte cette fonction à l’infini dans la direction positive de l’axe réel. Pour cela, simplifions l’équation (7) en y substituant
et choisissons pour a une valeur convenable de façon que le terme en
1 disparaisse. r2
Ainsi qu’on le voit facilement, cela exige que 0 soit égal à l’une des deux valeurs n ou -(n 1). L’équation (7) prend alors la forme :
+
p U + 2(u+i)dU+@( r
dr2 Pour r
dr
“>
E + y U=O.
Kz
(7’)
= O,
les intégrales de cette nouvelle équation appartiennent aux exposants Pour la première valeur de Q ; a = n, la première de CS intégrales est une transcendante entière, pour la seconde valeur de a,a = -(n i),c’est la seconde intégrale qui est une transcendante entière ; dans chaque cas nous sommes conduits d’après (9) à la solution x cherchée, qui est unique. Nous ne perdons donc aucune solution en nous bornant à une seule valeur de a. Prenons donc O et
-2u
- 1.
+
(10)
a=n;
u
o.
Dans ce cas appartient pour f = 0 à l’exposant Les mathématiciens appellent les equations du type (7’) des equations de Laplace. La forme générale d’une pareille équation est
+ $) U’+ ( E o +
U” +
F)u
= o.
Dans notre cas les constantes ont les valeurs suivantes a0
= O,
ai = 2(0 + l),
Eo
=
2mE jp I
E1
=
2me2 K2 .
Ce type d’6quatlon est relativement facile à traiter parce que la transformation de Laplace, qui en genéral redonne une équation de second ordre, conduit dans ce cas particulier à une équation du premier ordre, soluble par des quadratures. Ce fait permet de représenter les solutions de (7”) par des intégrales dans le domaine complexe. Je ne donnerai ici que le résultat final’. L’intégrale
u=
ez‘(z
- c1)&>-1(z
- cz)as-ld~,
(12)
L
’
Cf. L. Schlesinger, /oc.
ut. Cette théorie est due à H. Poincaré e t
J. Horn.
103
La construction de la nouvelle mécanique
prise le long d'un chemin d'intégration pour lequel
1:
[eZr(z- cl)"l(z
- ~ 2 ) ~ ' I d=z O
(13)
L est une solution de (7").Les constantes cl, c2, al,a2 ont les valeurs suivantes : cl, et c2 sont les racines de l'équation du second degré z2
+
602
- Eo = o.
et
Dans le cas de l'équation (7) nous avons donc d'aprb (11) et (10) : ,L'
-3mE
Kf-mE
+n+1, a ? = -
m e'
K G Z Z
(14")
+n+L
La représentation intégrale (12) permet d'étudier non seulement la manière dont /'ensemble des solutions se comporte asymptotiquement lorsque r s'éloigne vers l'infini d'une certaine manière, mais aussi de résoudre le même problème pour le cas d'une solution déterminée. ce qui est toujours beaucoup plus difficile. Nous allons éiiminertout d'abord le cas où (11 et a2 sont des nombres entiers réels. Lorsque ce cas se présente, 01 et a2 sont des toujours entiers et réels tous les deux en même temps ; la condition nécessaire et suffisante pour que cela ait lieu est
m e2
K VZEE
= nombre entier réel.
Nous supposons donc que cette condition (15) n'est pas remplie. Nous allons caractériser la manière dont l'ensemble des solutions se comporte asymptotiquement lorsque r tend vers l'infini - en se déplaçant, comme nous le supposerons toujours. le long de l'axe réel et u2, positif par le comportement des deux solutions linéairement indépendantes qu'on obtient lorsque l'on effectue l'intégration le long de deux chemins d'intégration particuliers, définis ci-aprks. Ces deux chemins ont une partie commune : z vient de l'infini e t y retourne dans une direction telle que
-
ce qui signifie que la partie réelle de zr doit tendre vers l'infini négatif. II s'ensuit que la condition (13) est remplie. Le reste des chemins d'intégration est constitué dans le premier cas (solutions &) par une courbe entourant une fois le point ci, et dans le second cas (solution u2) par une autre courbe entourant également une fois le point c2.
Sources et évoiution de la physique quantique
104
Pour de tr& grandes valeurs de r , réelles e t positives, ces deux solutions sont représentées asymptotiquement dans le sens de Poincaré) par
en nous limitant ici au premier terme des séries asymptotiques qui procèdent d'après les puissances entières e t négatives de r. II faut distinguer malntenant les deux cas E > 0 e t E < Soit d'abord :
o.
-
1.?!, > 0 Observons avant tout que dans ce cas. la condition (15) est gutomatiquement satisfaite, puisque le premier membre est purement imaginaire. De plus, d'après (14"), c1 et c2 sont de même purement imaginaires. Puisque r est réel, les exponentielles de (17) sont des fonctions périodiques finies. Les valeurs (14") de a1 e t a2 montrent
u~
et tendent tous les deux vers zéro comme r-"-'. Ildoit en être de même que pour notre solution transcendante entière U. dont nous voulons analyser l'allure, quelle que soit la manière dont elle est composée linéairement à partir de e t &. Ensuite, la relation (9) montre, si l'on tient compte de (lo), que l a fonction ,y, c'est-à-dire la solution transcendante entière de l'équation primitive (7). doit également tendre vers zéro comme 1/r, puisqu'eile résulte de par simple multiplication avec r". Nous pouvons donc dire : Pour une valeur positive quelconque de E, l'équation différentielle d'Euler (6) relative à notre problème de variations, possade des solutions finies, univoques et continues dans tout l'espace e t qui, à l'infini, tendent VeK zéro comme i/r, en oscillant continuellement. Nous reviendrons plus loin su; la condition aux limites (6).
u
-
2. E < 0 Dans ce cas, la possibilité (15) n'est pas exclue eo ipso ; admettons cependant pour l'instant qu'elle le soit, c'est-à-dire qu'on élimine les valeurs réelles e t entières de a1 et a2. Dans ce cas, d'après (14") et (17) croît indéfiniment pour r = eo, tandis que u 2 tend exponentiellement vers zéro. Notre transcendante entière ne pourra rester finie que si est identique à Uz à un facteur numérique près ; le même résultat vaut pour ,y. Or, ilne peut en ëtre ainsi. O n le voit de l a façon suivante. Choisissons un chemin d'intégration dans (12) un contour fermé entourant les deux points c1 e t c2 ; sur la surface de Riemann de la fonction à intégrer, ce contour sera réellement fermé a cause du fait que la somme a1 a2 est un nombre entier, et par conséquent la conditlon (13) sera eo ipso satisfaite. On peut montrer alors facllement que l'intégrale (12), prise le long de ce contour fermé, représente eflectivement notre transcendante entière En effet, elle peut se développer en serie suivant les puissances positives de r . série qui converge en tout cas pour r suffisamment petit ; elle satisfait donc l'équation différentielle (77,par conséquent elle coincide avec la *rie donnant Donc : est représenté par (12), le chemin d'intégration étant un contour fermé autour de deux points c1 e t c2. Mais on peut déformer ce contour de façon qu'il apparaisse comme une Combinaison additive des deux chemins d'intégration considérés plus haut e t &. e t cela avec des facteurs non nuls. par exemple 1 e t e2rm i. correspondant à A cause de cela doit neesairement contenir donc il ne pourra Jamais coïncider avec U2. c.q.f.d. Avec les hypothèses admises, notre transcendante entière l a seule parmi les solutions de (7') qui entre en ligne de compte pour ce que nous avons en vue ne garde
u
u
+
u.
u.
u
u
vi,
u-
-
La construction de la nouvelle mécanique
105
donc pas une valeur ffnie quand r devient très grand. Sous la réserve de démontrer que notre procédé fournit toutes les solutions linéairement indépendantes du problème, nous pouvons donc conclure que : Notre problème de variations n'a pas de solutions pour des valeurs de E qui ne satisfont pas à la condition (15). II ne nous reste plus à examiner maintenant que la suite discrète de valeurs négatives de E qui satisfont à la condition (IS). Dans ce cas a1 (22 sont tous les deux entiers. pour ne pas tomber sur un résultat nul, ilfaudra certainement modifier le premier des deux chemins d'intégration qui nous ont fourni le système fondamental de solutions et u2. En effet, al - 1est certainement positif, et par conséquent le point c1 n'est ni un point de ramification, ni un pôle de la fonction à intégrer : c'est un zéro ordinaire. Le point c1 peut être également un point régulier, si a2 1 n'est pas négatif. Quoi qu'il en soit, on peut facilement trouver dans chague cas, deux contours d'intégration convenables, e t même effectuer l'intégration jusqu'au bout au moyen de fonctions connues, ce qui permet d'analyser complètement le caractère de la solution considérée. Posons : m e' =I ; I = 1,2,3,4
+
-
...
KJ=GÈ On a alors d'après (14")
II faut distinguer les deux cas
n e t 1 > n. Soit d'abord
a) 2 5 n - c1 e t c2 perdent alors tout caractère de points singuliers. mais sont. par contre, t o u t qualhîés pour jouer le rôle de point initial ou point final du chemin d'intégration, ceci en vue de satisfaire automatiquement à la condition (13). Un autre point également qualifié pour ce rble est l'infini réel négatif. Toute courbe reliant deux de ces trois points conduit à une solution et deux quelconques de ces trois solutions sont toujours linéairement indépendantes, comme on le constate facilement en calculant complètement les intégrales (12). En particulier. la solution transcendante entière est donnée par le chemin d'intégration qui va de CI à c2. En effet, on voit sans aucun calcul que l'intégrale prise le long de ce chemin reste régulière pour le point r = J'insiste là-dessus, parce que le calcul effectif de l'intégrale est plutôt propre à masquer ce résultat. Par contre, ce calcul montre que l'Intégrale en question augmente indéfiniment pour r infini positif. Seule l'une des deux autres intégrales reste finie lorsque r est très grand. mais elle devient Infinie elle aussi pour r = o. Par conséquent, dans le cas 1 5 n le problème n'a pas de solution.
o.
a)
> n - Dans ce cas, c1 est un zéro e t c2 un pôle de l a fonction à intégrer, d'ordre au moins égal à 1. On obtient deux intégrales indépendantes : l'une correspondant à un chemin qul part de z = -00 e t conduit à zéro, en prenant la précaution d'éviter le pôle ; l'autre fournie par le reSidu correspondant à celui-ci. C'est cette dernière qui est notre transcendante entière. Ecrivons-la explicitement, après l'avoir multipliée toutefois par r", ce qui nous donne, d'après (9) e t (lo), la solution de notre équation du début
x
Sources et évolution de la physique quantique
106
(7). (La constante multiplicative a été choisie arbitrairement d'une façon convenable). O n trouve
(18) représente effectivement une solution utilisable car elle reste finie pour toutes les valeurs réelles non négatives de r. De plus, elle s'annule exponentiellement à l'infini, ce qui montre que la condition (6) sur la surface à l'infini est satisfaite. R&umons les résultats dans le cas des valeurs de E négatives : Pour E négatir. notre problème de variations n'a de solution que s i E satisfait a la condition (15). Dans ce cas, le nombre entier, n, qui donne /'ordre des fonctions sphériques apparaissant dans la solution, ne doit prendre que des valeurs plus petites que i (et ilexiste toujours au moins une valeur qui satisfasse à ces condltions). La partie de la solution qui dépend de r est donnée par (18). En dénombrant les constantes des fonctions sphériques (on sait qu'il y en a 2n 1), on obtient ensuite le résultat suivant : Pour toute combinaison permise (n, I ) la solution obtenue contient exactement 2n+ 1 constantes arbitraires ;par conséquent, pour une valeur de 1 donnée elle en contient
+
12.
Nous avons donc démontré dans leurs grandes lignes les théorèmes relatifs au spectre de valeurs propres de notre problème de calcul de variations, que nous avions énonc6s au début, cependant il subsiste encore des lacunes. Premièrement, il manque la démonstration que l'ensemble de toutes les fonctions propres indiquées forme un système complet. Je ne m'occuperai pas de cette question ici. II est permis de supposer. d'après l'expérience que nous avons des cas analogues, qu'aucune valeur propre ne nous a échappé. Deuxièmement, Il faut nous rappeler maintenant qu'on ne peut pas affirmer sans plus que les fonctlons propres correspondant à des E positifs satisfont a notre problème sous ia forme sous laquelle il a été énoncé au début ; en effet à l'infini elles ne s'annulent que comme l/r, donc sur une sphère de grand rayon,
84 ne tend pas vers zéro que ap
comme i/r*. II s'ensuit qu'à l'infini l'intégrale de surface (6) est encore de l'ordre de grandeur de 616. Si l'on veut donc obtenir réellement un spectre continu ilfaut ajouter au problème une seconde condition : par exemple que 616 s'annule à l'infini ou, au moins, qu'il tende vers une valeur constante, quelle que soit l a direction spatiale dans laquelle on s'éloigne ; dans ce dernier cas, ce seront les fonctions sphériques qui annuleront l'intégrale (6).
2.
L a condition (15) donne
x
SI l'on donne 5 la constante que nous avons été obligés d'introduire dans (2) Pour des raisons de dimensions, la valeur
K = -h 2a
107
La construction de la nouvelle mécanique
on obtient les niveaux d'énergie bien connus de Bohr, correspondant aux termes de Balmer. On a. en effet,
2 2 me'
-E1 = hlP . principal. n 1 est
(19')
+
Notre i est le nombre quantique analogue au nombre quantique azimutal et on peut mettre en parallèle la séparation de ce nombre en deux autres à laquelle conduit l'expression exacte des fonctions sphériques, avec le dédoublement du quantum azimutal en un quantum " équatorial e t un quantum " polaire Ces nombres déterminent ici le système des lignes nodales sur la sphère. De même, le " nombre quantique radial ", I n 1 détermine exactement le nombre des ' I sphères nodales " ; on peut, en effet, s'assurer facilement que la fonction f(z)de (la) a précisément I-n-1 racines réelles e t positives. Les valeurs positives de E correspondent à l'ensemble continu des trajectoires hyperboliques, auxquelles on peut attribuer en un certain sens le nombre quantique radial 03. Ceci correspond, ainsi que nous l'avons vu, au fait que les solutions respectives oscillent constamment à l'infini. II est encore intéressant de constater qu'en général le domaine dans lequel les fonctions (18) sont sensiblement différentes de zéro, et dans lequel elles oscillent est en tout cas du même ordre de grandeur que le grand axe de l'ellipse correspondante. L'argument de la fonction f , dépourvue de constante multiplicative, se prkente sous la forme d'un produit entre le rayon vecteur et un facteur qui est, naturellement, l'Inverse d'une longueur ; sa valeur est donnée par
".
- -
où ai est le demi-axe de la
iéme trajectoire elliptique.
et de la relation bien connue
Ei =
(Ces équations découlent de (19)
. 2ai ez )
Les nombres (21) donnent l'ordre de grandeur du domaine des racines pour I et n petits ; dans ce cas on peut admettre en effet que les racines de f(z) sont de l'ordre de grandeur de l'unité. II n'en est plus ainsi évidemment dans le cas où les coefficients de polynomes sont des grands nombres. Je ne veux pas discuter ici la question du calcul précis de ces racines mais j'ai bon espoir que l'hypothèse précédente se confirmera très exactement.
3. On est évidemment t r b tenté de rattacher la fonction 111 à un phénomène de vibration intra-atomique, ayant un caractère de réalité beaucoup plus prononcé que celui, si souvent mis en doute actuellement, des trajectoires électroniques. Primitlvernent j'avais eu l'intention, moi aussi. de fonder la nouvelle conception des conditions de quanta sur une hypothèse de ce genre, qui a l'avantage d'être a coup sOr beaucoup plus intuitive que d'autres ;j'ai préféré cependant la forme mathématique parfaitement neutre utilisée dans ce qui précède, parce qu'elle a l'avantage de mettre plus clairement en évidence l'essentiel de la question. Selon moi. cet essentiel consiste en ce que dans la nouvelle conception les règles de quanta ne contiennent plus trace de cette mystérieuse condition des nombres entiers ", qui se trouve pour ainsi dlre rejetée sur un autre plan : elle résulte du simple 'I
Sources et évolution de la physique quantique
108
fait qu'une certaine fonction spatiale reste finie, unique et bien déterminée dans tout l'espace de configuration. Je ne tenterai pas de discuter ici d'une façon plus précise les possibilités de représentation d'un pareil phénomène de vibrations, avant qu'on ait résolu avec succès au moyen des nouvelles méthodes, un certain nombre de problèmes particuiiers. En effet, ii est apr& tout possible que ces méthodes n'apportent rien de nouveau et que leur ensemble ne constitue finalement qu'une théorie calquée identiquement sur ia théorie ordinaire des quanta. Par exemple, il est tout à fait remarquable de constater que si l'on résout le problème relativiste de Kepler d'après les indications précédentes. on trouve que les deux nombres quantiques partlels (le quantum azimutal e t le quantum radiai) doivent nécessairement Etre demi-entiers. En tous cas, qu'il me soit permis d'ajouter encore quelques remarques au sujet de cette représentation ondulatoire des phénomènes intra-atomiques. Avant tout, je ne saurais passer sous silence le fait que je dois l'impulsion première qui a fait éclore ce travail pour la plus grande part à la remarquable thèse de M. Louis de Broglie' ;j'ai été amené aux considérations precedentes en réliechisant à la distribution spatiale de ces " ondes de phase ", dont M. de Broglie a montré qu'il y en a toujours le long de la trajectoire un nombre entier par période ou quasi-période de i'électron. La principale différence entre ses résultats et les ndtres consiste en ce que de Broglie imagine des ondes progressives, tandis que si l'on interprète nos formules au moyen d'une hypothèse ondulatoire, on est conduit â des vibrations propres statlonnalres. J'ai montré récemment' qu'on peut fonder la théorie des gaz d'Einstein sur des considérations qui introduisent des vibrations propres stationnaires, obéissant 2 la loi de dispersion des ondes de phase de de Broglie. Les observations que nous avons développées plus haut dans ie cas de i'atome pourraient être considérées comme une généralisation directe de nos remarques précédentes sur ia théorie des gaz. Si i'on admet que chaque fonction (18) multipliée par une fonction sphérique d'ordre n d k n t un phenornene ondulatoire intra-atomique, il faudrait neessairement admettre qu'il existe une certaine relation entre la fféquence de ce phénomène et la grandeur E. Or, dans les problèmes de vibrations, on est toujours habitua à trouver que ie paramètre de l'équation fondamentale (ordinairement désigné par est proportionnel au carré de la fréquence. Mais dans notre cas cela semble impossible : premikrement, parce qu'on serait conduit à des fréquences imaginaires pour les valeurs négatives de E qui correspondent précisément aux termes de Balmer : deuxièmement, parce que i'intuition avertit le théoricien que l'énergie doit être proportionnelle plutôt à la première puissance de la fréquence qu'à son carré. La contradiction se r h u t de ia façon suivante6. Jusqu'à present nous n'avons pas pu definir un niveau zéro naturel du " paramètre " E, de notre équation (s), et cela particulièrement à cause du fait que la fonction inconnue y est multipliée non seulement
x)
'
L. de Broglie, Ann. de Physique (lo),
Physikaliscbe Zeitschrfi,
3, 22 (1925), (Thèse, Paris, 1924).
27,95 (1926).
Les raisonnements qui suivent font allusion au traitement relativiste du problème. que je posséd-ais déjà au moment où j'écrivais ces lignes (voir plus haut). La forme des ces raisonnements ne me piait plus aujourd'hui ; elle risque d'entraîner des malentendus. (Remarque de l'auteur, 1932).
109
La construction de la nouvelle mécanique
par E,mais encore par un autre facteur, fonction de r, auquel on peut ajouter arbitrairement une constante pourvu que l'on modifie convenablement le niveau zéro de E. II s'ensuit qu'il faudra corriger *' les prévisions du théoricien des ondes " e t admettre que le carré de la fréquence n'est pas proportionnel au paramètre E lui-même, c'est-à-dire à la grandeur physique que nous avons appelée e t que nous continuerons à appeler par ce nom mais bien à E plus une certaine constante. Admettons maintenant que cette constante soit très grande par rapport aux valeurs absolues de tous les E négatifs qui interviennent dans le problème [et qui sont déjà limités par la conditon (15)]. Dans notre cas, les fréquences sont réelles, et de plus. nos valeurs de E qui correspondent à des différences de fréquences relativement petites, seront effectivement proportionnelles à ces différences, à très peu près. C'est tout ce que " l'intuition " d'un théoricien des quanta peut raisonnablement exiger, tant qu'on n'aura pas défini d'une façon plus précise un niveau nul pour l'énergie du système considéré. L'hypothèse suivant laquelle la fréquence du phénomène ondulatoire est donnée par une formule du type suivant :
-
où C représente une constante très grande par rapport à tous les E . possède en outre un autre avantage très précieux : elle nous facilite la compréhension des conditions de fréquence de Bohr. D'après ces conditions les fi&uences d'émission sont proportionnelles aux ditrérences entre deux valeurs de E ; donc d'après (22), elles sont également proportionnelles aux différences entre deux fréquences propres Y de notre phénomène ondulatoire. Ces fréquences propres sont très grandes par rapport aux fréquences d'émission, e t elles ont presque la même valeur. Par conséquent, les fréquences d'émission se présentent sous la forme de " sons de battement " graves, formés à partir d'oscillations propres qui se poursuivent avec des fréquences incomparablement plus élevées. II est très facile d'admettre qu'au moment où l'énergie se transporte d'une vibratlon propre à une autre, quelque chose apparaisse auquel il faille attribuer une fréquence égale à la différence des frequenw fondamentales ; ce quelque chose sera l'onde lumineuse correspondante ; il n'est pas nécessaire du tout ni de supposer qu'il existe un lien causal quelconque entre l'onde de lumière e t les battements qui se produisent en chaque point de l'espace pendant toute la durée de la transition - ni d'admettre que ia fréquence de cette lumière soit déterminée par le nombre de fois que l'intensité de ces battements prend sa valeur maxima par seconde. On peut être endin à douter de l'exactitude des considérations précédentes si l'on écrite MUS sa forme appmxlmb tient compte qu'elles sont basées sur la relation (Z), tive (c'est-à-dire après extraction de la racine carrée), ce qui confere en apparence à la condition de Bohr elle-même, le caractère d'une formule approchée. Mais cette difficulté n'est qu'apparente e t on peut l'éviter complètement en développant la théorie ondulatoire sous sa forme relativiste, qui seule permet de penétrer plus avant dans l'essence meme des phénomènes examinés. La très grande constante additive est étroitement liée à l'énergie au repos de l'électron rn2. La théorie relativiste également résout ou évite la difficulté qui rCsulte du f a i t qu'en apparence la constante h [déjà introduite par ( Z O ) ] se présente une seconde fois e t de façon indépendante. Malheureusement, le
c
110
Sources et évolution de la physique quantique
développement rigoureux de cette théorie rencontre encore à l'heure actuelle certaines difficult& non négligeables, que nous avons d'ailleurs signalées plus haut. II est à peine nécessaire de remarquer à quel point une représentation des phénomènes qui ferait intervenir au moment d'une transition quantique un simple échange d'énergie entre deux formes de vibrations distinctes, serait plus facilement acceptable que l'image actuelle des électrons qui sautent d'un niveau sur un autre. Le changement de forme d'une oscillation est un phénomène qui peut avoir lieu dans l'espace et le temps ; il peut durer autant que durent expérimentalement les processus de l'émission (expériences sur les rayons canaux de W. Wien). De même si, durant cette transition on soumet l'atome pendant un temps relativement court, à l'action d'un champ électrique qui modfie w fréquences propres, les fréquences de battement seront instantanément modifiées elles aussi et la modification cessera dès qu'on aura arrêté l'action du champ électrique perturbateur. L'lnterprétation correcte de ces faits expérimentaux rencontre jusqu'à présent des difficultés considérables : voir par exemple la dixussion de ces faits dans l'essai bien connu de Bohr-Kramers-Slater). Du reste, dans la joie que nous procure la possibilité que nous avons acquise maintenant de nous représenter ces phénomènes sous un aspect plus familier et plus intuitif, il ne faut pas perdre de vue une chose capitale. Notre représentation admet que lorqu'un atome ne rayonne pas il oscille toujours avec une fréquence propre unique ; mais il ne faut pas oublier que cette image, - m&me si elle &ait correcte et s i on devait la garder, - s'éloigne encore beaucoup de l'image normale d'un système oscillant. En effet, on sait qu'un système macroscopique ne vibre pas de cette manière, mais fournit en général tout un pot pourri d'oscillations propres. Cependant il ne faut pas se hâter de conclure sur ce point car l'existence de tout un pot pourri d'oscillations propres ne changerait rien au phénomgne, puisqu'elle ne ferait apparaïtre aucune fréquence de battement, en dehors de celles que l'atome lui-même peut émettre expérimentalement. L'émission simultanée par un même atome de plusieurs de ces raies spectrales ne serait pas en contradiction avec l'expérience. On pourrait très bien s'imaginer que l'atome oscille avec une seule fréquence propre, uniquement lorsqu'il se trouve dans l'état normal (ou approximatlvement, dans certains états '' métastables ") et qu'il ne rayonne pas, précisément parce que, ne disposant pas d'une fréquence unique, il ne peut pas provoquer des battements. L'excitation de i'atome consisterait alors en la mise en branle d'une ou plusieurs autres vibrations propres, ce qui provoquerait l'apparition de battements, donnant à leur tour lieu à l'émission de lumière. En tout cas, je suis enclin à croire qu'en général les fonctions propres appartenant a la même fréquence sont toutes excitées simultanément. En effet, le cas des valeurs propres multiples correspond, dans le langage de la théorie admise Jusqu'à présent, à la dégénérescence du systeme considéré. La réduction de la quantMcation des systèmes dégénérés devrait donc correspondre à la distributlon arbitraire de l'énergie parmi les fonctions appartenant à une même valeur propre.
Note ajoutée à la w m c t i o n le 28. II. 1916 Dans le cas de la mécanique classique des systèmes conservatifs on peut donner à notre problème un énoncé plus élégant que le précédent, sans faire explicitement appel à l'équation aux dérivées partielles de Hamilton.
111
La construction de la nouvelle mécanique
Soit T(q,p) l'énergie cinétique exprimée en fonction des coordonnées et des moments, V l'énergie potentlelle, dt l'élément de volume de l'espace de configuration, mesuré d'une façon ratlonneile ", c'est-à-dire égal au produit dqidq2.. dqn, divis6 par la racine carrée du discriminant de la forme quadratique T(q,p).(Cf. Gibbs, Mécanique Statistique). IIs'agit alors de déterminer $ de façon que I"' intégrale de Hamilton ''
.
I'
soit stationnaire, en tenant compte des conditions de norrna/isation
I
4' dr = 1.
(24)
Les valeurs propres de ce problème du calcul des variations sont les valeurs qui rendent l'intégrale (23) stationnaire ; d'après notre hypothèse, elles donnent /es niveaux quantiques d'énergie. Remarquons enfin, à propos de (14"), que la grandeur ' a représente, en somme, l'expression bien connue de Sommerfeld
--B +
JA
( d. Atmbau *I
", 4'
éd.. p. 775).
Institut de Physique de l'Université, Zürich
Article XI
La mécanique des matrices Réinterprétation en théorie quantique de relations cinématiques et mécaniques
WERNER HEISENBERG ZeitschrMt fiir Physik,
33,879-893(1925) (Springer-Verlag) (29juillet 1925)
[traduit par B. Escoubès] Cet article vise à fournir les bases d’une mécanique théorique quantique exclusivement fondée sur des relations entre des grandeurs en principe observables. On sait bien que les règles formelles utilisées en théorie quantique pour calculer des grandeurs observables telles que l’énergie d’un atome d’hydrogène peuvent être sérieusement mises en question en avançant qu’elles contiennent, comme élément fondamental, des relations entre des grandeurs qui sont apparemment inobservables en principe, comme par exemple la position e t la période de révolution d’un électron. Ces règles souffrent donc d’un évident manque de bases physiques, à moins que l’on ne continue à garder l’espoir que les grandeurs jusqu’ici inobservables puissent un jour faire partie du domaine des mesures expérimentales. On pourrait estimer que cet espoir est justifié si les règles mentionnées ci-dessus avaient une consistance interne et étaient applicables à une classe bien définie de probl&nes de mécanique quantique. L‘expérience montre cependant que seuls l’atome d’hydrogène et l’effet Stark sont susceptibles d’être traités par ces règles formelles de la théorie quantique. Des difkultés fondamentales se présentent déjà dans le problème des champs croisés ” (l’atome d’hydrogène placé dans des champs électrique et magnétique de directions différentes). La réaction d’atomes à des champs variant périodiquement ne peut, elle non plus, être décrite par ces règles. Et l’extension des règles quantiques à la description des atomes ayant plusieurs électrons s’est révélée finalement impossible, elle aussi. On a pris l’habitude de caractériser cet échec des règles de la théorie quantique comme une déviation de la mécanique classique, puisque ces règles étaient essentiellement déduites de la mécanique classique. Les caractériser ainsi a cependant peu de sens, quand on se rend compte que la condition de Einstein-Bohr pour les fréquences (qui est valide dans tous les cas) s’écarte déjà tellement de l a mécanique classique. ou plutôt (du point de vue de la théorie ondulatoire) de la cinématique qui sous-tend cette mécanique, que même pour le plus simple des problèmes de la théorie quantique la validité de la mécanique classique ne peut tout simplement plus être sauvegardée. Dans cette situation. il parait judicieux d’abandonner tout espoir d’observer des grandeurs jusqu’ici inobservables, comme la position et la période d’un électron. e t d’admettre que l’accord I’
La construction de la nouvelle mécanique
113
partiel entre les règles quantiques et l'expérience est plus ou moins fortuit. Au lieu de cela, ilsemble plus raisonnable de tenter d'établir une mécanique de la théorie quantique, analogue à la mécanique clasjique, mais dans laquelle seules apparaissent des relations entre des grandeurs observables. O n peut considérer la condition sur les fréquences et la théorie de la dispersion de Krarners' ainsi que leurs développements dans des articles récents' comme les premiers pas les pius importants vers une mécanique quantique de la sorte. Dans cet article, nous cherchons à établir quelques nouvelles relations de mécanique quantique et à les appliquer à l'analyse détaillée de quelques problèmes spéciaux. Nous nous sommes restreints à des problèmes n'ayant qu'un degré de liberté.
1. En théorie classique, le rayonnement émis par ,un électron en mouvement (dans la zone d'ondes, c'est-à-dire dans la région ob e t fi sont du même ordre de grandeur en l/r) n'est pas entièrement déterminé par les expressions
mais des termes supplémentaires apparaissent à l'ordre suivant d'approximation, c'està-dire des termes de la forme e6U/rc3. que l'on appelle " rayonnement quadripolaire A des ordres plus élevés. des termes tels que eUU2/rc4 apparaissent. De.cette manikre, l'approximation peut être poussée jusqu'à un ordre arbitrairement élevé. (Les symboles suivants ont été employés : 4 sont les intensités des champs en un point donné, t est le vecteur entre ce point e t la position de l'électron, O est la vitesse e t e la charge de l'électron). On peut se demander quelle forme ces termes d'ordre plus élevé prendront en théorie quantique. Les approximations d'ordre plus élevé se calculent facilement en théorie clas-. sique si le mouvement de l'électron est exprimé en série de Fourier, et on s'attend à un résultat semblable en théorie quantique. Ce point n'a rien à voir avec l'électromagnétisme, mais est plutôt e t ceci semble particulièrement important de nature purement cinématique. Nous pouvons poser la question MUS sa forme la plus simple de la manière suivante : si au lieu d'une grandeur classique z(f) nous avons une grandeur théorique quantique, quelle grandeur de théorie quantique apparaitra à la place de z(t) ? Avant de répondre à cette question, il est nécessaire d'avoir à l'esprit qu'en théorie quantique, il n'a pas été possible d'associer un électron à un point de l'espace, considéré comme fonction du temps, au moyen de grandeurs observables. Cependant, même en théorie quantique, il est possible d'attribuer à un électron une émission de rayonnement. Afin de caractériser ce rayonnement, il faut d'abord obtenir les fréquences qui apparaissent en fonction de deux variables. En théorie quantique, ces fonctions sont de la forme :
".
e,
-
-
1 v(n,n -a) = -{W(n)
h
- W(n -a)},
e t en théorie classique, elles sont de la forme :
1
dW
v ( n , a )= av(n)= a--. h dn H.A. Kramers. Nature 113 (1924) 673.
M. Born, Zeit. f. Phys. 26 (1924)379. H.A. Kramers e t W. Heisenberg, feit. f. Phys. 31 (1925) 681. M. Born et P. Jordan, Z e k f. Phys. (en cours de publication) [33 (1925) 4791.
Sources et évolution de la physique quantique
114
(Ici nous avons nh = J , où J est l'une des constantes canoniques). Pour caractériser la comparaison entre les théories classique et quantique en ce qui concerne ia fréquence, nous pouvons écrire les relations de combinaison : Théorie classique :
+
v(n,a) v( n,B ) = v(n,a
+ 8).
Théorie quantique :
v(n,n ou v(n
- a)+ v(n - a,n - a - 8) = v(n,n - a - 8)
- P,n - a - p) + v(n,n -8)
= v ( n , n - a - ,û)
Afin de compléter la description du rayonnement, il nous faut avoir non seulement
les fréquences mais aussi les amplitudes. Les amplitudes peuvent être traitées comme des vecteurs complexes, chacun étant déterminés par six composantes indépendantes, e t ils déterminent à la fois la polarisation e t l a phase. Les amplitudes étant aussi fonction des deux variables n e t a,la partie correspondante du rayonnement est donnée par les expressions suivantes : Théorie quantique :
Re{m(n,n - a) e iu(n+-~)i
1.
(1)
A premiere vue. la phase contenue dans %Semble dénu& de Sens physique en théorie quantique, puisque dans cette théorie les fréquences ne sont pas en général commensurables avec leurs harmoniques. Cependant nous verrons dans un instant qu'en théorie quantique aussi la phase a une signification physique précise qui est analogue a sa signification en t h b r i e classique. Si nous considérons à preent une grandeur donnée z(f) en théorie ciassique, elle peut être regardée comme repraentée par un ensemble de grandeurs de la forme %,(n) e idn)ot,
lesquelles, suivant que le mouvement est périodique ou non, peuvent être combinées en une somme ou une intégrale représentant z ( t ) :
u=-m
OU
La construction de la nouvelle mécanique
115
Une combinaison semblable des grandeurs correspondantes en théorie quantique semble impossible à effectuer p'une manière unisue et n'a donc pas de sens, en raison du poids égai des variables n e t n;a. Cependant, l'on peut facilement considérer l'ensemble des grandeurs fü(n,n a) e iw(n*n-a)f comme une representation de la grandeur z(t) e t tenter alors de répondre à l a question ci-dessus : comment la quantité z ( f ) 2 doit-elle être représentée ? L a réponse en théorie classique est manifestement :
-
+W
e idn)(o+@-a)t
gfl(,)e iw(n)@< =
(3)
a=-m
ou
de sorte que +m
ou, respectivement,
-
Lm +OD
Qg(n) e iw(n)f11d/3.
(6)
En théorie quantique, II semble que I'hypothke la plus simple e t la plus naturelle consiste à remplacer les équations (3) e t (4) par :
ou
-
+m
Lm
Il(n,n
- a)!U(n- a,n - /3) e i"'(nln-fl)fda
7
(8)
et de fait ce type de combinaison est une conséquence presque toujours nécessaire des r&ies de combinaison des fréquences. En faisant les hypothèses (7) et ( 8 ) , on se rend compte que les phases de la grandeur quantique fü ont exactement la même signification phplque que leurs analogues classiques. Seule l'origine de l'échelle de temps e t donc un facteur de phase commun à tous les fü est arbitraire, et par conséquent est dénuée de signification physique, mais les phases des fü lndlvidueis interviennent de manière essentielle dans la quantité Q3. Une interprétation géométrique de ces relations de phase en theorle quantique, en analogie avec celles de la théorie classique ne semble guère possible actuellement. Si nous recherchons à present une représentation de la grandeur z(t)' nous trouvons sans dltAculté :
Voir aussi H.A. Kramers et W. Heisenberg, ioc. cit. Les phases interviennent de manière essentielle dans les expressions qui y sont utilisées Dour la quantitë de mouvement induite par la diffusion.
Sources et évolution de la physique quantique
116
Théorie quantique :
e t les formes intégrales correspondantes.
De manière semblable, on peut trouver en théorie quantique une représentation pour toutes les grandeurs de la forme z(f)", et, étant donné une fonction f[z(t)], on peut toujours trouver l'expression correspondante en théorie quantique, à condition que cette fonction puisse etre développée en série de puissances de z. Une difficulté essentielle apparait cependant si nous considérons deux grandeurs z(f) et y(f), et cherchons leur produit z(t)y(f). Si z(f) est caractérisé par a et y(f) par 8, nous obtenons pour z(t)y(t) la représentation suivante : Théorie classique : +m
ép(n) =
C
~a(n)~p-a(n)-
a=-m
Théorie quantique :
u=-w
qu'en théorie classique. z(t)y(t) est toujours égal à y(t)z(t). ce n'est pas nécessairement le cas en théorie quantique. Dans des cas spéciaux, comme par exemple pour l'expression z(f)z(f)2.cette difficulté ne se produit pas. Si, comme ce. fut le cas au début de cette section. on s'intéresse à des produits de la forme u(t)u(t), alors, en t h h r i e quantique. le produit u i ) ( f ) doit ëtre remplacé Gu). afin que vi, soit bien la différentielle de )u'. D e manière semblable, par )(UV il devrait toujours être possible de trouver des expressions naturelles pour les valeurs moyennes en théorie quantique, même si celles-ci peuvent être encore'plus hypothétiques que les formules (7) e t (8). A part la difficulté que nous venons de mentionner, les formules du type (7) et (8) devraient en général suffire à exprimer l'interaction des électrons dans un atome par les amplitudes caractéristiques des électrons. AIWS
+
2. Après ces considérations concernant la cinématique de la théorie quantique, notre attention portera sur les problèmes dynamiques qui visent à déterminer les !&v,W à partir des forces données du système. résolu en deux étapes :
Dans la théorie précédente, le problème était
La construction de la nouvelle mécanique
117
1. Intégration de l'équation du mouvement
3 + f(2) = o.
(11)
2. Détermination des constantes du mouvement périodique grâce à :
Si l'on cherche à construire un formalisme en théorie quantique qui corresponde le plus étroitement possible à celui de la mécanique classique, il est tout à fait naturel d'introduire l'équation du mouvement (11) directement dans la théorie quantique. A ce niveau, il est cependant nécessaire - afin de ne pas s'écarter de ia base solide qu'offrent ces grandeurs en principe observables - de remplacer les grandeurs 2 et f(z) par leurs représentations en théorie quantique. comme on l'a fait au $1. En théorie classique. il est possible d'obtenir la solution de (11) d'abord en exprimant z en série de Fourier ou en intégrale de Fourier avec des coeficients (et des fréquences) indéterminés. En général, on obtient alors un ensemble infini d'équations contenant un nombre infini d'inconnues, ou bien des équations intégrales, qui peuvent se réduire à de simples relations de récurrence pour % dans des cas spéciaux seulement. En théorie quantique, nous sommes à présent forcés d'adopter cette méthode pour résoudre l'équation (il) puisque, comme il a été dit plus haut, il n'est pas possible de définir en théorie quantique une fonction directement analogue à ia fonction z(n, t ) . Par conséquent, la solution de (11) en théorie quantique n'est possible que dans les cas les plus simples. Avant de considérer ces exmples simples, donnons une réinterprétation. en théorie quantique, de la détermination de la constante du mouvement périodique à partir de l'équation (12). Supposons (Classiquement) que le mouvement soit périodique :
(13) d'où
mi = m
E
a,(n) iaw, e
a=-Co
et
- d f mk
dz =
De plus, comme a-,(n)
+W
m i 2 dt = 2x771
-
aa(n)a-,(n)a2w,.
a=--
= aa(n) car z doit être réel,
/
ii s'ensuit que
+mkZ d t = 2 x m
laa(n)l*a2w,.
(14)
a=-m
Dans la théorie antérieure, cette intégrale de phase était habituellement prise égale à un multiple entier de h, c'est-à-dire égale à nh, mais une telle condition ne rentre pas naturellement dans le calcul dynamique. Ceci apparaît arbitraire au sens du principe de
Sources et évolution de la physique quantique
118
correspondance, même si on le considère du point de vue adopté]usqu'ici, car de ce point de vue, les J ne sont déterminés qu'à une constante additive près comme des multiples de h. Au lieu de (14) il serait plus naturel d'écrire d
-(nh) dn
d
=dn
f
rni2dt,
c'est-à-dire. 4-00 0s-00
-..
Une telle condition ne détermine les amqu'à une constante près, et cette indétermination donne lieu dans i a pratique à des difficultés dues à l'apparition de nombres quantiques demi-entiers. Si nous cherchons une reiation en théorie quantique correspondant à (14) et (15) e t ne contenant que des observables, l'unicité qui a été perdue sera automatiquement restaurée. Nous devons admettre que seule l'équation (15) peut se reformuler de manière simple en théorie quantique, liée à ia théorie de la dispersion de Kramers4 : +w
h = 47rm c { l a ( n , n
+ a)12w(n,n + a)- la(n, n - &)('w(n, n - a)}.
(16)
o=o
Cette relation suffit, elle. à déterminer les a de manière unique, puisque la constante indéterminée contenue dans les quantités a est automatiquement fixée par la condition qu'un état fondamental, à partir duquel aucun rayonnement n'est émis. doit exister. Dénotons cet état fondamental par no ; nous devrions alors avoir a(n0,no a) = O (pour O > O). Donc nous pouvons nous attendre à ce que la questlon de la quantification en entiers ou en demi-entiers ne se pose pas dans une mécanique quantique basée exclusivement sur des relations entre quantités observables. Les équations (11) e t (16), si elles sont solubles, déterminent complètement non seulement des valeurs des fréquences et des énergies, mais aussi des probabilités de transition de la théorie quantique. Cependant, l a solution mathématique effective ne peut être obtenue que dans les cas les plus simples. Dans beaucoup de systèmes, par exemple l'atome d'hydrogène, une complication partlculiëre se produit car les solutlons correspondent à un mouvement qui est en partie périodique, e t en partie non périodique. Conséquence de cette propriété : les séries de théorie quantique (7). (8) et l'équation (16) se décomposent en une somme et une intégrale. En mécanique quantique, ce type de décomposition en " mouvement périodique et non périodique " ne peut être mené en général. Néanmoins. on pourrait considérer les équations (11) e t (16) comme une solution satisfaisante. au moins en principe, du problème dynamique, s'il était possible de montrer que cette solution est en accord (ou de quelque maniare n'entre pas en contradiction) avec les relations de mécanique quantique que nous connaissons en ce moment. O n
-
Cette reiation a dé à été démontrée à partir de considération de dispersion par W. Kuhn, Zeit. f.Phys. 33 l1925) 408. et par W. Thomas, Naturwiss. 15 (1925) 627.
La construction de la nouvelle mécanique
119
devrait pouvoir montrer, par exemple, que l'introduction d'une petite perturbation dans ie problème dynamique conduit à des termes additionnels pour l'énergie, ou pour la fréquence, du type de ceux frOUvéS par Kramers et Born - mals non du type donné par la théorie classique. D'autre part, on devrait aussi rechercher si l'équation (II), dans sa forme de théorie quantique actuelle, conduit en général à une une intégrale pour l'énergie ;miz = const., et si i'énergie qu'on en déduit satisfait la condition AW = hv,
+ u(z)
en analogie avec ia condition classique v = alv/aJ. Une réponse générale à cette question mettrait à lour les connexions intrinsèques entre les recherches antérieures en mécanique quantique, et préparerait le chemin vers une mécanique quantique consistante, uniquement basée sur des quantites observables. A part la connexion générale entre la formule de dispersion de Kramers et les équations (Il)'e t (16), nous ne pouvons répondre aux questions ci-dessus que dans des cas très spéciaux, qui peuvent être résolus par de simples relations de récurrence. La connexion générale entre la théorie de la dispersion de Kramers et les équations (11) e t (16) est la suivante. De l'équation (il) (pius précisément, de son analogue en théorie quantique), on trouve, comme en théorie classique, que l'électron oscillant se comporte comme un électron libre iorsqu'agit sur lui une lumière de fréquence beaucoup plus élevée que toute fréquence propre du système. Ce résultat découle aussi de la théorie de la dispersion de Kramers si on tient compte en plus de I'équ&ion (16). En fait, Kramers trouve pour la quantité de mouvement induite par une onde de ia forme E c o s 2 ~ v :t
-h
de sorte que pour v
"
2{
2 OD ~ ~
M = e Z ECOS 2
I.
t
la(n,n
> v(n, n f
+ a)IZv(n,n + a) - la(n,n - a)j2v(n,n - a)
vz(n,n + a >
- vz
vz(n, n
- a)- vz
a),
or0
qui, grâce à l'équation (16), devient :
M=3.
2Ee2 w s 2 x v t Wmuz
'
Nous traiterons maintenant l'exemple simple de l'oscillateur anharmonique :
3+w,22+Az2
=o.
(17)
Classiquement, l'équation admet une solution de la forme
z
= A-
+ a1 w s w t + ~a~c o s b t + X'Q
cos^
+ . .+ X+-'a,
cos T W ~ ,
OP les a sont des séries en puissance de A, le premier terme desquelles étant indépendant de A. En théorie quantique, tentons de trouver une expression analogue en représentant z par des termes de la forme
Aa(n,n);
a(n,n- i)cosw(n,n-i)t;
Sources et évolution de la physique quantique
120
Les formules de récurrence qui déterminent les a et les w (jusqu'à des termes en sans les inclure) sont, grace aux équations (3), (4) ou (7) et (8) :
A, mais
Théorie classique :
Théorie quantique :
wiao(n)
+ 41
-[a'(.
+ i , n ) + a'(n,n - 111 -wZ(n, n - i)
+w i
1 [-wz(n,n-2)+w,2]a(n,n-2)+-[a(n,n-I)a(n-1,n-2)] 2 [-wz(n,n - 3) wi]a(n,n - 3 ) 1 1 +z[a(n,n - i)a(n - i , n - 3 ) ] -[a(n,n - 2)a(n - 2,n - 3)] 2 ...
= O; =O; =O;
+
+
= 0;
...
L a condition quantique supplémentaire est :
Théorie classique (J = nh) :
Théorie quantique : m
h = 7rm
Era(.+ r ,n)I'w(n
+ T,n ) - la(n, n - .r)lzw(n,n - T ) ] .
O
Nous obtenons au premier ordre, aussi bien classiquement qu'en théorie quantique :
a:(.)
ou
az(n,n - i) =
+
( n const)h TWO
En théorie quantique, la constante dans l'équation (12) peut être déterminée à partir de la condition : a(n0,nO - 1) doit s'annuler pour l'état fondamental. Si nous numérotons les n de telle sorte que l'état fondamantal ait n = O, c'&-&dire no = O. alon a2(n,n-l) =
nh/xmwO.
121
La construction de la nouvelle mécanique
O n en déduit donc des relations de récurrence (18) qu'en théorie classique, le coefficient ar a (au premier ordre en la forme K(r)n+, où K ( T ) représente un facteur indépendant de n. En théorié quantique, l'équation (19) impllque
x)
K ( T ) est le même facteur de proportionnalité, indépendant de n. Naturellement, pour les grandes valeurs de n, la valeur de ar en théorie quantique tend asymptotiquement vers sa valeur classique. L e pas suivant le plus évident consiste à tenter d'insérer l'expression classique pour l'énergie +miZ $mwiz' ) m h 3= car dans le calcul présent mené à l a première approximation, elle est en fin de compte constante; même si on la traite en théorie quantique. Sa valeur, donnée par (19), (20) et (21). est la suivante :
où
+
+
w,
Théorie classique :
W = nhuo/l>s.
~
(22)
Théorie quantique :
(ies termes en .Az ayant é t é exclus). Donc, du point de vue adopté ici, l'énergie d'un oscillateur harmonique elle-même n'est pas donnee par la " mécanique classique ", c'est-à-dire par l'équation ( 2 2 ) , mais elle a la forme (23). Un calcul plus précis, tenant compte d'approximations à un ordre plus élevé en W,a, w sera maintenant effectué pour l'exemple plus simple d'un oscillateur anharmonique
Z + ~ ; Z + X Z ~ =o. En théorie classique. on peut dans ce cas écrire z = a1 coswt
+ Xu3 c o s h t + XZaSc o s ~+t ... ;
Nous pouvons tenter par analogie dans le cas de la théorie quantique
a(n, n
- i)cosw(n, n - i)t ;
Xa(n, n - 3) msu(n,n
Les quantités a sont une fois encore des séries en puissance de a la forme, comme dans l'équation (21).
- 3)t ;
.. .
dont le premier terme
( n - r)!' comme on peut le voir en évaluant les équations correspondant à (18) e t (19).
Sources et évolution de la physique quantique
122
Si on prockde à l'évaluation de w e t a à partir des équations (18) et (19) Jusqu'à l'ordre ou respectivement, on obtient
x2
w(n,n
- i) =wa +
3nh -A' 8irwom
3h2 256wOm2r2
3nh
a(n,n - 3 ) =
(17n2 +?)+...
+...).
-
(24)
(25)
'J
3 7 3nb - 2) 32 T uom h3 39(n - l ) h +...). 32irwim
L'énergie est définie comme le terme constant dans l'expression
1 -mi2
2
1 1 + -mw~z' + -mXz4 2 4
(Je ne peux prouver en general que tous les termes périodiques finissent par s'annuler, mais c'est le cas pour tous les termes que j'ai évalués). Cette énergie s'écrit donc :
W=
+
(n I b o ) 2ir
+
+ +
X 3 ( n Z n f)h2 8.4ir2wim
51 59 21 - X2 5 1 2h3~worn,(17n3 + -n2 + -p + 2). 2
(27)
Cette énergie peut aussi être déterminée en utilisant l'approximation de Kramers-Born, en traitant ie terme irnXz' comme une perturbation de l'oscillateur harmonique. Le fait que l'on obtienne exactement le même résultat que (27) me semble corroborer de façon remarquable les équations de la mécanique quantique qui ont été prises ici comme point de départ. D'autre part, l'énergie calculée 2 partir de (27) satisfait la relation (voir l'équation (24)) :
qui peut être considérée comme une condition n e a i r e pour permettre la détermination des probabilités de transition en accord avec les équations (il) et (16): Considérons en conclusion le cas d'un rotateur, et portons notre attention aux reiations entre les équations (7), (8) et les formules donnant l'intensité pour l'effet ZeemanS et pour les multiplets'.
'
S. Goudsmit e t
31 (1925) 340.
R. de L. Kronlg, Natumiss. 13 (1925) 90 ; H. Honi, Zeit. f. Pbys.
R. de L. Kronig, Zeit. f. Phys. 31 (1925) 885 ; A. Sommerfeld e t H. Honi, Sitzongsber. d. Preuss. Akad. d. Wiss. (1925) 141 ; H. N. Russell, Nature 115 (1925) 835.
La construction de la nouvelle mécanique
123
Considérons le rotateur représenté par un électron entourant un noyau a une distance constante a. Aussi bien cisassiquementqu'en théorie quantique, les '' équations du mouvement " établissent simplement que l'électron décrit une rotation plane, uniforme, à une distance a et à une vitesse angulaire w autour du noyau. La " condltion quantique '' (16) conduit à, suivant (12) : d
h = -(27rma2w). dn
et, suivant (16)
h = 27rm{a2w(n
+ i , n ) - azw(n,n
- i)},
D'où il suit, dans les deux cas, que : w(n,n
- i) = h(n -tconst) %ma2
'
Exiger que le rayonnement s'annule dans l'état fondamental conduit à la formule
hn w(n,n - 1) = 2nma2
L'énergie est
W
1
= -mu2,
2
ou, grâce aux équations ( 7 ) , (8) : m
W=-a2
w2(n,n-i)+w2(n+i,n)
2
2
hZ =-87r2ma2 (n2 n
1 + + i),
w(n
(29)
expression qui satisfait encore la condition w(n,n - 1) = (27r/h)[W(n) - I)]. En appui à la validité des formules (28) et (29). qui dimrent de celles de la théorie usuelle, on peut mentionner que, suivant Kratzer' beaucoup de spectres de bande (en incluant des spectres pour lesquels l'existence d'une quantité de mouvement pour l'électron est peu probable) semblent exiger des formules du type (28), (29), formules que jusqu'ici, afin d'éviter une rupture avec la théorie classique de la mécanique, on s'efforçait d'expllquer à travers la quantification en demi-entiers. Afin d'arriver à la formule de Goudsmit-Kfonig-HOnl pour le rotateur, nous devons abandonner le domaine des problèmes à un degré de liberté. Supposons que le rotateur ait une dlrection dans l'espace qui soit sujette à une précession tr& lente O autour de l'axe o z d'un champ extérieur. Soit m le nombre quantique correspondant à cette précession. Le mouvement est alors représenté par les quantitC
z : a(n,n
- i;m,m)cosw(n,n - i)t;
' Voir par exemple B. A. Kratzer Sitzungsber.
d. Bayf. Akad. (1922) p 107.
Sources et évolution de la physique quantique
124
Les équations du mouvement sont simplement z2
+ y' + z2 = 2
Tenant compte de (7) cela conduit à'
1 1 -{-a*(n,n 2 2
- l ; m , m ) + b*(n,n - l ; m , m - 1)+ b2(n,n - i ; m , m
+ 1)
1 + -a2(n + 1,n;m, m) + b2(n + 1,n; rn - 1, m) 2 + b2(n + l , n ; m + i , m ) } =O*.
1 2
-a(n, n
- 1;m, m)a(n - 1, n - 2;m, m) = b(n,n-i;m,m+l)b(n-i,n-2;rn+i,m)
+ b(n,n - l ; m , m - l)b(n - 1,n - 2;m - 1,m). On a aussi la condition quantique donnée par (16) :
L e s relations classiques correspondant à ces relations sont
Elles sufFisent (à la constante inconnue près à ajouter à m ) à déterminer Q, b l , bel de manière unique. La solution la plus simple d e s équations de la théorie quantique (30). (31), (32),qui s'offre elle-même est :
b(n,n
- i ; m , m - i) = a
+ + 4).
( n + m i)(n + m ) 4(n
. 3
a(n,n-i;m,m)=a
'
L'équation (30)est essentiellement la même que les règles de somme de Ornstein-
Burger.
La construction de la nouvelle mécanique
125
Ces expressions sont en accord avec les formules de Goudsmit-Kronig et Hbnl. II n'est cependant pas facile de voir que ces expressions représentent la seule solution des équations (30), (31). (32). bien que ceci'me semble probable au vu des conditions aux limites (a e t b s'annulent sur la " frontière " ; voir les articles de Kronig, Sommerfeld et de Han/, Russell cités plus haut). Des considérations semblables à celles-ci, appliquées aux formules donnant l'intensité des multiplets, conduisent au résultat que ces regles d'intensité sont en accord avec les équations (7) et (16). Ce résultat peut lui aussi être vu comme un appui à la validité de l'équation cinématique ( 7 ) . Seule une recherche mathématique intensive sur la méthode employée ici de manière tres superficielle permettra de savoir si une méthode de détermination de quantités de théorie quantique utilisant des grandeurs observables, comme celle-ci. peut être considérée satisfaisante en son principe, ou si une telle méthode ne représente en fin de compte qu'une approche trop grossière au problème physique qui est celui de construire une théorie physique, ce qui est manifestement un problème très compliqué actuellement. Gottingen, 1925
126
Sources et évolution de la physique quantique
3.3 L’interprétation probabiliste de la mécanique
quantique Au moment où l’on découvrait la mécanique quantique, dans les annéeS 19231926 se posait le problème de l’interprétation de son formalisme. L’interprétation du vecteur d’état ou de la fonction d’onde représentant un système physique fut l’objet d’un nombre important de discussions qui conduisirent Max Born à l’imaginer comme une amplitude de probabilité. Comme l’a dit Abraham Pais40 si les lecteurs du premier ariicle de Heisenberg JUP 1a.mécanique quantique avaient une chose en commun avec son auteur, c’était une compréhension inadéquate de ce qui éfaii e n train d’amver. La mathématique n’était pa^ familière, la physique opaque. La découverte de la mécanique ondulatoire par SchrOdinger apporta un soulagement à plusieurs physiciens, car ils étaient plus à l’aise pour traiter les problèmes au moyen d’équations aux dérivées partielles qu’au moyen de matrices à un nombre iniini de lignes et de colonnes une nouveauté alors pour les physiciens. Jusqu’à l’ônnée 1936, ’ la mécanique quantique, dam sa formulation ondulatoire ou mairicielle, était de la haute technologie mathémaiique de type nouveau, manifestement importante pour les réponses qu’elle donnait, m a u s a w principes physiques sous-jacents clairement afirmés Schrodinger proposa que l’on considérât les ondes comme la seule réalité ; les particules seraient alors déduites des ondes. Juste après l’article de Çchr6dinger où il établissait l’équation de continuité, et reliait le Carré du module de la fonction d’onde à la densité de charge, Born publia deux articles sur la mécanique quantique des collision^'^ en 1926 : il y proposait que, dans le déveioppement d‘une fonction d’ondes décrivant l’état d’un système suivant un ensemble d’états propres distincts non-dégénérés, le c a d du module du coeficient c,, d’un état $, donne la probabilité pour que le système se trouve, lOTJ d’une observation, dans cet état. C’était la clé du problème. La solution définitive. Cette interprétation rencontra une grande résistance chez certains physiciens parmi les plus célébres : Einstein, Schrodinger, de Broglie43. Pour de Broglie, l’onde associée à une particule était comme une onde piiote, une conception qu’Einstein avait déjà formulée en affirmant, à propos de la dualité onde-corpuscule, que les ondes électromagnétiques n’étaient là que pour indiquer le chemin aux photons et détenniner la probabilité pour que le photon suive un certain chemin. Cette conception, néanmoins, ne fut ni reprise ni détendue
-
“ A. Pais, I n w d Bound - Ofmatter and f m w in the physicai world, Clarendon Press, Oxford (1986), p 255. ‘I
”
A. Pais,ibid, p 255-256. M. Born, Zeibchr. f. Phys. 57,863 (1926) [Artide XII, page 1291.
Une collection d’artides importants sur l’interprétation de la mécani ue uantique Zurek, forme l‘ouvrage Quantum Theosy and Memuemeni, edité par J.A. Wheder Princeton University Press (1983). On y trouvera la célèbre discussion entre Einstein et Bohr ainsi que la arabole du chat de SchrOdinger, et, entre autres, des contributions de Von Neumann, \$per Bell, et Aspect. Nous avons choisi, pour illustrer ce roblème, l’un des plus beaux t e x b de ce recueil, d u i de F. London et E. Bauer, La l?héoric de I’ObseruOtion m Mécanique Quantique [Artide XIV, page 1.531.
3 Wk
La construction de la nouvelle mécanique
127
par Einstein qui répugnait à donner à notre connaissance une base probabiliste : Le Seigneur ne joue pas a? dés ”. Après la publication par Heisenberg44 des relations d‘incertitude “451 l’bterpdtation de Born commença à être admise par la majorité des physiciens et Ni& Bohr formula le principe de complémentarité4‘ : il existe des Vanables physiques, représentées par des opérateurs A et B qui ne commutent pas :
[A,B]= A B - B A # O L’bdét&nation
des valeurs de A et de B, mesurée par les fluctuations :
AA= où
[< A’> - < A > 2 ] ’ 1 2
< A > est la valeur moyenne de A, satisfait à la relation : AA . A B 2
1
{ - < 1.4,B]>2}1/2
Pour les coordonnées et l’impulsion d’un électron on obtient :
AzjApk=O,
j#k
Ces variables sont appelées complémentaires par Bok. Son principe affirme qu’il est impossible, dans une même observation, de déterminer exactement la valeur de deux variables complémentaires. La raison essentielle de la complémentarité de certaines %&ables provient du fait que l’observation de ces grandeurs s’eiïectue au moyen de la lumière ou de faisceaux de particules dont l’énergie a un minimum - hu pour un photon ou n’importe qu’elle autre p a r t i d e l u étant la fréquence de de Broglie - et ces particules apportent une perturbation au système observé qui empêdie la détermination exacte (AA = O et A B = O) des deux grandeurs A et B. La précision absolue sur l’une de ces variables AA O entraine le manque de connaissance total de la variable complémentaire, A B 400. La construction de la mécanique quantique basée sur le principe de la rep*tation de l’état physique d’un système par un vecteur d’un espace de Hilbert et de la représentation des variables physiques, des observables, par certains opérateurs linéaires définis dans cet espace, commença à prendre forme dans les années 19261930.
Le valeurs possibles d’une variable physique sont les val- propres de l’op& rateur qui la représente. Un dictionnaire qui contient les règles de comqondance entre le formalisme mathématique et le c o n b u physique de la théorie fut établi, qui permit de d e r les concepts et les propositions mathématiques aux résultats des observations et aux expériences elles-mêmes.Si l’état d’un système est connu à -W. Heisenberg, Zcibdr. f. Phys. Is
45,172 (1927).
Plutôt qu’en termes de dationa d’incerWude, il mudrait mieux parler, en français, en termes de relations d’uldétennimfwn. N. Bohr, Nature 121,580 (1929) [Artide XII, page 1331.
‘‘
128
Sources et évolution de la physique quantique
un instant donné, il aura une évolution au cours du temps et l'équation d'évolution
- la fameuse équation de Schrijdinger -
permet de déterminer le vecteur d'état à un autre instant. La prédiction des résultats d'une mesure, d'autre part, est introduite par les probabilités de trouver l'un de ces résultats dans une expérience où l'on mesure une grandeur physique représentée par uq opérateur. Le formalisme de la mécanique quantique'' est aujourd'hui un système théorique logiquement et physiquement cohérent, en accord avec les données expérimentales en physique atomique et moléculaire, en mécanique statistique, en physique nucléaire, en physique des particules et des champs.
De gauche à droite : M. Born, M. von Laue, O. Hahn lor5 d'une réunion des lauréal du Priz Nobel à Lindau en 1951. (Source :Internationes ed., Bad Godesbetg, t o m droits réservés).
'' cf. P.A.M. Dirac, Principles of antum Mechanics, Oxford Universi Press, 1947 ; Le cours de ph =que de F man, v%me 3 InterEditions Paris 1979 . 2 Leite L o p , ~
%
Eneyclopadia bnmersdia us 15, pp 515-516,Paris 19b5 ; J.M. Lé-&-Leblond Laverne, id., Corpus 15,p'p 501>-511.
et
A.
Article XII
L'indéterminisme quantique Sur la mécanique quantique des collisions * MAX Zeitschriff for Physik
BORN
37,863-867(1926) (Springer-Verlag)
(25 juin 1926) Communication préliminaire
[traduit par C. Frick]
Partant d'une étude des collisions, on développe le point de vue suivant : la mécanique quantique de Schrodinger peut décrire non seulement les états stationnaires, mais aussi les sauts quantiques.
La mécanique quantique fondée par Heisenberg n'a jusqu'ici été utilisée que pour calculer les états stationnaires et les amplitudes d'oscillation (à dessein j'emploierai le mot '' probabilité de transition "). Le formalisme qui s'est beaucoup développé depuis lors s'est révélé adéquat. Cependant, cette problématique ne concerne qu'un seul aspect du problème de la théorie quantique ; s'y ajoute la question au moins aussi importante de la nature de la '' transition " elle-même. Sur ce point, les avis sont partagés : beaucoup admettent que le problème des transitions ne peut être traité dans le formalisme actuel de la mécanique quantique, et qu'au contraire de nouveaux concepts sont nécessaires. Impressionné par la complétude de la logique qui sert à construire la meanique quantique, j'ai été amené à supposer que cette théorie était complète et que les problèmes de transition devalent y être inclus. Je pense être arrivé à le prouver. Bohr déjà avait attiré l'attention sur le fait que les difficultés de principe de la représentation quantique que nous rencontrons lors de l'émission et l'absorption de la lumikre par les atomes existent également pour les interactions des atomes à courte distance, c'est-à-dire pour les collisions. Dans ce cas, plutôt qu'à un champ d'ondes encore obscures, on a affaire exclusivement à un système de particules matérielles soumises au formalisme de la mécanique quantique. J'ai abordé le problème consistant à cerner au plus pres l'interaction entre une particule libre (particule a ou électron) et un atome quelconque, e t à déterminer si la description de la collision est possible dans le cadre de la théorie existante.
*
Cette communication fut initialement destinée à " Natunvissenxhaften ", mais elle ne put y etre acceptée par manque de place. J'espère que sa publication ici ne parallra pas superflue.
130
Sources et évolution de la physique quantique
Parmi les différentes formulations de la théorie, celle de Schrodlnger apparaît comme la plus appropriée, et précisément pour cette raison peut être considérée, il me semble, comme représentant la conception la plus approfondie des lois quantiques. L e s étapes de ma réflexion sont les suivantes. Lorsqu'on calcule en mécanique quantique l'interaction de deux systèmes, on sait qu'il n'est pas possible, comme en mécanique classique, en choisissant un état de l'un des systèmes, de déterminer de quelle manière cet état sera influencé par un état de l'autre systeme : en réalité. les états des deux systèmes sont couplés entre eux de manière enchevêtrée. Ceci est égaiement vrai pouf un processus apériodique, tel qu'une colllsion, 00 une particule, disons un électron, vient de l'infini et disparait à nouveau à l'infini. Mais dans ce cas se fait jour l'idée qu'il doit ëtre possible de définir, tant avant qu'aprh la collision, lorsque i'électron est sumsamment éloigné e t que le couplage est petit, un état déterminé pouf l'atome et un état de mouvement rectiligne e t uniforme pour l'électron. Il s'agit donc de définir mathématiquement ce comportement asymptotique des particules couplées. Avec la représentation matricielle de la mécanique quantique, cela ne m'a pas été possible ; avec la formulation de Schradinger, oui. Selon Schradinger. l'état quantique n d'un atome correspond 3 l'oscillation d'une grandeur d'état dans tout l'espace avec une fréquence constante Un électron en mouvement rectiligne est un cas particulier de mouvement oscillatoire correspondant a une onde plane. Lorsque les deux états entrent en interaction, il en résulte une oscillation enchevêtrée. Mais on voit immédlatement que l'on peut la saisir par son comportement asymptotique à l'infini. On n'a plus qu'un '' probleme de diffraction au cours duquel une onde plane incidente sera diffractée ou diffusée par l'atome. A la place des conditions aux limites que l'on utilise en optique pour décrire les écrans, on aura ici l'énergie potentielle d'lnteraction entre i'atome et l'électron. Le problème est donc : résoudre l'équation de Schrodlnger pour l a combinaison atome-éledron avec la condition aux limites que la solution pour une direction donnée de l'espace de l'électron soit asymptotiquement une onde plane se propageant préclsément dans cette dlrection (celle de l'électron incident). Dans ia solution ainsi définie, ie comportement de i'onde diffusée " à I'lnflni, nous intéresse principalement, car celle-ci décrit ce que devient le système après la collision. Allons plus avant. Soient +~(qi)l&(gt)l.,. les fonctions propres de l'atome non perturbe (nous supposons qu'elles ne forment qu'une série discrete). A I'biectron non perturbé (en mouvement rectiligne) correspondent les fonctions propres sin ?(a. &+rz+6), qui forment une multipliclté continue d'ondes planes, dont les longueurs d'onde (suivantte Broglie) sont liées à l'énergie r du mouvement de translatlon par l a relation r = La fonction propre de l'état non perturbé, où l'électron arrive le long de la direction 4-2, est alors :
iw;.
'I
I'
+
&.
Soit V(z, y, z;q k ) l'énergie potentielle de l'interaction atome-électron. On peut alors, à l'aide d'un simple calcul de perturbations, montrer qu'Il existe une solutlon unique de l'équation différentielle de Schradlnger qui, compte tenu de i'interaction se rapproche asymptotiquement pour z + m de la fonction ci-dessus. II nous faut voir à présent comment se comporte cette solution " a p r b la collision
v,
".
La construction de la nouvelle mécanique
131
Le calcul montre que la perturbation crée une onde diffuusée qui prend à l'Infini l'expression asymptotique :
Cela signiiie que la perturbation, regardée depuis l'infini. apparaït comme une superposition de solutions du processus non perturbé. Si l'on calcule les énergies correspondantes aux longueurs d'onde An, selon la formule de de Broglie cl-dessus, on trouve : Wnm
= bun,
+ r.
où les unm sont les fréquences de l'atome non perturbé. Si l'on interprète ces résultats en terme corpusculaire, Il n'y a qu'une interprétation possible : @n"(alb,7) donne la probabilité pour que l'électron venant de la directlon
z soit envoyé dans la direction définie par a1@,r(avec un déphasage 6), son énergie r s'étant en même temps accrue d'un quantum hv:, au détriment de l'énergie de l'atome. (Dans une collision de première espèce on aurait : < ~ , , h u ~ ,< O ; dans une collision de seconde espeCe : > Wz,hu:, > O). Ainsi, la mécanique quantique de Schrodinger donne une réponse précise à la question de l'effet d'une collision, mais il ne s'agit pas d'une relation causale. On ne répond pa's à la question " quel est l'état après la collision 1 ", mais plutot à la question I' quelle est la probabilité d'obtenir un effet donné après la collision 1 " (naturellement en conservant l'énergie en mécanique quantique). Ici se pose tout le problème du déterminisme. Du point de vue de notre mécanique quantique, il n'existe pas de grandeur qui, dans un cas particulier, déterminerait causalement l'effet d'une collision. De même. l'expérience ne nous donne aucune indication qu'une propriété interne de l'atome détermine un résultat donné pour une collision. Devons-nous espérer que l'on découvre plus tard de telles propriétés (comme des phases dans le mouvement interne de l'atome) et que certains cas particuliers puissent être déterminés 1 Ou devons-nous croire que l'incapacité, partagée aussi bien par la théorie que par I'exdrience. de trouver les conditions d'un déroulement causai provient d'une harmonie préetablie, qui repose sur l'Inexistence de telles conditions ? Je serais d'avis, quant à moi. de renoncer au déterminisme dans le domaine de l'atome. Mais ceci est une position philosophique, pour laquelle les arguments physiques à eux seuls sont insuffisants. En pratique, I'lndéterminisme existe dans tous les cas aussi bien pour le physicien experimentateur que pour le théoricien. La " fonction de rendement " a, bien connue des expérimentateurs. est maintenant parfaitement comprise par les théorlciens. O n peut y, z ; q k ) ; cependant les l'exprimer à partir de Mnergie potentielle d'interaction calculs nécessaires sont trop complexes pour ëtre développés ici. Je voudrais seulement éciairer de quelques mots la signification de la fonction @ n? Si par exemple avant le choc l'atome était dans l'état fondamental n = 1, il en résulte :
wn
wn
v(zl
.
7
+ hv;,
= T - hvm, = W i m > O r
Remarque lors de ia correction des épreuves : une réflexion plus approfondie montre que la probabilité est proportionnelle au carré du module de @.
Sources et évolution de la physique quantique
132
C'est-à-dire, que pour un électron d'énergie inférieure à celle du plus petit niveau d'excitation de l'atome, il faut que rn = 1 e t que par conséquent = T. II en résulte donc une
"
réflexion élastique
w11 r
"
de l'électron avec la fonction de rendement
011,Si I r
est supérieur au premier niveau d'excitation, à l a réflexion s'ajoutera l'excitation avec le rendement @ 1 2 , etc. Si l'atome touché par l'électron est dans un état excité r
si T
< hv&. il y
n = 2 et
aura réflexion avec le rendement a 2 2 e t un choc de deuxième espèce
avec un rendement 0 2 1 . Si T r
> hv&,
r
il y aura d'autres excitations, etc.
Les formules reproduisent fidèlement le comportement qualitatif lors des chocs. L'application quantitative de ces formules pour des cas particuliers exige d'ëtre menée à la suite d'une investigation approfondie. II ne me semble pas exclu que les liens étroits qui apparaissent ici entre mécanique et statistique ne conduisent à une révision des concepts fondamentaux de la thermodynamique statistique. Je crois de plus que le problème de l'absorption e t de l'émission de la lumière doit être traité de façon analogue, c'est-à-dire comme un problème de " conditions aux limites '' de l'équation d'ondes, .et que ceci conduira à une théorie rationnelle de l'amortissement et de la longueur des circuits en accord avec la représentation quantique de la lumière. Une présentation détaillée paraîtra prochainement dans cette revue. Gottingen, 1926
Article XIII
Le principe de complémentarité Le postulat quantique et le dernier développement de la théorie atomique
NIELSBOER Nature 121,580-591 (1928) [traduit par L. Rosenfeld e t A. Legros, extrait de : La théorie atomique e t la description des phénomènes, Gauthier-Villars (1 932)*] Le comité du Congrès m'a aimablement invité à donner un r h u m 4 de l'état actuel de la théorie quantique pour servir d'introduction à une discussion générale sur ce sujet, qui attire actuellement l'attention de tous les physiciens : c'est avec grande Joie, mais non sans certains scrupules. que j'accepte cette invitation. Carje vois parmi mes auditeue non seulement le célèbre créateur de la théorie, mais aussi plusieurs physiciens qui, en raison meme de leur contribution récente à son merveilleux développement, seront sans doute plus familiers que moi avec certains aspects du formalisme mathématique si complexe dont on f a i t usage. J'wayerai toutefois, en m'appuyant sur des considérations très simples e t sans entrer dans des détails mathématiques, d'exposer une manière générale d'envisager la question, que je crois susceptible de mettre en lumière des lignes directrices de I'évoJution de la théorie depuis sa première origine ; j'espère que ce point de vue ne pourra que contribuer à concilier les conceptions apparemment contradictoires défendues par différents physiciens. Aucune théorie ne pourrait, mieux que la théorie quantique, caracteriser le développement de la physique pendant le siècle écoulé depuis la mort du grand homme dont nous commémorons l'œuvre. E t c'est précisément dans un domaine comme celui-là, où nous nous hasardons en des sentiers inexplore e t où notre seul jugement peut nous mettre en garde contre les pièges qui nous entourent de toute part, que nous sommes amenés pius que jamais à avoir toujours preente à l'esprit l'œuvre de pionnier accomplie par les vieux maîtres qui nous ont forgé nos outils.
-
1. Postulat quantique et causalité Ce qui caractérise la théorie quantique, c'est qu'elle apporte une limitation essentielle aux concepts de la physique classique dans leur application aux phénomènes atomiques. II en résulte une situation un peu spéciale, provenant de ce que notre interprétation des données experimentales repose essentiellement
*
Traduction de la version allemande, légèrement modifiée par Bohr en 1931 par rapport au texte envoyé à Nature. Pour l'histoire de ce texte historique, la communication de Bohr à la Conférence de Come en commémoration de Volta (1927), voir : Nieis Bohr, Physique atomique et connaissance humaine. Folio E w i s 157 (1991): Nous avons rajouté à cette traduction les références que Bohr a mentionnées dans I'articie de Nature.
134
Sources et évolution de la physique quantique
sur l'emploi des concepts classiques ; c'est pourquoi il est assez difficile de formuler le contenu de la théorie quantique. II semble cependant, comme nous le verrons dans la suite, qu'il soit possible d'exprimer l'essence de la théorie à l'aide du I' postulat quantique '' ; d ' a p r l celui-ci, tout processus atomique présente un caractère de discontinuité, ou plut8t d'individualité, complètement étranger aux théories classiques. et caractérisé par le quantum d'actlon de Planck. Ce postulat nous oblige à renoncer à une descriptlon a la fois causale et spatiotemporelle des phénomènes atomiques. Car dans notre description ordinaire des phénomènes naturels, nous admettions en dernière analyse que I'observation d'un phénomène ne lui causait aucune perturbation essentielle. C'est bien ce que montre également l'énoncé de la théorie de la relativité, qui a tant contribué à élucider les théories classiques. Einstein a remarqué que toute observation ou mesure repose sur la coïncidence au même point de i'espace-temps de deux événements indépendants. Ce sont précisément ces coincidences qui ne sont pas influencées par les différences que peuvent présenter par ailleurs les descriptions spatio-temporelles des divers observateurs. Le postulat quantique, d'autre part, exprime que toute observatlon des phénomènes atomiques entrafne une interaction finie avec l'instrument d'observation : on ne peut par conséquent attribuer ni aux phénomènes n i à l'instrument d'observation une réalité physique autonome au sens ordinaire du mot. De toute façon, le concept d'observation contient un élément arbitraire : il dépend essentiellement du choix des objets comptés comme faisant partie du système observé. En dernière analyse, toute observation peut évidemment être ramenée à nos perceptions sensorielles. Mais comme i'interprétation des observations exige toujours l'emploi d'Idées théoriques, c'est à une questlon de commodité que se réduit, dans chaque cas individuel, le choix du moment où l'on introduit dans la description le concept d'observation, e t avec lui le trait " irrationnel " lié au postulat quantique. Ceci entrame d'importantes conséquences. D'une part, pour définir selon les conceptions ordinaires l'état d'un système physique, il faut faire abstraction de toute action extérieure ; mais alors, d'aprês le postulat quantique, on exclut du m€me coup toute possibilité d'observation : et en premier lieu, les concepts de temps et d'espace perdent leur sens immédiat. S i d'autre part, pour rendre i'observation possible. nous admettons l'éventualité d'interactions avec des instruments de mesure appropriés, qui n'appartiennent pas au système, ildevient impossible, par la nature même des choses, de donner une définition univoque de l'état du système. et il ne peut plus etre question de causalité au sens ordinaire du mot. II faut donc envisager une modification radicale du rapport entre la description spatio-temporelle e t le princlpe de causalité. qui symbolisent respectivement les possibilités idéales d'observation et de définition, e t dont l'union est caractéristique des théories classiques : d'après l'essence même de la théorie quantique,. nous devons en effet nous contenter de les concevoir comme des aspects complémentaires, mais mutuellement exclusifs, de notre représentation des résultats expérimentaux. O n peut dire que la théorie quantique nous apprend que si notre m'ode d'intuition a ia fois causal et spatio-temporel est bien adapté à son but, cela tient uniquement à la petitesse du quantum vis-à-vis des actions qui interviennent dans nos perceptions sensorielles ordinaires : de même, dans la t h h r i e de la relativité, l a séparation nette entre l'espace et le temps, Imposée paf nos sens, trouvait sa seule justification dans le fait que les vitesses relatives habituelles sont petites par rapport à la vitese de la lumikre. Somme toute, pour tenir compte du postulat quantique dans la description des phénomènes
La construction de la nouvelle mécanique
135
atomiques. nous devons développer une théorie de ia complémentarité ", dont ia noncontradiction ne peut être Jugée qu'en confrontant les possibilités de définition e t les posslbiiités d'observation. Cette conceptlon s'impose déjà dans ia question controver*e de la nature de la lumière et des particules matérieiles élémentaires. En ce qui concerne la lumière, sa propagation dans ie temps et dans i'espace est décrite d'une manière satisfaisante par la théorie électromagnétique. En particulier, le principe de superposition des ondes rend compte sans exception aussi bien des phénomènes d'interférence dans le vide que des propriétés optiques de ia matière. Néammoins, pour arriver à une expression exacte de la conservation de i'énergie e t de i'impuision dans l'interaction entre rayonnement et matière, telle qu'elle apparaît dans i'effet photo-électrique et dans i'effet Compton, ii faut recourir à l'idée de photon développée par Einstein. Cette contradiction apparente avait même fait douter un moment du caractère rigoureux du principe de superposition, ainsi que de ia validité générale des théorèmes d'énergie et d'impulsion ; mais ces doutes ont été définitivement dissipés par des expériences directes. Cette situation montre bien i'impossibüité d'une description causale et spatio-temporelle des phénomènes lumineux. S i nous voulons étudier les lois de la propagation des actions lumineuses dans i'espace et dans le temps, nous sommes réduits, en raison du postulat quantique, à des considérations statistiques. Inversement, en appllquant ie principe de causalité aux phénomènes lumineux individuels caractérise par ie quantum d'action, nous renoncons à la connaissance des rapports spatio-temporels. Naturellement. il ne peut jamais etre question d'appliquer tout à fait indépendamment soit la description spatio-temporelle, soit le concept de causalité. Bien au contraire, ces deux conceptions de la nature de l a lumière constituent deux tentatives différentes d'adaptation des faits expérimentaux à notre forme ordinaire d'intuition. dans lesquelles la limitation des concepts classiques trouve des expressions complémentaires. O n arrive à des conclusions analogues en étudiant les propriétés des particuies matérielles. L'individualité des particuies électriques élémentaires dérive assurément des expériences les pius courantes. Néammoins, pour expliquer différents résultats récemment découverts, notamment la réflexion &ledive des électrons par les cristaux métaliiques, on est obligé d'avoir recours au principe de superposition des ondes, conformément aux idées de L. de Broglie. La situatlon est donc la meme que dans le cas de ia iumiëre : t a n t qu'on s'en tient aux concepts classiques, on se trouve fataiement devant un dilemme, qui pourtant peut Btre considéré comme i'expression exacte de l'analyse des données expérimentales. En réalité, ii ne s'agit pas ià de contradictions, mais bien de conceptions complémentaires, dont seul i'ensembie peut constituer une généralkation naturelle du mode de description classique. Dans la discussion de ces questions, il ne faut pas perdre de vue que, conformément à la conception défendue id, le rayonnement dans le vide aussi bien que les participatlons matérielles libres ne sont que des abstractlons, puisque, d'après le postulat quantique, ieun propriétés ne peuvent etre définies ou observées que par leur interaction avec d'autres systèmes. Néanmoins, ces abstractions sont indlspensables, comme nous ie verrons, pour ramener i'expression des reuitats expérimentaux à nos formes ordinaires d'intuition. II y a longtemps que les dimcuités qui s'opposent dans ia théorie quantique à une description causale et spatio-temporelle fournissent matière à discussion ; elles ont été récemment mises en relief par le développement des nouvelles méthodes symboliques.
Sources et évolution de la physique quantique
136
Heisenberg a discuté dernièrement, dans un travail important', la non-contradiction de ces méthodes. A ce sujet, il a particulièrement insisté sur une certaine indétermination réciproque qui affecte toute mesure de grandeurs atomiques. Mais avant d'examiner de plus près ses résultats, il convient de montrer comment le caractère complémentaire de l a description des phénomènes, qui se traduit par cette indétermination, apparaït déjà inévitable dans l'analyse des concepts les plus simples qui sont à la base de l'interprétation des expériences. L e q u a n t u m d'action e t l a cinématique - L'opposition essentielle qui existe entre la quantum d'action et les concepts classiques se montre déjà nettement dans les formules très simples qui constituent la base commune de la théorie des photons et de la théorie ondulatoire de la matiêre. Si nous désignons par h la constante de Planck, nous avons
2.
Er = IX = h,
(1)
où E et I représentent l'énergie e t l'impulsion, r et la période et la longueur d'onde correspondantes. Dans ces formules nous voyons s'opposer les deux conceptions de la lumière et de la matière : en effet, l'énergie e t l'impulsion se rapportent à l'idée de particule et il est donc possible, d'après la conception classique. de leur faire correspondre des coordonnées spatio-temporelles déterminées ; la période e t la longueur d'onde, au contraire, concernent un train d'ondes planes harmoniques, illimité dans l'espace et dans le temps. Ce n'est qu'en appliquant le principe de superposition que l'on peut retrouver la description ordinaire. En effet, un champ d'ondes limité dans l'espace et dans le temps peut toujours être considéré comme résultant de l'interférence d'un groupe d'ondes harmoniques élémentaires. Et comme l'a montré de Broglie, la vitesse de translation des " individus " associés aux ondes est précisément donnée par la " vitesse de groupe Représentons en effet une onde plane élémentaire par la forme usuelle
".
A où
A
et
quantité
COS
2*(vt
-U
- uyy -
~ Z
U,Z
+ 6),
6 sont des constantes désignant respectivement l'amplitude e t la phase ; la I v = - est la fréquence : uzuyu., sont les nombres d'ondes dans les directions 7-
des axes e t peuvent être considérés comme les composantes du nombre d'ondes u V
dans la direction de propagation. La vitesse de phase est alors définie par groupe par V.
dv du'
I
=-
4
-, la vitesse de U
Or, la théorie de la relativité nous donne, pour une particule de vitesse
Eu I=-
et
C2
vdI=dE,
et c désigne la vitesse de la lumière. D'après la formule (l), la vitesse de phase est donc
2
égale à
- e t la vitesse de groupe égale à v.
vitesses
est toujours plus grande que la vitesse de la lumière, ce qui souligne directement
V
Zeitschf. F. Phys. 45, 172 (1927).
O n remarque d'abord que la première de ces
La construction de la nouvelle mécanique
137
le caractère symbolique de ces considérations. Ensuite, la possibilité d'identifier la vitesse de la particule avec la vitesse de groupe nous donne une idée du domaine d'application des images spatio-temporelles dahs la théorie quantique. En même temps se révèle le caractère complémentaire de la description : l'emploi de groupes d'ondes implique en M e t une indétermination dans la définition de la période et de la longueur d'onde, et par conséquent dans celle de l'énergie et de l'impulsion qui leur correspondent par ia relation
(1). Stricto sensu, la représentation d'un champ d'ondes limité exige une multiplicité d'ondes élémentaires correspondant à toutes les valeurs possibles de u et de uz,uy,6,. Cependant, dans les cas les plus favorables, les valeurs moyennes des différences entre ces grandeurs pour deux ondes élémentaires du groupe seront d'un ordre de grandeur donné Dar la condition
AtAu = AzAu, = AyAuy = AzAu, = î où At, A z Ay, Az expriment respectivement l'extension du champ d'ondes dans le temps et dans les directions des axes spatiaux. Ces relations se déduisent de la théorie des instruments d'optique. et en particulier des considérations bien connues de Rayleigh sur le pouvoir séparateur des appareils spectraux ; elles traduisent la condition pour que les trains d'ondes se détruisent par interférence aux surfaces limitant le champ d'ondes dans l'espace-temps. O n peut remaquer qu'elles expriment que le groupe considéré dans son ensemble, n'a pas de phase, au sens où on l'entend pour les ondes élémentaires. De la formule (1). on déduit maintenant les relations
A t A E = AzAI, = AyAIy = AzAI, = h, donnant l'incertitude minima qui affecte la définition de i'énergie et des impulsions des '' individus " associés au champ d'ondes. En général, quand on voudra faire correspondre à un champ d'ondes une valeur de l'énergie et de l'impulsion, les conditions seront moins favorables. Même s'il satisfait initialement aux relations (2). le groupe d'ondes prendra au cours du temps une extension telle qu'il deviendra de moins en moins susceptible de représenter le mouvement d'un " individu C'est précisément ià le point paradoxal du problème de la nature de la lumière e t des particules matérielles. D'ailleurs la limitation des concepts classiques exprimée par la formule (2) est étroitement liée à la restriction apportée à ia validité de la mkanique classique par la théorie ondulatoire de la matière ; par rapport a cette dernière, la mécanique classique correspond à l'optique géométrique, dans laquelle la propagation des ondes est représentée intuitivement au moyen de " rayons ". C'est seulement dans ce cas limite que l'énergie et l'impulsion peuvent être définies univoquement sans se départir des images spatio-temporelles. Mais pour obtenir une définition générale de ces concepts, il faut remonter directement aux théorèmes de conservation de l'énergie et de l'impulsion ; aussi l'énoncé exact de ces derniers a-t-il constitué un problème fondamental au cours du développement des méthodes symboliques dont nous parlerons en détail plus loin. Dans le langage de la théorie de la relativité, la formule (2) exprime que dans la théorie quantique, il existe une relation réciproque générale entre les incertitudes minima avec lesquelles les vecteurs d'énergie-impulsion et d'espace-temps associés aux " indlvidus " peuvent ëtre respectivement définis. Cette relation peut être considérée comme une
".
138
Sources et évolution de la physique quantique
expression symbollque très slmple de la nature complémentaire de la description spatiotemporelle et du principe de causalité. D'ailleurs, sa forme générale permet de combiner jusqu'a un certain point l'emploi du théorème d'énergie-impulsion avec la représentation spatio-temporelle des observations : au lieu de la coïncidence de deux événements bien deflnis en un point de l'espace-temps, on peut considérer celle d'" individus " définisavec une précision limitée dans les domaines spatio-temporels finis. Cette circonstance permet d'éviter les paradoxes que l'on rencontre chaque fois qu'on veut décrire la diffusion du rayonnement des particules électriques libres ou le choc de deux particules. D'après les concepts classiques, la description de l a diffusion implique l'extension finie du rayonnement dans l'espace e t dans le temps ; le postulat quantique, au contraire, semble exiger une variation instantanée du mouvement de l'électron en un seul point de l'espace. Mais l'impulsion e t l'énergie de l'électron, aussi bien que celles du rayonnement, ne peuvent ëtre définies sans prendre en considération un domaine spatio-temporel fini. De plus, l'application du théorème d'énergie-impulsion au processus suppose que la précision avec laquelle sont définis les vecteurs d'énergie-impulsion est la même pour le rayonnement e t pour l'électron. D'après la formule (2). on peut donc, dans la description de l'interaction, faire correspondre aux deux " individus " le mëme domaine spatio-temporel. Des considérations tout à f a i t analogues s'appliquent au choc de deux particules matérielles ; mais avant que l'Idée d'onde ne se révèle indispensable, on n'avait pas remarqué l'importance du postulat quantique pour ce phénomène. Ce postulat traduit ici I'hypoth&e de l'individualité des particules, qui dépasse l a description spatlo-temporelle pour rejoindre le principe de causalité. Le contenu tangible de la théorie des photons tenait tout entier dans les théorèmes de conservation de l'énergie e t de l'impulsion ; pour les particules électriques élémentaires, il faut de plus tenir compte de la conservation de la charge électrique. II est à peine nécessaire d'observer que les faits exprimés par les formules (1) e t (2) ne peuvent sumre à une description détaillée de l'interaction des " individus ",mais qu'il faut avoir recours à des méthodes qui permettent de tenir compte du couplage déterminant cette interaction : e t c'est là justement qu'apparaTt l'importance de la charge électrique. Comme nous le verrons, ces méthodes nous obligent a renoncer encore davantage à une description intuitive au Sens ordinaire du mot. Les mesures dans la théorie quantique - Dans son travail sur la non-contradiction des méthodes de la théorie quantique, Heisenberg a établi la relation (2) comme I'expression de la plus grande prkision qu'il soit posslble d'atteindre dans la mesure simultanée des coordonnées spatio-temporelles e t de i'énergie-impuision d'une particule. II s'appuie sur les considérations suivantes. D'une part, on peut mesurer, à l'aide d'un instrument d'optlque, par exemple, la position d'une particule avec une précision aussi grande que l'on veut : il s a t d'utiliser, pour former l'image, un rayonnement de longueur d'onde sufrisamment courte. Mais alors, d'aprb la t h k r i e quantique, le rayonnement diffus4 par l'objet subira une variation finie d'impulsion, d'autant plus grande que les ondes sont plus courtes. D'autre part, on peut déterminer l'impulsion d'une particule avec une précision aussi grande que l'on veut, par exemple en mesurant sa vitesse à l'aide de l ' f l e t Doppler accompagnant la diffusion du rayonnement : IIsuffit que la longueur d'onde de la lumière empioyée soit assez grande pour qu'on puisse négliger le recul ; mais de ce fait, la détermination de la position devient d'autant moins précise.
3.
La construction de la nouvelle mécanique
139
Le point essentiel de ces considérations est qu'on insiste sur la nécessité de recourir au postulat quantique pour reconnaitre les possibilités de mesure. Cependant, il faut encore examiner de plus près les 'possibilités de définition pour faire ressortir tous les aspects du caractère complémentaire de la description des phénomènes. Ce n'est pas une variation discontinue de l'énergie-impulsion de la particule au cours du processus d'observation qui pourrait par elle-même nous empêcher d'attribuer aussi bien aux coordonnées spatio-temporelles qu'à l'énergie-impuision des valeurs Précises avant et a p r b ce processus. Aussi bien, si les valeurs que l'on peut assigner à ces grandeurs sont toujours affectées d'une incertitude réciproque, cela tient surtout, comme il ressort de I'expoSe precedent, à ce que l'on ne peut définir ies variations d'énergie-impulsion qu'avec une précision limitée, quand on doit en même temps restreindre sufisamment l'extension des champs d'ondes utilisés dans I'observation pour fixer les coordonnées spatio-temporelles de la particule. A ce sujet, il ne faut pas oublier, quand on détermine la position d'une particule à l'aide d'un instrument d'optique, que la formation de l'image exige nécessairement i'empioi d'un faisceau divergent. Ainsi le pouvoir séparateur d'un microscope est donné par l'expression bien connue
x
-, E
dans laquelle
désigne la longueur d'onde de la lumière,
et E l'ouverture numérique. c'est-à-dire le sinus du demi-angle d'ouverture. Si même on éciaire l'objet par de la lumière parallèle, et si par conséquent l'impulsion du photon incident
-hx est parfaitement déterminée en grandeur et en direction,
on ne pourra pas
connaître avec précision. à cause de i'ouverture finie, le recul accompagnant la diffusion sur laquelle la mesure est basée. Meme si l'impulsion de la particule était connue exactement avant le processus de diffusion. sa composante dans le plan de l'objet après observation sera affectée d'une incertitude évidemment égale à
%h -.
x
Le produit des
incertitudes affectant la détermination de la coordonnée de position et de la composante d'impulsion dans une direction donnée est donc bien exprimé par la formule (2). On pourrait penser qu'en plus de l'ouverture, ia longueur du train d'ondes doive également intervenir dans l'estimation de la précision avec laquelle on peut déterminer la position de la particule, vu que ceile-ci peut modifier sa position pendant la durée finie de l'éclairement. Mais puisque la connaissance exacte de la longueur d'onde de la lumière n'entre pas essentiellement dans le raisonnement précédent, on voit facilement que, pour une ouverture donnée, le train d'ondes peut être choisi assez court pour qu'une variation de position de la particule pendant i'observation soit négligeable vis-à-vis de la limite de précision déterminée par le pouvoir séparateur.
-
Pour faire une mesure d'impulsion à l'aide de l'effet Doppler tout en tenant compte de i'effet Compton -, on se servira d'un train d'ondes parallèles. Mais la précision avec laquelle on peut mesurer le changement de longueur d'onde du rayonnement diffusé dépend essentiellement de la longueur du train d'ondes dans la direction de propagation. Désignons cette longueur par 1, e t supposons que la direction du rayonnement diffusé est oppoSee à celle du rayonnement incident ; si nous mesurons alors les composantes de position et d'impulsion dans cette même direction, nous trouvons que la précision de la mesure de la vitesse est de l'ordre de
CA
-.21
Dans cette formule, on a supposé pour simplifier
que la vitesse de la particule etait faible vis-à-vis de celle de ia lumière. Si
m est La m a s e
140
Sources et évolution de la physique quantique
de la particule, l'incertitude qui affecte la mesure de l'impulsion est donc égale Dans le cas actuel, le recul
2h
a
mcX -. 21
x est suffisamment bien défini pour ne donner lieu a aucune
incertitude appréciable sous l'impulsion de la particule après l'observation. La théorie générale de l'effet Compton permet égaiement de calculer, à partir des longueurs d'onde du rayonnement incident et du rayonnement diffusé, les valeurs de la composante de la vitesse dans la direction avant e t après la variation d'impulsion. Mais même si la position initiale de la particule est exactement connue, la connaissance de sa position a p r h la mesure d'impulsion sera affectée d'une certaine indétermination. En effet, comme il est impossible de déterminer le moment précis du recul, la vitesse moyenne dans la direction d'observation pendant le processus de diffusion ne peut être connue qu'avec la précision
2h -
mx'
1
L'intervalle de temps qui correspond au processus étant -, l'incertitude sur la
position après l'observation sera
2hl -.
mXc
C
O n voit donc que le produit des incertitudes sur
les mesures de position et d'impulsion est encore donné par la formule générale (2). Dans les mesures d'impulsion comme dans celles de position, la durée d u processus d'observation peut Ctre rendue arbitrairement petite : il n'y a qu'à utiliser un rayonnement de longueur d'onde suffisamment courte. Car l'augmentation de recul qui en résulte n'a. comme nous l'avons vu, aucune influence sur la précision de la mesure. II faut encore remarquer que lorsque nous avons parlé à plusieurs reprises de la vitesse de la particule, il ne s'agissait en I'occurence que d'un emploi commode, mais purement formel, de la description spatio-temporelle. Les considérations de L. de Broglie, exposées plus haut, montrent déjà que le concept de vitesse doit toujours être employé avec prudence. L e postulat quantique exclut également toute définition univoque de ce concept ; c'est ce qu'il ne faut pas oublier quand on compare les résultats de plusieurs observations successives. Sans doute, on peut déterminer la position d'un ' I individu " à deux instants différents avec une précision aussi grande que l'on veut. Mais si l'on veut calculer de la manière ordinaire l a vitesse de I"' individu " dans l'intervalle séparant ces deux instants, on n'obtient qu'une idéalisation d'où l'on ne peut pas tirer de conclusions univoques sur le comportement antérieur ou postérieur de I"' individu
".
Toute cette discussion de l'exactitude avec laquelle on peut mesurer l a position et l'impulsion d'une particule peut être repétée en utilisant, au lieu de la diffusion d'un rayonnement. un choc avec une autre particule matérielle ; cela résulte évidemment des considérations précédentes sur les possibilités de définition des propriétés des " individus Dans les deux cas, nous voyons que l'incertitude affecte tout autant l'instrument de mesure que l'objet. Cette incertitude est inévitable dès qu'on rapporte les mouvements des "individus " à un système de coordonnées fixé comme d'habitude par des corps solides et des horloges invariables. Car les seules conclusions que permettent les conditions expérimentales - ouverture et fermeture des diaphragmes, etc. - concernent l'extension du champ d'ondes associé dans l'espace et le temps.
".
Quand on ramène les observations aux perceptions sensorielles. le postulat quantique doit encore intervenir dans la perception de l'instrument de mesure, soit que l'on ait affaire à une action directe sur l'œil, soit que la perception ait lieu par des intermediaires approprie, tels que plaques photographiques, chambres de Wilson, etc. Toutefois, il est facile de voir que le nouvel élément statistique qui s'introduit ainsi n'aura aucune influence
La construction de la nouvelle mécanique
141
essentielle sur l'incertitude affectant la description de l'objet. O n serait même tenté de croire que l'élément arbitraire entrant dans la séparation de l'objet et de l'instrument de mesure implique la possibilité' d'éviter cette incertitude. Considérons par exemple la détermination de la position d'une particule : on pourrait songer à mesurer la variation d'impulsion que subit le microscope, y compris la source de lumière e t la plaque photographique, lors du processus d'observation, e t en déduire. à l'aide du théorème de conservation, l'impulsion cédée à la particule lors de l a diffusion. Mais en y regardant de plus près, on constate que l'on ne peut effectuer une +elle mesure si l'on veut en même temps connaïtre la position du microscope avec une précision suffisante. De l'ensemble des faits qui s'expriment par la théorie ondulatoire de la matière, il résulte en effet que les coordonnées du centre de gravité e t les composantes de l'impulsion totale d'un corps quelconque ne peuvent être définies avec une précision qui dépasse les limites imposées par la formule (2). Stricto sensu, le concept d'observation f a i t partie de la description causale e t spatiotemporelle. Mais en raison du caractère générai de la relation exprimée par la formule ( 2 ) , on peut aussi utiliser ce concept sans contradiction dans la théorie quantique : il suffit de tenir compte de l'incertitude exprimée par cette relation. Pour illustrer le caractère de la description quantique des phénomènes atomiques (microscopiques), il est instructif, comme l'a signalé Heisenberg, de comparer cette incertitude à celle qui, en raison de l'imperfection des mesures, affecte déjà toute observation dans la description ordinaire des phénomènes naturels ; on peut même dire, remarque-t-il à ce sujet. que les phénomènes ordinaires (macroscopiques) sont en quelque sorte engendre par des observations répétées. Cependant, il ne faut pas oublier que d'après la théorie classique, chaque observation nouvelle permet de prédire le cours des phénomènes avec une certitude de plus en plus grande, en nous donnant une connaissance toujours plus exacte de l'état initial du système. Par contre, dans la théorie quantique. un élément tout à fait nouveau, incontrôlable, surgit à chaque observation par suite de l'interaction finie avec l'instrument de mesure. Les considérations précédentes montrent en effet que la mesure des coordonnées de position d'une particule n'implique pas seulement une modification finie des variables dynamiques, mais entraîne toujours une rupture complète dans la description causale de son comportement dynamique : de même, la connaissance de son impulsion n'est obtenue qu'au prix d'une lacune dans sa description spatio-temporelle. C'est précisément cet état de choses qui traduit nettement le caractère complémentaire de la description quantique des phénomènes atomiques ; ce caractère peut être considéré comme une conséquence immédiate de l'antagonisme qui existe entre le postulat quantique e t la distinction exigée par le concept d'observation entre objet e t instrument de mesure.
- Jusqu'à présent, nous n'avons considéré que certains caractères généraux de la théorie quantique. Mais le probleme fondamental qui se pose immédiatement, c'est celui qui consiste à formuler les lois de l'interaction entre les I' individus " s y m b o ï i par les abstractions de la particule libre et de rayonnement. A cet effet, on est parti de l'étude de la constitution des atomes. O n a déjà pu mettre en lumière certains aspects essentiels des phénomènes par une simple application des concepts classiques en relation avec le postulat quantique. Cela tient surtout à ce que l'on peut, dans ces questions, se passer en grande partie d'une
4. Le principe d e correspondance e t la théorie des matrices
142
Sources et évolution de la physique quantique
description détaillée du cours des processus dans l'espace et dans le temps. C'est ainsi que l'hypothèse d'états stationnaires discrets et de processus individuels de transition traduit immédiatement les caractères principaux de l'excitation des spectres d'atomes par chocs électroniques ou par rayonnement. Cette conception de l'origine des spectres est en opposition particulièrement nette avec le mode de description ordinaire : des lignes spectrales qui, selon la théorie classique, devraient provenir d'un meme état de l'atome, sont attribuées, d'après le postulat quantique, à différents processus de transition entre lesquels l'atome a le choix. Malgré cette opposition, on est parvenu à raccorder le formalisme quantique aux idées classiques dans le cas limite où la différence relative entre les propriétés des états voisins disparait asymptotiquement, et où l'on peut faire abstraction des discontinuités dans les appiications statistiques. C'est grâce à cette circonstance que la théorie quantique a pu expliquer dans une large mesure les régularités des spectres conformément à nos idées générales sur la constitution des atomes. En cherchant à concevoir la théorie quantique comme une généralisation rationnelle des théories classiques, on a été conduit à l'établissement du " principe de correspondance ' I . Pour appliquer ce principe à l'interprétation des phénomènes spectraux, on utilisait les formules de l'électrodynamique ordinaire, en faisant correspondre à Chaque processus individuel de transition une composante d'oscillation du mouvement classique des particules de l'atome. Mais sauf à la limite où la différence relative entre les états stationnaires successifs est négligeable, cette application fragmentaire des théories classiques ne donnait que dans certains cas une description rigoureuse, quantitative, des phénomenes. Rappelons en particulier la relation, établie par Ladenburg et par Kramers, entre la theorie classique des phénomènes de dispersion et les lois statistiques d'Einstein réglant le processus de transition qui accompagnent les phénomènes de rayonnement. Cette étude de Kramers sur l a dispersion a d'ailleurs apporté une contribution importante au développement logique de l'idée de correspondance ; mais c'est seulement grâce aux méthodes introduites dans la théorie quantique au cours de ces dernières années que l'on a pu réaliser d'une manière générale la tendance exprimée par le principe de correspondance. c'est Heisenberg qui a inauguré ce nouveau développement de la théorie par un travail fondamental dans lequel il parvient à s'affranchir complètement du concept classique de mouvement. Ainsi, il remplace partout les grandeurs cinématiques et dynamiques ordinaires par des symboles qui se rapportent directement aux processus individuels exigés par le postulat quantique : au lieu de représenter les grandeurs mécaniques par des sommes d'oscillations harmoniques, il utilise des matrices dont chaque élément symbollse une oscillation harmonique et correspond ainsi à une transition possible entre états stationnaires. En exprimant que les fréquences correspondant à ces éléments doivent satisfaire au principe de combinaison des lignes spectrales, Heisenberg a trouvé pour ses symboles des règles de calcul t r b simples, qui permettent de transcrire directement SOUS forme quantique les équations fondamentales de la mécanique classique. Cette maniere hardie et ingénieuse d'attaquer le problkme de la dynamique des atomes s'est révélée tout de suite extrêmement puissante et fructueuse dans l'interprétation quantitative des résultats expérimentaux. Les travaux de Born, Jordan et Dirac ont rapidement donné a la nouvelle théorie une forme qui peut rivaliser de cohérence e t de généralité avec la mécanique classique. II est particulièrement remarquable que l'élément caractéristique de la théorie
La construction de la nouvelle mécanique
143
quantique, la constante de Planck, n'apparaisse plus explicitement que\dans les règles de calcul auxquelles les symboles sont soumis. En effet, deux matrices p et q correspondant à des variables canoniques conjuguées au sens de Hamilton n'obéissent pas à la loi de commutativité de la multiplication, mals satisfont à la relation de commutabilité
h W-qP=Gs;;,
(3)
dont la forme est un exemple frappant du caractère symbolique de toute la théorie, O n a souvent représenté la mécanique des matrices comme un calcul n'utilisant que des grandeurs directement observables. II faut toujours remarquer que cette méthode a précisément en vue des problèmes dans lesquels on peut appliquer le postulat quantlque en faisant abstraction dans une large mesure de la description spatio-temporelle, de sorte que la question de l'observation au sens ordinaire du m o t ne se pose pas. POW pousser plus loin la correspondance entre ia théorie quantlque et la théorie classique, il a été très important de mettre en relief le caractère statistique de ia description basée sur le postulat quantique. Un grand progrès a été réalisé dans cette voie par Dirac e t Jordan ; ceux-ci sont parvenus à généraliser la méthode symbolique de Heisenberg en opérant avec des matrices qui ne sont plus nécessairement ordonnées d'après les états stationnaires, mais dont les éléments peuvent avoir comme indices les valeurs propres de grandeurs mécaniques quelconques, commutables entre elles. Dans la forme première de la théorie, les " éléments diagonaux ", qui se rapportaient à un seul état stationnaire, pouvaient être interprétés comme moyennes temporelles de la grandeur considérée ; d'une manière analogue, la " théorie des transformations " fournit une représentation des grandeurs moyennes plus générales qui correspondent à un I' état " caractérisé par des valeurs données d'un certain nombre de grandeurs mécaniques. les variables canoniquement conjuguées pouvant prendre toutes les valeurs possibles. S'appuyant sur cette méthode ainsi que sur les idées émises par Born et par Pauli, Heisenberg a essayé d'analyser de plus près le contenu physique de la théorie quantique, en ayant spécialement égard au caractère paradoxal de la relation de commutabilité (3). II est arrivé ainsi à la formule générale
ApAq-h,
(4)
donnant la précision maxima avec laquelle on peut observer simultanément deux grandeurs mécaniques canoniquement conjuguées. Dans cet ordre d'idées. il a mis en lumière d'une manière très intéressante les nombreux paradoxes auxquels donne lieu l'application du postulat quantique et a prouvé ainsi dans une large mesure la non-contradiction de la méthode symbolique. A propos de la nature complémentaire de la description quantique, répétons qu'il faut toujours, pour juger de la non-contradiction, considérer à la fois les possibilite d'observation et les possibilités de définition. C'est précisément pour l'éclaircissement de cette question que la mécanique ondulatoire développée par Schrodinger s'est montrée extrêmement utile, en permettant d'étendre le principe de superposition à des particules soumises à des actions mutuelles, et par suite de leur appliquer immédiatement les considérations développées à propos du rayonnement et des particules libres. Nous reviendrons plus loin sur le rapport de la mécanique ondulatoire avec l'énoncé général des lois quantiques donné par la théorie des transformations.
144
Sources et évolution de la physique quantique
-
5.
L a mécanique ondulatoire e t l e postulat quantique Dans ses travaux sur la théorie ondulatoire des particules matérielles, de Broglie avait déjà attiré l’attention sur la possibilité de représenter les états stationnaires de l’atome par un phénomène d’interférence des ondes de phase associées aux électrons libres. Au début, ilest vrai, cette conception ne nous a pas menés plus loin, au point de vue quantitatif, que les méthodes primitives de la théorie quantique, qui reposaient sur l’application des principes classiques, et qui avaient été développées surtout par Sommerfeld. Mais bientôt la théorie ondulatoire propode par Schrodinger a ouvert de nouvelles perspectives et apporté une contribution décisive aux grands progrès réalisés récemment dans la théorie atomique. Les solutions propres de l’équation des ondes de Schrodinger fournissent pour les états stationnaires de l’atome une représentation très simple, dans laquelle l’énergie de chaque état est liée à la période propre correspondante par la relation quantique générale (1). De même. le nombre de nœuds de l’oscillation propre fournit une interprétation très simple d u concept de nombre quantique ; celui-ci s’était déjà présenté dans les anciennes théories. mais la mécanique des matrices l’avait momentanément laissé dans l‘ombre. De plus, Schrodinger associe à chaque solution de l’équation des ondes une densité continue de charge e t de courant électrique qui, dans le cas d’une solution propre, traduisent les propriétés électrostatiques et magnétiques de l’atome dans l’état stationnaire correspondant. La superposition de deux solutions propres correspond de même à une répartition continue d’oscillations électriques qui. d’après l’électrodynamique classique, doivent donner lieu à l’émission d’un rayonnement ; la fréquence e t l’intensité de celui-ci correspondent exactement à celles que donnent, pour le processus de transition entre les deux états, le postulat quantique e t le principe de correspondance, t e l qu’il est formulé dans la théorie des matrices. En traitant par la méthode de Schrodinger le problème du choc entre atomes et particules électriques libres, Born a obtenu des résultats très importants pour le développenient ultérieur de la théorie. II est parvenu notamment à donner pour les fonctions d’ondes une interprétation statistique permettant de calculer la probabilité des processus Individuels de transition entre &tats stationnaires qu’exige le postulat quantique. II en a déduit la forme que prend dans la mécanique ondulatoire le principe des invariants adiabatiques d’Ehrenfest, dont Hund a fait usage avec tant de profit dans 585 recherches sur le problème de la formation des molécules. Devant ces résultats. Schrodinger a exprimé l’espoir que le développement logique de la théorie ondulatoire permettrait d’éviter complètement l’irrationalité contenue dans le postulat quantique et d’arriver à une description des phénomènes atomiques conforme aux lignes directrices des théories classiques. A l’appui de cette conception, il remarque’ que tout processus s’interprétant, d’après le postulat quantique, comme un échange discontinu d’énergie entre atomes se ramène, dans la théorie ondulatoire, à un simple problème de résonance. En particulier, la conception d’états stationnaires individuels serait illusoire e t son applicabilité ne serait qu’un exemple de cette résonance. II faut toutefois remarquer que celle-ci se rapporte à un système mécanique rigoureusement isolé, c’est-à-dire, d’après les idées défendues ici, soustrait à toute observation. Et d’ailleurs, la mécanique ondulatoire, comme la théorie des matrices, doit même, d’aprb ces idées, être considérée comme une transcription symbolique de la mécanique classique, adaptée à la théorie des quanta et ne pouvant être interprétée que par l’application explicite du postulat quanAnn. d . Phys., 83. 956 (1927).
La construction de la nouvelle mécanique
145
tique. Du reste, on peut regarder comme complémentaires ces deux manières d e formuler le problème de l'interaction, quand, on tient compte d e ce qu'elles partent respectivement de la conception ondulatoire et de la conception particulaire des '* individus " libres. Cette complémentarité explique également l'apparence de contradiction naissant de l'emploi d u concept d'énergie dans les deux théories. Les difficultés de principe qui s'opposent à la description spatio-temporelle classique d'un système de particules soumises à des actions mutuelles proviennent directement d e ce que leur comportement individuel est essentiellement réglé par le principe de superposition. MSme dans le cas d'une particule libre, dès que l'on connaît l'impulsion et l'énergie, on ne peut utiliser avec précision les coordonnées spatio-temporelles. II en résulte qu'il est impossible d'appliquer directement le principe de l'énergie en introduisant l'idée classique de l'énergie potentielle d'un système. Dans l'équation de Schrodinger, on évite ces difficultés en transformant l'expression classique d e la fonction hamiltonienne en un oDérateur différentiel à l'aide de la formule
o ù p d e i g n e une composante de l'impulsion généralisée et q la variable canoniquement conjuguée ; de plus, on considère l'énergie du système. changée de signe, comme conjuguée au temps. Ainsi, les concepts d e temps et d'espace aussi bien que ceux d'énergie et d'impulsion n'interviennent tout d'abord dans l'équation des ondes que comme des quantités purement formelles. La méthode d e Schrodinger, comme d'ailleurs celle des matrices, doit essentiellement sa simplicité à l'emploi de nombres imaginaires. Cette circonstance lui confere déjà un caractère symbolique ; mais il y a une raison plus directe qui empêche son rattachement immédiat à nos formes ordinaires d'intuition : c'est qu'au point de vue " géométrique ", l'équation des ondes ne se rapporte pas à l'espace à trois dimensions, mais bien à i'extension en configuration, dont le nombre de dimensions est égal au nombre de degrés de liberté du système. D'autre part, i'énoncé du problème de l'interaction, qu'il soit donné par l'équation de Schrodinger ou par la théorie des matrices, est soumis à une restriction, provenant de ce que, dans ie problème de mécanique classique pris comme base, on ne tient pas compte de la vitesse finie de propagation des forces, exigée par la théorie de la relativité. D'ailleurs, on n'a guère le droit, dans le problème d e l'interaction, d'exiger une représentation intuitive basée sur des images spatio-temporelles. En effet, toutes les expériences sur les propriétés des atomes, à moins qu'elles ne concernent leur mouvement global, sont basées exclusivement sur la manière dont ils réagissent dans des phénomènes de rayonnement ou de choc. Par conséquent, l'interprétation des observations se ramène toujours en dernière analyse à la considération d'un rayonnement dans le vide ou de particules matérielles libres ; c'est sur ces abstractlons que repose toute entière notre conception spatio-temporelle des phénomènes. aussi bien que ia définition des concepts
d'impulsion et d'énergie. Tout ce qu'on peut exiger de ces moyens de description, c'est qu'ils ne soient pas utilisés de manière contradictoire : pour s'en assurer, il faut surtout tenir compte des possibilités d e definition et d'observation. Si les solutions propres de l'équation de Schrodinger sont aptes à représenter les états stationnaires de l'atome, c'est précidment parce qu'elles fournissent, à l'aide d e ia relation quantique générale (l), une définition univoque de l'énergie du système. Ceci nous
146
Sources et évolution de la physique quantique
oblige toutefois à renoncer dans une large mesure à la description spatio-temporelle : nous verrons en effet qu'il est tout à fait impossible de connaître en détail le comportement des partlcules individuelles dans l'atome e t d'appllquer en même temps sans contradictlon le concept d'état stationnaire. Dans les questions où il est essentlel de suivre les particules de l'atome dans te temps et dans i'espace pour Interpréter les obsewatlons, on est amené à étudier la solution générale de l'équation des ondes, qui s'obtient en superposant les solutions propres. II s'agit ici d'une complémentarité de définition et d'observation t o u t a fait analogue a celle que nous avons rencontrée précédemment dans l'étude des propriétés de la lumière e t des particules matérielles libres. Tandis que la définition de l'énergie et de l'impulsion des " individus " était basée sur le concept d'onde harmonique élémentaire, toute description des phénomènes dans l'espace et dans le temps reposait sur I'interf4rence d'un groupe de ces ondes élémentaires. Dans le cas actuel également, on peut mettre directement en évidence la non-contradiction des possibilités d'observation e t de définition. D'apr&s le postulat quantique, une observation susceptlble de nous renseigner sur le Comportement des particules atomiques individuelles entrame toujours une modification de l'état de l'atome. Lorsqu'il s'agit d'états stationnaires de faible nombre quantique, cette modifcatlon conslstera même en générai, comme l'a fait remarquer Heisenberg. en l'expulsion de l'électron considéré hors de l'atome. Dans ce cas, il est donc impossible de déterminer par des observations répétées I"' orbite " de l'électron dans l'atome. Ceci tient a ce qu'li est impossible de représenter, fit-ce d'une manière approchée, le '' mouvement " d'une particule au moyen d'un groupe d'ondes formé d'oscillatlons propres qui n'ont qu'un petit nombre de nœuds. Mais ce qui montre surtout le caractère complémentaire de la description, c'est que, pour obtenir une interprétation univoque d'observations relatives au comportement des particules de l'atome, \I faut que l'on pulsse, pendant le processus d'obsenratlon, faire abstraction des forces mutuelles et considérer les particules comme libres. Ced exige toutefois que la durée du processus soit courte par rapport aux périodes naturelles de l'atome, de sorte que la variatlon d'énergie accompagnant l'observation ne peut atre connue qu'avec une incertitude de beaucoup supérieure aux différences d'énergie entre les états stationnaires successifs. D'allleun, quand on veut se rendre compte des possibilités d'observatlon, li ne faut Jamais oublier que l'on ne peut attribuer un sens intuitif aux solutlons de la mécanique ondulatoire que dans la mesure où elles peuvent Btre interprétées à l'aide du concept de particule iibre. C'est là pr&'kément qu'apparait avec netteté la différence entre la mécanique ciassique et la théorle quantique de l'interaction. En effet, dans la première, une telle restriction est inutile, puisqu'on attribue â la particule une " réalité " immédiate, Indépendante du falt qu'elle sort llbre ou liée. II faut surtout tenir compte de cette situation pour juger de la non-contradlctlon dans l'emploi de la densite d'électrlclté de Schr6dlnger comme mesure de la probablllté de presence des electrons dans des domaines spatiaux donnés à l'intérieur de l'atome. D'aprh les restrictions, cet emploi revient â admettre que la probabilité de prêsence d'une particule libre est déterminée par la densité d'électricité associée au champ d'ondes de la même manière que la probabilité de presence d'un photon est déterminée par la densité du rayonnement, calculée d'aprb la théorie des ondes. Comme on l'a déjà dit, la théorie des transformations de Dirac-Jordan, à l'aide de laquelle Heisenberg a formulé sa théorie générale d'incertitude (4). nous offre un moyen
La construction de la nouvelle mécanique
147
général non contradictoire de tirer parti des concepts classiques dans la théorie quantique. L'équation de Schrbdlnger y a également trouvé une appllcation Instructive. En effet, on utilise les solutions propres de cette equation pour transformer une matrice ayant comme indices les valeurs de l'énergie du système en une autre ayant pour i n d l w les coordonnées spatiales de la particule considérée. A ce propos, Ilest également intéressant de rappeler que Jordan et Klein sont parvenus récemment, en partant d'une représentation ondulatoire des particules individuelles, à formuler le problème de i'lnteractlon en conformité avec l'équation de Schr6dlnger. Ils utilisent à cet effet le procédé symbolique, se rattachant au calcul des matrices, par lequel Dirac avait traité le problème du rayonnement ; nous y reviendrons plus loin.
'
6. La réalité des états stationnaires - Le concept d'état stationnaire résuite, on i'a déjà dit. d'une application caractéristique du postulat quantique au système considéré. Par sa nature, ce concept exige qu'on fasse complètement abstraction d'une description temporelle : et à notre point de vue, c'est justement à cette même condition que l'on peut définir de manière univoque i'énergie de l'atome. Strictement pariant, le concept d'état stationnaire implique l'exclusion de toute interaction avec des " individus " qui n'appartiennent pas au système. Le fait d'attribuer à un tel système isolé une énergie déterminée peut être considéré comme i'expression directe du principe de causalité contenu dans le théorème d'énergie. C'est ce caractère des états stationnaires qui justifie l'hypothèse de leur stabilité hypermécanique ; d'après cette hypothèse, sur laquelle est basée l'application du postulat quantique au problème de ia constitution atomique, l'atome se trouve toujours dans un état statlonnaire bien défini avant ou après toute action extérieure. Pour discuter les paradoxes bien connus qu'entraîne cette hypothèse dans la description des chocs et des réactions de rayonnement, il est essentiel de tenir compte de la limitation que la relation (2) Impose aux possibilités de definition des agents partlcipant à la réaction. D'après cette relation, si l'on veut que l'énergie des " individus " réagissants soit définie avec assez de précision pour qu'on puisse dire que l'énergie se conserve lors de la réaction, ii faut que l'intervalle de temps soit long vis-à-vis de la période qui se rapporte, d'après la formule (1). au processus de transition entre les états stationnaires considérés. C'est ce que montre d'une manière Intéressante l'étude des processus qui accompagnent le passage d'une particule en mouvement rapide à travers un atome. En effet, d'après la cinématique ordinaire, le temps effectif du choc serait, dans ce cas, faible relativement aux périodes naturelles de l'atome, et par consequent Il pourrait sembler extrêmement difficile de concilier le théorème d'énergie et l'hypothèse de la stabilité des états stationn a i r e ~ ~Dans . la représentation ondulatoire, au contraire, la durée qu'il faut attribuer à la réaction est directement liée à i'incertitude sur notre connaissance de l'énergie de la particule qui heurte l'atome. e t i'on n'a jamais à craindre de contradiction avec le théorème d'énergie. Au cours d'une discussion de paradoxes semblables, Campbell a proposé de considérer le concept de temps lui-même comme essentiellement statistique. Mais les idées défendues ici, d'après lesquelles ia description spatio-temporelle représente
' '
Zeits. f. Phys. 45, 751 (1927). Zeits. f. Phys. 34, 142 (1925). Phil. Mag. i, 1106 (1926).
148
Sources et évolution de la physique quantique
une abstraction fondée sur le comportement général des " individus " libres, s'opposent, fUt-ce en raison du principe de relativité, à une separation aussi essentielle des concepts de temps et d'espace. Si, en relation avec le concept d'état stationnaire, l e temps paraît jouer un rôle privilégié, cela tient uniquement, nous l'avons vu, à la nature particulière des problèmes qui se posent à ce sujet. Pour qu'on puisse appliquer le concept d'état stationnaire, il faut que lorsqu'on effectue, en utilisant par exemple un choc ou une réaction de rayonnement, une mesure permettant de distinguer les différents états stationnaires, on ait le droit de faire abstraction de i'histoire antérieure de l'atome. Au premier abord, on pourrait voir une difficulté dans le fait que les méthodes symboliques de ia théorie des quanta attribuent à tout état stationnaire une phase d'oscillation, qui semble permettre, en contradiction avec l'idée même d'état stationnaire, la possibilité d'une influence d'actions antérieures. Cependant, dès qu'il s'agit d'un problème temporel, il ne peut jamais être question d'un système rigoureusement isolé. Les oscillations propres utilisées dans l'interprétation des observations ne sont que des idéalisations commodes qui, comme dans une discussion plus exacte, devront toujours faire place à des groupes d'oscillations harmoniques se rapportant à des intervalles de fréquence finis. Or c'est là une conséquence générale, déjà signalée, du principe de superposition -, un groupe d'ondes, considéré dans son ensemble, n'a pas de phase au même sens que les ondes élémentaires ou les oscillations propres. Ce caractère inobservable de la phase - déjà bien connu dans la théorie des instruments d'optique - joue un rôle important dans la discussion de l'expérience de Stern et Gerlach sur la déviation des rayons moléculaires dans un champ magnétique, qui a contribué si utilement à l'étude des propriétés individuelles des atomes. Heisenberg anaiyse ainsi les conditions de cette expérience : d'après la conception ondulatoire de L. de Broglie, le faisceau de rayons moléculaires doit être diffusé par le diaphragme nécessaire pour le délimiter ; on ne pourra donc évidemment discerner les atomes d'orientations différentes dans le champ que si l a déviation magnétique du faisceau est plus grande que i'élergissement dû à cette diffusion. Un calcul simple permet d'exprimer cette condition en fonction du temps mis par les atomes pour traverser le champ magnétique. et de i'indétermination qui affecte notre connaissance de l'énergie des atomes individuels dans le champ, par suite de la largeur finie du faisceau. On trouve que le produit de ces deux grandeurs doit être au moins égal au quantum d'action. Heisenberg a vu dans ce résultat une confirmation de la relation (2) concernant les incertitudes réciproques qui affectent une détermination simultanée de i'énergie et du temps. Toutefois, dans le cas actuel, il ne s'agit pas à proprement parler d'une mesure de l'énergie de l'atome à un instant donné. Mais la période des oscillations propres de l'atome dans le champ est liée à l'énergie totale par la relation générale (1). Par suite, la condition envisagée exprime précisément que si l'on veut discerner les différents états de l'atome dans le champ, il devient impossible de déterminer la phase. On peut résoudre de la même façon les contradictions apparentes, souvent discutées, que présentent certaines expériences idéales sur le rayonnement de résonance. imaginées par Heisenberg. En comparant, comme nous venons de le faire, un atome à un systëme isolé, nous faisons abstraction de l'émission du rayonnement, qui, même en l'absence d'actions extérieures, met un terme à la vie moyenne des états stationnaires. Si l'on a le droit de négliger ce rayonnement dans beaucoup d'applications, c'est que le couplage entre atome et champ de rayonnement, calculé d'après l'électrodynamique classique, est généralement
-
La construction de la nouvelle mécanique
149
faible vis-à-vis du couplage entre les particules de l'atome. On peut donc décrire l'état de ce dernier en laissant de cdté dans la plupart des cas la réaction du rayonnement, ce qui revient à faire abstraction de I'lndétkrmination sur l'énergie déduite par la relation (2)de la vie moyenne des états stationnaires6. C'est précisément cela qui permet l'application directe, conforme au principe de correspondance, de l'électrodynamique classique au problème du rayonnement. C'est aussi de là que partent, pour traiter ce problème, les nouvelles méthodes de la théorie quantique, se basant sur les considérations primitives de Heisenberg. En particulier, Klein a récemment donné7, en s'appuyant sur le principe de correspondance, une analyse instructive de l'application de la méthode de Schrodinger au problème considéré. Dirac* traite la question d'une manière plus approfondie en considérant au contraire le champ de rayonnement comme une partie d'un système total isolé. De catte façon, on peut tenir compte logiquement du caractère lndivlduel des processus de rayonnement, exigé par la théorie quantique, et édifier une théorie de la dispersion qui comprenne la largeur finie des lignes spectrales. Cette théorie, où l'on renonce dans une large mesure aux images spatio-temporelles, offre un exemple frappant du caractère nécessairement complémentaire de la description quantique. Ceci est en relation étroite avec les points essentiels par lesquels les phénomènes de rayonnement s'écartent de la description causale : ces divergences, comme nous l'avons vu, se résument dans le fait que, pour l'émission des lignes spectrales, les atomes ont généralement à choisir entre différents processus de transition possibles. Si l'on observe que, d'après le principe de correspondance, les propriétés des atomes doivent se raccorder asymptotiquement à l'électrodynamique classique, on serait tenté de voir une difficulté dans l'exclusion mutuelle du concept d'état stationnaire et de la description du comportement des particules individuelles de l'atome. Car cette concordance asymptotique signifie que dans le domaine des grands nombres quantiques, où la différence relative entre états stationnaires successifs disparait à la limite, on peut rendre compte du comportement des électrons à l'aide d'images mécaniques. Mais il ne s'agit là en aucune façon d'un passage graduel à la théorie classique, au cours duquel le postulat quantique deviendrait peu à peu Superflu ; au contraire, les conclusions que l'on peut tirer du principe de correspondance à l'aide des images classiques s'obtiennent précisément en conservant même à cette limite le concept d'état stationnaire et les processus individuels de transition. ,Sur cette question, les nouvelles méthodes ont fourni des éclaircissements intéressants. Schr6dingerg a montré que, dans le domaine considéré, on peut construire, par une superposition d'oscillations propres, un groupe d'ondes dont l'extension est faible visà-vis des '' dimensions '' de l'atome, e t dont la propagation devient aussi proche qu'on le veut de la représentation classique du mouvement d'une particule matérielle, lorsque les nombres quantiques sont suffisamment grands. Dans le cas particulier d'un oscillateur harmonique, il a même pu montrer que l'extension de ce groupe d'ondes ne se modifie pas au cours du temps e t qu'il est animé d'un mouvement de va-et-vient correspondant à
' '
6.Proc. Camb. Phil. Soc. (1924) (Supplement), ou Zeits. f . Phys. 13, 117
(1923). Zeits. f. Phys. 41,707 (1927). a Proc. Roy. Soc., A114,243 (1927). Natumis.,
14,664 (1926).
Sources et évolution de la physique quantique
150
l'image classique d'une vibration. C'est précisément sur cette remarque que Schrodinger a fondé l'espoir d'édifier une théorie purement ondulatoire de la matière sans utiliser le postulat quantlque. Mais, comme Heisenberg l'a exposé en détail, la simplicité du cas de l'oscillateur constitue une exception qui tient à la nature purement harmonique du mouvement classique correspondant. De plus, d'après la nature même de la question, il ne s'agit pas du tout d'un passage graduel au mouvement d'une particule. Dans le cas général, le groupe d'ondes s'étale peu à peu dans tout le domaine de i'atome, de sorte que le mouvement d'un électron ne peut être suivi que pendant un nombre de révolutions du même ordre de grandeur que les nombres quantiques attribués aux oscillations propres. Cette question a été étudiée en détail dans un récent travail de Darwin", qui renferme un grand nombre d'exemples Instructifs du comportement des groupes d'ondes. Kennard" a traité des problèmes analogues au point de vue de la théorie des matrices. Ici encore, nous nous heurtons donc à cet antagonisme, que nous avions déjà observé dans le cas des particules libres, entre le principe de superposition des ondes et l'hypothèse de l'individualité des particules. En même temps, la concordance asymptotique avec la théorie classique, qui ne connaït aucune différence de principe entre particules libres et particules iiées, Illustre d'une manière très simple les considérations précédentes sur l'emploi non contradictoire du concept d'état stationnaire. Comme on l'a vu, si l'on veut déceler la présence d'un atome dans un état stationnaire déterminé, on introduit dans la description temporelle une indétermination de l'ordre de grandeur des périodes qui correspondent aux processus de transition entre les états stationnaires considérés. Or, dans le domaine des grands nombres quantiques, ces périodes peuvent précisément s'interpréter comme des périodes de révolution et nous voyons donc que, même dans ce cas, il est impossible d'établir une relation causale entre des observations qui permettent de déceler un état stationnaire déterminé et des observations antérieures sur le comportement des particules individuelles de l'atome. En résumé, on peut dire que, dans leur domaine d'application, les concepts d'état stationnaire et de processus individuel de transition possedent autant de réalltë, ou aussi peu. que les particules indivlduelles elles-mêmes. Dans un cas comme dans l'autre, il s'agit d'une expression du principe de causalité, complémentaire à la description spatiotemporelle, et dont l'emploi logique n'est limité que par les possibilltés de définition des concepts considérés.
7.
Le problème des particules élémentaires - Si l'on tient compte du caractere de complémentarité exigé par le postulat quantique, les méthodes symboliques paraissent vraiment fournir une description non contradictoire des phénomènes atomiques, qui peut être regardée comme une généralisation naturelle de la description causale et spatiotemporelle ordinaire. Toutefois, ceci ne veut pas dire que ia théorie classique des électrons peut être considérée simplement comme un cas limite correspondant à une valeur infiniment petite du quantum d'action. En effet, ia description des faits expérimentaux que cherche à donner la théorie des électrons repose sur des hypothèses qui ne peuvent être séparées de l'ensemble des problèmes de la théorie quantique : c'est ce que montre déjà la difficulté de concilier l'individualité des partlcules électriques élémentaires lo
Proc. Roy. Soc., A117. 258 (1927). ieits.
r.
Phys. 47, 326 (1927).
La construction de la nouvelle mécanique
151
et les principes de la mécanique et de l'électrodynamique ordinaires. Dans cet ordre d'idées, la théorie de la gravitation,. telle qu'elle est formulée dans la théorie de la relativité générale, n'a pas répondu davantage aux espérances qu'on avait fondées sur elle. Une solution satisfaisante de ces questions ne peut sans doute venir que d'une modification rationnelle de l'interprétation de la théorie générale des champs, dans laquelle le quantum élémentaire d'électricité aurait trouvé sa place naturelle comme expression de I'lndivldualité caractérlstlque de la théorie quantique. Récemment, Klein a attiré l'attention sur la possibilité de rattacher ce problème à la représentation unitaire de l'électromagnétisme et de la gravitation dans l'univers à cinq dimensions introduit par Kaluza ; dans cette théorie. en effet, la conservation de l'électricité prend une forme analogue à celle de la conservation de l'énergie et de l'impulsion. Ces derniers concepts fournissent une description des phénomènes atomiques complémentaire à la description spatio-temporelle. De même, dans la théorie de Klein, puisque la charge électrique se présente toujours comme un quantum élémentaire bien défini, la cinquième dimension, qui lui est conjuguée, n'entre pas directement dans l'interprétation des faits expérimentaux. C'est sur ce point que reposeraient essentiellement la commodité de la description ordinaire à quatre dimensions ainsi que son utilisation symbolique dans la théorie des quanta. Abstraction faite de ces problèmes importants, encore sans solution, la théorie classique des électrons a joué un role fondamental dans les perfectionnements apportés tout récemment à la description des phénomènes basés sur le principe de correspondance. Ces perfectionnements résultent surtout de l'idée, émise pour la première fois par Compton, d'attribuer aux particules él&nentaires, en plus de leur masse et de leur charge, un moment magnétique, provenant lui-même d'un moment d'impulsion dont la valeur est déterminée par le quantum d'action. Cette hypothèse a été introduite avec succès par Goudsmit et Uhlenbeck dans la discussion de l'effet Zeeman anormal. Heisenberg et Jordan entre autres, ont montré qu'elle restait tout aussi féconde dans les nouvelles théories. On peut meme dire que I ' h y p o t h b de l'électron magnétique -jointe à l'analyse. due à Hei~enberg'~ , du phénomène de résonance qui se présente dans la description quantique des atomes à plusieurs électrons - a permis de parachever l'interprétation des spectres et des régularités du système périodique conformément au principe de correspondance. Les caractères fondamentaux de cette interpretation ont meme ouvert la voie à la découverte de certaines propriétés des noyaux atomiques. Ainsi, Dennison est parvenu ré~emment'~. en partant de certaines idées d'Heisenberg et de Hund, à surmonter les difficultés qui s'opposaient jusqu'ici à l'explication des variations de la chaleur spécifique de l'hydrogène aux basses températures : il suffit d'admettre que le proton possède aussi un moment d'impulsion, égal celui de l'électron. En raison de sa masse PIUS grande, il faut d'ailleurs attribuer au proton un moment magnétique beaucoup plus petit que celui de l'électron. Dans ces questions, l'insuffisance des méthodes existantes vis-à-vis du problème des partlcules élémentaires apparait dans leur inaptitude à fournir une justification univoque du '' principe d'exclusion " établi par Paull, qui révèle une dlfférence si caractéristique entre les particules électriques élémentaires et les " individus " symbolisés par l'idée l2
Zeits. f. Phys. 46,188 (1927).
l3 Zeits. f. Phys. l4
41,239 (1927).
Proc. Roy. Soc., A115,483 (1927).
152
Sources et évolution de la physique quantique
de photon. En effet, ce principe, dont les conséquences sont si importantes pour le problème de la constitution des atomes ainsi que pour le récent développement des théories statistiques. ne se présente que comme une possibilité parmi plusieurs autres imaginables, qui satisfont toutes au principe de correspondance. D'autre part le problème de l'électron magnétique nous offre un exemple particulièrement instructif de la difficulté que l'on éprouve dans la théorie quantique à satisfaire au principe de relativité. Thomas a montré qu'il était essentiel de tenir compte de la cinématique relativiste pour expliquer les résultats expérimentaux ; e t jusqu'ici ses observations n'avaient pu trouver place dans les w a i s si encourageants de généralisation des méthodes quantiques, que Darwin et Pauli avaient proposés pour traiter l a question. Mais Dirac vient d'attaquer avec succès'5 le problème de l'électron magnétique grâce à une nouvelle extension, fort ingénieuse. de la méthode symbolique ; II est ainsi parvenu à rendre compte de tous les détails des phénomènes spectraux qui en dépendent, tout en satisfaisant au principe de relativité. L e procédé de Dirac ne présente pas seulement, comme les preédents, une complexité caractérisée par l'emploi de grandeurs imaginaires ; mais de plus, il introduit dans les équations fondamentales elles-mêmes des groupes de nombres d'une complexité encore plus grande. D'après sa nature même, l'énoncé du principe de relativité suppose déjà l'union de la coordination spatio-temporelle e t du principe de causalité particulière aux théories classiques. Si l'on essaie d'adapter logiquement le principe de relativité au postulat quantique, il faut donc s'attendre à devoir renoncer à l'emploi des formes ordinaires d'intuitiog plus encore que dans les méthodes quantiques discutées ici. Nous avançons ainsi dans la voie suivie par Einstein : adapter graduellement les formes d'intuition dérivées des perceptions sensorielles à une connaissance des lois naturelles peu à peu approfondie. La principale difficulté que nous rencontrons dans cette voie provient de ce que, somme toute, chaque m o t de notre langue dépend de ces formes d'intuition. Dans la théorie quantique, nous nous heurtons à cette difficulté dès que nous VOUlOnS exprimer le caractère nécessairement irrationnel du postulat quantique. J'espère toutefois que le concept de complémentarité contribuera à élucider les difficultés actuelles, qui présentent une analogie si profonde avec les difficultés d'ordre général, résultant de la nécessité de faire une distinction entre sujet e t objet dans la formation des concepts humains.
l5 Proc. Roy. Soc..
A117,483(1927) [Article XV page 1941.
Article X I V
Le problème de la mesure en physique La théorie de l'observation en mécanique quantique F.LONDONet E. BAUER Exposés de Physique Générale III, 1-51, Hermann, Paris (1939)
introduction On sait que la physique théorique s'est transformée depuis le début de ce siècle en une doctrine essentiellement statistique et que c'est la découverte des quanta qui a rendu cette révolution inévitable. L'objet principal de cette étude sera l'interprétation statistique du formalisme de la théorie quantique. Bien que ces questions d'interprétation fussent déjà réglées il y a environ dix ans', on rencontre encore souvent des idées assez vagues sur le sens de l'apparition des probabilités dans la physique moderne. D'après certains, ce caractère statistique serait un symptôme de ce que notre connaissance des lois atomiques est encore jncomplète : il resterait à trouver des paramètres cachés, determinant les processus que, provisoirement, nous nous contentons de décrire en langage statistique. A les en croire, on pourrait espérer réussir quelque jour a refondre la théorie dans un moule détermin'kte. D'autres comprennent que c'est /'action de /'observateur qui est en jeu. Ils pensent parfois que celle-ci serait une action causale, mais incomplètement connue, parce qu'on ne sait jamais exactement dans quel état se trouve l'observateur. De là résulterait la dispersion statistique des mesures. dont il serait peut-être possible de prévoir les résultats exacts, si l'on pouvait mieux tenir compte de l'intervention de l'observateur. On a dit aussi que la loi de causalitéserait peut-être valable mais inapplicable, parce qu'il n'y aurait aucun moyen de reproCuire deux fois les conditions identiques. La discussion de ces questions n'est point un objet de speculation, c'est un problème positif, qu'on doit traiter en appliquant la théorie quantique au processus même de mesure, sur lequel elle fournit des précisions essentielles. On peut se convaincre que les distributions statistiques, telles qu'elles sont données par la mécanique qUantiqUe et confirmees par l'expérience, ont une structure telle qu'elles ne peuvent pas être réduites W. Heisenberg, Zeit. f. Phys., 43 1927 ; J.V. Neumann, GBttinger Nachrichten. 1927; P.A.M. Dirac, Proc. ROK Soc. A 113 1927.
Sources et évolution de la physique quantique
154
à l'aide de paramètres cachés. II ne s'agit pas, comme on l'a souvent prétendu, d'une question d'interprétation philosophique : la mécanique quantique devrait être fausse objectivement, si les processus atomiques étaient déterminés en réalité et seulement connus incomplètement. En effet il faudrait changer foncièrement la théorie et en abandonner des résultats assurés si l'on voulait la ramener a une base déterministe. La causalité n'est plus applicable, il est vrai ; mais la raison de ce fait n'est pas une Imposslbillté éventuelle de reprodulre identlquement les conditions d'une expérience. C'est essentiellement que la séparation de l'objet et de l'observateur présente des difficultés. C'est un trait assez général de la physique moderne que souvent ses conquetes ne sont obtenues que par le sacrifice de certaines de nos convictions philosophiques traditionnelles. L e cas de la mécanique quantique est particulièrement instructif. On a cherché en toute innocence à construire une théorie ne contenant que des relations entre les grandeUK '' observables " de la théorie de Bohr, notamment les fréquences et les intensite des raies spectrales. Heisenberg y parvint et réussit ainsi à obtenir un formalisme qui résolvait ce problème. Mais comme il arrive en physique théorique, le formallsmede la théorie une fois établi portait plus loin qu'on ne s'y attendait. II impliquait plus de relations que ses fondateurs n'en avaient mises explicitement, relations entre des grandeurs tout â fait anodines, observables elles aussi (coordonnées, impulsions, etc.). O n f u t conduit ainsi tout naturellement à chercher a p r b coup à interpréter ces relations qui découlaient automatiquement de la théorie. C'est ainsi que la discussion de ce formalisme nous apprit que le point de départ philosophique apparent de l a théorie, l'idée d'un monde observable, totalement indépendant de l'observateur, était une idée vide. Sans avoir eu l'intention d'aborder une théorie de la connaSance, bien qu'ils fussent même guidés par une philosophie assez contestable, les physiciens furent entraÏnés, pour ainsi dire, malgré eux à découvrir que le formalisme de la mécanique quantique implique déjà une théorie bien définie de la relation entre l'objet et l'observateur, relation bien différente de ce réalisme naïf, qui semblait jusqu'alors une des bases necessaires de toute science de la nature. Pour la discussion de l'acte de mesure il est nécessaire de considérer au moins deux systèmes. l'observateur et l'objet. II nous faudra donc appliquer la théorie quantique d'un système de plusieurs corps. Celle-cl n'existe à présent que dans l'approximation non relativiste. Nous serons donc forcés de nous borner 3 cette approximation qui néglige encore tous les M e t s des retards de propagation. II ne peut pas s'agir ici de donner une introduction détaillée à la mkanique quantique. Nous nous bornerons (1. et 2.) à rappeler brièvement, sous une forme un peu dogmatique, les définitions et les lois fondamentales dont nous aurons besoin2.
1. Résumé des principes de la physique quantique L'emploi de conceptions statistiques en physique atomique est beaucoup plus ancien que la mécanique ondulatoire. Le premier pas en ce sens a peut-être été fait au moment où
'
Pour un exposé plus détaillé de la théorie de quanta. voir par exemple : L. de Broglie. Introduction à l'étude de la meanigue ondulatoire. Paris, 1930 : E. Bloch, L'ancienne et la nouvelle TheOrie des Quanta. Pads, 1930 ; E.C. Kemble. Quantum Mechanics. New York, 1937 : 5 . Dushman, The elements o f Quantum Mechanics. London, 1938.
La construction de la nouvelle mécanique
155
l'on décrivit par des lois de probabilité les décompositions radioactives spontanées. Bien entendu, on a pensé d'abord qu?l s'agissait d'un état de choses provisoire provenant de notre ignorance de ce qui se passe à l'intérieur des noyaux. Mais quand Bohr, évidemment guidé par une analogie avec ces conceptions statistiques, construisit son modèle d'atome avec ses sauts quantiques spontanés, e t surtout quand Einstein établit sa démonstration célèbre de la loi fondamentale du rayonnement de Planck en prenant pour base l'idée de probabilités élémentaires de transition spontanée ou forcée (coefficients de probabilité A e t B ) , on eut déjà le sentiment net que ces probabilit6s devraient Etre quelque chose de fondamental et d'irréductible. Dans un monde de phénomènes discontinus, l'apparition d'une forme statistique des lois élémentaires semblait presque inevitable. La théorie de Bohr, bien qu'elle ne fournit pas encore un schème mathématique complet et cohérent, permettait déjà de poser les questions principales auxquelles devait répondre plus tard la théorie quantique : Dans une physique concernant des grandeurs dont les domaines de variation ne sont pas nécessairement continus il s'agit de savoir : 1. Quelles sont les valeurs possibles d'une grandeur physique 7
2. Avec quelles probabilités sont-elles réalisées dans un système e t dans des circonstances donnés ?
L a mecanique quantique nous fournit un schéma précis qui permet de traiter de façon quantitative les questions de ce genre. Nous pouvons le résumer de la manière suivante : " L'état " d'un système, donné en mécanique classique à chaque instant t par les 2f valeurs des variables ql(t),q*(t)...q1( t ) , P l ( t ) , p z ( t ) ...pf( t), est représenté en mécanique quantique par une fonction complexe des f variables QI,qz q j e t de t, la '' fonction d'onde de Schrodinger "
...
qui est normée de telle manière que' :
L'évolution du système dans le temps est réglée en mécanique classique par une "fonction hamiltonienne " H ( q , p ) caractéristique du système en question. Cette fonction des coordonnées QI, B.. q j e t des impulsions p 1 , ~ . p f , qui n'est autre que l'énergie, permet d'écrire les équations hamiitoniennes du mouvement. C'est essentiellement' la même fonction B ( q , p ) qui en mécanique quantique aussi donne l a loi d'évolution du
.
.
a (q, *,> en remplacant && et q k par l'opération de
représentant tl, de l'état du système : on forme l'opérateur p k dans I'hamiltonien par l'opérateur de différenciation
multlplication par qk. II s'introduit ici une certaine ambiguïté en ce qui concerne l'ordre des facteurs, parce que ias opérations q k e t ne sont pas comrnutables. II nous sufiira
&
~~
~~
Dans ce qui suit les intégrales j d q sont toujours prises sur tout i'espace des configurations pl, 6.. . q j e t $* est la valeur complexe conjuguée de
'
+.
Complétée par un terme
se rapportant au
spin 'I.
Sources et évolution de la physique quantique
156
de savoir qu'il y a des prescriptions suffisantes en général pour déterminer univoquement l'ordre des opérateurs, mais nous ne nOUS occuperons pas ici de ce détail. L'opérateur
a (q, A&),une fois donné, nous Permet d'écrire l'équation d'évolution :
Cette équation, découverte par Schradinger, a la propriété importante de lav& ser invariante i'intégraie J$tp'dq, ce qui est nécessaire pour que notre normalisation $$*dq = 1soit possible. Donc 4, une fois norme. garde pour toujours sa normalisation. $(q, t o ) représente un " état " du système à un instant t o . Nous prenons ici ce mot dans un sens tout à fait analogue à Celui qu'il a en mécanique classique où l'on dit que les données q I ( t 0 ) . q f ( t o ) , p i ( t o ) . pf(t0) " représentent un état La connaissance du représentant de l'état 2 un instant donné est nécessaire e t sufisante pour calculer de façon univoque, à l'aide de la loi dynamique, le représentant de l'état en chaque instant ultérieur. Nous ne pouvons pas nous passer d'une partie de ces données sans perdre la possibilité de calculer l'avenir. Nous ne pouvons pas non plus y ajouter de données supplémentaires sans introduire des tautologies inutiles ou des contradictions aux données dejà rassemblées. Les €tats stationnaires de Bohr correspondent à des solutions particuliers de I'équation de Schrodinger, solutions purement périodiques dans le temps et de la forme complexe :
I
..
..
' I .
rl, = e Y E f . u(q1 Par suite de (1) et (2). 1'" amplitude du temps
"
(3)
u(q) obéit à une équation qui ne dépend pas
:
[H,u]=E.u
(4)
et à la condition de normalisation :
I
uu*dq = 1
(5)
Ce couple d'équations (4) et (5) n'a pas en général de solution pour toute valeur de
E. IIreprésente un problème aux valeurs propres ". C'est seulement pour un '' spectre de valeurs particulières El,&,& ... pouvant contenir aussi des intervalles continus5, que la condition (5) peut être remplie. Pour les autres valeurs de E t'équation Ilnéaire "
I'
u contenant un facteur arbitraire ; mais elles ne sont pas de carré sommable, ce qui rend la normalisation (5) impossible. Les valeurs a d m i w (4) a naturellement aussi des solutions
E l , &...Et...
'
Au cas d'un spectre continu la condition (5) devrait être imposee 2 une fonction u adjointe à un petit intervalle d d du continu (" différentielles propres "). Dans ce qui
suit, nous ne tiendrons pas compte de ces subtilités, qui ne touchent que des questions de pure forme, et nous écrirons toutes les formules comme s'il n'y avait que des spectres discontinus.
La construction de la nouvelle mécanique
157
sont appelées les " valeurs propres " de l'opérateur H. Les solutions correspondantes u sont appelées " fonctions propr,es " e t désignées par des indices correspondants
Ce fut l'idée fondamentale de Schrodinger d'identifier les spectres des valeurs propres les dimensions d'une énergie, aux valeurs permises de l'énergie dans la théorie de Bohr et l'on sait le succès de cette idée ingénieuse. O n sait aussi que les fondateurs de la mécanique ondulatoire ont été d'abord guidés par la conviction qu'il fallait se débarrasser des discontinuit&, ou plutôt les fonder sur une substructure essentiellement continue, sur une théorie de champ, et bouleverser ainsi l'image foncièrement statistique de Bohr e t d'Einstein. Mais ce programme ne s'est pas montré réalisable. L'interprétation statistique de la mécanique ondulatoire peut être considérée comme une tentative particulierement conservatrice pour maintenir l'image de Bohr et d'Einstein et l'encadrer en un système théorique cohérent. Maintenant que nous savons interpréter les solutions monochromatiques de l'équation d'onde (2) telles que
E,, & ..., qui ont
$ =e F E k i .
Uk(4)
comme représentant les états possédant l'énergie E k , il nous faut apprendre quelle est la signification des solutions plus générales. On peut montrer que, si l'on se borne aux fonctions de carré sommable (1). la solution la plus générale de l'équation ( 2 ) , s'écrit
où les Ck sont des constantes complexes. C'est Born qui, en répondant à cette question, posa les fondements de l'interprétation statistique de la théorie : il admit que la grandeur Ick12 donne la probabilité de trouver
+ zk
ia valeur d e l'énergie, lorsque ie système dans l'état = ckevEki soumis à une mesure de cette énergie. SI nous introduisons l'abréviation + k = c k e Y E k * , nous pouvons écrire
u k ( q ) est
es coemcients +k ne dépendent que du temps, et, comme 1tjk1' = Ick12. nous pouvons interpreter aussi la grandeur I$k(t)12 comme ia probabilité de trouver dans i'état rl, la valeur E k de l'énergie. Les c o d d e n t s G k peuvent d'ailleurs être calculés très facilement à l'aide des deux propriétés fondamentales des fonctions propres : 1. être " orthogonales " :
]
Uk*u
où
= &kt
Sources et évolution de la physique quantique
158
2. former un ” système complet ”, ce qui veut dire que pour une fonction f ( q ) quelconque de carré sommable f * f d q =fini) on a l’identité :
(s
(6’)
La propriété 1. donne immédlatement la forme des coefficients $Jk du développement :en multlpllant (6’) paru(’ et en intégrant on obtient :
J *(q)uc*(q)dq = +e
(9)
La propriété 2. donne l a garantie que le développement ainsi défini converge vers la fonction +(q) : en effet, l’Intégrale du carré de la valeur absolue de la différence
3(q>- W f 4 d s’annule :
D’où résulte aussi :
=
*f*f
f
/ *3’4
= 1.
C’est-à-dlre que la somme des probabilités de trouver n’importe quelle valeur de l’énergie art l’unlté ; si nous cherchons quelle est l’énergie, nous pouvons être assures d’en trouver toujours une valeur. Bien entendu, Il faut qu’Il en soit ainsi pour que les definitions de Born aient un sens. Alnsl nous voyons comment, pour l’énergie au moins, la théorie quantique répond aux deux questions qui se posaient * à toute théorle du discontinu : 1. Les valeurs possibles de l’énergie sont les valeurs propres &,&,E3 de i’opérateur
iï (g, &F8 ,
...
.
2. La probabilité de trouver dans l’état, représenté par
$J, la valeur
de i’énergie
est donnée par
oh
u& est la fonction propre de l’énergie
pour une valeur propre &.
En particulier, si par hasard l’état est représenté par une fonction propre de l’énergie, C’&-%dln $1
41, = uk, voir P 157
159
La construction de la nouvelle mécanique
l'équation (IO) donne les probabilités 1 pour la valeur E, e t O pour toute autre valeur. Dans la théorie primitive de Bohr on s'était préoccupé surtout de I'energie. Cependant dans notre formalisme actuel l'énergie ne joue un role singulier que pour 1'6volutlon dans ie temps d'un état r e p r h n t é par sa fonction 16 (équation (2)). Si $ est donné à un certain instant, nous pouvons chercher aussi des prévisions statlstiques concernant à cet instant une grandeur F(q,p) quelconque. La généralisation de nos délinitions à d'autres grandeurs F (q, p ) (comme par exemple zp, ypS, qp., etc.) est tout indiquée :
-
Nous formons i'opérateur F (q,
-,njq)
et detinissons à i'aide des équations du
problème propre
..
.
les valeurs propres fi, fi . f,,.. de i'opérateur F et les fonctions propres correspondantes v i l v2.. u p . , Les mathématiciens ont montré que ces dernières forment, elles
.
.
aussi, sous des conditlons suffisamment larges, un S y S t h e complet de fonctions orthogonales, C'est-à-dire que nous avons les relations
I
v,,v;dq = sw
(12)
e t que nous pouvons développer la fonction 16 à un moment donné t o en série convergente de ces fonctions up :
Il(%
to) =
c
4,,(tO)V,,(P)
C
Ob
+,,(to) = /4(P,to)v;(od* L a généralisation de nos définitions antérieures est immédiate : 1. Les valeurs posriblcs de la grandeur F sont données par les valeurs propres
,
fi fi..
4)
.f,,...de i'opérateur F q,* ; -.
(
2. L a probabilité de trouver dans i'état r e p r h n t é par
16 la valeur f,,de la grandeur
F(q,p) est donn6e par
P r o w , , ) =I
1
16(at.)+?)dq
12=1
$,
I2
(13)
En particulier, si par hasard l'état est reprCHnté par une fonction propre Y,,de c'est-à-dire si
f,
16 = vp on obtient
la probabilité 1 de trouver ia valeur valeur la probabilité O.
f,,de
la grandeur F e t pour toute autre
Sources et éuolution de la physique quantique
160
De ces définitions résulte immédiatement la valeur moyenne de
F
dans /'&at
4
:
Cette expression peut ëtre écrite sous une forme p l u commode, qui permet de calculer immédiatement la moyenne, sans qu'il soit nécessaire de recourir à un calcul explicite des valeurs propres individuelles f p e t à un développement de 4 en série des vp. O n vérifie aisément que
MoydF) =
/ 4'[F41dq
(14')
car, par suite de (11) e t (12). cette expresslon s'écrit :
2.
N o t a t i o n vectorielle
Nos définitions sont maintenant complètes. II nous reste seulement à introduire une notation un peu plus commode, celle du langage vectoriel. Vecteurs Nous dirons que l a fonction $(q), représentant l'état instantané d'un système, est un vecteur " dans un espace à un nombre infini de dimensions, l'espace fonctionnel de Hilbert. L'intégrale du produit des deux fonctions $* e t 4 prise sur toutes les coordonnées q1, q2 qf sera appelé le " produit scalaire de $ e t " :
-
...
I#I
E, vecteur. propres v i , y ...vp... d'un opérateur F satisfont à la relation (1..
La grandeur ($,$) = S$*$dq = I IPp 1' sera le c a r e de la longueur du (q,4) = 0 signifie que les vecteurs $ e t 4 sont " orthogonaux 'I.
Les fonctions
eq(12))
:
Elles forment donc un systêrne de vecteuriunités orthogonaux qui définissent un système de coordonn6es orthogonales où l'on peut représenter un vecteur
sous la forme
4(n)= C+P% P
Les composantes $p du vecteur
$ sont
définies par la
"
projection
"
4 quelconque
La construction de la nouvelle mécanique
de
161
$ en direction du vecteur vp.
Cette décomposition en composantes est tout à fait analogue à celle d’un vecteur dans l’espace ordinaire. Nous pouvons considérer l’ensemble des $, comme équivalent à la fonction $(q) elle-meme ; c’est une décornposition particulière du vecteur $ en composantes orthogonales. Les coeflicients
donneraient une décomposition analogue du même vecteur suivant un autre système d‘axes orthogonaux Ui,U2.. Uk La représentation de $ par lui-même, c’est-à-dire la fonction 11>(q), peut être considérée comme un cas special de représentation en composantes orthogonales, à savoir à l’aide du système orthogonal de fonctions propres de l’opérateur particulier F = q. Le problème aux valeurs propres de cet opérateur s’écrit :
.
...
q.vu(q) = qa.va(q)
Ses solutions sont les fonctions
”
(q
ou
-qu).47) =0
limites ” de Dirac
vu(q) = 4 2 qui sont par définition égales à O pour q
# qa
-
mais telles que
jS(q-~u)dP=l. En terme de ces fonctions propres particulières, on obtient pour $(q) le développement banal :
=
c
$(nu)a(B
- qu)
U
où $(qa) = J$(q)6(q
- qa)dq sont les coefficients du développement.
De nos définitions générales r h u l t e donc en particulier :
I $(q) 1’
dq = Probabilité de trouver q dans l’intervalle [q, q
Tenseurs - Dans cette image, les opérateurs F
(
q,
L8,)
--
+ dq].
, représentant les gran-
deurs physiques, sont des tenseurs, c’est-à-dire des transformations linéaires des vecteurs : appliqués à un vecteur 3, ils le transforment en un autre vecteur $‘ = [F$].ils sont linPaires parce que, pour toutes les combinaisons de différentiations et de multiplications, on a toujours la relation distributive :
et que, pour toute constante e, on a :
Sources et évolution de la physique quantique
162
Comme ils représentent des grandeurs physiques réelles (non complexes), ils ont encore une autre propriété importante :
(4, F$)=
($9
F99* *
(3)
Ce sont des opérateurs du type hermitien. L a relatlon (3) se démontre aidment par intégratlon par parties, en tenant compte du f a i t que chaque différentiation contenue dans
F
apporte un facteur
i et
que
F,considérée comme fonction de p e t
-a est 2*i aq I
une fonction réelle. si nous utilisons pour la représentation par les $k, c'est-à-dire si nous nous référons au système de coordonnées u1 u 2 . . . U t . . il faut décomposer aussi l'opérateur F en composantes suivant ces mêmes coordonnées, d'où résulte évidemment la transformation linéaire eRectuée par la matrice
4
,
..
En effet si l'on applique cette transformation à un vecteur $1
on obtient la composante d'indice k de la fonction De (3) résulte immédiatement la relation
[F$].
.
des " matrices bermitiennes " II y a un système de coordonnées, dans lequel la matrice representant l'opérateur F montre une forme particulièrement simple. Ce sont les coordonnées définies par les fonctions propres v i . . .Y,, de cet opérateur lui-meme. Pour celles-ci l'on obtient :
...
Dans ces coordonnées
"
propres
", la matrice F
prend donc la forme diagonale e t
ses éléments diagonaux sont les valeurs propres de F :
F, =
fi
O
O
f2
O O
O O
......
...... O O f3 O ...... O O O f4 ...... ..................
Dans le système de coordonnées $J , relatif à un développement de q$ en &rie des fonctions propres VI u p . . d'un opérateur quelconque F,I'opdrateur hamiltonien H prend la forme H , = (vp, a v , ) et I'équatlon de Schrminger s'&rit :
...
.
La construction de la nouvelle mécanique
163
forme discontinue sous laquelle Heisenberg. Born e t JorUan ont trouvé tout d'abord les équations de la mtkanique quantique.
-
.
Invariants. R6servons les grandes lettres H , F . . pour les tenseurs, les lettres grecques $,cp,. pour les vecteurs ; nous pourrons alors supprimer 1- indices (ou arguments) caractéristiques d'une décomposition particulière en composantes et écrire (7) sous forme invariante, indépendante du système de coordonnées, ou plutbt comprenant tous les systèmes possibles (cf.éq.(2) $1) :
..
h
I?$=-$.
2iri
Deux repr&ntations
et
différentes d'un même vecteur
$,
rbP = ( y p , 3 ) sont liées entre elles par une transformation rbk
s k p $p
avec
skp
par exempte $k linéaire :
=(ut,
= ( U k , $)
rb)
(8)
P
En &et,
comme
$=
skp
vp (vp +), on a :
P
Pour les coefficients
-
OQ s k p
Skp,on
obtient facilement tes relations :
= spk.
Ces relations caradérlsent la transformation (8) comme une t r a n s f o m a t l m taire
".
" un&
Deux représentationsdifférentes du même tenseur F , par exemple F k r = ( U k , Fui) e t Fw = (up, Fu,). sont liées entre elles comme on le vkrme aisément. par les relations :
En f l e t . c o m m U k
=
vp (vp U k ) = P
S o h p vp. on
P
a
Sources et évolution de la physique quantique
164
es valeurs numériques ayant une signiflcation physique doivent naturellement €tre des salaires invariants par rapport à ces transformations unitaires. Les seuls scalaires invariants que nous rencontrerons sont le " produit scalaire " de deux vecteurs $ et 9 :
e t la
"
trace
"
d'un tenseur
Ri :
Ainsi par exemple la valeur moyenne d'une grandeur F dans l'état forme invariante par un produit scalaire
est donnée sous
Les autres données de la théorie pourront s'écrire aussi de manière invariante. Nous. y reviendrons au
$5.
L e produit scalaire peut aussi être considéré comme la trace d'une matrice particuiière ($ x Q) définie par :
('b et qu'on appelle le
3.
"
produit direct
"
= #JEQP
x '+')Lo
des vecteurs
(10)
$ et y.
Statistique e t objectivité
Déjà dans le mémoire classique' où il posa les premières bases.de l'interprétation statistique de la mécanique des quanta, Born remarqua que les probabilités qu'il y introduisait devaient avoir un caractère assez étrange et très différent de ce que l'on entend en générai lorsqu'on parle de probabilités. C'est ce qu'il exprima sous une forme un peu paradaxale : " Bien que les mouvements des particules ne soient détermine que par des probabilités. ces probabilités memes Ce qu'il entend ici par '' loi causale ", c'est évoluent conformément à une loi causale une connexion entre des " états I' à différents instants, telle que la connaissance d'un état initlal à un instant quelconque implique univoquement la connaissance de l'état à t o u t instant ultérieur. Un " état ", d'autre part, c'est une collection bien définie de données relatives au système en question. à un instant donné. II n'y a natureliement aucun moyen de prévoir a priorisi, dans un certain domaine des sciences, il existe des lois causales ainsi définies e t quelles sont les données nécessaires et suffisantes pour les constituer. Si l'on n'aboutit pas à des prévisions univoques, si l'on se voit forcé de se contenter de probabilités. cela peut provenir ou bien de ce que notre connaissance de " l'état " n'est pas encore complète, ou encore de ce qu'il n'y a
".
Zeit. f. Phys. 37,1926.
La construction de la nouvelle mécanique
165
pas de causalité. Mais, par contre, losqu'on a réussi à établir des lois causales, cela est évidemment un critérium du fait que l'on a atteint une connaissance complète de l'objet, dont on dispose ainsi. en quelque sorte, d'une description maximum. O r l'équation de Schrodinger présente tous les caractères d'une connexion causale : si la fonction $ est connue à un moment donné, elle est déterminée pour tout instant ultérieur. II semble donc difficile de concevoir que cette fonction contienne néanmoins une collection de statistiques. A première vue. il semble impossible d'éviter le dilemme suivant : 1. - O n pourrait concevoir que la fonction $ a le caractère d'une fonction de probabilités ordinaires telles qu'on en fait usage par exemple pour décrire le mouvement brownien : une fonction de ce type contient certaines prédictions statistiques. que nous pouvons vérifier. Nous constaterons alors laquelle des possibilités prévues théoriquement est réalisée en fait dans un cas donné. Après cette observation, nous sommes naturellement en droit de faire usage, pour des prédictions ultérieures, de ia connaissance ainsi obtenue et de rempiacer notre fonction de probabilités primitive par une fonction du même type, mais mieux adaptée. Cela n'est évidemment possible qu'en vertu de l'enrichissement de notre connaissance, toujours partielle. Bien entendu, nous ne prétendons pas que l'objet lui-même ait changé d'état par suite de notre observation. Seul a changé l'écart entre notre connaissance et l'objet. Dans ce cas la fonction $ représenterait donc i'état de notre connaissance partielle de l'objet et non i'état de l'objet lui-même. II.- Supposons par contre que la fonction $ ait un caractère '' objectif" comme, par exemple, les fonctions d'onde de l'optique. Elle prétend alors représenter, sous une forme idéaliee et simplifiée. quelque chose de complet. une image maximum de l'état de l'objet. peut Mais s'il en est ainsi, il semble difficile de comprendre comment cette fonction impliquer une statistique : si l'on soumet à un contrôle expérimental les prédictions qu'on en peut déduire et si l'on observe lequel est réalisé parmi les cas possibles - cas prévu par la théorie, mais seulement avec une certaine probabilité -, de quel droit pouvons-nous ajouter cette noueelle connaissance à notre conna'ksance antérieure prétendue complète ? C'est Heisenberg qui trouva la solution de ce dilemme. II remarqua que c'est le processus de mesure lui-mëme qui introduit l'élément d'incertitude sur l'état de l'objet. Ainsi l'élément statistique n'interviendrait qu'à l'occasion d'une mesure e t si la fonction $ nous fournit des probabilités. elle ne le fait qu'en vue d'une mesure éventuelle. Ce ne sont donc pour ainsi dire que des probabilités y p o t e n t i e I h qui entrent seulement en vigueur à l'occasion d'une mesure actuelle. Elles ne touchent pas la précision avec laquelle l'état du système est actuellement connu ; celle-ci est maximum lorsque la fonctlon $ est donnée. Blen entendu il peut arriver qu'il existe en outre une incertitude sur l'état du système. c'&-&dire sur la fonctlon (I elle-même. Dans ce cas il s'agit de probabiiita au sens ordinaire du m o t : elles proviennent d'une connaissance incomplète de l'état de l'objet ; il faut les distinguer clairement des probabilités potentielles fournies par les fonctions $.
Sources et évolution de la physique quantique
166
4. Mélanges e t cas purs
c'est par un exemple que l'on comprendra le mieux qu'Il s'agit ici d'une distinction essentielle : 1.
- Considérons d'abord le cas OU un systeme est représenté par une fonction d'onde t
...
.
où u1, uz ut.. sont par exemple les fonctions d'onde de l'énergie. Nous savons que la grandeur nous donne la probabilité de trouver la valeur Ek de l'énergie lorsque le système dans l'état 4 est soumis à une mesure de cette dernière.
-
II. On a souvent pens$ que ce cas correspond simplement à un ensemble virtuel de systèmes identiques en différents états possédant respectlvement les énergies El,&; &. chacun d'eux étant contenu dans l'ensemble avec les concentrations pk =
...
..,
1
du
Cependant ce dernier cas (Il), qui nous intéressera aussi, est essentiellement différent cas pur " (I) représenté par une seule fonction
y
cas
...
Iz ...
avec les concentrations respectives m = /
(t)
tandls que dans le cas II, chaque composante genre, c'est-à-dlre :
'
(1) ( 2 )
Dans ce qui suit les indices supérieurs ( d , , q5 p u n distincts.
donne une contribution de ce
(ml
... d, ) designent toujours des cas
La construction de la nouvelle mécanique
167
Lorsque cette composante apparaTt avec la probabilité p k dans le mélange, on obtient au total k
Donc si nous considérons ie cas du mélange oti p k = 1$Jk12, nous obtenons
Donc, pourvu que F k i ne soit,pas par hasard une matrice diagonale (c'est-à-dire que n'ait pas les mêmes fonctions propres que les deux cas I et II sont foncièrement différents. II est évident que dans le cas II notre connaissance du système est beaucoup plus restreinte que dans le cas I : si elle se borne à la statistique de l'énergie, c'est-à-dire si nous avons seulement les équations
a),
F
nous connaissons non pas les coefficients $Jk eux-mêmes, mais seulement leurs valeurs absolues. Etant donné que les $k sont des grandeut5 essentiellement complexes, nous Douvons les écrire sous la forme
où les p h a w Qk sont encore indéterminées. O n se rend aisément compte que la différence entre le cas I et II provient en effet de cette ignorance concernant les phases Qk. Car en introduisant (1) dans l'expression Moyl (F), nous obtenons :
Si nous prenons alors la moyenne sur les phases inconnues. tous les éiéments s'annulent et l'on retombe précisément sur la Moy,,(F).
k#I
O n voit donc qu'il faut faire une distinction nette entre :
-
1. Un '' cas pur ", décrit par une seule fonction d'onde $ qui représente, nous le verrons, quelque chose d'irréductible, les probabilités qu'il implique ne sont que des
probabilités
"
potentielles
"
: (1) (2)
... ...
II. - Un '' mé/ange ", composé de différents cas purs $, $ $ réalisés avec les probabilités pl, p 2 . . pn Ces dernières probabilités sont entendues au sens ordinaire du mot. Elles sont naturellement toujours non-négatives ; nous les supposons normées :
.
...
n
Sources et évolution de la physique quantique
168
5. L'opérateur statistique IIsera utile d'introduire ici une notation concise pour caractériser en toute généralité
les ensembles statistiques. Considérons un mélange tel que nous l'avons défini tout à l'heure ($4. il). La valeur moyenne d'une grandeur G dans ce mélange est donnée par :
n
ou, dans un système particulier de coordonnées :
ce qui peut s'écrire :
Moy(G) = Trace (PG) = nace (GP), en introduisant une matrice hermitienne
P.la
"
matrice statistique " définie par
:
c'est-à-dire dans un système particulier de coordonnées
n
Le
cas pur $ =
$hP up est compris dans ces formules comme cas particulier d'un P
mélange où tous les pn sont nuls sauf un seul, qui est égal à un. Sa matrice statistique s'écrit :
Appelons la matrice statistique d'un cas pur une " matrice é/émentaire " ( I ' Einzek matrix "). La matrice d'un mélange général P peut alors être considérée comme une superposition linéaire de " matrices élémentaires " :
(lb)
p,=62p'628=
O O O O
O O 1 O O O O O
O
1..
... ... ... . . . . ... O
O O
(2')
169
La construction de la nouvelle mécanique
Calculons maintenant la probabilité de trouver la valeur go de G dans l'ensemble caractérise par sa matrice statistique, P : prenons comme axes les fonctions propres vu de l'opérateur G. Pour la composante pure
(4 $ =
(4 $ o v u avec l'indice ti, nous avons
(Si. €4.
(13)) :
Lorsque cette composante se trouve dans l'ensemble avec la probabilité pn, on a au total :
si nous nous servons de
(a)
la matrice élémentaire
P
du cas pur où
G = go
nous pouvons écrire la probabilité de trouver la valeurg, dans le mélange P invariante :
MUS
(4 Probp (gu) = Pap = Trace (P P )
(4 En particulier si P = p désigne le cas où
(cf. (2'))
la forme
(11)
une grandeur quelconque
F
a la valeur
est la probabilité de trouver dans le cas pur où F = fn la valeur G = gu. On remarquera que cette expression est t o u t à fait symétrique en F et G. La même grandeur (ill)donne donc aussi la probabilité de trouver F = fn dans le cas pur où G = gu. Les matrices statistiques P présentent donc un avantage évident : elles permettent de donner à toutes nos définitions une exprwion dont la forme même (I)(II) (Ill)indique déjà le caractere invariant.
6. Quelques propriétés mathématiques des matrices statistiques a) Calculons la trace d'une matrice statistique
O
n
P quelconque
o
nous obtenons donc la relation
Trace P = 1 qui exprime en somme la normalisation des probabilités.
n
:
Sources et évolution de la physique quantique
170
b) En particulier les matrices statistiques é/émentaifes P des outre ia propriété
cas purs possèdent en
qui résulte immédiatement de ia définition ($5.. 2) de ces matrices
La relation (2) est d'ailleurs évidente si l'on se rappelle la représentation diagonale (5. 2') des matrices élémentaires. L'on voit immédiatement que l'inverse est vrai aussi : de P2 = P e t de Trace P = 1, résuite que P est une matrice élémentaire. En f l e t lorsque P est écrit sous sa forme diagonale p 2 est égaiement diagonale e t P = P2 entrafne pi = piz. Les valeurs propry sont donc nulles ou égaies à l'unité. De l'équation Trace P = c p i = 1 résulte enfin I
qu'un seul des p est égal à un, et que tous les autres sont nuls. La relation p 2 - P = 0 est donc nécessaire et suflsante pour que la matrice statistique P soit la matrice d'un cas pur. c) Nous n'avons encore fait aucune restriction concernant le choix des cas purs qui constituent un mélange. En particulier, nous n'avons pas supposé qu'ils étaient (4
représentés par des fonctions d'onde 3 orthogonales. Mais on se rend très facilement compte qu'un mélange quelconque composé de cas purs quelconques peut toujours être écrit sous la forme d'un mélange de cas purs orthogonaux avec des concentrations pi non-négatives. Montrons d'abord que la matrice P est une matrice semi-déffnie *', c'est-&dire que pour un vecteur ( quelconque, on a toujours O'
(t,PO 2 0 En effet la définition (5.. 1') de
(3)
*
P donne :
I(.$,
(n)
1'
expression qui ne peut être négative, car pn 2 0 et t/~ ) 2 O, Or P est une matrice hermitienne. II y a donc un système de coordonnées ortbogonales y, y., u p . . où P prend sa forme diagonale
.
.
4
O
O
pi O
O
O O pi O O p;
... ...
... ... . . . . ...
Pw = O
O
O
O
(4)
171
La construction de la nouvelle mécanique
Les valeurs de la diagonale encore dans ces coordonnées :
p i p i . . . p i ne peuvent être négatlves. En
ce qui n'est possible pour un vecteur [ quelconque que si p', L a matrice
P
2 O,
effet, on a
quel que soit p.
peut toujours être écrite sous ia forme
P
(Pl
où les p sont les matrices élémentaires d'un certain système de cas purs orthogonaux v i , v2 vp es p i p i . p i 1 O sont leurs concentrations. Comme Trace P = 1, nous avons aussi
... ...
et
p',
..
2 O entraîne
d) De cette inégalité r&ulte en outre :
D'où pour un vecteur
t$
quelconque :
-
La matrice P P2 est donc égaiement semi-définie. ' s'évanouit (2). En particulier pour un cas pur la grandeur P P Les operateurs statistiques élémentaires P = ($ Xqb) peuvent être considérés comme Appliqués à un vecteur arbitraire 4, ils projettent ce vecteur dans la des " projecteurs direction du vecteur $.
-
".
0,
La longueur de ce vecteur est ($, sa direction est celle du vecteur unité L'itération d'une projection ne change plus rien : P' = P .
$.
Sources et évolution de la physique quantique
172
7. L'opérateur statistique et la thermodynamique L'opérateur P caractérise un ensemble de systemes identiques qui sont distribués d'une manière quelconque sur des états différents. II joue un rdle analogue à celui de la fonction de répartition en mécanique statistique ordinaire. II doit donc y avoir une connexion entre l'opérateur P et les grandeurs macroscopiques de la thermodynamique. II nous suffira ici d'indiquer brièvement en quoi consiste cette connexion, sans nous arrêter aux démonstrations'. Tout est contenu dans la définition de l'entropie :
s
S = -kN?tace (Ph P);
k = Constante de Boltzmann. N = nombre total des systèmes.
Celle-ci est fort plausible, si l'on se rappelle qu'en mécanique statistique classique on a : S= In na - N In N )
-kC(n, P
où na est le nombre de systèmes dans l'état a. Donc si pa
=
pour qu'un système soit dans l'état a,on a encore
n
N
représente
la probabilité
S = -kN [ C p P ( I npa +In N ) -In N I , ce qui est identique avec (1) dans le système de coordonnées où P est diagonal (6.4). Notre définition de l'entropie est donc une généralisation t o u t indiquée de la definition habituelle. On voit immédiatement que, pour un cas pur, l'entropie ainsi définie s'annule. Car si l'on utiiiie pour P sa représentation sous forme diagonale, l'entropie s'écrit :
P
où chaque terme pa pu de la somme s'annule ; car dans un cas pur les pu sont nuls sauf un seul qui est égal à 1. O n voit immédiatement aussi que l'entropie d'un mélange est toujours positive. Le maximum de l'entropie pour une énergie totale E donnée impose à P les conditions suivantes :
- k N T r W ( P In P)+Max. TraCeP=l NTrace(PH) = E
La solution de ce problème d'extremum est représenté par la matrice :
'
Voir J. v. Neumann, Gottinger Nach., 1927. p 273.
173
La construction de la nouvelle mécanique
où
2(@) =?\race(ë#H) Le facteur de Lagrange @ parfait :
1
=-
kT ‘
où
se détermine comme toujours par équilibre avec un gaz
T est la température absolue.
On obtient donc pour l’entropie de la distribution la plus probable :
u - In 21
= -k N [P- a
aa L’énergie :
d’où l’on tire aisément toutes les autres grandeurs thermodynamiques, par exempie l’énergie libre : F = E -TS = -kNT In 2, etc.
8. L’irréductibilité du cas pur Nos définitions manqueraient de valeur si les cas purs n’étaient pas caractérisés par quelque chose d’irréductible. II faut démontrer qu’il n’est pas possible de repreenter un cas pur sous la forme d’un mélange. Pour cela, nous établirons qu’une matrice statistique P obtenue par mélange de deux matrices statistiques Q et R
P=aQ+BR.
avec a + B = l
et
cyI0,
ne peut pas être une matrice statistique élémentaire (teiie que
B I 0
P 2 = P).sauf
si
Q=
R = P. Formons
P2 = a2Qz+ B2Rz + aB(Q R + RQ) = cy2Q2 + B2R2+ ap(Q2+ R2 - (Q - R ) 2 ) = aQZ+ BR2- aB(Q- R)2
+ @ = 1. Donc : P - P2= a(Q - Q 2 ) + B(R - R2)+ c$(Q
où nous avons fait usage de la condition
cy
- R)’
.
Rappelons maintenant que les matrices Q - Q2 et R - R2, ainsi que (8 - R)’. sont toujours semi-définies ($6 éq. (5)). II faut donc que celles-ci s’evanouissent pour que P soit une matrice élémentaire (P= P 2 ) . En particulier on a, (Q - R)2= O, d’où résulte :
Q=R,
Sources et évolution de la physique quantique
174
car le carré d’une matrice hermitienne ne s’annule que si elle est nulle
( C A i k Aki = k
k
Ait Ark =
IAik12 = O entratne Aik I O). De
0 = R e t de (1) résulte 0 = R = P.
k
Les opérateurs statistlquesforment donc un ensemble d’une structure caractéristique, appelé ensemble convexe. Sa bordure est formée par les opérateurs des cas purs. Ceux-ci ne peuvent pas etre atteints par superposition linéalre à coefficients positifs, c’est-à-dire par mélange de deux cas purs non identlques. Bien que les opérateurs statlstiques P des cas purs ne puissent pas être décompos&, on pourrait penser qu’il existe peut-être quelque autre moyen de réduire directement les statistiques correspondantes. En réalité ce problème ne diffère pas de celui que nous venons de discuter. Mais il sera peut-Stre utile de s’en rendre compte explicitement. Bien entendu, nous prenons toujours comme données de base les répartitions statistiques telles qu’elles sont prevues par le formalisme de la théorie et vérifiées par tant d’expériences, Nous ne discuterons donc pas de la validité de ces statistiques. Nous nous demandons plutôt si, une fois admises, elles ne pourraient pas être représentées par des mélanges de forme quelconque, mais de systemes bien définis au sens ordinaire de la physique classique. Prenons un exemple concret aussi simple que possible. celui des statistiques attachées à un “spin”.
Considérons un atome de moment angulaire
h -2l et fixons notre attention 2n
sur la composante de ce moment dans une direction quelconque. II n’y a dans chaque direction pour la composante du spin que deux valeurs possibles :
h -ï et
2 2n
h --i -
2 2n’
Fixons dans l’espace l’axe d‘un systeme de coordonnées sphériques. Soient u+ et u, les fonctions propres attachées aux deux valeurs possibles de la composante suivant cet axe. Supposons pour fixer les idées que
$=u+ soit la fonction d’onde de l’état considéré, qui est ainsi un “cas pur“. Considérons maintenant, pour le meme état $, la composante du spin dans une autre direction, oblique à l’axe polaire et caractérisée par exemple par les angles 8, cp de coordonnées polaires. Les seules valeurs possibles de la composante du spin dans cette
h 4%
direction sont encore $-
et
h --_ Pour évaluer les probabilit& 4n
de ces deux valeurs il faudra représenter attachées. Nous les appellerons u$ et.:u
u+ = + .$. avec
de trouver chacune
$ par les deux fonctions propres qui leur sont Le calcul donne
+c-ul
c+
=2
e-
= c - ~ Q ~sine12 ’
~u3s)e12~
Les carrés des valeurs absolues des coeftïcients de u; e t u: représentent les probabil&& de trouver l’une ou l’autre des deux composantes possibles dans la direction
0, Q :
p!+ = Ic+l2 = cos2 el2
pL = 1c-1~= sinzel2
175
La construction de la nouvelle mécanique
Or, dans le même état, les probabilités des deux composantes possibles suivant l'axe polaire sont respectivement
P+ = 1 p- = O II est évident qu'il n'est pas possible de décomposer cette statistique en un mélange de spins bien orientés : il faudrait dans ce mélange qu'une fraction a s 2 8/2 des atomes
soit en direction
8,
'p avec une composante
ï h
-2 -, 2*
une fraction sin' 8/2 en direction
opposée, ce qui serait possible en soi. Mais on devrait avoir en outre 100% des atomes avec la même composante
h dans la direction de l'axe polaire et enfin une fraction -ï2 2n
cos2 #/2 suivant toute autre direction #. Ce serait là un tour de passe-passe bien dlmcile à réaliser ! il est évidemment impossible de former un ensemble virtuel d'atomes orientés qui comporte en même temps toutes ces statistiques. Déjà leur forme mathématique exclut cette possibilité. Ce sera précisément cet exemple simple dont nous nous servirons au 312 pour étudier en détail comment, par sa propre intervention, l'observateur réussit à faire ce "tour de passe-passe". Cependant, pour que la discussion soit claire, il nous faut d'abord mettre en évidence une particularité caractéristique de la mécanique quantique. dont nous n'avons pas encore parlé, mais qui contient à vrai dire l'essence même de cette théorie : c'est elle qui est en fait responsable de l'apparition des probabilités.
9. Statistique d'un système composé de deux sous-systèmes
A première vue ie formalisme mathématique de la mécanique quantique semble entièrement analogue à celui d e s théories de la physique "classique" : une équation qui représente différentielle règle d'une facon univoque l'évolution de la fonction d'onde l'état du système. II semble donc que notre situation devant l'équation de Schredinger ne d l m r e pas de celle de Laplace devant les équations de Newton. L'état d'un système clos, peut-être de l'univers entier, est complètement déterminé s'il est connu à un instant donné : d'après l'équation de Schrijdinger. un cas pur represent6 par une fonction 4 reste toujours un cas pur. O n ne voit pas bien à quelle occasion peuvent s'introduire des probabilit& et nos définitions statistiques apparaissent dans la théorie comme un corps étranger.
4,
Nous verrons qu'il n'en est rien. II est vrai que l'état d'un système dos, une fois donné pur reste toujours pur. Mais étudions ce qui se passe quand on met au contad deux systèmes, donnés tous deux primitivement en des états purs, et qu'on les sépare ensuite. Considérons donc deux systèmes I et II d'abord separés ; soit z l'ensemble des c o o r d o n n h de I et y celui des coordonnées de II. Chacun des deux syst&mes est
176
Sources et évolution de la physique quantique
supposé dans un &at pur donné par sa fonction d'onde : $(E)
=x $ k . k ( z )
(WStemeI)
k
d Y >=
(systèmeII)
' P P .P(Y)
P
Nous avons développé les fonctions $ et cp en séries de certaines fonctions orthogonales U k ( Z ) et vp(y) ; les coemcients $k e t Q~ ne dépendent que du temps. Bien que les deux systemes soient SuP~oséSd'abord séparés, nous pouvons néanmoins les décrire par une fonction d'onde commune *(z, y ) dont l'évolution est régie par une fonction hamiltonienne commune. Le fait que les deux systèmes Sont isolés i'un de l'autre s'exprimera par la forme de i'hamiltonien qui se présentera comme une somme de deux termes ne dépendant chacun que de l'un des deux systèmes :
On vérifie aidment que la fonction d'onde commune *(z,y), qui joint les statistiques exprimées par $(z) et ?(y), se présente simplement comme le produit de deux fonctions d'onde isolées ; elle obéit à l'équation d'onde dont I'hamiltonien est HI Hrr. O n a donc avant le contact :
+
*(z, Y)
= $(z)dY) =
$kY'pUdz)vp(Y)
(1)
kP
Effectuons maintenant le contact entre les deux systèmes. IIfaut alors ajouter à i?i un terme d'interaction, Bi(z,p=, y,&), contenant les deux groupes de variables z,p, et y,p, MUS une forme qui n'est pas simplement additive. II est évident que la fonction Q commune aux deux systèmes ne gardera plus en général la forme d'un produit de deux fondions dépendant chacune d'un seul des groupes de variables ; mais elle pourra naturellement étre developpee à chaque instant en série de produits uk(z) vp(y) avec des coetficients qui dépendront d'ailleurs de l'instant choisi. En effet, si u&(z)et vp(y) forment des systèmes completsde fonctions orthogonales dans leurs domaines propres, z e t y, les produits ?I&(.) vp(y)forment aussi un système orthogonal complet dans l'espace des fondions du domaine de l'ensemble (2,y ) . Pendant ou après le contact la fonction d'onde s'écrira donc en tout cas sous l a forme générale :
où ies coefficients q k p n'auront pas en générai la forme particulière d'un produit $k y P . Comme nous avons toujours affaire à une fonction d'onde unique évoluant suivant une équation de Scfirodinger. il s'agit, pour le système total, d'un cas constamment pur. Sa matrice statistique est une matrice élémentaire :
La construction de la nouvelle mécanique
177
Comme il faut ici une paire d'indices k , p pour caractériser un état du système total, les éléments de la matrice statistique d l ce système dépendront donc de deux paires d'indices k , p e t 1,a. Fixons maintenant notre attention sur le système I . Quelle est sa matrice statistique 7 Soit F une fonction des seules variables du système I et Fki sa représentation dans les coordonnées U k ( Z ) . La moyenne de F dans l'état 'P sera donnée par
'Pzp ' P p F k i = TraCe ( P I
( i k , F'P) =
F)
4 0
C'est donc la matrice
Pi1 =
QIp
qp
(34
P
qui joue le rôle de matrice statistique pour le système systeme II ia matrice statistique
I.
On obtient de même pour le
P' e t PIr ne sont évidemment plus des matrices élémentaires. Nous avons affaire à des mélanges. Quelles sont leurs composantes 7 Avec quelles concentrations 1 Remarquons que les ' P k p sont normes dans l'espace des k p : = ]Qkp12 = 1 k,P (Pl
C'est donc la grandeur
t,b
avec les composantes QkP -
(P)
t6&=
qui est un vecteur norme pour le système I et qui en représente un cas pur. Nous pouvons donc donner à PI la forme suivante :
P
où
PP =
PIPI2
(44
I (P )
est la concentration avec laquelle le cas pur même k
4
est contenu dans le mélange
I. On a de
Sources et évolution de la physique quantique
178
où
est un vecteur unité, représentant un cas pur en
IT. e t
(k)
est la concentration avec laquelle Cp est contenu dans le mélange II. Tandis que le système total I + II que nous supposons isolé du reste du monde est et demeure dans un état pur, nous voyons pendant l'interaction les systèmes I e t II se transformer individuellement de cas purs en mélanges. c'est ia un résultat assez étrange : en mécanique classique nous ne nous étonnons pas de ce que l a connaissance maximum d'un système composé implique la connaissance maximum de tous ses éléments. Nous voyons que cette équivalence, que l'on pouirait croire banale, n'a pas lieu en mécanique quantique : la connaissance maximum d'un systeme composé n'implique en général pour ses composantes que celle d'un mélange, c'est-à-dire une connaisance qui n'est pas maximum. Les mélanges de PI e t prr ne peuvent naturellement pas épuiser tout ce qu'il II. II est évident que l'ensemble des est possible de savoir sur le système total I deux statistiques de mélanges ne peut pas à elle seule équivaloir à un cas pur. En effet la fonction totale @(z,y) contient encore d'autres relations, à savoir des corrélations statistiques entre les composantes des deux mélanges I e t II. Le fait que la description que nous obtenons pour chacun des deux systèmes individuels n'a pas le caractère d'un cas pur provient de ce que nous renonçons à une partie de la connaissance contenue dans @(z, y) lorsque nous calculons les statistiques relatives à chacun des deux systèmes séparés. Ce renoncement s'exprime par l a sommation sur l'indice p dans la définition de PI,où nous faisons l'abstraction de ce qu'on peut savoir de l'état p du système II et de sa connexion avec le système I . Cette perte de connaissance se manifeste par l'apparition de probabilitb, entendues maintenant au sens ordinaire du mot, à savoir comme expression du fait que notre connaissance concernant l'ensemble des deux systèmes n'est plus maximum.
+
10. Evolutions réversibles et irréversibles II faut donc faire entre deux sortes d'évolutions essentiellement différentes d'un système individuel une distinction caractéristique, qui n'a pas d'analogue en mécanique classique : 1.
- Les transformations
réversibles que l'on peut appeler aussl causales. Celles-ci
se réallscnt tant que le système est isolé ; elles peuvent être décrites par le changement dans le temps d'une fonction J> (OU d'un certain nombre de fonctions $ distinctes s'il s'agit d'un mélange). Si $(ta) reDrésente un cas Pur à l'instant t o son évolution peut €tre écrite sous la forme : $(t) = W
t o )
(1)
La construction de la nouvelle mécanique
179
avec l'opérateur
n! S'il s'agit d'un mélange, l a variation dans le temps de l'opérateur statistique
P
est donc donnée par l'équation
P(t) = T P(t0)T' où i+kl représente ta matrice x k . On vérifie que
Ce sont des transformations unitaires qui caractérisent les évolutions causales. Elles transforment un cas pur en un cas pur. Les transformations unitaires, ayant comme invariants les traces de tenseurs, ne changent pas la valeur de l'entropie : la Trace (P,hap) sera invariante.
II. - Les transformations irréversibles que l'on pourrait appeler aussi acausales. Celles-ci ne se réalisent qu'à l'occasion d'un contact du système en question (I) avec un autre système (II). L e système total embrassant ces deux systèmes (I II) subit encore dans ce cas une transformation réversible tant que l'ensemble I II est isolé. Mais si nous fixons notre attention sur le système 1, ce dernier subira une transformation irréversible : s'il était dans un état pur avant le contact, il sera en général transformé en un mélange. S'il était déjà un mélange, il sera transformé en un un autre mélange dont l'entropie ($7,eq(1)) sera plus grande. Une fois dégradé ainsi, il n'y a aucune chance que le système,retrouve jamais tout seul son degré de détermination primitif. Nous verrons que le processus de mesure entrafne en particulier une transformation irréversible de l'objet mesuré, telle que l'opérateur statistique initial d'un cas pur
+
($((il = C $nun(q)) n
+
:
p = ($ x $1 se transforme (par Interaction avec l'appareil de mesure) dans le mélange :
les un étant les fondions propres de la grandeur qu'on mesure. II est évident qu'on ne peut représenter par une transformation unitaire la transition de P à P' : cette dernière est accompagnée par une augmentation d'entropie de O à
-k n
I$nlZ
h I$,,l2,
ce qui
ne peut pas se faire par une transformation unitaire. La distinction entre ces deux modes d'évolution n'a pas d'analogue en mécanique classique, où ii est toujours possible de décrire l'état d'un objet de façon maximum, par ses 2f coordonnées et Impulsions q i , qz p f , quelles que soient les interactions que subisse le système avec d'autres systèmes.
...
180
Sources et évolution de la physique quantique
11. M e s u r e e t observation. L'acte d'objectivation Nous sommes dès maintenant en état de pressentir ce qui se passe au moment de l'acte de mesure. Nous esquisseronsd'abord un schéma de ce processus et nous vérifierons au paragraphe suivant qu'il décrit effectivement la marche typique d'une mesure. Supposons qu'on veuille mesurer la grandeur F(s,p,) d'un système ("l'objet"), donné dans un état Ip = C $ t u r ( z ) , où U k est une fonction propre correspondant à ia t
valeur f t de F. On le couple avec un appareil capable de mesurer F. Soit G(y,p,) la coordonnée fixant la position de "l'aiguille" de l'appareil go, g1 g P . ses valeurs propres, avec les fonctions propres vo(y), vl(y). u p ( y ) . L'état vo(y)
..
..
...
..
correspond au zéro de l'appareil. Avant le couplage, nous attribuerons au système total une fonction d'onde commune de la forme :
*(z, Y) = vû(Y)
- (1) _
$kuk(z)-
k
C'est un cas pur pour chacun des deux systèmes individuels. Après couplage, la fonction d'onde sera du type plus général :
Mais un couplage quelconque n'est pas encore une mesure. Pour qu'il le soit, il faut qu'il trouble aussi peu que possible l'état de l'objet et permette en outre de conclure des gp aux 6. II faut donc que les valeurs de l'échelle gp soient coordonnées de façon univoque aux valeurs ft de la grandeur considérée, que l'on puisse écrire directement sur l'échelle des gp les valeurs correspondantes de F. Cela revient à remplacer directement l'indice p(k)par k. Donc g k = gp(k) correspondra à fi. Nous verrons ($12)qu'après une mesure de la grandeur F, la fonction prend la forme particulière *(21
Y) =
(2' 1
d ' k U t ( z ) Wc(Y)
D'après ce que l'on a vu au paragraphe précédent, cette fonction représente maintenant un état ayant pour chaque système séparé, objet e t appareil. le caractère d'un mélange. D'aprk $9. éq.(4). c'est la grandeur pr: = 1$kI2 qui donne la probabilité de trouver l'objet dans l'état pur u t avec F = f t e t la même grandeur p t = donne aussi la probabilité de trouver l'indication G = g k de l'appareil. Nous avons en outre une corrélation entre les deux mélanges, à savoir la certitude que si G = g t , F = f k . Mais bien entendu la mkanique quantique ne nous permet pas de prévoir quelle valeur résultera effectivement de la mesure. L'interaction avec l'appareil ne conduit pas l'objet dans un nouvel état pur ; elle seule ne confire pas à l'objet une nouvelle fonction d'onde : au contraire, elle ne conduit actuellement, pour l'objet e t pour l'appareil séparés, qu'à une statistique de mélange, c'est-à-dire à une incertitude provenant d'une connaissance Incomplète ; mais, d'autre part, rien ne nous empeche de réduire celle-ci par une observation ultérieure. Et c'est là notre chance. Jusqu'à pr&nt nous n'avons fait que coupler un appareil avec un objet. Mais un couplage, même avec un appareil de mesure, n'est pas encore une mesure. Celle-ci est achevée seulement lorsqu'on a observé la position
I&12
La construction de la nouvelle mécanique
181
de l'aiguille. C'est précisément cet enrichissement de connaissance, acquis en vertu de l'observation, qui donne à l'observateur le droit de choisir entre les différentes composantes du mélange prévues par la'théorie. de rejeter celles qui ne sont pas observées et d'attribuer dorénavant à l'objet une nouvelle fonction d'onde, celle du cas pur qu'il a trouvé Remarquons le rôle essentiel que joue l a conscience de l'observateur dans cette transition du mélange au cas pur. Sans son intervention effective, jamais on n'obtiendrait une nouvelle fonction $. Afin de bien comprendre ce point, considérons l'ensemble de trois systèmes, (objet z) (appareil y) (observateur z). comme un système composé, unique. Nous le décrirons par une fonction d'onde globale sous une forme analogue à (2) :
.
+
+
ozi les wk représentent les différents états de l'observateur. "Objectivement", c'est-à-dire pour nous qui considérons comme "objet" le système composé z, y, z, la situation semble peu changée par rapport à celle que nous avons rencontrée tout à l'heure, quand nous ne considérions que l'appareil et l'objet : nous avons maintenant trois mélanges, un pour chaque système, avec entre eux les corrélations statistiques iiées à un cas pur pour ie système total. En effet, ia fonction $(z,y, z) représente une description maximum de l'"objet" composé, consistant en l'objet proprement dit z, l'appareil y et l'observateur I ; néanmoins nous ne savons pas en quel état se trouve z. L'observateur a un tout autre point de vue : pour lui c'est seulement l'objet z et l'appareil y qui appartiennent au monde extérieur, à ce qu'il appelle "objectif'. Par contre il a avec lui-même des relations d'un caractère tout particulier : il dispose d'une faculté caratéristique et bien familière, que nous pouvons appeler la "faculté d'introspection" : il peut se rendre compte de manière immédiate de son propre état. C'est en vertu de cette "connaissance immanente" qu'il attribue le droit de se créer sa propre objectivité, c'est-à-dire de couper la chaïne de coordinations statistiques exprimées par ~ $ ~ u ~ ( z ) v ~ ( y ) w ken ( z constatant ) : "Je suis dans i'état zut" ou plus simplement : k
"Je vois G = gk" ou même directement : "F = fk". Ce n'est donc pas une interaction mystérieuse entre l'appareil e t l'objet qui produit pendant la mesure un nouveau $ du système. C'est seulement la conscience d'un "Moi" qui peut se séparer de la fonction $(z, y, z) ancienne et constituer en vertu de son observation une nouvelle objectivité en attribuant dorénavant à l'objet une nouvelle fonction
$(z) = Uk(Z). Ce n'est pas non plus une ignorance éventuelle, quand à l'état de l'observateur, qui fait i'incertitude quantique. A u contraire, en présumant un cas pur pour le système total, nous avons supposé implicitement une connaissance parfaite de l'état initial aussi bien de l'observateur wo(z) que de i'appareil v&), c'est-à-dire le maximum possible de connaissance. De plus nous avons supposé que l'observateur peut se rendre parfaitement compte de son propre état. Bien entendu, ilse pourrait qu'il y eOt aussi des restrictions relatives à la connaissance immanente de l'observateur. Mais celles-ci, si elles existaient, n'auraient en tout cas rien à faire avec l'incertitude quantique, ce seraient des restrictions additionnelles d'une
Sources et évolution de la physique quantique
182
nature tout à fait différente. D'autre part il n'est généralement pas nécessaire. pour la discussion de l'acte de mesure, qu'on possede en fait une connaissance absolue de l ' é t a t de l'observateur ; en effet on a en général peu de chances de commettre une erreur grave si, par exemple, on ne connaît pas son âge.
12. Un exemple de mesure II ne nous reste maintenant qu'à vérifier le schéma de mesure que nous venons de discuter. Prenons pour exemple typique la détermination de la valeur d'une composante du moment magnétique d'un atome par la méthode.de Stern e t Gerlach. Les formules que nous obtiendrons se généraliseront sans difficultés à une mesure quelconque. Cette mesure se fait, comme on sait, en observant le mouvement d'un atome traversant un champ magnétique non uniforme. La direction suivant laquelle on veut déterminer la composante du moment magnétique de l'atome est celle du champ. Ce sont donc le?coordonnées (y) du centre de gravité de l'atome qui jouent le rôle de la position G(y,p,) de l'aiguille. Les coordonnées internes de l'atome, par rapport au centre de gravité, constituent les coordonnées (z) de l'objet. Nous nous occuperons en particulier de la composante du moment magnétique M = M(z,p,) dans la direction du champ. Ecrivons l'équation d'onde de ce problème sous la forme suivante :
où
HO est
l'opérateur hamiltonien de l'atome sans champ après séparation des va-
riables du centre de gravité,
h2
--Ay 8rzm
est l'opérateur de I"' appareil " correspondant à
l'énergie cinetique du centre de gravité, (M, F) est l a contribution provenant du champ magnétique F e t M est l'opérateur moment magnétique de l'atome dans la direction du champ. Tant que le champ F est constant, c'est-à-dire qu'il ne dépend pas des coordonnées y, les variables 2 e t y se separent dans l'équation (1). Pour les différents états de I"' objet ", nous avons affaire au problème aux valeurs propres :
Bornons-nous à l'état le plus bas de l'atome, état que nous supposons dégénéré e t dont les composantes se sépareront dans le champ, proportionnellement à F :
où p
= moment magnétique de
1,j - 2 , j
h
l'atome et
k = nombre quantique magnétique = j , j -
- 3 . . .-j, où j -27r représente le moment d'impulsion total de l'atome.
Dans le
cas où le champ n'est pas constant, F = F(y), l'équation ( 2 ) contient les coordonnées y comme paramètres : par conséquent les valeurs propres de (2)
183
La construction de la nouvelle mécanique
dépendront aussi de CES paramètres y, ainsi que les fonctions propres .a(.), qui s'écriront plus correctement uk(q y). Prauquement la perturbation des uk par la non-uniformité du champ est si faible que nous avons le droit d'y supprimer le paramètre y. %Développonsmaintenant $(z, y) en série des fonctions u k ( z )
'
$(z, Y) =
Yk(t>Y)Uk(Z)
k
et introduisons ce développement dans l'équation (y) de Schrodinger. A p r b multiplication par uk et intégration par rapport 21 2 , nous obtenons pour les coefficients v k ( t , y ) les équations suivantes :
qui sont encore du type de Schrodinger mais se rapportent au centre de gravité seul. La valeur propre (3a) de (2), Ek(y), y joue le rôle du potentiel. Considérons maintenant un rayon atomique e t développons E&) au voisinage de ce rayon :
k E6 = Eo + -![Fo 3
+ (y,gradF) + ...]
En première approximation le potentiel '' &(y) varie linéairement : ii se comporte donc comme celui de la gravité sur la terre. L'équation (4) n'est donc pas autre chose que celle de la chute libre. Mais l'accélération y est proportionnelle au nombre quantique k, elle dépend donc de la valeur de la composante du moment magnétique dans la direction du champ, elle peut être positive ou négative. II est donc facile de prévoir en gros sans calcul détaillé la forme des diverses trajectoires qui proviennent d'un pinceau initial monocinétique assez délié voo e t qui parcourent ensuite le champ magnétique 'I
v-l
Figure 1 n uniforme. Les rayons d'origine commune voo se sépareront conformément ux différentes valeurs de k en composantes séparés. Les régions hachurées de la figure 1 indiquent les domaines où les fonctions v k sont notablement différentes de zéro. Cela est certainement possible. Les uk(y,t) figurent dans ce développement, non pas comme des fonctions propres données, mais comme les coefficients encore inconnus des fonctions U I ( Z ) .
Sources et évolution de la physique quantique
184
Jusqu'à présent, nous n'avons discuté que les solutions non encore normées des équations auxiliaires (4). Les solutions completes de l'équation de Schrodinger (1) auront
donc la forme :
*(zv Y ) =
(5)
ckvk(Y)uk(z) k
Soit
l'état de l'atome avant la mesure dans la région à gauche de la figure, où nous pouvons encore *parer le mouvement du centre de gravité et où toutes les fonctions v k ( y ) sont identiques (= v o o ( y ) ) . La fonction d'onde totale de l'objet 4- l'appareil s'écrira avant l'entrée dans le champ
De /'autre coté du champ, elle s'écrira d'après (5) et par continuité :
Une mesure de la coordonnée y du centre de gravité d'un atome qui a traverse le champ équivaut à une détermination de t parce que les V k ( y ) ne sont différents de zéro qu'en certaines régions particulières et qu'une détermination de k équivaut à la connaissance de la composante du moment parallèle à F. C'est l à précisément le type de lien statistique que nous avons présumé au $11. Supposons par exemple que nous ayons affaire à un atome de moment total 1, pour lequel k se borne aux valeurs 1, O, -1. L'influence de la mesure s'exprime par la transition des coefficients '@kp de l a fonction d'onde commune de
en
P'tr =
$-1
*-l*
$-1
*O*
$-1
$l*l
$0
$-l*
$0
*O*
$0
$1.
$1
$-1'
$1
$O*
$1
$l*
= O 1 O O 0 10 O 0 O/
L'application du champ magnétique les transforme en mélanges :
La construction de la nouvelle mécanique
185
dont les composantes sont liées de façon univoque par des corrélations réciproques. Pour le système total, ia transition 9 -+ Q' est ia transformation unitaire :
T L ~ , I ~ *où~ uT t p , i o = 6ki 6p,i+u
q;,, = lo
où
p = f 2 équivaut à p = rfl.
13. Individualité e t cas pur Un dispositif de mesure, t e l que celui que nous venons de décrire au paragraphe précédent, peut etre utilisé pour filtrer " les objets possédant une valeur prescrite d'une certaine variable : il suffit de percer dans l'écran, sur lequel tombent les atomes, une fente convenable pour que l'appareil de Stern-Gerlach se transforme en une source d'atomes uniformément orientés. C'est donc un bon montage pour produire des cas purs. Cela n'est-il pas en contradlction avec ce que nous avons appris tout à l'heure (fjll),à savoir que l'établissement d'un cas pur s'accomplit seulement par un " acte d'objectivation " réalisé par l'intervention effective d'un observateur ? Mais ilfaut préciser les idées : le filtre n'amène nullement un objet individuel en un état pur nouveau ; il ne peut l'amener qu'en état de mélange ; c'est ce qui a toujours lieu lorsqu'on couple un système avec un autre. Par contre, nous pouvons évidemment dire que ceux des atomes, qui ont passé la fente ont la propriété désirée et nous pouvons leur attribuer la fonction d'onde du cas pur en question. Mais cela ne se fait pour ainsi dire qu'aux dépens de l'individualité de l'objet, lorsqu'on ne sait pas d'avance quels sont les atomes qui ont la propriété en question. Nous pouvons bien attribuer aux objets après la fente la fonction $ du cas pur mais nous ne pouvons pas dire quel objet, c'est-à-dire quelle variable est l'argument de cette fonction $. Sans contrôle supplémentaire par un observateur, il n'est pas possible de garantir qu'un atome donné a traverse le filtre, ou qu'il y a été retenu. L e filtre seul produit donc bien des cas purs, mais sous une forme absolument anonyme. Bien entendu nous pouvons leur attribuer à nouveau des noms propres, par exemple en comptant les atomes qui traversent effectivement la fente. Mais cela n'est pas autre chose qu'une véritable mesure et nous serions ainsi ramenés à ce que nous avons déjà discuté. D'ailleurs, dans beaucoup de recherches expérimentales on s'intéresse précisément à des objets anonymes. La plupart des mesures de physique atomique ne s'appliquent pas en vérité à des systèmes individuels ; elles s'occupent plutdt de rechercher les propriétés générales d'espèces entières, d'atomes, de molécules ou de particules élémentaires. Ainsi par exemple le dispositif de Stern et Gerlach, que nous avons discuté tout à l'heure, est utilisé en général non pour mesurer une composante du spin d'un atome individuel, mais plutôt pour déterminer le spin de /'atome d'argent. La mécanique quantique, véritable " théorie des espèces " , s'adapte parfaitement à cette tâche posée par l'expérience. Mais étant donné que chaque mesure contient un acte macroscopique, individuel e t singulier, il nous semble indispensable de voir jusqu'à quel point on peut encore retrouver en mécanique quantique le concept habituel d'objet individuel e t de lui fixer ses limites. I'
186
Sources et évolution de la physique quantique
14. C o m m u n a u t é scientifique e t objectivité A premiere vue, il semble qu'en mécanlque quantique le concept d'objectivité scientifique solt fortement ébranlé. Depuis la période classique on s'est accoutumé à l'idée que l'objet de la physique est quelque chose de réel, existant en dehors de l'observateur, indépendant de lul, Indépendant en particulier du fait qu'il soit soumis ou non à une mesure. II n'en est plus de même en mécanique quantique. Loin qu'il soit possible
d'attribuer à un s y s t h e , à chaque Instant. Ses propriétés mesurables, on ne peut pas prétendre que cela ait un sens défini de lui attribuer une fonction d'onde, à moins de se référer explicitement à une mesure effective. En outre, il semble que le résultat d'une observation soit lié intimement à la consclence de celui qui l'a faite e t que ia mécanique quantique nous entraîne ainsi vers le solipsisme total. Et pourtant, nous savons qu'en réalité les relations des physiciens entre eux n'ont pratiquement pas changé depuis la découverte de la mécanique quantlque ; ils ne se sont pas enfermés chacun dans un isolement solipsiste, ils se servent des memes moyensd'échange scientifique qu'autrefois e t sont capables d'étudier en commun le même objet. II existe donc en fait quelque chose comme une communauté de conscience scientifique, un accord sur ce qui constitue l'objet de l a recherche, et c'est ce qu'il faut encore justifier. Tout d'abord, il est facile de se rendre compte que l'acte d'observation, c'est-àdire le couplage entre l'appareil de mesure et l'observateur (cf. notre exemple du $il), est en vérité une action macroscopique et non pas essentiellement quantique ; on a par conséquent toujours le droit de négliger la réaction sur l'appareil du ' I regard " de l'observateur ; et, remontant le cours du temps, on obtiendra des conclusions certaines sur l'appareil (ou de la plaque photographique) et, par suite, de l'objet avant l'observation (mais, bien entendu, apr& leur couplage). En outre, rien n'empêche un autre observateur de regarder le même appareil e t l'on peut prévoir, qu'à moins d'erreur, ses observations seront les mêmes. La possibilité de faire abstraction de l'individualité de l'observateur et de créer une consclence scientifique collective ne saurait donc être mise sérieusement en question. Mais il se pourrait que la communauté scientifique ainsi créée soit celle d'une sorte de société spirite. qui s'occupe d'étudier des phénomènes imaginaires, que les objets de ia physique soient des fantômes produits par l'observateur lui-même. En physique classique, on peut se représenter à chaque Instant un système de manière univoque e t continue par l'ensemble de toutes ses propriétés mesurables, même pendant qu'il n'est pas soumis à une observation, et c'est précisément la possibilité de cette continuité de connexion entre propriétés et objet qui fut considérée en général comme une preuve que la physlque s'occupe de quelque chose de " réel ", c'est-à-dire ayant en principe une En mécanique quantique un objet est existence " Indépendante de tout observateur porteur, non pas d'un ensemble défini de propriétés mesurables, mais seulement d'un ensemble de statistiques " potentielles " ($3)se rapportant à ces propriétés mesurables, statistiques qui entrent seulement en vigueur à l'occasion d'une mesure effective bien définie. Si l'on fait abstraction de toute mesure, il est dénué de sens de se représenter ces propriétés mesurables comme réalisées ; la forme mathématique même de ces statistiques ne le permet pas (cf. 88). Mais cela ne nous empêche pas de prédire ou d'interpréter les résultats de nos expériences. La théorie en fixe les conditions : elle nous apprend d'abord comment il faut
".
La construction de la nouvelle mécanique
187
filtrer un objet, pour obtenir un cas pur, c’est-à-dire les conditions reproductibles, puis comment il faut faire les mesures,,soit pour vérifier des prédictions théorlques, soit pour découvrir de nouvelles lois empiriques. Elle s’adapte de façon vraiment merveilleuse à la situation posée par l’expérience : elle lu1 répond dans tous les détails désirables et se tait sur les prétendues questions que l’expérience ne peut trancher. Dans la physique actuelle, le concept d’”objectivité ” est en fait un peu plus abstrait que celui qui dérive de la notion classique d’objet matériel. Par sa cohérence interne et par la portée de ses applications, la théorie nouvelle montre qu’il n’est pas vrai que “ l’objectivité ” d’un objet doive être garantie par la possibilité formelle de lui attribuer ses propriétés mesurables de façon continue aux époques où II n’est pas soumis a une observation. II suffit évidemment que ses propriétés soient présentes au moment de leur mesure et qu’elles soient prévues par la théorie en accord avec l’expérience. Dans ce cas limite des phénomènes macroscopiques, la théorie quantique rejoint la théorie classique : elle justifie ainsi l’application du concept “ n a i f ” d’objectivité et fixe en même temps ses limites. Ce qui précède se rattache à un problème philosophique important, que nous ne pouvons pas aborder ici : déterminer les conditions nécessaires et suffisantes pour qu’un objet de pensée soit doué d”‘ objectivité ‘ I , c’est-à-dire puisse devenir objet de science. Ce problème fut peut-être posé pour la première fois avec une certaine généralité par des mathématiciens tels que Malebranche, Leibniz et surtout par B. Bolzano. Plus récemment Husserl” a étudié systématiquement ces questions et créé ainsi une nouvelle méthode de recherche qu’on appelle la “ Phénoménologie ”. La physique en tant que science empirique ne peut pas aborder de tels problèmes en toute généralité ; elle se contente de se servir de concepts philosophiques suffisant a ses besoins ; mais parfois elle peut se rendre compte que certains des concepts qui lui ont servi ne lui sont nullement nécessaires, qu’ils contiennent des éléments inutiles et même incorrects, véritables obstacles au progrès. Si l‘on peut constater qu’il soit possible de fonder des vérités philosophiques par les méthodes des physiciens, il n’est sOrement pas hors de leur compétence de mettre en évidence que certaines affirmations qui prétendent a une validité philosophique n’en ont pas en vérité. Et parfois ces découvertes philosophiques ” négatives ” des physiciens ne sont pas moins importantes, ni moins révolutionnaires pour la philosophie que les découvertes des philosophes de métier.
lo Logische Untersuchung. Halle, 1901 ; ldeen zu einer reinen Phanomenoiogie. Halle, 1913. Des idees assez voisines se trouvent aussi dans le livre Substanzbegrifï und Funktionsbegrifde E. Cassirer (Berlin, 1910) ; voir aussi son étude : Determinisrnus u. Indeterminismus in der modernen Physik. Gcteborg, 1936.
188
Sources et évolution de la physique quantique
De gauche à droite : Bohr, Heisenberg et Dirac, auz enmrum de 1960. (source : Niels Bohr Archive, tow droits réservés).
Chapitre 4
De la mécanique quantique relativiste à la théorie quantique des champs 4.1 La mécanique quantique relativiste :
l’anti-matière L’équation de Schrodinger d’une particule libre, décrite par une fonction d’onde
u(z,t) s’écrit :
-a 2m -fi2
2
@(?’ t) =-ifi
ae(2,t) at
et s’obtient de l’équation exprimant l’énergie cinétique en mécanique newtonienne : -2
P
-2m= E
(4-2) -t
-;fia
en appliquant la règle de substitution de l’impulsion P par l’opérateur et de l’énergie E par l’opérateur i h g ! le résultat étant appliqué à la fonction d’onde *(-2,t).
L’équation relativiste correspondante à l’équation non-relativiste (4.1) peut s’obtenir si l’on tient compte de la relation d‘Einstein liant l’énergie E et l’impulsion -+
P d’une particule libre en théorie de la relativité, à savoir :
E’ = c2(T2 + m2c2)
(4.3)
-+
et si on applique la même règle de substitution de P et de E par lez opérateurs mentionnés. Il en résulte : (O $) Q ( 2 , t ) = O (4.4) où p = mc/iï. Cette équation fut découverte par de Broglie lui-même, par S~hrüdinger‘~ ”
+
“ Voici ce u’+riyit Dirac à-pro os de de Io dépuverte de Schrodin er : y Je p o u r n i a j’ai d e n d u c de Schrodinger : comment fonqu’il nit l’idée v o w raconter?’hutoire de son équation, il I’app immédiatement au comportement de l*é/ectron dana l’atome d’hydrogrne, e t comment obtint des résultats qui n’étaient pas en accord mec I’czpénqnce. Le déaaccord prowmait du fad qu’ci l’époque, on n! saooat que 1é’ el ct.n poaaédad un spin. Cela cauda natunllcment u n e grande déception à Sclroding? e t lui fit abandonner d u tmvauz p.endant quciquw mois. nota enduite e, s’il apphguait io théorie d’une t a r m a t i w e , sana prendre en com t e les r a g e m e n t a &gw ar la théorie de la àvit sw caicuis, O l’a rozimatio? ufüisée, tombaim! en a c davec l’observation. c qu’il y a une m o a à cetie hutoin, à savoar ’ai u t plw important de trouver PaCMbcauté dam les équations que d’y tFuwer un acco% avec l’clpérience. Si Schr6din er await plus eu confiance en son tmvad, ai l’aurait probablement publié quùquw m o w plw t6t, et aurait aimi produit une équation plw a a c t c ”. P.A.M. Dirac in J. Mehra (editor), The phyaiciat ’a conception of nature, Reidel, Dordrecht, 1973. ” Donner la priorité à la beauté d’une théorie physique n’entrait pru dans les vues de
i y
52 2
n
190
Sources et évolution de la physique quantique
et, indépendamment, par Oskar Klein et Walter Gordon en 1926. O n la connaît depuis lors comme l’équation de Klein-Gordon. il s’avère difficile d’introduire une probabilité de localisation pour une particule Iorsqu’on la décrit par l’équation (4.4). En effet, l’équation (4.1)’ ou, en général, l’équation d’une particule en présence d‘un potentiel de forces d’énergie V(z) :
détermine, unie à l’équation pour la fonction d’onde complexe conjuguée une densité de probabilité de localisation :
@O(?,
t),
p ( Z i , l ) = Q*(2’,t)P(z’,t)
et une densité de courant de probabilité :
h
-+-t
3 ( 2 ’ t )= - ( P * 3 9
2mr
- *ta**)
qui satisfont à l’équation de continuité (consenation des probabilités) :
Or l’équation de Klein-Gordon introduit une densité de probabilité : p(.‘,t)
i a* = -(W- 2m at
a**
“ôt)
qui n’est pas définie positive : et une probabilité ne peut prendre des valeurs négatives. L’équation de Klein-Gordon étant une équation du second ordre par rapport à un instant initiai donné pour pouvoir au temps, il faudrait connaitre 9 et déterminer la solution Q ( 3 , t )à un instant ultérieur. Fidèle à l’interprétation de la fonction 9 comme décrhant un état, Dirac admit alors comme postulat que l’équation quantique relativiste de l’électron devait être du premier ordre par rapport au temps, de sorte que la fonction d’onde à un instant arbitraire puisse être déterminée par la seule connaissance de cette fonction à l’instant initiai. La connaissance de l’état de l’électron à un instant donné serait Newton, qui remarquait (voir citation pages 7 et 8) qu’en ” philosophie ezpérimentale, les prvposition, sont déduites d u phénomènes et nnduu g é n é d w par induction W .A cette conception de la connaissance physi ue, suivant I uelle les luis physiques commencent et finissent avec l’expérience, s’opposabnstein qui a r m a i t * le caractlnnem>né de cetle conception u t clairement a p y u avec la théorie de la nlaiivité génémie Et il écrivit : y L’apérimce peut sugghrr w concepts mathématiquw ad+& mou ceuz-ci nepeuvmt en 2tn dlduits. L’apGence -te, natunll~ment le seul critk d’utilité ph nque des construction, mathématiques. Maw le pnncape mefatcur r&de dans lu mnthkatiqucs. Dans un certain aens je mainiiem donc comme mai que la pende pure eut saisir la réalité, comme le rivaient les Ancicns A. Einstein, Idcw and opinioru, p. 574, Souvenir Press, Londres, 1957.
.
.
De la mécanique quantique relativiste à la théorie quantique des champs
191
alors suffisante pour déterminer son état à un instant ultérieur, sans qu’il soit besoin de connaître la vitesse de changement de l’état à l’instant initiai. L’invariance relativiste exigeant de l’équati8n qu’elle soit aussi du premier ordre par rapport aux coordonnées spatiales, Dirac supposa dors pour l’équation de la fonction d’onde de l’électron l’expression50 :
+ où 7? et /3 sont quatre opérateurs, indépendants de z‘ et de P qui doivent décrire de nouveaux degrés de liberté de l’électron. De plus, le principe de correspondance exigeant que l’équation (4.3) reste valable, l’équation (4.6) doit impliquer l’équation (4.4) pour cette même fonction Q. Cela oblige les opérateurs Q I et B à satisfaire les règles d’anticommutation suivantes : (4.6a) ce qui exige que la Ce sont des matrices à quatre lignes et quatre c01onnes~~~ fonction Ql dans l’équation (4.6)’ ait quatre composantes. Cette équation prend donc la forme :
où la somme de 1 à 4 sur b est sous-entendue. Cette équation doit être invariante lors d’une transformation de Poincaré. Cette équation connut un grand succès. Le spin de l’électron, t h , en fut déduit, et sa description se ramène à celle donnée par Pauli dans la limite des faibles vitesses. Cette d e u r du spin signifie que sa composante sur un axe de coordonnées physiquement déterminé, par exemple par un champ magnétique, ne peut prendre que deux valeurs possibles, $ti ou -+fi. Ainsi un électron au repos ne peut se présenter qu’en deux états possibles, ceux qui correspondent à ces deux valeurs du moment angulaire propre. Ces états sont alors décrits par deux composantes de la fonction d’onde de Dirac (elles furent déjà introduites par Pauli en 1926). Si l’on prend les quatre équations (4.6b)’ on trouve que ce système admet quatre solutions, dont deux correspondent aux deux valeurs possibles du spin et possèdent une énergie positive :
7
E = + c2P +m2c4 les deux autres possédant une énergie négative :
P.A.M. Dirac, Pmc. Roy. Soc. A 117,341 (1928). P.A.M. Dirac, Proc. Roy. Soc. A 117, 610 (1928) [Article XV suivant] ; A 118, 341 (1928).
Sources et évolution de la physique quantique
192
Les solutions à énergie négative ne peuvent être ni ignorées, ni mathématiquement écartées. Elles constituent en effet, avec les solutions à énergie positive, un ensemble complet, une base, dans l’espace des solutions de l’équation (4.6). Et pourtant, un électron avec une énergie négative aurait une masse au repos négative : il se déplucerait, #ow Z’uction d’une force - y compris celle de la gravité - dans le sens contraire à celui des électrons ordinaires d’énergie positive. Dirac interpréta alors ces solutions en postulant que les électrons libres à énergie négative occupent tous les états correspondants, chaque état étant occupé par un électron en accord avec le principe de Pauli. Le vide serait alors défini comme la situation où aucun des états à énergie positive n’est occupé, alors que tous les états à énergie négative le sont, ceux-ci étant par definition inobservables. On voit aisément que l’absence d’un électron dans un état d’énergie négative - par transition à un état d’énergie positive où il devient observable en tant qu’électron - aura le même effet que l’apparition d’une particule observable d’énergie positive, mais de charge opposée à celle de l’électron ordinaire (voir la figure 4.1) (dans le vide, les grandeurs observables ont une valeur nulie).
0
O O
Energie
_ - -- - - - --
g. élec tron
observé
-------,--Clianip externe I
I
---C----moc2 O O
pliolon neutre
+ nlonie
O O
Q I vide) =O Figure 4.1
O
û(initiai)= û(finaI1 exige charge du ”trou”= charge de l’électroii
-
C’est ainsi que Dirac prédit l’existence de l’électron positif ou posiion ou antiéiectron (et non celle du proton comme il le pensa initialement), particule dont la découverte fut annoncée en 1932 par Carl Anderson et Seth Neddermayer, observant les rayons cosmiques, et fut confirmee par Patrick Blackett et Giuseppe Occhidini. Une telle transition, provoquée par exemple par un photon d’énergie supérieure à 2mccZdans le champ d’un atome, apparaît comme la création d’une paire éiectronpositon. Ainsi, le vide contient des paires virtuelles : c’est un système dynamique complexe, puisque la notion d’antimatière s’étend à toutes les particules de spin f, donc décrites par l’équation de Dirac. La présence d’un noyau d’atome ou d’un champ externe lors de la créatjon de paire et e- par un photon est nécessaire pour que la quantité de mouvement et l’énergie soient conservées dans cette transition. La transition inverse est l’annihilation d’un électron avec un anti-électron conduisant à
De la mécanique quantique relativiste à la théorie quantique des champs
193
l’émission d’un photon en présence d’un noyau, ou,en l’absence de champ externe, à l’émission d’au moins deux photons. Cette interprétation de l’état du vide où Dirac cachait les particules à énergie ‘négative donna lieu à l’époque à une controverse : Pauli remarquait, dans un séminaire donné dans les années 30 à l’Institut d’Etudes Avancées de Princeton, que le succès était plutôt du côté de Dirac que de celui de la logique. Mais Dirac vit confirmé le succès de sa théorie lorsque, grâce à elle, on obtint les énergies de l’atome d’hydrogène (dans sa structure hyperfine) précédemment calculées par Sommerfeld ; et lorsque la valeur mesurée du moment magnétique associé au spin de l’électron se trouva en accord presque parfait avec son équation relativiste, alors que la théorie non-relativiste développée par Pauli postuiait ce moment lors de son interaction avec un champ magnétique. Du point de vue mathématique, la fonction d’onde de Dirac à quatre composantes se transforme, lors d‘une transformation de Poincaré du système de coordonnées, de façon spécifique, différemment de celle d’un quadrivecteur. Elle constitue ce que l’on appelle un spineur relativiste ou spineur de Dirac. La notion de spineur, développée par plusieurs chercheurs parmi lesquels Elie Cartan, Hermann Weyl, B.L. van der Waerden, apparaît naturellement dans l’étude des représentations h i e s du groupe propre orthochrone de Poincaré (Eugene P. Wigner”). Le spineur de Dirac, à quatre composantes, peut être écrit, dans une représentation des matrices de Dirac appelée représentation de Weyl, comme une paire de spineurs à deux composantes, les spineun de Weyl. Dans une autre représentation des matrices de Dirac, où la matrice ,9 est diagonale, deux composantes du spineur de Dirac deviennent petites pour des vitesses de la particule petites par rapport à la vitesse de la lumière, les deux autres composantes restant finies obéissant à l’équation que Pauli avait proposée pour la description non-relativiste du spin de l’électron. Cette dernière équation est invariante par rapport au groupe des rotations, et la transformation du spineur lorsqu’on fait subir aux coordonnées d’espace une rotation appartenant à ce groupe caractérise le spineur de Pauli à deux composantes. Remarquons que l’équation (4.6) peut se mettre sous la forme :
(ira& - /I)*(.)
=O
(4.7)
qui tait intervenir les matrices yo = @, =j‘= PQ et où :
et sont telles que :
1
$7’7’
+ ru%)
= VPVi
p, v = O,
1,2,3
et
52 cf. M.A. Naimark, Les reprCsentations linéaires du groupe de Lorentz, Dunod, Paris, 1962 ;E.P. Wigner, Ann. Math.,40,149 (1939) est la référence fondamentde.
Article XV
L'équation d'onde relativiste de l'électron La
théorie quantique de l'électron
PAUL ADRIENMAURICE DIRAC Proceeding o f the Royal Society A
117,610-624 (1928)
(Transmis par R.H. Fowler, F.R.S., reçu le 2 janvier 1928.) [traduit par B. Escoubès]
Lorsqu'on applique la nouvelle mécanique quantique au problème de la structure de l'atome en considérant l'électron comme une charge ponctuelle, les résultats obtenus ne sont pas conformes à l'expérience. Les désaccords proviennent du phénomène de '' dédoublement " (dupiexity), le nombre observé d'états stationnaires pour un électron dans un atome étant deux fois celul donné par la théorie. Pour faire face à cette difficulté, Goudsmlt e t Uhlenbeck ont introduit l'idée d'un électron possédant un moment angulaire de spin d'un demi-quantum e t un moment magnétique d'un magnéton de Bohr. Ce modèle pour l'électron a été intégré à la nouvelle mécanique par Pauli' et Darwin', travaillant sur une théorie équivalente, a montré qu'elle donne des résultats en accord avec l'expérience pour des spectres hydrogénoïdes à la précision du premier ordre. Reste la question de savoir pourquoi la Nature a-t-elle choisi ce modèle particuller de l'électron au lieu de se satisfaire de celui d'une charge ponctuelle ? On souhaiterait découvrir quelque imperfection dans les méthodes antérieures appliquant la mécanique quantique à l'électron considéré comme une charge ponctuelle de telle sorte que, lorsque cette imperfection est éliminée, l'ensemble du phénomène du dédoublement en découle sans hypothèses arbitraires. L'article présent montre que c'est en effet le cas, l'imperfection des théories antérieures résidant dans leur désaccord avec la relativité, ou, alternativement, avec la théorie générale des transformations en mécanique quantique. II apparalt que I'hamiltonien le plus simple pour un électron chargé ponctuel satisfaisant les exigences à l a fois de la relativité et de la théorie générale des transformations mène à une explication de l'ensemble des phénomènes de dédoublement sans hypothèse supplémentaire. De même, il y a une grande part de vérité dans le modele de l'électron tournant, au moins en première approximation. L e défaut le plus important du modèle semble être que la grandeur du moment angulaire orbital d'un électron en
'
Pauli, Zeitschr. f. Phys. 43, 601 (1927). Darwin, Proc. Roy. Soc.
A 116, 227 (1927).
De la mécanique quantique relativiste à la théorie quantique des champs
195
mouvement sur une orbite dans un champ de forces central n’est pas constante, comme le prévoit le modèle.
1. Traitements relativistes antérieurs Suivant la théorie classique, I’hamiltonien relativiste pour un électron ponctuel en mouvement dans un champ électro-magnétique arbitraire de potentiei scalaire A. et de potentiel vecteur A est :
F=
(c
-+-Ao
)2+(p+fA)2+m2~2,
ob p est le vecteur de quantité de mouvement. Gordon3 a suggéré que l’opérateur de l’équation d’onde de la théorie quantique devait être obtenu à partir de cet F par ia meme procédure que celle utilisée en théorie non-relativiste, c’est-à-dire, en y efFectuant la substitution :
a
W = ih-
at’
pr=-ih-,
a axr
r=1,2,3,
Cela donne l’équation d’onde :
F
=
[
( i h az
+ EAo)
2
+c
û
(-iha
r
Ir
e + -Ar)’ C
+m2c2] $ = O ,
(1)
$ est une fonction de z1,x2,13, t . Ceci donne lieu à deux difficultés. La première concerne l’interprétation physique de 4. Gordon, et indépendamment Klein‘, partant de considérations sur des théorèmes de conservation, émirent l’hypothèse sont deux solutions, alors que si $m,
où la fonction d’onde
doivent s’interpréter comme la charge et le courant associés à la transition m + n. Ceci s’avère satisfaisant tant que l’on s’intéresse à l’émission ainsi qu’à l’absorption, mais n’est pas aussi général que l’interprétation de la mécanlque quantique non reiativlste, qui a été suffisamment développée’ pour que l’on puisse répondre à la question : quelle est la
’
Gordon, Zeitscbr. f. Pbys. 40, 117 (1926).
‘ Klein, Zeitschr. f. Pbys. 41,407 (1927).
Jordan, Zeitschr. f. Pbys. 40,809 (1927) ; Dlrac, Proc. Roy. Soc. A 113. 621 (1927).
196
Sources et évolution de la physique quantique
probabilité pour une variable dynamique quelconque à un instant donné d'avoir une valeur comprise entre des limites données, lorsque le système est représenté par une fonction d'onde donnée $, ? L'interprétation de Gordon-Klein peut répondre à des questions de ce genre si elles concernent la position de l'électron (en utilisant pmn), mais non SI elles concernent sa quantité de mouvement, ou son moment angulaire, ou n'importe quelle variable dynamique. Nous attendons de l'interprétation de la théorie relativiste qu'elle soit au moins aussi générale que celle offerte par la théorie non relativiste. L'interprétation générale de la mécanique quantique non relativiste est basée sur la théorie des transformations. et elle est rendue possible par le fait que l'équation d'onde est de la forme
(H- W)$J = O,
w
a/&,
c'est-à-dire par le fait qu'elle est linéaire en ou de sorte que la fonction d'onde à un instant quelconque détermine l a fonction d'onde à n'importe quel instant pour ultérieur. L'équation d'onde de l a théorie relativiste doit aussi être linéaire en que l'interprétation générale soit possible. Dans l'interprétation de Gordon, la deuxième difficulté provient du fait que si on prend le complexe conjugué de l'équation (1). on obtient
w
qui est la même que l'autre si on y met -e au lieu de e. L'équation d'onde (1) concerne donc aussi bien un électron avec une charge e qu'un électron avec une charge -e. Pour être précis, si on considère le cas limite des grands nombres quantiques, on trouverait que quelques-unes des solutions sont des paquets d'onde se déplaçant de la mëme manière que le ferait une particule de charge -e en théorie classique. alors que d'autres sont des paquets d'onde se déplaçant comme le ferait classiquement une particule de charge e. Pour cette deuxième classe de solutions, w a une valeur négative. On dépasse la difficulté en théorie classique en excluant arbitrairement les solutions qui ont un négatif. On ne peut le faire en théorie quantique, car en général une perturbation peut causer une posltif vers des états à négatif. Une telle transition transition depuis des états à apparailrait expérimentalement si un électron changeait soudainement sa charge de -e à e, phénomène qui n'a pas été observé. La vraie équation d'onde relativiste devrait être telle que ses solutions se découplent en deux ensembles ne se combinant pas, se référant respectivement à la charge -e et e. Dans l'article présent, nous nous intéresserons seulement à éliminer la première de ces deux difficultés. La théorie qui en résulte n'est donc encore qu'une approximation, mais elle se révele être suffisamment bonne pour tenir compte de tous les phénomènes de dédoublement sans hypothèses arbitraires.
w
w
w
2. L'hamiltonien en absence de champ Notre problème est de trouver une équation d'onde de la forme (2) qui soit invariante lors d'une transformation de Lorentz et soit équivalente à (1) à la limite des grands nombres quantiques. Nous considèrerons le cas où il n'y a pas de champ, lorsque l'équation
De la mécanique quantique relativiste à la théorie quantique des champs
(I) se réduit a
+ p2 + mzc2)tj= O
(;pi si i'on pose
197
(3)
w = ih- a w =-
c cat' p i , n , m exigée par la relativite montre que, puisque La symét e en I'hamiltonien que nous cherchons est linéaire en p o . il dolt aussi etre linéaire en pi,p1 et m. Notre équation d'onde est donc de la forme
(PO
+ a i p i + s p z + a m i-D)J, = O,
(4)
où, pour l'instant, tout ce que l'on sait des variables dynamiques ou des opérateurs a l r a z , a 3 , B est qu'ils sont indépendants de p o , p l , p 2 , p 3 , c'est-à-dire qu'ils commutent
avec t , 2 1 , 2 2 , 2 3 . Puisque nous sommes en train de considérer le cas d'une particule en mouvement dans un espace vide, tous les points dans l'espace sont équivalents, nous nous attendons à ce que I'hamiltonien ne dépende pas de t , ~ 1 , 2 2 , 2 3 . Cela signifie que a l , a 2 , a 3 , B sont indépendants de t , 21, 2 ~ ~ 2 c'est-à-dire 3 , commutent avec Nous sommes donc obligés d'avoir d'autres variables dynamiques que les coordonnées et quantité de mouvement de i'éiectron, afin que a1 ,QZ, a 3 , puissent être fonction d'elles. La fonction d'onde doit donc dépendre de plus de variables que simplement z l , z ~ , z 3 , t . L'équation (4) entrafne
po,pl,n,p3.
signifient des permutations cycliques sur les suffixes 1.2.3. Ceci est en accord où les avec (3) si
Si nous posons /3
,
uz = i
+
aras
a: = 1,
pz= rn2c2, Q,P
= O (r # S)
asUr
+ @a, = O
1
r,s = 1,2,3.
= n r m c . ces conditions deviennent
+
aCuY a w n p= O
(p # u)
p , u = i,2,3,4.
(6)
Nous pouvons supposer que les a,, s'expriment comme des matrices dans un certain schéma matriciel, les éléments des matrices a,, etant, disons, a,,((',("). La fonction d'onde 111 doit maintenant être fonction de ( aussi bien que de Z i , Z 2 , ~ 3 , t . Le résultat de la multiplication de $ par Q, sera une fonction (a,,$) de 21,Z Z , Z ~ , ~ ,définie < par
a,,(<, C')d(Zit, ('1.
(a,$>(z,t , C) = c'
Nous devons maintenant trouver quatre matrices a,, qui satisfassent les conditions (6). Utilisons les matrices
O
-i
1
0
Sources et évolution de la physique quantique
198
que Pauli Introduisit6 pour décrire les trois composantes du moment angulaire de spin. ces matrices ont Justement les propriétés u; = 1
orus
+
~
=~O,
s
r
( r # s),
(7)
que nous exigeons de nos a. Nous ne pouvons cependant prendre simplement les u pour Stre trois de nos a , car il ne serait alors pas possible de trouver la quatrième. Nous devons prolonger les O de manière diagonale afln qu'elles offrent deux colonnes et deux lignes de plus, de sorte que nous pouvons introduire trois matrices supplémentaires p l l p 2 , h de la meme forme que u 1 , u 2 , 0 3 , mais où les colonnes e t les lignes sont dans des positions différentes, de cette manière :
0
0 1 0 0
4
0
1 0 0 0 - 1 0
O
1 0 0 0
o
0 0 1 0
o
i
O
O
0 O
0-1
Les p sont obtenus à partir des u en échangeant les deuxième et troisième lignes, et les seconde e t troisième colonnes. Nous avons, en plus des équations (7)
Si nous prenons maintenant 01
= plul,
02
= ploz,
03
=pi631
0 4
= P39
toutes les conditions (6) sont satisfaites, par exemple, 0:
QiQ2
=p1alpIal =piUlpiU2
=p:u: = p:UlO2
=1 = -p:U2U]
= -a201.
Notons les équations suivantes, en vue de leur emploi ultérieur :
pip2 U]U2
= iP3 =iu3
= -P2Pi = -a201
1
ainsi que les équations obtenues par permutation des suffixes. L'équation (4) prend maintenant la forme
[Po où
O
'
+ Pl(..P) + P 3 4
indique le vecteur ( q ,uz, (13). Voir réf. I.
(9)
De l'atomisme grec
3.
199
Preuve d e l'invariance lors d'une transformation d e Lorentz Multiplions à gauche l'équat'lon (9) par p3. €lee devient, grâce a ( 8 )
+
[P~PO ipz(uipi
+ QPZ t a m ) t mc] (CI = O
Posant
PO = iP4 p3
nous avons
=-ni p1ur=rr, r = 1 , 2 , 3 .
[icr,p,
+mc]S,= O,
p = 1,2,3,4.
LS p, se transforment lors d'une transformation de Lorentz suivant la loi
Y
où les cefficients a,, sont des nombres complexes vérifiant
r
P
L'équation d'onde se transforme donc en
où Y
Les T,,, comme les a, satisfont elles aussi à
Ces relations peuvent être rassemblées en une seule équation
NOUS
avons
Les 7; satisfont donc aux mCmes relations que les 7,. manière analogue à (io)
7: = P)3
7: = P:.:
Nous pouvons donc poser, de
200
Sources et évolution de la physique quantique
OU l'on peut facilement vérifier que les p' et les O' satisfont les relations correspondant a ( 7 ) , ( 7 ' ) et (a), si l'on définit p i et pi par = -i7;7;7;, p: = -ipip'J. Nous allons maintenant montrer que, Par une transformation canonique, on peut mettre les p' et les 6' sous la forme des p e t des Q. De l'équation pf = 1, il suit que les seules valeurs caractéristiques possibles pour pk sont f l . Si l'on applique à pk une transformation canonique avec la fonction de transformatlon p i , le résultat est
pi
puisque les valeurs caractéristiques ne sont pas changées par une transformatlon canonique, pi doit avoir les memes valeurs caractéristiques que - p i . Par conséquent les ValeUK caractéristiques de pi sont deux fois 4-1 et deux fois -1. Le même argument s'applique a chacun des autres p' et à chacun des u'. Puisque p i et Q; commutent, eiies peuvent etre mises simultanément sous forme diagonale par une transformation canonique. Elles auront alors chacune pour élements diagonaux deux fois 4-1 et deux fois -1. Ainsi, en réarrangeant convenablement leurs lignes et leurs colonnes, on peut les mettre sous la forme p3 et uz respectlvement. (La possibilité p i = est exclue par l'existence de matrices qui commutent avec l'une mais non avec l'autre). Toute matrice contenant quatre lignes et quatre colonnes peut s'écrire sous la forme
&:ai
ob les seize coeficients c, cr, crS sont des nombres complexes. En exprimant u; de cette manière. nous voyons, compte tenu du fait qu'elle commute avec pi = p3 e t anticommute' avec 6;= u3, qu'elle doit être de la forme =clcl
+
CZUZ
+
c31p3Qi
+
C32hu2,
c'est-à-dire, de la forme
La condition un = 1montre que alza21 = i l a j 4 a 4 ~= 1. Si maintenant nous appliquons la transrormation canonique : multiplier la première ligne par (azi/ol2)t et la troisiëme ligne par ( ~ 4 ~ / 0 3 4 ) 1 )et si nous divisons la première e t la troisième colonne par les mêmes expressions, ai se mettra sous la forme de 6 1 , et les matrices diagonales ui et p i resteront Inchangées. Si à présent nous exprimons p i sous la forme (13) et si nous utilisons ses conditions de commutation avec ui = u1 et Q: = u3, et d'anticommutation avec pi = p 3 , nous voyons qu'elle doit être de la forme
p: = c:pi
'
+ 4Pz.
Nous dirons que a anticommute avec b lorsque ab
= -ba.
De la mécanique quantique relativiste à la théorie quantique des champs
La condition de la forme
pî
+ 4'
= 1 montre que c r
.:=(p. O
201
= 1, ou ci = COS6, ci = sine. Donc, p i est
;
O
e-ie
O 0
0
O e;)
eie
O
Maintenant nous appliquons la transformation canonique : multiplier la première et ta seconde lignes par eie, et diviser la première et la seconde colonnes par la même expression, p i se mettra sous la forme de p l , et 61,uz,u3 ne seront pas modifiées. p i et u$ doivent maintenant &tre sous la forme de p~ et de oz lorsqu'on tient compte des relations
ipi = p i p : , iuk = u;u;. Ainsi, par une succession de transformations canoniques, qui peuvent se combiner pour ne former qu'une seule transformation canonique, tes p' et tes O' peuvent être mis sous la forme des p et des 6. La nouvelle équation d'onde (12) peut de cette manière être mise sous la forme de l'équation d'onde originale (il) ou (9). Ainsi les résultats qui découlent de l'équation d'onde originale doivent être indépendants du système de références utilisé.
4.
L'hamiltonien pour
un
champ arbitraire
Afin d'obtenir I'hamiltonien pour un électron dans un champ électromagnétique de potentiel scalaire A0 et de potentiel vecteur A , nous suivons la procédure habituelle consistant à remplacer po par po e/c.Ao et p par p e / c . A dans I'hamiltonien en absence de champ. De l'équation (9). nous tirons alors
+
+
Cette équation d'onde apparaît suffisante pour rendre compte du phénomène de dédoublement. Les matrices p et u contenant quatre lignes et quatre colonnes, elle aura quatre fois autant de solutions que l'équation d'onde non-relativiste, et deux fois autant que l'antérieure equation d'onde relativiste (I). Etant donné que la moitié des solutions dolvent être rejetées pulsqu'elles assignent une charge +e à l'électron, on en aura encore un nombre correct pour rendre compte du phénomène de dédoublement. La démonstration donnée dans la section précédente de l'invariance lors d'une transformation de Lorentz s'applique t o u t aussi bien à l'équation plus générale (14). Nous pouvons avoir une première idée de la différence entre (14) et I' équation d'onde relativiste antérieure (1) en la multipliant par elle-même de manière analogue à (5). Cela donne, si nous écrlvons e' pour e / c
+ pi(a,p + e'A) + pamc] x (w +e'&) + PI(U,P + e'A) + p3mcISt +
O = [-(w e'Ao)
+
+
+
+
= [-(w e'A0)' (u,p e'A)' m'c' p l { ( u ,P e'A)(po e'&) - (PO e ' A ~ ) ( up,
+
+
+
+
(15)
+ e ' A ) ) ]St.
Sources et évolution de la physique quantique
202
Nous utiliserons maintenant la formule générale qui établit que. si vecteurs quelconques commutant avec u,alors
Prenant
B = C = p + e'A,
(a,P
+ e'A)2
B
et
c sont deux
nous trouvons
= (p
+ e'A)' + i
= (P
+ e'A)2 + he'(a,rotA).
[@I
+ e'Al)(pz
+ e'A2) - (pz + e'A2)(pl
+ elAl)]
Ainsi (15) devient
-ie'hpl
= [-(PO où
(~,gradAo
+
$
+ e'&)2 + (p + e'A)' + m2cZ4- e'h(u,H) + ie'hpl(u, E)]$,
E e t H sont les vecteurs électrique et magnétique du champ. Cette équation dimre de (1) par les deux termes supplémentaires
dans I?. Ces deux termes, lorsqu'on les divise par le facteur 2m. peuvent être regard& comme l'énergie potentielle additionnelle de l'électron due à son nouveau degré de liberté. L'électron se comportera donc comme s'il avait un moment magnétique eh/2mc.u e t un moment électrique ieh/Zmc.piu. Ce moment magnétique est juste celui qu'on lui attribue dans le modèle de l'électron tournant. Le moment électrique, étant purement imaginaire, n'est pas prévu dans ce modèle. II est douteux que ce moment électrique ait une signification physique, puisque I'hamiltonien (14) dont nous sommes partis est réel, et sa partie imaginaire n'apparait que lorsqu'on le multiplie d'une manière artificielle afin de le faire ressembler à I'hamiltonien de théories antérieures.
5. Les '
intégrales sur le m o m e n t angulaire p o u r l e m o u v e m e n t dans un c h a m p central
Nous allons détalller davantage le mouvement d'un électron dans un champ de forces central. Nous posons A = O et e'Ao = V(r), une fonction arbitraire du rayon r, de sorte que I'hamiltonien dans (14) devient
FE
+ V + pr(a, p) + p ~ m c .
PO
De la mécanique quantique relativiste à la théorie quantique des champs
203
Nous déterminerons les solutions périodiques de l'équation d'onde F$ = O, ce qui signifie que po doit être pris comme un pa!amètre au lieu d'un opérateur ; c'est en fait l'énergie du niveau multipliée par i/c. Nous déterminerons d'abord les intégrales du mouvement concernant le moment angulaire. Le moment angulaire orbital m est défini par
m = x x p et satisfait les relations suivantes (dltes de Vertauschung,
m1z1 mipi
- z l m l = O, - p1m1 = O,
m x m = ihm,
"
d'échange ")
- zzml = ih23 m ~ p ?- n m = ~ ihp3 mZml- m l m Z = O,
rnlq
1
,
ainsi que les relations semblables que l'on obtient en permutant les suffixes. également avec r, e t avec pr, le moment canoniquement conjugué de r. Nous avons
IF - F m i
(17) m commute
= P I { ~ I ( O , P )- ( U , P ) . ~ I ) = P I ( U , ~ I-PP ~ I ) = ihpi(OZp3 - 0 3 4 ) 7
et ainsi
mF - F m = ihp1 O x p. Donc
m n'est pas une constante du mouvement. Nous avons d'autre part
en utilisant (8) ; ainsi
D'où
U F - FU = - 2 i p l ~ x p.
1 (m + -hu)F 2
1 2
- F(m + -ho)
= O.
Donc m+ ;ha (soit M) est une constante du mouvement. Nous pouvons interpréter ce reSultat en disant que l'électron a un moment angulaire de spin de ahu, qul, ajouté au moment angulaire orbital total m, donne le moment angulaire total M. lequel est une constante du mouvement. Les relatlons de Vertauschung (17) sont vérifiées lorsqu'on les écrit pour les M au lieu des m. En particulier
M x M = ihM
et
M3 sera une variable d'action du système.
MZM3= M3MZ.
Puisque les valeurs caractéristlques de m3 doivent être des multiples entiers de h afin que la fonction d'onde soit univoque, les
Sources et évolution de la physique quantique
204
valeurs caractéristiques de M3 doivent être des multiples semi-entiers de posons
h.
1 M2 = ( j z - -)hZ,
Si nous
(19)
4
i sera un autre nombre quantique, et les valeurs caractéristiques de MJiront de ( j - 4)h
+
$)ha. Donc j prend des valeurs entières. On vérifie aisément à partir de (18) que m 2 ne commute pas avec F,et n'est donc pas une constante du mouvement. Cela constitue une différence entre la théorie présente et la théorie antérieure de l'électron tournant, dans laquelle m2 est constant, et qui définissait le nombre quantique azimutal k grâce à une relation semblable à (19). Nous allons prouver que notre j joue le même rôle que k dans la théorie antérieure. a (-j
6. Les niveaux d'énergie pour un mouvement dans un champ central Nous chercherons maintenant à écrire l'équation d'onde comme une équation diff& rentlelle en r , en séparant les variables qui définissent l'orientation du système comme un tout. Nous pouvons le faire en n'utilisant que l'algèbre élémentaire non-commutative de la manière suivante : Dans la formule (16), prenons B = = m. Cela donne
c
(a,m)2 = m2 = (m
+ ia, (m x m) 1 1 + -ha)2 - h(a,m ) - - P o 2 - h(o, m ) 2 4
= MZ- 2h(a, m )
3
- -h2. 4
D'où
+ h)2 = M* + 4
( ( 6 ,m>
=j z ~ .
Jusqu'à présent, nous n'avons défini j qu'à travers j z , aussi pourrions-nous, si nous le voulions, prendre j h @galà (u.m) h. Ce ne serait cependant pas satisfaisant puisque nous voulons que j soit une constante du mouvement alors que (O, m) h ne l'est pas, même si son carré l'est. Nous avons, en fait. en appliquant encore (16).
+
( 0 ,m) ( 0 ,P>
+
= i(a,m x P)
puisque (m.p) = O , et, de manière semblable, ( 0 ,P>( 0 ,m )
= i(a,P x m )
de sorte que
*
Voir Dirac, Proc. Roy. Soc.
A 111,281 (1926).
De la mécanique quantique relativiste à la théorie quantique des champs
ou
+ hip,P) +
((aim)
+
( 0 9
P)t(U, m)
205
+h}=0
Donc (a,m) h anticommute avec l'un des termes de F,à savoir p1(0, p), et commute avec les trois autres. II s'ensuit que p 3 ( ( c r , m ) h} commute avec tous les quatre et est donc une constante du mouvement. Mais le carré de p 3 { ( u , m ) 4- h} doit aussi être égal à j z h 2 . Nous devons donc prendre
+
Nous avons, en appliquant une fois encore (16)
Une définition acceptable de pr est alors
(x, P) = rpr
+ ih
e t d'après (21)
(a,m) = p3jh - h . D'où
P)= rpr + ip3jh.
(0,X) (0,
Introduisons la quantité e définie par
re = p l ( u , x ) .
(23)
Puisque r commute avec p l e t avec ( u , x ) , r doit commuter avec e. Nous avons donc
r2e2 = [Pi(a,x)J2 = (a,xl2 = x2 = r2 ou
2=1. Puisqu'il existe une symétrie entre X et p lorsqu'il s'agit du moment angulaire, aussi bien M et j .
p i ( o , x ) que pi(u,p) doivent commuter avec M et j . Donc c commute avec D'autre part, e doit commuter avec pr, puisque nous avons ( 0 ,x)
(x,P)- ( x , P)(0,x) = w u ,x),
qui donne
re(rpr
+ ih) - (rp, + ih)re = ihrc,
qui se réduit à
epr
- pre = O .
De (22) et (23) nous avons maintenant
repi((~,p)= rpr
+ ihp3jh
206
Sources et évolution de la physique quantique
ou Donc L’equation (23)montre que c anticommute avec p3. Avec une transformation canonique (faisant peut-être intervenir les z e t les p aussi bien que les u et les p ) , on pourra donc mettre mettre c sous la forme du p z du 82 sans changer p 3 , ni sans changer aucune des autres variables apparaissant sur la partie droite de l’équation (24). puisque toutes ces autres variables commutent avec e. k p 3 aura maintenant la forme ipzp3 = - p l , de sorte que l’équation d’onde prend la forme
F E [Po
+ V + pzpr - p l j h / r + p3mc]$ = O .
Si nous écrivons cette équation au complet, en appelant respectivement matrices et +a les composantes de $ qui se réfèrent à la première e t à la troisième lignes (ou colonnes) nous avons
+a
Les deuxième et quatrième composantes conduisent à répéter ces deux équations. Elim inons donc
Si nous écrivons hB pour
po
+ V + mc, la première équation devient
qui donne, par différenciation
+ (;+kg)( ; + ; ) $ a . Ceci se réduit à
Les valeurs du paramètre PO pour lesquels l‘équation a une solution finie à r = O et r = M sont 1 / c fois l’énergie du système. Pour comparer cette équation avec celle des théories antérieures, posons ?,6p = rx. de sorte que
De la mécanique quantique relativiste à la théorie quantique des champs
207
Si on néglige le dernier terme, qui est petit par le fait que B est grand, cette equation devient la même que l'équation de Schrodinger ordinaire pour le système, avec la correction reiatlviste inclue. Puisqile j a, de part sa définition. aussi bien des valeurs caractéristiques entières positives que négatives, notre équation donnera deux fois autant de niveaux d'énergie lorsque le dernier terme n'est pas négligé. Nous allons maintenant comparer le dernier terme de ( 2 6 ) , qui est du même ordre de grandeur que la correction relativiste, avec la correction de spin donnée par Darwin e t Pauli. Pour ce faire, nous devons éliminer le terme en &/& par une nouvelle transformation de la fonction d'onde. Nous posons
ce qui donne (PO
+ V)' - m2cz
j(j
+ i)
La correction est maintenant, à l'approximation du premier ordre
où
B = 2mc (pourvu que PO soit positif). Pour l'atome d'hydrogène nous devons poser
v = e'/n.
La correction au premier ordre devient alors
si nous écrivons -j pour j
+
1 dans (27). nous ne modifions pas les termes qui représentent le système non perturbé, de sorte que e'
2mc~r3 j donnera une seconde correction possible pour le terme non perturbé. Dans la théorie de Pauli et Darwin. le terme de correction correspondant est
8
où le facteur de Thomas est inclus. II nous faut rappeler que dans la théorie PauliDarwin, le moment angulaire orbital résultant k joue le rôle de notre j. Nous devons définir k par
i n ' = k(k
+ 1)h'
208
Sources et évolution de la physique quantique
au lieu de l’analogue exact de (19). afin qu’il puisse avoir des valeurs caractéristiques entieres, comme j. Nous avons, d’après (20)
(a,m)’ = k(k ou
{(u,m)
+ l)h’ - h(a,m)
1 + Sh}’
= (k
d’où
(a,m) = kh ou
1 + Z)2hz,
- (k + ï ) h .
La correction devient donc
qui est en accord avec (28) et (28’). L a théorie preente conduit donc, en premiere approximation, aux mêmes niveaux d’énergie que ceux obtenus par Darwin, qui sont en accord avec l’expérience.
St. John’s College, Cambridge
De la mécanique quantique relativiste à la théorie quantique des champs
209
4.2 L’électrodynamique quantique Avec le développement de la mécanique quantique - et son extension au domaine relativiste - il devint clair que l’étude du mouvement de particules matérielles dans des champs extérieurs donnés deMit se faire d’après les règles de cette théorie. Néanmoins, dans l’étude de l’interaction entre la matière et le rayonnement, ce dernier était traité d’après l’électrodynamique classique, ce qui n’était pas satisfaisant. On se rappile que Max Planck situait la quantification de l’énergie dans la zone de l’interaction matière-rayonnement, encore non éclaircie théoriquement, et refusait d’accepter l’hypothèse du quantum de lumière prop& par Einstein. J e ne cherche paa à aavoir ce que signifie le quantum d’action dans le vide, mais plutôt là où ont lieu l’abaorpiion et l’émiaaion, et jcauppoae que ce qui se paase daw le mde eat rigoureusement décrit par lea Cquatiom de Mazwell (cité par A. Pais, Subiie u the L o d , p. 384). Le premier pas vers une théorie quantique du rayonnement fut encore fait par Diracs3. De la même façon que la quantification de la matière consiste à considérer ses variables, telles que celles de position, d’impulsion, de moment angulaire, etc. comme des opérateurs linéaires obéissant à certaines règles de commutation et d é G s dans l’espace des vecteurs d’état, la quantification du champ électromagnétique dans le vide consiste à considérer les variables du champ comme des opérateurs définis dans le même espace. Pour trouver les règles de commutation auxqueiles doivent obéir ces opérateurs, il suffit de faire le développement du potentiel vecteur en ses composantes de Fourier de sorte que celui-ci apparaît, à cause des équations du champ dans le vide, comme une superposition d’ondes monochromatiques se comportant comme des oscillateurs harmoniques linéaires, à chaque fréquence étant associés deux oscillateurs indépendants, chacun correspondant à l’une des deux directions propres de la polarisation. La mécanique quantique d’un oscillateur harmonique linéaire lui attribue les énergies E, = (n $)ri w , n = 0, 1’2 ... : il s’ensuit que l’énergie d‘un rayonnement monochromatique ne peut changer que de h par l’émission ou l’absorption d’un photon : on retrouve la quantification de Planck. La théorie quantique du rayonnement et de l’électron relativiste confere des propriétés nouvelles au vide. Celui-ci est délini comme l’état de plus basse énergie et donc l’état dans lequel le nombre de photons, de particules matérieiles, de quanta en générai, est nul. Le formalisme prévoit que l’on ne peut avoir en même temps une valeur exacte du nombre de quanta et de l’amplitude du champ. Le champ dans le vide est donc le siège de fluctuations autour de Zéro, fluctuations que l’on peut calculers4. Ainsi, un électron libre dans le vide interagit avec les fluctuations autour de la valeur zéro du champ de rayonnement. Les oscillations correspondantes de l’électron contribuent à son énergie propre, mais la contribution 8 sa masse est divergente. D’autre part, il existe également des fluctuations au point Zéro de la densité de charge électrique dans le vide. Un électron dans le vide a une interaction avec
+
PAM. Dirac, P a . Roy. Soc. A114,243 (1927). .Voir par exe.mple, pour une éduation élémentaire de cet effet, V.F. Weisskopf, Lo phyaquc au X X aLclc, p. 102,del Duca, Paris 1974. ”
Sources et évolution de la physique quantique
210
les électrons virtuels qui occupent les états d’énergie négative. Comme le principe de Pauli interdit l’occupation d’un état par plus d’un électron, il en résulte une tendance des électrons à s’écarter les uns des autres. Il y a par conséquent une extension spatiale de la charge d’un électron réel, puisque les électrons virtuels du vide sont repoussés par lui, tandis que les positons sont attirés par lui. Toutes ces interactions donnent une contribution à l’énergie propre, clest-à-dire à la masse de l’électron ainsi qu’à sa charge. Les valeurs ainsi obtenues sont infinies, et cela fut, jusqu’en 1948, la source de difficultésmajeures pour le développement de l’électrodynamique quantique et des théories des champs entre temps formulées. En 1948, des travaux importants ” menés par Julian Schwinger et Shin-Itiro Tomonaga (qui avait déjà fait paraître ses premiers mémoires en 1943, en japcnais), ainsi que par Richard P. Feynman, établirent un formalisme où la covariance relativiste était mise en évidence, et qui permit de séparer les contributions des fluctuations du vide en des parties divergentes et des termes finis. Les termes divergents 6m et 6 e furent incorporés à la masse et à la charge initiales de l’électron, mo et eo, pour donner ce que l’on prend comme valeurs expérimentales - on cache ainsi les infinis : m = mo 6m
+
e
Les valeurs mo et
= eo
+ be
relatives à un électron dépouillé de l’interaction avec le vide sont pas observables ; elles se rajoutent à 6m et à be, et l’on appelle cette procédure consistant à cacher lea infinis la tenonnabation de la théorie : procédure qui donnera finalement m et e qui sont la masse et la charge observées. Les termes finis séparés des divergences donnent des effets observables : des contributions au moment magnétique s’ajoutent à la valeur de Dirac et donnent l’effet Uhling, résultant de la modification du potentiel coulombien, et l’effet Lamb, c’est-à-dire le déplacement des niveaux d’énergie de l’atome dû à cette modification. eo
- l’électron nu - ne
4.3 La quantification par l’intégrale de chemin Dans ses tentatives d‘éliminer les divergencesde l’électrodynamique quantique, Feynman découvrit une nouvelle façon d’effectuer le passage d’une théorie classique à la théorie quantique : la méthode de quantification par l’intégrale de chemins6. Il développa alors un formalisme intégral pour la mécanique quantique où l’équation différentielle de Schrodiger est remplacée par une équation intégrale qui détermine Is
R.P. Feynman, R a . Mod Phys. 20,367 (1948) ; Phys. Rev. 74,939,1430 (1948) ;
78, 749, 769, (1949) ; 80, 440 (1950) ; J. Schwinger, Phys. Rev. 79, 146 (1948) ; 74, 1439 (1948) ; 75, 651 (1949) ; 76, 790 (1949) ; 82,664,914 (1951) ; 91,713 (1953) ; S. Tomonaga, Progr. Thcor. Phys. (Japon) 1 , 27 (1946) ; 2. Koba, S. Tati et S. Tomonaga Pmgr. Thcor. Phys. 2, 101 (1947) ; Z. Koba et S. Tomonaga, Prog. Thcor. Phys. 3, 290
(1948). f 6 Voir R.P. Feynman and A.R. Hills, Quantum mechaniw and path integrals, hlcGrawHill, New York 1965.
De la mécanique quantique relativiste à la théorie quantique des champs
211
la fonction d’onde à un instant t z si on la connaît à un instant antérieur tl. Le noyau de l’équation intégrale, K(%,tz ;z;‘,ti) :
*($, tz) =
1
K($, tz ; 3,h)Q(G1t1)dzfdh
est le propagateur qui fait effectuer à la fonction d’ondes la transition de l’instant ti à l’instant f l . Cette transition comprend des contributions de tout l’espace. L’équation ci-dessus est un cas particulier du principe de Feynman, qui peut s’exprimer de la façon suivante.
a
Figure 4.2
Considérons une particule pouvant passer d’un point z. l’instant to à un autre point 2) à l’instant f i en suivant une trajectoire c. D’après la mécanique classique, parmi l’infinité des trajectoires possibles entre a et b, celle qui est eflectiuemenf réalbée est définie par le principe de moindre action. C’est-à-dire, qu’à chaque chemin est associée une variable S - une fonctionnelle, un nombre qui dépend de toute la trajectoire - et le chemin physique est celui qui rend S minimum (ou maximum) : 6s = O,
S, l’action, est définie par l’intégrale :
(la notation (...) est réservée aux fonctionnelles), L est le lagrangien de la particule, et bS est la variation de S correspondant à la variation de s lorsqu’on passe d’un point sur un chemin ci à un autre s u r un chemin cz au même instant. Les variations 6s sont arbitraires (on peut passer d’un chemin à n’importe quel autre) pourvu que 6s s’annule aux points extrêmes a et b. Le principe de Feynman associe à la transition de la particule du point z,,au point 2) un nombre complexe K(b,a) (lire de la droite à la gauche), l’amplitude de a ci b, dont le carré du module
212
Sources et évolution de la physique quantique
détermine la probabilité de sa réalisation. A chaque trajectoire c(i) entre a et b : z(i) = z(i)(t)
on associe une amplitude partielle :
4( q i ) ( f ) ) = a(i)eiqz(i)(*)l qui est, par définition, proportionnelle à l’exponentielle contenant l’action S[z(i)(t)] attachée. à ce chemin ;et l’amplitude K contient, toujours par définition, la somme de toutes les amplitudes partielles : Wb, 4 =
4 (Z(i,(t))
Feynman introduisit ainsi le concept d’intégrale de chemin, car il montra que la somme de toutes les amplitudes partielles correspondant à toutes les trajectoires possibles entre les points a et b conduit à écrire l’équation précédente sous la forme : K(b,a) E< Zb,tblZ.,t.
>=
/.i
,fsIr(’)(‘)l ( W f ) )
où la notation D z ( t ) indique de manière spécifique une somme sur tous les chemins entre a et b. C’est l’intégrale de chemin. Les definitions précédentes se généralisent. Au lieu d’une particule, on peut considérer un système plus général, par exemple un champ physique, a(.), dont le lagrangien est connu. L’intégrale de Feynman pour l’amplitude de la transition entre des états initial et final,où le champ prend des valeurs @i à l’instant ti, et 0 , à l’instant t f respectivement aura une forme du type :
où C est une constante, et L(@)est la densité du lagrangien qui contient le champ a(.), la somme étant l’intégrale de chemin généralisée aux champs.
4.4 Les diagrammes de Feynman pour
les propagateurs de l’électron et du photon Le formalisme intégral de Feynman en électrodynamique quantique le conduisit à introduire le concept de propagateur d’un électron relativiste libre qui est la fonction de Green de l’équation de Dirac correspondante :
De la mécanique quantique relativiste à la théorie quantique des champs
213
c’est-à-dire, essentiellement, l’inversede l’opérateur de Dirac. Le propagateur s’écrit comme une intégrale de Fourier :
Tenant compte de la représentation de la fonction de Dirac :
nous avons pour SF(P)l’expression :
Dans un système d’unités où c est l’unité de vitesse et fi l’unité d’action on aura :
et
Feynman représente ce propagateur par un segment de droite entre les points 2 2 dans un plan où l’axe des temps est dirigé vers le haut - le futur en haut, le passé en bas : z1 et
Figure 4.3
Les points 21 et 2 2 sont les vertex (nœuds), lieu de l’interaction avec un champ électromagnétique, lieu également d’entrée (11) et de sortie ( 2 2 ) de l’électron libre :
Figure 4.4
Sources et éuolution de la physique quantique
214
Le diagramme de Feynman de la figure 4.4 représente I’efet Compfon, à savoir : l’électron qui arrive libre de l’infini passé P,absorbe en zl un photon kl et après propagation jusqu’au point 2 2 , y émet un photon k2 et ressort libre vers le futur F. Cet effet est d’ailleurs représenté par la somme du diagramme de la figure 4.4 et celui de la figure 4.5 :
t
Figure 4.5
car on ne peut savoir si kz est émis avant ou après l’absorption de kl. Tandis que les photons dans les figures 4.4 et 4.5 sont des photons réels (pour -12
lesquels k,2 = k ) qui viennent du passé ou vont vers le futur, on voit immédiatement que l’on pourrait avoir (figure 4.6) un diagramme de l’interaction de l’électron avec les fluctuations du vide du champ électromagnétique :
Figure 4.6
Le photon émis au point 2 1 est réabsorbé par le même électron au nœud 2 2 : c’est un photon virtuel et la ligne correspondante représente la propagation du photon (figure 4.7) avec celui de l’électron.
YX2 *1
Figure 4.7
I1 est représenté par l’inverse du dalembertien, puisque la fonction de Green de l’équation : CIA’ = e j ”
De la mécanique quantique relativiste à la théorie quantique des champs
215
(le potentiel électromagnétique A' satisfait à cette équation de Maxwell, où
et où j' est le courant) vérifie l'équation :
DF (P) = -
Pl
. p (proton émergent i
Figure 4.8
P Les photons virtuels, qui contribuent à l'énergie propre de 1'6lectron selon la figure 4.6, sont déterminants également pour l'interaction électromagnétique entre particules chargées. Ainsi, une interaction, au second ordre, entre un électron et u n proton est représentée par la figure 4.8. L'échange d'un photon virtuel contribue à cette interaction : elle est du second ordre, puisque le diagramme possède deux vertex, et par conséquent, l'amplitude correspondante contient l'intensité de l'interaction, c'est-à-dire la charge e, au carré, au premier orcire en a =
A.
4.5
Le positon et la marche de l'électron vers le passé
L'une des idées les plus fécondes pour le développement des diagrammes de Feynman fut suggérée par John Archibald Wheeler. Dans un appel téléphonique à Feynman, Wheeler lui dit" : Feynman, j e saU pourquoi t o w les électroru ont la
''
RP. Feynman, Conférence Nobel, in La Nature de la Physique, p. 250, Le Seuil, Paris, 1980 [article XVI, page 2271.
Sources et évolution de la physique quantique
216
même m a s e et la même charge. - Pourquoi ? - Parce que ce sont tous le même électron !” Et il expliqua qu’une ligne d’univers comme celle de la figure 4.9
Figure 4.9
1
*
?
espace
représente un électron qui, aux points A, C, subirait l’action d‘un potentiel si intense qu’il réussirait à lui faire rebrousser chemin dans le temps, de telle sorte qu’il se propagerait vers le passé de A à B, de C à D et qu’il marcherait vers le futur sur les segments PA, BC, DE, EF. Par l’équation du mouvement classique de l’électron dans un champ électromagnétique, on voit que l’inversion du signe du temps propre ds
--t
-ds
la transforme en l’équation d’un positon (charge -e) vers le futur :
=+- moc2-$ z P = -eFP”-dzv ds2 ds ’ Ainsi donc le diagramme de la figure 4.9 représente un électron unique qui serait en marche vers le futur (avec une énergie positive) ou vers le passé (et dans ce c85 son énergie est négative), et dans ce cas il est équivalent à un positon qui
évolue vers le futur (avec une énergie positive). L’interprétation de Wheeler est donc que, au point B , une paire électronpositon est créée, le positon B A rencontre et annihile l’électron P A et ainsi de suite jusqu’à l’électron EF qui évolue vers le futur. temps
Figure 4.10 espace
De la mécanique quantique relativiste à la théorie quantique des champs
217
Cette idée aété développée par Feynman ; le diagramme d’annihilation électronpositon dans le vide : e+ e- * 27
+
est représenté par le diagramme de la figure 4.10,où l’électron p i A émet un photon kl, se propage de A à B où il émet le photon k 2 et s’annihile ensuite avec le positon W B (il y a un autre diagramme qui s’ajoute à celui montré sur la figure, et dans lequel les photons kl et kz sont échangés). Le point important des diagrammes de Feynman est qu’ils sont associés à des amplitudes pour le processus physique auquel ils correspondent. A chaque vertex et à chaque ligne sont associées une matrice ou une fonction de champ qui permet de décrire l’amplitude et de la calculer. Une conséquence de ces idées est qu’une paire virtuelle, représentée par la figure 4.11,constituée d’un électron qui s’annihile virtuellement avec un positon
Figure 4.11 pace
représente une fluctuation des charges dans le vide ; et c’est ainsi que le propagateur effectif d’un électron est en réalité une série de termes dont le premier représente la propagation d’un électron nu (figure 4.3)’ suivi d’un propagateur qui contient un photon virtuel (figure 4.7), plus un terme qui contient la boude électron-positon virtuelle insérée dans un photon virtuel (figure 4.11)’et ainsi de suite. Cette technique fut développée et permit de calculer les processus électromagnétiques avec une grande précision.
4.6 La renormalisation des théories quantiques
des champs A partir de l’année 1948,les divergences apparaissant dans l’électrodynamique quantique furent soigneusement étudiées. Les intégrales divergentes furent régularisées, c’est-à-dire qu’au lieu de sommer sur toutes les impulsions d’électrons ou de photons virtuels, on arrêta la somme à une impulsion maximale A, le paramètre de coupure, et l’on sépara les termes dépendant de A (et qui deviennent infinis lorsque l’on fait A * 00) et les autres, indépendants de A, finis, décrivant les effets dus
218
Sources et évoZution de Z a physique quantique
à la réaction du champ de rayonnement s u r l’électron qui le crée. La méthode de régularisation la plus élégante5’ et ia plus efficace consiste à effectuer les intégrales dans un espace physique à un nombre de dimensions 2) que l’on prendra comme paramètre. On vérifie alors qu’à la limite V = 4, les divergences réapparaissent c o m m e les pôles de certaines fonctions. De cette façon,on réussit à incorporer les termes qui dépendent du paramètre, A ou D, à la masse mo de l’électron nu, à sa charge eo et aux constantes multiplicatives affectant les propagateurs des nœuds et des fonctions d’onde. Ces constantes, définies gâce à la méthode de renormalisation, sont censées être petites au cas où elles sont strictement finies. On montra surtout que chaque processus électrodynamique est déterminé par et que les termes une amplitude qui est une série infinie en puissance de a = d’ordre supérieur au premier n’ajoutent pas de nouvelles divergences: on parle alors d’une théorie renormalisable. Bien que les théories quantiques ne soient pas nécessairement renormalisables, il en existe qui le sont. Par exemple, en plus de l’électrodynamique, celle du modèle électro-faible de Steven Weinberg, Abdus Salam et Sheldon Glashow pour laquelle la méthode de quantification de Feynman, celle de l’intégrale de chemin, est la plus adéquate.
&
’’
Cette méthode a été proposée par les physiciens argentins Bollini et Giambiagi [cf
C.G Bollini et J.J. Giambiagi, Phys. Lett. 40B, 566 (1972) ; Nuovo Cimento 12B, 20 (1972)], et indépendamment par les physiciens hollandais t’Hooft et Veltman [cf G. t’Hooft et M.Veitman, Nucl. Phys. B44,189 (1972)l.
Article XVI
L'électrodynamique quantique L'électrodynamique quantique et l'espace-temps
RICHARD PHILIPPS FEYNMAN Conférence Nobel 1965 Extrait de :La nature de la physique, Le Seuil (1980)* [traduit par H. Isaac, J.-M. Lévy-Leblond et F. Balibar]
Quand nous écrivons un article pour une revue scientifique, nous avons l'habitude de présenter un travail aussi bien fini que possible, d'effacer toutes nos traces derrière nous, d'oublier les impasses, de ne jamais décrire les idées fausses de départ, et ainsi de suite. De sorte qu'il n'existe aucune publication où l'on puisse raconter, de façon sérieuse, le travail tel qu'on l'a vraiment fait - bien que, récemment, un certain intérêt se soit manifesté pour ce genre de question. Mais, puisque le prix Nobel est une affaire personnelle, vous m'excuserez, je pense, si, en cette circonstance particulière, je parie de mes relations avec l'électrodynamique quantique, plutôt que de discuter le sujet en lui-meme de façon raffinée et systématique. De plus, puisque nous sommes trois, en physique, avoir reçu ce prix, si nous parlons tous de l'électrodynamique quantique en tant que telle, le sujet finira par vous ennuyer. Ce que je voudrais donc vous raconter aujourd'hui est la séquence des événements, celle des idées en tout cas, qui m'ont permis de venir 3 bout d'un problème j u s q u e 4 non resolu, ce pourquoi ]'ai recu ce prix. Je sais bien qu'un article vraiment scientifique serait d'une grande valeur, mais je pourrais le publier dans n'importe quel journal spécialisé habituel. Je vais donc utiliser cette conférence comme une occasion pour une contribution de valeur peut-être moindre, mals que je ne pourrais, en tout cas, pas donner ailleurs. Je dois encore vous demander votre indulgence pour les détails et les anecdotes sans valeur pour la compréhension du contenu scientifique, nl pour celle du développement des idées. Leur inclusion ne servira qu'à donner un peu de vie à cette conférence. Premiers émois J'ai travaille sur le problème environ huit mois, jusqu'à la publication finale, en 1947. Tout a commencé au Massachusetts lnstltute of Technology, où l'étais étudiant.
J'apprenais la physique alors connue, assimilant lentement les questions qui tracassaient les gens du métier, et il m'apparut finalement que l'état peu satisfaisant de la théorie quantique de l'électricité et du magnétisme était le problème fondamental du moment. J'appris ceci dans des livres comme ceux de Heitler e t Dirac. Dans ces livres, ce sont les
*
Copyright Fondation Nobel e t Robert Laffont.
220
Sources et évolution de la physique quantique
discussions et remarques qui m'inspiraient, et non les passages oh t o u t était démontré et calculé soigneusement, car je ne comprenais pas très bien ces passages. A cet âge tendre, ce que je pouvais comprendre, c'étaient les remarques sur le manque de sens de tels calculs, et je peux encore me rappeler la dernière phrase du livre de Dirac : " II
".
semble que nous ayons besoin de quelques idées physiques radicalement nouvelles Je trouval là un défi et une inspiration. J'avais aUSi le sentiment personnel que, pulsqu'ils n'avalent pas obtenu de réponse satisfaisante au problème que j e voulais résoudre, il ne m'était pas nécessaire d'accorder une attention exagérée à ce qu'ils avaient fait. Je compris à partir de mes lectures, cependant, qu'il y avait deux sources aux difficult& des théories électrodynamiques quantiques. La première résidait dans la valeur infinie de l'énergie d'interaction de l'électron avec lui-même, de son " auto-énergie Et cette dificulté existait déjà dans la théorie classique. L'autre difficulté provenait d'infinités liées au nombre infini de degrés de liberté du champ électromagnétique. Comme je ia comprenais à l'époque (pour autant que je me souvienne), cette difficulté provenait de la quantification des oscillateurs harmoniques du champ, disons, dans une boÎte. Chaque osciilateur a alors une certaine énergie minimale, dans son état fondamental, soit h v / 2 ob Y est sa fréquence : mais comme il y a un nombre infini de modes propres de la boîte, de fréquences croissantes, il doit y avoir une énergie infinie dans la boîte. J e vois bien aujourd'hui que ce n'était pas là un énoncé tout a f a i t correct du problème central : ce point peut être réglé simplement en changeant l'origine, le zéro, à partir duquel est évaluée i'énergie. Quoi qu'il en soit. je pensais que la difficulté était en quelque sorte le résultat combiné de l'interaction de l'électron avec lui-même e t de l'infinité des degrés de liberté du champ, vecteur de cette interaction. Eh bien, II me paraissait tout à fait évident que l'idée d'une particule qui agit sur elle-même, ia force électrique agissant sur la particule même qui l'engendre, n'a rien de nécessaire - c'est une idée plutôt absurde, en fait. Et je me fis donc à moi-même la suggestion que les électrons ne peuvent pas agir chacun sur lui-même, mais seulement sur les autres électrons. Ce qui veut dire qu'il n'y a pas de champ! S i toutes les charges contribuent à engendrer un champ unique commun, et si ce champ commun agit sur toutes les charges, alors, vous le voyez bien, chaque charge doit réagir sur elle-même. Mais voila i'erreur : il n'y a pas de champ! Tout simplement, ilse passe que si vous agitez une charge, une autre s'agitera plus tard. IIy a entre les charges une interaction directe, quoique agissant avec un certain retard. La loi donnant la force liant le mouvement d'une charge à une autre devrait juste inclure ce retard : agitez celle-ci, celle-ia se mettra a bouger un peu plus tard. Un atome vibre dans le soleil : l'électron dans mon œil vibrera huit minutes plus tard à cause de l'interaction directe transmise entre eux. Or, cette idée présente l'avantage de résoudre les deux problèmes d'un coup. D'abord, j e peux dire tout de suite : " Je ne laisse pas l'électron réagir sur lui-même. j e laisse juste ceci agir sur cela. Donc pas d'auto-énergie " Ensuite, il n'y a pas un nombre infini de degrés de liberté dans un champ : il n'y a plus de champ du tout ! Ou bien, si vous tenez à penser à l'aide d'idées comme celle de champ, ce champ désormais est toujours complètement déterminé par le mouvement des particules qui l'engendrent. Vous agitez cette particule : cela fait bouger cette autre. Mais SI vous voulez penser en termes de champ, le champ, s'il est là. est entièrement déterminé par la matière qui le produit ; par conséquent ce champ n'a plus aucun degré de liberté hdépendant, et les infinit& liées aux degrés de liberté du champ sont donc supprimées. De fait, quand nous regardons
".
De la mécanique quantique relativiste à la théorie quantique des champs
n'importe où et voyons de la lumière, nous Pouvons toujours '' voir à la source de cette lumière.
"
221
la matière qui est
Vous voyez donc que mon plan général était d'abord de résoudre le problème classique, de me débarrasser de l'auto-énergie infinie dans la théorie classique et d'espérer qu'en en tirant ensuite une théorie quantique, tout se passerait sans problèmes. Ce fut le début de mon travail,et l'idée me semblait si claire et si élégante que j'en tombai profondément amoureux.-'C'est comme quand vous tombez amoureux d'une femme : ça n'est possible que si vous ne la connaissez pas bien, et ne voyez pas ses défauts. Les défauts vous apparaitront plus tard, mais après que l'amour est devenu assez puissant pour vous attacher à elle. C'est POUrqUOi j e suis toujours resté attaché à cette théorie, malgré toutes les difficultés. par mon enthousiasme de jeunesse. C'est alors que je commençais mes études spécialisées, et vint un moment où j'appris ce qui n'allait pas dans cette idée suivant laquelle l'électron n'agirait pas sur lui-même. Quand vous accélérez un électron, il rayonne de l'énergie, et vous devez effectuer un travail supplémentaire pour fournir cette énergie. L a force supplémentaire que ce travail doit vaincre est appelée résistance radiative. Suivant une idée de Lorentz, on considérait à l'époque que l'origine de cette force se trouvait dans l'action de l'électron sur luimême. L e premier terme de cette auto-interaction fournit une sorte d'inertie (quoique non entièrement satisfaisante du point de vue relativiste). Mais ce terme d'inertie est infini pour une charge ponduelie ! Malgré tout, l e terme suivant donne un taux de dissipation de l'énergie qui. pour une charge ponctuelle, coincide exactement avec le taux d'énergie rayonnée. O r cette résistance radiative devait disparaitre si j'admettais qu'une charge ne puisse réagir sur elle-mëme, alors que cette force est absolument nécessaire pour assurer la conservation de l'énergie. Actions anticipées Pendant cette période, j'appris donc le défaut trop évident de ma propre théorie. Mais j'en étais toujours amoureux e t continuais de penser qu'elle contenait la solution des difficultés de l'électrodynamique quantique. Je persistai donc à essayer tant bien que mal de la sauver. II fallait, pour rendre compte de la résistance radiative, que sur tout électron accéléré se developpe une certaine réaction. Mais SIje ne laisse agir chaque électron que sur les autres électrons, la seule source possible de cette réaction réside dans ces autres électrons. Un jour, comme je travaillais pour le professeur Wheeler e t n'arrivais pas à résoudre le problème qu'il m'avait donné, j e repris mon Idée e t fis le calcul suivant. Supposons que j'ai deux charges électriques. J'agite la première, que j e considère comme une source et ca fait bouger la seconde ; mais ce mouvement de la seconde réagit sur la source. Je calculai donc quelle était l'ampleur de cet effet en retour sur ia première, espérant qu'il fournirait la résistance radiative. Mais le résultat n'était pas le bon, bien entendu et j'allai trouver Wheeler pour lui exposer mes idées. II me d i t : " Oui, mais la réponse que vous trouverez dans le problème des deux charges doit malheureusement dépendre de la charge e t de la masse de la seconde, et varie comme l'inverse du carré de la distance R entre les charges, alors que la résistance radiative ne dépend d'aucune de ces quantités ! " Je pensais alors qu'il avait déjà fait tous ces calculs pour lui-même. mais maintenant que je suis devenu professeur aussi, je sais qu'on peut acquérir assez d'expérience pour voir d'un coup ce qu'il faudra à un étudiant plusieurs semaines pour
Sources et évolution de la physique quantique
222
élaborer. II m'indiqua alors quelque chose qui me préoccupa : dans une sltuation où il y avait de nombreuses charges autour de la source originale, avec une densité à peu près constante, en ajoutant i'effet de toutes ces charges alentour, le facteur en inverse de R2 serait compensé par le R2 de l'élément de volume : plus les charges sont loin, plus faiblement elles agissent mais plus nombreuses elles sont, les deux effets se compensant. O n obtiendrait alors un résultat proportionnel à l'épaisseur de la couche de charges, donc un resuitat infini. Autrement dit, il y aurait une réaction infinie sur la source. Et finalement il me dit : " Vous avez encore oublié quelque chose : quand vous accélérez la première charge, la seconde agit plus tard et la réaction sur la source se fait sentir plus tard encore En d'autres termes, la force agit au mauvais moment. Je pris conscience t o u t d'un coup de ma bêtise : ce que j'avais décrit et calculé, c'était tout simplement la réflexion ordinaire de la lumière, pas du tout la réaction radiative. 'I.
Mais autant j'étais bete, autant Wheeler était astucieux. Car il se mit à me faire un cours, comme s'il avait mis tout ça au point depuis longtemps et se trouvait parfaitement prépar6. Mais pas du tout : il improvisait au fur et à mesure. " D'abord, dit-il, supposons que l'action en retour due aux charges du milieu absorbant atteigne la source par des ondes avancées, aussi bien que par les ondes retardées ordinaires de la lumière réfléchie, de sorte que la loi d'interaction agisse aussi par anticipation dans le temps, e t non J'était déjà assez physicien pour ne pas m'écrier : " Mals non, seulement avec retard c'est impossible ! " Car, aujourd'hui, tous les physiciens savent, après avoir étudié Einstein et Bohr, que, parfois, une idée apparemment tout à fait paradoxale, si on l'analyse en détail, et dans le contexte de situations expérimentales, peut finalement n'avoir rien de paradoxal. De sorte que cela ne me tracassait pas plus que le professeur Wheeler d'utiliser des ondes avancées pour engendrer la réaction, une solution des équations de Maxwell qui n'avait pas été envisagée physiquement jusque-là. Wheeler utilisa donc des ondes avancées pour obtenir la réaction au bon moment et eut l'idée suivante : s'il y avait beaucoup d'électrons dans I'absorbeur, on aurait un indice de réfraction n. de sorte que les ondes retardées provenant de la source verraient leur longueur d'onde Iégerement modifiée en passant à travers I'absorbeur. Maintenant, en supposant qu'entre la source et I'absorbeur, le milieu a un indice égal à l'unité, II y aura un décalage progressif entre les phases du signal de retour et du signal initial, de sorte que nous pourrons considérer la réaction comme due à une couche d'épaisseur finie, celie de la première zone d'onde (plus précisément, jusqu'à cette profondeur où la phase dans le milieu est appréciablement décalée par rapport à ce qu'elle serait dans où est la longueur d'onde et n l'indice). le vide, une épaisseur proportionnelle à Or, moins Il y aurait d'électrons, moins chacun contribuerait, mais plus épaisse serait la couche efficace, car l'indice differe d'autant moins de l'unité qu'il y a moins d'électrons (et moins n - 1 est grand, plus l'est &). Plus serait forte la charge de chaque électron, plus II contribuerait, mals moins épaisse serait la couche efficace, car l'indice serait plus élevé. Et quand nous fimes une estimation (sans nous préoccuper de garder tous les facteurs numériques corrects), comme de juste, Il se trouva que la réaction sur la source était completement indépendante des propriétés des charges dans le milieu absorbeur aux alentours. De plus, elle avait juste l'allure nécessaire pour représenter la résistance radiative, mais nous fûmes incapables de voir si elle avait exactement la bonne valeur. Wheeler me renvoya chez moi avec mission de calculer précisément quelle proportion d'ondes avancées et d'ondes retardées il fallait pour obtenir le bon résultat numérique,
".
De la mécanique quantique relativiste à la théorie quantique des champs
223
et ensuite d'évaluer ce qui se passe pour les effets anticipés qu'on doit attendre, si l'on place une charge d'essai près de la source. Car, SI. toutes les charges engendrent des ondes avancées aussi bien que retardées, pourquol cette charge d'essai ne seralt-elle pas affectée par les ondes avancées émises par la source ? .
Figure 1. En b) la réaction avancée de la paroi au rayonnement retardé de la source compense sur la charge d'essai le rayonnement avancé direct de l a source. En c ), la réaction de la paroi au rayonnement avancé de la source s'ajoute au rayonnement retardé direct.
Je trouva1 qu'on obtient l a bonne réponse en utilisant comme champ engendré par chaque charge une moitié d'ondes avancées et une moitié d'ondes retardées, c'est-&dire qu'on doit utiliser la solution des équations de Maxwell qui est symétrique par rapport au temps. Et l'on n'avait finalement pas d'effets anticipés en un point proche de la source bien que celle-ci produise un champ avancé, pour l a raison suivante : supposez que la source est au centre d'une paroi absorbante sphérique d'un rayon de dix secondeslumière et que la charge d'essai se situe une seconde-iumiere à droite de la source. Alors, la distance de la charge d'essai à la paroi va de neuf secondes-lumière pour certaines parties de la paroi. à onze secondes-lumière pour d'autres parties (fig. 1 a). La source agissant à un temps pris conventionnellement comme origine, soit t = O, induit des mouvements dans ia paroi absorbante au temps t = 10 secondes. Les effets avancés
Sources et évolution de la physique quantique
224
de ces mouvements peuvent réagir sur la charge d'essai dès onze secondes auparavant, mit à t = 10 - 11 = - 1seconde. Mals c'est également l'instant où les ondes avancées en provenance directe de la source atteignent la charge d'essai. e t Il se trouve que les deux effets sont exactement égaux et opposés, de sorte qu'ils se compensent (fig. 1 b) ! AU temps ultérieur t = 1 seconde, les effets sur la charge test provenant de la paroi (avancés) et de la source (retardés maintenant) sont encore égaux, mals de meme signe (fig. 1 c). Ils s'ajoutent donc et tout se passe comme si grâce aux ondes avancées de la paroi, la demi-onde retardée de la source avait sa pleine valeur comme dans la théorie
+
conventionnelle. II devint ainsi clair qu'en supposant d'une part toutes les actions transmises par les solutions pour moitié avancées et pour moitié retardées des équations de Maxwell, e t d'autre part toutes les sources entourées par un milieu absorbant l'intégralité de ia lumière grnise, alors nous pouvions rendre compte de la resistance radiative comme due à une action directe des charges de I'absorbeur réagissant sur la-source par ondes avancées. De nombreux mois furent consacrés à vérifier tous ces points. Je travaillai à montrer que tout ceci est indépendant de la forme des couches absorbantes et autres détails, que les lois sont absolument les bonnes, et que les effets anticipés se compensent exactement dans tous les cas. Nous essayions toujours d'accroître I'efiicacité de nos démonstrations et de voir toujours plus clairement pourquoi ça marchait, maisje ne vais pas vous ennuyer avec les détails de ce travail. Du fait que nous utilisions des ondes avancées, nous avions aussi de nombreux paradoxes apparents, que nous réduisîmes, un par un, Jusqu'à nous convaincre qu'il n'y avait finalement pas de difriculté logique dans la théorie. Elle était t o u t à fait satisfaisante.
Une théorie sans champs II nous apparut aussi que nous pouvions reformuier la chose d'une autre façon, à l'aide d'un principe de moindre action. Puisque mon plan initial était de tout décrire directement en terme des mouvements des particules, j e désirais représenter cette nouvelle théorie sans lamals parler de champs ou d'ondes. Nous pomes trouver une forme pour l'action ne dépendant que du mouvement des charges qui, soumises au calcul variationnel, fournirait les équations du mouvement de ces charges. L'expression de cette action A est :
avec Iij
où
-
= x;(ai) Xj(Clj)
XG(ai) est le quadri-vecteur position de la ième particule, fonction d'un certain dX'(a.) ~-&f.
paramètre a;,et X, est Le premier terme dans l'expression de A est t'intégrale du temps propre, l'action ordinaire de la mécanique relativiste pour des particules de masse mi (suivant, la convention, nous sommons sur les Indices de composantes répétés, comme p ) . Le second terme représente l'interaction électrique entre les charges. C'est une somme sur toutes les paires de charges (le facteur 1/2 est là pour qu'on ne compte
De la mécanique quantique relativiste à la théorie quantique des champs
225
chaque paire qu'une fois e t on exclut les termes i = j pour éviter les auto-interactions). L'interaction est une intégrale double sur une fonction " delta " de Dirac du carré de 1 entre deux points des trajectoires. Alnsl, il n'y a l'intervalle spatio-temporel invariant ' d'interaction que lorsque cet intervalle s'annule, c'est-à-dire le long des cônes de lumière. C'est le fait que l'interaction, dans notre théorie, soit moitié avancée, moitié retardée qul permet d'écrire un principe de moindre action, alors qu'une interaction transmise par des ondes retardées seules ne peut être décrite de cette façon. Ainsi, toute l'électrodynamique classique était contenue dans cette formule très simple. Elle avait belie allure e t donc, pour un débutant au moins, devait sans le moindre doute être vraie. Elle fournissait automatiquement des effets mi-avancés, mi-retardés, et ne comprenait pas de champs. En supprimant les termes de la somme où i = j, on éliminait l'auto-interaction e t il n'y avait plus d'auto-énergie infinie. C'était donc la solution tant souhaitée au problème de l'élimination des infinités dans l'électrodynamique classique.
-4
largeur fonction 6
a2
I
fonction f
____b
2
O
O
Figure 2.
II se trouve, bien sOr, que vous pouvez restaurer les champs si vous le désirez, mais il faut alors suivre le champ produit par chaque particule séparément. En effet, pour trouver le champ correct agissant sur chaque particule, vous devez exclure le champ qu'elle engendre elle-même. Un champ unique e t universel auquel contribueraient toutes les charges ne ferait pas l'affaire. Cette idée avait déjà été suggérée par Frenkel et nous baptisames ces champs : '' champs de Frenkel ". Notre théorie, qui ne permettait à chaque particule que d'agir sur les autres, était donc équivalente à une théorie utilisant des champs de Frenkel mi-avancés, mi-retardés. il existait plusieurs possibilités pour modifier l'électrodynamique de façon Intéressante. Nous en discutâmes de nombreuses, mais je n'en décrirai qu'une. Elle consistait à remplacer ia fonction delta dans l'interaction par une autre fonction, disons f(p),qui n'ait pas un pic infiniment aigu. Au lieu que l'action ne s'exerce que si l'intervalle invariant entre les deux charges est rigoureusement nul, on remplace la fonction delta de p par un pic Ctroit (flg. 2). Supposons que la fonction soit grande uniquement autour de = O, avec -' R sera une largeur d'ordre a'. Les interactions s'exerceront maintenant quand d'ordre a', où T est l'intervalle de temps et R la séparation spatiale entre les charges. II pourrait sembler que ceci soit contredit par l'expérience, mais si a est une longueur minime devant R, le temps de propagation de l'action sera en gros T (RZI a')'/*
f(z)
=
226
Sources et évolution de la physique quantique
approximativement T 2: R f a2/2R. Cela veut dire que l’écart entre le temps T erectif e t le temps To = R Idéal de la théorie de Maxwell, soit a2/2R, est d’autant plus petit que R est grand, donc que les charges sont elolgnées. Par conséquent toutes les analyses théoriques du fonctionnement des générateurs, des moteurs, etc., c’est-à-dire, en fait, toutes les vérifications de l‘électrodynamique qui étaient disponibles à l‘époque de Maxwell, restent valides SIa est de l’ordre de IO-’’ cm. SI R e s t de l’ordre du centimètre en effet, l’écart relatif sur ‘ I serait ‘ seulement de II était donc possible de modifier la théorie de façon simple, tout en restant en accord avec toutes les observations de l’électrodynamique classique. Bien sOr, il n’existe aucune indication précise quand à la fonction f, mais il était Intéressant de garder cette possibilité à l’esprit pour développer l’électrodynamique quantique. II nous vint aussi l’idée que si nous procédions à cette modification (remplacer 6 par f), nous pourrions réintroduire le terme i = j dans la somme, car il repreenterait maintenant de façon Invariante relativiste une action finlede chaque charge sur elle-même. En fait, on pouvait démontrer que, dans ce cas, l’effet principal de l’auto-interaction (pour des accélérations modérées) serait de produire une modification de la masse. D u coup, il n’y a m@meplus besoin des termes de masse en mi : toute la masse mécanique pourrait être due B i’auto-interaction électromagnétique. Donc, si l’on veut, on peut avoir une autre théorie avec une expression encore plus simple pour i’action A. Dans la formule (I), il suffit de ne garder que le second terme en étendant la somme sur tous les i et tous les j et en remplaçant 6 par une certaine fonction f. Une telie formule pourrait représenter toute l’électrodynamique classique qui, la gravitation exceptée, recouvre essentiellement toute la physique classique. Tout cela peut paraitre un peu confus, car je décris en même temps plusieurs théories alternatives. L’important est de noter que, à l’époque, nous les avions toutes en tête, comme autant de possibilités. II y avait plusieurs solutions au problème de l’électrodynamique classique. chacune pouvant servir comme une bonne base de départ pour vaincre les diftlcultés de l’électrodynamique quantique. Je voudrais aussi mettre l’accent sur ceci : pendant cette période, j e m’habituai à adopter un point de vue physique différent de la vision traditionnelle. Dans la vision traditionnelle, les phénomènes sont discutés en détail quand à leur évolution dans le temps. Par exemple vous connaissez le champ à tel instant ; une équation différentielle vous donne ensulte le champ à l’instant suivant, et ainsi de suite - c’est la méthode que j’appelleral hamiltonienne, la méthode de l’évolution différentielle. Dans notre démarche (par exemple dans l’équation (l)),nous avons au contraire une description globale de la trajectoire dans l’espace e t le temps. Le comportement de la nature est défini par une certaine propriéte d’ensemble des trajectoires spatio-temporelles. Pour une action telle que (1). les équations obtenues à l’aide du principe variationnel portant sur les coordonnées sont très dificitement ramenées à la forme hamiltonienne. Si l’on souhaite n’utiliser comme variables que les coordonnées des particules, on peut, certes, parler des trajectoires et de leurs propriétés - mals la trajectoire d’une particuie à un moment donné est affectée par la trajectoire d’une autre à un autre moment. Si donc vous essayez de donner une description différentielle, indiquant quel est l’état present des particules et comment cet état affectera le futur, vous n’y arriverez pas avec des particules uniquement, car ie COmpOTtement passé (et non seulement l’état présent) d‘une particule va affecter ce futur.
OU
xb(a;)
De la mécanique quantique relativiste à la théorie quantique des champs
227
\
temps
to---
I
D
I Figure 3. L a ligne d'univers d'un électron capable de " remonter le temps IIs'agit d'un électron unique. Néanmoins, au temps t o , ilse manifeste comme trois électrons (en P, 9, et deux positons (en R, T). Autrement dit, cet électron se présente à nous, sur les segments AB et CD de sa ligne d'univers, comme un positon. En suivant le cours du temps, c'est-à-dire en " coupant " le diagramme par des lignes t = to d'ordonnée temporelle croissante, on verrait :en D,apparaitre une paire électron-positon, en B de même ;en A, le positon apparu en B s'annihile avec l'électron initial, puis en le positon apparu en D s'annihile avec l'électron apparu en B , e t ilne subsiste que l'électron apparu en D. 'I.
s)
c,
II faut donc toute une comptabilité avec des variables supplémentaires pour garder la trace du comportement passé des ,particules. Ces variables sont préclsément celles qu'on appelle d'habitude les amplitudes du champ, et il faudra Indiquer aussi quel est le champ présent SI vous voulez savoir ce qui se passera plus tard. Mais du point de vue global que donne le principe de moindre action sur tout l'espace-temps. le champ dlsparaït, ou n'est plus que l'ensemble des variables nécessaires à la comptabilité imposée par la méthode hamiltonienne. Comme sous-produit de ce même type de vue, je reçus un jour, 3 Princeton, un coup de téléphone de Wheeler : " Feynman, j e sais pourquoi tous les électrons ont l a même masse et la même charge. - Pourquoi ? - Parce que ce sont tous le même électron ! " Et il m'expliqua au bout du fil : '' Supposez que les lignes d'univers dans l'espace-temps que nous avons l'habitude de considérer, au lieu d'aller toujours dans le sens du futur, forment un nœud compliqué (fig. 3). Alors, en coupant à travers ce nœud par le plan correspondant à un instant donné, nous verrions, au lieu d'une seule ligne, de trës nombreuses lignes, qui représenteraient autant d'électrons, à un changement près : SI sur l'un des segments, cette ligne représente un électron ordinaire, allant vers le futur, alors sur un segment où le sens est renversé et où il revient du futur, on aura le mauvais signe pour le temps propre ou pour la quadri-vitesse, ce qui revient à changer ie signe de la charge et ce segment de la ligne représente donc un positon. - Mais, Monsieur, dis-je, il n'y a pas autant de positons que d'électrons ! - Oh, peut-être sont-ils
228
Sources et évolution de la physique quantique
cachés dans les protons, ou quelque chose de ce genre ", r é p o n d i t 4 Je ne pris pas trop au sérieux l'idée que tous les électrons n'en étaient, en fait, qu'un seul, mais retins cette observation que les positons pouvaient être simplement représentés comme des électrons allant du futur vers le passé sur un segment rétrograde de leur ligne d'univers. Cette idée, j e l'ai volée ! E n résumé, après ce travail, j'avais, en tant que physicien, fait deux acquisitions. D'une part, j e connaissais diverses façons de formuler l'électrodynamique classique, sous plusieurs formes mathématiques différentes. D'autre part, l'avais acquis un point de vue général, le point de vue global de l'espace-temps, et un certain dédain pour la méthode hamiitonienne de descriptlon du monde physique. Je voudrals m'interrompre ici, pour faire une remarque. Que l'électrodynamique puisse s'écrire de tant de façons différentes, les équations différentielles de Maxwell, divers principes extrémaux avec des champs, des principes extrémaux sans champs, etc., ça, j e le savais déjà, mais j e ne l'ai toujours pas compris. II me semble toujours étrange que les lois de la physique, quand on les découvre, se présentent sous tant de formes différentes qui n'ont pas dès i'abord l'air équivalentes, mais dont on peut démontrer ensuite qu'elles le sont en faisant jouer les mathématiques. Un exemple en est l'équivalence de i'équation de Schrodinger et de la formulation matricielle de Heisenberg de la mécanique quantique. Je n'en comprends pas le pourquoi, cela reste pour moi un mystère, mais c'est quelque chose que l'expérience m'a enseigné. II y a toujours une façon d'exprimer la même chose, mais sous une forme qui ne ressemble absolument pas à ce que vous disiez auparavant. Je n'en sais pas la raison, mais je pense que, d'une certaine façon, cela représente la simplicité de la nature. Une loi comme celle du carré inverse est juste ce qu'il faut pour être donnée par la solution de l'équation de Poisson qui, par conséquent, est une autre façon différente de l'exprimer, bien qu'elle ne ressemble en rien à la formulation de départ. Je ne sais pas ce que cela peut bien vouloir dire, que la nature choisisse ces formes curieuses, mais c'est peut-être juste une façon de définir la simplicité. Peut-être une chose est-elle simple si vous pouvez la dëcrire complètement de diverses facons, sans savoir immédiatement que toutes ces descriptions s'appliquent à la même chose. L'action e t la
théorie quantique
J'étais convaincu maintenant que, puisque nous avions r b o i u le problème de I'électrodynamique classique (et en complet accord avec mon programme du MIT, à l'aide d'interactions directes entre particules, d'une façon qui rendait inutik les champs), tout irait bien dorénavant. J'étais convaincu qu'il me suffisait de fabriquer une théorie quantique analogue à cette thCorie classique et que tous les problèmes seraient r w i u s . Le problème était donc seulement de faire cette théorie quantique ayant comme analogue classique l'expression (1). Mais Il n'existe pas de recette unique pour fabriquer une théorie quantique à partir d'une théorie classique, bien que tous les manuels vous laissent croire le contraire. lis vous indiquent de chercher les variables de moment e t de les remplacer par -i h 6 / s , . Mais je ne pouvais trouver une variable de moment, puisqu'il n'y en avait pas ! C'est que le style de la mécanique quantique à l'époque était d'écrire la théorie sous la fameuse forme hamiltonienne - comme une équation différentielle, décrivant comment la fonction d'onde change d'instant en instant, à l'aide d'un certain opérateur H. Si la
De la mécanique quantique relativiste à la théorie quantique des champs
229
théorie classique pouvait s'écrire sous forme hamiltonienne, tout allait bien. Or, le principe de moindre action n'implique pas l'existence d'une forme hamiltonienne si l'action dépend d'autre chose que des vitesses e t des positions au m€me instant. Quand l'action s'écrit comme l'intégrale d'une fonction (ordinairement appelée le lagrangien) des positions et des vitesses à un certain instant :
alors vous pouvez partir du iagrangien, former un hamiltonien et puis passer a la théorie quantique. de façon plus ou moins unique. Mais le principe (1) fait intervenir les variables clés, les positions. à deux instants différents, et la facon de s'y prendre pour fabriquer son analogue quantique était loin d'être évidente. J'essayal. Je me battis sur différents fronts. Une des idées était la suivante : SI j'avais des oscillateurs harmoniques interagissant avec un certain retard dans le temps, j e pourrais calculer les modes propres, puis espérer que la théorie quantique de ces modes propres serait la mëme que pour des oscillateurs simples et la reformuler ensuite à l'aide des variables de départ. Je réussis à faire ce calcul, mais je voulais le généraliser à d'autres systèmes que l'oscillateur harmonique. C'est là que j'appris avec regret ce que beaucoup d'autres avaient appris déjà : i'oscillateur harmonique est trop simple ! Souvent, vous pouvez écrire ce que devrait être son comportement quantique sans pour autant obtenir la moindre Indication sur la facon de généraliser vos résultats à d'autres systèmes. Cela ne m'aida donc pas tellement. Mais, alors que j e me battais avec ces problèmes, j'allai à une fête de la bière à la Taverne de Nassau, à Princeton. II y avait là un monsieur fraichement arrivé d'Europe, qui s'assit près de moi. II s'appelait Herbert Jehle. Les Européens sont beaucoup plus sérieux que nous autres, Américains. et ils pensent qu'une fête de la bière est un bon endroit pour discuter de problèmes intellectuels. Le voilà donc qui s'assied près de moi, et me demande : " Que faites-vous en ce moment ?" ; je lui réponds : " Je bois de la bière Puis j e compris qu'il voulait plutut savoir sur quoi je travaillais ; j e lui racontai comment j e me débattais avec ce problème et lui demandai simplement : " Dites, connaissez-vous une façon de faire de la mécanique quantique à partir de l'action ? Un moyen de faire intervenir l'intégrale d'action en théorie quantique ? - Non, répondit-il, je ne sais pas, mais il y a un papier de Dirac où le lagrangien, en tout cas, intervient en mécanique quantique. Je vous le montrerai demain
".
".
Le lendemain, à la bibliothèque de Princeton, dans l'une de ces petites salles latérales où l'on peut discuter, il me montra cet article. Dirac y écrivait la chose suivante : il existe en théorie quantique une entité très importante qui effectue la transformation de la fonction d'onde d'un instant à un autre, par-delà l'équation différentielle, tout en lui étant équivalente. Ce noyau, comme on l'appelle, noté K(z',z), change la fonction d'onde $(z) connue au temps t en la fonction d'onde ~(z') au temps t + E . Dirac montrait que cette fonction K est anaiogue à la quantité que vous obtiendriez en mécanique ciassique en calculant l'exponentielle du lagrangien L(Z,z) multiplié par k - en supposant que les deux positions z et z' correspondent aux instants t et f E. En d'autres termes :
+
Sources et évolution de la physique quantique
230
Le professeur Jehle me montra donc cet article. Je le lus e t puis je lui dis : " Qu'estce que ça veut dire, que ces deux grandeurs sont analogues ? Qu'est-ce que ça signifie, II me répondit : I' Ah, vous autres, Américains ! il faut analogue ? A quoi ça sert I toujours que ça serve à quelque chose I " J'émis l'Idée que Dirac voulait dire que ces q u a n t i t e sont égales. " Non, dit Jehle, ce n'est pas ça qu'il veut dire. Eh bien, dis-je, voyons ce qui se passe si nous les faisons égales Donc, je les posa1 égales, en prenant l'exemple le plus simple d'une particule de masse M dans un potentiel V(z), où le lagrangien est 1 / 2 M i 2 - V ( z ) , mais je découvris vite qu'Il me fallait introduire une constante de proportionnalité correctement ajustée. Quand j e remplaçai K par C e x p ( i E L), obtenant : 'I.
-
".
c
et fis un développement en série de Taylor, surgit l'équation de Schrodinger ! Alors, sans bien comprendre encore, j e me tournai vers Jehle et lui dis : " Eh bien, vous voyez, Dirac voulait dire que ces quantités sont proportionnelies " Les yeux du professeur Jehle lui sortaient de la tête, il avalt pris un petit cahier e t recopiait rapidement les calculs qui couvraient l e tableau. " Non, non, dit-il, ceci est une découverte importante. Vous, les Américains, vous essayez toujours de trouver comment vous servir des choses. Mais c'est un bon moyen de faire des découvertes ! '' Ainsi, j e croyais avoir trouvé ce que Dirac voulait dire, mais, en fait, j'avais découvert que ce qu'il pensait être une analogie était en réalité une égalité. J'avais, enfin, une relation entre le lagrangien e t la théorie quantique, mais toujours en termes de fonctions d'onde et d'intervalles de temps infinitésimaux.
.
Un jour ou deux plus tard, j'étais dans mon lit et réfléchissais à tout ça. C'est alors que Je tachal d'imaginer ce qul se passerait SI je voulais calculer la fonctlon d'onde apr& un intervalle de temps finl. En mettant l'un de ces facteurs exp(ieL), j'obtiendrais la fonction d'onde à l'instant E. Puis je mettrais cette nouvelle fonction d'onde dans l'équation (3). pour suivant t avoir un nouveau facteur exp(iaL), ce qui me donnerait la fonction d'onde à l'instant 26, et ainsi de suite. De cette facon, je me pris à imaginer un grand ultérieur t nombre d'intégrales, à la suite l'une après l'autre. Sous l'intégrale était le produit des exponentielles qui. bien entendu, était l'exponentielle d'une somme de termes du type i d . Mais L est un lagrangien e t E est comme un intervalle de temps dt, de sorte que la somme de tels termes est exactement comme une intégrale : c'est la méme chose que la formulation de Riemann pour l'intégrale J L d t : vous prenez les valeurs en chaque point et les ajoutez. II faut encore prendre la limite OU E tend vers zéro, blen sûr. Ainsl, le rapport entre la fonction d'onde à un certain instant e t la fonction d'onde à un autre instant, un intervalle de temps fini plus tard, peut être obtenu par un nombre infini d'intégrales (puisque E -+ O) d'exponentielles de i A / h où A est l'action, donnée par (2). Enfin, l'avais réussi à exprimer directement la mécanique quantique % l'aide de l'action
+
+
A. Ceci me conduisit ultérieurement à l'idée d'amplitudes associées à un chemin : pour chaque chemin possible que la particule pourrait suivre d'un point de l'espace-temps à
De la mécanique quantique relativiste à la théorie quantique des champs
231
un autre, II y a une amplitude, donnée par l'exponentielle de l'action le long de ce chemin, multipliée par i / h . Les amplitudes des divers chemins se superposent par addition. C'est donc là une autre facon-encore, une troisième, de décrire la mécanique quantique, qui semble tout à fait différente de celles de Schrodinger ou Heisenberg, mais leur est équivalente. Après avoir effectué quelques vériflcatlons, ce que je voulais faire, bien entendu, c'était de remplacer i'actlon (2) par l'autre (1). La premiere difficulté fut que Je n'arrlvals pas à ce que ça marche pour le cas relativiste du spin un demi. Cependant, même si j e ne pouvais traiter la matière que de facon non relatlviste, je pouvais traiter correctement la lumlère, ou le photon, en insérant dans l'action les termes d'interaction de (1), et en remplaçant les termes de masse par l'expression non relativiste 1 / 2 M & ' d t . Quand l'action se faisait avec retard comme c'était maintenant le cas, et impliquait plusieurs temps, je devais abandonner l'idée de fonction d'onde. En d'autres termes, j e ne pouvais plus décrire mon programme de la facon suivante : " étant donné l'amplitude pour toutes les positions à un certain instant, calculer l'amplitude à un autre instant Cependant, ceci ne provoquait pas de dimcultés majeures et voulait simplement dire qu'il fallait développer un nouveau point de vue. Au lleu de fonctions d'onde, il faut calculer, pour une certaine source, émettant une particule. et un détecteur la recevant, l'amplitude pour que la source émette et le détecteur reçoive. O n fait ce calcul sans préciser l'instant exact où la source émet, ni celui où un détecteur recoit, sans essayer de préciser l'état de quoi que ce soit entre-temps, juste en prenant l'amplitude pour l'expérience complète. Et il est alors possible de discuter comment l'amplitude changerait s'il y a une diffusion entre l'émission et la réception pour modifier les directions, etc., sans avoir vraiment besoin
1
".
des fonctions d'onde. Je pus aussi découvrir ce que les vieux concepts d'énergie et de quantité de mouvement signifient pour cette action généralisée. Et l'en vins à croire que l'avais une théorie quantique de l'électrodynamique classique, ou plutôt de cette nouvelle électrodynamique décrite par l'action (1). Je fis plusieurs vérifications. Si l'adoptais le point de vue des champs de Frenkel, dont vous vous souvenez qu'il avait un caractère plus dlfférentiel, je pouvais en faire une théorie quantique de facon plus conventionnelle. Le seul problème était de définir en mécanique quantique la condition aux limites de la théorie classique correspondant aux solutions mi-avancées, ml-retardées. Avec un peu d'astuce pour définir ce que cela voulait dire, je trouvai que la théorie quantique des champs de Frenkel, plus une conditlon aux limites speclales. me redonnait l'action (1) sous forme d'une théorie quantique avec retard. Ainsi, divers éléments indiquaient que, sans plus de doutes, j'avais tout réglé. II était aisé également de deviner comment modifier cette électrodynamique, si quelqu'un le désirait. J'avals Juste à changer le delta en une fonction f, comme pour le cas dasslque : chose tr& facile et très simple. Pour décrire la vieille théorie avec retard sans mention explicite des champs, il fallait considérer les probabilités e t pas seulement les amplitudes. donc prendre le carré de mes amplitudes, ce qui faisait intervenir des doubles Intégrales de chemin, avec deux A, etc. Cependant, en mettant ces choses au point et en étudiant des formes diverses et différentes conditions aux limites. je r w e n tais l'impression bizarre que tout n'allait pas aussi bien qu'il semblait. Je n'arrivais pas à Identifier clairement la difficulté. Aussi, pendant l'une des brèves périodes où je croyais avoir réussi à tout mettre au point, j e publiai ma th&e et reçus mon doctorat.
232
Sources et évolution de la physique quantique
Dificultés Pendant la guerre, j e n'eus pas le temps d'étudier sérieusement ces questions, mais pendant que j e voyageais, dans les autobus ou n'importe où, j'emportais mes petits bouts de papier et tâchais de travailler sur le problème. Je finis par découvrir qu'Il y avait quelque chose de faux, de terriblement faux. Je trouva1 que si l'on généralisait l'action de l'agréable forme lagrangienne (2) à la forme (l), alors les quantités que je définissais, comme l'énergie, par exemple, étaient complexes. Les valeurs des énergies des états stationnaires ne seraient pas réelles et la somme des probabilités des événements ne ferait pas 100%. C'est-à-dire, SIvous preniez les probabilités que ceci arrive, ou cela, ou n'importe quoi, leur somme ne ferait pas un. D'autres difficultés, dans lesquelles je me débattais péniblement, portaient sur la représentation des électrons relativistes dans cette nouvelle mécanique quantique. Je voulais l'obtenir de facon unique e t nouvelle - pas seulement en copiant les operateurs de Dirac et en utilisant leur algèbre à la place de celle des nombres complexes ordinaires. J'y étais vivement encouragé par le fait que dans un espace à une seule dimension, j'avais trouvé le moyen d'attribuer une amplitude à chaque chemin en me limitant aux trajectoires parcourues, dans un sens ou dans l'autre, à la vitesse de la lumière. L'amplitude était simple : ia élevé à une puissance égale au nombre de rebroussements du chemin, si j e divisais le temps en intervalles & et n'autorisais la vitesse à changer de signe qu'au bout de ces intervalles. Ceci donnait, à la limite où E approchait zéro, i'équation de Dirac à deux dimensions, l'une d'espace, l'autre de temps. La fonctlon d'onde de Dirac a quatre composantes pour un espace-temps à quatre dimensions. mais n'en a que deux dans ce cas, e t ma règle pour l'amplitude d'un chemin exige automatiquement deux composantes. En effet, avec ma formule, il ne vous sert à rien de connaître l'amplitude totale pour tous les chemins qui aboutissent à un point donné si vous vouiez connaître l'amplitude pour atteindre le point suivant. C'est que, au cours de l'intervalle suivant, si le chemin arrive de la droite, il n'y a pas besoin de facteur ie pour continuer vers la gauche, alors que s'il arrive de ia gauche, il faut un nouveau facteur ir. Ainsi, pour savoir ce qui se passe au moment suivant. l'amplitude totale ne donne pas assez d'information et il faut connaitre, indépendamment, les amplitudes correspondant aux deux directions d'arrivée, droite et gauche. Si tel est le cas, on peut alors calculer ces deux amplitudes à l'instant suivant. et en les gardant toutes les deux, on peut former une équation différentielle (du premier ordre par rapport au temps).
Et je rêvais donc que, si j'étais assez malin, je pourrais trouver pour l'amplitude d'un chemin à trois dimensions d'espace et une de temps, une amplitude belle et simple qui serait équivalente 3 l'équation de Dirac et avec laquelle les quatre composantes, les matrices, et toutes ces bizarreries mathématiques apparaîtraient comme de simples condquences. Je n'ai jamais réussi à réal'wr ce rêve. Mais je voudrais mentionner quelques-uns des problèmes non résolus, des échecs sur lesquels j'ai dépensé presque autant d'effoorts que sur mes réussites. Pour résumer la situation, après ces quelques années, j'avais acquis une grande expérience de l'électrodynamique quantique, au moins dans la connaissance de diverses formulations, en termes d'intégrales de chemins, d'actions et d'autres formes. Un sousproduit important de cette expérience, par exemple, était que je pouvais facilement combiner ce qu'on appelait à l'époque des champs transverses et longitudinaux, et de
De la mécanique quantique relativiste a la théorie quantique des champs
233
façon générale, mettre clairement en évidence l'invariance relativiste de la théorie. En effet, à cause du besoin d'exprimer la théorie en termes différentiels, on avait, dans l'électrodynamique quantlque conventionnelle, opéré une séparation complète du champ en deux parties, l'une appelée composante longitudinale, et l'autre, médiatMe par les photons, correspondant à des ondes transverses. La partie longitudinale était décrite par un potentiel coulombien agissant instantanément et apparalssant dans l'équation de Schrodlnger, alors que la partie transverse avait une description entièrement différente en termes d'ondes transverses quantifiées. Mais, d'après la relativité, cette séparation est biaisée par l'orientation de vos axes dans l'espace-temps. Deux physiciens se déplatant à des v l t w e s dlfférentes sépareraient de deux façons distinctes le même champ en une partie longitudinale et une partie transverse. De plus, toute la formulation de la mécanique quantique, insistant, comme elle le faisait alors, sur la fonction d'onde à un instant donné, était difficile à analyser de façon relativiste. Dans un autre système de coordonnées, la succession des événements serait décrite à l'aide de fonctions d'onde définies sur des tranches d'espace-temps découpées autrement e t avec une autre séparation du champ en partie transverse et partie longitudinale. La théorie hamiltonienne donc n'avait pas l'air d'avoir l'invariance relativiste, bien que, naturellement. elle I'eOt. L'un des grands avantages du point de vue global était que vous pouviez voir d'emblée i'invariance relativiste, ou -comme dirait Schwinger - que la covariance était évidente. J'avais l'avantage, par conséquent. d'avoir une forme manifestement covariante de l'électrodynamique quantique, avec des possibilités de modifications, et d'autres agréments. J'avais l'inconvénient, si je la prenais trop au sérieux - j e veux dire, si je la prenais au sérieux tout simplement -, de rencontrer des ennuis avec ces énergies complexes et la somme incorrecte des probabilités. etc. Je me battais avec ce problème sans guère de succès. Le
défi d e ïexpérience
C'est alors que Lamb fit ses expériences. Mesurant l'écart entre les niveaux 2 et 2 P1I2 de l'hydrogène, il trouva une différence en fréquence d'environ 1 000 mégacycles. Le professeur Bethe, avec qui Je travaillais alors à l'université Cornell. a une manle particuliëre : s'il tombe sur un bon résultat expérimental, il lui faut absolument le tirer de la théorie. De sorte qu'il força l'électrodynamique quantique de l'époque à lui donner une réponse pour la séparation de ces niveaux. II fit remarquer que l'énergie d'auto-interaction de l'électron tout seul, c'est-à-dire sa masse, est infinie, de sorte que le calcul de l'énergie d'un électron lié dans un atome doit aussi donner un résultat infini. Mais il pensait que si l'on calculait la séparation des deux niveaux d'énergie en termes de la masse corrigée au lieu de la masse inltiale, la théorie fournirait une réponse convergente finie. II fit une estimation de la séparation avec cette méthode et trouva encore un résultat divergent. Mais il supposa que cela était probablement dO à son utilisation d'une théorie non relativiste de la matière. Faisant alors l'hypothèse qu'un traitement relativiste donnerait un résultat convergent, il put évaluer cet écart de fréquence, le " Lamb shift ", à un millier de mégacycles environ - ce fut la découverte la plus importante dans l'histoire de l'électrodynamique quantique. C'est dans le train, entre lthaca et Schenectady, qu'il élabora ce calcul et il me téléphona tout excité de Schenectady pour me communiquer ce résultat, dont j e n'ai pas souvenir de l'avoir partlculierement apprécié sur le moment.
De retour à Cornell, Bethe fit, sur le sujet, un exposé auquel j'assistai. II expliqua
234
Sources et évolution de la physique quantique
qu'il était très difficile de démêler à quoi correspond chacun des termes infinis nécessaires pour corriger la modificatlon, elle-même infinie, de la masse. SI l'on connaissait une modification quelconque, dit-Il, meme si elle n'était pas physiquement correcte (c'est-àdire ne correspondant pas nécessairement à la façon dont fonctionne la nature), mals une modification quelconque aux fréquences élevées qui puisse rendre finies ces corrections, alors il n'y aurait aucune difficulté pour savoir s'y repérer. Vous calculez simplement la correction de masse Am de l'électron, maintenant finie, de sorte que la vraie masse de l'électron est m = mo 4- Am, et vous remplacez partout dans les résultats mo par m - Am, ce qui résout toutes les ambiguïtés. Si, de plus, cette modification possédait l'invariance relativiste. alors on serait absolument sOr de faire le calcul en accord avec cette invariance. Après i'exposé, j'ailai le voir et lui dis : " Si vous vouiez, je peux faire ce calcul, j e Je crois bien que j e connaissais toutes les façons possibles vous l'apporterai demain de modifier l'électrodynamique quantique connues par l'humanité à cette époque. Je retournai le voir le lendemain, lui expliquai ce qu'entraTnerait le remplacement de la fonction 6 par f et lui demandai de me montrer comment calculer I'auto-énergie de l'électron, par exemple, de façon à voir si elle est bien finie. Je veux que vous remarquiez bien ceci : j e n'avais pas suivi l e conseil du professeur Jehle et cherché " à quoi ça servait Toute la machinerie quej'avais montée, j e ne l'avais pas utilisée pour résoudre le moindre problème relativiste. Jusque-ià, j e n'avais même pas calculé l'auto-énergie d'un électron et j'étudiais les difficultés, liees à i a conservation de la probabilité, etc., sans rien dire d'autre que discuter les problèmes généraux de la théorie. Mais maintenant, j'étais avec Bethe qui m'expliquait au tableau comment calculer l'auto-énergie d'un électron. Jusqu'alors, quand on calculait ces intégrales, elles avaient une divergence logarithmique. Je lui montrai comment faire les modifications dictées par l'invariance relativiste, dont j e pensais qu'elles feraient tout converger. Nous calculâmes ensemble l a nouvelle intégrale - elle divergeait comme la puissance sixième de la fréquence au lieu du logarithme, une divergence bien pire ! Je retourna1 dans mon bureau, tri% préoccupé et me mis à tourner en rond, essayant de comprendre ce qui clochait. J'étais physiquement certain que le résultat devait être fini et ne pouvais Comprendre pourquoi nous avions obtenu quelque chose d'infini. J'étals de plus en plus intéressé, et en vins à admettre que je devais apprendre à faire ce genre de calculs. J'appris par moi-même comment calculer l'auto-énergie d'un électron, avançant patiemment au milieu de la terrible confusion qui régnait alors avec des " états d'énergie négative des " trous ", des I' contributions longitudinales ", et tutti quanti. Quand je trouvai finalement comment faire, avec les modifications que j e proposais. le résultat convergeait agréablement, il était fini comme j e m'y attendais. Bethe e t moi n'avonsjamais découvert où nous avions bien pu nous tromper au tableau noir deux mois auparavant ; apparemment, nous avions dérapé quelque part mais n'avons jamais trouvé où. II se trouve que ma proposition, si nous l'avions mise en œuvre sans nous tromper, était valide et aurait donné, une correction finie. Quoi qu'il en soit, cette erreur me força à revenir en arrière et à me convaincre que, physiquement ça devait marcher. La correction donc, était maintenant finie e t proportionneile au logarithme de ma/h où a est la largeur de la fonction f qui remplace 6. Si vous vouliez une électrodynamique non modifiée, il suffisait de prendre a nul, ce qui donne bien une correction infinie.
".
".
'I,
De la mécanique quantique relativiste à la théorie quantique des champs
235
Mais telle n'était pas la question. Gardant au contraire a non nul, j e suivis le programme de Bethe e t montrai comment calculer les diverses quantités, la diffusion des électrons par les atomes. les décalages des niveaux etc., exprimés en termes de la masse expérimentale, et remarquai alors que, sous Cette Forme, les résultats, comme Bethe l'avait suggéré, ne dépendaient plus de a de façon critique e t avaient une limite bien définie lorsque a -i o. Le reste de mon travail fut seulement d'améliorer les techniques de calcul dé]& disponibles, en fabriquant les diagrammes pour aider à analyser plus rapidement la théorie des perturbations (fig. 4).
Figure 4.
Quelques
'I
diagrammes de Feynman
"
La plupart de ces résultats furent atteints au jugé - j e n'avais pas une bonne théorie relativiste de la matière. Par exemple, II me paraissait évident que les vitesses dans les formules non relativistes devaient être remplacées par les matrices de Dirac a,ou. sous forme covariante, par les opérateurs 7.Je faisais ces conjectures d'après les formes que j'avais élaborées en utilisant les intégrales de chemin pour la matiëre non relativiste, la lumière seule étant traitée de façon relativiste. II était facile de construire des règles de substitution pour obtenir le cas relativiste. Je fus très surpris de découvrir que personne à l'époque ne savait que chacune des formules si patiemment élaborées en séparant les ondes transverses e t longitudinales pouvait étre obtenue à partir des ondes transverses seules, SI au lieu de sommer sur les deux directions de polarisation perpendiculaires à la vitesse, on sommait sur les quatre directions de polarisation possibles. C'était tellement évident d'après l'action (1), que je pensais ce résultat connu de tout le monde e t que je I'utlllsals tout le temps. Je me heurtai aux autres parce que j e n'imaginais pas qu'ils ne savalent pas Ca ; mais II se trouvait que tout leur patient travail avec les ondes longitudinales revenait toujours à étendre l a somme sur les deux directions transverses de polarkation en une somme sur les quatre directions. C'était l'un des avantages amusants de ma méthode. De plus, j'inclus les diagrammes pour les divers termes de la série de perturbations, améliorai les notations à utiliser, inventai des techniques de calcul aisées pour les Intégrales qui apparaissent dans ces problèmes e t écrivis une sorte de manuel d 'elect rodynamique quant ique Cependant, une étape importante et physiquement nouvelle, liée à la mer d'énergie négative de Dirac, me procura beaucoup de difficultés logiques. Je me retrouvai dans
.
Sources et évolution de la physique quantique
236
une telle confusion que je me rappelai la vieille idée de Wheeler à propos du positon qui serait, peut-être, l'électron remontant le temps à reculons. Alors, dans la théorie des perturbations dépendant du temps qu'on utilisait d'habitude pour calculer I'autoénergie, j e supposai simplement que, pour un moment, on pouvait remonter le temps, et j e regardai quels termes on obtenait en faisant courir les variables de temps à l'envers (fig. 5 ) .
Figure 5. L e diagramme a) décrit l'émission d'un photon par un électron en A, et l'absorption d'un autre photon ensuite en B. Le diagramme b) montre la transformation en B' d'un photon en électron et positon, suivie de la transformation en A' du positon et d'un électron en photon. La théorie de Feynman décrit ces deux processus comme deux aspects d'un même phénomène et permet de considérer, dans le cas b)., le positon se propageant de B' en A' comme un électron " remontant le temps '* de A' en B'. Eh bien, c'était exactement les memes termes qu'obtenaient les autres en attaquant le problème de façon plus compliquée, en considérant des trous dans la mer de Dirac, les mCrnes a quelques signes près, éventuellement, signes que je déterminai empiriquement d'abord, en inventant certaines règles et les essayant. J'ai tenté de vous expliquer que toutes ces améliorations de la théorie relativiste ont d'abord été des recettes seml-empiriques, plus ou moins simples. Chaque fois que Je découvrals quelque chose, cependant, je revenais en arrière et je vérifiais ce résultat de plusieurs façons, le comparais à tous les problèmes résolus au préalable en électrodynamique (et plus tard en théorie mésique à couplage faible) pour voir s'il y avait toujours accord, jusqu'à ëtre absolument convaincu de la vérité des diverses règles et recettes que J'avais Inventées pour simplifier le travail.
Confirmations Pendant ce temps, les gens avaient développé la théorie mésique. un sujet que je n'avais pas étudié en détail. Je m'intéressai à la possibilité d'appliquer mes méthodes de calculs de perturbation à la théorie des meons. Mais c'était quoi, la théorie des mésons ? Tout ce que j e savais, c'était que la théorie mésique était quelque chose d'analogue à l'électrodynamique, sauf que les particules correspondant aux photons ont une masse. II était facile de deviner que la fonction 6 dans l'équation ( l ) , solution
De la mécanique quantique relativiste à la théorie quantique des champs
237
particulière de l'équation " d'Alembertien égale zéro ' I . devait être remplacée par la solution correspondante de l'équation " d'Alembertien égale (masse)' Ensuite, il y avait différentes espèces de m h n s ; certains, les plus semblables aux photons, couplés sont appelés " mésons vectoriels " ; d'autres sont dits " scalaires " Bon, peutpar 7,,7" être ces derniers correspondaient-ils à l'insertion de l'unité devant 7p,sans doute ce qu'on appelalt le '' couplage pseudo-vectoriel ", et je pouvais à peu près deviner ce que c'était. Je n'avais pas assez de connaissances pour comprendre la façon dont ils étaient définis dans les articles conventionnels, parce qu'ils s'exprimaient en termes d'opérateurs de création et d'annihilation, que j e n'avais pas réussi à apprendre à manipuler Correctement. Je me rappelle que lorsque quelqu'un avait commencé à m'enseigner les opérateurs de création et d'annihilation, me montrant comment tel opérateur créait un électron, je m'étais dit : " Mais comment peut-on créer un électron? Ça contredit la conservation de la charge électrique ", et ce blocage mental m'empecha d'apprendre une technique de calcul très utile. II me fallait donc trouver autant d'occasions que possible pour vérifier si j'avais deviné correctement ce qu'étaient ces diverses théories.
".
.
Un jour, lors d'une conférence de la Société de physique, s'éleva une dispute sur le bien-fondé d'un calcul fait par Slotnick sur l'interaction d'un électron avec un neutron, utilisant la théorie pseudo-scalaire avec couplage pseudo-vectoriel et aussi la théorie pseudo-scalaire avec couplage pseudo-scalaire. II avait trouvé que les réponses n'étaient pas les mêmes ; en fait, l'une des théories donnait un résultat toujours divergent, et l'autre un résultat toujours convergent. Mais certains pensaient que les deux théories devaient donner le même résultat. C'était une occasion rêvée pour vérifier mes hypothèses et voir si je comprenais vraiment ce qu'étaient ces deux couplages. Je rentrai chez moi et, pendant la soirée, j e calculai la diffusion électron-neutron pour les couplages pseudo-scalaire et pseudo-vectoriel. Je constatai que les résultats n'étaient pas les mêmes. et j e calculai en détail leur différence. L e lendemain, à la conférence, j'allai trouver Slotnick et lu1 dis : Slotnick, j'ai fait le calcul hier soir et je voudrais voir si ]'ai les mêmes résultats que vous. J'ai deux resultats d.flérents pour les deux cas, e t je voudrais être sOr de ma méthode. Hier soir, dites-vous 7 me répondit-il, mais il m'a fallu six mois ! " Et quand nous nous mîmes à comparer nos résultats, il regarda les miens et me demanda : " C'est quoi, au juste, cette variable Q dans vos formules 7 U'avais des expressions comme ArctgQlQ, etc.) - C'est la quantité de mouvement transférée par l'électron, qui dépend de son angle de déflexion, dis-je. - Oh, fit-il, moi j e n'ai que la valeur limite pour le cas où Q tend vers zéro, le cas de la diffusion vers l'avant 'I. II était facile de calculer ce que devenaient mes expressions pour Q nul et je retrouvai exactement ses résultats. Mais Il lui avait fallu six mois pour ne traiter que le cas du transfert de quantité de mouvement nul, alors qu'en une soirée. j'avais obtenu la réponse pour toutes les valeurs de ce transfert. Ce fut pour moi un moment de triomphe - comme celui ob j'ai reçu le prix Nobel - car j'en tirai la conviction, enfin, que j e possédais une méthode et une technique pour faire ce que personne ne savait faire. En ce moment de triomphe, j e compris que j'avais vraiment réussi à construire quelque chose de sérieux. A ce stade on me pressa de publier. Le bruit circulait que j'avais une façon commode de fake les calculs e t tout le monde voulait l'apprendre. Je fis donc cette publlcation bien qu'il lui manquSt deux choses. L'une n'était autre que la preuve, sous forme mathématique conventionnelle, de toutes mes affirmations. Pour beaucoup d'entre elles, j e ne savais pas les démontrer, même au sens des physiciens, à partir des règles e t des I'
238
Sources et évolution de la physique quantique
équations de l'électrodynamique quantique conventionneile. Mais je savais d'expérience, à force de jouer avec, que tout ça é t a i t équivalent à la théorie habituelle. J'avais des preuves partielles de plusieurs résultats, bien que je n'aie jamais pris la peine de m'asseoir tranquillement pour vérifier, comme l'avait f a i t Euclide pour la géométrle grecque, qu'on pouvait tout obtenir à partir d'un ensemble bien délimité d'axiomes. En conséquence, mon travail fut critiqué e t ma " méthode " fut baptisée " méthode intuitive " - sans que j e sache toujours si c'était péjoratif ou non. Pour ceux qui ne le saisiraient pas bien, cependant il me faut insister ici sur le travail considérable qui est nécessaire pour utiliser avec succès la " méthode intuitive Précisément parce qu'il n'y a pas de démonstration simple e t claire d'une formule ou d'une Idée, il faut procéder à une quantité énorme de vérifications et de revérifications de sa cohérence e t de la justesse par rapport ayx formules ou idées connues, en faisant des comparaisons avec d'autres exemples analogues, en prenant des cas limites, etc. Devant i'absence d'une démonstration mathématique directe, on doit être particulièrement prudent et consciencieux pour pouvoir avancer une affirmation, et l'on doit essayer sans relâche d'en démontrer le maximum. Néanmoins, on peut connaître bien plus de vrai qu'on peut en prouver.
".
II faut bien comprendre que tout au long de ce travail, j'utilisais l'électrodynamique conventionneile, avec des interactions retardées, e t non ma théorie avec des interactions mkretardées, mi-avancées correspondant à l'équation (1). Je n'utilisais i'équation (1) que pour me guider et m'aider à deviner les bonnes formules. Et l'une des formules que j e proposai était obtenue en remplacant 6 par une fonction f de largeur a', ce qui me permettait d'obtenir des résultats finis pour tous les problèmes. Ceci m'amène au second point qui manquait lorsque j e publiai mon papier, à une difficulté non résolue. En remplaçant 6 par f, les calculs fournissaient des résultats non " unitaires ", c'est-à-dire pour lesquels ia somme des probabilités de toutes les possibilités ne donnait pas l'unité. En pratique, la déviation par rapport à l'unité restait minime si a était très petit. Le processus de renormalisation pouvait être effectué : on calculait tout en fonction de la masse expérimentale. puis on prenait la limite où a tend vers zéro, et la dimculté apparente, la violation temporaire de i'unitarité, semblait disparaître. Je n'arrive pas à le démontrer, mais, de fait, Ca marche. II est heureux que je n'aie pas attendu d'avoir réglé ce point car, pour autant que Je sache, personne n'a encore réussi. L'expérience des théories meiques avec des couplages plus intenses, ou des théories à photons vectoriels plus fortement couplés, bien qu'elle ne démontre rien en toute rigueur, m'a convaincu que SIle couplage en électrodynamique était plus grand, ou que si vous alliez Jusqu'à un ordre plus élevé de la théorie des perturbations (autour du 137e ordre pour l'électrodynamique), cette difficulté persisterait à ia limite : le problème est grave. Autrement dit, j e crois qu'il n'y a pas encore une électrodynamique quantique vraiment satisfaisante - mais je n'en suis pas non plus certain. Et je pense que l'une des raisons de la lenteur relative de nos progr& dans la compréhension des interactions nucléaires fortes est l'absence de tout modèle théorique relativiste que l'on puisse résoudre complètement. Bien qu'il soit d'habitude affirmé que la difficulté des interactions fortes est celle des techniques de calculs applicables, Je crois piutot que ces interactions posent un problème sans solution et n'ont, en fait, pas de sens en théorie des champs : soit elles sont infinies, soit. si vous tentez de les modifier, elles violent i'unitarité. Je ne pense pas que nous ayons un seul modèle de théorie quantique relativiste qui soit Complètement satisfaisant - même un modèle en
De la mécanique quantique relativiste à la théorie quantique des champs
239
désaccord avec les faits, mais qui au moins serait compatible avec la condition logique que la somme des probabilités des alternatives donne 100%. Je pense donc que la théorie de la renormallsation est juste un moyen de masquer les difficultés dues aux divergences de l'électrodynamique quantique ; Ca revient à cacher la poussière sous le tapis. Mals Je peux me tromper.
(Im)moralités Ceci complète l'histoire du développement du point de vue spatio-temporel sur l'électrodynamique quantique. Je me demande si on peut en apprendre quoi que ce soit. J'en doute. II est particulièrement frappant de constater que la plupart des idées développées au cours de cette recherche n'ont pas été utilisées dans le résultat final. Par exemple, le potentiel mi-retardé mi-avancé n'a pas été utilisé, la forme (1) pour l'action non plus, l'idée que les charges n'agissent pas sur elles-mêmes a été abandonnée. La formulation de la mécanique quantique en termes d'intégrales de chemin f u t utile pour deviner les expressions finales e t pour formuler la théorie générale de l'électrodynamique, mais, à strictement parier, elle n'était pas nécessaire. La même remarque vaut pour l'idée du positon comme électron remontant le cours du temps : elle fut très commode, mais non absolument nécessaire pour la théorie, puisqu'elle équivaut exactement à l'idée de la mer d'énergie négative. L'existence d'un très grand nombre de points de vue physiquement différents, et de formulations mathématiquement différentes mais équivalentes les unes aux autres, est un fait marquant. La méthode ici utilisée, le raisonnement en termes physiques, peut donc paraitre hautement inefficace. A me repencher sur ce travail. j e ne peux qu'éprouver une sorte de regret pour l'énorme quantité de raisonnements physiques et de réexpressions mathématiques qui n'ont abouti qu'à reformuler ce qui était déjà connu - bien que sous une forme beaucoup plus efficace pour la solution de problèmes spécifiques. N'aurait41 pas été plus simple de travailler entièrement à l'intérieur du cadre mathématique formel, jusqu'à élaborer cette expression pius efficace ? Sans doute. mais il faut remarquer que, bien que le problème résolu en fait n'ait été finalement qu'une telle reformulation, le problème originellement affronté était celui, probablement encore non résolu. de l'élimination des divergences infinies dans la théorie usuelle. C'était donc une théorie nouvelle que je cherchais, et pas seulement une modification de la vieille. Bien que cette quéte n'ait pas abouti, il faut s'interroger sur la valeur des idées physiques pour le développernent d'une nouvelle théorie. Beaucoup d'idées différentes peuvent décrire la même réalité physique. Ainsi, I'électrodynamique classique peut être décrite en termes de champs o u bien d'adion à distance, etc. Initialement, Maxwell concevait l'espace comme rempli de sortes d'engrenages et Faraday y voyait des lignes de forces : mals les équations de Maxwell par elles-mêmes sont indépendantes de tout énoncé verbal qui en tente une descriptton physique. La vraie description physique n'est que celle donnant le sens expérimental des quantités physiques figurant dans les équations - ou mieux, la facon dont les équations sont utilisees pour représenter les observations. En conséquence, la meilleure méthode serait peut-être de deviner les équations et d'éliminer les modëles ou les descriptions physiques. Ainsi McCuliough put-Il imaginer les équations correctes pour la propagation de la lumière dans un cristal bien avant que ses collègues qui utilisaient un modèle élastique
Sources et évolution de la physique quantique
240
puissent y voir clair dans le phénomène. De meme, Dirac obtint son équation pour la description de l'électron à partir d'une proposition presque de pure mathématlque ; et une vision physique simple qui fournirait tout le contenu de cette équation nous manque aujourd'hui encore. Donc, deviner les équations pourrait être la meilleure méthode pour obtenir les lois de la physique encore inconnues. Pourtant ... Quand j'étais plus jeune, j'ai tenté ce jeu de devinettes e t j'ai vu beaucoup d'étudiants s'y essayer, mais il est très facile de s'égarer dans des directions complètement erronées et sans issue. Au fond, le problème n'est pas de trouver la meilleure méthode, ou la plus emcace, pour faire une découverte, mais bien de trouver une méthode. Et le raisonnement physique peut aider à imaginer comment passer du connu à l'inconnu. Les théories du connu qui sont décrites par des idées physiques différentes peuvent être équivalentes quant à leurs prédictions et sont donc scientifiquement Indiscernables. Cependant, psychologiquement, elles ne sont pas identiques, dès qu'il s'agit de quitter cette base pour aller vers l'inconnu. En effet, divers points de vue suggèrent différentes modifications possibles et ne sont donc pas équivalents quant aux hypotheses qu'ils suscitent lorsqu'on essaie de comprendre ce qui est encore incompris. Je crois donc qu'un bon théoricien de la physique aujourd'hui aurait avantage à disposer d'une large panoplie de points de vue physiques e t d'expressions mathématiques différentes pour la même théorie (par exemple, i'éiectrodynamique quantique). C'est peut-être exiger beaucoup d'un seul homme. Au moins, les étudiants devraient-ils alors remplir cette exigence à titre collectif. Si chaque étudiant suit la mode actuelle quant à la facon d'exprimer ou de penser l'électrodynamique ou la théorie des champs, alors la diversité des hypothèses qui surgiront pour expliquer, par exemple, les interactions fortes, restera limitée. Peut-être est-ce un bien, s'il est vrai que la vérité se trouve dans la direction aujourd'hui à la mode. Mais, dans le cas défavorable où elle se trouverait dans une autre direction - une direction qui serait évidente à partir d'un point de vue marginal qui la trouvera ? Seulement quelqu'un qui se sera sacrifié pour apprendre par lul-même l'électrodynamique quantique d'un point de vue particulier et Inhabituel, un point de vue qu'il aura peut-être dO inventer tout seul. Je dis I' sacrifié ", car selon toute vraisemblance, il n'en retirera rien, parce que la vérité peut se trouver dans une t o u t autre direction encore - et le cas échéant dans celle qui est à la mode. Mais si ma propre expérience peut servir de guide, le sacrifice n'est pas bien grand. C'est que, si ce point de vue particulier est équivalent au point de vue usuel dans le domaine du connu, il existe toujours. même dans ce domaine, une zone d'applications et de problemes pour lesquels le point de vue particulier fournit une puissance d'analyse e t une clarté de pensée specifiques, ce qui est deja de grande valeur. Sans compter que, à la recherche des lois nouvelles, vous pouvez alors ressentir cette exaltation psychologique : penser que personne avant vous, sans doute, n'avait imaginé cette folie possibilité que vous considérez maintenant. Qu'est-il donc advenu de la théorie dont j'étais tombé amoureux dans maleunesse ? Eh bien, je dlrai qu'elle est devenue une vieille dame, peut-être plus très attirante, et les jeunes gens au]ourd'hui ne sentiront plus battre leur cœur en la regardant. Mais je peux en faire le plus bel éloge que mérite une vleille dame : elle a été une très bonne mere, et a donné naissance a quelques très beaux enfants. Et j e remercie l'Académie suédoise des sciences pour avoir récompensé l'un d'eux.
-
Chapitre 5
Les grandes heures de la physique des particules 5.1 Le neutrino de Pauli Après la découverte de la radioactivité à la fin du siècle dernier, Rutherford entreprit l’étude des réactions produites par le bombardement de diverses cibles faites d’éléments différents par des particules alpha émises par des sources radioactives, surtout le polonium. Il découvrit ainsi l’émission de protons dans la réaction où la cible était l’azote. Nous écrivons aujourd’hui cette réaction de la manière suivante :
Ce fut la première réaction de transmutation de la matière - le rêve des alchimistes - l’azote se transformant en oxygène 17. En 1914, James Chadwick établit, en étudiant les électrons émis par les noyaux radioactifs, que ces électrons aMient UII spectre continu en énergie. A l’époque on imaginait que les noyaux de nombre atomique 2 et de nombre de masse A étaient constitués de A protons et de A - 2 électrons. Il était donc naturel de considérer les électrons bêta comme des électrons provenant du noyau. Dans les années 1920, une controverse surgit entre Otto Hahn et Lise Meitner à Hambourg d’une part, et Ellis et Chadwick à Cambridge, d’autre part. Suivant les premiers, les électrons bêta avaient une énergie définie par celles des noyaux initial et final, tandis que les physiciens anglais zdirmaient que les électrons émis avaient bel et bien une énergie qui variait d’une façon continue. Les faits ont donné raison à Chadwick et Ellis. il s’agissait donc de trouver une explication pour l’énergie manquante d’un électron qui sort d’un noyau radioactif avec une énergie inférieure à la différence entres les énergies du noyau initial et final. Niels Bohr proposa alors que dans ces réactions - et dans tous les phénomènes atomiques - la loi de conservation de l’énergie soit violée, et qu’elle ne soit valide que statistiquement, c’est-à-dire en valeur moyenne. La solution du problème fut finalement trouvée par Pauli : dans une lettre en date du 4 décembre 1930, &essée aux physiciens réunis à Tübingen59 Pauli
...
59 Liebe mdioaktive Damen und Hewn : A savoir, il ut possible qu’eziste dans les noyaw: d u partinilea électriquement ncutns, que j e vaw appeler neutrons, qui ont un spin 1/2 e t obéisrnt au principe d’aclwion maw qui se distinguent des quanta de lumitn puwqu’ elles ne se propagent w à la vitesse de la lumihr. La masse du neutron d m i t itn du même o r d n de gmndcur que celle de l’électron, et e n t o w c w non supérieun à 0 O1 de la mwsc du d o n . Le spectre @ continu deviendmat alors compréhensible s o w llhypothèse que, lors %e la désintégration p, un neutron ut émw de aunroît, de telle sorte que la somme des énergies de l’électron et du neutron soit constonte !
242
Sources et évolution de la physique quantique
avança l’idée que dans une transition radioactive un noyau se transforme en un autre et émette un électron accompagné d’une particule neutre possédant une masse n’excédant pas 1/10Oe de la masse du proton. Cette nouvelle particule fut appelée neutrino par Enrico Fermi qui élabora la théorie de la désintégration p des noyaux radioactifs.
5.2 Le neutron En 1928, les physiciens allemands Walter Bothe et H. Becker décidèrent d’observer les désintégrations de certains éléments antérieurement détectés par Rutherford en les bombardant avec des particules alpha émises par le polonium. Ils trouvèrent que le bombardement du béryllium produisait une radiation pénétrante qu’ils interprétèrent comme étant des rayons gamma. Ces travaux furent répétés deux ans plus tard par Frédéric Joliot et Irène Curie, qui possédaient une puissante source de particules alpha et qui trouvèrent que cette radiation pénétrante était capable d’expulser des protons de la paraffine. Tandis que Joliot et Curie attribuaient cette réaction à une collision de rayons gamma de haute énergie avec les noyaux de la p a r a e - un improbable effet Compton incompatible théoriquement avec le taux de la réaction observée - James Chadwick conclut, lui, que l’émission de protons par la paraffine était due à la collision de ses noyaux avec des particules neutres ayant une masse approximativement égale à celle du proton et qui devaient constituer la radiation pénétrante émise dans la réaction de Bothe et Becker“. Chadwick était mentalement préparé à faire cette découverte : depuis 1920 il cherchait une particule neutre qui avait été annoncée par Rutherford lors d’une conférence à la Royal Society - une Baker Lecture - où ce dernier avançait l’hypothèse suivant laquelle l’électron de l’atome d’hydrogène finirait par tomber (sans obéir aux postulats de Bohr) dans le noyau, le proton, donnant ainsi lieu à une nouvelle particule, électriquement neutre. Chadwick l’appela neutron - avec une masse de l’ordre de grandeur de celle du proton. Or le neutron a un spin 1/2, tandis que la spéculation de Rutherford conduirait à une particule de spin O ou 1, à moins qu’un neutrino de Pauli ne fût émis lors du collapse électron-proton imaginé par Rutherford. Ce fut après cette découverte que Fermi baptisa neutrino le neutron de Pauli. La découverte du neutron en 1932 conduisit à la solution du paradoxe du spin et de la statistique des noyaux : si ceux-ci étaient constitués de A protons et de A - 2 électrons, ils auraient un spin qui ne serait pas en accord avec celui trouvé expérimentalement. Si, par exemple, le deuton, noyau du deutérium (A = 2, 2 = 1) ou hydrogène lourd, était formé de deux protons et d’un électron, son spin serait soit 1/2 soit 3/2, alors qu’on le trouve expérimentalement égal à 1. De Dans la collision d’une particule A avec une particule B au repos, il y a transfert d’énergie cinétique de A à B. si m. = mb et si 1 angle de déviation de A par rapport à la direction d’incidence dans le système du laboratoire est égd à $, après le choc, la particule B s’en va dans la direction d’incidence et la particule A reste au repos dans ce même système du laboratoire : c’est le cas du transfert maximum, c’est celui du neutron éjectant le proton de la paraffine.
Les grandes heures de la physique des particules
243
plus, le moment magnétique d‘un électron est 1836 fois supérieur à celui du proton : et pourtant, le moment magnétique des’noyaux ne reçoit aucune contribution du moment magnétique des électrons. La solution provint du modèle proposé en 1932 par D. Ivanenko en U.R.S.S., W.Heisenberg en Allemagne et par Ettore Majorana en Italie : un noyau de nombre atomique 2 et de nombre de masse A est constitué de Z protons et de A - 2 neutrons. La théorie que Fermi proposa en 1934 pour la radioactivité bêta postula une nouvelle interaction qui s’exercerait sur le neutron et le transfomerait en proton, avec émission simultanée d’un électron et d’un neutrino de Pauli (ou plutôt d’un antineutrino) : n+p+e+K où y; est l’antineutrino. /
’e
/
Cette interaction de Fermi agit sur un neutron de façon similaire à la force électromagnétique agissant sur un électron et lui faisant émettre un rayon gamma : la paire (e,%) créée dans la transition neutron --+ proton est l’analogue du photon 7 créé dans la transition entre deux états d’un électron dans l’atome (figure cidessus).
5.3 Le champ de mésons de Yukawa Lorsqu’il devint clair que les noyaux devaient être constitués de protons et de neutrons, se posa immédiatement le problème de savoir quelles forces devaient agir entre ces particules, quelle était la nature des forces nucléaires. Car les protons, tous de charge électrique positive, se repoussent normalement. Pour qu’ils restent liés dans les noyaux atomiques, il doit exister une force d’attraction protonproton qui soit plus forte que la répulsion coulombienne à petites distances, c’està-dire h des distances de l’ordre des dimensions nucléaires, lO-”cm. Une telle force d’attraction doit également agir entre un proton et un neutron, et entre les neutrons. L’étude des collisions entre protons et entre neutrons (produits par exemple dans la réaction : particule alpha béryllium) et protons, conduisit dans les années 1930 à la notion de forces nucléaires indépendantes de la charge : les forces proton-proton, proton-neutron, neutron-neutron, mises en jeu dans des étots c o n spondanls du noyau, devraient toutes avoir la même intensité. Ces travaux furent
+
244
Sources et évolution de la physique quantique
surtout dus aux physiciens américains M. Tuve, N. Heydenburg et L. Hafstadt, ainsi qu’à G. Breit, E. Condon, R. Present, B. Cassen, et J. Bartlett ; alors qu’une analyse phénoménologique était entreprise à la même époque par W. Heisenberg, E. P. Wigner et E. Majorana. En 1935, Hideki Yukawa, physicien japonais, eut l’idée d’attribuer les forces nucléaires à l’existence d‘un nouveau champ de forces créé par les protons et les neutrons qui serait responsable des forces nucléaires, de la même façon que les interactions entre particules chargées électriquement sont dues au champ électromagnétique‘”. Le champ de Yukawa, s’il est représenté par une fonction scalaire @(z), obéit à l’équation : (0+ 127 = P ( Z ) où p(z) est la densité de nucléons (les protons et les neutrons), qui a pour fonction de Green,dans le cas statique :
(7’- p2)Y(z,z’)= -g63(z
- z‘).
Et cette fonction a la forme : e-”’ Y($, f 2 ) = -9-
47rr
’
r = I s ( - z-7
I.
C’est le potentiel d’attraction entre deux nucléons à une distance r. La portée de l’attraction - la distance à laquelle le potentiel décroît de l / e - est égale à l/p. Si on égale la portée aux dimensions nucléaires, cm, on obtient : m, Ei 200m, puisque 1 / p = h/m,c. m, est la masse du quantum du champ de Yukawa. Ce fut une idée révolutionnaire, car elle postulait pour la première fois l’existence d’un nouveau champ de forces, en plus de la gravitation et du champ électromagnétique. La suggestion de Yukawa allait à l’encontre d’un préjugé des physiciens qui, en général, étaient opposés à l’idée de l’existence de nouvelles particules (on se souvient que Dirac voulait identifier les électrons à énergie négative avec les protons ; et que Pauli ne publia pas sa suggestion du neutrino). D’après Y. Tanikawa”’, Niels Bohr, lors d’un voyage au Japon à cette époque, critiqua Yukawa pour avoir proposé l’idée du méson (particule de masse intermédiaire entre celles de l’électron et du proton). En 1937, Carl D. Anderson et Seth Neddermeyer trouvèrent dans les rayons cosmiques des particules avec une masse de l’ordre de 200 me. La théorie fut alors prise au sérieux, et on identifia ces Particules (mésotrons, mésons) aux particules de Yukawa. Cette identification s’avéra erronée : elle fut corrigée en 1947 lors de la découverte cette année-là de deux espèces de particules à masse intermédiaire entre celle de l’électron et celle du proton. Ce fut en &et en 1947, que César Lattes, ‘lo 61b
H. Yukawa, Pmc. of Phys ;Math. Soc. of Japan 17,48 (1935) [Article XVII]. Y. Tanikawa, dans Yukawa, H. Scientific Works, Tokyo, Iwanami Shoten (1979).
Les grandes heures de la physique des particules
245
G. Muirhead, G. Occhialini et C. Powell mirent en évidence, à l’aide d’émulsions placées’au sommet du Chacaltaya (La Paz, Bolivie) le méson R, le méson de Yukawa, l’agent des forces nucléaires. Il était différent de la particule p, plus légère, qui, insensible aux forces nucléaires, provient essentiellement de la désintégration du méson x au cours de laquelle est également protiuit un neutrino d‘un nouveau type. (Le muon est non pas un méson, car il possède un spin demi-entier, mais un lepton, comme l’électron). Un grand nombre de physiciens théoriciens travaillèrent alors au développement de la théorie du champ mésonique. Parmi eux : H. FrOhlich, Walter Heitler, Nicola Kemmer, Homi 3. Bhabba, W. Pauli, S. Kusaka, S. M. Dancoff, Gregor Wentzel, Lamek Hulthén, J. Robert Oppenheimer, F. Carlsen, C. Mdler, Leon Rosenfeld, Julian Schwinger, Josef Maria Jauch, Hans Albrecht Bethe, Robert Marshak et Victor Weisskopf, entre autres.
Article XVII
La prédiction du méson De l'interaction des particules élémentaires
HIDEKIYUKAWA Proceedings o f Physical Mathematical Society o f Japan 17,48-57
(1935)
(reçu le 30 Novembre 1934) [traduit par B. Escoubès]
1. I n t r o d u c t i o n Dans l'état actuel de la théorie quantique, l'on connaît peu de choses au sujet de la nature de l'interaction des particules élémentaires. Heisenberg considérait que l'interaction du type *' Platmechsel " (échange de places) entre le neutron et le proton jouait un rôle important pour ia structure nucléaire'. Recemment, Fermi traita le problème de la désintégration @ à l'aide de l'hypothèse du '' neutrino "'. Suivant cette théorie, le neutron e t le proton interagissent en émettant et en absorbant une paire neutrino-électron. Malheureusement, l'énergie d'interaction calculée à partir de cette hypothèse est beaucoup trop petite pour rendre compte de l'énergie de liaison des neutrons e t des protons dans le noyau3. Pour éliminer ce défaut, il paraît naturel de modifier la théorie de Heisenberg et de Fermi de la manière suivante. L a transition d'une particule lourde d'un état de neutron à un état de proton n'est pas toujours accompagnée de l'émission de particules légères, c'est-%dire d'un électron et d'un neutrino, mais l'énergie libérée par cette transition est parfois absorbée par une autre particule lourde, qui à son tour sera transformée d'un é t a t proton en un état neutron. Si la probabilité que se produise ce deuxième processus est beaucoup plus grande que l a probabilité du premier. l'interaction entre le neutron e t le proton sera beaucoup plus grande que dans le cas de Fermi, alors que la probabilité d'émission de particules légères ne sera pratiquement pas affectée. Mais ce genre d'interaction entre des particules élémentaires peut être décrite à l'aide d'un champ de force, de la même manière que l'interaction entre des particules chargées se décrit à l'aide du champ électromagnétique. Les considérations qui précèdent
'
W. Heisenberg, Zeit. f. Phys.. 77, 1 (1932) ; 78, 156 (1932) ; 80, 587 (1933). Nous noterons le premier de ces articles I.
'
E. Fermi, ibid, 88,161 (1934).
lg. Tamm. Nature 133. 981 (1934) ; D. Iwanenko, ibid. 981 (1934).
Les grandes heures de la physique des particules
247
montrent que l'interaction de particules lourdes avec ce champ est beaucoup plus grande que l'interaction de particules légères. En théorie quantique, ce champ devrait Stre accompagné par une nouvelle sorte de quantum, comme le champ électromagnétique est accompagné par le photon. Dans cet article, on discutera brièvement de la nature possible de ce champ et du quantum qui l'accompagne et on examinera leur impact sur la structure nucléaire. A côté de ce type de force d'échange e t des forces électrique e t magnétique ordinaires peuvent exister d'autres forces entre les particules élémentaires, mais nous Ignorerons ces dernières pour l'instant. Nous en tiendrons mieux compte dans un prochain article.
2. Champ décrivant l'interaction De manière analogue au potentiel scalaire du champ électromagnétique, on introduit une fonction y, z , t ) pour décrire le champ entre le neutron et l e proton. C e t t e fonction satisfera une équation semblable à l'équation d'onde pour le potentiel électromagnétique. Or l'équation
u(z,
{*-;+=O n'a qu'une solution statique à symétrie Centrale i/r. mis à part des constantes additives e t multiplicatives. L e potentiel de la force entre le neutron e t le proton ne devrait pas, néanmoins, être du type de Coulomb, mais devrait décroître plus rapidement avec la distance. II pourrait s'exprimer, par exemple, paf
+
ou
-g
e-xr
OU g est une constante qui a les dimensions de l a charge électrique. c'est-à-dire c m f 5 - l g r i e t a la dimension cm-'. Puisque cette fonction est une solution statique à symétrie centrale de l'équation d'onde
u
supposons que cette équation soit l'équation correcte pour dans le vide. En présence interagit avec elles et cause la transition de l'état de particules lourdes, l e Champ neutron à l'état proton. Introduisons maintenant les matrices'
u
'
Heisenberg, loc. cit 1.
Sources et évolution de la physique quantique
248
e t désignons l'état neutron e t l ' é t a t proton par r 3
= 1
et r3
= -1
respectivement ;
l'équation d'onde est alors donnée par
où 11, désigne la fonction d'onde des particules lourdes, i/I étant une fonction du temps, de l a position, du spin ainsi que de r3, qui prend les valeurs +1 ou -1. Ensuite, Introduisons la fonction complexe conjuguée ÜIz, y, z , t ) satisfaisant l'équation
Elle correspond à la transition inverse de l'état protorr à l'état neutron. Une équation semblable est valable pour l a fonction vectorielle, qui est l'analogue du potentiel vecteur du champ électromagnétique. Nous ne la mentionnerons cependant pas pour l'instant, car il n'existe pas de théorie relativiste correcte pour les particules lourdes. Nous utiliserons donc pour les particules lourdes une équation d'onde nonrelativiste simple, en négligeant le spin, de la forme suivante :
- - irz (u-2 +.-)I TI
-9
ri
+2 ir2
11, = O,
(6)
h est la constante de Planck divisée par 2n , A l n e t M p étant respectivement les masses du neutron et du proton. Nous indiquerons plus loin pour quelle raison nous avons pris le signe - devant 9. L'équation (6) corrrespond à I'hamiltonien
où
H=
où
(*4Mn + 3) 1 4MP
p2+-Mnc2 +73
2
1 - 73
Mpcz +2
p est le moment de la particule. si nous posons Mnc2 - hfpc2 = I) e t A&,
2M, l'équation
+ Alp
=
( 7 ) devient approximativement
où nous avons omis ie terme constant M c Z .
* Nous avons noté, suivant l'usage, A ce que Yukawa notait h dans son article original (NdT).
Les grandes heures de la physique des particules
249
Considérons à présent deux particules lourdes aux points respectifs (zl, yl, zl) et et supposons petite leur vitesse relative. Les champs en (21, y’, zl)dus à la particule en (52, yz, 2 2 ) grâce à (4) e t (51,
( 5 2 , 212, 2 2 )
où
(Ti”,
Ti’), (Ti”)
et
(Ti’),
T i 2 ’ , (T$”’>
sont les matrices se référant respectivement
à la première et à la seconde particule, e t r12 est la distance entre elles.
Donc l’hamiltonien pour le système est donné, en l’absence de champs extérieurs, par
OD p1 et p2 sont les moments des particules. Cet hamiltonien est équivalent à I’hamiltonien (1) de Heisenberg‘. si nous prenons comme ” intégrale de Platzwechsel *’ (intégrale de l’échange de places)
mis à part le fait de n’avoir pas pris en compte l’Interaction entre les neutrons ni la répulsion électrostatique entre les protons. Heisenberg a pris le signe positif pour J ( r ) . de sorte que le spin de l’état de plus basse énergie de H Z était O. alors que dans notre cas, grâce au signe négatif devant g 2 , l’état de plus basse énergie a le spin 1. ce qu’exige
l’expérience. qui apparaissent dans les équations ci-dessus doivent être Les constantes g et déterminées par comparaison avec l’expérience. Par exemple, si l’on utilise I’hamiltonien (10) pour les particules lourdes, on peut calculer le défaut de masse de H 2 e t la probabilité de diffusion d’un neutron par un proton, pourvu que leur vitesse relative soit petite par rapport à la vitesse de la lumière‘. Une première estimation montre que tes valeurs calculées sont en accord avec les résultats expérimentaux si nous prenons pour X une valeur comprise entre io+’’ cm-’ et cm-’ et pour g plusieursfois la valeur de la chargeélémentaire e, les considérations ci-dessus n’impliquant néanmoins aucune relation directe entre g e t e. 1. ‘ Heisenberg, Ces calculs avaient déjà été faits, suivant la théorie de Heisenberg, par M.Tomonaga
à qui l’auteur doit beaucoup. Une petite modification est nécessaire dans notre cas. Des calculs détaillés seront faits dans un prochain article.
Sources et évolution de la physique quantique
250
3.
N a t u r e des quanta accompagnant le champ
u
L e champ considéré ci-dessus doit être quantifié suivant la méthode générale de la théorie quantique. Puisque le neutron et le proton suivent tous les deux la statistique de Fermi, les quanta accompagnant le champ doivent suivre la statistique de Bose et la quantification peut s'effectuer de manière semblable à celle du champ électromagnétique. L a lo1 de conservation de la charge électrique exige que le quantum ait la charge +e ou -e. La quantité de champ correspond à l'opérateur qui augmente le nombre de quanta chargés négativement e t abaisse le nombre de quanta chargés positivement d'une unité respectivement. le complexe conjugué de correspond à l'opérateur inverse. Si nous notons
u
u
u,
u,
p z = -ih-
a
etc.
al
a
,
IV = ifi-,
at
mUc = AL, alors l'équation d'onde pour
u dans l'espace libre peut s'écrire
sous la forme
{ de sorte que le quantum accompagnant le champ a une masse propre
Ah mu = -.
Sup-
C
posant que 1 = 5 x 10"cm-', nous obtenons pour mu une valeur 2 x 10' fois plus grande que la masse de l'électron. Comme un quantum de grande masse e t de charge positive ou négative n'a jamais été trouvé expérimentalement, la théorie ci-dessus semble mal engagée. Nous pouvons montrer, cependant, que lors d'une transformation nucléaire ordinaire, un tel quantum peut ne pas être émis dans l'espace extérieur. Considérons, par exemple, la transition d'un état neutron d'énergie WN à un état proton d'énergie w p , les deux énergies propres étant incluses. s'exprimer grâce aux fonctions d'onde + N ( z , y, z ,
t , 1) = ~
( 5y,,
z)ëiWNt/',
q N ( 5 , y,
Ces états peuvent
E,
t , -1) = O
et $ p ( z , y, z , t ,
+ p ( z , y, z ,
i) = O,
t , -1) = u ( z , y,
z)e-i"'p'/*,
de sorte que. dans le membre droit de l'équation (4). apparaît le terme -4Tg,jUe-it(WN-W~)/h Posant
ob w =
W N
U = U 1 ( z ,y, z)eiw*,(4)
- W P . En intégrant, ti
nous donne
nous obtenons une solution
251
Les grandes heures de la physique des particules
laI ou mGc2 > ( i v -~I v p l , p >-
Si
est réel e t la fonction J ( r ) de Heisenberg
C
e-~r
a la forme -g2-.
dans laquelle p , cependant, dépend de
l r V ~- IVpl, e t devient de
plus en plus petit à mesure que cette quantité s'approche de muc2. Ceci signifie que la portée de l'interaction entre un neutron e t un proton croit lorsque IIVN lvpl croît. Or la diffusion (élastique ou iné1astique)'d'un neutron par un noyau peut être considérée comme le résultat du double processus suivant : le neutron tombe sur un niveau de proton dans le noyau et le proton saute ensuite 3 un état de neutron d'énergie positive, I'energie totale étant conservée dans le processus. L'argument ci-dessus montre alors que l a probabilité de diffusion peut parfois croître avec la vitesse du neutron. Suivant l'expérience de Bonner', la section efficace de collision du neutron croit, de fait, avec la vitesse dans le cas du plomb alors qu'elle décroit dans le cas du carbone et de l'hydrogène, le taux de décroissance étant plus faible dans le premier que dans le second cas. L'origine de cet effet n'est pas claire, mais les considérations ci-dessus, au moins, ne le contredisent pas, En effet, si l'énergie de liaison du proton dans le noyau devient comparable à mr;c2, la portée de l'interaction du neutron avec le proton croÏtra considérablement avec la vitesse du neutron, alors que la section efficace,décroitra lentement dans des cas comme celui de l'hydrogène, c'est-à-dire du proton libre. Quant a l'énergie de liaison du proton dans C12, que l'on estime à partir de la différence des masses du C12 et du B l l , elle est
-
12,0036- 11,0110 = 0,9936 Ceci correspond à une énergie de liaison de 0,0152 en unité de masse, soit trente fois la masse de l'électron. Donc, dans l e cas du carbone, nous pouvons nous attendre 3 l'effet observé par Bonner. Ces arguments ne sont donnés qu'à titre d'essai ; d'autres explications ne sont naturellement pas à exclure. Si à présent
Iw I ou mut' < Irv,v - rvpI, p
devient purement imaginaire et
u représente une onde sphérique non amortie, ce qui implique qu'un quantum d'énergie supérieure à mut' peut être émis dans l'espace extérieur par la transition de la partlcule
lourde de l'état neutron à l'état proton, 3 condition que IWN- IVpl > muc2. La vitesse de l'onde de u est plus grande, mals la vitesse de groupe est plus p e t i t e que la vitesse de l a lumière c comme dans le cas de l'onde de l'électron. La raison pour laquelle de tels quanta massifs. s'ils existent, n'ont pas été encore découverts est peut-etre due au fait que la masse mu est si grande que la condition ~IVN W p l > muc2 n'est pas remplie dans les transformations nuclëaires ordinaires.
-
4. Théorie de la désintégration
p
u
Jusqu'lci, nous n'avons considéré que les interactions des quanta avec les particules lourdes. Mais, suivant notre théorie, le quantum émis lorsqu'une particule lourde saute d'un état neutron à un état proton peut être absorbe par une partlcule légère qui, par suite de l'énergie absorbée passera d'un état neutrino d'énergie négative à un état d'électron
'
T.W. Bonner. Phys. Rev. 45, 606 (1934).
Sources et évolution de la physique quantique
252
d’énergie positive. Ainsi un anti-neutrino e t un électron Sont émis simultanément du noyau. Cette intervention du quantum massif ne modifie pas essentiellement la probabilité de la désintégration p. qui a é t é calculée en supposant Un couplage direct d’une particule lourde e t d’une particule légère, de la même manière que, dans la théorie de la conversion Notre interne d’un rayon 7,l’intervention du proton n’affecte pas le résultat final’. théorie, par conséquent, ne dimre pas de manière appréciable de la théorie de Fermi. Fermi considéra qu’Un électron et un neutrino sont émis simultanément du noyau radioactif, mais ceci est formellement équivalent à l‘hypothèse d’une particule légère sautant d’un état neutrino d’énergie négative à un é t a t d’électron d’énergie positive. En effet, si les fonctions propres de î‘éiectron e t du neutrino sont +k et y k , respectivement, où k = 1, 2, 3, 4, un terme de la forme 4
6kVk
4x9’
k=i doit être ajouté au membre droit de l’équation (5) pour Ü, où g‘ est une nouvelle constante ayant la mme dimension que g. Or les fonctions propres de l’état neutrino possédant une énergie e t un moment opposés à ceux de i’état q k sont données par y; = -5i,+c e t réciproquement pk = -6&, où
/O
-1
O
O\
Ainsi (15) devient
Des équations (13) e t (15) on Obtient. pour l’élément de matrice de l’énergie d’interaction de la particule lourde e t de la particule iégère une expression
qui correspond au double processus suivant : une particule lourde tombe de l’état neutron avec la fonction propre u ( r ) dans I’etat proton avec la fonction propre u(r) e t Simultanément une particule legère saute de l ’ é t a t neutrino yk(r) d’énergie négative a l’état d’électron $k(r) d’énergie Positive. Dans (17). on a pris au lieu de p , puisque l a diflérence des énergies de l’état neutron et de l’état proton, qui est égale à la somme de la limite supérieure du spectre d’energie des rayons p et de l‘énergie propre de l’électron e t du neutrino, est toujours petite comparée à mye'. Comme est beaucoup plus grand que le nombre d’onde de l ’ é t a t électron et de e-.hz
l’état neutrino, la fonction
peut en bonne approximation r12
ëtre prise pour une
H.A. Taylor e t N.F. Mott, Proc. Roy. Soc. A 138,6 6 5 (1932).
Les grandes heures de la physique des particules
fonction 6 multipliée par
253
4a
- en ce qui concerne les intégrations par rapport à 22, yz, z2. A2
L e facteur
4x provient de A2
Donc (17) devient
k
ou, à l'aide de (16)
qui est la même que l'expression (21) de Fermi, celle qui correspond à l'émission d'un neutrino e t d'un électron d'énergie positive +;(r) e t +t(r), excepté le fait que le facteur
4*99< est substitué par le facteur g de Fermi. A2
Donc, dans cette approximation, le résultat est le même que celui de la théorie de Fermi, pourvu que nous prenions
résultat à partir duquel la constante g' peut être déterminée. ' ~g = 2x10-9,.nous obtenons g' z 4x10-", En prenant par exemple A = 5 ~ 1 0 et qui est environ io-' fois plus petite que g. Cela signifie que l'interaction entre le neutrino e t l'électron est beaucoup plus petite qu'entre le neutron e t le proton, de sorte que le neutrino sera beaucoup plus pénétrant que le neutron et par conséquent beaucoup plus difficile à observer. La différence entre g e t g' peut ëtre due à la différence des masses des particules lourdes et légères.
5. Résumé Les interactions des particules élémentaires sont décrites en considérant un hypothétique quantum possédant la charge élémentaire et une masse propre et obéissant à la statistique de Bose. L'interaction de ce quantum avec la particule lourde doit être beaucoup plus grande que l'interaction avec la particule légère, de manière à rendre compte de la grande interaction entre le neutron et le proton, aussi bien que de la petlte probabilité de désintégration Ces quanta, s'ils existent et s'approchent suffisamment pres de la matière pour être absorbés, cèderont leur charge e t leur énergie à cette dernière. Si. alors, les quanta de charge négative apparaissaient en excès, la matière se chargerait à un potentiel négatif.
8.
254
Sources et évolution de la physique quantique
Ces arguments, bien évidemment de caractère purement spéculatif, sont en accord avec l'opinion que les particules de grande vitesse des rayons cosmiques sont engendrées par le champ électrostatique de la terre, qui est chargé à un potentiel négatif'. Les quanta massifs peuvent aussi avoir quelque Impact sur les gerbes produites par les rayons cosmiques. En conclusion, l'auteur tient à exprimer ses chaleureux remerciements au Dr. Y. Nishina et au Pr. S. Klkuchl pour leurs encouragements durant le cours de ce travail.
Département de Physique Université Impériale d'Osaka
G.H. Huxley, Nature, 134.418, 571 (1934) ; Johnson, Phys. Rev. 4 5 , 5 0 9 (1934).
Les grandes heures de la physique des particules
255
5.4 Les accélérateurs et les détecteurs
de particules Simultanément à la découverte du positon et du mésotron dans les rayons cosmiques et à celle du neutron au laboratoire, et parallèlement à l’annonce de l’existence du neutrino par Pauli, d’importants développements concernant la physique nucléaire expérimentale eurent lieu au début des années 1930. En 1930,Ernest O.Lawrence et Stanley Livingstone inventèrent le cyclotron, une machine capable d’accélérer des ions en leur faisant parcourir des trajectoires en spirale avant de les éjecter en faisceaux d’énergie bien définie : les p a r t i d e s ainsi accélérées étaient utilisées pour bombarder des noyaux cibles et provoquer des réactions nucléaires. Les projectiles accélérés étaient des protons, des particules alpha et d’autres ions : ces faisceaux, à la fois plus intenses et plus énergiques, allaient remplacer les particules alpha émises par le polonium, les sources les plus employées jusqu’alors. En 1932, John Codrroft et Ernst Walton construisirent le premier accélérateur électrostatique. Successivement furent inventées de nouvelle3 machines destinéea à accélérer des protons, des ions et des électrons : le générateur de R Vaa de GraafT, le bétatron de Donald Kerst, le synchro-cyclotron de 4.7Q m de Mac Millan à Berkeley, le bévatron à Brookhaven, llaccélérateur linéaire de Stanford et celui d’Orsay, et finalement les accélérateurs du CERN (Centre Européen de Recherches Nucléaires) à Genève, du Fermi National Laboratory à Batavia (près de Chicago), de Serpubrhov, en URSS. La construction, entreprise en 1990 au Texas, du SSC (Superconducting Super Collider) destiné à élever l’énergie dans le centre de masse de la collision à 20 20 TeV (Tera électron-Volt, c’est-à-dire miXe milliards d’électron-Volts), a brutalement été stoppée en novembre 1993, sur décision du Sénat des Etats-Unis. Cet abandon, joint à celui de l’anneau de collisions russe UNK en 1990, pourrait bien marquer la fin d’une course presque ininterrompue depuis les années 30 vers des énergies de plus en plus hautes. Le LHC (Large Hadron Collider), un collisionneur de 8 8 TeV qui utiliserait le tunnel du LEP (Large Electron Positron) à Genève, devrait voir son sort décidé dam le courant 1994. Quelle que soit la décision prise, il restera toujours aux physiciens des hautes énergies l’ouverture vers l’astrophysique, où la détection des grandes gerbes cosmiques permettra d‘observer des évènements certes rares et aléatoires, mais dont les énergies peuvent atteindre jusqu’à 1021 eV. Les appareils qui permettent d’identifier et éventuellement de découvrir les particulea produites dans les réactions provoquées par les accélérateurs sont aussi importants que les accélérateurs eux-mêmes. C’est grâce aux détecteurs que l’on peut mesurer les paramètres caractérisant les p a r t i d e s qui les atteignent, comme leur énergie et leur quantité de mouvement, voire leur masse et leur charge électrique. Peut-être devons-nous citer, parmi les plus anciens détecteurs, l’électroscope à feuilles d’or utilisé par Jean Perrin pour étudier la charge des électrons qui constituent les rayons cathodiques ; la d u l e photo-électrique, qui servit à détecter les photons de basses énergies ; les tubes Geiger-Müller, qui permettaient de compter les particules ionisantes. Les chambres d’ionisation, la chambre de Wilson permettent de voir la trace laissée par les particules chargées : les ions formés par le passage de ces particules attirent des molécules de vapeur d’eau qui se condensent
+
+
Sources et évolution de la physique quantique
256
et rendent visible lorsqu’on les illumine le parcours des particules. Les chambres de Wilson sont des détecteurs à traces. Elles furent suivies par les chambres à bulles, les émulsions photographiques et les chambres à étincelles. Actuellement, on utilise les chambres développées par Georges Charpak, les chambres proportionnelles multifils, pour déterminer la trajectoire des particules chargées, et les calorimètres pour mesuer l’énergie aussi bien des hadrons (neutres ou chargés) que des électrons et des gammas“. Tous ces développements techniques n’ont été possibles que grâce à une nouvelle organisation de la recherche scientifique, en créant des institutions et des laboratoires d’échelle jusqu’ici inconnues dans l’histoire des sciences. Nous déuirons brièvement en Appendice quatre exemples de ces développements, ceux qui eurent lieu aux Etats-Unis, au Brésil, au Japon et en France et qui permirent à la physique nucléaire, puis à celle des particules d’obtenir les résultats que nous exposerons maintenant.
5.5
La découverte des mésons : la désintégration des pions et des muons
Après la Deuxième Guerre mondiale, en 1947,deux séries d’observations expérimentdes marquèrent la naissance de la physique des particules élémentaires et sa séparation de la physique nucléaire. L’expérience de M. Conversi, E. Pancini et O. Piccionis3 en Italie mit en évidence que l’interaction des mésons observés par Anderson et Nedermeyer dans le rayonnement cosmique au niveau de la mer est beaucoup plus faible que celle que les mésons de Yukawa étaient supposés avoir avec les nucléons. Ce résultat suggéra à Robert Marshak et Hans A. Bethe“ l’idée de l’existence, dans les rayons cosmiques, de deux espèces de mésons, les uns interagissant par une interaction forte, les autres interagissant par une interaction environ io1* fois plus faible, avec la matière nucléaire6’. A peu près à la même époque, des chercheurs, à Bristol, le Brésilien César M. G. Lattes, l’Italien Giuseppe. Occhialini et l’Anglais Cecil utilisèrent la technique des émulsions nucléaires - développée dans leur laboratoire avec la collaboration de H. Muirhead et du Français Pierre Cüer - pour la détection des traces de particules chargées : ils découvrirent ainsi, dans des émulsions exposées au Laboratoire de Chacaltaya, à La Paz, en Bolivie, à 5 000 m d’altitude, des traces de mésons, possédant une masse 62 Pour une vue d’ensemble des accélérateurs et des dédecteurs, on peut se reporter à la dernière édition de ReMew of Parficles Properties, Phys. Rev., D 45, Part II (1992), pourvue de nombreuses références.
63
M. Conversi, E. Pancini et O. Piccioni, Phys. Reu. 71,209 (1947).
64
R. Marshak et H.A. Bethe, Phys.
Reu. 72,506 (1947).
‘‘ E. Fermi, E. Teller et V. F. Weisskopf, Phys. Rcu. 71, 314 (1947). 66
C.M.G. Lattes, G.P.S. Occhialini et C.F. Powell, Nature, 160,453, 486 (1947).
Les grandes heures de la physique des particules
257
de l'ordre de 212 me ; ces particules, les muons, provenaient de la désintégration, après ralentissement, des piolu positifs : T+ --+
p+ +PO
Les pions négatifs, pas contre, étaient capturés lors de leur ralentissement par les noyaux de l'émulsion, et donnaient lieu à une explosion nucléaire : T-
+ noyau -+ explosion nucléaire
En effet la masse d'un pion au repos étant de l'ordre de 140 MeV, cette énergie est absorbée par le noyau et produit une étoile nucléaire. Quant à la particule neutre p o qui accompagne le méson p+, on montra plus tard (Léon Lederman, Melvin Schwartz, Jadc Steinberger en 1962) qu'il s'agit en réalité d'un nouveau type de neutrino, le neutrino muonique v,, distinct du neutrino de Pauli, le neutrino électronique Y, : quand les Y, bombardent des neutrons au repos, ils produisent des protons et des p - , alors que les Y, produisent des protons et des électrons. La désintégration du pion au repos en deux particules est caractérisée par la valeur constante que prend l'énergie du muon p+ dans ce type de réaction (dite à 2 corps). Lattes, Ocdiialini et Powell montrèrent encore que les muons p + qui proviennent de la désintégration pion-méson se désintègrent à leur tour et produiçent des positons, selon la réaction : p++v;+e++v,,
le positon étant accompagné des deux neutrinos V; et v,. Cette réaction (dite à trois corps) donne lieu à des positons d'énergie variable d'un événement à l'autre, comme c'est le cas pour la désintégration bêta du neutron. Si l'on assigne aux muons (et aux électrons) négatifs un nombre quantique L, égai à 1 (Le= i), les muons positifs (et les positons) seront les antiparticules respectives des particules précédentes, avec les nombres quantiques L, = -1 (Le = -1). On admet pour ces réactions le principe de la conservation séparée de chacun des nombres leptoniques L, et Le, et par conséquent vp et v, sont associés à p - et e-, tandis que v; et y; sont associés à p+ et e+. En 1948, Lattes et l'Américain Eugene Gardner6' furent capables de détecter pour la première fois des pions produits dans la collision de protons contre des noyaux atomiques dans le synchrotron de Berkeley, suivant les réactions : p+n--+p+p+*p+p
+p
+ n
+
T+
Puis furent détectés les pions neutres à travers leur désintégration en deux gammas : "O--'T+T
C.M.G.Lattes e t E. Gardner, Science 107,270
(1948).
258
Sources et évolution de la physique quantique
Dans les années 1947-1950, les travaux de recherche sur ces particules se multiplièrent, d n de trouver leurs propriétés et celles de leurs interactions. Les pions s'avérèrent être des bosons de spin Zéro,représentés par des champs pseudo-scalaires, alors que les muons ont, eux, le spin 1/2. Le Brésilien Jayme Tiomno, en collaboration avec John A. Wheeler", Bruno Pontecorvo6', Oskar Klein'O et Gianpetro Puppi'l d'une part, et Tsung-Dm Lee travaillant avec M.Rosenbluth et Chen-Ning Yang" d'autre part, arrivèrent indépendamment à la conclusion que la réaction
et la réaction de capture des muons négatifs : p- + p
-t
n t up
sont toutes deux décrites par les interactions de Fermi responsables de la désintégration bêta du neutron : n+p+e-+Y;
Iis trouvèrent également que les constantes d'interaction qui déterminent l'amplitude de ces réactions ont approximativenient la même valeur :
Un principe à'univcr~alitéde l'interaction de Fermi fut alors énoncé, et la phénoménologie de ces réactions fut réexaminée par Louis Michel" de manière systématique : cet auteur introduisit le paramètre p qui caractérise la forme du spectre d'énergie des électrons émis dans la désintégration du muon, avec une valeur qui change suivant la nature géométrique (scalaire, vectorielle, axiale, pseudoscalaire, tensorielle) de l'interaction de Fermi. Ce principe trouva son expression finale après l'introduction d'un paramètre (l'angle de Cabbibo) qui relie les quarks u, d et s, paramètre que l'on généralisa ensuite en une matrice 3 x 3 unitaire (la matrice de mélange de Kobayashi-Maskawa) dans le modèle à 6 quarks". Ce ne fut que dix ans plus tard que la nature de l'interaction de Fermi - l'interaction faible directe entre d e w paires adéquates de fermions - fut déterminée. R P. Feynman et M. Gell-Mann" et simultanément R Marshak et E.C.G. i~~ en 1958 qu'une combinaison de l'interaction Sudarshan, et J.J. S a k ~ r amontrèrent 6*
" 'O
J. Tiomno et J.A. Wheeler, Rev. Mod. Phys. 21, 144, 153 (1949). B. Pontecorvo, Phys. Rev. 72,246 (1947). O. Klein, Nature 161,897(1948).
'' O. Puppi, Nuouo Ciment0 5,587 (1948). '' .T.D. Lee, M. Rosenbluth et C.N. Yang,Phys. Rev. 75,905 (1949). 73 'I4
'' "
L. Michel, Proe. Phys. Soc. A63,514, (1950). cf. J. Leite Lopes, Gauge field theories, Pergamon Press, Oxford (1983). R.P. Feynman et M. Gell-Mann, Phys. Rev. 109,193(1958). R. Marshak et E.C.G. Sudarshan, Phys. Rev. 109,1860(1958); J.J. Sakurai, Nuouo
Cimenta, 7,649 (1958).
Les grandes heures de la physique des particules
259
+
vectorielle V et de l’interaction axiale A , à savoir U A bV représente l’interaction faible ci-dessus si l’on prend a = -1, b = 1. C’est la fameuse interaction V - A. Après avoir pris exnnaissance de l’article de Feynman et Gell-Mann, l’un des auteurs de ce livre77effectua la première estimation réaliste de la masse des bosons intermédiaires W, les agents reponsables de l’interaction de Fermi, en égalant la constante d’interaction entre ces bosons et la matière nucléaire g, et la constante d’interaction entre les photons et le courant électrique, e : e=g
Cette égalité était possible en raison du caractère vectoriel aussi bien des champs de photons que des champs de bosons W : elle suggérait une unification des interactions électromagnétiques et faibles. Cette égaiité fut remplacée par la relation e = gsinBw dans le modèle standard” d’unification électro-faibledéveloppé plus tard par Steven Weinberg (1967)’ Sheldon Glashow et Abdus Salam (1968)’ où Bw est l’angle qui détermine le mélange du champ E,, associé au groupe U(1) avec la composante A P 3 du champ A,,,,,a = 1,2,3 associé au groupe SU(2) dans le modèle SU(2) x U(i) pour former le champ électromagnétique A,, et le champ Z,,associé au boson neutre
ZO . Ce boson neutre Zo, responsable des interactions faibles sans changement de charge électrique (appelées interactions faibles neutres), fut d’ailleurs prédit par l’un des auteurs” dans l’article où il suggérait la relation e = g ; en 1958, date de l’article, on n’avait pas encore mis au point les faisceaux de neutrinos susceptibles de provoquer ce type d’interaction faibles neutres, c’est pourquoi l’auteur proposa d’observer les collisions élastiques neutronélectron pour vérifier si ces interactions transmises par le boson Zo existaient effectivement. il chercha aussi, en 1958, quelle serait la contribution de l’interaction forte du pion avec un proton et de celle de son interaction faible avec un muon pouvant donner lieu à la capture d’un muon négatif par ce pro tor^'^. il trouva ainsi une interaction effective, de caractère pseudoscalaire, induite par les couplages mentionnés plus haut, d’intensité plus faible que l’interaction V - A , mais s’y rajoutant, et étant proportionnelle à la masse du muon. La combinaison des deux interactions rend bien compte de la situation expérimentale. Cette approche - l’échange d’une particule pseudoscalaire - n’a pas perdu toute actualité : dans le modèle standard d‘unification, le rôle joué par le pion serait alors repris par le boson de Eggs (voir p. 277)’ particule jusqu’à ce jour hypothétique, mais dont la découverte serait la clé de voûte de ce modèle. J. Leite Lopes, Nucl. Phys. 8,234 (1958).
S. Weinberg, Phys. Rev. Lett. 19, 1264 (1967) ; A. Salam, Nobel Symposium,N. Svartholm Editor (1968) ; S.L. Glashow, Nucl. Phys. 22,579 (1961). ‘Is J. Leite Lopes, Phys. Rev. 109,509 (1958) ; L. Wolfenstein, Nuouo Cimcnto 8,382 (1958) ; L. Wolfenstein, The weak pscudoscalar interaction in h i t e Lopes Festschrift, p. 365, World Scientific, Singapore (1988).
260
Sources et évolution de la physique quantique
Hu«, Leiie Lopes, Pauli, Jarrch (Princeton, 1945. Célébration du Priz Nobel de Pauli).
Chapitre 6
Vers l’unification des interactions 6.1 Les particules élémentaires et le modèle SU(3) de Gell-Mann A partir de 1948, de nouvelles particules furent découvertes. Les préjugés d’un grand nombre de physiciens d’antan contre l’existence de nouvelles particules s’effondrèrent alors. On peut citer à ce propos Dirac, lorsqu’il tenta d’interpréter les solutions à énergie négative de son équation comme des protons. Ii écrivait : It h a always been the dream of philosophers to have all the matter built up from one fundamental kind of particle, so that it i s not altogether satufactory to have two in our theory, the electron and the proton. There are, however, reasons for believing that the electron and the proton are really not independent, but are just two manifesîations of one elementary kind of particle ”*O. En réalité, comme l’ont montré Robert Oppenheimer et Hermann Weyl, les solutions à énergie négative de l’équation de Dirac pour l’électron correspondent à de nouvelles particules, les positons, qui ont exactement la même masse que l’électron - ce furent les premières particules d’antimatière découvertes. Chaque particule de spin 1/2, comme le proton, le neutron, le muon, est décrite par une équation de Dirac et est associée à une anti-particule correspondante, dont la charge (le moment magnétique et les nombres quantiques qui leur sont liés) est opposée à celle de la particule. Après la découverte des pions et des mésons, on découvrit les mésons eta ( q ) , qui se désintègrent suivant les modes principaux : LL
q-
7+7 n++r-+nO 3n0
4 ---t
On découvrit ensuite les mésons K ou kaons, chargés :
K++ 4
p++v, *++*O
et les kaons neutres, dont nous reparlerons plus loin. Les années 50 et 60 virent aussi la découverte de fermions plus lourds que le proton et le neutron, à savoir le baryon A’, le triplet E+,Co,C-, le doublet -0 , et le baryon fi-, prévu théoriquement par Gell-Mann dans son modèle des quarks. Ces baryons reçurent dans les années 50 le nom d’hypéron, ; Gell-Mannet
- -
I _
I
I
P.A.M. Dirac, The proton, Nafure 128,605 (1930)
262
Sources et évolution de la physique quantique
Kazuhiko Nishijima introduisirent un nouveau nombre quantique, Z’éfrangeféS, à partir duquel et du nombre baryonique B on déiinit Z’hypercharge Y :
Y=S+B
On abandonna alors à cette époque la conception simpliste des années 30 qui consistait à penser que les seules particules fondamentalesétaient les nucléons (proton et neutron), les leptons (électron et neutrino de Pauli), et le photon, résumée dans la tableau 1. Tableau 1
Les particules élémentaires dans le8 années 1930 Nom
Nucléon
Masse (MeV/c’)
Charge (I e
I)
Spin ( f j
Proton
938
-+I
112
Neutron
940
O
112
%O
O
112
Electron e
0,511
-1
112
7
O
O
1
Leptons Neutrino v
Avec la découverte du neutron, on perdait la notion héritée de l’atomisme, ceile de particules indivisibles et immuables solides, matsives, dures, impénétmbles, (...), aucun pouvoir ordinaire n’étanf capable de diviser ce que Dieu, Lui-Mime,jit un dam la première Création suivant les paroles de Newton. Ainsi, dans la description qu’il donna de la d6sinGgration bêta du neutron, Fermi employa lea opérateurs de création et d’annihilation de quanta d’un champ. D’après la théorie, le neutron est annihilé et à sa place est créé un proton : simultanément une paire électron-antineutrinoest à la fois créée et émise. L’analogie avec l’électrodynamique quantique (développée par Dirac, et par Heisenberg et Pauli) selon laquelle, lorsqu’un atome excité émet de la lumière, un photon est créé et l’atome subit une transition vers un état à énergie, quantité de mouvement et spin inférieurs, cette analogie guida la construction des fondements de la théorie quantique des champs. Toutes les particules sont instables à l’exception de l’électron, du neutrino et du proton - et lorsqu’une de W. particules rencontre son antiparticule, les deux disparaissent et se transforment en bosons. Dans les théories de grande unification, cependant, le proton pourrait se désintégrer (au bout de quelques 10j2 années) en un positon et un xo : cette désintégration n’a pas été observée à ce jour. De plus, les particules sont les quanta d’un champ déterminé et elles sont créées dès qu’une énergie suffisante est disponible. Comme nous l’avons déjà souligné, le vide est le siège de fluctuations des valeurs du champ et est peuplé de quanta virtuels. Pour interpréter le fait que la chaîne de désintégration des baryons s’arrête au proton et qu’il y a toujours le même nombre de baryons dans l’état final que dans
Vers l‘unification des interactions
263
l’état initial, Wigner inventa un nombre quantique 8,égal à 1 pour les baryons, à -1 pour les anti-baryons, et Zéro pour les autre particules, leptons et bosons : la loi de conservation du nombre baryonique dans toutes les réactions et désintégrations nucléaires est toujours vérifiée. Elle serait violée dans les théories de grande unification, encore dépourvues d’appui expérimental, que nous venons de mentionner. L’isospin i fut introduit par Heisenberg pour exprimer le fait que, la masse du proton et celle du neutron étant approximativement égales, ces deux particules ne représenteraient que deux états d’une même particule, le nucléon, de charge I e I et zéro, respectivement. Le nombre I fut alors attribué au nucléon avec la valeur 112 et la charge Q fut exprimée en fonction de la troisième composante I 3 grâce à :
avec I3 = i / 2 pour le proton et I3 = -112 pour le neutron. Avec la découverte des hypérons et la définition de l’étrangeté S et de l’hypercharge Y,la charge Q vint à prendre l’expression :
Q = I3 +YI2 Ainsi la classification des particules possédant l’interaction forte, les hadrons, put s’établir comme le montrent les deux tableaux suivants, le tableau 2 pour les baryons, avec B = 1, le tableau 3 pour les mésons, avec B = O. Tableau 2
I
Les baryons B = 1
264
Sources et évolution de la physique quantique
Tableau 3 Les méso s B = O
Nom
ymbole r+
Pions
(spin zéro)
ifo
a-
Mésons
êta
'I
(spin zéro)
K+ Kaons (spin zéro)
KO
KO
O
-1
K-
-1
Parallélement à ces mésons de spin zéro, pseudoscaiaires, on trouve des mésons de spin 1 : ce sont les mésons vectoriels p + , p o , p- et les mésons 9. et K*. L'interprétation des objets ainsi classifiés a été effectuée d'après la tentative menée par Fermi et Yang de décrire les pions comme des structura de nucléons et d'anti-nucléons. Une interaction très forte serait ainsi capable de lier un proton à un antineutron pour former le pion positif :
ce qui donnerait de même : et
Cette représentation est basée sur la théorie du groupe SU(2) qui agit s u r un espace à deux dimensions, l'espace des isospineurs
(3 .
Une fois les kaons découverts, Shoichi Sakata proposa que l'on prenne en considération le trivecteur
(i)
au lieu de l'isospineur
();
: ies mésons K auraient
265
Vers l’unification des interactions
une structure de la forme :
Les diacultés rencontrées par le modèle de Sakata pour décrire les hypérons furent surmontées dans l’étape décisive suivante, due à Gell-Mann”. Tel Anaximandre, pour qui la substance primordiale de toutes choses n’était ni l’eau, comme le supposait Thalès, ni aucun corps connu, Gell-Mann affirma que les éléments primordiaux des hadrons n’étaient ni les nucléons, ni le Ao, mais des objets inconnus, les quarks doués des nombres quantiques appropriés ; les mésons seraient formés de combinaisons de produits d’un quark par un antiquark et les baryons d’une combinaison de trois quarks. Au début, Gell-Mann supposa l’existence de trois quarks, u , d et s, les trois composantes d’un vecteur dans un espace complexe à trois dimensions sur lequel agit le groupe SU(3), c’est-à-dire l’ensemble des matrices unitaires à trois lignes et trois colonnes dont le déterminant est égal à +1, la théorie attribuant un isospin i/2 aux quarks u et d et une étrangeté au quark s. De très beaux travaux furent alors entrepris, qui donnèrent lieu à l’algèbre des courants, à l’étude des groupes SU(n) et de leurs représentations. Le quark s est responsable des particules étranges : Gell-Mann put alors proposer les structures suivantes pour les pions :
(à la façon de Sakata) et K+-Zu,
KO-Zd
I1 postula que si les quarks devaient aussi engendrer les baryons, et si - hypothèse naturelle - le spin des quarks valait 1/2, chaque baryon devrait être constitué de trois quarks, chacun devrait donc avoir un nombre baryonique B = La structure des pions impose aux u d’avoir une charge $e et aux d une charge de -+e. Cela conduit à la structure suivante pour les baryons :
i.
P
-
uud,
N
-
udd,
A‘
-
uds
(s doit donc avoir une charge - t e et une étrangeté -1).
L’étude des représentations du groupe SU(3) conduisit à la classification des hadrons en multiplets bien définis, comme le montrent les tableaux suivants.
81
M. Gell-Mann et Y. Ne’eman, The Eightfold Way, W.A. Benjamin (1964).
Sources et évolution de la physique quantique
266
On obtient ainsi l'octet baryonique :
Les quarks de Gell-Mann reçurent les attributions suivantes :
Tableau 5
Tableau 4 ie
Les quarks de Gell-Mann I
Is
d 112 -1}2 J
O
O
Y
I
B Q=IJ+~
y
Is
Q(lCl
omposition
L/2 112 1
1
uud
LI2 -1/2
1
O
udd
113 113
O
0
0
O
Uds
-2/3 113
1
1
0
1
uw
1
0
0
1
Uds
1
-1
O
-1
dds
1/2 112 -1
O
Wd
1/2 -112 -1
-1
&a
ainsi qu'un décuplet de baryons : Tableau 6
-
-
!cuplet baryonique
't Q / I e I = I s + $
A++
1
2
A+
1
1
A0
1
O
A-
1
-1
om position
Y'+
O
1
uw
Y.0
O
O
Uds
Y'-
O
-1
dds
=.O
-1
O
=.-
-1
-1
0-
-2
-1
u
L
-
Le modèie de Gell-Mann rencontra donc un grand suc& puisque les partid e s et les tbonancwB2 (particules qui se désintègrent rapidement sous l'efiet de l'interaction forte, telles que le A++) qui ne semblaient obéir à aucune régularité "
Voir par exemple R.A. Salmeron, Baryon Resonances, p. 366 in Subnuclear Phcno-
Vers l’unijication des interactions
267
purent alors être comprises comme des représentations du groupe SU(3). En particulier, 1’0- fut prédit théoriquement a w t d’être observé expérimentalement. Les hadrons apparaissant alors comme des structures de quarks et d’antiquarks, ce furent les interactions entre les quarks qui devinrent fondamentales. Ainsi la désintégration bêta du neutron s’interpréta comme celle du quark d :
d
u
+ e- +
et les recherches s’orientèrent vers la mise en évidence des quarks et de leurs interactions. Certaines particules telles que le A++ et l’a- avec spin 3/2 étaient considérées ) s(l),4 2 ) , s(3) respeccomme formées de trois quarks identiques, u(l), u(2), ~ ( 3 et tivement. Or l’état fondamental de trois fermions identiques (les quarks ayant un spin 1/2) devait être symétrique par rapport à la permutation des trois corps, ce qui est interdit par le principe de Pauli. On a alors imaginé qu’il doit exister un nouveau nombre quantique, la couleur, susceptible de prendre trois valeurs. De cette manière, chaque quark est représenté par un spineur q! af€ecté d’un nombre quantique a, a = 1,2,3. Chaque type de quark j = u,d,s etc. est appelé une saueur. On pense actuellement qu’il existe 6 saveurs différentes, donnant lieu aux quarks u (up), d (down), c (charme), s (étrangeté), t (top) et b (beauté), et que pour chacun de ces 6 quarks il existe trois états de couleurs différentes (soit qd ,j = 1 à 6 ; a = 1 à 3). L’état fondamental d’une particule telle que le A++ est ainsi décrit par une amplitude anfisymétrique par rapport à la couleur :
A++
Gbcua(l)ub(2)uc(3)
où u,,(l) est le quark u de couleur a dont les coordonnées d’espace-temps et de spin sont 1, et C& est ie tenseur d’ordre 3 totalement antisymétrique avec dl23 = i ; la somme s u r tous les indices a,b, c est sous-entendue. Cette amplitude est en accord avec le principe de Pauli. Chaque baryon est décrit par une amplitude de la forme :
-
cabcq.(l)qb(2)!&(3)
Ainsi le proton est représenté par l’amplitude :
et la résonance A++ est représentée par une fonction d’onde symétrique par rapport à l’échange de tous les nombres quantiques exceptée la couleur, pour laquelle elle est antisymétrique :
~
ed. par A. Zichichi Academic Press Inc. Londres 1969 ; et R.A. Sdmeron What Old Baryo&?, p. 565 in Proc. of the 1977 huropean Conference on $article Physics, Budapest, Hungary, 4-9 July 1977, ed. L. Jenik et I. Montvay, p. 565. mena,
is New on
Sources et évolution de la physique quantique
268
(le quark ul(1) au point 1et le quark uz(2) au point 2 ont des couleurs différentes). De la même façon, un méson est constitué d’un quark lié à un antiquark, a couleurs de ces paires : l’amplitude étant la somme sur l Méson
-
3
zqa 0=1
Ainsi :
+
r+ -&u,
&?A2
K + -Gu, +;szu,
+ Gu3 + Ku3
Le tableau 7 donne la liste des quarks dont l’existence est aujourd’hL admise, chacun d’entre eux pouvant prendre trois états de coule? différents a = 1,2,3. Les quarks sont colorés, mais ne sont pas observables ; leur existence découle de la description des hadrons observés qui, eux ne portent pasLdeCouleur. Tableau 7 Quarks ?om (anglais)
aveur I
13
s c b i Q(1el
UP
t/2 1/2 O O O O
2/3
down
1/2 -1/2 O O O O
-1/3 2/3
charm
O
O
0 1 0 0
strange
O
O
-1 O , O O -1/3
top
O
O
O 0 0 1
2/3
O
O O 1 O
-1/3
bottom
O
Q = 13
+ $ ( B + s + c t b + t)
a = 1,2,3 correspondent aux 3 états de couleur
Le quark charmé fut postulé par Sheldon Glashow, Jean Iliopoulos et Luciano Maiania3 pour justifier l’absence de courants faibles neutres qui changent
l’étrangeté. Il fut mis en évidence en 1974 lorsque Sam Tinga4, analysant auprès du synchrotron à gradient alterné de Brookhaven la production de paires e+,eà partir d’interactions de protons sur du béryllium d’une part, et Burt Richterss, indépendamment, examinant à l’anneau de collision SPEAR au voisinage de l’accélérateur linéaire de Stanford SLAC les annihilations e+, e-, découvrirent l’existence d’un état lié ( c - E), que l’on appela J / @ , et qui est constitué d’un quark charmé c s3
”
S . Glashow,J. Iliopoulos et L. Maiani, Phys. Rev. D2, 1285 (1970). J.J. Aubert et al., Phys. Rev. Lett. 33,1404 (1974). J.E. Augustin et ai., Phys. Rev. Lett. 33, 1406 (1974).
Vers l’unification des interactions
269
lié à son antiquark charmé E. Il s’agit d’un état qui, par analogie au positronium, fut appelé chatmonium : 3
0=l
-
Sa masse est 3 , i GeV. En 1978, l’équipe de Léon Lederman“ au Fermi National Laboratory étudiant les paires p+p- produites dans des interactions de protons de 400 GeV/c sur des noyaux découvrit un méson de masse élevée, m 9,5 GeV, dont les propriétés sont très bien décrites si on suppose qu’il s’agit d’une structure de type b$ : c’est le méson upsilon, T :
-
T
-
3
xxb, o=l
Remarquons qu’un doublet comme celui du nucléon :
ou le doublet des quarks u et d :
sont des éléments de l’espace dans lequel agit le groupe SU(2) et où l’on introduit un nombre quantique qui est celui de l’isospin I. Dans l’espace des isospineurs, trois matrices de base sont déhies, Il = 2,I2 = y, 1 3 = y , dont l’une est diagonale et distingue le quark u , 13 = 112, du quark d, 13 = -112 : ce sont les générateurs du groupe SU(2). Dans le modèle de Gell-Mann, les trois quarks u , d , s forment un tri-vecteur, élément d’un espace où opère le groupe SU(3) dont les générateurs sont huit matrices à trois lignes et trois colonnes. Deux de ces matrices sont diagonales, ce qui permet de définir l’isospin et l’étrangeté. Dans le cas de quatre quarks, u , d, e, s, on a affaire au groupe SU(4) et l’on introduit un nouveau nombre quantique, le chatme c. De la même manière, on d é h i t le nombre quantique b lorsqu’on traite des particules contenant le quark b. On fera de même avec le quark 2 lorsqu’on aura observé des particules le contenant, ce qui n’est pas encore le cas aujourd’hui (voir cependant page 278) : un nouveau nombre quantique t sera alors introduit.
S.W. Herb et al., Phys. Reu. Lett. 39,252 (1977).
270
Sources et évolution de la physique quantique
6.2 Les champs de jauge et les interactions fortes La notion de champs de jauge s’est avérée aussi féconde pour décrire les interactions fortes qu’elle l’avait été pour les interactions électromagnétiques. Et avant de parler des modèles d’unification de ces dernières avec les interactions faibles, nous d o n s l’expliciter. Le premier exemple de champ de jauge est le champ électromagnétique. On sait que le champ électrique E(z) et le champ magnétique B(zj se déduisent des
+
potentiels 4(z) et A(z) au moyen des équations :
ïi convient de noter que ces équations ne changent pas lorsqu’on remplace ces potentiels par d’autres, #(z) et relations :
A’(lj
liés aux potentiels
4(z) et
4
A ( z ) par les
dA
4’b)“4b) - Z ’
A’(=)=À’(z) + TA(=) où A(z) est une fonction dérivable arbitraire. En effet :
puisque le rotationnei d’un gradient est identiquement nul. La transformation de
$’Â en q1f A s’appelie une
trawformation de jauge. Les équations de Maxweli homogènes aussi bien que celles qui relient les champs aux sources ne changent pas lors de cette transformation - elles sont invariantes de jauge. Cela est naturel : les lois physiques ne doivent pas contenir des fonctions arbi-
traires, telles que A(%). Ainsi, en physique classique, ce sont les &s 3,B qui sont observables, non les potentiels (en mécanique quantique, cependant, les potentiels ont une action physique directe, comme le montre l’effet Bob-Aharonov : cet &et est défini par un facteur de phase qui dépend des potentiels, mais qui est invariant de jauge). Bien que le lagrangien et l’hamiltonien classiques ne soient pas invariants de jauge, on postule en mécanique quantique que l’équation de Schrodinger est invariante de jauge, puisque cette équation sert à décrire des situations physiques. Pour qu’elle le soit, il faut que la trançformation des potentiels décrite par l’équation (1) soit accompagnée d’une transformation des fonctions d’onde de la forme : -.)
(2)
Vers l‘unification des interactions
271
L’ensemble des transformations (1) et (2) constituent les tramformatiom de jauge électromagnétique ou transformations du groupe U(i). On vérifie que les équations qui contiennent des opérateurs avec les dérivées usuelles :
sont invariantes de jauge si l’on y remplace les opérateurs de différentiation :
3+3= a- hieA
4
(4)
par les dérivées covariantes qui contiennent un champ se transformant suivant l’équation (1)’ et une fonction d’ondes $ 8e transformant d’après (2). Le champ qui s’ajoute aux dérivées usuelles pour rendre effective cette invariance s’appelle, depds Hermann Weyl, un champ de jauge. L’équation invariante de jauge associée à l’équation (3) s’écrit donc :
3
et Di sont définis par les équations (4). L‘apparition du champ de jauge dans les dérivées covariantes implique que ce champ interagit avec le & $ - c’est, dans le cas présent, l’interaction du champ électromagnétique avec le courant électrique déterminé par le champ $. La notion de champ de jauge fut généralisée en 1954 par C.N. Yang et R. Mills8’. Ils remarquèrent qu’un champ défini par un isospineur, comme celui des nucléons - proton et neutron - ou celui du doublet de quarks u et d, peut subir une transformation de phase similaire à celle décrite par l’équation (2). Ainsi, si N(x) est l’isospineur du nucléon
où
et compte tenu du fait que si on néglige la différence de masse entre le proton et le neutron, les lois de la physique nucléaire (en excluant celles de l’électromagnétisme) sont invariantes lors du changement de l’un en l’autre, ceci se traduit par le fait que ces lois sont invariantes par la transformation de N ( z ) en N’(z),où :
(‘2)
N’(2) = e x p i x . -
N(z)
(5)
où les 7’ sont les générateurs du groupe SU(2) (les matrices de Pauli) et Xl,X2, sont les trois paramètres (les constantes du groupe). Dans cette transformation ” C.N.Yang et 1597 (1956).
R.L. Mills, Phys. Res. 96, 191 (1954) ;R. Utiyama, Phys. Rev. 101,
272
Sources et évolution de la physique quantique
apparaissent les générateurs d’un groupe de transformations non commutatives, (groupe appelié non-abélien en mémoire du grand mathématicien norvégien Abel). L’invariance implique la conservation d’un courant, analogue au courant électromagnétique pour les charges, le courant d ’isospin ;en raison de cette analogie avec le cas électromagnétique, on introduit alors un nouveau champ de jauge qui interagit avec ce courant. Le remplacement des constantes X1,X2,& par trois fonctions arbitraires h l ( z ) ,A ~ ( z ) A , ~ ( z dans ) la transformation (5) définit les transformations de phase locales :
et I’invaxiance, pour N(z),de ces équations lors de la transformation (6) est assurée par le remplacement des dérivées ordinaires nouvelles dérivées covariantes :
9 et & dans l’équation (3) par les
où a,b = 1,2,3 définissent les trois lignes et les trois colonnes des matrices 4
--$
7,et Ak
et q5 sont les composantes spatiales et temporelles de trois champs quadrivectoriels : --+ A,,,p = O, 1,2,3. g est une constante similaire à la charge e en électromagnétisme (la flèdie indique un trivecteur dans l’espace des isospineurs). Les champs de jauge se transforment d’après des lois qui généralisent les équations (1) et se généralisent eux-mêmes aux groupes SU(n). Lorsque les transformations sont celles du groupe SU(3). dans l’espace de la couleur pour les quarks, il existe huit champs quadrivecteurs : ce sont les champs des gluons, qui déterminent huit états de couleur pour les gluons, et qui sont associés aux huit générateurs du groupe. Les gluons possèdent donc une couleur, ce qui leur permet d’interagir avec eux-mêmes. La chromodynamique quantique est la théorie des interactions fortes : on admet que les interactions fortes ne sont pas dues primordialement à un échange de mésons entre des nucléons, mais sont le résultat de l’échange de gluons entre des quarks. On considère aujourd’hui les interactions fortes comme dues à l’existence du nombre quantique de couleur. Le3 leptons, qui n’ont pac de couleur, ne produisent ni ne subissent d’intemctions fortes. De la même façon que l’interaction de Van der Waals entre deux molécules neutres résulte de l’échange de photons virtuels entre les constituants électroniques des molécules, l’interaction de Yukawa, eiie, est une sorte d’échange de gluons virtuels entre les quarks qui composent deux nucléons, de sorte que la couleur de l’ensemble soit nulle. Si nous rep&entons par un diagramme de Feynman la structure d’un proton, celui-ci, étant composé de trois quarks, aura la forme donnée par la figure 6.1 :
Vers l’unification des interactions
273
N Figure 6.1
Figure 6.2
En plus des quarks on trouve dans un proton libre des gluons et des paires de quarks et antiquarks virtuels. Ainsi l’émission d’un pion négatif A- par un neutron se transformant en un proton est représentée par le diagramme de la figure 6.2. La réaction d’échange d’un pion chargé entre un proton et un neutron peut être représentée par la figure 6.3 page suivante.
Les gluons, qui ont une couleur, ne sont pas directement observables, de même que les quarks. Mais ils produisent des jerS de bosons, formés de paires quarksantiquarks. On admet que si l’on écarte un quark d’un antiquark, l’union des deux constituant la structure d’un boson, la force d’attraction entre eux augmente avec leur distance de séparation et en arrive à donner lieu halement à la création de nouvelles paires : ce sont ces paires qui constituent un jet de bosons. Et c’est ce processus qui entre en jeu lorsqu’on essaie d‘isoler aussi bien un quark qu’un gluon.
La figure 6.4 montre la réaction de production d‘un méson KO et d’un ho à partir du bombardement de protons par des A- : x- + p
--t
Ir’’ + A o
Dans l’état initial on a le proton (uud) et le pion x - (Ud). La réaction fait naître la paire quark 5 - antiquark 3 qui s’accrochent respectivement aux quarks u et d pour constituer le A”, et au quark d pour donner naissance au méson KO. On voit que dans cette réaction, il y a production de particules étranges et conservation de l’étrangeté (c’est la produciion rusociée). L’essentiel dans cette réaction est l’annihilation de la paire de quarks u , ü et la création de la paire 5,s’ ainsi que la substitution du quark u du proton par le quark 5 nouvellement créé, et celle de l’antiquark U du A- par le nouvel antiquark F du ICo.
274
Sources et éuolution de la physique quantique
N
,
i
Figure 6.4 Répétons, néanmoins, que l’interaction forte primordiale est celle s’exerçant entre les quarks qui échangent des gluons, et non celle s’exerçant entre baryons avec échange de mésons. L’énergie d’un système de quarks en interaction se compose non seulement de celle des quarks supposés libres et de celle de leur interaction avec les gluons, mais également de l’énergie de l’interaction des gluons avec eux-mêmes : ce terme, mathématiquement non linéaire en fonction du champ de gluons, exprime le fait que les gluons ont une couleur (une ‘ charge par analogie électromagnétique) et par conséquent interagissent entre eux ; ce que ne font pas les photons, qui ne possèdent pas de charge électrique mais qui peuvent néanmoins donner lieu à une d i h i o n photon-photon par l’intermédiaire de paires virtuelles électron-positon, comme l’indique la figure 6.5.
Figure 6.5
Vers l’unification des interactions
275
6.3 Le modèle standard d’unification
des interactions électromagnétique et faible La théorie utiljsant le premier champ de jauge, le champ électromagnétique, se développa à partir de l’unification du champ électrique et du champ magnétique découverte par Maxwell en 1867 et complétée par Einstein en 1905. En 1928-1929, on appliqua la méthode de quantification à ce champ et il en résulta l’électrodynamique quantique, grâce aux travaux de Dirac, Heisenberg et Pauli. Finalement, en 1948, on découvrit la procédure de renormalisation qui permit le calcul à tous les ordres d’approximation, grâce aux travaux de Richard Feynman, Juiian Schwinger, Freeman Dyson et Sin-Itiro Tomonaga. La découverte du champ de jauge de Yang-Milis ouvrit de nouveaux horizons et conduisit à l’unification des interactions électromagnétiques et des interactions faibles. Dès 1958,lorsqu’on attribua les interactions faibles à l’action d’un boson vecde l’égalité de la constante de couplage g de ces toriel W + ,W - , bosons avec les courants faibles et de e - la constante de couplage des photons avec les courants électriques - indiquait pour la première fois que les deux types de quanta, les W et le 7, possédant le même spin et la même constante d’interaction avec la matière, devaient constituer deux manifestations d’une même particule. La difficulté essentielle provint du fait que l’égalité e = g impliquait une masse élevée pour le boson W alors que la masse du photon est nulle. II devenait donc difficile de mettre ces deux particules dans un même multiplet, ce qui suppose l’existence d’une certaine symétrie : en choisissant pour celle-ci l’invariance de jauge, on était conduit à attribuer aux bosons intermédiaires une masse nulle, comme dans le cas des photons. La solution fut trouvée vers la fin des années 1960 par Steven Weinberg, et, indépendamment, par Abdus Salam et Sheldon Glashow88b. Un résultat expérimental de première importance, la violation d e la parité dans le3 interactions faibles, allait lui servir d’argument. Nous allons rappeler sa genèse. Des recherches entreprises sur la désintégration des mésons K surgit en 1955 un paradoxe qui fut appelé le puzzle û - T . Le méson K+ symbolisé alors par û+ se désintègre en deux pions :
e+ -,
-
ir+ + * O
Un autre méson K - symbolisé alors par T+
A+
T+
-
se désintègre en trois pions
+*+4- ir-
Les données expérimentales indiquaient que ces deux particules, 0 et T , avaient la même masse et la même durée de vie. Mais selon l’analyse théorique, les pions ayant une parité intrinsèque négative, les deux particules devaient être distinctes si l’interaction faible, responsable de leur désintégration, conservait Is parité (c’est-àdire l’invariance par rapport à la réflexion dans un miroir). Ce fut alors que T.D.
’“ J. Leite Lopes, Nucl. Phys. 8,234 (1958). cf réf. 78, p 259, et la conférence Nobel de S. Weinberg, p 279.
276
Sources et évolution de la physique quantique
Lee et C.N. Yang sotunirent à un examen critique toutes les données relatives à l’interaction faible et conclurent qu’il n’y a 6 t aucune évidence de conservation de la parité par cette interaction. Si donc la parité’ n’était pas conservée, û et 7 pourraient n’être bel et bien qu’une seule et même particule, et le puzzle serait ainsi résolu. Des expériences spécifiques inspirées par Lee et Yang furent réalisées par différents chercheurs et montrèrent qu’effectivement l’interaction faible ne conserve pas la parité. Ce fut le cas de l'expérience analysant la distribution angulaire des électrons émis lors d’une transition bêta permise par des noyaux radioactifs polarisés tels que le cobalt 60 :
+ + Y;
Cos0 -+ Nido e
par Mme C.S. Wu et ses collaborateurs à Washington 8 9 . D’autres expériences indiquèrent également une violation de l’invariance par rapport à la conjugaison de charge. En 1964, une équipe comprenant le Français R. Turlay et les futurs prix Nobel V. Fitch et J. Cronin, ainsi que J. Christensonso montra que les mésons K neutres se désintègrent en violant la transformation CP - violant de plus séparément la conjugaison de charge C et la parité P. De nombreux physiciens, tels W. Pauli et E. P. Wigner, accueillirent avec surprise ces résdtats : ils impliquent en effet que les interactions responsables de la désintégration des mésons K violent également l’invaxiance par renversement du temps T,puisque la théorie, aujourd‘hui encore, suppose l’invariance de toutes les interactions par rapport à la transformation définie par l’opérateur CPT. Revenons maintenant aux déductions de Weinberg lors de la construction du modèle standard. La violation de la parité dans les interactions faibles implique que le neutrino v, ait une héiiuté négative : Weinberg considéra donc que la partie lévogyre de l’électron devait accompagner le neutrino entièrement lévogyre pour former un isospineur L ; et en plus, il devait exister un singlet S constitué par la partie dextrogyre de l’électron. Ainsi, en considérant ces champs comme des champs de Yang-Mills,on est amené à considérer le groupe SU(2) agissant sur I’isospineur L et le groupe U(i) agissant sur le singlet S. Si l’on admet que la théorie est invariante par rapport au groupe SU(2)QDU(l),toutes ces particules devraient avoir une masse nulle, la masse nulle du neutrino, due au fait qu’il n’existe pas de neutrino dextrogyre, impliquant une masse nulie pour l’électron lévogyre. Weinberg eut alors l’idée d’introduire un nouveau champ dans la théorie, un doublet de champs scalaires pourvus d’une masse imaginaire et en interaction avec les leptons, ce champ ayant en plus une interaction spéciale, une autc-interaction du quatrième ordre proportionnelle au carré (négatif) de cette masse imaginaire. Ce champ a la propriété d’avoir deux états fondamentaux - un vide dégénéré - qui
C.S. Wu, E. Ambler, R.W. Hayward, D.D. Hoppes et RP. Hudson, Phys. Rev. 105, 1413 (1957). J.H. Christenson, J.W.Cronin, V.L. Fitch et R Turiay, Phys. Rev. Lett. 13, 138 (1964).
277
Vers l’unijïcation des interactions
se transforment sous réflexion du champ. Les quanta de ce champ sont appelés les boson, de Eiggs. Si l’on choisit l’un des deux états fondamentaux autour duquel on développe tous les champs, la symétrie sera brisée. Mais en même temps
apparaîtront des termes dans le formalisme qui donneront au champ scalaire physique une masse réelle, ainsi qu’une masse (réelle) pour l’électron physique - tout en conservant une masse nulle pour le neutrino. La symétrie de jauge imp& initialement sera en partie brisée - seule restera intacte la symétrie de jauge du groupe U(i), la symétrie électromagnétique (sans masse). Cette brisure partielle conservera une masse nulle pour le photon, tandis qu’une masse apparaîtra pour les bosons W + , W - , ainsi que pour le boson neutre 2”. Dans ce modèle, l’existence du 2” devient une conséquence du formalisme : le modèle prévoit donc l’existence d’interactions faibles mettant en jeu des couranis faibles neutresg1. Aux quatre générateurs des groupes SU(2) et U(1) correspondent quatre champs APs,B,. Les deux premiers vectoriels de jauge introduits par le modèle : A,, , dP2, se combinent pour décrire les bosons chargés W + ,W - , tandis qu’un mélange entre A,, et B,, défini par une rotation à deux dimensions d’un angle de mélange ûw, déterminera les champs 2, du boson neutre 20 et le champ A, des photons :
On voit qu’à la limite ûw Au lieu de l’égalité :
-+
on a Z,(z)
-t
-d,,(z),
A,(.) -+
B,(z).
e=g suggérée en 1958, on a maintenant l’égalité e = gsinûw
reliant la charge de l’électron - la constante de couplage électromagnétique - à la contante g de couplage des interactions faibles : la limite û + 5 signifierait l’identification électrofaible, la vraie unification. Ce modèie, appiiqué aux leptons aussi bien qu’aux quarks, est en excellent accord avec l’expérience jusqu’à aujourd’hui (1994)’ et les paramètres suivants ont été déterminés : sin2Ow = O, 2325 f O, 0008 MW = (80,22 f O, 26) GeV/cZ
Mz = (91,173 f O, 020) GeV/cZ Néanmoins, on n’a pas encore découvert expérimentalement les bosons de Higgs, et les données sur les masses de ces particules sont actuellement des limites
d réf. 88a et aussi S.L. Bludman, Nuovo Cimento 9, 433 (1958). Notons que la découverte expérimentale de l’existence des courants faibles neutres est due à une é uipe du CERN travaillant sur des photos de la chambre à bulles Gargamelle. Voir F.J. Hasert et a l , Phys. Lett. 48B,138 (1973).
Sources et évolution de la physique quantique
278
''
inférieures (à 95% de confiance, c'est-à-dire que l'on estime à 5% la probabilité que la vraie d e u r de ces masses soient plus petites que d e s qui sont indiquées) :
MHO> 58,4 GeVf c' MHi > 41, 7GeV/c' Quant au quark top, un groupe de physiciens utilisant le détecteur CDF (Collider Detector at Fermilab) a annoncésa découverte s ' % ~ printemps 1994. L'anneau de collision de ce laboratoire était rempli d'antiprotons et de protons circulant en sens inverse, et offrant lors de leurs chocs une énergie disponible de 1,8 TeV. Parmi les interactions observées, 12 événements sont apparus comme des candidats possibles à la réaction de production d'une paire de topantitop ,production suivie de la désintégration purement leptonique :
P
+F
- t
+5
+ p -+
t
e ( d + 4P)-
Vc(p) ü e ( p )
ou semi-leptonique : p
+ Z +e ( p ) v + jets.
La mesure de l'énergie de leurs produits de désintégration permit de donner au top la masse : Mt
= 174 f1 0 t : ~GeV/c'
Ce résultat doit être considéré comme préliminaire, la probabilité que ces candidats ne soient pas de vraies réactions de production du top n'étant pas encore négligeable. Elle le deviendra lorsque les physiciens du Fermilab auront accumulé un nombre d'événements statistiquement significatif. Si les étapes postérieures de l'analyse c o n h e n t ce résultat, la découverte du top possédant une masse de cette valeur serait un suc& remarquable pour le modèle standard d'unification des interactions électro-faibles.
''
Voir Review of Partides Properties, php3. Reu. D50,1192 (1994). F. Abe et ai., FEUILAB-PUB 94/097-E,avril 94.
'ln
Article XVIII
L'unification électro-faible Théorie des champs des interactions faibles et électromagnétiques
STEVENWEINBERG Conférence Nobel 1965
*
[traduit par W. Escoubès]
Notre travail. en physique, est de voir les choses de manière simple. de comprendre un grand nombre de phénomènes compliqués de façon unifiée. en termes de quelques principes simples. Parfois, nos efforts sont projetés en pleine lumière par une brillante expérience, comme le fut en 1973 la découverte des réactions de neutrinos par courants neutres. Mais même dans l'intervalle obscur qui sépare les percées expérimentales, les idées théoriques continuent toujours leur régulière évolution, conduisant presque lmperceptiblement au changement de nos convictions antérieures. Dans cet exposé, je veux présenter le développement de deux lignes de pensée en physique théorique. L'une d'elles est le lent approfondissement de notre compréhension de la symétrie, et en particulier de la symétrle brisée ou cachée. L'autre est le vieux combat pour en finir avec les Infinis en théories quantiques des champs. A un degré remarquable, nos théories détaillées actuelles des interactions entre les particules élémentaires peuvent être comprises de manière déductive, comme des conséquences des principes de syrnetrie e t d'un principe de renormalisation auquel on fait appel pour manier les infinis. Je décrirai brièvement comment la convergence de ces lignes de pensée m'a conduit à mon travail sur l'unification des interactions faibles et électromagnétiques. Pour la plus grande part, mon expos6 sera centré sur mon apprentissage progressif de ces matières, car c'est un sujet dont Je peux parler avec une certaine assurance. Moins assuré, toutefois, j e tenterai aussi de regarder plus loin, et de suggérer quel rble ces lignes de pensée pourront jouer dans la physique du futur. Les principes de symétrie ont fait leur apparition dans la physique du vingtième siècle en 1905, Iorsqu'Einstein identifia le groupe d'Invariance de l'espace et du temps. Grâce à ce précédent, les symétries dans l'esprit des physiclens prennent le caractère de principes a priori de validité univenelle, d'expressions de la simplicité de la nature à son niveau le plus profond. De sorte qu'il fut douloureux et difficile dans les années 1930 de réaliser qu'il existait des symétries internes, comme la conservation de I'isospln [l],
*
Copyright Fondation Nobel
Sources et évolution de la physique quantique
280
qui n'avaient rien à voir avec l'espace et le temps, des symétries qui sont loin d'être évidentes et qui ne concernent que ce qu'on appelle maintenant les interactions fortes. Les années 1950 voient la découverte d'une autre symétrie interne - la conservation de l'étrangeté [2) - que ne respectent pas les interactions faibles, et on découvrit même que l'une des symétries de l'espace-temps que l'on croyait sacrée la parité
-
-
était violée par les interactions faibles [3]. Au lieu d'aller vers l'unité. les physiciens étaient en train d'apprendre que les difiérentes interactions obéissaient apparemment à des symétries tout à fait différentes. Les choses devinrent encore plus confuses lorsqu'on découvrit un groupe de symétrie au début des années 1960 - la " eightfold way 'I (la
-
voie octuple) qui n'était méme pas une symétrie exacte des interactions fortes [4]. Ce sont toutes des symétries " globales ", pour lesquelles les transformations de symétrie ne dépendent pas de la position dans l'espace-temps. O n s'était rendu compte [5] dans les années 1920 que l'électrodynamique quantique possédait une autre symétrie de type beaucoup plus puissant, une symétrie *' locale " lors de transformations où le champ de l'électron subit un changement de phase qui peut varier librement d'un point a l'autre de l'espace-temps et où le potentiel vecteur subit une transformation de jauge correspondante. Aujourd'hui on I'appelerait une symétrie de jauge U(l), car un simple changement de phase peut être vu comme une multiplication par une matrice unitaire 1 x 1. L'extension à des groupes plus compliqués fut faite par Yang et Mills [SI en 1954 dans un article fécond où ils montrerent comment construire une théorie de jauge des interactions fortes. Le nom " " signifie que les transformations du groupe de symétrie consistent en des matrices unitaires 2 X 2 ' I spéciales ", en ce sens que leur déterminant vaut l'unité. Mais l à aussi, il semblait que la symétrie, si tant est qu'elle existe, devait être approchée, car au moins à une approche naïve, l'invariance de jauge exige que les bosons vectoriels comme le photon doivent avoir une masse nuile, et il semblait évident que les médiateurs des interactions fortes ne sont pas des particules de masse nulle. La vieille question demeurait : si les principes de symétrie sont une expression de la simplicité de la nature, comment peut-il y avoir des choses comme une symétrie approchée 1 La nature est-elle approximativement simple I Entre 1960 et le début de 1961. j'entendis parler d'une idée qui avait trouvé son origine bien avant dans la physique de l'état solide. Elle avait été lancée en physique des particules par des gens comme Heisenberg, Nambu et Goldstone qui avaient travail@ dans les deux domaines. C'était l'idée de la symétrie brisée : I'hamiltonien et les relations r de commutation d'une théorie quantique pouvaient posséder une symétrie exacte et les états physiques pouvaient néanmoins ne pas constituer des représentations pures de la symétrie. En particulier, une symétrie de I'hamiltonien peut ne pas être une symétrie du vide. Comme cela arrive parfois aux théoriciens, je tombai amoureux de cette idée. Mais comme il arrive souvent dans les affaires de cœur, j e fus pris au début d'une certaine confusion quant à ses prolongements. Je pensais (cela s'avéra faux) que les symétries approchées parité, isospin, étrangeté, " eightfold way " - devaient en réalité être des principes de symétrie exacts a priori et que les violations observées de ces symétries devaient en quelque manière se faire jour lors de la brisure spontanée de la symétrie. Je où au fus donc plutôt perturbé lorsque l'entendis parler d'un résultat de Goldstone moins dans un cas simple, la brisure spontanée d'une symétrie continue comme I'isospin entraînait nécessairement #'existence d'une particule de masse et de spin nuls - que l'on
su(2)
su@)
-
[?I,
Vers I'unzFcation des interactions
281
appellerait aujourd'hui un Soson de Goldstone. II me semblait évident qu'il ne pouvait exister aucune nouvelle particule de masse zéro de ce type qui n'ait déjà été découverte. J'eus de longues discussions sur ce problème avec Goldstone, à Madison. l'et6 1961, et aussi avec Salam dont J'étais l'hôte à l'Imperia1 College en 1961-1962.Tous les trois, nous Mmes bientôt capables de montrer que les bosons de Goldstone doivent de fait apparaltre lorsqu'une symétrie comme I'isospin ou l'étrangeté est spontanément brisée, et que leurs masses demeurent nulles à tous les ordres de la t h a r i e des pertubations. Je me souviens avoir été si découragé par ces masses nulles que lorsque nous &rifimes notre article en commun sur le sujet [8], l'ajoutai une note nnaie à l'article pour souligner combien il était futile de supposer que l'on pût expliquer quoi que ce soit en termes d'état du vide non-invariant : c'était la réplique de Lear à Cordelia, " Rien ne vient de rien : continue de parler ' I . Bien entendu, la Physical Review défendit la pureté de la littérature physique et supprima l a note. Si on considère ce qui advint d u y i d e non-invariant en physique théorique, ce ne fut pas si mal. II y eut finalement une exception à cette démonstration, signalée peu après par Higgs, Kibble et d'autres [9].Ils montrèrent que si la symétrie est locale, si c'est une symétrie de jauge comme l'invariance de jauge électromagnétique, alors, les bosons de Goldstone peuvent être éliminés par une transformation de jauge, bien qu'ils existent de manière formelle, et dans un certain sens sont réels, de sorte qu'ils n'apparaissent pas comme des particules physiques. Les bosons de Goldstone manquants apparaissent à la place comme des états d'hélicité zéro de particules vectorielles, qui de ce fait acquièrent une masse. Je pense que les physiciens qui à cette époque entendaient parler de cette exception la considéraient en général comme un détail technique. De nouveaux développements en physique théorique semblèrent soudainement convertir les bosons de Goldstone d'intrus indésirables en amis bienvenus. En 1964, Adler et Weisberger trouvèrent, de manière indépendante des règles de somme qui donnèrent le rapport g A / g v de la constante de couplage axiale à la constante de couplage vectorielle dans la désintégration beta en termes des sections efficaces pion-nucléon. Une manière de voir leur calcul (peut-ëtre la manière la plus courante à l'époque) était d'y trouver l'analogue à la vieille règle de somme dipolaire de la physique atomique : un ensemble complet d'états hadroniques est inséré dans les relations de commutation des courants axiaux. C'est l'approche dont on se souvient sous le nom d'algèbre de courants [il]. Mais ily avait une autre manière de considérer la règle de somme d'Adler-Weisberger. On pouvait supposer que les interactions fortes p o e d a i e n t une symétrie approchée, basée sur le groupe su(2) X et que cette symétrie était spontanément brisée, donnant lieu entre autres à la masse du nucléon. Le pion est alors identifié comme étant (approximativement) un boson de Goldstone, avec une petite masse non-nulle, une idée proposée déjà par Nambu [12]. Bien que la symétrie X soit spontanément brisée, elle contient encore un grand pouvoir de prédiction. Mais ses prédictions prennent la forme de formules approchées, qui donnent les éléments de matrice pour les reactions avec des pions de basse énergie. Dans cette approche, la règle de somme de AdlerWeisberger est obtenue en utilisant les longueurs de diffusion prévues pour la diffusion pion-nucléon en liaison avec une règle de somme bien connue (131, qui avait été obtenue des années auparavant à partir des relations de disperslon pour cette diffusion pion-
[io],
su(2)
su@) su@)
282
Sources et évolution de la physique quantique
nucléon. Dans ces calculs, on exploite en réalité le fait que non seulement les interactions X spontanément brisée. mais aussi que fortes ont une symétrie approchée les courants de ce groupe de symétrie peuvent être identifiés, à une constante près, aux courants vectoriel et axial de la désintégration bêta. (Cette hypothese permet de faire rentrer gA/gv dans cette formulation à travers la relation de Goldberger-Treiman [14],qui exprime ie rapport gA/gV en fonction de ia constante de désintégration du pion et du couplage pion nucléon). Ici, dans la relation entre les courants des symétries des interactions fortes et les courants physiques de la désintégration bêta, on avait une indication stimulante d'un profond rapport entre les interactions faibles et les interactions fortes. Mais ce rapport ne f u t en fait pas réellement compris pendant près de dix ans. Je passai les années 1965-1967 en développant avec bonheur les implications de la brisure spontanée de symétrie pour les interactions fortes (151. Ce fut ce travail qui conduisit en 1967 à mon article sur l'unification faible et électromagnétique. Mais avant d'en arriver là, je dois revenir en arrière et signaler une autre ligne de pensée, qui traite du problème des infinités en théorie quantique des champs. Je crois que ce furent Oppenheimer et Waller en 1930 [16], qui, indépendamment, notèrent les premiers que SI l'on étendait l a théorie quantique des champs au delà de l'approximation la plus basse, elle donnait lieu à des résultats divergents dans l'ultraviolet pour le rayonnement dû à l'auto-énergie. L e Professeur Waller m'a dit la nuit dernière que lorsqu'ii présenta ce résultat à Pauli, celui-ci ne le crut pas. On auralt pu croire que ces Infinis constitueraient un désastre pour la théorie quantique des champs qui venait d'être développée par Heisenberg et Pauli en 1929-1930. En effet, ces Infinis provoquèrent un sentiment de découragement envers la théorie quantique des champs et de nombreuses tentatives furent faites dans les années 1930 et au début des années 1940 pour trouver des alternatives. Le problème fut résolu (au moins pour l'électrodynamique quantique) après la guerre, par Feynman, Schwinger et Tomonaga [17]et par Dyson [19].Ils trouvèrent que tous les infinis disparaissent si l'on identifie l a masse et la charge de l'électron non pas avec les paramètres m et e apparaissant dans le lagrangien. mais avec la masse et la charge qui sont CJ/CU/& à partir de m et de e, lorsqu'on prend en compte le fait que l'électron et le photon sont toujours entourés d'un nuage de photons virtuels e t de paires Tout d'un coup, toutes sortes de calculs devinrent possibles et electron-positon donnèrent des résultats en spectaculaire accord avec l'expérience. Mais même après ces succès, les opinions continuaient de différer sur la signification des dlvergences ultraviolettes de la théorie quantique des champs. Beaucoup pensaient - et quelques-uns continuent à penser - que l'on n'a fait que repousser le vrai probleme sous le tapis. Et il devint bientôt clair qu'il n'y avait qu'une classe limitée de théories dites " renormalisabies " dans lesquelles les infinis pouvaient être éliminés en les absorbant dans une redéfinition. une " renormalisatlon " d'un nombre fini de parametres physiques. (Grossièrement parlant, dans les théories renormalisables, aucune constante de couplage ne peut avoir les dimensions de puissances négatives de la masse. Mais chaque fois que nous ajoutons un champ ou une dérivée par rapport à l'espace-temps à une interaction, nous réduisons le nombre de dimensions de ia constante de couplage associée. Seuls quelques types simples d'interaction sont renormalisables). En particulier, ia thCorie de
su(2) su(2)
[is].
Fermi existante pour les interactions faibles était clairement non renormalisable. (La constante de couplage de Fermi a les dimensions d'une [masse]-2). La sensation de
Vers i'unijication des interactions
283
découragement persista Jusqu'aux années 1950 et 1960. J'ai étudié la théorie de la renormalisation en préparant mon master, essentiellement en lisant les articles de Dyson (191. Dès le début il me parut merveilleux qu'un trbs petit nombre de théories quantiques des champs fussent renormalisables. Les limltations de cette sorte sont, en fln de compte, ce que nous voulons avant t o u t : non pas des méthodes mathématiques capables de donner un sens à une lnflnlté de théories sans Intérêt physique, mais bien des méthodes qui apportent des contraintes, car ces Contraintes peuvent indiquer la voie vers la seule vraie théorie. En particulier, j'étals impresslonné par le fait que l'électrodynamique quantique pouvait dans un sens se déduire des principes de symétrie et des contraintes dues à son caractère renormalisable ; le seul lagranglen renormallsabie invariant de Lorentz et Invariant de jauge pour des photons et des électrons est précisément le lagrangien original de Dirac de l'électrodynamique quantique (EDQ). Bien entendu, ce n'est pas de cette manlhre que Dirac trouva sa théorie. II bénéficia de l'information glanée durant des siècles d'expérimentation en électromagnétisme et afln de fixer la forme finale de sa théorie, il s'appuya sur des idées de simplicité (de manière spécifique, sur ce qui est parfois appellé le couplage électromagnétique minimal). Mais nous devons regarder au-delà, tenter de faire la théorie de phénomènes qui n'ont pas été SI bien étudiés expérimentalement, et II est possible que nous ne soylons pas capables de croire à des Idées purement formelles de simplicité. Je pensais que le caractère renormalisabie pouvait Btre ie critère clé, celui qui imposerait a w l dans un contexte plus général un type précis de simplicité à nos théories et nous aiderait à dégager la seule vraie théorie physique de ia variété infinie des théories quantiques des champs concevables. Comme j e l'expliquerai plus loin, je dirais cela d'une manière un peu différente aujourd'hui, mais je suis tout à fait convaincu que l'usage du caractère renormalisable comme contrainte pour nos théories des interactions observées est une bonne stratégie. Plein d'enthouslasme pour la théorie de la renormalisation, ]'écrivis ma thèse de doctorat sous la direction de Sam Treiman, en 1957, sur l'utilisation d'une version limitée du caractère renormalisable pour mettre des contraintes aux interactions faibles [20].Un peu plus tard, je démontrai un petit théorème plutôt coriace [21],qui complétait la preuve donnée par Dyson [19] et Salam [22] que les divergences ultraviolettes s'annulent en réalité à tous les ordres dans les théories nominalement renormalisables. Mais rien de tout cela ne semblait nous aider pour le problème Important : comment produire une theorle renormalisable des interactions faibles ? Revenons maintenant à 1967. J'étais en train de considérer les implications de la X des interactions fortes et j e pensais tester l'idée que symétrie brisee la symétrie SU(2) x SU(2) était peut-être une symétrie '' iocaie *', non simplement '' globale C'est-à-dire que les interactions fortes peuvent être décrites par quelque chose comme une théorie à la Yang-Mills, mais qu'en plus des vecteurs p de la théorie de Yang-Mills, ii devait aussi y avoir des mésons vecteurs Al. Pour donner une masse au méson p, II était nécessaire d'insérer un terme de masse commun à p et à A l dans ie lagrangien. La brisure spontanée de la symétrie X séparerait alors le p du A l par quelque chose comme le mécanisme de Higgs ; mais comme la théorie n'était pas invarlante de jauge, les pions ne seraient que des bosons de Godstone physiques. Cette théorie comportait un curieux résultat : c'est que le rapport des masses Al/p devait être égal à&. En tentant de comprendre ce résultat sans faire appel à la théorie des perturbations, je découvris certaines règles de somme. les " règles de somme des
su(2) su(?,)
".
su(2) su(2)
Sources et évolution de la physique quantique
284
fonctions spectrales " [23], qui s'avérèrent fécondes pour une série d'autres usages. Mais la théorie X n'est pas Invariante de jauge, et n'est donc pas renormalisable (241 de sorte que cela ne m'enthousiasma guère (251. Naturellement, SI j e n'insérais pas le terme de masse p Al dans le lagrangien, la théorie était invariante de Jauge et renormallsable, et les Ai avaient une masse. Mals alors il n'y aurait pas eu de pions e t les mésons p n'auraient pas de masse, ce qui était en contradiction manifeste (pour ne pas dire plus) avec l'observation. Durant l'automne 1967, alors que je conduisais pour me rendre à mon bureau au M.I.T., je réalisai soudain que l'étais en train d'appliquer des idées correctes à un faux problème. Ce n'est pas le méson p qul est sans masse : c'est le photon. E t son partenaire n'est pas le A l , mais le boson intermédiaire massif, celui que l'on suspecte depuis Yukawa d'être le médiateur des interactions falbles. Les interactions faibles et électromagnétiques pourraient alors être décrites [26] de manière unifiée en termes d'une symétrie de jauge exacte, mais spontanément brisée [naturellement, pas nécessairement x Su(2)). Et cett théorie serait renormalisable comme l'électrodynamique quantique car elle est invariante de jauge, comme l'électrodynamique quantique. II ne fut pas difficile de développer un modèle qui prit corps autour de ces idées. J'avais peu confiance alors en ma compréhension des Interactions fortes, aussi décidai-je de me concentrer sur les leptons. II y a deux leptons de type électronique lévogyres, le V,L et le e t , et un lepton de type électronique dextrogyre, le e R . Aussi démarrai-je avec le groupe U ( 2 )x U(i) : toutes les matrices unitaires 2 x 2 agissent sur les leptons lévogyres de type e, alors que toutes les matrices unitaires 1 X 1 agissent sur le lepton dextrogyre de type e. Cassant u(2) en transformations unimodulaires e t en transformations de phase, on peut voir que l e groupe était X X Mais alors, l'un des peut être identifié avec le nombre leptonique ordinaire, e t puisque le nombre leptonique se conserve visiblement et qu'aucune particule vectorlelle de masse nulle n'est couplée à ce nombre, je décidai de l'exclure du groupe. II me restait donc le groupe à quatre dans le groupe paramètres SU(2) x u(1).La brisure spontanée de su(2)X de l'invariance de Jauge ordinaire électromagnétique devrait donner des masses à trois des quatre bosons de jauge vectoriels : les bosons chargés W* et un boson neutre Que ]'appelai 2'. Le quatrième boson restait automatiquement sans masse et pouvait être identifié au photon. Connaissant l'intensité des courants charges des interactions faibles comme la désintégration beta dont le médiateur est le la masse du était alors '. détermlnée comme étant environ 40 GeV/ sine, où 8 est l'angle du mélange 7 - 2 Pour aller plus loin. il nous faut faire une hypothèse sur le mécanisme de brisure de su(2)x Le seul type de champ dans une théorie su(2) x renormalisable dont la valeur moyenne dans le vide donne à l'électron une masse est un doublet de spin zéro (@+,@O) et par simplicité j e supposal qu'il s'agissait la des seuls champs scalaires de la théorie. La masse du 2' fut alors déterminée comme environ égale à ûûGeV/sin28. Cela fixait l'intensité des interactions faibles courant neutre. En effet, comme en EDQ, une fois que l'on a choisi ta liste des champs de la théorie, tous les détails sont déterminés par les principes de symétrie et la renormallsation, et seulement quelques paramètres restent libres : les masses et la charge des leptons, la constante de couplage de Fermi de la désintegration bêta, l'angle de mélange 8 et la masse de la particule scalaire. (Il était d'une importance cruciale d'imposer la contrainte de la renormalisation : sinon, les interactions faibles recevraient des contributions des couplages invariants 3 quatre
su(2) su(2)
-
su(2)
su(2) u(i) v(i).
u(i)
u(1)
w*,
u(1).
su(2),
u(1)
w*
u(1)
Vers l'unijïcation des interactions
285
u(1)
fermions su(2) X ainsi que de l'échange du boson vectoriel, et la théorie aurait perdu beaucoup de son pouvoir de prédiction). Le caractère naturel de la théorie dans son ensemble fut bien démontré par le fait qu'en grande partie elle fut développee de manière indépendante par Salam en 1968.
[%'I
La question suivante f u t celle de la renormalisation. Les règles de Feynman pour les théories de Yang-Milk avec des symétries de jauge non brisées avaient été élaborées [28] par de Witt. Faddeev. Popov et d'autres. O n savait que de telles t h e r i e s étaient renormalisabies. Mais en 1967 je ne savais pas comment prouver que ce caractère renormalisable n'était pas détruit par la brisure spontanée de la symétrie. Je travaillai sur ce problème à diflérentes reprises durant plusieurs années, en partie en coilaboratlon avec mes étudiants [29], mais j e fis peu de progrb. Rétrospectivement, j e constate que la principale difficulté provenait de ce qu'en quantifiant les champs vectoriels j'adoptai une jauge que l'on connait maintenant sous le nom de Jauge de i'unitarité [30]. Cette jauge a quelques splendides avantages : elle falt apparaltre le vrai spectre des particules de la théorie. Mais elle présente l'inconvénient de rendre la renormalisation totalement obscure. Finalement, en 1971 't Hooft (311 montra dans un magnifique article comment on pouvait résoudre le problème. II inventa une jauge, comme la " jauge de Feynman " en EDQ, dans laquelle les règles de Feynman ne conduisent manifestement qu'à un nombre fini de divergences de type ultraviolet. II fut aussi nécessaire de montrer que ces lnflnis satisfaisaient essentiellement les mêmes contraintes que le iagrangien lui-même. de sorte qu'ils pouvaient être absorbés en redéfinissant les paramètres de la théorie. (C'était plausible, mais pas facile à prouver, car une théorle invariante de jauge ne peut être quantifiée qu'après avoir choisi une jauge spécifique, de sorte qu'il n'est pas évident que les divergences ultraviolettes satisfont les mêmes contraintes d'invariance de jauge que le lagrangien lui-même). La démonstration fut complétée ensuite [32] par Lee et Zinn-Justin, et par 't Hooft et Veitman. Plus récemment, Becchi. Rouet et Stora [33] ont inventé une méthode ingénieuse pour mener à bien cette sorte de démonstration, en utilisant une supersymétrie globale des théories de jauge qui est préservée même lorsqu'on choisit une jauge spécifique. Je dois admettre que, lorsque je lus pour la première fois i'artlcle de 't Hooft en 1971, je ne fus pas convaincu qu'il avait trouvé la voie pour prouver le caractère renormalisable. L e probleme ne venait pas de 't Hooft, mais de moi : j e n'étais t o u t simplement pas assez familiarisé avec le formalisme des Intégrales de chemin sur lequel était basé le travail de 't Hooft, et l'attendais une démonstration des règles de Feynman dans la jauge de 't Hooft à partir de la quantification canonique. Ceci avait déjà été effectué (pour une classe limitée de théories de jauge) dans un article de Ben Lee [34], et la lecture de cet article. me conduisit à admettre le caractère renormallsable de la théorie unifiée comme essentiellement démontré. A cette époque, beaucoup de physiciens théoriciens commençaient à être convaincus de l'approche générale que Salam et moi avions adoptée : c'est-à-dire, que les interactions faible e t électromagnétique sont gouvernées par un certain groupe de symétries locales de jauge exactes ; ce groupe est spontanément bris4 en U(i), en donnant une masse à tous les bosons vectoriels excepté au photon ; et la théorie est renormalisable. Que notre simple modèle, spécifique, était celui qu'avait choisi la nature n'était pas si clair. C'était, bien entendu, à l'expérience de décider. Ii était évident, même avant 1967, que la meilleure manière de tester la théorie
286
Sources et évolution de la physique quantique
était de chercher les interactions faibles de courant neutre, dont le médiateur serait le boson intermediaire neutre 2 '. Naturellement, la possibilité de courants neutre n'était pas nouvelle. II y avait eu des spéculations [35] sur de possibles courants neutres dès 1937 par Gamow et Teller, Kemmer, et Wentzel, ainsi qu'en 1958 par Bludman et LeiteLopes. Des tentatives vers une théorie unifiée faible e t électromagnétique avaient été menées au début des années 1960 par Glashow, Salam et Ward [36]et elles contenaient les courants neutres, ainsi que beaucoup des caractéristiques que Salam e t mol rencontrâmes en développant notre théorie en 1967-1968.Mais puisque i'une des prédictions de notre théorie était une valeur pour la masse du elle faisait une prédlctlon bien déterminée pour i'intensité des courants neutres. Plus important, nous avions maintenant une théorie quantique des champs d'ensemble des interactions faibles e t électromagnétiques qui était physiquement et mathématiquement satisfaisante au même sens que l'électrodynamique quantique - une théorie qui traitait les photons e t les bosons vecteurs intermediaires sur le même pied, qui était fondée sur un principe de symétrie exacte, et qui permettait de mener des calculs jusqu'au degré de précision désiré. Pour tester cette théorie, il devenait mintenant urgent de trancher la question de l'existence des courants neutres. A la fin de 1971, l'effectuai une étude des possibilités expérimentales [37]. Les résultats étalent saisissants. Des expériences antérieures avaient mis des limites supérieures sur les taux de processus courant neutre qui étaient plut8t basses et beaucoup de gens avaient l'impression que les courants neutres étaient pratiquement exclus. Mais je trouvai qu'en fait la théorie de 1967-1968 prédisait des taux tout à fait bas, assez bas pour avoir échappé à la detection jusqu'à ce jour. Par exemple, des expériences [38] quelques années auparavant avaient trouvé une limite supérieure de O, 12 f O, 06 pour le rapport d'un processus courant neutre - la diffusion élastique de neutrinos muoniques par des protons - au processus courant chargé correspondant - dans lequel un muon est produit. Je trouvai une prédlction pour ce rapport de O, 15 à O, 22. suivant la valeur de l'angle 8 du mélange - 7. Ainsi, il y avait de bonnes raisons de regarder d'un peu plus près. Comme tout le monde le sait, les courants neutres furent finalement découverts en 1973 [39]. Suivirent des années d'études expérimentales soigneuses sur les proprietes détaillées des courants neutres. Passer en revue ces expériences conduirait trop loin de mon sujet [40]. Aussi me limiterai-je à dire qu'elles ont confirmé la théorie de 19671968 avec une précision constamment améliorée en ce qui concerne les réactions courant neutre neutrino-nucléon e t neutrino-électron. Les réactions courant neutre électronnucléon, analysées par la remarquable expérience SLAC-Yale de l'an dernier [41],l'ont également confirmée. Tout cela é t a i t très satisfaisant. Mais je dois dire que je n'aurais pas été autrement surpris s'Il s'était avéré que la théorie correcte était basée sur un autre groupe de jauge spontanément brisé, avec des courants neutres très différents. Une brillante théorie SU(2) avait d'ailleurs été proposée en 1972 par Georgi et Glashow [42] : elle ne comportait pas de courants neutres du tout. Ce qui était important pour moi, c'était l'idée d'un groupe de symétrie exact spontanément brisé, qui relie les interactions faibles et électromagnétiques, e t permet à ces interactions d'être renormalisables. J'étais convaincu de l'intérêt de cette idée, ne serait-ce que parce qu'elle cadrait avec ma conception de la façon d'être de la nature. II me faut mentionner ici deux autres développements théoriques intéressants au tout
zo,
zo
287
Vers l’unijïcation des interactions
début des années 1970, avant la découverte des courants neutres. L’un est l’important travail de Glashow, lllopouios et Malan1 sur ie quark charmé (431. Leur travail apporta une solution à ce qui autrement aurait constitué un problème sérieux, celui des courants neutres avec changement de l’étrangeté. Je laisse ce sujet pour la conférence du Professeur Glashow*. L’autre développement théorique regarde sp5dfiquement les Interactl6ns fortes, mais il nous ramène à l’un des thèmes de mon exposé, le thème de la symétrie. En 1973,Politzer, Gross e t W i l u e k découvrirent (441une remarquable propriété des théories à ia Yang-Mills qu’ils appelèrent la “ liberté asymptotique ” la constante de couplage effective [45] décroit vers zéro lorsque l’énergie caractéristique d’un processus tend vers l’infini. II semblait que cela puisse expliquer le fait expérimental que le nucléon se comporte dans la diffuslon profondément Inélastique d‘un électron à haute énergle comme s’il se composait essentiellement de quarks libres [46]. Mais ii y avait un problème. Afin de donner une masse aux bosons vectoriels dans une théorie de jauge des interactions fortes, on voulait inclure des champs scalaires lnteragissant fortement, et ceux-ci en général détruisent la liberté asymptotique. Une autre difiiculté, l’une de celles qui me gênaient particulièrement, était que dans le cas d’une théorie unifiée des interactions faibles e t électromagnétiques, le couplage faible fondamental est du même ordre que la charge électronique e, de sorte que les effets des bosons vectoriels intermédiaires devraient introduire des violations de la conservation de la parité e t de l’étrangeté beaucoup trop grands, de i’ordre de 1/137, parmi les interactions fortes de ces scalaires entre eux et avec les quarks (471. Durant l’été 1973, il m’apparut (et indépendamment à Gross et à Wiluek) que l’on pouvait se débarrasser des champs scalaires interagissant fortement tous ensemble, en permettant à la symétrie de jauge des interactions fortes de demeurer non-bris6e - de sorte que les bosons vectoriels, ou I’ gluons ”, seraient sans masse et en s’appuyant sur i’augmentation des forces fortes avec l’accroissement de la distance pour expliquer pourquoi ni les quarks ni les gluons sans masse ne sont détectés au laboratoire [48]. Si on suppose qu’il n’y a pas de scalaires Interagissant fortement, qu’il existe trois ‘I couleurs” de quarks (comme l’indiquait un travail antérieur de plusieurs auteurs 1491) et que le groupe de jauge est su(3), alors on a h e théorie spécifique des interactions fortes, la théorie que l’on connaît généralement sous le nom de chromodynamique quantique
-
-
(COQ).
Les expériences ont depuis lors confirmé chaque jour davantage la CDQ comme ia théorie correcte des interactions fortes. Ce qui m’intéresse ici, C’est son impact sur notre compréhension des principes de symétrie. Une fois encore, les contraintes de l’invariance de jauge et de la renormalisation se sont avérées d’une énorme puissance. Ces pntraintes forcent le iagrangien à @tresi simple que les Interactions fortes en CDQ doivent conserver l’étrangeté, la conjugaison de charge et (à part quelques problèmes [50] concernant les instantons) la parité. On n’a pas à supposer i’existence de ces symétries comme des principes a priori ; il n’y a simplement pas moyen que le lagrangien soit suffisamment compliqué pour les violer. Avec une hypothèse supplémentaire, que les quarks u et d aient des masses relativement basses, les Interactions fortes doivent aussi satisfaire la symétrie approchée su(2) x de l’algèbre des courants, qui, lorsqu’elle se brise spontanément, nous donne I’isospin. Si la masse du quark s n’est pas non plus trop
su(2)
*
Conférence Nobel, ce même jour (NdT).
Sources et évolution de la physique quantique
288
grande, on obtient alors la " voie octuple " comme une Symétrie approchée des interactions fortes. Et la brisure de la symétrie X par les masses des quarks a juste la forme (3,3) (3,3) requise pour tenir compte des longueurs de diffuslon pion-pion [15]et des formules de masse de Cell-Mann-Okubo. En outre, les interactions faibles et électromagnétiques étant également décrites par une théorie de Jauge, les courants faibles sont nécessairement les courants associés avec ces symétries de l'interaction forte. En d'autres termes, presque l'ensemble du panorama des symétries approchées des interactions fortes, faibles et électromagnétiques qui nous intriguait tant dans les années 1950 et 1960 se trouvait alors expliqué comme une simple conséquence de l'invariance de jauge forte, faible et électromagnétique, et, de plus, de leur caractère renormalisable. La symétrie Interne est maintenant au point où était la symétrie de l'espace-temps à l'époque d'Einstein. Toutes les symétries internes approchées sont expllquées de manière dynamique. A un niveau fondamental, il n'y a pas de symétrie approchée ou partielle : seules des Symétries exactes gouvernent toutes les interactions. Je vais maintenant regarder un peu plus loin et faire quelques commentaires sur le possible développement futur des ldées de symétrie et de renormalisation.
+
su(3) su@)
Nous sommes encore confrontés à la question de savoir si les particules scalaires responsables de la brisure spontanée de la symétrie de jauge électrofaible x u(1) sont réellement élémentaires. SI elles le sont. les I' bosons de Higgs " de spin zéro se désintégrant semi-faiblement devraient être trouvés à des énergies comparables à celles nécessaires pour produire les bosons vecteurs intermédiaires. D'un autre côté, il se peut que ces scalaires soient composites [51]. Les bosons de Higgs seraient alors des états indistincts, de grandes largeurs, de très grandes masses, analogues à la probable augmentation de la section efficace de l'onde-s de la diffusion ?F - ?F. II devrait aussi probablement exister des particules scalaires d'un type assez différent, plus légères, se désintégrant plus lentement, connues comme des bosons pseudo-Goldstone [52].Et il se pourrait aussi qu'existe une nouvelle classe d'interactions " extra-fortes " [53]pour fournir la force de liaison extra-forte dans la mesure où la liberté asymptotique s'établirait non à quelques centaines de MeV comme en CDQ, mais à quelques centaines de GeV. Ces forces " extra fortes " s'exerceraient entre de%ouvelles familles de fermions et donneraient à ces fermions des masses de l'ordre de quelques centaines de GeV. Nous verrons. Des quatre types d'interactions (maintenant trois), seule la gravité a résisté à l'incorporation dans une théorie quantique des champs renormalisable. Cela peut juste signifier que nous ne sommes pas assez malins pour traiter mathématiquement la relativité générale. Mais il y a une autre possibilité qui me semble tout à fait plausible. La constante de gravité définit une unité d'énergie connue sous le nom d'énergie de Planck, environ 1 0 ' GeV. C'est l'énergie à laquelle la gravitation devient effectivement une interaction forte, de sorte qu'à cette énergie, on ne peut plus longtemps ignorer les divergences ultraviolettes. II se peut qu'existe tout un monde de physique nouvelle avec des degrés de liberté insoupçonnés à ces énergies énormes et que la relativité générale ne fournisse pas un cadre adéquat pour comprendre la physique des degrés de liberté à ces super-hautes énergies. Lorsque nous explorons la gravitation ou d'autres phénomenes ordinaires, avec des masses et des énergies de particules pas plus grandes qu'un TeV ou proches, nous ne pouvons découvrir qu'une théorie des champs " effective ",c'est-&dire, une théorie dans laquelle les degrés de liberté superlourds n'apparaissent pas explicitement, mais où les paramètres de couplage représentent implicitement des sommes sur
su(2)
Vers l'unification des interactions
289
ces degrés de liberté cachés. Pour voir SI cela a un sens, supposons que ce soit vrai, et demandons-nous quelles sortes d'interactions nous nous attendons à trouver sur cette base à l'énergie ordinaire. En " intégrant sur " les degrés de liberté des énergies superhautes dans une théorie fondamentale, nous rencontrons en générai une théorie de champ effectif très compliquée - si compliquée, en fait, qu'elle contient toutes les interactions permises par les principes de symétrie. Mals lorsque l'analyse dimensionnelle nous dit qu'une constante de couplage est une certaine puissance d'une certaine masse, cette masse est vraisemblablement une masse typiquement superlourde, telle que 1 0 ' GeV. La variété infinie d'interactions nonrenormalisables dans la théorie effective a des constantes de couplage dont la dimension est celle de puissances négatives de la masse, de sorte que leurs effets sont supprimés aux énergies ordinaires par des puissances de l'énergie divisée par ces masses superlourdes. Donc les seules interactions que nous pouvons détecter aux énergies ordinaires sont celles qui sont renormalisables au sens usuel, plus des interactions non-renormalisables produisant des effets qul. bien que ténus. sont d'une manière ou d'une autre suffisamment exotiques pour être vus. Une interaction très faible peut éventuellement être détectée si elle est cohérente et de longue portée, de sorte qu'elle peut s'additionner et avoir des effets macroscopiques. On a montré [54] que les seules particules dont l'échange pourrait produire de telles forces sont des particules sans masse de spin O, 1 ou 2. D'autre part, l'invariance de Lorentz à elle seule est capable de montrer que les interactions à longue portée produites par toute particule de masse zéro et de spin 2 doit obéir à la relativité générale [55]. Donc, suivant ce point de vue, nous ne serions pas trop surpris que la gravitation soit la seule interaction découverte Jusqu'ici qui ne semble pas décrite par une théorie des champs renormalisable : c'est presque la seule interaction superfaible qui pouvait avoir été détectée. Et nous ne serions pas surpris de trouver que la gravité est bien décrite par la relativité générale aux échelles macroscopiques, même si nous ne pensons pas que la 0 ' GeV. relativité générale puisse s'appliquer à 1 Des interactions effectives non-renormalisables peuvent aussi être détectées si elles violent par ailleurs des lois de conservation exactes. Les meilleurs candidats à la vioiation sont la conservation des baryons et des leptons. Une conséquence remarquable des symetries de Jauge et su(2) X v(1) des interactions fortes, faibles et électromagnétiques, est que toutes les interactions renormalisables entre les particules connues conservent automatiquement les nombres baryonique et leptonique. Donc, le fait que la matière ordinaire semble assez stable - que la désintégration du proton n'ait pas été observée - ne devrait pas nous conduire à la conclusion que les lois de conservation des baryons et des leptons sont des lois de conservation fondamentales. A la précision à laquelle elles ont été vérifiées, les conservations des leptons et des baryons peuvent être expliquées comme des conséquences dynamiques d'autres symétries, de la même manière que la conservation de l'étrangeté peut être expliquée dans la CDQ. Mais les particules superlourdes peuvent exister et elles peuvent avoir des propriétés de transformation inhabituelles suivant su(3)ou X Su(1). Dans ce cas, il n'y a aucune raison pour que ces interactions conservent le nombre baryonique ou ie nombre leptonique. Je doute qu'elles le fassent. En effet, le fait que l'Univers semble contenir un excès de baryons sur les antibaryons devrait nous conduire à soupçonner que des processus ne conservant pas le nombre baryonique aient effectivement eu lieu. SI les effets d'une toute petite non
su(3)
su(2)
290
Sources et éuolution de la physique quantique
conservation du nombre baryonique ou leptonique tels que la désintégration du proton ou les masses des neutrinos étaient découverts expérimentalement, il nous resterait alors des symétries de jauge au seul niveau des vraies symétries internes de la nature, une conclusion qul me paraitrait très satisfaisante. L'idée d'une nouvelle échelle de masses superlourdes est apparue d'une autre manière [56].Si une sorte de '' grande unification " des couplages de jauge forts et électrofaibles était possible, on s'attendrait à ce que toutes les constantes de couplage de jauge de et de sü(2) x ü(i)soient de grandeur comparable. (En partlculler, si et s U ( 2 ) x U(1) sont des sous-groupes d'un groupe simple plus grand, les rapports du carré des couplages sont fixés comme étant des nombres rationnels de l'ordre de l'unité 157)). Mais ceci semble entrer en contradiction avec le f a i t évident que les interactions fortes sont plus fortes que les interactions faibles et électromagnétiques. En 1974 Georgi, Quinn e t moi-même suggérions que l'échelle de la grande unification, à laquelle les couplages sont comparables, se trouve à une énergie énorme, et que la raison pour laquelle le couplage fort est si grand devant les couplages électrofaibles aux énergies ordinaires est que la CDQ est asymptotiquement libre, de sorte que sa constante de couplage effective monte lentement lorsque l'énergie tombe de l'échelle de l a grande unification aux valeurs ordinaires. La variation des couplages forts est très lente (en I/-), de sorte que l'échelle de la grande unification doit être énorme. Nous trouvions que pour une assez grande classe de théories l'échelle de grande unification se trouve être dans les parages de GeV, une énergie pas trop différente de l'énergie de Planck de 1 0' GeV. La vie moyenne du nucléon est très difficile à estimer avec précision, mais nous donnions une valeur représentative de ans, qui semble accessible en quelques années d'expériences. (Ces estimations ont été améliorées en des calculs plus détaillés par quelques auteurs Nous avons aussi calculé une valeur pour le paramètre de mélange sinZ0 d'environ 0,2, pas trop éloignée de la valeur actuelle de O, 23 f O, 01. Une tache importante pour les futures expériences sur les courants neutres sera d'améliorer la précision avec laquelle sin2 8 est connu, pour vérifier s'il est réellement en accord avec cette prédiction. Dans une théorie de grande unification, afin que les particules scalaires élémentaires soient disponibles pour produire une brisure spontanée de la symétrie de jauge électrofaible aux environs de quelques centaines de GeV, il est nécessaire que ces particules évitent d'acquérir les supermasses à partir de la brisure spontanée du groupe de grande unification. II n'y a rien d'impossible à cela, mais je n'ai pas été capable de trouver une raison quelconque pour que cela se produise. (Le problème peut être en rapport avec le vieux mystère de la raison pour laquelle les corrections quantiques ne produisent pas une énorme constante cosmologique ; dans les deux cas, on a affaire à un terme ' I superrenormalisable " anormalement petit dans le lagranglen effectif qui doit être ajusté a la valeur zéro ; dans le cas de la constante cosmologique, l'ajustement doit avoir la précision de la cinquantième décimale). Avec des scalaires élémentaires de masse nue zéro ou petite, les rapports énormes d'échelles de brisure de symétrie peuvent se produlre d'une manière tout à fait naturelle (59). D'un autre côté, s'Il n'y avait pas de scalaires élémentaires qui évitent d'acquérir des masses énormes lors de la brisure du groupe de jauge de grande unification, alors, comme je l'al déjà mentionné, il doit exister des forces extra-fortes pour lier les bosons de Higgs et de Goldstone composites qui sont associés à la brisure spontanée de X De telles forces peuvent apparaître de manière plutôt naturelle dans les théories de grande unification. Pour prendre un
su(3)
su(3)
I.%]).
su(2) u(1).
Vers iunzjication des interactions
291
su(3)
exemple, supposons que le grand groupe se brise, non pas en x s U ( 2 ) x V(l), mais en su(4) X X su(2)X u(i). Puisque su(4) est un groupe plus grand que sa constante de couplage augmente lorsque l'énergie décroft plus rapidement que le couplage CDQ, de sorte que ia force devient forte à une énergie beaucoup plus haute que les quelques centaines de GeV auxquels la force de la COQ devient forte. Les leptons et les quarks ordinaires seraient neutres sous su(4), de sorte qu'ils ne ressentlraient pas cette force, mais d'autres fermions pourraient porter les nombres quantiques de su(4) et acquérir ainsi des masses plutôt grandes. On peut même imaginer une suite de sous-groupes de taille grandissante du grand groupe de jauge, qul rempliralent le grand domaine d'énergie jusqu'à 10" ou 10" GeV avec des masses de particules qui seraient produites par ces Interactions chaque fols plus fortes. S'Il existe des scalaires élémentaires dont les valeurs moyennes dans le vide sont responsables des masses des leptons et des quarks ordinaires, ces masses peuvent être affectées à l'ordre a par les corrections radiatives affectant les bosons vectoriels superlourds du grand groupe de jauge, e t ilsera probablement impossible d'expliquer des valeurs comme m,/m,, sans une théorie de grande unification complète. D'un autre côté, si ces scalaires élémentaires n'existent pas, presque tous les détails de la théorie de grande unification sont oubliés par la théorie des champs effective qui décrit la physique aux énergies ordinaires. II devrait alors être possible de calculer les masses des quarks e t des leptons en termes exclusifs de processus ayant lieu aux énergies accessibles. Malheureusement, personne jusqu'ici n'a été capable d'expliquer comment pourrait se produire de cette manière quoi que ce soit qui ressemble au tableau des masses observé [60]. Mettons de côté toutes ces incertitudes et supposons qu'il existe une théorie vraiment à loi9 GeV, 2 fondamentale carctérisée par une échelle d'énergie de l'ordre de laquelle les interactions fortes, électrofaibles e t gravitationnelles sont toutes unifiées. Ce peut être une théorie quantique des champs renormalisable conventionnelle, mais pour l'Instant, si nous incluons la gravité, nous ne voyons pas comment c'est possible. (Je laisse le sujet de la supersymétrie e t de la supergravité pour l'exposé du Professeur Salam*). Mais si cette théorie n'est pas renormalisable, qu'est-ce qui détermine alors l'ensemble infini des constantes de couplage qui sont nécessaires pour absorber toutes les divergences ultraviolettes de ladite théorie ? Je pense que la réponse tient au fait que la théorie quantique des champs, qui naquit il y a juste cinquante ans du mariage de la mécanique quantique et de la relativité, est un très bel enfant. mais pas très robuste. Comme Landau e t Killén s'en rendirent compte il y a longtemps, la théorie quantique des champs à très hautes énergies est susceptible de toutes sortes de maladies - tachyons, fantemes. etc. - et elle a besoin d'un traltement spécial pour survivre. Une manière pour la théorie quantique des champs d'éviter ces maladies est d'être renormallsable e t asymptotiquement libre, mais il existe d'autres possibilités. Par exemple, m@meun ensemble infini de constantes de couplage peut approcher un point fixe qui ne soit pas zéro lorsque l'énergie à laquelle elles sont mesurées tend vers l'infini. Cependant exiger ce comportement impose tant de contraintes sur les couplages qu'il ne reste seulement qu'un nombre fini de paramètres libres [Si] - juste comme dans le cas des théories qui sont renormalisables au sens usuel. Ainsi, d'une maniere ou d'une autre, j e pense que la théorie quantique des champs est en train
su(3),
*
su(3)
su(4)
Conférence Nobel, ce même jour (NdT).
292
Sources et évolution de la physique quantique
de devenir très entêtée, refusant de nous permettre de décrire autre chose qu'un petit nombre de mondes possibles, parmi lesquels, espérons-le, se trouve le nôtre. Je suppose que ma tendance est l'optimisme quant au futur de l a physique. Et rien ne me rend plus optimiste que la découverte des symétries brisées. Dans le septième llvre de La République, Platon décrit des prisonniers qui sont enchaînés dans une caverne et qui ne voient que les ombres des choses extérieures projetées sur les parois de la caverne. Lorsqu'ils sont libérés de la caverne, au début les yeux leur font mal et pendant un moment ils pensent que les ombres qu'ils voyaient dans la caverne étalent plus réelles que les objets qu'ils voient maintenant. Mais finalement leur vision s'éclaircit et ils comprennent combien le monde réel est beau. Nous sommes dans une caverne de ce genre, prisonniers des limites qu'ont les expériences que nous pouvons faire. En particulier, nous ne pouvons étudier la matière qu'à des températures relativement basses, où il est probable que les symétries soient spontanément brisées, de sorte que la nature ne nous apparaît ni vraiment simple, ni unifiée. Nous n'avons pas été capables de sortir de la caverne, mais en regardant longuement et Intensément les ombres sur sa paroi, nous pouvons au moins distinguer les formes des symétries, qui, bien que brisées, sont les princlpes exacts qui gouvernent tous les phénomènes, les expressions de ia beauté du monde extérieur.
II ne m'a été possible de donner des références que d'une toute petite partie de la littérature sur le sujet discuté dans cette conférence. On peut trouver des références supplémentaires dans les revues suivantes :
Abers, E.S. et Lee, B.W., Gauge Theories (Physics Reports 9c No 1, 1973) Marciano, W.et Pagels, H., Quantum Chromodynamics (Physics Reports 36C No 31, 1978) Taylor, J.C., Gauge Theories o f Weak lntefactions (Cambridge Univ. Press, 1976).
Références de l'article 1 Tuve M.A.. Heydenberg N. et Hafstad L.R. Phys. Rev. 50,806 (1936); Breit G.. Condon E.V. et Present R.D. Phys. Rev. 50, 825 (1936) ; Breit G. e t Feenberg E. Phys. Rev. SO, 850
(1936). 2 Gell-Mann M. Phys. Rev. 92. 336 (1953); Nakano T. e t NlshlJirna K. Prog. Theor. Phys. 10, 581 (1955). 3 Lee T.D. et Yang C.N. Phys. Rev. 104. 254 (1956) : Wu C.S. e t al. Phys. Rev. 105, 1413 (1957): Garwin R.. Lederman L. e t Weinrich M. Phys. Rev. 105,1415 (1957); Friedman J I. et Telegdl V.L. Phys. Rev. 105, 1681 (1957). 4 Gell-Mann M. Cal. Tech. Synchrotron Laboratory Report CTSL-20, non publié; Ne'eman Y. Nucl. Phys. 26. 222 (1961). 5 Fock V. 2. f. Physlk 39 ,226(1927); Weyl H. Z. f. Physik 56. 330 (1929). Le nom 'Invariance de Jauge" est basé sur une analogie avec les spéculations antérieures de Weyl H. dans Raum, Zeit, Materie. 3e éd. (Springer, 1920). Volr aussi London F. 2. f. Physik 42, 375 (1927). (Cette hldolre a et6 passée en revue par C.N. Yang dans un expose à Clty College. (1977)). 6 Yang C.N. et Mills R.L. Phys. Rev. 96, 191 (1954). 7 Goldstone J. Nuovo Ciment0 19. 154 (1961). 8 Goldstone J.. Salam A. et Weinberg S. Phys. Rev. 127, 965 (1962).
Vers l'unification des interactions
293
9 Higgs P.W. PhYs. Lett. 12, 132 (1964) ; 13. 508 (1964) ; PhYs. Rev. 145. 1156 (1966) ; Kibble T.W.B. Phys. Rev. 155. 1554 (1967) ; Gurainik G.S., Hagen C.R. et Kibble T.W.B. Phys. Rev. Lett. 13. 585 (1964) ; Englert F. et Brout R. Phys. Rev. Lett 13. 321 (1964) ; voir aussi Anderson P.W. Phys. Rev. 130. 439 (1963). 10 Adler S.L. Phys. Rev. Lett. 14, 1051 (1965) ; Phys. Rev. 140 B, 736 (1965) : Weisberger W.I. Phys. Rev. Lett. 14, 1047 (1965) : Phys. Rev. 143. 1302 (1966) ; 11 Gell-Mann M. Physlcs 1. 63 (1964). 12 Nambu Y. et Jona-Lasinio G. Phys. Rev. 122, 345 (1961) ; 124, 246 (1961) ; Nambu Y. et Lurie D. Phys. Rev. 125, 1429 (1962) : Nambu Y. et Shrauner E. Phys. Rev. 128, 862 (1962) ; voir aussi Gell-Mann M. et Levy M. Nuovo Ciment0 16, 705 (1960). 13 Goidberger M.L., Miyazawa H. et Oehme R. Phys. Rev. 99,986 (1955). 14 Goldberger M.L. et Treiman S.B. Phys. Rev. 111. 354 (1958). 15 Weinberg S . Phys. Rev. Lett. 16, 879 (1966) : 17. 336 (1966) : 17, 616 (1966) : 18, 188 (1967) : Phys. Rev. 166, 1568 (1967). 16 Oppenheimer J.R.. Phys. Rev. 35, 461 (1930) ; Waller I. Z. f. Physik 59. 168 (1930) ; ibid. 62, 673 (1930). 17 Feynman R.P. Rev. Mod. Phys. 20, 367 (1948) ; Phys. Rev. 74. 939, 1430 (1948) ; 76, 749. 769 (1949) ; 80, 440 (1950) : Schwinger J. Phys. Rev. 73, 146 (1948) : 74, 1439 (1948) : 75, 651 (1949) ; 76. 790 (1949) ; 82. 664, 914 (1951) : 91, 713 (1953) ; froc. Nat. Acad. Scl. 37. 452 (1951) : Tomonaga S. frog. Theor. Phys. (Japan) 1, 27 (1946) ; Koba Z.. Tati T. et Tomonaga S. lbid. 2. 101 (1947) ; Kanazawa S . et Tomonaga S. /bid. 3, 276 (1948) : Koba Z. et Tomonaga S. ibid. 3. 290 (1948). 18 Que les inflnis puissent être éliminés des théories quantiques des champs de cette manière avait
été déJà antérieurement suggéré var Weisskopf V.F. Kong. Dansk. Vld. Sel. Mat.-Fys. Medd. 15, (6) 1936, en partlcuiier p. 34 et pp 5-6; Kramers H. (non publié). 19 Dyson F.J. Phys. Rev. 75,486, 1736 (1949). 20 Weinberg S. Phys. Rev. 106. 1301 (1957). 21 Weinberg S. Phys. Rev. 118,838 (1960). 22 Salam A. Phys. Rev. 82. 217 (1951) : 84, 486 (1951). 23 Weinberg S . Phys. Rev. Lett. 18. 507 (1967). 24 Pour le caractère non-renormalisable des théories avec des symétries de jauge brisées de manière intrinsèque, voir Komar A. et Salam A. Nucl. Phys. 21,624 (1960) : Umezawa H. et Karnefuchi S. Nucl. Phys. 23, 399 (1961) ; Kamefuchi S . , O'Raifeartalgh L. et Salam A. Nucl. Phys. 28. 529 (1961) ; Salam A. Phys. Rev. 127. 331 (1932) : Veltman M. Nucl. Phys. B7, 637 (1968) : B21, 288 (1970) : Boulware D. Ann. Phys. (N.Y.) 56. 140 (1970). 25 On rend compte brièvement de ce travail en ref. 23, note en bas de page 7. 26 Weinberg S. Phys. Rev. Lett. IS,1264 (1967). 27 Salam A. dans Elementary Particle Physics (Symposium Nobel No. 8) édité par Svartholm. N. (Aimqvist and Wiksell. Stockholm, 1968). p.367. 28 de Witt B. Phys. Rev. Lett. 12. 742 (1964) : Phys. Rev. 162. 1195 (1967) : Faddeev L.D. et Popov V.N. Phys. Lett. B25, 29 (1967) ; voir aussi Feynman R.P., Acta. yhys. Pol. 24. 697 (1963) ; Mandelstam S. Phys. Rev. 175. 1580. 1604 (1968). 29 Voir Stuiier L.M.I.T., Thèse Ph. D. (1971) non-publiée. 30 J'ai mentionné l'utilisation de la Jauge d'unltarité dans Weinberg S. Phys. Rev. Lett. 27, 1688 (1971) et l'ai décrite plus en détail dans : Weinberg S . Phys. Rev. D7, 1068 (1973). 31 't Hooft G. N u d . Phys. B35, 167 (1971). 32 Lee B.W. et Zinn-Justin J. Phys. Rev. D5. 3121, 3137, 3155 (1972) : 't Hooft G. et Veitman M. Nucl. Phys. B44. 189 (1972) ; B50, 318 (1972) ; Restait encore le problème de possibles anomalies à la Adler-Bell-Jackiw, mais elles s'annulèrent très bien : voir Gross D.J e t Jackiw R. Phys. Rev. D6. 477 (1972) et Bouchiat C.. lllopouios J. et Meyer P. Phys. Lett. 38B. 519 (1972). 33 Beechi C..Rouet A. et Stora R. Comm. Math. Phys. 42. 127 (1975). 34 Lee B.W. Phys. Rev. D5, 823 (1972). 35 Gamow G. et Teller E. Phys. Rev. 51. 288 (1937) ; Kemmer N. Phys. Rev. 52, 906 (1937) : Wentzel G. Helv. Phys. Acta. 10. 108 (1937) ; Biudman S Nuovo CImento 9. 433 (1958) ; Leite-Lopes J. Nud. Phys. 8. 234 (1958). 36 Glashow S.L. Nucl. Phys. 22,519 (1961) : Salam A. et Ward J.C. Phys. Lett. 13, 168 (1964). 37 Weinberg S. Phys. Rev. D5, 1412 (1972). 38 Cundy D.C. et ai., Phys. Lett. 31B. 478 (1970).
294
Sources et évolution de la physique quantique
39 La premlère découverte des courants neutres publiée fut celle faite à la Chambre à Bulles Gargamelle au CERN : Hasert F.J. et al. Phys. Lett. 48B, 121, 138 (1973). Volr aussi M u w t P. Jour. de Physlque 11/12 T34 (1973). Des événements sans muons furent observés à peu prës au meme moment par le groupe HPWF au Fermllab. mals lorsque la publlcatlon de leur
40
41 42 43
44
artlde fut retardée, lis en profltèrent pour reconstrulre leur détecteur et ne trouvèrent plus alors le meme slgnal de courants neutres. Le groupe HPWF publla sa découverte des courants neutres dans Benvenutl A. et al. Phys. Rev. Lett. 32. 800 (1974). Pour une revue des données voir Baltay C. Proceedings of the 19ih Inlemational Conference on High E n m Physics. Tokyo. 1978. Pour les analyses théorlques. voir Abbott L.F. et Barnett R.M. Phys. Rev. D19, 3230 (1979) ; Langacker P., Klm J.E., Levine M., Wlllams H.H. et Sldhu D.P. Neutrino conference '79'; et les références antérleures qui y sont citées. Prexott C.Y. et al., Phys. Lett. 77B, 347 (1978). Glashow S.L. et Georgl H.L., Phys. Rev. Lett. 28, 1494 (1972). Volr aussi Schwlnger J. Annals of Physlcr (N.Y.) 2. 407 (1957). Glashow S.L.. IIIO~OUIOS J. et Malan1 L. Phys. Rev. D2. 1285 (1970). Cet artlcie avait été cité dans la ref. 37 comme apportant une x>lUtlOn possible au prObl&tW des courants neutres changeant l'étrangeté. Cependant, à l'époque, l'avals des doutes sur le modèle des quarks, de sorte que les calculs de la ref. 37 Incorporèrent les baryons dans la theorie en prenant le proton et le neutron sous forme d'un doublet SU(2). les particules étranges y étant tout simplement ignorées. Politzer H.D. Phys. Rev. Lett. 30, 1346 (1973) ; Gross D.J. et Wllczek F. Phys. Rev. Lett.
SO. 1343 (1973). 45 Les constantes de couplage effectives dépendant de I'énergle furent Introduites par Gell-Mann M. e t Low F.E. Phys. Rev. 95. 1300 (1954). 46 Bloom E.D. et al.. Phys. Rev. Lett. 23. 930 (1969) ; Breidenbach M. et al., Phys. Rev. Lett. a3.935 (1969). 47 Welnberg 5. Phys. Rev. D8. 605 (1973). 48 Gross D.J. et Wiluek F. Phys. Rev. D8. 3633 (1973) ; Weinberg S. Phys. Rev. Lett. 31, 494 (1973). Une Idée semblable fut proposée avant la découverte de la liberté asymptotique par Frltzsch H., Gell-Mann M. et Leutwyler H. Phys. Lett. 47B. 365 (1973). 49 Greenberg O.W. Phys. Rev. Lett. 13. 598 (1964) ; Han M.Y.et Nambu Y. Phys. Rev. 139B 1006 (1965) ; Bardeen W.A., Frltzsch H. et Gell-Mann M. dans Scale and Conformal Symmetry In Hadron Physlcs, ed. par Gatto R. (Wlley, 1973). p. 139; etc. SO 't Hooft G. Phys. Rev. Lett. 37, 8 (1976). 51 De tels mécanismes "dynamiQues" pour briser spontanément des symétries furent d'abord dlscut& par Nambu Y. et Jona-Laslnlo G. Phys. Rev. 122, 345 (1961) ; Schwinger J. Phys. Rev. 125, 397 (1962) ; 128. 2425 (1962) ; et dans le contexte des théories de Jauge modernes Dar Jacklw R. et Johnson K. Phys. Rev. D8. 2386 (1973) ; Cornwall J.M. et Norton R.E. Phys. Rev. D8, 3338 (1973). Les Impilcations de la brisure dYnamlQUede symétrle ont été considérées par Welnberg S. Phys. Rev. D13. 974 (1976) ; D19. 1277 (1979). Sussklnd L. Phys. Rev. D20. 2619 (1979). 52 Weinberg S. ref. 51. La posslblllté de pSeUdO-bosonS de Goldstone fut lndlquëe à I'orlgine dans un contexte dlfférent par Welnberg 5 . Phys. Rev. Lett. 29, 1698 (1972). 53 Welnberg S. ref. 51. Des modèles faisant lntervenlr de telles Interactions ont aussl été dlscutés par Sussklnd L. ref. 51. 54 Weinberg S. Phys. Rev. 135B. 1049 (1964). 55 Weinberg S. Phys. Lett. 9, 357 (1964) ; Phys. Rev. B138. 988 (1965) ; Lectures in Particles and Fle/ds Theory, ed. par Deser S. et Ford K. (PrentlceHall, 1965). p.988; et ref. 54. Le programme visant à dédulre la relativlté génerale de la mécanique quantique et de la relathrité restrelntc fut complété par Boulware D. et Deser S. Ann. Phys. 89. 173 (1975). J'al entendu que des idées semblables ont ëté développ6es par Feynman R. dans des cours non pUbllëS donnés
au Cal. Tech. 56 Georgi H.. Quinn H. et Weinberg S. Phys. Rev. Lett. 33. 451 (1974). 57 Un exemple de groupe de jauge simple pour les interactlons faibles et électromagnétlques (pour lequel sin' 8 = f ) fut donné par S. Welnberg Phys. Rev. DS, 1962 (1972). II y a de nombreux modèles SPéciii~uesd'lnteractlons faible. électromagnétl~ueet forte basés sur des groupes de Jauge slmples. en comptant ceux de Pati J.C. et Salam A. Phys. Rev. D10, 275 (1974) ; Georgl H. et Glashow S.L. Phys. Rev. Lett. 32, 438 (1974) ; Georgl H. dans ParWes and Fields (American lnstltute of Physlcs, 1975) ; Frltzsch H. .et Mlnkowskl P. Ann. Phys. 93, 193 (1975) ; Georgl H. et NanOpOUlOS D.V. Phys. Lett. B82, 392 (1979) ; Gtirsey F., Ramond
Vers l'unification des interactions
295
P. et Sikivie P. Phys. Lett. B60. 177 (1975) : GUrsey F. et Slkivle P. Phys. Rev. Lett. 36, 775 (1976) ; Ramond P. Nucl. Php. Bila, 214 (1976) : etc.: ils violent tous la conservation leptonique et baryoniQue. car ils ont les Quarks et les leptons dans les m h e s multiplets: voir Pati J.C. et Salam A. Phys. Rev. Lett. 31. 661 (1973) ; Phys. Rev. D8. 1240 (1973). 58 Buras A. Ellis J., Gaillard M.K. et Nanopoulos D.V. N u d Phys. B135, 66 (1978) ; R o n D. Nucl. Phys. B140, 1 (1978) : Marciano W.J. Phys. Rev. 0 2 0 . 274 (1979) ; Goldman T. et Ross D. CALT 68-704. dolt être publié; JarlskJog C. et Ynduraln F.J. Prétirage CERN. doit W e public Machacek M. Prdtirage Harvard HUTP-79/AOZI. doit l t r e publié dans Nuclear Physlcr. Weinberg article en Dréparation. La phénoménologie de la désintégration du nucléon a été dlxutet en termes généraux par Weinberg S. Phys. Rev. Lett. 43, 1566 (1979) ; Wliuek F. et Zee A. Phys. Rev. Lett. 43. 1571 (1979). 59 Glldener E. et Weinberg S. Phys. Rev. D13, 3333 (1976) :Weinberg S. Phys. Lett. 02B.387 (1979). En général, il devrait exister au moins une particule scalaire avec une masse physique de l'ordre de 10 GeV. Les premiers à considérer la brisure spontanée de symétrie dans des modèies possédant une masse scalalre nue égale a zéro furent Coleman S. et Weinberg S. Phys. Rev. D7. 1888 (1973). 60 Ce problème a récemment étë étudié par DlmopouloS S. et Susskind L. Nucl. Phys. B165. 237 (1979) ; Elchten E. et Lane K. Phys. Lett.. a publier; Weinberg S. non pUbllé. 61 Weinberg S. dans General Relarlvlty An Einstein Centenary Survey, éd. par Hawklng S.W. et Israel W. (Cambridge Unlv. Press, 1979), Chapitre 16.
-
296
6.4
Sources et évolution de la physique quantique
La super-unification
Les interactions fondamentales à l'œuvre dans la nature sont schématisées dans le tableau 8. Tableau 8
Les interactions fondamentales en physique Interaction
Intensité des constantes
Champs Champ sans masse graviton (spin 2)
Gravitationnelle
Champ avec masse
w+, w-, 20
Faible
(SP" 1) Champ sans masse photon (spin 1)
Electromagnétique
Forte
Constante qui dépend Champ sans masse gluons du transfert d'impulsion (spin 1) ?our la matière nucléaire 4r c -10
-+
La gravitation, négligeable à l'échelle atomique, joue un rôle primordial dans l'évolution des étoiles et de l'univers. Sa prédominance, lorsque le combustible de la fusion nucléaire est épuisé dans les masses stellaires, conduit à l'effondrement des étoiles, avec formation des naines blanches, des pulsars et des trous noirs - dans ces objets, la gravitation l'emporte halement sur la répulsion des électrons, puis des neutrons (répulsion due au principe de Pauli) et infléchit la lumière vers l'intérieur : rien ne sort donc des trous noirsg3. Les champs de ces interactions sont tous des champs de jauge - nous croyons que le champ de bosons faibles (avec brisure de symétrie) et le champ de gluons sont des champs de jauge au même titre que le champ de gravitation et celui des photons.
93 Voir S. Hawking, Une brève histoin du temps, Flammarion, Paris (1988) ;les artides fondamentaux sont ceux de J.R. Oppenheimer et G . Volkoff, îhys. Rev. 55,374 (1939) ; J.R.Oppenheimer et H. Snyder, Phys. Reu 58,455 (1939).
Tableau 9
(Gaiil&) est identique Lia force de gravitniion entre LOUS Ica corpa (Ncwton)
(la phydque dans l'espace-tempi) (Einatdn, Lorentz, Poincaré) : l'hcrgie n une marse
la gravitation (Einstein) ln matière modifie la métrique qui d&nil le champ
quantique
(?I
aux foreni magnétiques: la lumière est de nature
-
électromagnétique Supcrunificntion
Elcctrodynnmiquc
la Mécanique quantiquc
(dc Broglie, Schrodinger, Hciscnbcrg, Born, Dirnc, Pauli) rdgiî IC mondc microawpiquc
- quantiquc (Dirac, Hcisenberg, Pauli, - Tomonaga, Feynman,
(7)
3'
m Grnndc
unification (7)
R3. vi 3
La Intcrnctiona fniblcr (Fcnni, Feynman, Gell-Mann, Marchak-Sudnrahm) nfïcctcnt Icptons cl qucuka Chromodynamique quantique (t'Hooft, . fortes (Yuliawn) araocicnt Ics quarka
Bjorken, Polyakov, Pulitzer)
N
\O
u
298
Sources et évolution de la physique quantique
Le tableau 9 indique la tendance actuelle de la physique vers la construction d’une grande théorie qui unifie toutes les interactions - un héritage des efforts d’Einstein jusqu’à la fin de sa vie pour tenter d’unifier l’électromagnétisme et la gravitation. Ces tentatives d’unification rencontrèrent leur premier succès avec celui du modèie électrofaible de Weinberg, Salam et Glashow. L’équation e = g sin& montre qu’il ne s’agit là que d’une semi-unification,puisque deux constantes interviennent dans la théorie - la suggestion de 1958’* correspondrait à une vraie unification, puisque pour ûw = f, une seule constante e = g intervient. La grande unification, celle des interactions fortes avec les forces électrofaibles, a fait l’objet de plusieurs modèles, le plus suggestif étant le modèle SU(5) de Glashow, qui ne fait intervenir qu’une constante de couplage. Cette unification impose aux leptons et aux quarks d’apparaître comme des composantes de l’objet géométrique de l’espace des représentations : cela entraîne que le proton doit se désintégrer en positon et pion neutre, une désintégration non encore observée aujourd’hui, même si cette désintégration est supposée correspondre à une demi-vie de ans. Ce modèle implique également l’existence de bosom lepto-baryoniques de très grandes masses. Une autre approche est celle de la supersymétrie (voir l’article XiX ci-après). Beaucoup reste donc à faire dans ce domaine, ainsi que dans celui de la quantification de la gravitation, qui attend elle aussi une forme satisfaisante sinon définitive. La cosmologie et la physique des particules sont de plus en plus des source3 d’inspiration mutuelles : le modèle du Sig Bang par exemple suppose qu’aux très secondes, une hautes énergies où baignait l’univers entre l’instant initial et seule force était présente - c’est ce qu’implique la liberté asymptotique lorsqu’elle fait converger les quatre interactions pour des transferts de moment de l’ordre de la masse de Planck (10’9GeV/cZ). La création des photons, des leptons et des quarks libres s’accompagnerait d’une brisure de cette symétrie universelle, allant de pair avec l’établissement de la hiérarchie des interactions, avec l’expansion et le refroidissement de l’univers peuplé des photons émis dans l’explosion primordiale. Suivraient la génération des masses, le confinement des quarks, la formation des baryons, des mésons et des noyaux. Ainsi sont perçues par les physiciens d’aujourd’hui la naissance, l’évolution des structures de la matière, jusqu’à l’avènement du vivant. Les modèles qu’ils formulent pour imaginer le monde vivent, eux aussi : ils naissent, prennent corps, remplacent ceux qui les ont précédés, se transfigurent et meurent à leur tour.
cf réf. 77 p 259.
Article XIX
L’unification de toutes les interactions ? La supersymétrie et l’unification des interactions fondamentales
PIERRE FAYET Bulletin de la Soclété Française de Physique,
91 9 - 11 (1993)
où en sont les tentatives en vue d’une unification éventuelle des interactions fondamentales t Quelles sont les symétries profondes des lois de la Nature et y en aurait-il d’autres que celles que nous connaissons ? Qu’est ce que la ” supersymétrie ” et que pourrait-elle nous apprendre sur les lois fondamentales ? On peut présenter la supersymétrie comme une structure algébrique étendant celle du groupe de Lorentz, qui est à la base de la relativité. O u bien encore, sous une forme plus physique, comme une symétrie pouvant relier des particules de spin entier - ou bosons - et des particules de spin demi-entier - ou fermions. Encore faudralt-il savoir de quels bosons e t de quels fermions II s’agit, ce dont nous reparlerons par la suite. L’algèbre d e supersymétrie On sait depuis Einstein que les lois de la physique doivent s’exprimer de manière Invariante par rapport aux changements de coordonnées dans l’espace-temps. Ces transformations font intervenir la généralisation des rotations dans i’espace-temps à 4 dimensions, comprenant, en plus des rotations, les transformations de Lorentz. La relativité générale, où l’espace-temps peut être courbé, conduit à une description de la gravitation, liée aux déformations de cet espace. La supersymétrie est, au départ, une structure mathématique qui, sur le plan algébrique, étend et généralise l’invariance par relativité. Elle fait intervenir, comme toute symétrie continue, des genérateurs infinitésimaux. satisfaisant à certaines relations alg& briques. Revenops aux rotations, qui en général ne cornmutent pas entre elles. Dans l’espace a trois dimensions deux rotations infinitésimales autour de deux axes perpendiculaires et o y ) peuvent être combinées, mais le résultat dépend de l’ordre de ces opérations ; la différence de ces résultats s’exprime comme une rotation infinitésimale autour d’un axe o z , perpendiculaire aux deux premiers. L’invariance des lois physiques par rotation conduit à ia loi de conservation du moment cinétique ; de la même manière leur invariance par translation, dans l’espace ou
(oz
Sources et évolution de la physique quantique
300
dans le temps, entraîne la conservation de l'impulsion totale, ou de l'énergie totale. d'un système isolé. A chacune de ces grandeurs est associé, en mécanique quantique, un opérateur agissant dans l'espace des états utilise! pour représenter ie système considéré. Les opérateurs énergie H et impulsion P sont associés aux translations dans le temps ou dans l'espace, e t l'opérateur moment cinétique J aux rotations. Le fait que deux et o y ne commutent pas s'exprime par la relation '' de cornrotations autour de J,JL = ihJ,. où h est l'unité élémentaire de moment mutation " [Jz,Jg]= J,J, cinétique. Cette relation algébrique traduit la structure non-commutative du groupe des rotations. Elle se généralise à l'espace-temps à 4 dimenstons, OD l'on considère, en plus des rotations, les transformations de Lorentz élémentaires le long des trois axes. L'algèbre de supersymétrie constitue une généralisation supplémentaire de l'algèbre précédente, en faisant intervenir un nouvel opérateur constitué de quatre composantes Qu formant un " spineur ", porteur d'une demi-unité de moment cinétique élémentaire. Appliqué à un état de spin entier, cet opérateur le transforme en état de spin demientier, ce qui ouvre la possibilité d'accroître la symétrie d'une théorie en y établissant des relations entre bosons et fermions ; ou même de découvrlr que les bosons e t les fermions que l'on trouve dans la Nature pourraient être reliés par supersymétrie, s'interprétant alors comme états de spins differents des mêmes particules, un peu comme la symétrie électrofaible permet de considérer l'électron et son neutrino comme deux états de charges différentes de la même particule. Comme l'opérateur de moment cinétique J, le générateur de supersymétrie Q doit satisfaire à des relations algébriques. Ses quatre composantes Qu obéissent, non pas à des relations de commutation, mais à des relations d'anticommutation (car il s'agit d'un opérateur de spin 1/2. donc de type fermionique). Les anticommutateurs {Qu, = QuQaf QsQu s'expriment comme des combinaisons linéaires des quatre P).Ainsi, de même qu'en comcomposantes de l'opérateur énergie-impulsion Pp = (H, binant deux rotations élémentaires on engendre une rotation autour de l'axe perpendiculaire, en combinant deux transformations de supersymétrie, on engendre une translation dans l'espace-temps. L'invariance par supersymétrie est alors susceptible d'apparaître comme plus fondamentale que l'invariance des lois physiques par translation dans l'espace et le temps, qui en serait une conséquence.
oz
-
Qa}
Relier les bosons aux fermions, est-ce possible ? Cette structure algébrique a été introduite, dans les années 1971-1973,par trois groupes distincts (Gol'fand et Llkhtman, Volkov et Akulov en Union Soviétique, et Wess et Zumino en Europe Occidentale). Mais peut-elle servir à décrire le monde des particules e t des interactions que nous connaissons ? Quels sont les bosons et les fermions qui pourraient être reliés ? La supersymétrie doit-elle agir au niveau des constituants fondamentaux, comme les quarks e t les leptons, ou bien au niveau des particules composées : par exemple pour relier les protons et les neutrons (fermions de spin 1/2. formés de trois quarks) aux mésons (bosons de spin O, formés d'un quark et d'un antiquark) ? L'algèbre de supersymétrie requiert en principe que les bosons et les fermions qu'elle associe aient des masses égales. Or les masses des bosons Sont loin d'être égales à celles des fermions ! On peut cependant faire appel à la notion de symétrie brisée spontanément,
Vers I'uni$cation des interactions
301
'.
très fructueuse en phySiQUe C'est en s'appuyant sur celle-ci que les physiciens ont construit, au cours des années 1960, une théorie cohérente des interactions faibles et électromagnétiques, malgré les caractéristiques très différentes de ces interactlons. La symétrie électrofaible relie l'électron à son neutrino, et le quark d au quark u (tous deux constituants des protons, uud, et des neutrons, ddu). Elle associe au photon, médiateur de l'interaction électromagnétique, les agents responsables des interactions faibles, les bosons et 2. L'existence de ces derniers est une conséquence de la symétrie électrofaible, et ils ont été mis en évidence par la suite au CERN, en 1983. Cette associatlon entre particules de masses très différentes - O pour le photon, 80 et 91 GeV/c2 pour les et le - est rendue possible par la brisure spontanée de la symétrie électrofaible. Ce phénomène autorise la différenciation entre interactions faibles et électromagnétiques, et est aussi responsable de l'apparition des masses pour les particules. Son origine exacte n'est pas encore établie. O n croit qu'il est dO à des champs de spin O appelés '' champs de Higgs ", décrivant de nouvelles particules, les bosons de Higgs. Ceux-ci ne se sont toujours pas manifestés au LEP et leur masse doit être supérieure à 60 GeV/c2, dans le cas le plus simple. On sait que, malgré certaines difficultés, le phénomène de brisure spontanée peut aussi s'appliquer à la supersymétrie. Y aurait4 alors une supersymétrie entre bosons et fermlons, malgré leurs masses très différentes ? Encore faut-il identifier les particules susceptibles d'être ainsi associées. O n peut chercher à relier le photon, de spin 1, au neutrino, de spin 1/2 ; et en même temps l'électron (de spin 1/2) au boson intermédiaire chargé (de spin 1). Mais il existe trois neutrinos, pour un seul photon ! Et que faire du muon, e t des quarks ? Pourrait-on relier les agents médiateurs des interactions fortes, les gluons, de spin 1, aux quarks, de spin 1/2 ? Mais il y a un seul octet de gluons, neutres, pour six triplets de quarks, e t qui sont chargés ! Enfin relier les leptons aux hypothétiques bosons de Higgs se révèle aussi impossible. En résumé, on aurait espéré que la supersymétrie associe les bosons de spin 1 responsables des interactions - ou les bosons de Higgs, de spin O - aux leptons et aux quarks, de spin 1/2. Mais on n'a trouvé aucune'paire de particules connues qui soient directement Images l'une de l'autre. Faut-il donc abandonner cette idée séduisante comme sans rapport avec le monde réel ? Pas nécessairement. car il existe une solution si l'on accepte d'imaginer que chaque particule connue ait sa propre image par supersymétrie. qui nous serait actuellement inconnue. Cette idée a conduit à postuler l'existence d'hypothétiques superpartenaires, dont les spins diffèrent de ceux des particules connues par une demi-unité. Mais il faut alors introduire un grand nombre de nouveaux bosons et veiller à ce que les échanges de ceux-ci n'induisent pas de nouvelles interactions. non-observées. en plus des interactions fortes, électromagnétiques et faibles.
wt.w-
w
w-
*
II s'agit de symétries exactes des équations fondamentales, mais qui e; laissent pas Invariant l'état d'énergie minimum du Système considéré, dans notre cas l'état du vide , où aucune particule n'est présente. Un exemple simple de brisure spontanée de symétrie est celui d'une bille dans une bouteille. Ce système est invariant par rotation autour d'un axe vertical, mais la position d'équilibre de la bille au fond de la bouteille ne l'est pas. La symétrie (dans cet exemple, l'invariance par rotation), bien que toujours présente au niveau des équations régissant le système, ne l'est plus pour leurs solutions.
302
Sources et évolution de la physique quantique
Les superpartenairet e t le
"
M o d è l e Standard Supersymétrique
"
Le partenaire du photon est une partlcuie neutre de spin 1/2,qui ne peut s'identitier à aucun des neutrinos connus v,, up ou même U r ,et que j'ai appelée en 1976 neutrino du photon, par la suite contracté en " photino D e même les huit gluons responsables des interactions fortes sont associés à huit particules de spin 1/2, appelées I' gluinos ", et les W* et à des '' winos " et " zinos ", aussi de spin 1/2. Les leptons et des quarks sont associés à des partenaires de spin O. " sleptons " et " squarks " (volr table 1). Les échanges de ces derniers entre leptons e t quarks, susceptibles d'induire de nouvelles interactions, non-observées, peuvent être interdits grâce à une nouvelle loi de conservation, celle de l a R-parité ; faute de quoi le proton se désintégrerait en une très brève fraction de seconde, une véritable catastrophe ! Enfin la brisure de la symétrie électrofaible nécessite maintenant un système de bosons de Higgs plus étendu, incluant un boson de Higgs chargé (qui peut même apparaïtre comme relié au par deux transformations de supersymétrie). Tout cet ensemble constitue ce que l'on appelle maintenant le Modèle Standard Supersymétrique.
".
La R-parité peut se définir comme étant simplement +1 pour les particules ordinaires (y compris les bosons de Higgs) et -1 pour les nouveaux superpartenaires. souvent appelés aussi I' particules supersymétriques 'I. La conservation de la R-parité - ou sa non-conservation éventuelle - sont reliées à celles du nombre baryonique B et du nombre leptonique L. Elle implique que les nouvelles particules doivent être produites seconde, les produits en paires. La plupart se désintègrent, souvent en moins de de désintégration étant seuls observables. La loi de conservation, multiplicative, de la R-parité impose que parmi ceux-ci on trouve encore une (ou un nombre impair) de ces nouvelles particules. La plus légère doit donc être stable. Elle est aussl probablement neutre, sinon elle aurait conduit à des isotopes anormaux de l'hydrogène, qui n'ont pas été détectés. Ce pourrait être le photino, ou plus généralement un mélange de divers fermions neutres ; et un candidat possible pour constituer la fameuse matiëre sombre qui serait abondamment présente dans notre Univers, formant peut-être l a plus grande partie de ceiui-cl. La recherche des superpartenaires, entreprise dès la fin des années 1970, constitue à l'heure actuelle l'une des préoccupations essentielles de la physique des particules. Les expériences effectuées auprès de l'anneau de collision e+e- du LEP a Genève ont brillamment confirmé la validité du " modèle standard " avec trois types de neutrinos seulement e t donc trois familles de leptons e t de quarks, même si le sixième quark (le top), est trop lourd pour y avoir été détecté
-
'.
Mais aucun de ces superpartenaires ni d'ailleurs aucun boson de Higgs - n'a été trouvé au LEP dans les désintégrations de plusieurs millions de 2,pas plus qu'auprès des collisionneurs pp du CERN et de Chicago. L a plupart de ces nouvelles particules doivent donc être plus lourdes qu'une quarantaine de GeV/cZ, ou même sans doute une centaine pour les squarks e t les gluinos. O n compte beaucoup maintenant. après l'augmentation en cours de l'énergie du LEP, sur les projets de collisionneurs LHC (dans le tunnel du La découverte du quark top pourrait avoir lieu au collisionneur proton-antiproton de Fermilab à Chicago. au cours des prochaines années. Mais ceci dépend de la valeur de sa masse (de 100 à 200 GeV/cz).
Vers l'unification des interactions
LEP) e t
sSC (au Texas
303
*), qui permettront d'accéder à une nouvelle échelle d'énergie.
Table 1. Les particules et leurs images par supersymétrie
Particules
(R = t i )
Superpartenaires
(R= -1)
(hypothétiques)
fortes :
gluons spin 1
:
Constituants de la matière (fermions)
I
6 leptons
(
Y,,
up, u,
e, p , T
graviton (hypothétique)
spin 2
(neutrinos) (charge - 1)
gluinoa photino winos et zinos
spini/Z
quarks d , (us B
Bosons de Higgs (hypothétiques)
squarks
spin O
higpinos
spin 1/2
]
fermions
spin 3/2
gravilino
sleptons
(charge 2/3) b (charge -1/3)
]
I
bosons de spin O
fermions de spin 1 / 2
Les particules élémentaires connues se répartissent en deux grandes classes. Les messagers des quatre interactions fondamentales sont les gluons, le photon, /es bosons intermédiaires Wf et Z (de spin ï)>.ainsi que l'hypothétique graviton (de spin 2). Les gluons et le photon sont de masse nulle, tandis que les Wf et ont près de LOO fois la masse du proton. Les constituants de la matière comprennent six quarks et six leptons, de spin 1/2. Les quark8 ont des charges électriques fractionnaires, 2/3 ou -1/3. Contrairement aux leptons, Ils peuvent échanger des gluons et sont donc sensibles aux interactions fortes. En plus des quarks u et d (constituants des nucléons) il en existe trois autres. 8 , c et b. et la cohérence de la théorie nécessite un sixième quark, le top t, non encore observé". En outre, la différenciation entre interactions faibles et électromagnétiques, ainsi que l'existence des masses, sont attribuées à un mécanisme nécessitant de nouvelles particules. les bosons de Higgs. La supersymétrie conduit a associer aux particules précédentes d'hypothétiques superpartenaires, qui en d i a r e n t par le spin et la masse, telles que les squarks et les séiectrons, les gluinos et le photino. La plus légère, neutre et stable, serait-elle un constituant de la " matière sombre " de l'Univers I ~~
~~
Abandonné en novembre 1993 par suite d'un vote défavorable du Sénat des EtatsUnis (note des auteurs de l'ouvrage).
** La découverte du t o p a été annoncée au printemps 1994. Voir page 278 (note des auteurs de l'ouvrage).
304
Sources et évolution de la physique quantique
Mais si l'on n'a pas détecté les superpartenaires aujourd'hui, pourquoi les trouveraiton demain ? Ces particules, si elles existent, ne doivent pas en principe avoir des masses (80 GeV/c'), faute de quoi cette dernière se trouverait en très supérieures à celle du quelque sorte " aspirée " vers des valeurs beaucoup plus grandes. Ce type d'argument indique que les masses attendues sont de préférence de l'ordre de la centaine de GeV/c2, o u au plus du TeV/c' (1 TeV = 1 O00 GeV). II a été très utilisé, au début des années 1980,dans le cadre de la grande unification des interactions fortes, électromagnétiques et faibles. Ces théories rencontrent un grave problème, la masse du ayant tendance à y être aspirée par l'énergie d'unification de ces trois interactions. au moins lo1' fois supérieure ! Les théories supersymétriques sont susceptibles de faciliter la résolution de ce problème, tant que les masses des superpartenaires ne dépassent pas l'ordre du TeV/cz.
w
w
Supersymétrie e t unification Dans l'approche de la grande unification, les médiateurs des interactions fortes, électromagnétiques e t faibles (voir table 1) sont reliés, et le proton doit être tr& faiblement instable, se désintégrant par exemple en r o e + , par transformation en iepton d'un de ses quarks constituants. La grande unification permet aussi de relier les intensités de ces trois interactions. Mais les prédictions du modèle le pius simple, tant en ce qui concerne la durée de vie finie du proton que les relations entre intensités des interactions, ont été infirmées par les résultats expérimentaux. Ces prédictions sont modifiées, dans ie cadre des théories supersymétriques, par l'effet des superpartenaires e t des nouveaux bosons de Higgs. et sont alors parfaitement compatibles avec les observations (figure). Cecl peut titre considéré. de manière optimiste, à la fois comme un indice de l'existence des superpartenaires - et avec des masses pas trop élevées - et d'une unification entre GeV, ou un peu plus. les interactions, à une énergie de l'ordre de II s'agit là d'une énergie qui commence à se rapprocher de I"' énergie de Planck " -1
(GN:w,an. soit environ lo1' GeV), où l'interaction gravitationnelle, extrêmement faible aux énergies usuelles, devient une interaction de forte intensité. C'est là que les quatre types d'interactions pourraient se fondre en une interaction unique. A des énergies aussi énormes, les effets quantiques de l a gravitation sont essentiels. Or la mécanique quantique et la relativité générale - qui décrit ia gravitation - ne font pas bon ménage : dans les calculs apparaissent des quantités infinies, que l'on ne sait pas traiter de manière satisfaisante. II semble que l'on doive aiors quitter le cadre habituel de la théorie des champs décrivant des particules élémentaires ponctuelles, pour se représenter celles-ci comme des objets étendus tels que des cordes. L'espace pourrait alors ?tre doté de dimensions supplémentaires, très petites, e t les particules correspondraient aux divers états de vibration d'une corde minuscule ( X cm), leurs interactions résultant de processus de fusion ou de séparation entre cordes. La supersymétrie joue un r81e essentiel dans cette approche, dite des supercordes. II est très difficile de savoir si ces théories permettent de décrire les particules avec les symétries, les masses et les interactions que nous leur connaissons. Du moins imagine-t-on ainsi ce que pourrait être une " théorie ultime " unifiant toutes les interactions, à des énergies gigantesques qu'il n'est pas question d'atteindre directement. Mais les futurs accélérateurs LHC et SSC devraient permettre d'explorer l'échelle d'énergie du TeV, éclairant les mécanismes de
lo-''
Vers Vunification des interactions
305
la différenciation entre interactions et de l'origine des masses. Et on a bon espoir de découvrir aiors l'existence des superpartenaires, qui révèlerait la supersymétrie comme invariance fondamentale des lois de la physique. au delà de la relativité générale.
Lien entre les intensités des trois interactions 60
40
1 ai
20
O 1
ENERGIE (GeV)
102
mJ
io5 10'0 ENERGIE ( G e V )
10'6
%"TI
Les paramètres al, a2 et a3, qui déterminent les intensités des interactions électromagnétiques, faibles et fortes sont en fait des fonctions lentement variables de l'énergie, dont on peut extrapoler le comportement à très haute énergie à partir des mesures actuelles. Dans une théorie de grande unification ces paramètres doivent converger à une énergie très élevée, pour laquelle les trois types d'interactions viendraient se fondre en une interaction unique. Le modèle le plus simple est maintenant exclu. cette convergence ne se produisant pas (a). Mais l'effet des superpartenaires sur l'évolution de ces trois paramètres conduit à une convergence remarquable (b), qui pourrait indiquer à la fois'üne unification entre interactions (vers GeV ou un peu plus), et l'existence de ces superpartenaires à des énergies pas trop éloignées.
Bibliographie M. Jacob (North Holland/World Scientific, 1986). 2. P. Fayet, La Recherche 19 334 (1988) ; Introduction t o Supersymmetric Theories of Proc. of t h e Erice Particles and Interactions, in '' Properties of SUSY Particles Workshop, (1992), ed. by Cifarelli and Khoze (World Scientific, 1993) p . l . 1. Supersymmetry and Supergravity, A Reprint Volume of Physics Reports, ed.
".
306
Sources et éuolution de la physique quantique
Louis Armctrong et Niels Bohr, auz environs de 1955 (Source : Niels Bohr Archive, tous droi2J réservés)
Appendice
La physique nucléaire dans les années 30 aux Etats-Unis, en France, au Japon et au Brésil Les bouleversements politiques de l’Europe des années 1930 - le fascisme en Italie, le nazisme en Allemagne - provoquèrent l’émigration des gands talents en science, en technologie, en arts de l’Europe vers les Etats-Unis d’Amérique. Ce fut le cas de physiciens tels que Albert Einstein, Eugene P. Wigner, Leo Szilard, Edward Teller, Hans Albrecht Bethe, Enrico Fermi, Gian Carlo Wick, Emilio Segrè, Sergio de Benedetti ; de mathématiciens comme Hermann Weyl, John von Neumann, Paul Erdik, Claude Chevalley, des écrivains tels que Thomas Mann, Jacques Maritain, et tant d’autres, comme le biologiste Severo Ochoa, des ingénieurs, des peintres, des musiciens. Le transfert de connaissances est un processus historique fondamental et irréversible, générateur d’idées et de technologies nouvelles ; le transfert de technologie, tant prôné, n’est qu’un des produits du transfert de connaissances.
Le Brésil a bénéficié d’une petite partie de ce transfert : les physiciens Gleb Wataghin, Giuseppe Occhialini, Bernhard Gross, Guido Beck, David Bohm (en provenance des Etats-Unis dans l’après-guerre) ; les mathématiciens Luigi Fantappiè, Giacomo Albanese, Achille Bassi, suivis de Jean-Dieudonné, André Weil et des Portugais Antonio Monteiro, Pereira Gomes, Manuel Zaluar ; les chimistes Heinrich Rheinboldt, Heinrich Hauptmann, Hans Stammreich, Hans Zocher, Fritz Feigl ; des humanistes tels que l’historien Fernand Braudel, l’anthropologue Claude Lévy-Strauss,les écrivains Roger Bastide ainsi que Fortunat Strowski, Jacques Lambert, René Poirier ont contribué à développer les recherches aux Universités de Sa0 Paulo, de Rio et de Recife. Stefan Zweig mettra fin à ses jours à Petropolis en février 1942, au moment le plus tragique de la guerre. Des peintres comme Vieira da Silva et Arpad Szenes, l’écrivain Otto Maria Carpeaux, se sont établis à Rio à cette époque. Les rayons cosmiques furent l’objet de recherches menées par Wataghin qui, dans un article publié en 1940 avec Souza Santos et Paulus Pompeia, annoncèrent avoir détecté la production simultanée de particules pénétrantes dans le rayonnement cosmique à 800 m d’altitude, les “gerbes pénétrantes”’. Un ancien élève de Wataghin, Mario Schônberg, publia un article* dans les Rendiconti deli’Accademia dei Lincei, à Rome, où il proposa la représentation de la fonction impropre de Dirac par l’intégrale de Stieltjes. Avec Gamow’, Schônberg
*
’
P.A. Pompeia, M.D.de Souza Santos et G. Wataghin, Phys. Rev. 57, 61 (1940). M. Schonberg, Rendiconti Reale d. A c a à Nu. dei Lincei, 20, 81 (1937). G. Gamow et M. Schhberg, Phys. Rev. 5 8 , 1117 (1940) ; 69, 539 (1941).
308
Sources et évolution de la physique quantique
établit le rôle des neutrinos électroniques dans le processus de perte d’énergie des étoiles en contraction gravitationnelle (le processus Urca : Gamow comparait la perte d’énergie par les étoiles en contraction par émission de neutrinos à la perte de leur argent par les joueurs du Casino d’Urca, situé sur les flancs du Pain de Sucre à Rio de Janeiro). Dans les années 50, un bêtatron fut installé à l’Université de Sa6 Paulo : il permit le développement de recherches sur les réactions photonucléaires ; on y confirma le rôle des nombres magiques4 des noyaux sur les sections &caces de ces réactions jusqu’à 30 MeV. A la même époque, Oscar Sala, en collaboration avec l’université du Wisconsin, installa un accélérateur Van de Graaff et mit en route l’étude des réactions provoquéees par des ions. Nous avons évoqué la découverte des pions en 1947 et la nouvelle impulsion qu’elle donna au développement de la physique au Brésil. Le développement de la recherche aux Etats-Unis fut le résultat des activités des Universités - privées et des Etats de la Fédération -,des Instituts technologiques et des laboratoires d’entreprises industrielles. La tendance a toujours été dans ce pays d’éviter une planification centrale. Les fondations privées telles que la Rockefeller Foundation - qui a aidé la physique en Europe et en Amérique du Sud (Pauli, Heisenberg, Landau et tant d’autres scientifiques bénéficièrent de bourses d’étude Rockefeller), la Ford Foundation, la John Simon Guggenheim Memorial Foundation, eurent un rôle important pour le développement de l’enseignement supérieur et de la recherche scientifique. En 1950, après cinq années de débat au Congrès des Etats-Unis, fut créée la National Science Foundation (le National Research Council lié à la National Academy of Sciences fut instauré pendant la Première Guerre mondiale). En 1951, un Science Advisory Committee fut créé auprès du Président des Etats-Unis. La Commission de l’Energie Atomique, créée après la Deuxième Guerre mondiale, joua un rôle important dans le développement des laboratoires de recherche en physique nucléaire et en physique des hautes énergies. Elle fut récemment absorbée par le Department of Energy (Ministère de 1’Energie). Après l’invention du cyclotron, une quinzaine d’universités se dotèrent de ces accélérateurs- ce qui montre bien que les universités américaines constituaient un sol fertile pour l’accueil et la collaboration des physiciens immigrés d’Europe dans les années 1930. L’intervention de 1’Etat dans le financement des grands projets de recherche s’est avérée néanmoins indispensable, surtout après le succès du projet Manhattan. Des laboratoires nationaux se sont constitués grâce à la réunion, le cotuortium de plusieurs universités, tel que I’Associated Midwest Universities qui institua le National Brookhaven Laboratory. Un autre consortium, plus large, constitua le Fermi National Laboratoiy, à Batavia. Au Japon, la recherche en physique nucléaire débuta dans les années 1930, dans la ligne de la réforme Meiji de 1868 qui introduisit l’enseignement de la science occidentale dans les universités nationales. Dew laboratoires importants existaient à l’Institut de Recherche en Physique et Chimie Rikken à Tokyo, ceux de S. J. Goldemberg et J. Leite Lopes, Phys. Rev. 199, 1053 (1955).
Vers l’unification des interactions
309
Nishikawa et de Yoshio Nishina. Le laboratoire de Nishina, créé en 1931, possédait un groupe de physiciens tramillant dans les rayons cosmiques et des physiciens théoriciens. Nishina, bien connu pour son travail avec Oskar Klein sur la section efficace de l’effet Compton, passa un certain temps en Europe, à Cambridge, à Gottingen et à Copenhague, et attira les théoriciens S. Kikuchi, Sin-Itiro Tomonaga et Shoidii Sakata dans son laboratoire. Ce fut à l’université d’Os& que Hideki Yukawa eut l’idée des mésons comme les quanta des forces nucléaires et développa sa théorie avec Sakata et Taketani. La visite de Niels Bohr au Japon en 1937 exerça une infiuence positive sur la physique dans ces laboratoires. Mais, contrairement aux Etats-Unis, il n’y eut aucqne migration de scientifiques de l’extérieur vers le Japon. Dans les années 1950, après la tragédie des bombes atomiques, de nouvelles universités furent créées, ainsi que des instituts tels que l’Institut de Recherche en Physique Fondamentale à Kyoto (Yukawa) en 1953, I’Obsenatoire des Rayons Cosmiques sur le mont Norikura, l’Institut d’Etudes Nucléaires à Tokyo en 1955, doté de deux cyclotrons (1957, 1958) et d’un synchrotron à électrons (1961), dont l’énergie peut s’élever à 1,3 GeV. L’année 1971 fut celle de l’inauguration du KEK, le Laboratoire National de Physique des hautes energies, avec un synchrotron à protons de 12 GeV et un accélérateur à électrons de 2,5 GeV en 1982. En France, la tradition historique d’un gouvernement centralisateur a conduit à un développement de la recherche scientifique et technologique principalement concentré à Paris et dans la région parisienne. Le CNRS fut créé quelques mois avant le déclenchement de la Deuxième Guene mondiale, sous l’inspiration de scientifiques de prestige comme Jean Perrin, Irène Curie, Frédéric Joliot, Pierre Auger. Cette organisation stimule la recherche dans les universités, les grandes écoles (comme 1’Ecole polytechnique et 1’Ecole normale supérieure), et dans ses laboratoires propres répartis SUT tout le territoire (Marseille, Lyon, Grenoble, Strasbourg, Caen, Orsay, etc.). Le Commissariat à 1’Energie Atomique, créé en 1945, a, entre autres activités, un Centre d’Etudes Nucléaires à Saclay, un autre à Grenoble, équipés de divers accélérateurs de particules. Après les travaux de Pierre Weiss, Louis et Maurice de Broglie, Pierre Auger, Alexandre Proca, Eugène Bloch, Francis Perrin, toute une génération de chercheurs est apparue en France, avec Louis Néel, Louis Leprince-Ringuet, André Berthelot, Louis Michel, Maurice Lévy, Claude Bouchiat, Bernard d’Espagnat, Marcel Froissart, Philippe Meyer, Roland Omnès, Jacques Prentki ; André Lagarrigue et Bernard Grégory ; Charles Peyrou ; de la génération suivante on peut citer les expérimentateurs P. Musset, P. Darriuiat, R. Turlay, et les théoriciens P. Fayet, J. iliopoulos, C. Itzykson, M.Jacob, J.M. Lévy-Leblond, M.Le Bellac, J. Zinn-Justin, C. Zuber, entre autres. Témoins et acteurs du renouveau scientifique français après la Deuxième Guerre mondiale : les prix Nobel de physique Alfred Kastler et Louis Néel, PierreGilles de Gennes et Georges Charpak, ainsi que le prix Nobel de chimie Jean-Marie Lehn.
Bibliographie (Avec les éditiona l w plus récentes, quelques éditions originales) L. ALLEN, P. FORMAN, J.L. HEILBRON et T.S. KUHN, S O U ~ for ~ Whistory of quantum physics. A n inventory and report - The American Philosophical Society, Philadelphie (1967)
A. ASPECT et al., Le monde quantique - Points Sciences 1 Le Seuil (1985) J. P. BATON et G. COHEN-TANNOUDJI, L’horizon des Particules - NRF Essais 1 Gallimard (1989) B.BENSAUDEVINCENT, Langevin, Science et Vigilance - coll. Un savant, une époque 1 Belin (1987) M. BIEZUNSKI, Histoire de la Physique Moderne - coll. Histoire des Sciences / La Déeouverte (1993) N.BOBR, Physique Atomique et Connawsance Humaine - Folio Essais / Gallimard (1991) M.BORN, Structure Atomique de la Matière. Introduction à la physique quantique - Collection U / Armand Colin (1971) L.de BROGLIE, Louis de Broglie, Physicien et Penaeur (coniributioru de la plupart des créateurs de la physique moderne) - Les Savants et le Monde 1 Albin Michel (1953) M. BUNGE, Philosophie de la Physique - Science Ouverte / Le Seuil (1975) D. CASSIDY, Uncertainty (The life and science of Werner Heisenberg) - Freeman and Cie / New York (1992) G. COHEN-TANNOUDJI et M.SPIRO, La matière-espace-temps - Folio Essais 1 Gallimard (1990)
R. CREASE et C. MANN, The second creation: Makers of the Revolution in 20th-Century Physics - Collier Books, MC Millan Pub. Comp., New York (1988) M. CROZON, La matière première - Science Ouverte 1 Le Seuil (1987) P. DAVIES, Lu, forces de la nature - Sciences 1 Armand Colin (1988) P. A.M. DIRAC, Les Principes de la mécanique quantique - J. Gabay (1990) F. DYSON, Diaturbing the Universe: a life in science - Harper and Row (1979) A.EINSTEIN, Oeuvres choisies, 6 vol. - F. Balibar, O. Darrigal et B. Jech ed., Le Seuil / CNRS (1989) A. EINSTEIN, Comment j e vois le monde - Champs 1 Flammarion (1989) A. EINSTEIN, Concepfionr seieniifiquw - Champs 1 Flammarion (1990) A. EINSTEIN, M. BORN, Comapondance (1916-1955) -Science Ouverte 1 Le Seuil (1988) A.EINSTEIN, L. INFELD, L’évolution des idées en phyjique - Champs 1 Flammarion (1983)
L. FERMI, Atomes en famille - Gallimard (1955) R. FEYNMAN, La Nature de la Physique - Points Sciences 1 Le Seuil (1980) R. FEYNMAN, S. WEINBERG, Particules et lois de la physique - InterEditions (1989) G. GAMOW, l k n t e années qui ébranlèrent la physique - Dunod Paris (1968) S.HAWKING, Une brtve hktoire du temps - Champs 1 Flammarion (1991) S.HAWKlNG, Commencement du temps et fin de la physique P - Flammarion (1992) J.L. HEILBRON, Planck, une conscience déchirée - trad. N. Dhombres, coll. Un savant, une époque 1 Belin (1988) W.HEISENBERG, La Partie et le Tout. Le Monde de la physique atomique - Champs 1 Flammarion (1990) W.HEISENBERG, Physique et Philosophie - Albin Michel (1971) W.HEISENBERG, La Nature d a w la Phyjique Contempomhe - Gallimard (1970) W.HEISENBERG, LW Principes phya‘ques de la Théorie des quanta - J . Gabay (1990)
312
Sources et évolution de la physique quantique
B. HOFFMANN, A. Einatein, créateur et rebelle - Points Sciences / Le Seuil (1978) B. HOFFMANN, M. PATY, L’étmnge histoire des quantaa -Points Sciences /Le Seuil (1981) M. JAMMER, The conceptual development of quantum mechanics - McGraw-Hili, New York (1966) J. H. JEANS, Théorie du Rayonnement et des Quanta - Librairie Scientifique Albert Blanchard, Paris (1925) H. KRAGH, Dime: A scientific Biography - Cambridge University Press (1990) J. LABERRIGUE-FROLOW, La physique des particules élémentaires - Masson (1990) P. LANGEVIN, La Notion de ~ o r p w ~ ~ et i Cd’Atomes 9 -.Hermann (1934) S.L E STRAT, Epistémoiogie des sciences physiques - Nathan (1990) J. M. LEVY-LEBLOND et F. BALIBAR, Quantique, rudiments - InterEditions (1984) S.ORTOLZ, J.P. PEARABOD, Le Cantique des Quantiques - Sciences et Société / La Découverte (1984) A. PAIS, Albert Einstein. La vie et l’oeuvre (“Subtle is the Lord... ”) -Inter-Editions (1993) A. PAIS, Niels Bohr’s Times, in physics, philosophy and polity - Clarendon Press Oxford (1979) A. PAIS, Inward bound: of matter and forces in the physical world - Oxford University Press (1986) M. PATY, Einstein philosophe - Presses Universitaires de France (1993) J. PERRIN, Les Atomes - Gallimard (1970) M.PLANCK, Initiation d la physique - Champs / Flammarion M. PLANCK, L’image du monde dans la physique moderne - Gauthier (1963) P.RADVANYI et M. BORDRY, La Radioactivité artificielle - Points Sciences / Le Seuil (1984) A: REEVES, Patience dans l’azur - Science Ouverte 1 Le Seuil R. REID, Marie Curie - Points Scienees / Le Seuil (1983) SROZENTAL, Ed. Niels Bohr, his life and work 0s seen by his friends and colleagues - North Holland, Amsterdam (1967) A.SALAM, W. HEISENBERG, P.A.M. DIRAC, La Grande Unification - Science Ouverte 1 Le Seuil (1991) RSCHRODINGER, L’Esprit et la Matièrr - Le Seuil (1990) E.SCHRODINGER, Ma conception du monde - Mercure de France (1982) E.SCHRoDINGER, Qu’est ce que la vie ? - Christian Bourgois (1986) E. SCHRODINGER, Physique quantique et représentation du monde - Points Sciences 1 Le Seuil Q992) E.SCHRODINGER, Mémoires sur la mécanique ondulaioire - J. Garbay (1988) E.SEGRE, Lw Physiciens modernes et leurs découvertes - coll. Le temps des Sciences / Fayard (1990) S.TOMONAGA, Quantum Mechanics - 2 vol. North Holland Pub. (1962et 1966) B. VAN DER WAERDEN, Sources of quantum mechaniw - Dover, New York (1968) S.WEART, La grande aventure des atomistes fninçaw. Les savants au pouvoir - Fayard (1980) S.WEINBERG, Les 3 premières minutes de l’Univers - Points Sciences 1 Le Seuil (1978) V. WEZSSKOPF, La Révolution des Quanta - Questions de Science / Hachette (1989) V. WEISSKOPF, La physique au XJ? siècle - Editions Mondiales (1974) H. WEYL, Philosophy of mathematics and natuml sciences - Princeton Univ. P~ess(1949) ~
Index Abel 272 Albanese G. 307 d’Alembert 8 Anaxagore 1 Anaximandre 1,265 Anaximène 2 antimatière 3, 189-193 Anderson C. 192,244, 256 Aristarque de Samos 2 Aristote 2,4,6 Auger P. 309 Avicenne 4 Balmer-Bohr (formule) 57 Bartlett J. 244 baryon 263, 265 Bassi A. 307 BastideR. 307 Bauer E. 153-187 Beck G. 307 Becker H. 242 Becquerel H. 10, 11 Benedetti J.B. 5 Benedetti S. 307 Berthelot A. 309 bêta (désintégration) 241-243,257,262 Bethe H.A. 61,245,256,307 Bhabba H.J. 245 Bjorken J. 298 Blackett P. 192 Bloch E. 309 Bohm D. 307 Bohm-Aharanov (effet) 270 Bohr N. 17-19,57, 90-91,127, 133-152 241,242,244,309 Boltzmann L. 9 (constante) 16 Born M. 57,91,126-127,129-132 Bose (condensation) 61 BosoEinstein (statistique) 85-88 boson 258 boson intermédiaire 259, 275-278 Bothe W. 242 Bouchiat C. 309 Braudel F. 307 Breit G 244 de Broglie L. 89-90,92-98,189,309 de Broglie M. 309 bulles (chambres à) 256, 277 (note)
Buridan J. 5 Cabbibo N. (angle) 258 Carlsen F. 245 Carpeaux O.M. 307 Cartan E. 193 Cassen B. 244 centrifuge (force) 15-16 CERN 18,255,277 Chadwick J. 241,242 Chandrasekhar S. 61 charme 268-269 Charpak G. 256,309 Chevalley C. 307 Christenson J. 276 chromodynamique quantique 272 civilisations précolombiennes 7 Cockroft J. 255 complémentarité (principe) 127, 133-152 Compton A. 89 (effet) 89, 213-214 Condon E. 244 conjugaison de charge 3, 276 Conversi M. 256 Cooper (paires de) 62 Copernic N. 6 Coriolis (force) 15-16 couleur 61, 267,272 courants faibles neutres 277 Cronin J. 276 Crookes W. 10 CÜer P. 256 Curie I. 242, 309 Dalton J. 9 Dancoff S.M. 245 Darriulat P. 309 Démocrite 3 DescartesR. 5 Dieudonné J. 307 Dirac P.A.M. 2,60,91, 128, 190-193, 194208,209 (équation) 194-208 Doppler (effet) 14 Duhem P. 9 Dyson F. 275 Einstein A. 2, 13-17,28-40,89, 126, 189,209,275,297,307
Sources et évolution de la physique quantique
314
Ellis C.D. 241 électrodynamique quantique 219-240 Empédocle 3 Eotvos von R. 16 Epicure 3 Erathostène 1 E r d k P. 307 d’Espagnat B. 309 éther 13 étrangeté 262-263 Euler L. 8 exclusion (principe d’) 57-58, 296 Fantappiè L. 307 Faraday M. 298 Fayet P. 299-308,309 Feigi F. 307 Fermi E. 60-61, 81-84,242-243, 258,262, 298, 307
(statistique de Fermi-Dirac) 60, 81-84 (pression) 61 (interaction) 242-243,258,262, 298 FERMILAB 19, 255, 303 (note), 308 fermion 60, 81-84, 299 Feynman R.P. 210-217, 219-240, 258-259, 272,275,298
Fitch V. 276 Franck J. 19 Frohlich H. 245 Froissart M. 309 Galilée 2,4, 6, 13-14, 16, 298 (transformations) 13-14 Gamow G. 307-308 Gardner E. 257 Gay-Lussac L.J. 9 Geiger-Müller (compteur) 255 Gell-Mann M. 258, 261-269, 298 Gennes de P.G. 309 Gibbs J.W. 9 Glashow S 259,268,276, 297-298 gluons 272 Gomes P. 307 Gordon W. 190 Goudsmit S. 58, 78-80 graviton 303 Gregory B. 309 Gross B. 307 Hafstadt L.
244
Hahn O. 241 Hamilton W.R. 8 Hauptmann H. 307 Hawking S. 296 (note) Heisenberg W. 90-91, 112-125, 127, 243, 244, 262-263, 275,278, 308
Heitler W. 245 Héraciite 3 Hertz G. 19 Hertz H. 10 Heydenburg N. 244 Hilbert (espace de) 127 Higgs (boson de) 277,278,301,303 Hofstadter R. 18 Homère. 2 Hooft t’ G. 298 Hulthén L. 245 hypercharge 262-264 hypéron 263 Iliopoulos J. 268,309 incertitude/indétermination(relations) indiscernabilité 59 isospin 263, 272 Itzykson C. 309 Imnenko D. 243 Jacob M. 309 Jauch J.M. 245 jauge (transformations) 270-271 Jeans J. 16 Joliot F. 242, 309 Jordan P. 91 kaon 261
Kastler A. 309 KEK (laboratoire) 309 Kemmer N. 245 Kepler 6 Kerst D. 255 Kikuchi S. 309 Kirchhoff 16 Klein O. 190,258,309 Kobayashi-Maslcawa (matrice) 258 Kronig de R. 58-59 Kusaka S. 245 Lagarrigue A. 309 Lagrange 8 &bW.E. 210
127
Vers l’unification des interactions
Lambert J. 307 Landau L.D. 309 LandéK. 308 Laplace P.S. 8 Lattes C.M.G. 245, 256-257 Lawrence E.O. 255 Le Bellac 3. 309 Lederman L. 257, 269
Néel L. 309 Neumann von J. 307 neutrino 241-242, 257, 262 Newton I. 2, 6-8, 9, 13, 17,262, 298 Nishijina K. 262 Nishikawa 309 Nishina Y. 309 Nominalist- ( E a l e des) 5
I
Lee T.D. 258,276
Occhialini G. 192, 245,256, 307 Ochoa S. 307 Omnès Fi. 309 Oppenheimer J.R. 245, 256, 307 OresrneN. 4 Ostwald W. 9
Lehn J.M. 309 Leibnitz 7 Leite Lapes J. 259, 286 LEP (accélérateur) 255 Leprince Ringuet L. 309 Leucippe 3 Lévi-Strauss C. 307 Lévy M. 309 Lévy-Leblond J.M. 309 LHC (accélérateur) 255 Livingstone M.S. 255 Locke J. 8 London F. 153-187 Lorentz H.A. 14, 16, 18, 298 Lucrèce 3-4
Pais A. 126 Pancini E. 256 Parménide 3 Pauli W. 57-61, 03-77, 91, 191-193, 275,296, 298, 308
MachE. 8 Maiani L. 268 Majorana E. 243, 244 Manhattan (projet) 308 Mann T. 307 matrices (mécanique des) 90-91, 112-125 Maritain J. 307 Marshak R. 245,258 Maupertuis P.L.M. 8 Maxwell J.C. 2, 9, 270, 275, 298 Meitner L. 241 243-245 Meyer P. 309 Michel L. 258, 309 m&n
Michelson et Morley (exfirience) Mills R. 271,275 Minkowski H. 15 modèle standard 275-278 Méller C. 245 Monteiro A. 307 Muirhead G. 245, 256 muon 256-259 Musset P. 309 NagaokaH. 18 Neddermayer S . 192, 244,256
315
14
(matrices) 59 (neutrino) 241-242, 244 (Le principe d’exclusion) 65-79 Perrin J. 9, 255, 309 Perrin F. 309 Peyrou C. 309 Piccioni O. 256 pion 256259, 264-265 Philippon J. 4 Planck M. 9, 16-17, 19, 20-27 (constante) 17-19 (masse) 297 Platon 4,6 Poincaré H.
13-15,298
(transformations) Poirier R. 307 Poisson (équation) 16 Polyakov 298 Pompeia P.A. 307 Pontecorvo B. 259 Powell C. 245, 256 Prentki J. 309 Proca A. 309 Ptolémée C. 1 Pulitzer 298 Pythagore 2, 6 quark 265 Rayleigh J.W.S. 16
191
316
Sources et évolution de la physique quantique
R é F . 61 note 33 Thalès 2, 265 renormdisation 217-218 TEVATRON accélérateur 278, 303 note 3 Rheinboldt H. 307 Thomson J.J. 10, 18 Richter B. 269 Ting S. 268 Riemann B. (espace de) 16 Tiomno J. 258 RJKKEN Institut 309 Tomonaga S.I. 210,275,309 h n t g e n W. 10 top 268,278 Rosenbluth M. 258 Turlay R 276,309 Rosenfeld L. 245 "uve M. 244 Russel B. 1 Uhlenbeck G. 58, 78-80 Rutherford E. 18,41-57,242 Uhling (effet) 210 Rydberg J.R.(constante) 19 Rydberg-Ritz (principe de combinaison) 91 unification électrofaible 275-278,279-295 Urea (procédé) 308 Sakata S. 264265,309 Sakurai 258 Van de Graaff 255 SalaO. 308 Van der Waals (interactions) 272 Salam A. 218,255,276,297,298 Van der Waerden 193 saveur 267 Vieira d a Silva 307 Schonberg M. 307 Vinci de L. 5 Schrodinger E. 59,90-91,99-111,126-128, Voigt W. 14 188-189,210,298 Voltaire 8 (équation) 9%iii Waiton E. 255 Schwartz M. 257 Wataghin G. 307 Schwinger J. 210,245,275 Weil A. 307 Segrè E. 307 Weinberg S. 218,259,276-278,279-295, SERPUKHOV laboratoire 255 297-298 SLAC laboratoire 18, 268 Weiss P. 309 Sommerfeld A. 17,60, 193 Weisskopf V. 245 Souza Santos M.D. 307 Wentzel G. 249 SPEAR accélérateur 268 Weyl H. 1,193,261,271,307 spin (de l'électron) 78-80 Wheeler J.A. 215-216,258 SSC accélérateur 255 Wien W. 16 Stammreich H. 307 Wigner E. 193,244,263, 276, 307 Steinberger J. 257 Wick G.C. 307 Stoner (règle de) 57-58 Wilson C.T.E. (chambre de) 255 Stoney G. 10 Wu C.S. 276 Struwski F. 307 Sudarshan E.C.G. 258,298 Yang C.N. 258,264,271,276 superfluidité 62 Yukawa H. 243-245,246254,256,272,309 superposition (principe de) 126 supersymétrie 298,299-305 Zaiuar M. 307 superunification 296-298 Zeeman (effet anormai) 57 supraconductivité 62 Zénon 3 Szenes A. 307 Zinn-Justin J. 309 Szilard L. 307 Zocher H. 307 TaLetani 309 Zuber C. 309 Teller E. 307 Zweig S. 307