Théorie statistique des champs 2
Claude Itzykson Jean-Michel Drouffe
Théorie statistique des champs2
S A V O I R S
A C T U E L S
InterEditions/Editionsdu CNRS
@ 1989, InterEditions, 25. rue Leblanc, 75015 Paris. et
Editions du CNRS, 1, Place Aristide Briand, 92195 Meudon. Tous droits réservés. Aucun extrait de ce livre ne peut être reproduit, sous quelque forme ou par quelque procédé que ce soit (machine électronique, mécanique, à photocopier, 3 enregistrer ou tout autre) s a w l’autorisation écrite préalable de InterEditions. ISBN 2-7296-0327-1 ISBN 2-222-04365-4
TABLE DES MATIERES
Avant-propos
........................................................................
IX
.....
1
1. Techniques générales ........................................................... 1.1 Définitions et notations ................................................. 1.2 Graphes connexes et cumulants ..................................... 1.3 Irréductibilité et transformation de Legendre ................ 2 Développements en série ..................................................... 2.1 Développement de haute température ........................... 2.2 Le rôle des symétries ..................................................... 2.3 Développements de basse température - cas discret ...... 2.4 Développement de basse température - cas continu ....... 2.5 Développement en champ fort ....................................... 2.6 Champs fermioniques .................................................... 3 Enumération de graphes ..................................................... 3.1 Nombres de configurations ............................................ 3.2 Graphes multiplement connexes .................................... 4 Résultats et analyse ............................................................. 4.1 Techniques d’analyse des séries ...................................... 4.2 Un exemple ................................................................... Notes ......................................................................................
1 1 6 10 16 16 21 24 27 31 31 33 33 35 39 39 43 47
Chapitre VI11 .SIMULATIONS NUMERIQUES .............
49
Chapitre VI1 . METHODES DIAGRAMMATIQUES
.
. .
.
1 Algorithmes ........................................................................... 1.1 Généralités .................................................................... 1.2 Algorithmes classiques ................................................... 1.3 Simulations microcanoniques ......................................... 1.4 Considérations pratiques ............................................... 1.4.1 Conditions aux limites ............................................. 1.4.2 Taille du réseau ....................................................... 1.4.3 Temps de thermalisation ......................................... 1.4.4 Mesure des observables ............................................
49 49 53 57 58 58 60 61 62
VI
TABLE DES MATIÈRES
1.4.5 Erreurs statistiques .................................................. 1.4.6 Paramétrisation des champs .................................... 2 Mesures .................................................................................. 2.1 Détermination des transitions ........................................ 2.2 Effets de taille finie ....................................................... 2.3 Méthode de renormalisation Monte Carlo ...................... 2.4 Equation de Langevin ................................................... 3 Simulations fermioniques .................................................... 3.1 Approximation des variables fermioniques gelées ........... 3.2 Fermions dynamiques .................................................... 3.3 Spectre hadronique ........................................................ Notes ......................................................................................
.
.
Chapitre IX .INVARIANCE CONFORME
.......................
.
1 Tenseur impulsion-énergie . Algèbre de Virasoro .......... 1.1 Invariance conforme ...................................................... 1.2 Tenseur impulsion-énergie ............................................. 1.3 Transformat ions conformes en deux dimensions ............. 1.4 Charge centrale ............................................................. 1.5 Algèbre de Virasoro ....................................................... 1.6 Les déterminants de Kac ............................................... 1.7 Représentations unitaires et minimales .......................... 1.8 Caractères de l’algèbre de Virasoro ............................... 2 Exemples ................................................................................ 2.1 Modèle gaussien ............................................................ 2.2 Modèle d’king ............................................................... 2.3 Modèle de Potts à trois états ......................................... 3 Invariance moduliaire ........................................................... 3.1 Fonction de partition sur un tore .................................. 3.2 Formule limite de Kronecker .......................................... 3.3 Modèle d’Ising ............................................................... 3.4 La c1assificai;ion A-D-E des modèles minimaux ............ 3.5 F’rustrations et symétries discrètes ................................. 3.6 Modèles non. minimaux ................................................. 3.7 Fonctions de corrélation dans un demi-plan ................... 3.8 Le voisinage du point critique ....................................... Appendice A Séries et produits û de Jacobi .................. Appendice B Algèbre super-conforme ............................ Appendice C Algèbre des courants .................................. C . l Algèbres de Lie simples ................................................. C.2 Modèles de ‘Wess-ZumineWitten ................................. C.3 Représentations et caractères des algèbres de Kac-Moody
.
.
. .
.
Notes
......................................................................................
62 63 65 65 68 71 76 79 80 82 83 88 89 90 90 94 96 101 107 118 129 133 135 135 139 142 148 149 152 158 163 172 175 182 186 192 196 201 202 209 220 224
TABLE DES MATIÈRES
Chapitre X . SYSTEMES DESORDONNES ET METHODES FERMIONIQUES ..................................
.
VI I
229
1 Modèles unidimensionnels .................................................. 1.1 Le potentiel aléatoire gaussien ....................................... 1.2 Equation de Fokker-Planck ........................................... 1.3 La méthode des répliques .............................................. 1.4 Réseau aléatoire unidimensionnel .................................. 2 Gaz bidimensionnel d’électrons en présence d’un champ magnétique ............................................................................ 2.1 Niveaux de Landau - L’effet Hall quantique .................. 2.2 Spectre à une particule en présence d’impuretés ............ 3 Matrices aléatoires ............................................................... 3.1 Loi du demi-cercle ......................................................... 3.2 Méthode fermionique ..................................................... 3.3 Espacements des niveaux ............................................... 4 Approximation planaire ...................................................... 4.1 Analyse combinatoire .................................................... 4.2 Approximat ion planaire en mécanique quantique .......... 5 Système de spins en interactions aléatoires ..................... 5.1 Champ extérieur aléatoire et transmutation dimensionnelle ............................................................... 5.2 Modèle d’king bidimensionnel désordonné .................... Appendice A La conductivité de Hall en tant qu’invariant topologique ..................................................... Notes ......................................................................................
229 229 232 240 246
........................ 1. Réseaux aléatoires ................................................................ 1.1 Réseaux poissonniens et statistique locale ..................... 1.2 Equations des champs discrétisées ................................. 1.3 Spectre du laplacien ......................................................
317
.
. . .
.
Chapitre XI .GEOMETRIE ALEATOIRE
256 256 260 269 271 274 277 283 284 292 295 295 298 308 313
2 Surfaces aléatoires ................................................................ 2.1 Surfaces triangulées ....................................................... 2.2 Anomalie conforme et action de Liouville ...................... 2.3 Sommes sur des surfaces régulières ................................ 2.4 Modèles discrets ............................................................ Notes ......................................................................................
317 318 332 339 343 343 351 358 377 386
...................................................................................
389
.
INDEX
Avant-propos
La théorie quantique des champs vise à décrire les interactions fondamentales dans un cadre unique conciliant les principes de la mécanique quantique et les invariances géométriques et cinématiques. Cette discipline s’est enrichie, au cours des deux dernières décennies, d’applications insoupçonnées, qui tiennent à la parenté de ses méthodes avec celles de la physique statistique, à travers l’étude des phénomènes critiques ou des modèles de physique du solide. Certains développements ont permis de s’affranchir en partie des techniques perturbatives, qui sont à la source de succès considérables dans le domaine des interactions électromagnétiques et faibles. En jetant un jour nouveau sur le rôle du groupe de renormalisation, en permettant d’aborder des questions comme le confinement des constituants dans la chromodynamique, en s’ouvrant aux possibilités de simulation numérique, en découvrant des problèmes nouveaux comme ceux posés par la théorie des cordes quantiques, la théorie des champs s’est entièrement renouvelée. Nous nous sommes attachés à en donner un panorama complétant un texte précédent sur la théorie quantique des champs écrit par l’un des auteurs en collaboration avec J.-B. Zuber. Bien qu’on suppose du lecteur qu’il possède quelques rudiments de cette théorie, le présent ouvrage veut éviter de faire de trop nombreux appels à des connaissances extérieures et s’inscrit dans le cadre d’un enseignement destiné à de jeunes chercheurs et, plus généralement, à des scientifiques intéressés par les progrès de cette discipline. L’abondance des matières, le rythme rapide des nouvelles contributions et les compétences limitées des auteurs ont cependant posé des bornes à l’ensemble des sujets traités. Si l’on veut bien admettre ces limites, nous avons cependant tenté de décrire les fondements de la théorie euclidienne des champs, reposant sur l’usage des intégrales de chemins de Feynman et concrètement réalisée à travers les modèles statistiques qui utilisent un réseau discret, dont le paradigme est le modèle d’Ising. Ce point de vue permet d’attribuer un sens global aux quantités physiques, d’étudier des régimes de couplage fort, suggère l’existence de transitions de phases et montre le rôle du groupe de renormalisation agissant comme filtre des propriétés universelles au voisinage des théories critiques continues.
X
AVANT-PROPOS
Le premier volume est consacré pour l’essentiel à l’illustration de ces thèmes. I1 s’ouvre par une étude des chemins aléatoires et leur relation avec les champs bosoniques, et introduit les intégrales fermioniques sur l’exemple du modèle d’Ising bidimensionnel. I1 expose la méthode du champ moyen, les propriétés relatives à l’invariance d’échelle, et illustre les idées de la renormalisation dans le cadre de la transition de Kosterlitz et Thouless du modèle des rotateurs. Un long chapitre est consacré à la théorie des transitions de phases continues à partir des idées de Wilson, où nous nous sommes appuyés sur les contributions de nos collègues E. Brézin, J.-C. Le Guillou et J. Zinn-Justin. C’est encore à Wilson qu’on doit la formulation des théories de champs de jauge sur réseau et leurs applications à la chromodynamique et au confinement dont la présentation clôt la première partie. Le second volume est plus éclectique. On y trouve d’abord des indications sur les développements de haute ou basse température et les applications des simulations numériques de Monte Carlo, en particulier à la chromodynamique. Un copieux chapitre décrit les résultats récents concernant les systèmes critiques bidimensionnels, dans le cadre des théories conformes, qui servent aussi d’outil à la théorie des cordes quantiques. Nous discutons ensuite les applications de l’intégration fermionique à des systèmes désordonnés simples. Enfin le dernier chapitre expose quelques résultats de géométrie aléatoire et introduit l’étude des surfaces fluctuantes. Dans la première partie, au risque de répétitions, nous nous sommes efforcés de présenter le sujet de manière aussi élémentaire que possible. Nous ne supposons du lecteur qu’une certaine familiarité avec la notion de poids statistique de Gibbs, ainsi qu’avec la représentation des amplitudes de transition quantiques comme superpositions relatives à toutes les évolutions possibles, affectées d’un poids exponentiel dans l’action. C’est précisément ce parallélisme qui est à la source des convergences évoquées précédemment. Le choix des sujets traités et les nombreuses omissions reflètent les intérêts des auteurs et leurs préoccupations. Nous ne sommes que trop conscients de nombreuses lacunes dont la liste serait à l’origine d’un texte encore plus volumineux. I1 est quelque peu dangereux de vouloir systématiser ce que l’on a cru comprendre sans laisser percer de-ci de-là des ignorances. I1 est bon de comprendre .A quel point la recherche débouche sur des problèmes ouverts, des questions en suspens, des interrogations. Comprendre nécessite le plus souvent que l’ori reprenne la plume, que l’on retrace les étapes d’un raisonnement, que l’on refasse un calcul, que d’une façon générale on ne se satisfasse jamais de ce ‘que l’on trouve écrit ou dit ici et là. Malgré tous nos efforts, et ils s’étalent hélas sur une trop longue période, il nous a été difficile, voire impossible, de polir suffisamment notre texte pour éviter les no tations conflictuelles, fruit de l’usage, les erreurs matérielles, voire les erreurs tout court. Comme il est rituel, nous invitons le lecteur patient à les redresser et à nous en faire part. Nous espérons cependant que ces défauts inévitables ne nuisent pas trop à la compréhension de
AVANT-PROPOS
XI
l’ouvrage, même si une quantité change parfois de symbole de chapitre en chapitre, ou si la même lettre désigne dans des paragraphes voisins deux entités distinctes. Nous avons inclus des passages en petits caractères, concernant des compléments, des explications et quelquefois des exercices, le plus souvent résolus. En outre, quelques appendices constituent de (trop) brefs résumés de sujets qu’il n’était pas possible de présenter en détail. Enfin des notes bibliographiques complètent chacun des chapitres et sont destinées à indiquer nos sources, fournir des jalons, et surtout à encourager le lecteur à poursuivre son étude dans les articles originaux ou de revue. Ces notes sont évidemment très incomplètes. Parmi les textes qui servent de références, figurent bien entendu ceux de la série publiée par C. Domb et M.S. Green, et maintenant J. Lebowitz, intitulée Phase Transitions and Critical Phenomena, publiée par Academic Press (New York). En ce qui concerne la mécanique statistique, citons K. Huang, Statistical Mechanics, J. Wiley and Sons, New York (1963), H.E. Stanley Introduction to Phase Transitions and Critical Phenomena, Oxford University Press (1971), S.K. Ma Modern Theory of Critical Phenomena, Benjamin New York (1976) et Statistical Mechanics, World Scientific, Singapour (1985), D.J. Amit Field Theory, the Renormalization Group and Critical Phenomena, World Scientific, Singapour (1984). Tandis que nous préparions cette édition sont venus s’ajouter plusieurs ouvrages traitant des mêmes sujets. I1 s’agit tout d’abord du livre de M. Le Bellac Des phénomènes critiques aux champs de jauge, une introduction aux méthodes et aux applications de la théorie quantique des champs, publié dans la même collection par InterEditions, Editions du CNRS Paris (1988) et de ceux de G. Parisi Statistical Field Theory, Addison Wesley, New York (1988) et S. Polyakov Gauge Fields and Strings, Harwood (1988). Enfin un traité de J . Zinn-Justin devrait paraître sous peu. La référence classique où 1,011 trouve un traitement des intégrales de chemins est R.P. Feynman et A.R. Hibbs Quantum Mechanics and Path Integrals, Mc Graw Hill, New York (1965). Des aspects variés sont discutés dans C. Itzykson et J.-B. Zuber Quantum Field Theory, Mc Graw Hill, New York (1980), P. Ramond Field Theory, A Modern Primer, Benjamin, Cummings, Reading, Mass. (1981), J. Glimm et A. Jaffe Quantum Physics, Springer, New York (1981). De nombreux progrès récents de la théorie des champs qui n’ont pas trouvé place dans notre traitement sont présentés dans S. Coleman Aspects of Symmetry, Cambridge University Press (1985), S. Treiman, R. Jackiw, B. Zumino et E. Witten Current Algebra and Anomalies, World Scientific, Singapour (1985). Pour s’initier aux systèmes intégrables, on consultera R. Baxter Exactly Solved Models in Statistical Mechanics, Academic Press, New York (1982) et M. Gaudin La Fonction d’Onde de Bethe, Masson, Paris (1983). Bien entendu cette liste n’est qu’indicative et 1’01.1 trouve de nombreuses autres références dans les notes.
XII
AVANT-PROPOS
L’un des auteurs (C.I.) remercie ses collègues qui lui ont fourni l’occasion d’enseigner des parties de cet ouvrage dans le cadre du Troisième cycle de Suisse Romande à Lausanne, du Département de Physique de l’université de Louvain la Neuve, du Troisième cycle de Physique Théorique à Marseille et à Paris, où les deux auteurs ont eu l’opportunité de participer à l’enseignement. Nos remerciements vont aux secrétaires de ces institutions qui ont pris part à la frappe des, divers textes préliminaires, ainsi qu’à toutes celles et tous ceux qui ont permis la réalisation finale, à Dany Bunel et Sylvie Zaffanella qui ont eu la lourde charge de mettre au point le manuscrit, à M. Leduc qui a accueilli ce livre dans sa collection. Nous remercions chaleureusement les chercheurs et amis du Service de Physique Théorique à Saclay qui au cours des années ont été nos interlocuteurs et co11aborateui:s et qui sont trop nombreux pour être tous cités ici. Enfin le Commissariat à 1’Energie Atomique et son Institut de Recherche Fondamentale inous ont toujours offert des conditions de travail d’une qualité difficile à égaler. C’est en quelque sorte témoigner de notre gratitude que de dédier ce livre aux futurs chercheurs. C’est aussi la raison pour laquelle nous sommes heureux de bénéficier d’une édition française grâce au concours du Centre National de la Recherche Scientifique. Bien souvent il nous est arrivé d’hésiter sur une formulation, simplement parce que nous avions perdu l’habitude de nous exprimer dans notre langue et que nous cherchions un précédent impossible à trouver, tant la langue anglaise a fini par envahir toutes les publications dans notre domaine. S’il n’est pas souhaitable de retourner à l’époque de la tour de Babel et si l’on ne peut espérer revenir aux siècles où le français était une langue scientifique universelle, du moins peut-on souhaiter maintenir un vocabulaire et une capacité d’exprimer les idées contemporaines dans sa propre langue. Sans prétendre aux effets de style, nous nous sommes attachés à trouver une terminologie simple qui puisse rendre compte de concepts nouveaux et nous nous associons à tous les efforts, heureusement de plus en plus nombreux, pour maintenir une langue scientifique vivante. Saclay, Février 1989
Avertissement Dans cet ouvrage, nous avons utilisé les notations internationales. Ainsi, les nombres décimaux ont un point décimal plutôt qu’une virgule, In représente le logarithme népérien, tan la tangente, sinh, cosh, tanh les lignes hyperboliques, etc.
CHAPITRE VI1
METHODES DIAGRAMMATIQUES
Ce chapitre est consacré aux aspects techniques de divers développements déjà rencontrés dans le premier volume. Nous examinerons surtout ceux qui sont reliés à la formulation des modèles sur réseau, à haute ou basse température, ou à couplage fort. Nous n’explorerons pas de façon très. approfondie le vaste domaine de la théorie des graphes, mais nous donnerons plutôt des exemples empruntés aux modèles les plus courants. I1 existe cependant de nombreux traits communs de nature topologique qui sont manifestes dans des développements variés. I1 est bon de les souligner malgré le caractère en apparence élémentaire des procédures employées.
1. Techniques générales 1.1 Définitions et notations Un graphe étiqueté Ç est une collection de v éléments d’un ensemble d’indices et de 1 paires de ces éléments, avec des répétitions possibles (liens multiples). Nous utiliserons aussi le mot diagramme au lieu de graphe. Cet objet abstrait sera représenté par le dessin de v points (ou sommets) reliés par 1 lignes. A chaque sommet est associé la valeur de son indice. Suivant le problème considéré, on ne retiendra qu’une partie de l’ensemble de tous les graphes possibles. A chacun de ces graphes admissibles, on fait correspondre un poids w ( l ; ) (nombre réel ou complexe) par un ensemble de règles. On veut évaluer la somme des poids de tous les graphes admissibles. Parmi les restrictions que 1,011sera amené à considérer, citons (i) la contrainte d’exclusion qui interdit à deux sommets de porter le même indice, (ii) la simplicité, lorsque deux sommets ne sont reliés que par une ligne au plus (le graphe de la figure l(a) n’est pas simple). Par exemple, la série de haute température de la fonction de partition du modèle d’king
2
VII.1.1
METHODES DIAGRAMMATIQUES
z r l : El
k
(4
(b)
Figure 1 : ( u ) Un graphe étiqueté. ( b ) Le graphe libre correspondant.
est représentée par des jraphes associés à chacun des termes du développement . graphe sera du produit, caractérisés par un ensemble d’entiers { n z J }Le constitué de nz3 lignes joignant les points i et j. Les points isolés ne seront pas dessinés. La sommation terme à terme sur les configurations {uz = kl} revient à retenir les termes où chaque u, n’apparaît qu’à une puissance paire. Ainsi les graphes admissibles sont déterminés par les conditions suivantes (i) une ligne ne peul joindre que deux points indexés par des sites voisins (le graphe est dessiné sur le réseau) (ii) le nombre de lignes incidentes en chaque sommet est pair (iii) deux sommets distincts ont des indices distincts (contrainte d’exclusion). Le poids associé est évalué en attribuant un facteur p à chaque ligne et en n z J !ordre , du groupe de symétrie du graphe divisant le résultat par (2-3) par échange de ses lignes.
n
Nous avions aussi écrit
qui conduit à un autre développement pour Z/(cosh@)N. Dans ce cas, les graphes doivent être siinples, et leur poids est calculé en attribuant un facteur tanh B à chaque ligne. Les deux développements ont chacun leur intérêt et sont utilisés concurremment,.
Deux graphes sont isomorphes s’il existe une correspondance bi-univoque entre leurs éléments, telle que deux lignes homologues joignent des points homologues. Ils lie different donc que par la valeur des indices des
VII.1.1
METHODES DIAGRAMMATIQUES
3
sommets. Cet isomorphisme est une relation d’équivalence, et les classes. correspondantes, notées G, sont appelées graphes libres. Leur représentation (figure l(b)) ne comporte plus d’indices. Conventionnellement, le poids w(G) du graphe libre G est la moyenne des poids de tous les graphes isomorphes correspondants. Appelons nombre de configurations n(G) d’un graphe libre G le nombre des graphes étiquetés correspondants; on a alors
Cette notion est particulièrement utile lorsque le poids d’un graphe ne dépend pas de ses indices, puisque les règles de calcul des poids des graphes étiquetés s’étendent immédiatement aux graphes libres. Cependant, son principal intérêt est de séparer l’influence du modèle ou du type de modèle considéré (évaluation de w ( G ) ) des contraintes dues à la géométrie du réseau (dont dépend n( G ) ) . Les sections 2 et 3 de ce chapitre traitent successivement ces deux problèmes. Les graphes ainsi introduits peuvent être généralisés dans diverses directions. Ainsi, (i) on peut considérer plusieurs types de sommets, (ii) les lignes peuvent être orientées, (iii) une modification plus profonde consiste à étendre ces graphes unidimensionnels (collection de points de dimension O et de lignes de dimension 1) à des dimensions supérieures (dimension 2 pour les théories de jauge); (iv) enfin les indices peuvent être composés, et une ligne pourra en porter à ses extrémités. Cette liste n’est qu’indicative des extensions possibles.
Nous aurons besoin dans certaines applications (en particulier pour l’estimation des fonctions de corrélations) de conserver un indice sur un ou plusieurs sommets. Les classes de graphes isomorphes respectant cette contrainte sont appelées graphes avec racines. Deux sommets x , y d’un graphe G sont liés s’il existe un chemin les joignant, c’est-à-dire une suite de liens du graphe 5 2 1 , 2 1 2 2 , ..., z,y. On définit ainsi une relation d’équivalence entre sommets, et les classes correspondantes permettent de séparer le graphe en parties connexes. Un graphe connexe n’a qu’une seule partie connexe. I1 peut exister sur un graphe des cycles ( x 1 , x 2 ,...,x,, X I ) , c’est-à-dire des chemins fermés passant par n points distincts. Un graphe connexe sans cycle est un arbre (figure 2 ( a ) ) . Le nombre de boucles d’un graphe est le nombre minimal de lignes qu’il faut ôter pour qu’il devienne un arbre (figure
W)). Un point d’articulation (figure 2(c)) est tel que sa suppression (ainsi que celle des lignes qui lui sont incidentes) augmente le nombre de parties connexes du graphe. C’est donc un point de passage obligé pour les chemins
4
METHODES DIAGRAMMATIQUES
VII. 1.1
Figure 2 : ( a ) Un arbre. ( b ) Un graphe à quatre boucles. ( c ) Un graphe à deux points d’articulakion. ( d ) Un graphe multiplement connexe. joignant certaines paires de points. En particulier, tous les sommets non terminaux d’un arbre sont des points d’articulation. Un graphe sans points d’articulation (figure 2i:d)) est appelé graphe multiplement connexe; deux quelconques de ses sommets sont sur un cycle et peuvent donc être reliés par deux chemins totalement distincts au moins. Appelant v k , le nombre de sommets d’où partent k lignes v = C kv k , le nombre total de sommets I, le nombre de lignes b, le nombre de boucles c, le nombre de pa:rties connexes d’un graphe nous avons la relation 21 = kvk k
En effet, puisque chaque lien joint deux sommets, la somme des sommets pondérée par le nombre de liens incidents est égale à deux fois le nombre de liens. Par ailleurs, la relation d’Euler
v+b=c+Z
(5)
s’obtient par récurrence, en supprimant une à une les lignes du graphe jusqu’à obtention de u points isolés. A chaque étape, ou bien on diminue le nombre de boucles d’une unité, ou bien on augmente le nombre de parties connexes. (i) Calculer exp icitement jusqu’à l’ordre 4 la fonction de partition du modèle d’king sur un réseau hypercubique à d dimensions. Les graphes libres admissibles ayant au plus 4 lignes sont représentés sur la figure 3. Leurs nombres de configurations, calculés pour u n réseau fini de N points avec conditions aux limites périodiques, sont respectivement N d , 1). En tenant compte du N d , Nd(2d - l ) , $ N d ( d - 1) et $ N d ( N d - 4d
+
VII. 1.1
METHODES DIAGRAMMATIQUES
préfacteur de symétrie, les poids correspondants sont $pZ,&O4, $p4,p4, aB4. La sommation de ces différentes contributions conduit à 2=1
+ $Nd,B2 + [ $ N d ( 6 d
-7)
+ i N 2 d 2 ]B4 + 0 ( B 6 )
A cet ordre, il est facile de vérifier l’extensivité de l’énergie libre. L’expression
N
-
F N
-
In2 N
-
$dp2
+ k d ( 6 d - 7)p4+ u(f’)
est en effet indépendante de N .
(a)
(b)
(4
(cl
Figure 3 : Graphes du modèle d’king jusqu’à l’ordre ,û4. Notons qu’il était plus rapide d’utiliser le développement en tanh p. En vertu de la contrainte de simplicité, seul le graphe de la figure 3 ( d ) donne une contribution non nulle, ce qui conduit à la formule suivante, équivalente à ( 6 ) dans un développement à l’ordre ,û4 Z = (cosh /3)Nd[l 1- i N d ( d
-
1)tanh4 ,û
+ 0(tanh6 a)]
Cette contrainte est donc bien utile dans ce cas pour réduire le nombre de graphes, qui prolifèrent rapidement avec l’ordre. Les sous-sections suivantes étudient d’autres techniques de réduction. (ii) Théorème de Kirchoff. Les définitions précédentes nous permettent de rappeler un théorème dû à Kirchoff, donnant le nombre d’arbres distincts tracés s u r un graphe connexe et joignant tous les sommets. Associons à un graphe connexe G sa matrice d’incidence A (qui est l’équivalent topologique du laplacien). Sur la diagonale principale, (-A)%i est le nombre de liens incidents au sommet i, alors quc ( - A ) L jest l’opposé du nombre de liens joignant les sommets (distincts) i et j. Comme la somme des éléments de chaque ligne ou colonne est nulle, det(-A) s’annule. Cela correspond à l’existence d’un mode nul, unique car le graphe est conncxe. Le théorème stipule que tout mineur principal (c’est-à-dire ( - l ) i + J fois le déterminant de la matrice où l’on a supprimé la i-iènie ligne et la 1-ièrne colonric) est égal au nombre d’arbres recherché. Le vecteur propre corrcspondant à l’unique mode nul a toutes ses compole mirieur principal de l’élément ij (avec son signe). santes égales. Soit Puisque
5
6
MFTHODES DIAGRAMMATIQUES
VII. 1.1
tous les M k j , à IC fixi, sont égaux. Comme la matrice est symétrique, on en déduit que le résultat s’étend à toute valeur de k, tout mineur étant égal à la même valeur M . I1 nous suffit donc d’évaluer M = M i l . Soit v le nombre de sommets et f? 2 v - 1 le nombre de liens. Introduisons la matrice Lai de dimension 1 x v, où CI indexe les liens et i les sommets, après avoir orienté arbitrairement chaque lien, en posant
+1
si le lien a part du sommet i
-1
si le lien a arrive au sommet i
O
si le lien a n’est pas incident au sommet i
On a alors (-A) = L??L. Appelons L’ la matrice déduite de L en supprimant sa première colonne, de telle sorte que
où la sommation porte sur toutes les matrices La,...û., d’ordre (v - 1) x (v - 1) obtenues en choisissant v - 1 lignes de L’. Chaque terme de la somme est de la forme (detLkz..,a,,;2, et n’est non nul que si l’application i + a; associe à chaque sommet i = 2, ..., v un lien incident. Dans ce cas, la matrice Laz ,,,Qu ne diffère d’une matrice de permutation que par le fait que ses éléments sont *1 plutôt que +l. I1 s’ensuit que (detLa,,,,,v)2 vaut 1, et que la matrice est en correspondance bi-univoque avec un arbre. On a ainsi prouvé le théorème de Kirchoff. Cette interprétation topologique du laplacien se révèle utile dans les problèmes de percolation et de polymères. Nous en verrons une application au chapitre XI.
1.2 Graphes connexes et cumulants La propriété fondamentale d’exponentiation se fonde sur les conditions suivant es: (i) Le graphe vide (sans point, ni ligne) est admissible, et son poids est égal à 1; il a c = O parties connexes et n’est donc pas connexe (e # 1). (ii) Toute juxtaposition d’éléments de graphes admissibles est un graphe admissible. (iii) Le poids d’un graphe est égal au produit des poids de ses parties connexes. Sous ces hypothè:jes, la somme des poids des graphes est égale à l’exponentielle de celle des graphes connexes.
VII.1.2
METHODES DIAGRAMMATIQUES
7
La contrainte d’exclusion est incompatible avec la condition (ii). On vérifiera sans peine que dans ce cas la proposition précédente appliquée telle quelle est inexacte en prenant pour exemple le modèle d’king à l’ordre B4. Nous montrerons dans cette sous-section comment tourner cette difficulté et construire un développement pour l’énergie libre.
La démonstration tient en quelques lignes. Un graphe quelconque sera construit en choisissant indépendamment et successivement ses c parties connexes ...Çc d’après la première condition. L’ordre dans lequel ce choix est fait étant indifférent, chaque graphe est ainsi obtenu exactement c! fois. Utilisant la propriété de factorisation et sommant sur le nombre c de parties connexes
on reconnaît dans le membre de droite de cette relation l’exponentielle annoncée, soit
Bien que dans la pratique, il ne soit pas toujours indispensable de se servir de ce résultat, la propriété d’exponentiation est d’une importance capitale : les calculs de quantités extensives, de comportements asymptotiques, de longueurs de corrélation, d’effets de bord reposent sur une proprieté d’exponentiation. Nous avons vu que la contrainte d’exclusion, fréquemment rencontrée, l’invalide. Cependant , un simple changement des règles diagrammatiques, connu sous le nom de méthode des cumulants, permet de rétablir la propriété. Supposons donc qu’il existe un autre ensemble de règles n’obéissant, pas à la contrainte d’exclusion. Nous en différencierons les graphes en représentant les sommets par des cercles plutôt que des points noirs. Un nouveau graphe représente une partie de la contribution de l’ancien graphe obtenu en fusionnant les sommets portant le même indice. Si l’on veut que le nouveau développement conduise au même résultat, on obtiendra un système de contraintes que l’on peut écrire symboliquement
8
VII.1.2
ME:THODES DIAGRAMMATIQUES
10
l!
+-1 O O + 1 ooo+.** 2!
3! (1+ . ) ( O - )
(1+.)(-0-+4+)=
-
=O =
-c
Le facteur (i+.) tient compte de la possibilité de fusionner autant de points isolés qu’on le désire. Dans ces relations, tous les points portent le même indice, qu’on a omis pour la clarté de la formule. Pour résoudre ces équations, nous allons préciser les règles de calcul des poids. Dans le développement utilisant la contrainte d’exclusion, (i) un facteur
zk
eE,t associé à chaque sommet relié
k lignes,
(ii) un facteur ,B est associé à chaque ligne, (iii) le produit des facteurs précédents doit être divisé par l’ordre du groupe de symétrie du graphe. Le développement sans contrainte d’exclusion obéit aux mêmes règles, le facteur zk étant remplacé par un facteur uk. Les équations (il)s’écrivent alors
et permettent de ca1cu:ler de proche en proche les cumulants
‘uk
VII.1.2
METHODES DIAGRAMMATIQUES
u2
=-z2 -
9
(z) 2
z0 u3
I
z3 zo
22
=- - 3--
z1
zo zo
+ 2 (:)3
La solution peut s’exprimer sous forme compacte en introduisant les fonctions génératrices
u(h)= k=O
(15)
IC!
Le premier membre des équations (12) s’interprète alors comme la suite des coefficients du développement en h de expu(h)
(i) Justifier plus complètement la méthode des cumulants et vérifier l’équation (16) jusqu’à l’ordre 4. (ii) Retrouvons par ces règles l’énergie libre (7) du modèle d’king à haute température. Les règles initiales imposent Z 2 k = 1, Z g k + l = O , de sorte que z ( h ) = cosh h ~ ( h=)lncoshh = i h z - A h 4
(17)
+...
Les graphes connexes sont les quatre premiers de la figure 3. Mais, la contrainte d’exclusion étant levée, leurs nombres de configuration diffèrent et sont maintenant respectivement N d , N d , $ N ( 2 ~ l )a~N, d ( 2 d - 1). Ces nombres sont tous proportionnels à N , à cause de l’invariance par transition, ce qui assure à tous les ordres l’extensivité de l’énergie libre. Les poids respectifs sont alors (puisque 212 = 1, 214 = -2) $p2, i p 4 ,-$p4,p4.On notera la perte de la positivité des poids, consécutive à celle des cumulants. La sommation des graphes connexes redonne immédiatement la formule (7) et fournit ainsi une vérification de la proposition générale énoncée ci-dessus. La même méthode est applicable au développement en tanh p. On doit introduire des facteurs Zk dépendant de la
(18)
10
MIETHODES DIAGRAMMATIQUES
VII. 1.2
direction des lignes incidentes, et les graphes obtenus ne sont plus simples. Cela limite l'intérêt de la méthode pour les graphes simples. Le choix entre les contraintes de simplicité et de connexité dépend du problème considéré. Nous verrons en particulier qu'il est plus avantageux, pour les théories de jauge, de choisir la simplicité.
En ce qui concerne les graphes avec racines, la répartition des indices fixés entre les différentes parties connexes conduit à des relations similaires à (11). Si Z ( i l . ..i k ) désigne la somme des contributions de tous les graphes (connexes ou non) avec racines il ,.. . ,i k , et si (il . . . i k ) , désigne la somme correspondante des graphes connexes calculés avec les règles des cumulants, on a
< i l >= < i l >c < i l i 2 >= < i l i 2 :>, + < i l >,< i 2 >, < i l i 2 i 3 >= < i 1 i 2 i : I > c + < i l i a > c < i 3 > c + < i l i 3 >,< 22 >, + <: i 2 i 3 >,< i l >, + < i l >,< i 2 >,< i 3 >,
(19)
En effet, les graphes non connexes se factorisent d'une part en parties connexes ne comportant aucune racine et dont la somme va reconstruire la fonction de partition 2, d'autre part en graphes avec racines qui vont réaliser toutes les partitions possibles des indices i l , ..., ik fixés. Ces propriétés sont évidentes zi un introduit une source j pour les champs. Les graphes avec racines correspondent alors aux fonctions de corrélation, qu'elles soient non connexes
ou connexes
Les relations (19) deviennent alors une simple conséquence de (20-21).
1.3 Irréductibilité e t transformation de Legendre Poursuivons la réduction du nombre de graphes en décomposant les graphes connexes en parties irréductibles. La notion d'irréductibilité peut être plus ou moins poussée. Elle peut aller jusqu'aux graphes multiplement connexes (cf. exercice ci-après). Une étape intermédiaire conduisant à des calculs assez simples él!mine seulement les graphes réductibles relativement aux lignes.
VII.1.3
METHODES DIAGRAMMATIQUES
11
Un graphe connexe est réductible s’il contient au moins une ligne dont la suppression le rend non connexe; tel est le cas de celui de la figure 4u, où l’on a indiqué les lignes par rapport auxquelles il peut être réduit. On notera qu’un arbre est réductible par rapport à n’importe laquelle de ses lignes. Ayant supprimé les lignes de réductibilité, le graphe se trouve disjoint en parties irréductibles, qui vont depuis le simple point isolé jusqu’aux “cactus” formés de blocs multiplement connexes reliés par des points d’articulation. Si l’on représente ces blocs par un cercle hachuré, tout graphe prend l’aspect d’un arbre dont les sommets sont des cercles hachurés. La figure 4b illustre cette décomposition par une équation symbolique; le membre de gauche est la somme des graphes connexes, représentés par un cercle vide.
Figure 4 : (u) Un graphe réductible et sa décomposition en parties irréductibles. ( b ) Aspect général des graphes connexes. Sous les conditions énoncées au paragraphe précédent, nous allons montrer qu’il est possible de définir des règles diagrammatiques pour ces graphes en arbre, puis nous les calculerons en exposant une méthode de resommation des arbres. Soit C ( { h i } )la somme des poids des graphes étiquetés connexes où l’on associe au sommet étiqueté i, d’où partent IC lignes, un facteur dku(hi)/dht. Ultérieurement, on annulera les champs auxiliaires hi afin de retrouver les règles diagrammatiques initiales. L’opération de dérivation dC/dhi consiste à choisir successivement dans tous les graphes de C les points d’indices i et de remplacer leur contribution dku(hi)/dhFpar dk+f’u(hi)/dhf+l. Ceci s’interprète diagrammatiquement par l’addition d’une ligne supplémentaire sur les graphes avec racine i, soit symboliquement
i
De même, nous faisons correspondre au cercle hachuré la fonction
12
METHODES DIAGRAMMATIQUES
VII.1.3
I ( h z ) , somme des poids de tous les graphes irréductibles calculés avec des poids similaires dku(h,)/dht pour le sommet i. L’interprétation (22) de la dérivation restant valable pour cette fonction, la contribution des sommets hachurés dans les arbres de la figure 4b est donnée par la fonction génératrice pour un champ unifoIme I ( h ) = I({hz})lh,=h. Ces graphes sont non étiquetés et il convient, dans les règles diagrammatiques, de diviser leur contribution par l’ordre de symétrie du graphe afin de reconstituer de façon unique chaque graphe etiqueté connexe du développement primitif. Pour resommer les arbres, nous allons les engendrer avec un poids incorrect, puis corriger le résultat en utilisant les relations topologiques du paragraphe 1.1. Considikons tout d’abord tous les graphes ayant un sommet généralisé distingué. Leur somme C. s’obtient en comptant chaque arbre un nombre de fois égal à son nombre de sommets. Construisons l’arbre à partir de ce sommet d’où peutent partir IC = O, 1 , 2 , ... lignes. Le sommet généralisé représenté par le cercle hachuré contient plusieurs sommets simples, et il va falloir les “habiller” individuellement. Rajouter kt lignes incidentes à l’un de ces sommets i revient à effectuer la dérivation ûkl/ûhf*. A chaque ligne qui relie le sommet i à l’un des sites voisins, on attribue un facteur ,L?. En d’autres termes, le sommet habillé est obtenu à partir du sommet nu par l’opération
+
,L?Cj
c’est-à-dire explicitement (rappelons que q est le nombre de coordination) dkI(h)
c . = c F(pm)k= I ( h + qPm). k=O
On peut faire un calcul similaire en particularisant cette fois un lien. Le résultat CJ compte chaque graphe un nombre de fois égal à son nombre de lignes
VII.1.3
METHODES DIAGRAMMATIQUES
13
Utilisant la relation ( 5 ) qui s’écrit dans ce cas (26)
w-1=1
nous constatons que chaque graphe est compté exactement une fois dans la différence C. - Cl. Le résultat final est donc
C ( h )= I ( h
+ qPm) -
,Om2
(27)
liens
où chaque terme est proportionnel au nombre total de sites N et où la quantité m est solution de
c’est-à-dire, compte tenu de (27),
+
m = -1 d l ( h qPm) N dh
(29)
Les relations (27) et (29) expriment que les fonctions C et I sont transformées de Legendre l’une de l’autre. L’équation (29) implique la stationnarité du membre de droite de (27) vis-à-vis des variations de m à h fixé. Ceci permet de donner une expression sous forme compacte
m
I(h
+ qPm) -
,Om2 liens
dans laquelle nous pouvons maintenant, si nous le désirons, annuler le champ extérieur h. Cette transformation de Legendre permet en principe d’étendre la procédure du champ moyen à tous les ordres. Sous la forme d’un principe variationnel, elle montre le caractère convexe de l’action effective C(h ) . (i) Dans le cas du modèle d’king en champ extérieur nul, cette méthode pourrait sembler dénuée d’intérêt, puisque tous les graphes d’ordre fini sont irréductibles à cause de la parité des sommets. L’aimantation par site
est également nulle à tout ordre fini. Ce n’est plus le cas cependant à basse température pour d 2 2. La formule (30), qui réalise en fait la resommation d’un nombre infini de graphes, peut reproduire ces faits en remplaçant le champ extérieur nul, h = O , par un champ moyen qpm. En effet, la série déterminant la quantité Z peut être réordonnée en puissances d’une autre variable que la température, l’inverse de la dimension, l / d , par exemple. I1 est alors possible d’approximer i(h) à toute température par le graphe d’ordre le
14
METHODES DIAGRAMMATIQUES
VII.1.3
plus bas, c’est-à-dire rie comportant qu’un sommet, dont la contribution est u(hi) = lncoslihi. La formule (30), qui devient
ci
ci
In Z
-- = Extr (In cosh 2dBm - p d m 2 ) IV
m
lorsque tous les mi scnt égaux, n’a qu’un minimum à m = O pour B petit. Lorsque @ croît, ce minimum devient un maximum, encadré par deux minima correspondant à f m s c # O où msp est l’aimantation spontanée. La technique diagrammatique n’indique pas le choix à faire parmi les extréma, ce dernier résulte d’une étude globale. L’annulation de la dérivée seconde du second membre de (31) fourriit le point de transition du deuxième ordre Pcd = 1. Nous retrouvons ainsi le résultat du champ moyen. L’intérêt de la méthode est de permettre un calcul systématique des corrections.
+
+
Figure 5 : Construction récursive du réseau de Bethe. (ii)Nombre d’arbres sur un réseau de Bethe. Un réseau de Bethe est un réseau formé d’un arbre infini où chaque site est relié à q voisins. Sa construction est illustrée sur la figure 5. Les arbres de Cayley construits de cette manière récursive ont cependant la propriété malheureuse que, dans la limite “thermodynamique”, le nombre de sites en surface est du même ordre que le nombre total de sites. Les effets de surface ne peuvent donc être ignorés, à moins de ne considérer que les quantités relatives aux sites “profonds” (c’est-à-dire que la liinite de volume infini doit être prise avant tout calcul). C’est ce que nous en1;endrons par réseau de Bethe. De nombreux problèmes sont solubles sur un tel réseau. Par exemple, on peut compter le nombre Nk d’arbres à IC branches, par site. A cet effet, nous évaluerons la fonction géneN k t k . Remarquant que ces arbres ont des sommets à q ratrice G ( t ) = branches au plus, on obtient sans peine l’équation (correspondant à (27))
=(1
+ mt)Q- 1 - Iqtm2 2
...
VII.1.3
METHODES DIAGRAMMATIQUES
15
où m représente la contribution des arbres poussant au bout d’un lien donné
La solution
G ( t )= Extr { (1+ tm)4- 1 - iptm2} m
devient singulière à t, = (p - 2 ) q - 2 / ( q - 1 ) q - l . Cette singularité provient du poids important des arbres de grande taille et est reliée au seuil de percolation sur ce réseau. (iii) Réduction aux graphes multiplement connexes. Dans une telle réduction, les variables sur lesquelles s’effectue la transformation de Legendre deviennent en nombre infini. On veut sommer des “cactus” (figure 6) où les points d’articulation sont précisés. La relation topologique à utiliser est
Figure 6 : Décomposition d’un arbre en parties multiplement connexes. où nb est le nombre de boucles, n, le nombre de points d’articulation et nm ce même nombre de points d’articulation, chacun étant compté autant de fois qu’il est relié à des boules différentes. Soit B({uE!”’})la contribution de graphes multiplement connexes calculée en attribuant à chaque sommet i d’où partent n lignes le facteur uin) (avec les règles habituelles, on utilisait ûnu(hi)/ahl).L’habillage d’une boule pour en faire un cactus consiste à remplacer la contribution d’un sommet par celle d’un sommet “habillé”
où g l k ) représente la contribution de l’ensemble des graphes connexes tels que k lignes sont incidentes au sommet z
(34)
16
VII.1.3
METHODES DIAGRAMMATIQUES
L’utilisation de la relation (35) permet d’évaluer, comme précédemment, la somme C des poids de tous les diagrammes connexes
Les formules ( 3 6 ) et ((37) sont à nouveau des conditions d’extrémalité sur le membre de droite de (38), considéré comme fonction des variables indépenet 91“). dantes
.In’
Ces techniques de réduction paraissent très attrayantes dans leur principe. En pratique, leur utilisation dans les développements pour les modèles sur réseau conduit à des expressions si compliquées que leur usage reste limité. Dans le cadre des thliones continues, des noyaux irréductibles analogues interviennent dans les equations intégrales de Schwinger-Dyson, dans l’analyse des états liés par l’équation de Bethe-Salpeter et dans la théorie formelle de la renormalisation.
2. Développements en série 2.1 Développement de haute température Nous discuterons en toute généralité des modèles statistiques dont l’action, intervenant ditns le poids de Boltzmann exp S , s’écrit
1 -V?i.:.akipz /%! 2 1 ...zk . . . p z+
S ( J )= k22
c
JFipq
(39)
i,a
Les champs pi peuvent être soit bosoniques, soit fermioniques. Dans ce dernier cas, la source J fait également intervenir des variables grassmanniennes.. Dpi. On cherche à évaluer la La mesure d’intégration est désignée par fonctionnelle génératrice des fonctions de corrélation
ni
A haute température, l’exponentielle est développée en série de la variable /3. Chaque terme est a,lors intégré sur les champs évaluer l’intégrale
cpi.
On est alors amené à
VII.2.1
METHODES DIAGRAMMATIQUES
17
qui requiert la connaissance de la fonction de partition associée à un seul site
Enonçons les règles diagrammatiques pour le calcul de Z. On considère tous les diagrammes comportant les éléments suivants : O Des sommets correspondant aux sites, à n 2 1 branches, indexés par le site i et représentant un produit de n champs 9:’ . . .cpEn. Leur contribution sera
Des sommets correspondant aux interactions à IC indice, associés au facteur
2 2 branches, sans
(ij denotant les indices de sommets correspondant aux sites auxquels ce sommet sera relié). Des lignes joignant un sommet correspondant à un site à un sommet correspondant à une interaction. Elles portent à leurs deux extrémités un indice interne Q sur lequel il faudra sommer. On se propose de resommer les contributions de tous les diagrammes possibles, connexes ou non, avec contrainte d’exclusion pour les sommets associés aux sites. Les méthodes de la section précédente peuvent être utilisées, et nous allons en donner quelques exemples. Un cas particulier est celui d’une interaction quadratique et homogène (invariante par translation). Les sommets relatifs aux interactions, ayant toujours deux branches, peuvent être omis, et l’on retrouve les diagrammes habituels aux modèles de spin, et en particulier au modèle d’Ising qui illustrait la section précédente.
(i) Etablir un développement valable à grande dimension pour le modèle de spin O ( n ) en utilisant l’irréductibilité. Les champs
BE,.
La fonction de Bessel I k ( h ) ne doit pas être confondue ici avec la fonctionnelle génératrice des graphes irréductibles I ((h}). Dans l’équation (42), la mesure
18
VII.2.1
M ETHODES DIAGRAMMATIQUES sur cp est normalisée à l’unité. En posant H = h on trouve In Z -=I(H)-N
H2 4Bd
,
+ 2dBm dans la relation (30),
dI H=2/3ddH
(43)
Comme nous l’avons déjà indiqué, la valeur H = O cesse de donner la solution physique lorsqu’elle correspond à un maximum. La transition est obtenue en annulant la dérivée seconde du membre de droite de (43) pour H = O. A l’ordre le plus bas, I ( H ) = u ( H ) , et on en déduit donc B, = n/2d, d’ordre l / d en grande dimension. Les diagrammes jusqu’à l’ordre 6, ainsi que leur dérivée seconde à H = O , sont représentés sur la figure 7. Puisque B est d’ordre a-’, on constate qu’un diagramme d’ordre IC sera d’ordre d - k + [ k / 2 1 .Ceci est dû au fait que l’irréductibilité oblige le diagramme à ne comporter que des cycles; un cycle de longueur 2k ne peut utiliser que k directions différentes sur un réseau et son nombre de configurations est une expression polynômiale en d, de degré k. Si l’on réordonne 1.i série donnant I en pd et d - l , il n’y aura donc qu’un nombre fini de diagrammes contribuant à un ordre donné en d-’. On est ainsi conduit à l’équation donnant Bcd en série de d - l , à savoir n
-
1
2 P , d - l - - -2d
2-2/(n+2) 4d2
- 7-8/(n+2)
+...
8d3
à comparer à l’expresision (111.104) obtenue dans la limite n infini.
(ii) I1 est intéressant d’étudier dans ce cadre la limite n + oû. De la discussion précédente, on déduit que cette limite doit se faire à B/n fixé. Une inspection de la figure 7 révèle que seuls contribuent les diagrammes dont chaque partie multiplement connexe ne comporte qu’une boucle. Ceci suggère l’utilisation du formalisme de l’exercice 3 de la section 1.3. La fonction u ( h ) se comporte comme
ce qui assure que les variables g(3), g(4) ... n’interviennent pas dans l’équation (36). En fonction des variables g(’) (vecteur) et g(2)(matrice), le second membre de l’équation (36) peut alors s’écrire
Nous ne retiendrons, dans le calcul de B , que le diagramme formé d’un seul lien et les diagrammes à une seule boucle. En tenant compte du nombre de boucles à p segments que l’on peut tracer sur un réseau (voir la section 3 de ce chapitre), on arrive à la formule
(44)
e 0
a
2~2d/~3
-8P4d/(n5(n
+2))
-64P5d2/(n6(n
-8P6d3(7n
+2)) +
4 P 3 d / ( n 4 ( n+ 2 ) )
36P5d(2d - l ) / ( n 6 ( n 2 ) )
+ 1 6 ) / ( n 7 ( n+ 2 ) )
96P6d2(2d - l ) / n 7
0
+
+
M d
4P6d(4d2 8d - 7 ) / ( n 7 ( n 2 ) ) ti
E O00
-40p6d3/n7
0
-20B6(6d2 - 9d
+ 4)/n7
-6P4d(2d - i)/n5
Figure 7 : Diagrammes intervenant dans le calcul au sixième ordre du noyau irréductible I ( H ) et leur contribution à d21(W/dH2 .
IHZO
20
METHODES DIAGRAMMATIQUES
Les conditions de stationarité relatives à u ( l ) et
où la quantité
Y
VII.2.1
conduisent alors à
est scilution de l’équation
1
m
n
=
dsIt(s)eëS”
La température critique est obtenue lorsque ce paramètre v prend sa plus petite valeur possible égale à d . On vérifie que le développement en i / d du résultat obtenu coïncide avec la formule (44) de l’exercice précédent dans la limite n -+ 00. (iii) Utiliser l’irrhductibilité pour retrouver, en toute généralité, les résultats du champ moyen avec corrections. La formule (31) se généralise à des interactions quelconques. Cependant, la méthode se complique légèrement, compte tenu des deux types de vertex (interactions et sites: intervenant dans les diagrammes. Reprenons donc la dérivation effectuée en 1.3, en précisant les changements à apporter. Nous envisagerons tout d’abord l’irréductibilité vis-à-vis des vertex d’interaction. Un diagramme sera réductible vis-à-vis d’un vertex si sa suppression le sépare en exactement k parties disconnectées. I1 faut noter que cette définition n’est pas aussi générale que celle de l’irréductibilité forte, où une simple disconnection du diagramme assure la réductibilité. Diagrammatiquement, nous représenterons les vertex d’interacticin par un point noir, les vertex-sites par un point blanc. L’équation (22)
dans laquelle le verte:<-sitei a été distingué, doit être complétée par la formule correspondante pour le vertex d’interaction
H 2. --
&
=
La reconstruction à partir d’une boucle irréductible faite en (23-24) se généralise alors sans difficulté
(49)
’
VII.2.1
METHODES DIAGRAMMATIQUES
21
de même que celle faite à partir d’un vertex d’interaction. La relation topologique à utiliser est maintenant, pour z1 boucles et nk vertex d’interaction à IC branches z1
C(k-
1)nk
=1
+ H)) + S ({m
(2)))
-
(53)
D’où la relation finale C ( { h ) )= I ( { h
-
miHi
(54)
i
Les formules (50-51) expriment l’extrémalité du membre de droite de (54) vis-à-vis des variations en H et m. Le développement diagrammatique de I est tel que tout vertex d’interaction appartient au moins à une boucle et le développement peut s’ordonner naturellement suivant le nombre de boucles.
Le premier terme redonne l’approximation du champ moyen, telle qu’elle a été écrite en toute généralité dans les formules (VI.64)-(VI.66)). A nouveau, la technique diagrammatique n’indique pas quel est le choix à effectuer lorsqu’il y a plusieurs extrema; seule une méthode intégrale permet de résoudre ce problème.
2.2 Le rôle des symétries L’exploitation des symétries conduit à un développement en graphes simples qui généralise le développement en tanh /3 du modèle d’Ising. Un modèle chiral utilise des champs cp éléments d’un groupe G. La base naturelle pour exprimer les fonctions de cp est formée des éléments de matrice D&(cp) des représentations irréductibles T de G. Cette assertion est le théorème de Peter-Weyl dans le cas des fonctions de carré sommable sur un groupe de Lie compact. Elle est vérifiée a fortiori pour un groupe
22
METHODES DIAGRAMMATIQUES
VII.2.2
fini. La mesure d p sur les champs est la mesure invariante, ou mesure de Haar sur le groupe G que nous normaliserons à l’unité. Les représentations irréductibles satisfont aux relations d’orthogonalité et de complétude
est la mesure’ La représentation irréductible r est de dimension d, et 6(p, 9’) de Dirac (fonction 6) sui: G. Au lieu de développer exp S en série entière dans les champs cp, on le développe en fonction des coefficients des représentations irréductibles DT(cp)et on effectue les intégrations par les méthodes de la théorie des groupes, en utilisant en particulier la relation (56). A titre d’illustration, reprenons le modèle de spin O ( n ) dont nous récrirons l’action sous la forme
Les champs sont maintenant des rotations R E SO(n) dans un espace à n dimensions, choisies pour amener un vecteur fixe 90sur le vecteur +i = Riao. L’espace des spins est l’espace homogène S O ( n ) / S O ( n- 1).A l’aide de la formule (56), exp S peut être développé en série de Fourier
n EdT
’I3 ( B T D T ( R Z 1 R j ) )
expS =
(59)
r
dont les coefficients p, (qui sont des matrices r x r ) sont donnés par
LIT =
/
dR
exp Sij(R)
tandis que PO est un simple scalaire. Comme précédemment, chaque terme du produit (59) est représenté par un diagramme. Pour chaque paire de voisins (ij) pour laquelle on aura choisi une représentation non triviale r # O, on dessinera une ligne allant de i vers j indexée par la représentation r; on lui associera une contribution dTpT//3o (dans le calcul de la fonction de partition, une puissance du scalaire ,BOa été factorisée). Le graphe est simple, avec au plus une ligne joignant deux sommets. Chaque ligne est orientée; le changement d’orientation revient à substituer à la représentation r son adjointe F : DT = 11 est à noter que, d’après la définition (60), pr =
m.
Pour le modèle d’Ising, le groupe est 2 2 = { 1, -1) qui n’a qu’une seule représentation non triviale. On retrouve immédiatement que PO = coshp et pi = sinhp, ainsi que les règles du développement en ,&/@O = tanhp.
K.
VII.2.2
METHODES DIAGRAMMATIQUES
23
Lorsque plusieurs lignes T I , . . T , sont incidentes sur un même sommet, l’intégration sur le champ Ri en ce site prend la forme a,
/
d R Drl (R) ...Vrn(R)
En particulier, le cas n = 1 est exclu, car les représentations T sont non triviales et l’intégrale correspondante s’annule. Lorsque n = 2, deux lignes successives doivent porter la même représentation. Plus précisément, l’intégration sur les variables attachées aux sommets intermédiaires d’une ligne composée d’une suite de liens successifs se fait aisément par la formule
conduisant à une contribution pour une ligne brisée de la même forme que l’interaction élémentaire. Une boucle formée de k maillons donne en particulier un facteur
Les sommets communs à plus de deux lignes conduisent à des calculs plus complexes, où interviennent les coefficients de couplage des représentations TI,
...,T,.
Si, au lieu du modèle vectoriel, on considère le cas chiral avec une action de la forme
s=p les calculs se simplifient, car
Tr(R7lRj)
ph est alors multiple de la matrice unité.
C’est aussi le cas de l’action utilisée dans les modèles de jauge sur réseaux
L’interaction est quartique dans les champs. Plutôt que d’adopter la représentation graphique de la sous-section précédente, on préfére représenter l’interaction par la surface de la plaquette i j k l , dont les côtés portent les champs (figure 8). On est ainsi conduit à considérer des diagrammes qui ont la topologie de surfaces constituées de plaquettes.
24
VII.2.2
METHODES DIAGRAMMATIQUES
Figure 8 : Repr,Ssentation de l’interaction dans le cas des modèles de jauge. Les méthodes de réduction à des graphes connexes peuvent être utilisées, mais conduisent malheureusement à une prolifération excessive du nombre de graphes. Par exerr.ple, si l’on énumère les graphes du quatrième ordre apparaissant dans un réseau réduit à une seule plaquette, on en trouve 16 topologiquement distincts, parmi lesquels on identifie des sphères, des tores, des plans projectifs et des bouteilles de Klein. Un seul de ceux-ci est non connexe. Cette méthode n’est en pratique utilisable que pour certains problèmes de resomma.tion à topologie fixée. En revanche, les méthodes de théorie des groupes conduisent, pour ces modèles, à des calculs relativement économiques. Ecrivant la représentation
P
r
en termes des caractères xT = TrVT et effectuant les intégrations à l’aide des formules (56), on est amené à considérer tous les diagrammes ayant la topologie de surfaces fermées. La première de ces surfaces borde un cube t n dimensionnel (à 6 facej), dont il existe N d ( d - i)(d - 2)/6 positions distinctes sur le réseau hypercubique. On en déduit le début du développement de la fonction de partition de ce modèle
z = p0”d
(+ 1
@d(d
- l)(d - 2)
d: r#O
(
+ ..
.)
2.3 Développements de basse température - cas discret Dans les développements de haute température, on considérait une configuration d'interactions donnée (représentée par un diagramme) et on effectuait explicitement terme à terme la sommation sur toutes les configurations de champs. Nous allons maintenant adopter le point de vue dual en partant d’un &at ordonné minimisant l’énergie (ou maximisant le poids de Boltzmann) en le modifiant peu à peu, prenant ainsi en compte les excitations successives. Les techniques different suivant que le champ prend des valeurs discrètes ou continues. Nous évoquerons le cas d’un champ à valeurs continues dans I a sous-section suivante.
VII.2.3
METHODES DIAGRAMMATIQUES
25
Dans le cas discret, les niveaux d’énergie’(ou les valeurs de l’action) des E l , ...), chaque différentes configurations forment un spectre discret (EO, niveau étant dégénéré no, nl, . . . fois. Supposons provisoirement que l’état fondamental soit non dégénéré (no = 1)’et que chaque état excité soit obtenu en modifiant un nombre fini de champs de l’état fondamental. Nous reviendrons plus tard sur ces points. La fonction de partition s’écrit
et il s’agit de classer les états suivant leur énergie. Chaque configuration est identifiée par l’ensemble des champs (pi dont les valeurs different de celle de l’état fondamental ,pio). L’action va être récrite sous forme d’une somme de termes So + Si S, . .. faisant intervenir un nombre croissant n de champs modifiés
+ +
Sn
Sn(~il,.**~in)
E
(68)
i l ,...in
avec S, (,pi(O),. . . ,,pin)) = O pour n de partition s’écrit donc
avec f. .
212*...2,
.
> O et
SO
E
s ({,pio)}) . La fonction
= esn(vi1?...vin)- 1
( 70)
L’expression entre crochets dans (69) est développée et représentée graphiquement par des diagrammes. Les sommets sont étiquetés par les champs pi # ,pio) différant de l’état fondamental. I1 y a également des sommets associés aux “interactions”; il sont reliés à ces sites et représentent les termes f i j , f i j k , ... choisis dans le développement du produit (69). Les graphes correspondants sont simples, en ce sens qu’au plus un sommet d’interaction d’ordre n relie n sites donnés. Le développement obtenu est analogue aux’ développements de basse densité dans la théorie des gaz imparfaits. Reprenons de nouveau l’exemple du modèle d’Ising, en présence d’une source extérieure constante positive h. Ce champ est destiné à lever la dégénérescence entre les deux états fondamentaux C T ~ = +1 et ui = -1 d’une +O qu’après la liquantité 2Nh. On ne prendra la limite de champ nul h mite thermodynamique N -+ CO. Seuls les états différant de l’état fondamental ai = +1 par un nombre fini de spins retournés contribueront. Pour un réseau de N sites ayant chacun q voisins, l’action s’écrit --f
26
METHODES DIAGRAMMATIQUES
VII.2.3
Le premier terme de cette expression fournit la contribution de l’état fondamental exp 3PqN. Le second terme indique que la contribution de chaque spin retourné est un facteur exp(-2pq). Le dernier terme attribue aux lignes du diagramme la quantitii (exp4p - 1 ) représentant l’effet des interactions. Les premiers diagrammes sont indiqués sur la figure 9. Prenons de nouveau comme exemple le réseau hypercubique à d dimensions, avec q = 2d. Les nombres de c:onfigurations des diagrammes sont respectivement N , a N ( N - l ) , N d , B N ( N - l ) ( N - 2 ) , N d ( N - 2 ) , Nd(2d-1) et O . En conséquence,
a
a
a
I
a a .
* i i A
c.
Figure 9 : Premiers termes du développement de basse température du modèle d’king. La variable du développement est ici exp(-4@). Remarquons que la première partie du terme d’interaction, exp(lp), tend à diminuer l’ordre du dévelop pement; il va ainsi compenser exactement la contribution des sites situés à l’intérieur d’un amas ‘de spins retournés qui interagissent avec leurs q voisins. Seuls resteront donc les termes d’interface. Comme la surface d’un amas croît avec le nombre de spins qui le composent, on est assuré de pouvoir réordonner la série en puissances croissantes de exp(-4p) de telle f q o n que seul un nombre fini de diagrammes contribue à un ordre donné. Une exception se produit pour d = 1; quelle que soit la longueur d’une séquence de spins retournés, celle-ci fournira un terme exp(-8p). On a ici le reflet de la dimension critique inférieure dc = 1du modèle d’king, phénomène déjà discuté au chapitre I (volume 1). La phase de basse 1,empérature disparaît et le développement à partir d’une phase ordonnée perd son sens. Le développement de basse température met en évidence la compétition entre termes énergétiques et entropiques. Celle-ci est à l’origine de l’analyse de Peierls (1936) qui conduit à la preuve de l’existence de phases ordonnées it basse température en dimension égale ou supérieure à deux. L’argument de Peierls a inspiré de nombreuses généralisations. I1 faut aussi remarquer que les propriétés de positivité observées dans le développement à haute température de la fonction de partition ne sont plus valables. Une conséquence est que l’analyse de ces séries révèle fréquemment la présence de singularités complexes, qui en limite parfois l’utilité.
VII.2.3
METHODES DIAGRAMMATIQUES
27
Les développements de basse température nécessitent la connaissance de l’état fondamental qui minimise l’énergie. En l’absence d’un champ extérieur, celui-ci n’est généralement pas unique. Dans le cas des modèles de spins ferromagnétiques, un champ extérieur infinitésimal suffit à lever complètement la dégénérescence dans la limite thermodynamique. A faible température et champ nul, les états intermédiaires nécessaires pour passer d’un état fondamental à un autre ont une énergie infinie à la limite thermodynamique; ces états sont totalement séparés, et il ne faut donc n’en considérer qu’un seul, décrivant une phase pure. Dans d’autres cas, la situation peut être plus complexe. Ainsi, dans un modèle d’king antiferromagnétique, deux spins voisins tendent à prendre des valeurs opposées à basse température. Cette contrainte ne peut être satisfaite pour tous les liens sur certains réseaux; sur un réseau triangulaire par exemple, elle est nécessairement violée pour un lien au moins sur chaque triangle élémentaire. Cela entraîne une dégénérescence importante de l’état fondamental, suivant la répartition de ces liens, dits frustrés. Par la suite, il faut tenir compte du fait qu’un état donné peut être considéré comme une excitation de plusieurs états fondamentaux et donc être représenté par plusieurs diagrammes relatifs à des “vides” différents, qui communiquent ainsi entre eux. (i) Etudier la dégénérescence du modèle d’Ising antiferromagnétique sur un réseau triangulaire en utilisant les expressions du chapitre II. jauge
(ii) Déterminer le développement de basse température du modèle de 2 2 sur réseau, dont l’action est
P
Les champs uij prennent les valeurs f l . L’état fondamental est celui où chaque terme de plaquette vaut + l . Cette contrainte se résout en exprimant que le champ sur chaque lien est donné par un terme de jauge pure
aij
= sjsj
(Si
= *l)
pour des valeurs arbitraires des variables si aux différents sites du réseau. L’état fondamental est donc dégénéré autant de fois qu’il y a de configurations des { s i } , soit 2 N . Relativement à une configuration de pure jauge, les diagrammes de basse température sont formés de liens tels que ajj = -sisj. Cependant, le changement d’état fondamental par renversement d’un si revient à changer le signe des variables O sur tous les liens issus d’un site donné i. On est donc amené à considérer comme équivalents deux diagrammes qui ne d i a r e n t que par l’effet d’une transformation de jauge sur tous les liens issus d’un ensemble de sites (figure 10).
(73b)
28
METHODES DIAGRAMMATIQUES
VII.2.4
Figure 10 : Diagrammes de basse température équivalents pour une théorie de jauge sur rtiseau.
2.4 Développement de basse température
-
cas continu
La méthode exposcie au paragraphe précédent nécessite quelques am& nagements pour être appliquée au cas continu. En effet, les excitations ne sont plus locales, mais deviennent collectives (ondes de spin). La formule (67) est une intégrale, et doit être évaluée par la méthode du col et ses corrections perturbatives (éventuellement renormalisées). Cette technique a été utilisée maintes fois dans cet ouvrage, et nous n'allons qu'en rappeler brièvement le principe. Le (développement se fait autour d'un état fondamental { cpp}, satisfaisant à l'équation du col
L'action est développé'e au voisinage de cet état maximisant l'action en isolant une partie quadratique définie négative
La fonction de partition s'écrit alors
Le développement diagrammatique est obtenu en développant l'opérateur exp V({6/6ji}) en série. Chaque monôme de V est associé graphiquement à un vertex. A source j nulle, l'effet des dérivations est de joindre, de toutes
VII.2.4
METHODES DIAGRAMMATIQUES
29
les manières possibles, ces vertex par des lignes auxquelles on attache un propagateur (A-l)ij (théorème de Wick). A la différence du cas discret, on obtient ainsi un développement en puissances de /3-’ au lieu de exp(-P). En effet, A-l est proportionnel à 0-l’ et, bien que V contienne aussi un facteur p, le nombre de propagateurs l’emporte sur le nombre d’interactions, suivant le comptage standard du nombre de boucles. Le facteur B-’ joue ici le rôle de la constante h. Remarquons que la configuration stationnaire cpo est indépendante de p. Lorsqu’on cherche à expliciter ces séries, le problème le plus sérieux est l’existence de modes nuls, vecteurs propres de A pour la valeur propre O, et en particulier ceux qui proviennent du théorème de Goldstone. L’opérateur A est alors seulement semi-défini et ne peut plus être directement inversé. I1 est nécessaire d’isoler ces degrés de liberté et de les traiter par intégration directe et non par la méthode du col, inadéquate. Un exemple d’un tel traitement est donné au chapitre VI paragraphe 2.4 (volume 1) pour le calcul des corrections au champ moyen des systèmes de jauge continus. Une méthode générale consiste à introduire un terme brisant la symétrie, dont on prend ensuite la moyenne. Pour cela, introduisons une fonction non invariante f(cp) brisant la symétrie. Dénotons par gcp la transformée de’ la configuration ‘p par l’action du groupe G, et supposons que l’équation f(gcp) = c ait une solution unique g E G. I1 se pourrait qu’il n’existe aucune fonction possédant cette propriété globale ; cette difficulté est généralement esquivée en demandant que la propriété précédente ne soit valable qu’au voisinage de l’identité. Pour un groupe d’invariance global, il suffit en fait que f(gcp) = c ne détermine g qu’à une transformation du petit groupe Go de cpo près (ce sous-groupe de G laisse cpo invariant et en conséquence tous les termes de l’action développée au voisinage de cp”). Cette restriction n’apporte que des complications inessentielles dans la suite, et nous laissons le lecteur modifier les formules pour en tenir compte. Ecrivons
avec
En principe, le jacobien devrait être écrit ldet M(cp)l, mais la valeur a b s e lue peut être omise, car le déterminant ne s’annule pas compte tenu de nos hypothèses. Introduisons l’identité (77) dans l’intégrale fonctionnelle définissant 2 et utilisons l’invariance de l’action de la mesure et du jacobien. On obtient
s,
2=
s
es(9)S(f(cp)- c)detM(cp)dcpdg
30
METHODES DIAGRAMMATIQUES
VII.2.4
On peut maintenant intégrer sur g. De plus, puisque le résultat est indépendant de c , on peut aussi intégrer sur c avec un poids arbitraire normalisé expF(c) (par exemple proportionnel à exp - c 2 ) . D’où l’expression
2=
J
exp [S(cp)
+ F(f(cp))+ TrlnM(cp)] dcp
(79b)
Sous cette forme symbolique, l’invariance est apparemment brisée par la présence du terme F(f(cp))et la méthode du col s’applique sans difficulté. Le terme detM(cp), non local, peut être remplacé par une intégrale grassmannienne équivalente en introduisant des champs auxiliaires $,$I (fantômes de Faddeev-Popov)
Une illustration typique est fournie par le modèle u non linéaire (modèle O ( n ) )à deux dimensions (qui est la dimension critique inférieure) dans la phase de basse température. Ce système à symétrie globale a un comportement similaire à celui des champs de jauge en dimension quatre, et est également asymptotiqueinent libre. Comme il est beaucoup plus simple que son homologue, il a été étudié en détail en vue d’extraire des renseignements sur la génération dynamique de masse par une utilisation habile de calculs perturbatifs. De plus, des conjectures intéressantes ont été faites concernant une expression exacte de la matrice de diffusion (Zamolodchikov). Le lecteur trouvera dans la littérature un traitement détaillé du modèle u et de ses diverses généralisations à une variété homogène arbitraire (plutôt que la sphère). Ces généralisations ont éi,é en particulier très utiles dans l’application de la méthode des répliques aux systèmes désordonnés bidimensionnels (chapitre X) ou en théorie des cordes. (i) Partant d’un modèle originellement invariant par G, étudier la symétrie résiduelle sous la forme (79c). (ii) Pour le mocèle vectoriel bidimensionnel, dont l’action s’écrit
montrer que la renormalisation de la constante de couplage est donnée à l’ordre le plus bas par les expressions n-2
1 =-1 g2
p - ga aP
go”
+
2aIn pa +. . .
=-
e
g
3
+ . ..
4a
où p fixe l’échelle de normalisation et où a est l’inverse du facteur de coupure ultraviolet. Ces formules expriment la propriété de liberté asymptotique ultraviolette, montrant que, lorsque l’échelle de masse p augmente indéfiniment, le
VII.2.4
METHODES DIAGRAMMATIQUES
31
couplage renormalisé g s’approche de O lorsque n > 2. Le facteur ( n - 2) est en conformité avec le fait que cette propriété n’est valable que pour n > 2, le cas limite étant le modèle X Y pour lequel n = 2. Un prolongement analytique pour n inférieur à 2 inverserait les conclusions.
2.5 Développement en champ fort L’introduction d’un champ extérieur dans les développements décrits précédemment ne modifie pas de façon importante la dérivation des séries de basse température. I1 supprime néanmoins le problème des extrema dé&. nérés. Pour le modèle d’Ising, par exemple, la contribution diagrammatique du vertex devient
z = exp(-2H - 2Pq) où H est le champ extérieur, alors que celle du lien reste
u = exp(4P) - 1
(83)
Le développement apparaît naturellement comme polynômial dans les variables u et z , et le problème rencontré au paragraphe 2.3 consistait à le réordonner dans la variable de basse température (1 u)-’.Si on cherche, au contraire, un développement valable autour du champ extérieur H infini, ce réarrangement devient inutile, la variable appropriée étant z , qui compte le nombre k de sommets du diagramme. Le nombre de liens, à k fixé, étant borné (par i k ( k - 1) en dimension infinie, par iqlc à nombre de voisins q fixé sur le réseau), chaque coefficient de ce développement est un polynôme en u de degré correspondant. Ainsi, pour le modèle d’king, la formule (72) se récrit
+
1 -In 2 = H + Pd+ z N
+ z2(du- i)+ z3[d(2d- l) u 2- 2du+ f]+ O(z4) (84)
par lecture directe des graphes de la figure 9. L’utilisation de ces développements a été illustrée au chapitre III (volume 1) lors de l’étude de la singularité de Lee et Yang.
2.6 Champs fermioniques L’extension des règles diagrammatiques aux intégrales grassmanniennes ne pose aucun problème sérieux, si l’on tient compte soigneusement des propriétés d’antisymétrie (chapitre II, volume 1). Donnons un exemple élémentaire en démontrant par la méthode perturbative un résultat familier concernant les intégrales gaussiennes. Soit une intégrale sur des variables anticommutantes { q i , q i } , en présence de sources {vi,vi}, elles-mêmes anticommutantes
32
M ETHODES DIAGRAMMATIQUES
VII.2.6
=det(m - A)expfj(m - A)-’q
(85) Dans le développement qui va suivre, le terme de masse joue un rôle essentiel et est incorporé à la mesure d’intégration. La seconde exponentielle de l’intégrand est développée en série et interprétée diagrammatiquement. Chaque terme comportant un facteur ’A : est représenté par une ligne orientée allant du site i au site j. Lors de l’intégration sur les variables grassmanniennes qz et ijf , les seuls termes donnant une contribution non nulle sont 1 et gq:. En conséquence, les diagrammes à retenir sont formés de boucles fermionique:; orientées fermées et d’arcs orientés ouverts partant d’une “source’’ f j et se terminant sur un “puits” q . Une boucle ( i l i z . . . inil) fournit une contribution - Tr (A,,,, . . . A,,,,,) /nmn. La trace porte sur les indices (a@ des niatrices AG’. Le signe moins pour chaque boucle fermionique provient de l’anticommutation nécessaire pour ramener l’ordre de tous les champs grassmanniens sur lesquels on intègre dans le sens standard q, ij. Enfin le facteur i / n résulte d’une compensation incomplète des facteurs de symétrie. En principe, nous devons aussi omettre les diagrammes où deux lignes passent en un même site i avec le même indice a. Cette règle d’exclusion peut cependant être tout simplement ignorée. En effet, nous avons vu que la méthode des cumulants permet de s’affranchir de ce type de contrainte. Or, du fait de l’identitib expmijq = 1
+ mqq
valable dans les algèbres de Grassmann, les règles diagrammatiques pour les cumulants coïncident avec les règles initiales. Vérifier qu’effectivement la somme des contributions relatives à l’ensemble des diagrammes où plusieurs lignes passent en un point z (avec le même indice interne a ) s’annule.
Une autre conséqcence de la trivialité de la transformation en cumulants est l’exponentiat.(on immédiate du développement diagrammatique. En l’absence de sources, l n 2 est la somme des contributions de tous les diagrammes comportant une seule boucle. Quant au seul terme connexe comportant des sources, proportionnel à fj,qJ, il est donné par la somme des contributions des diagrammes formés d’un arc simple (ij). On a ainsi reconstruit de façon perturbative le développement en A / m de
VII.2.6
METHODES DIAGRAMMATIQUES
lnZ(q,q)=Trln
33
(86)
D’autres exemples seront présentés au chapitre X. Notons ici que le modèle d’Ising tridimensionnel admet une présentation grassmannienne non triviale comportant des termes d’interaction quartiques et conduisant à des règles diagrammatiques complexes, en relation avec les surfaces fermioniques.
3. Enumération de graphes 3.1 Nombres de configurations Nous avons déjà remarqué que la notion de graphe libre permettait de séparer l’influence du réseau utilisé sous forme d’un nombre de configurations du diagramme n ( G ) . Ce nombre dépend de la taille N du réseau considéré. Dans le cas d’un réseau fini avec conditions périodiques, il est clair qu’un diagramme connexe aura un nombre de configurations proportionnel à N , en raison de la symétrie de translation. Ceci est valable au moins pour N suffisamment grand afin d’éviter des configurations spéciales où la périodicité est mise à profit pour refermer une boucle. Bien que nous ne considérons pas ces termes par la suite, leur étude est légitime et peut révéler des effets de taille finie intéressants. Généralement, n ( G ) sera un polynôme dont le degré en N est le nombre de parties connexes du graphe. La partie linéaire en N , f i ( G ) ,est particulièrement importante, car c’est la seule qui subsiste lors du calcul de In 2, quantité extensive proportionnelle à N.
Pour évaluer ces nombres de configurations, nous nous restreindrons aux graphes simples, puisque la multiplicité d’un lien n’affecte pas le nombre de configurations. Le calcul peut être ensuite réduit à l’évaluation de certains diagrammes multiplement connexes par l’utilisation du théorème suivant. Considérons l’ensemble des graphes G I ü G2 = { G } pouvant être obtenus à partir de deux graphes G1 et G2 donnés par la mise en commun de certains de leurs éléments. Si on désigne par Ic(G;Gl,Ga) le nombre de façons différentes dont G peut être scindé en G1 et G2, on a alors la formule
Nous appliquerons cette formule à divers cas. [a) Réduction aux diagrammes connexes Si GI et Ga sont des graphes libres ayant respectivement cl et c2 parties connexes, G aura au plus c1 c2 parties connexes, et un seul des graphes G1 ü G2 aura exactement c1 + c2 parties connexes (celui ne mettant en
+
34
METHODES DIAGRAMMATIQUES
VII.3.1
commun aucun des é!éinents de G I et G2). De la sorte, on peut relier le nombre de configurations d’un graphe à ceux de graphes ayant moins de parties connexes. Ainsi, avec deux graphes triangulaires, la relation
n ( A ) 2= 2 n ( A A ) + 2 n ( M ) + 2 n ( @ ) + n ( A )
(88)
permet de ramener le calcul de n ( A A ) aux nombres de configurations de graphes connexes. Des formules similaires peuvent être utilisées pour les théories de jauge, où les graphes ont la topologie de surfaces. Par exemple, pour deux cubes,
(b) Réduction aux diagrammes multiplement connexes La même méthode peut être employée pour deux graphes G I et G 2 ayant une racine commune i. Dans les graphes intervenant au membre de droite de (87),un seul aura un point d’articulation i. Ainsi, n(AiI2= 2n(
)
+ 2n(@) +.(Ai)
(90)
2
Par ailleurs, lorsque l’on somme le nombre de configurations d’un graphe avec racine i , sur la position de cette racine, on obtient N p fois le nombre de configurations du graphe libre correspondant, où p est le nombre de points équivalents au vertex choisi pour racine par automorphisme du graphe libre. La formule (90) de notre exemple devient alors
[3Nn(A)]’= 2Nn(
w)+ 4Nn( 6 ) )+ 3 N n ( A )
(91)
(c) Réduction le long d’un lien On peut encore considérer le cas où GI et G2 ont une ligne commune i j , ce qui permet de réduire les graphes pouvant être séparés en deux par coupure le long d’une ligne. Ainsi, 1
4 A 3 ) 2
=2 4
6) + n(&)
(92)
3
Compte tenu du fait qt.’un réseau de nombre coordination g possède $Ng liens, on en déduit
[3Nqn(A)12 = 2Nqn( 6 ) )
+ 3Nqn(A)
(93)
Après ces réductions, les diagrammes qui subsistent sont beaucoup moins nombreux, mais leur nombre de configurations ne peut plus être obtenu à l’aide de méthodes générales simples et doit être examiné cas par cas. La table I compte les anneaux fermés, la table II présente quelques
VII.3.1
35
METHODES DIAGRAMMATIQUES
diagrammes irréductibles plus complexes pour un certain nombre de réseaux classiques (triangulaire et carré à deux dimensions, cubique, cubique centré et à faces centrées en dimension trois). Finalement, la table III montre les diagrammes intervenant en théorie de jauge sur un réseau hypercubique à d dimensions. -
- triangulaire 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 20 22 24 26 -
2 3 6 15 42 123 380 1212 3966 13265 45144 155955 545690 1930635 6897210 24852576
carré
C.C.
cubiaue
c.f.c.
1
3
12
2
22
148
7
207
2736
28
2412
61896
124
31754
1579324
588
452640
43702920
8 33 168 970 6168 42069 301376 2241420 17173224 134806948 1079802216 8798329080
... 2938
6840774 1282524918
...
15268 108088232 ... 81826 1768560270 ... 449572 2521270 14385376 -
Table I :Nombre réduit de configurations n(G) pour des graphes en boucles sur les réseaux triangulaire, carré, cubique, cubique centré (c.c.) et cubique à faces centrées (c.f.c.).
3.2 Graphes multiplement connexes La méthode que nous avons utilisée jusqu’ici se révèle assez rapidement complexe de par le nombre de termes qu’elle met en jeu. I1 est en particulier nécessaire de calculer tous les graphes, qu’ils soient multiplement connexes ou non. I1 est bien sûr aussi possible de faire appel aux méthodes générales de cumulants et transformées de Legendre, mais on perd alors le bénéfice de la simplicité des diagrammes. Une troisième méthode, applicable modèle par modèle et réseau par réseau, permet d’exprimer directement les résultats en n’utilisant que les graphes multiplement connexes et simples. Le point de départ est le théorème suivant. Si A ( G ) et B ( G ) sont deux ensembles de poids satisfaisant à la relation
36
VII.3.2
ME:THODES DIAGRAMMATIQUES
-
oli+ 7 Diagramme
triangulaire
carré
cubique
C.C. c.f.c. 12
I- I B I - l- l 41- 1 - 1 @ I 6 I - 124 Q I 3 I - / @ I - 1-1 @ I - 1-1 D I - 1 - 1 8 1 1 1 A l -
-
2 l1 II 1
600
-
-
48 480
3888
-
3132
-
24
3
192
I
-
-
20
436 -
Table II : Nombre réduit de configurations n(G) pour les premiers graphes irréductibles.
A(G) =
B(g)
(94)
SCG
et tels que, si G peut être décomposé en deux parties GI et Gz disjointes pour lesquelles
VII.3.2
37
METHODES DIAGRAMMATIQUES
6.1
$d(d - l) ( d - 2)
10.1
i d ( d - l) ( d - 2)(2d - 5)
11.1
Sd(d - l) ( d - 2)(2d - 5)
12.1
- I1d2 ( d - l) ( d - 2)(12d - 29)
12.2
$d(d - l ) ( d - 2)(d - 3)
12.3
$d(d - l) ( d - 2)(d - 3)
14.1
Sd(d - l) ( d - 2)(2d - 5)2
14.2
2d(d - l ) ( d - 2)(4d2 - 22d
14.3
d(d - l )( d - 2)(d - 3)
14.4
4d(d - l ) ( d - 2 ) ( d - 3)
15.1
$d(d - l ) ( d - 2)(d - 3)(2d - 5)
15.2
+d(d - l ) ( d - 2)(d - 3)
15.3
$d(d - l)(d - 2)(d - 3)
15.4
d(d - l)(d - 2)(2d - 5)2
+ 31)
Table III : Les premiers graphes relatifs au développement de couplage fort des théories de jauge jusqu’à l’ordre 16.
38
VII.3.2
MIETHODES DIAGRAMMATIQUES
15.5
4d(d - l)(d - 2)(4d2 - 22d + 51)
16.1
$d(d - l) ( d - 2)(4d2 - 24d
16.2
i d ( d - l)(d - 2)(d - 3)
16.3
8d(d - l ) ( d - 2)(d - 3)2
16.4
16d(d - l)(d - 2)(d - 3)2
16.5
16d(d - l) ( d - 2)(d - 3)’
16.6
i d ( d - l ) ( d - 2)(d - 3)(2d - 5)
16.7
-d(d - l ) ( d - 2)(22d2 - 113d
16.8
2d(d - l ) ( d - 2)(d - 3)
16.9
+d(d - l)(d - 2)(2d - 5)2
16.10
2d(d - l ) ( d - 2)(4d2 - 22d + 31)
16.11
4d(d - l ) ( d - 2)(d - 3)
+ 37)
+ 147)
Table III (suite) La démonstration de ce théorème s’appuie sur l’inversion de la formule (94)’ qui s’écrit
(- i)”‘G’B(G) =
(-i)p(g’A(~) SCG
(96)
VII.3.2
METHODES DIAGRAMMATIQUES
39
et se démontre par récurrence sur le nombre p(G) de liens de G. La formule (96) se prouve en appliquant la formule (94), puis les formules (96) à tout graphe g strictement inclus dans G (d’après l’hypothèse de récur( - l ) P ( g ‘ ) . L’appariement des rence). Le coefficient de B ( g ) est alors graphes g’ et g” qui ne different que par un lien arbitraire fixé n’appartenant pas à g, montre que la paire correspondante ne contribue pas à ce coefficient. Seul reste non apparié le graphe g’ formé de G auquel on a ôté le lien choisi; on arrive ainsi à (96).
xG,g,,g
Les graphes g contribuant à (96) se divisent en trois catégories: g C G I , g C G2 et g = g1 ii 92 avec g1 G G I , g 2 C G2 tous deux non vides. Le théorème peut alors se démontrer sans difficulté. Appliquons maintenant ce résultat à une théorie dont le réseau est limité aux liens et sites d’un graphe donné. Choisissons A ( G ) = lnZ(G). I1 est clair que les hypothèses du théorème sont vérifiées lorsque G n’est pas connexe. On en déduit donc, pour le réseau complet ln2=
c
(97)
g connexe
où les poids B peuvent être calculés directement par la formule (94). Aux ordres les plus bas, jusqu’à trois liens, on a
Cette procédure se prête bien à une automatisation. Le lecteur prendra garde au fait que la formule d’inversion (96), valable pour les graphes étiquetés, ne l’est plus pour des graphes libres. Dans un deuxième temps, on applique ce même théorème aux graphes articulés, pour lesquels la relation (95) reste valable.
4. Résultats et analyse
4.1 Techniques d’analyse des séries Les méthodes que nous avons décrites fournissent des séries qui seront tronquées à un certain ordre n dans un calcul explicite
40
METHODES DIAGRAMMATIQUES
VII.4.1
On se trouve alors confronté à deux types de questions. (1) Trouver les singularités zi de la fonction f et étudier le comportement de f dans leur voisinage. En particulier, on aimerait savoir s’il est’ vraisemblable ou non de supposer que ce comportement est de la forme
et, dans ce cas, détermmer l’exposant critique yi et, si possible, l’amplitude Ai. (2) Extrapoler la fonction en dehors de son cercle de convergence. Par exemple, on peut voulciir estimer sa limite f ( z = KI). Bien entendu, ces problèmes ne peuvent être résolus stricto sensu, et toutes les méthodes vont supposer une information supplémentaire : singularité des coefficients fk propriété d’analyticité, comportement connu dans une région, etc, que l’on cherchera à exploiter en choisissant alors la méthode la plus appropriée. Cette information fait malheureusement souvent défaut, et on en est alors réduit à procéder aveuglément, en essayant différentes techniques et en comparant leurs résultats. Nous ne donnerons ici qu’un aperçu rapide de ces méthodes, amplement décrites dans des ouvrages spécialisés. I1 faut noter que l’on a acquis des connaissances précieuses sur le comportement aux grands ordres des séries perturbatives en théorie continue des champs. L’origine en est un travail de Bender et Wu sur l’oscillateur anharmonique généralisé par Lipatov aux théories des champs simples. Ceci constitue un outil important pour l’analyse de ces séries. Dans le cas des modèles sur réseau, rien d’aussi s,jstématique n’a été fait, bien qu’il existe des résultats isolés qui reflètent en particuler la nature du réseau.
La méthode la plu:; directe est celle des quotients. Si fk est réel, et si la singularité ZO la plus proche est unique, isolée et “algébrique” (c’est-à-dire de la forme (loo)), le rapport de deux coefficients successifs se comporte comme -fk
= zo [ 1 + l + Y +O(&] 1
f k+l L’étude de la limite de cette suite et de la façon dont elle s’en approche va donc fournir à la fois ;:O et y. L’utilisation d’accélérateurs de convergence comme les tables de Neville est très pratique dans cette étude.
VII.4.1
41
METHODES DIAGRAMMATIQUES
Les tables de Neville résultent d’une disposition commode des formules d’itération d’ilitken. Si l’on désigne par f (z 1x0,.. . ,x k ) l’unique polynôme en z de degré k coïncidant avec f(x) aux points 20,.. . ,X k , les formules
permettent une construction récurrente de formules d’interpolation à 2, 3, ... points. Si on applique cette mét,hode à une suite { u n } et si la forme asymptotique de celle-ci est polynômiale dans la variable l / n , on est conduit à considérer les suites successives u n ) =(n
+ i)u,+i
- nun = iimun
u ~ 2 ) = + { ( n + 2 ) -nui’) u~~, un)
=$ { ( n+ 3)u?i1
1
+O
=iimu,+0(7)
- n u n ) } = iimun + O
1
1 (n.)
... Dans la pratique, on observe tout d’abord une amélioration de la convergence, puis une détérioration due à des instabilités (le terme correctif, d’ordre croissant en l / n , voit son coefficient grandir).
Les problèmes apparaissent lorsque le nombre de termes disponibles n’est pas suffisant pour que la singularité impose le comportement présupposé de la forme (100). Cette méthode est également limitée à une singularité réelle, et ne peut en traiter qu’une seule à la fois. Les approximants de Padé fournissent un moyen puissant d’analyse simultanée de plusieurs singularités, avec de grands domaines de convergence. L’idée est d’approximer une fonction analytique par une suite de fractions rationnelles. Plus précisément, l’approximant de Padé [ L / M ]( 2 ) PL(z)/QM ( z ) est l’unique fraction rationnelle dont le développement de Taylor coïncide avec les termes connus de la série jusqu’à l’ordre L M inclus
+
f ( z ) - ~ ‘ L ( ~ ) / Q M ( z=) O(2L+M+1 )
(104).
+ +
+
L’équation (104) donne ( L + M + 1) relations pour ( L 1) ( M 1) - 1 inconnues. Les approximants de Padé ont des domaines de convergence plus importants que les séries de Taylor. Ils reconstruisent parfaitement les pôles par construction même, et sont donc particulièrement adaptés à l’étude des fonctions méromorphes. On observe expérimentalement qu’ils peuvent simuler des points de branchement par accumulation successive de pôles et de zéros le long d’une coupure. En cela, ils répondent au désir d’extrapoler les séries en dehors de leur cercle de convergence. Leur
42
METHODES DIAGRAMMATIQUES
VII.4.1
convergence prend cependant parfois une allure erratique. On observe aussi sur certains approximants l’apparition de singularités supplémentaires sans rapport avec celles de la fonction que l’on examine. La singularité algébrique (100) n’a pas la forme la plus adaptée à ces approximants. Cependant, s’il n’y a pas de singularité sous-dominante au même point, c’est-à-dire si ( z - zo)-’f(z) est régulière en zo, la dérivée logarithmique 1 (if y partie régulière f ciz z - zo
+
a un pôle isolé et c’est; donc à elle que l’on doit appliquer la méthode. Dans les problèmes rencontrés en pratique, on peut voir des singularités non factorisables ( A ( z ) ( z- z o ) Y B ( z ) ) ,ou la confluence de deux singularités ( A ( z- z0)Y B ( z - z0)D . .), etc. La méthode devient alors moins précise. En général, la détermination de la position zo est relativement correcte, alors que l’exposant critique y est plus instable. Les approximants intégraux sont une généralisation des précédents. Ils sont la solution d’une équation différentielle d’un type bien choisi, à coefficients polynômiaux déterminés de telle façon que f( z ) soit également solution (à l’ordre connu). Par exemple, l’équation linéaire du premier ordre
+
+.
+
fournit à la fois les approximants de Padé classiques en imposant Q k O ( k E -1)’ et les apprmimants de la dérivée logarithmique en choisissant RL E O. Ces approximants sont singuliers aux zéros de Q et se comportent selon
A ( z - ZO)’
+B
Ils sont ainsi mieux adaptés à l’étude de certains comportements sousdominants au voisinage des singularités et conduisent alors à de meilleurs déterminations des exposants critiques. Mais on est souvent noyé sous le nombre d’approximants possibles; l’écart entre les différentes déterminations est parfois important et il est alors difficile de choisir entre elles. Nous noterons finalement qui: ces approximants intégraux se généralisent au cas de fonctions à plusieurs, variables et permettent ainsi d’aborder l’étude des points tri-critiques. La connaissance de certaines propriétés d’analyticité de la fonction permet de combiner au mieux les transformations de variable et les méthodes décrites plus haut. NOUSen donnerons un seul exemple. Supposons que la fonction possède des singularités confluentes en un point z, connu, soit
VII.4.1
METHODES DIAGRAMMATIQUES
f ( z ) admet alors une représentation intégrale de forme
et sa transformée
est une fonction méromorphe. Les coefficients du développement de Taylor de g ( t ) sont aisément déduits de ceux de f(z). Les approximants de Padé, mal adaptés aux singularités confluentes de f(z), le sont en revanche parfaitement pour analyser la structure méromorphe de g ( t ) . C’est la méthode dite de Padé-Mellin. En conclusion, l’extraction d’exposants critiques et d’amplitudes à partir des séries perturbatives est un art. Mis à part quelques cas simples, elle requiert une expertise importante.
4.2 Un exemple Nous ne pouvons énumérer ici toutes les séries connues pour les modèles les plus simples. Le chapitre VI (volume 1) donne quelques exemples concernant les champs de jauge. Nous nous limiterons à citer quelques résultats relatifs au modèle d’king sur un réseau cubique centré, système pour lequel les séries disponibles sont particulièrement longues. D’autres séries figurent’ dans les références données en fin de chapitre. Utilisant la variable t G tanh p, l’énergie libre à haute température est donnée par le développement 1
- In 2
N
+ 12t4 + 14%‘ + 2496t’ + 52168t1’+ + 1242078t12+ 32262852t14 + 892367762tl‘ + 0(t1’)
= In 2 - 4 in( 1+ t )
(109) Cette série permet d’obtenir l’énergie interne et la chaleur spécifique par dérivations successives, et on peut déterminer ainsi l’exposant critique (Y. La fonction de corrélation ( C J O C T ~ ) dépend d’une variable supplémentaire x; les diagrammes de haute température correspondants ont des sommets impairs en O et x. On est principalement intéressé par les propriétés à grande distance de cette fonction. I1 revient au même d’étudier sa transformée de Fourier
44
METHODES DIAGRAMMATIQUES
VII.4.2
X(k) = z e i k . x (ooox)= x - -k P2 2 +O(k4) 2d pour de petites impulsions k. Ici x est la susceptibilité magnétique statique. L'anisotropie du réseau ne se manifeste qu'à partir des termes d'ordre 4 en k. Si on ne désire pas étudier ces phénomènes d'anisotropie, on peut se restreindre à l'étude des. moments sphériques
toujours convergents à haute température (car la fonction de corrélation décroît exponentiellement). En particulier, = 1+po diverge à la température critique avec un exposant y. De même, = 2dx/p2 est une longueur de corrélation effective, dont on attend une divergence qui fournit l'exposant u. Pour le réseau cubique centré étudié, on dispose des séries suivantes
x
x =1+
+ 56t2 + 392t3 + 2648t4 + 17864t' + 118760t6 -k 789032t7 + 5201048t' t-34268104t' + 224679864tl' + 1472595144tll + 9619740648t12+ 62823141192t13+ 409297617672t14 + 2665987056:200t15+ 17333875251192t16+ 112680746646856t17 + 731466943653464t" + 4747546469665832t" + 3077910Afi7!i700312t20+ 199518218638233896t21+ O(t22)
8t
(112) et
,UZ
=8t
+ 128t2 + 1416t3 + 13568t4 + 119240t' + 992768t6 + 7948840t7 + 61865216t' + 470875848t' + 3521954816t" + 25965652936tl' + 189180221184t'2 + 1364489291848t13 + 9757802417152t14+ 69262083278152tl' + 488463065172736t16 + 3425131086090312t17+ 23896020585393152t1' + 1659582390(35454632t1'+ 1147904794262960384t2' + 7910579661767454248t21+ O(t22)
(113) La positivité des coefficients entiers de ces deux séries nous assure que la singularité la plus proche est réelle et positive. Illustrons les techniques d'analyse des séries sur le cas de la susceptibilité. Deux difficultés se présentent immédiatement. La première est une symétrie du modèle. Le réseau choisi se scinde en effet en deux sous-réseaux cubiques simples décalés, et l'interaction n'agit qu'entre spins de sous-réseaux
VII.4.2
METHODES DIAGRAMMATIQUES
45
différents; l’opération consistant à changer l’orientation de tous les spins d’un sous-réseau ainsi que le signe de la température est donc une symétrie. Nous observerons donc une singularité antiferromagnétique à -t, dont il faut tenir compte. En conséquence, on peut subdiviser la susceptibilité en parties paire et impaire, suivant que la paire de spins considérée est ou non sur le même sous-réseau. La partie impaire est reliée à la partie paire par l’adjonction d’une contribution spatiale d’une maille de réseau, ce qui revient approximativement à la multiplier par l’énergie interne, avec un exposant (Y - 1. On s’attend donc à ce que le coefficient xn de la série (112) se comporte suivant
xn N An7-ltLn[i + B(-i)nna-7+1 1 On est ainsi amené à considérer la quantité
et l’exposant critique y apparaît alors comme la limite de la suite
La seconde difficulté est l’existence d’une singularité confluente prédite par le groupe de renormalisation. La correction à la formule (114) est de la forme (1 cn-*l), où A1 = wu. Il n’est donc pas possible d’utiliser de manière efficace les tables de Neville pour améliorer la convergence des suites, et on observe effectivement de fortes instabilités si l’on tente de le faire. Cependant, si l’on connaît t, (dont on a une bonne détermination), on peut utiliser la méthode de Padé-Mellin décrite plus haut. Une autre possibilité est d’employer la valeur approximative A1 = 0.50 pour supprimer cette singularité. Ainsi, Zinn-Justin considère la moyenne jjn = ( ~ ~ + 2 y ,+- ~ yn-2)/4, puis la quantité
+
qui remplace l’équation (115) en éliminant totalement la correction due à la première singularité confluente. Toutes ces méthodes ont permis d’extraire de façon cohérente des séries de haute température les résultats suivants
tC1 =6.3543 y =1.239 f 0.0025 u =0.6305 f 0.0015 q =0.035 f 0.003
46
METHODES DIAGRAMMATIQUES
VII.4.2
I1 est à noter que la longueur de corrélation effective calculée à partir de p2 n'est pas la véritable longueur de corrélation qui caractérise la décroissance exponentielle
quantité dont on peut également construire des développements. On se reportera au paragraphe 3.5 du chapitre VI (volume 1) pour une discussion des difficultés que l'on peut rencontrer pour obtenir les séries correspondantes. Les développements de basse température sont un peu plus irréguliers et sont donc moins faciles à exploiter. Pour la fonction de partition, on a l'expression suivante en termes de la variable u = exp( -4P)
In 2 =u4
+ 4u7 - 4 i u 8 + 28u"
- 64u" + 48$u12 + 2 0 4 ~ ' ~7 8 6 d 4 + 1 1 6 4 ~ '+- ~9 2 2 a . 1 -~ ~8~7 6 0 +~ 2~0~0 3 2 ~ ~-' 9164~" - 8 4 2 1 5 $ ~+~2~9 4 6 7 7 8 ~ ~-' 3 7 8 9 9 6 ~ -~5 ~6 9 7 0 4 ~ ~ ~
+ - 694845120~ +~2~1 6 0 7 8 1 0 8 6 ~+~0~( u 2 ' )
- 5 4 0 1 2 8 8 2 ~ ~1~1 2 6 4 0 8 9 6 ~ -~5~1 6 4 4 6 4 ~ ~ ~
(120) La répartition des coefficients positifs et négatifs illustre le commentaire fait plus haut concernant lii, possibilité de singularités complexes. Nous avons utilisé une notation abrégée, écrivant par exemple 4 i au lieu de (4 pour éviter les numérateurs énormes d'une notation fractionnaire.
+ i)
L'aimantation spontanée ((T)n'est pas nulle dans cette région et s'écrit
((T)=1- 2u4 - 16u" + 18u' - 1 6 8 ~ + ~ '384ul1 - 3 1 4 ~ ' ~1 6 3 2 ~ ' ~
+ 6 2 6 4 -~ 9~7~4 4 ~ -' ~1 0 0 1 4 ~ +' ~8 6 9 7 6 2 ~-~205344~" ~ + 8 0 1 7 6 ~ . +~ ' 1 0 0 9 3 3 8 ~-~3~5 7 9 5 6 8 ~ ~+' 4 5 7 5 2 9 6 ~ ~ ~ + 8 3 0 1 0 2 4 ~+~3832961 ~ 3u24 - 7 9 4 2 7 9 6 ~ ~ ~ + 1 1 1 8 1 1 8 ~+~4~3 0 1 6 0 5 2 ~-~133595088;~~' ~ + 0(u2') ( 121) I1 convient d'en tenir compte pour calculer la fonction de corrélation connexe ((To(T~), = ((TOC,) - ( ( T ) ~et, pour accéder ainsi à la susceptibilité à basse température
VII.4.2
METHODES DIAGRAMMATIQUES
47
+ X =u4 + 16u7 - 1 8 ~ '+ 2 5 2 ~ ~- '5 7 6 +~ 5~1 9~ ~ ~+'3 2 6 4 ~ ~ ~ - 1 2 4 6 8 . 1+ ~ ~2~0 5 6 8 ~ +~2 ~6 6 6 2 ~- ~2 ~1 5 5 6 8 ~+~5 ~2 8 5 7 6 ~ ~ '
+
- 164616~~ -' 3014889~~' 1 0 8 9 4 9 2 0 ~-~13796840~" ~
+
- 2990961~'~ 190423962~'~ - 399739840~'~ - 22768752~"
+ 2803402560~'~- 8743064909~'~+ C1(u2') (122) L'analyse des pôles et résidus des approximants de Padé de la dérivée logarithmique de ces développements permet d'estimer les exposants a', ,û et y' au-dessous de la température critique. Ces résultats sont moins précis que les précédents obtenus par les séries de haute température. On constate que l'égalité y = y' semble vérifiée. Les exposants trouvés sont
p =0.312 f0.05 y' =1.25 f 0.05 Enfin, nous terminerons par le développement en champ fort, dans les variables p = exp(-2,ûH) et u = exp(-4,û). Les premiers termes de ce développement sont donnés par
+ (4u7 - 4$us)p' + (28u1' - 64u" + 36+u1')p3+ (1221" + 2O4ul3 - 798u14 + 948u15 - 366iul6)p4 + ( 1 2 ~ +' ~2 1 6 ~ +' ~1 2 6 2 -~ 9072d7 ~ ~ + 17592~~' - 14184~~ +' 4174$u2')p5 + (27u16 + 3 1 2 ~ ' ~ + 2 3 6 8 ~ ~+' 4 3 1 2 ~ ~-' 92992~" + 275021+uz1
In 2 =u4p
+ 2 1 6 0 3 6 ~ '-~ 51444$~'~)p~ + 7 0 4 ~ ~+'4404~'' + 1 7 6 1 6 ~ '-~ 36348~"
- 353640~"
+ (72u"
- 8 3 3 0 6 4 ~ '+ ~ 3795726~'~ -7072736~ +~6798900~'~ ~
+
- 3 3 4 4 7 1 2 ~ ~669438+u2')p7 ~
+ O($)
Notes Les sujets traités dans ce chapitre sont d'une nature plus technique. Plusieurs revues et de nombreuses références figurent dans la série Phase
48
MEïHODES DIAGRAMMATIQUES
VII.Notes
Transitions and Critical Phenomena, vol. 3 intitulé Series Expansions for Lattice Models, C. Domh et M.S. Green eds, Academic Press (1974), et plus récemment, dans les Proceedings of the 1980 Cargèse Summer Institute on Phase Transitions, M. Levy et al. eds, Plenum (1982). La théorie générale des graphes est exposée dans C. Berge, The Theory of Graphs, Methuen (1962). La technique de réduction est discutée par F . Englert, Phys. Rev. 129 567 (1963), qui contient des références à des travaux antérieurs. Les développements en série, et en particulier ceux concernant le modèle d’king, sont présentés dans C. Domb, Adv. Phys. 19,339 (1970) et dans une série de travaux de M.F. Sykes et ses collaborateurs, J. Math. Phys. 6 283 (1965); J. Phys. A 5 624,640,653,661,667 (1972); J. Phys. A6 1517 (1973); J. Math. Phys. 14 1060, 1066, 1071 (1973); J. Phys. A12 L25 (1979). Voir aussi S. McKenzie, J. Phys. A8 L102 (1975) et A12 L185 (1979), ainsi que B.G. Nickel dans les comptes rendus de l’institut d’été de Cargèse mentionné plus haut. Les problèmes relatifs à la fonction de corrélation spin-spin sont examinés par M.E. Fisher et R.J. Burford, Phys. Rev. 156 583 (1967). La théorie des approximants de Padé est développée dans le livre de G.A. Baker, Jr, Essentals of Padé Approsimants, Academic Press (1975). Pour l’analyse des singularités confiuentes par la méthode de Padé-Mellin, voir G.A. Baker et D.L. Hunter, Phys. Rev. B7 3377 (1973). D’autres techniques sont présentées par J. Zinn-Justin, J. Physique 42 783 (1981). Parmi les généralisations à plusieurs variables, voir M.E. Fisher et J.H. Chen dans les comptes rendus de l’institut d’été de Cargèse cité plus haut, et J.H. Chen, M.E. Fisher et B.G. Nickel, Phys. Rev. Lett. 48 630 (1982). Le travail de R. Peierls sur l’existence de phases ordonnées à basse température a été cité au chapitre II (volume 1). Pour la liberté asymptotique du modèle CJ, voir A.M. Polyakov, Phys. Lett. B59, 79 (1975), E. Brézin et J. Zinn-Justin, Phys. Rev. B14, 3110 (1976). Les expressions de la matrice S pour certains modèles bidimensionnels sont dues à A.B. Zamolodchikov et A.B. Zamolodchikov, Nucl. Phys. B133, 525 (1978).
CHAPITRE VI11
SIMULATIONS NUMERIQUES
Les capacités croissantes des ordinateurs ont stimulé des recherches numériques de plus en plus ambitieuses portant sur des systèmes de taille croissante. Ces simulations peuvent être confrontées à des solutions analytiques permettant d’en préciser les limites de validité, ou de servir de guide dans l’exploration de comportements mal ou peu connus. On dispose ainsi d’un moyen d’expérimentation bien contrôlé dont la souplesse se conjugue avec les hypothèses théoriques offrant la possibilité de vérifier ces dernières, de les modifier en fonction des données ou encore de découvrir de nouveaux territoires. Nous allons décrire ici les méthodes générales de mise en oeuvre de simulations de taille (relativement) grande. Divers exemples de résultats ainsi obtenus ont été présentés dans les chapitres précédents de sorte que nous nous limiterons à quelques illustrations supplémentaires portant principalement sur les théories de jauge dont beaucoup de développements reposent en partie sur les indications tirées de telles simulations. Les plus récentes ont même requis la conception d’ordinateurs spécialisés. Nous décrirons aussi la technique de renormalisation Monte Carlo dans l’espace de configuration due à Ma, Swendsen et Wilson. Enfin nous évoquerons l’extension de ces méthodes au cas de systèmes fermioniques, tenant compte des difficultés évoquées au chapitre VI.
1. Algorithmes 1.1 Généralités Les ordinateurs actuels peuvent traiter des systèmes comportant jusqu’à des dizaines de millions de variables. Ces nombres croîtront probablement de manière significative dans un proche avenir. Les mesures peuvent être cependant assez nombreuses pour atteindre une précision statistique suffisante. Bien que les tailles des systèmes traités restent encore assez m e destes en comparaison avec les ensembles macroscopiques, les effets collectifs apparaissent néanmoins très clairement et l’on est capable d’obtenir des résultats précis concernant les phénomènes critiques. En examinant de près
50
SIMULATIONS NUMERIQUES
VIII.1.1
les méthodes numériques utilisées, on acquiert un sens plus concret des fondements de la physique statistique d’équilibre, des problèmes d’ergodicité, de la signification des concepts probabilistes et de la question capitale de l’approche à l’équilibre. Bien que superficiellement, ce chapitre ne traite que d’aspects techniques, le lecteur se convaincra sans peine que le sujet mérite un examen attentif et que la pratique est le meilleur guide en ces matières. Le nombre colossal de variables interdit dans la majorité des cas un traitement exact qui consisterait à énumérer toutes les configurations possibles et à calculer leur contribution. Qu’on songe aux quelque lOSoo0 configurations d’un système de spins binaires sur un réseau bidimensionnel de taille 30 x 30 x 30! Il existe cependant quelques tentatives de ce type où l’on a calculé pour un système d’king 4 x 4 x 4 par exemple les contributions du nombre déjà macroscopique d’états, environ 2.101’, en exploitant au mieux ses symétries. En pratique on doit se contenter d’un échantillon représentatif de l’ensemble des états. On effectue sur chaque échantillon les mesures souhaitées et on analyse les erreurs statistiques comme lors d’observations dans de!; expériences de laboratoire. En quelque sorte il s’agit aussi dans le cas présent d’une forme d’expérimentation contrôlée où l’on a à faire front à deux types de difficultés. La première est celle de simuler ce qui est d’ordinaire naturellement fourni par des agrégats macroscopiques, la seconde est celle d’estimer les biais provenant des tailles relativement petites. On pourrait songer tout d’abord à une méthode directe utilisant un générateur de nombres aléatoires pour choisir successivement et indépendamment les différents degrés de liberté et leur associer un poids statistique, produit du facteur de Boltzmann par la mesure relative aux champs. Une application classique de cette technique est la roulette qui assure un gain (positif et sans risque) aux établissements de jeu aux dépens de ceux qui ignorent, ou veulent ignorer, les lois statistiques. L’application de cette idée et son élaboration est à l’origine de la dénomination méthode de Monte Carlo qui a été donnée à ces simulations. L’échantillonnage simple est couramment pratiqué avec succès dans les questions de percolation ou d’hydrodynamique. Cependant, cette méthode n’est pas bien adaptée aux exemples auxquels nous songeons, systèmes de spins généralisés, théories de jauge, surfaces aléatoires, etc..., dont les poids de Boltzmann impliquent l’interaction de plusieurs degrés de liberté et qui sont susceptibles d’engendrer des effets collectifs non triviaux. Comme c’est le cas d’ordinaire, les fluctuations d’énergie sont d’ordre f l ,où N désigne la taille. Or les configurations qui ne sont pas énergétiquement très voisines de la valeur moyenne (nous utilisons ici le terme énergie quand il faudrait parfois parler d’action) ont un effet négligeable dans l’estimation de la plupart des observables. L’échantillonnage simple ne prend pas ceci en compte et, afin d’optimiser le rendement des calculs, il est nécessaire d’introduire un biais. Désignons par le symbole x l’ensemble des variables caractérisant une configuration. Une si-
VIII. 1.1
51
SIMULATIONS NUMEFUQUES
mulation engendre une suite de valeurs {xi} attachées à des configurations choisies indépendamment selon une loi de probabilité l‘(xi). On remplace la valeur moyenne cherchée
par celle de la suite
On vérifie que dans la limite d’un “temps” infini, n tendent vers la quantité requise
à une erreur d’ordre
-+
00,
les variables fn
i/Jn près.
Vérifier que si toutes les configurations xi sont choisies avec la même loi de probabilité P ( x ) , la moyenne temporelle (l/n) !(xi) tend vers P ( x ) f ( x ) .En déduire l’égalité ( 2 b ) .
E,
Le facteur de Boltzmann peut varier sur plusieurs ordres de grandeur. Si P ( x ) est presque constant, très peu d’échantillons contribuent significativement à la somme (2a) et le nombre d’itérations n, c’est-à-dire le temps de calcul, devient énorme. I1 est cependant possible de corriger en partie ce défaut puisque la loi de probabilité P ( x ) demeure à notre disposition. On est ainsi conduit à adapter cette dernière à la quantité à calculer, ce qui introduit la notion d’échantillonnage sélectif Le choix optimum consiste a prendre le poids de Boltzmann lui-même, de sorte que, à une normalisation près, P ( x ) = exp(-p’Fl(x)). Les interactions couplent les valeurs locales des champs (les composantes de x). On choisit d’engendrer la configuration xi+l à partir de xi à l’aide d’un processus de Markov. Les quantités xi et xi+p,séparées par un intervalle de temps fini, ne seront pas indépendantes, ce qui sera néanmoins sans conséquence pourvu que ces corrélations décroissent suffisamment vite avec p de sorte pue la distribution de xifp s’approche de la loi souhaitée, P ( x ) , indépendamment de xi. La relation (2b) reste alors valable. Soit W(xi, xi+1) la probabilité conditionnelle de tirer xi+l étant donné xi. Elle définit le processus de Markov. On lui demande de posséder les propriétés suivantes (i) N o m a h a t i o n W(x, y) = 1 (ii) Ergodicité W ( x , y ) > O. En d’autres termes, on doit pouvoir atteindre chacune des configurations. (iii) Probabilité limite
E,
52
SIMULATIONS NUMERIQUES
VIII.1.1
X
Considérée comme une matrice dans l’espace des configurations, la distribution W a donc une valeur propre maximale unité d’après les conditions (i) et (ii) et la condition (iii) entraîne que le vecteur propre correspondant de composantes positives n’est autre que P(x). Ainsi WP appliqué à une loi de distribution arbitraire sur les configurations la transforme, lorsque p croît indéfiniment, en celle définie par P , ce qui est le résultat désiré. On peut aussi obtenir la distribution limite de l’estimation f n de (f).Pour n grand c’est une loi gaussienne exp[-(fn - (f))’/2c~:], avec une déviation standard telle que
Obtenir cette relation par transformation de Fourier.
Les trois conditions précédentes sont loin de déterminer uniquement la probabilité conditionnelle W(x, y). I1 est commode en pratique de décompcser W en une succession d’étapes élémentaires
w(x’ y) =
IV1 (x’ z1) w2 (z 1,552 1 * * * Wk (Zk -1 ’Y
(5)
zi
On impose alors la condition plus restrictive de l’équilibre détaillé
de sorte que la relation (3) soit automatiquement satisfaite. I1 est plus facile de vérifier et de mettre en oeuvre la condition (6) et ses propriétés de symétrie sont souvent très utiles. Mais même cette dernière laisse encore un grand arbitraire pour W, lequel explique la diversité des algorithmes. Concrètement on préfère procéder en étapes élémentaires qui n’affectent qu’un petit nombre de degrés de liberté à la fois. Par exemple Wj reviendra à agir sur une variable a u site j sans modifier celles relatives aux autres sites. Cette procédure est iiitéressante pour les systèmes ayant des interactions à courte portée en limitant le temps de calcul nécessaire à chaque étape, indépendamment de la taille. Le temps total pour balayer le système entier (c’est-à-dire pour effectuer une itération complète du processus de Markov) sera donc proportionnel au volume de ce dernier. L’impartialité demande cependant de mentionner le défaut principal de cette procédure, à savoir, qu’il est difficile d’exciter ainsi les modes collectifs de grande longueur d’onde à basse température ou près d’un point critique. Le temps de thermalisation nécessaire pour effacer la mémoire de la configuration
VIII.1.1
53
SIMULATIONS NUMERIQUES
initiale devient relativement long. De plus le domaine critique est caractérisé par des corrélations importantes entre configurations successives (c’est le ralentissement critique). En d’autres termes il existe aussi des phénomènes critiques ,dynamiques à l’approche de l’équilibre, contrepartie des propriétés critiques statiques.
1.2 Algorithmes classiques Le moyen le plus simple de satisfaire à la condition ( 6 ) est de choisir
qui s’interprète comme la thermalisation d’un spin (ou d’une variable locale) avec une source à la température voulue, les autres degrés de liberté du système étant figés. La variable cible est réactualisée en contact thermique avec la source en tenant compte de ses interactions avec les spins voisins qui restent passifs. C’est l’algorithme du themnostat (“heat bath” en anglais). Comparée au problème initial de réactualiser simultanément l’ensemble des variables avec une probabilité proportionnelle au poids de Boltzmann, la procédure est considérablement simplifiée puisque la loi de probabilité (7) ne dépend que du voisinage d’un site. Dans une simulation du modèle d’Ising par exemple, on calcule le champ local hj = O k auquel est soumis le spin au site j. Indépendamment de sa valeur initiale on choisit alors pour le spin final une valeur +1 avec une probabilité p j = [l exp(-2phj)]-’ et -1 avec la probabilité complémentaire. En pratique, ce choix se fera en engendrant un nombre aléatoire uniformément distribué dans l’intervalle O et 1 et en prenant le spin égal à +1 si ce nombre est inférieur à p j , et à -1 sinon. Cet algorithme s’applique efficacement à des systèmes discrets plus généraux. Quand on a affaire à des variables continues il n’est pas toujours facile d’engendrer des nombres aléatoires selon la loi (7) qui peut conduire à des calculs longs et dispendieux qu’on cherche à éviter. La méthode suivante est mieux adaptée. Définissons la fonction &‘(y) telle que
ck(j)
+
Si on choisit pour y une loi de probabilité uniforme sur [O, 11, on vérifie que x = F(y) est distribué selon la loi de probabilité P ( z ) . L’inversion nécessaire dans l’expression ci-dessus est en général malcommode, excepté dans des cas très simples comme celui de la distribution normale ou de la loi exponentielle; mais on peut l’éviter par l’usage d’un procédé qui admet de nombreux raffinements. Par une transformation simple on peut supposer que la variable z prend ses valeurs dans l’intervalle [O, il. L’algorithme suivant engendre II: en deux temps selon la probabilité P ( z ) .
54
SIMULATIONS NUMEFUQUES
VIII.1.2
1. On tire deux variables x et y indépendamment et uniformément distribuées sur [O, 11. 2. Si P ( x ) < (SupP)y on procède à un nouveau tirage, sinon on retient la valeur x qui se trouve être correctement distribuée. Confirmer la validité de la méthode et calculer le taux de rejet dans le second temps.
Cet algorithme demande d’engendrer deux nombres aléatoirement, de calculer P ( x ) , de faire une comparaison et effectuer ces opérations un nombre moyen de fois égal à SupP. Son efficacité s’accroît lorsque la loi devient plus uniforme. On en trouvera de nombreuses adaptations dans un texte de référence cité dans les notes. En généralisant les idées précédentes, Metropolis a été conduit à proposer une méthode qui peut se substituer à celle du thermostat. On réactualise encore la configuration x site par site d’après les règles suivantes. M1 On engendre au hasard une valeur d’essai pour le champ au site donné conduisant à une nouvelle configuration y. La loi de probabilité & ( y ) qui gouverne ce choix est arbitraire (excepté un souci d’efficacité) et peut même dépendre de la valeur antérieure du champ. M2 Si H ( y ) 5 H ( x ) , la configuration y est acceptée et l’algorithme s’achève. M3 Si au contraire l’énergie croît, H(y) > ‘H(x),on tire un nombre X au hasard uniformément distribué dans l’intervalle ] O , l[et on n’accepte la configuration y que si X < exp-B(X(y) - X ( x ) ) . Sinon on conserve l’ancienne configuration x. Observons que le deuxième temps de l’algorithme serait identique si l’on cherchait l’état fondamental du système. C’est dans le troisième temps qu’un accroissement d’énergie est admis selon une loi de probabilité qui dépend de la température. Vérifier que la probabilité de transition
Wj (x, Y ) 0:
r)
si %(Y) 5 3i(x), x # Y si % ( y ) > ‘H(x) & ( Y ) ~ X -PB ( W Y ) - WX)) Q ( z ) ( l- exp -/3(N(z) - X(x)) si x y
Z,%(Z)>X(X)
(9)
satisfait aux conditions requises pourvu que Q ( y ) obéisse au critère d’ergodicité. On pourrait se contenter de demander qu’une puissance finie de W remplisse ces conditions.
On choisira Q(y) de manière à maximiser (empiriquement) l’efficacité de la procédure. Par exemple on modifiera une variable continue cp selon un incrément aléatoire Scp en s’assurant que la valeur moyenne (Scp) reste de l’ordre de grandeur des fluctuations dans le système entier. Tirer trop
VIII.1.2
SIMULATIONS NUMERIQUES
55
souvent des valeurs beaucoup plus grandes de l’incrément conduirait à un taux important de rejets. Inversement, si les valeurs sont trop petites, le taux de rejet serait faible, mais l’évolution très lente. Dans les deux cas il serait nécessaire de balayer le système un très grand nombre de fois pour obtenir des configurations indépendantes et une bonne thermalisation. En pratique on admet qu’un taux de rejet d’environ 50% conduit à de bons résultats. I1 est possible d’appliquer l’algorithme plusieurs fois à la même variable locale avant de passer à la suivante. Si ce nombre devient très grand, il revient à créer une chaîne de Markov secondaire qui converge vers la loi de probabilité (7). I1 est donc possible d’interpoler entre la méthode de Metropolis et l’algorithme du thermostat, ce qui peut améliorer l’efficacité. (1) On utilise sur les ordinateurs des suites déterministes, possédant des propriétés d’ergodicité, en guise de générateurs de nombres aléatoires. I1 faudrait peut-être qualifier ces nombres de “pseudo-aléatoires” . Les générateurs classiques sont fondés sur des congruences linéaires du type suivant. On produit une suite de nombres xn entre O et 1 à partir du système dynamique auxiliaire un tel que
~n
un+1
=2-’~n
=Aun
[mod 2’1
La suite des nombres (2,) obtenue possède des propriétés aléatoires “raisonnables” pour un choix approprié de l’entier impair A . L’algorithme est facile à mettre en oeuvre et bien adapté à la structure des ordinateurs. I1 peut cependant présenter des défauts et c’est une sage précaution que de vérifier les propriétés du générateur dans des simulations de grande taille. Par exemple on peut découvrir des corrélations entre trois tirages consécutifs susceptibles de produire des biais considérables dans des simulations tridimensionnelles. I1 faut alors utiliser des procédures plus complexes. Ainsi en utilisant un générateur du type précédent on peut extraire un nombre au hasard dans une table qu’on renouvelle aléatoirement à l’aide d’une suite telle que (10) après modification des constantes A et uo. En tout cas, une simulation d’importance requiert de nombreuses vérifications statistiques destinées à assurer l’indépendance et la distribution correcte des configurations. I1 est évident que la substitution d’un générateur de nombres aléatoires à un autre ne doit pas modifier les résultats. (2) I1 est possible, dans certains exemples, de classer les champs en groupes sans interaction directe. Ainsi dans le cas d’interactions entre proches voisins sur un réseau (hyper-) cubique, les sites peuvent être groupés selon la parité de la somme de leurs coordonnées. I1 est essentiel de tenir compte de cette possibilité dans les simulations sur un processeur vectoriel ou parallèle. En effet les machines vectorielles “pipelinées” effectuent très rapidement des séquences d’opérations répétées sur des tableaux d’éléments, à condition que ces opérations soient indépendantes, le résultat d’un pas de calcul ne devant
56
SIMULATIONS NUMERIQUEÇ
VIII.1.2
pas influencer le suivant. La même remarque est valable pour les calculs faits en parallèle. Pour satisfaire à cette contrainte, on peut décomposer chaque balayage du réseau en deux boucles successives traitant les sites pairs, puis impairs. L’organisation des mémoires doit elle aussi être soigneusement étudiée. Par exemple, un spin d’un modèle d’king peut être représenté par un bit (unité d’information binaire). Ces derniers peuvent être groupés en mots (l’unité d’information d’un ordinateur) de façon telle qu’ils puissent être traités simultanément à l’aide d’une seule instruction logique. Cela assure ainsi une parallélisation des calculs sur les machines monoprocesseur. Ces considérations sont importantes dans la pratique, car le temps, la capacité de mémoire et le coût sont des limitations essentielles. Les progrès effectués ne permettront pas de s’en affranchir, car on les mettra à profit pour augmenter la taille des systèmes simulés.
(3) Citons encore une autre difficulté qui peut se présenter quand une série de balayages réguliers successifs conduit à la Stabilisation d’états métastables. Considérons à titre d’exemple une théorie de jauge bidimensionnelle avec une action
s =81
fflOZff304
+
B2
OlO203ff4U5U6
qui fait intervenir des termes bordant deux plaquettes adjacentes. Supposons /?z grand et négatif. Ce modèle est équivalent à un système antiferromagnétique de spins dans un champ extérieur. Un état fondamental peut être représenté comme l’indique la figure 1. 11 a l’aspect d’un damier sur lequel les variables de plaquettes prennent alternativement les valeurs +1 et -1. Si l’on initialise le système en choisissant toutes les variables de plaquette égales à +1, un balayage régulier des liens ligne à ligne laisse la configuration inchangée, comme le lecteur s’en assurera aisément. Le même phénomène se produit pour B2 grand et positif (système ferromagnétique), lorsqu’on prend pour point de départ une configuration en damier. Dans les deux cas l’état initial reste stable et il est très difficile d’analyser la transition du premier ordre entre les deux régions. Cette difficulté se présente aussi dans les simulations du modèle à huit vertex (ou ce qui est équivalent des chaînes de Heisenberg quantiques, ou encore des systèmes d’king couplés). Pour une simulation plus efficace, on pourra tirer au hasard le lien à réitctualiser, au lieu de balayer le réseau régulièrement. Les résultats ne sont cependant pas encore satisfaisants car le plan peut être divisé en deux régions correspondant aux deux configurations dégénérées (résultant de l’échange des plaquettes paires et impaires) dont les frontières évoluent très lentement. I1 est nécessaire de comprendre le mécanisme de stabilisation pour surmonter cette difficulté. On s’attend à ce que la transition entre la phase de pure jauge (ou ferromagnétique) et la phase gelée (ou antiferromagnétique) se produise le long d’uns ligne voisine de la droite j 3 1 + 4 B 2 M O . Supposons Bi positif et donc 8 2 négatif. Si on renverse une variable de lien dans l’un ou l’autre état ordonné on s’attcnd à un accroissement d’énergie de l’ordre - 2 p 2 et -6B2 respectivement, processus qu’on peut considérer comme très improbable. En
VIII.1.2
SIMULATIONS NUMERIQUES
57
revanche si on renverse simultanément les variables sur deux liens parallèles voisins, la variation d’énergie est bien plus faible. I1 s’agit donc de l’excitation élémentaire dans ce domaine et il paraît judicieux de fonder une simulation sur cette technique de double renversement. Malheureusement ce faisant on violerait le critère d’ergodicité si on n’alternait pas avec un balayage lien par lien. L’efficacité d’une simulation sera grandement accrue si on s’inspire des remarques précédentes.
Figure 1 : La configuration en damier de l’état fondamental d’un système de jauge décrit par l’action (11) pour PZ < O. Les variables le long des liens appartenant aux lignes ondulées et les variables de plaquettes en grisé sont égales à -1.
1.3 Simulations microcanoniques On a proposé de s’affranchir de l’usage des générateurs de suites pseudo-aléatoires tout en engendrant une séquence ergorlique de configurations à l’aide d’un processus déterministe dans l’espace de configuration. L’idée consiste à contraindre l’énergie à demeurer dans un étroit intervalle de largeur SE comme dans l’analyse du théorème ergodique. On comparera cette technique à celle d’un générateur de nombres aléatoires. Dans les deux cas l’ergodicité résulte du mécanisme spécifique qui gouverne le mouvement. Les simulations microcanoniques nécessitent une vérification expériment ale des propriétés d’indépendance statistique. La méthode qu’on va exposer semble satisfaire à ce critère. Considérons un démon possédant un réservoir d’énergie positive de capacité 6E. I1 visite tous les sites successivement et renverse les spins (s’il s’agit d’un système à variables dichotomiques) chaque fois qu’il le peut. Si l’énergie nécessaire pour modifier la configuration localement est supérieure à celle dont il dispose dans son réservoir, ou si la modification
58
SIMULATIONS NUMERIQUES
VIII.1.3
envisagée dégage une iinergie supérieure à la capacité du réservoir, les variables demeurent inchangées. Sinon le spin est renversé et la quantité d’énergie disponible dans le réservoir est modifiée en conséquence. I1 est aisé de procéder à une simulation de ce type dans le cas d’un modèle d’Ising ou de tout modèle analogue, en tirant en outre parti de la subdivision possible du système en groupes de variables qu’on pourra traiter en parallèle. Concrètement on mettra en oeuvre un “bataillon de démons” visitant simultanément des spins sans interaction directe. La procédure exposée ci-dessus peut être considérée comme l’analogue d’un générateur pseudo-aléatoire, sur le même plan que les algorithmes usuels. Elle a conduit jusqu’à présent à d’excellents résultats pour des systèmes de type Ising. Son intérêt réside dans sa très grande économie de temps de calcul. On peut lui apporter des améliorations empiriques pour augmenter l’ergodicité, par exemple en redistribuant aléatoirement les contenus des réservoirs des différents démons à des intervalles de temps réguliers. Contrairement aux précédents algorithmes, l’énergie est fixée (à SE près) dans les simulations microcanoniques. I1 est alors nécessaire de mesurer la température. 11 cet effet, l’énergie moyenne dont disposent les démons peut servir de thermomètre. A l’équilibre thermique la distribution de l’énergie des réservoirs doit être donnée par le facteur de Boltzmann exp(-PEdémon). Etant donné que le réservoir ne possède qu’un seul degré de liberté, il est facile de calculer son énergie moyenne en fonction de p. Pour un système d’Ising par exemple, &,4mon est un multiple de l’énergie correspondant au renversement d’un spin (que nous prenons comme unité pour simplifier) avec une coupure à l’énergie maximale SE. Ainsi
relation qu’il est facile d.’inverser pour obtenir p.
1.4 Considérations pratiques I1 est clair d’après ce qui précède que les simulations Monte Carlo constituent en fait un art. Les détails de leur mise en oeuvre dépendent du but qu’on s’est fixé (et des capacités de l’utilisateur). Nous présentons ci-dessous quelques remarques techniques supplémentaires. 1.4.1 Conditions aux limites
Tant que les tailles des réseaux employés demeurent modestes, les conditions au bord jouent un rôle essentiel. Par exemple un réseau tndimensionnel de lo3 sites avec bords libres possède 48.8% de sites sur la frontière. Cet effet croît avec la dimension et l’estimation des quantités thermodynamiques devient douteuse. La façon la plus courante de s’affranchir en partie
VIII.1.4.1
SIMULATIONS NUMEFUQUES
59
de ce problème est d’utiliser des conditions de bord périodiques. Du point de vue de l’ordinateur ceci se réalise aisément à l’aide d’une instruction élémentaire modulo. De plus on utilisera au mieux la structure binaire des données en choisissant une taille linéaire en puissance de 2, qui remplace cette opération par une instruction logique, plus rapide à exécuter. I1 est même possible de traiter toutes les dimensions à la fois en enveloppant le réseau sur une hélice. Considérons par exemple un réseau bidimensionnel. Dans la mémoire de l’ordinateur on dispose les sites en une série linéaire (1’1)’(1’2)’ ( l , L ) , (2’1)’ (2,L), (3’1)’ De la sorte les adresses des sites voisins d’un site donné s’obtiennent à partir de la sienne en les décalant de quantités fixes ( k l et f L ) . Les conditions hélicoïdales reviennent à étendre la règle aux sites initiaux et finaux, les adresses étant définies modulo L 2 . Ce procédé simplifie considérablement le programme et est très efficace. La périodicité introduit cependant des effets parasites qui peuvent provoquer des désastres si on n’en est pas conscient comme le démontrent les exemples suivants. (i) La mesure des masses (ou des longueurs de corrélation) résulte de l’ajustement d’une décroissance exponentielle en exp( - x / c ) au comporte ment asymptotique des fonctions à deux points (cpocp,.). Du fait des conditions aux limites, les fonctions de corrélation deviennent périodiques. Si on ~ cpo, la formule précédente est ne retient que la première duplication c p de modifiée en - - e ,
e - - ,
I
-
grand
O
Cstcosh
-
.
.
(T) SL 2-
(13)
O
On observe un cas typique de ce comportement sur la figure 2. (ii) Dans les théories de jauge on déduit le potentiel statique entre quarks de l’observation de la moyenne d’un opérateur de Wilson. Ce dernier est relatif à une boucle de taille R dans la direction spatiale, T dans la direction temporelle, dans la limite où T + 00 à R fixé. Si T = L dans un volume périodique de taille L, la boucle se décompose en deux circuits fermés en raison des conditions aux limites. Ces dernières sont appelées boucles de Polyakov. Si on les utilise plutôt que les boucles de Wilson, on élimine le problème de la limite T + 00 ainsi que les effets de coin caractéristiques des boucles de Wilson. (iii) La fonction de partition d’une théorie des champs à la température T, 2 = Trexp - X / T peut s’exprimer comme une intégrale fonctionnelle euclidienne impliquant une variable temporelle supplémentaire
et une contrainte de périodicité Q(0,x) = @(l/T,x)dans le cas le plus
60
VIII. 1.4.1
SIMULATIONS NUMEFUQUES
7
I
II
10
14
77
Figure 2 : Comportements typiques en cosinus hyperbolique dans le calcul du propagateur du pion (d’après A. Billoire, R. Lacaze, E. Marinari et A. Morel, Nucl. Phys. B251 [FS13], 581 (1985)). simple d’un champ bosonique scalaire. On utilise dans les simulations des numériques un réseau asymétrique de N,“x Nt sites, N,a, > Ntat, conditions au bord péria,diques, et on se réserve la possibilité de choisir des mailles a, et at inégales. Dans la limite continue, la température s’exprime selon 1 Nt at
T=-
(iv) Enfin on peut étudier divers effets grâce à des conditions de bord antipériodiques. Ces dernières permettent par exemple la mesure des énergies libres d’interface à basse température. 1.4.2 Taille du réseau
Le choix de la taille linéaire L du réseau est évidemment directement relié au coût de la simulation. C’est le facteur déterminant de la précision numérique, en particulier en dimension élevée (trois ou quatre). Cependant les simulations sur des réseaux de très petite taille ne sont pas inutiles. Les calculs sont alors très rapides et fournissent des informations semiquantitatives sur les plages de paramètres à explorer dans des simulations à plus grande taille. Expérimentalement on observe que la mesure de certaines observables thermodynamiques (comme l’énergie interne) est déjà assez précise sur de petites tailles. Bien entendu de plus grands réseaux réduisent les effets de taille finie. Pour des raisons techniques (initialisation des boucles, vectorisation ...) le temps nécessaire à la réactualisation d’une variable est lui aussi réduit
VIII.1.4.2
SIMULATIONS NUMERIQUES
61
lorsque la taille croît et les marges d’erreur sur les quantités thermodynamiques s’amenuisent. De toute f q o n il est nécessaire d’utiliser des réseaux aussi grands que possible pour mesurer les fonctions de corrélation. Dans ce cas on peut réduire le coût en ne faisant croître la taille que le long de la direction de séparation des champs. Notons qu’une simulation devient sans intérêt dès que la longueur de corrélation dépasse la dimension linéaire. I1 semblerait donc que l’étude détaillée des phénomènes critiques fasse appel à des systèmes de tailles très importantes. 1.4.3 Temps de thermalisation
I1 est important de se faire une idée du temps nécessaire pour atteindre l’équilibre thermique ainsi que celle de l’intervalle séparant deux configurations de la chaîne de Markov qui peuvent être considérées comme indépendantes. Rappelons la définition des fonctions de relaxation. Partant d’un état hors d’équilibre caractérisé par un écart SO d’une quantité thermodynamique (température, champ extérieur, ...) à la valeur d’équilibre, on définit une fonction de relaxation non linéaire pour une observable A comme la fonction
et le temps de relaxation associé
On peut aussi définir des quantités similaires à l’équilibre, en se fondant sur la théorie de la réponse linéaire
L’hypothèse la plus courante est que les deux fonctions sont reliées par la relation
où B est la quantité conjuguée à û (l’énergie interne si û est la température, l’aimantation s’il s’agit du champ extérieur...). Cette hypothèse qui implique que le temps de thermalisation est de l’ordre des temps de fluctuation à l’équilibre, n’a d’intérêt que si on a un moyen d’estimer a priori ces derniers, ce qui est rarement le cas. On peut faire des remarques semblables dans le cas d’états métastables séparés par
62
SIMULATIONS NUMERIQUES
VIII. 1.4.3
une barrière énergétique AE. D’après la théorie des processus d’activation thermique, on peut supposer que le temps de relaxation se comporte comme
-
r 7-0 exp(PAE) (PAE > 1) (20) où 70est un temps caractéristique de la phase métastable. Ces phénomènes sont typiques de transitions du premier ordre et sont à l’origine des boucles d’hystéresis que nous discuterons plus loin. La barrière énergétique est ici l’énergie de “nucléa,tion” de la phase stable. On rencontre des effets analogues dans les problèmes comme celui des verres de spin qui conduisent à des temps de relaxation extrêmement longs, et qui de ce fait rendent la méthode de Monte Carlo très inefficace. Au voisinage d’une transition du second ordre, le temps de relaxation diverge puisque les champs sont corrélés dans des volumes d’ordre Id.On s’attend donc à un ralentissement critique au voisinage de T,,associé à un exposant critique dynamique r - ( 1 - 8 ) -c Pour la fonction de relaxation ~ A A le, temps de relaxation est approximativement proportionnel à la susceptibilité X A A = P N [ ( A 2 )- ( A ) 2 ]Pour . un système fini il n’y a pas à proprement parler de divergence (voir ci-dessous). Dans la pratique, en 1’a.bsence de prédictions convaincantes, on se contente d’estimer r en observant comment une observable se stabilise à sa valeur d’équilibre. I1 faut prentdre garde au fait que des observables distinctes peuvent avoir des temps de relaxation très différents.
1.4.4 Mesure des observables La mesure de certaines observables peut consommer une fraction non négligeable du temps de calcul comparé à celui qui est nécessaire pour engendrer les configurations d’équilibre. Nous verrons ainsi que les moyennes fermioniques impliquent l’inversion de très grandes matrices Ld x L“. Les fluctuations statistiques constituent un autre facteur de limitation. I1 est clair que les mesures perdent tout sens si les moyennes des quantités qu’on désire obtenir sont de l’ordre du bruit statistique. Par exemple on ne peut calculer des dtirivées par des approximations de différences finies entre des quantités memrées sur des échantillons indépendants. C’est le cas par exemple de la chaleur spécifique C = dE/dT. Nous verrons qu’il est possible de contourner cette difficulté pour obtenir cette grandeur. I1 est plus facile de mesurer des moyennes thermodynamiques, mais leur intérêt est en général restreint lorçqu’on s’intéresse aux quantités renormalisées de la limite continue. On cherchera plutôt à obtenir les masses ou les longueurs de corrélation qui requièrent malheureusement des simulations plus soigneuses et plus longues, puisqu’il s’agit de les déterminer à partir de la façon dont un signal décroît avec la distance et tend à disparaître dans le bruit.
VIII.1.4.5
63
SIMULATIONS NUMEFUQUES
1.4.5 Erreurs statistiques
Soit A l’estimation de la moyenne d’une observable, égale à la moyenne arithmétique sur N mesures. On prendra comme ordre de grandeur de l’erreur statistique la quantité I
.
formule qui suppose les valeurs Ai sans corrélation, ce qui n’est pas le cas lorsqu’elles sont engendrées par une chaîne de Markov. On retrouve là la nécessité de faire des tests variés de l’indépendance statistique des mesures. ) ~divers Une méthode empirique consiste à calculer les valeurs de ~ v ( b Asur échantillons et à vérifier que les résultats sont indépendants de N. La détermination du temps de relaxation TAA (équation (18)) est évidemment reliée à cette question. On montre que la formule précédente doit être multipliée par un facteur d’ordre d m . Justifier ce résultat.
1.4.6 Paramétrisation des champs
Les champs peuvent prendre leur valeur dans des domaines variés, en particulier dans des groupes de Lie (c’est le cas des champs de jauge). La structure de ces domaines peut allonger le temps de calcul de manière significative. De plus la paramétrisation adoptée peut influer sur la capacité de mémoire nécessaire. A titre d’exemple considérons le cas de champs prenant leur valeur dans le groupe S U ( 2 ) . Nous avons le choix entre les techniques suivantes. 6 ) Nous pouvons paramétriser les champs à l’aide de matrices complexes 2 x 2. Ceci implique de garder en mémoire 8 mots (nombres à virgule flottante) par champ. I1 est facile d’effectuer les multiplications des matrices qui nécessitent 32 multiplications ordinaires (en fait ce nombre peut être légèrement réduit grâce à des astuces de programmation). (ii) Nous pouvons encore traiter les champs comme des points sur la sphère unité S3 dans un espace quadridimensionnel sous la forme U = a0 ia.Ü, avec a i a2 = 1, a0 et a réels. Cette fois-ci, 4 mots sont suffisants. En revanche la multiplication est un peu plus complexe à programmer : UU’ = (aoab - a.a‘) i(a0a‘ aoa a A a‘).Z), mais ne nécessite que 16 opérations élémentaires.
+
+
+
+
+
La seconde paramétrisation est la meilleure à tous points de vue et c’est celle qu’on préférera, Elle a l’avantage supplémentaire de se prêter à une simulation utilisant l’algorithme du thermostat (Creutz, 1980). Le poids de Boltzmann relatif à un champ U se réduit à exp Tr U V où V est une somme de matrices qui admet une paramétrisation analogue de la forme V = bo S i b 3 sans contrainte sur b2 = bi b2. Le tirage de U s’effectue selon la loi
+
64
SIMULATIONS NUMERIQUES
dP(U‘ == U V - l )
c (
VIII.1.4.6
dâ‘ d--exp(pbab)dao
Le choix de ab est gouverné par une exponentielle et s’obtient en utilisant les algorithmes usuels corrigés par une procédure de rejet pour tenir compte du facteur en racine camée. On choisit alors la direction de a’ uniformément au hasard et on peut reconstruire l’élément du groupe. On obtient ainsi une méthode de simulation très efficace. La structure des groupes W ( n ) pour n 2 3 ne permet pas de telles simplifications. La variété du groupe est plus compliquée et jusqu’à présent il a semblé préférable d’employer une paramétrisation en termes de matrices complexes n x n bien que la capacité de mémoire nécessaire en soit considérablement accrue.
I1 est parfois possible de discrétiser à son tour le domaine des valeurs des champs dans le but de diminuer la capacité de mémoire nécessaire (un seul entier suffira à prescrire la valeur du champ) ainsi que le temps de calcul (en construisant une table de multiplication appropriée). Cependant il est indispensable de s’assurer qu’on ne modifie pas ainsi les propriétés du système que l’on étudie. Examinons le cas du groupe U(1) qui est bien représenté par 2, pour n grand. On a étudié très exhaustivement les systèmes de spins correspondants (l’action s’écrivant ,O &s,j) cos[27r(mi - mj)/n],mi = O , . . .,n - 1) ainsi que leur contrepartie invariante de jauge. Ces modèles présentent génériquement deux transitions pour n > 4 (figure 3). On interprète la phase intermédiaire comme décrivant des ondes de spins analogues à celle du modèle X Y (chapitre IV, volume 1). La transition entre la phase intermédiaire et celle de haute température appartient à la même classe d’universalité que la transition du modèle à symétrie U(1). A très basse température, la structure discrète de 2, devient apparente et le système possède une seconde transition. Lorsque n croît, le point critique inférieur s’approche de la température nulle. On conçoit qu’il est alors possible de remplacer l’étude du modèle U(1) par celle d’un modèle à symétrie 2, pourvu que la température excède cette transition inférieure. La technique précédente serait extrêmement intéressante si on pouvait l’étendre aux cas des groupes continus non abéliens. Malheureusement les sous-groupes finis intéressants ne sont qu’en nombre fini et en général pas assez denses pour assurer une transition discrète à température suffisamment basse. Considérons à nouveau le cas du groupe S U ( 2 ) . En se servant de la structure des polyèdres réguliers (c’est-à-dire en se réduisant à S O ( 3 ) obtenu par quotient de S U ( 2 ) par son centre Z 2 ) et en écartant les groupes cycliques et diédraux (d’ordre supérieur à quatre), peu représentatifs, on a le choix entre les sous-groupes suivants (chapitre XI).
VIII.1.4.6
SIMULATIONS NUMERIQUES
65
(1) Q groupe quatemionique à 8 éléments. C’est le groupe multiplicatif des éléments izl, f i q , un double recouvrement du groupe à quatre éléments des rotations d’angle ?r autour de trois axes orthogoiiaux. (2) T double recouvrement du groupe tétraédral, 24 éléments. (3) O double recouvrement du groupe cubique ou octaédral, 48 éléments. double recouvrement du groupe icosaédral ou dodécaédral, 120 élé(4) ments. Les théories de jauge quadridimensionnelles correspondantes exhibent une transition du premier ordre unique à une valeur de la constante de couplage égale respectivement à 1.23, 2.175, 3.21 et 5.9. Rappelons que pour S U ( 2 ) le raccord entre régimes de couplage fort et faible s’effectue aux environs de B N 2. On voit donc que les deux derniers groupes peuvent être utiles dans un domaine limité comme approximation au modèle à symétrie continue. Dans le cas de S ü ( 3 ) , et en écartant comme précédemment des séries infinies généralisant les sous-groupes cycliques et diédraux, qui n’offrent pas une approximation satisfaisante de la variété, on connaît des sous-groupes discrets d’ordre 108, 216, 648 et 1080 (liste non exhaustive). Les transitions du premier ordre correspondantes sont à B = 2.5, 3.2, 3.43 et 3.58. Aucune de ces approximations ne semble donc étre un substitut satisfaisant pour le groupe continu, puisque la région de transition vers la limite continue se situe aux environs de x 5.9 dans le cas de SU(3).
2. Mesures Lorsqu’un programme a été suffisamment développé, on a à sa disposition un système dont les paramètres (température, champ extérieur, ...) peuvent être modifiés à volonté, permettant ainsi d’effectuer diverses mesures. Mis à part les questions relatives au traitement statistique des données déjà discutées, nous allons passer en revue ci-dessous divers points spécifiques aux phénomènes critiques.
2.1 Détermination des transitions La première tâche consiste à déterminer le diagramme de phase - s’il n’est pas déjà connu - et à situer les régions critiques. On effectue une exploration préliminaire le long d’un chemin dans le diagramme de phase parcouru dans un sens et dans l’autre, tout en mesurant une (ou plusieurs) observables. A titre d’exemple considérons un modèle de jauge de groupe 2,. La température est choisie assez grande et la configuration initiale totalement désordonnée. On autorise le système à évoluer pendant un temps assez long pour atteindre l’équilibre thermique (ce dernier étant déterminé par la condition que les observables fluctuent autour d’une valeur moyenne stable). On poursuit le processus de Markov en faisant décroître régulièrement la température par un très faible décrément à chaque balayage, tout en poursuivant la mesure de l’énergie moyenne d’une plaquette E = 1- (?I.U p ) .
66
VIII.2.1
SIMULATIONS NUMEFUQUES
Lorsqu’on atteint une température suffisamment basse, on inverse le processus de manière à revenir à la température initiale. La figure 3 représente la courbe obtenue pour la valeur de l’énergie. On y observe deux boucles d’hystéresis qui signalent l’existence de deux transitions et déterminent grossièrement leur position.
o.e E O.ii
o. O 0.0
1.0
2.0
3.0
P Figure 3 :L’énergie moyenne d’une plaquette dans une théorie de jauge en fonction de la température (d’après M. Creutz, L. Jacobs et C. Rebbi, Phys. Rev. D20, 1915 111979)).
26
Pour obtenir les températures critiques avec précision et connaître leur ordre, il est nécessaire de procéder à une étude plus minutieuse. Dans les circonstances présentes un effet d’hystéresis n’est pas nécessairement caractéristique d’une transition du premier ordre. En principe, quand on a affaire à une telle transition, le système peut rester bloqué dans une phase métastable jusqu’à ce qu’une fluctuation d’énergie libre provoque un saut vers une phase plus stable. Une observable telle que E présente alors une discontinuité. Dans le ciis d’une transition du second ordre, il se pourrait que le phénomène d’hystéresis soit dû à un temps de relaxation très grand viçà-vis du temps de calcul. L’énergie à l’équilibre est une fonction continue de la température et la boiicle devrait s’amenuiser avec une variation plus lente de la température. Ceci ne constitue cependant pas un critère très fiable, car le facteur dominant est la taille finie du système. Les singularités des courbes relatives au système infini sont alors supprimées et il devient très difficile de distinguer les comportements caractéristiques qui différencient les transitions selon l e x ordre. En tout état de cause, il n’existe pas de transitions dans les systèmes finis. I1 faut donc que les critères qu’on va présenter soient suffisamment clairs pour permettre une distinction qui subsiste sans ambiguïti à limite thermodynamique. A titre d’exemple on peut préparer le système dans deux états, l’un d’entre eux étant totalement ordonné et l’autre désordonné. On laisse alors
VIII.2.1
SIMULATIONS NUMERIQUES
67
Figure 4 : Evolution des systèmes à la température critique selon que la configuration initiale est ordonnée ou désordonnée. ( a ) Modèle de jauge 2 6 (transition du second ordre). (b) Modèle de jauge 2 2 (premier ordre). Même source que la figure 3. chacune de ces configurations évoluer à la température critique (ou à une valeur très voisine). Dans le cas d’une transition du second ordre, chacun des spécimens atteint le même état d’équilibre (figure 4a) alors qu’ils demeurent dans des phases différentes s’il s’agit d’une transition du premier ordre (figure 4b). I1 reste cependant la possibilité que le temps de relaxation vers l’équilibre soit extrêmement long. On étudiera alors un échantillon possédant une interface séparant deux phases pures en le laissant évoluer à diverses températures proches de la valeur critique. On a représenté sur la figure 5 le résultat de telles expériences effectuées sur le système de jauge 2 2 quadridimensionnel à des valeurs p = 0.41, 0.42, .. ., 0.47. Les courbes sont suffisamment caractéristiques pour qu’on puisse confirmer l’existence d’une transition du premier ordre pour une valeur critique légèrement supérieure à 0.44 (on sait que la dualité prédit la valeur 0.4407). Dans le cas d’une transition du second ordre, on veut déterminer les exposants critiques et l’amplitude des singularités, ou plus généralement l’ensemble des quantités universelles. Cherchons à estimer la difficulté de telles mesures sur l’exemple du modèle d’Ising. Nous voulons mesurer la susceptibilité
x= ou la chaleur spécifique
(
-
(
(23)
68
VIII.2.1
SIMULATIONS NUMERIQUES
O .1’
1
I
1
2 2
0.5
E 0.4
0.:1
O.? 0.1
0.11
O
100
200
300
400
Figure 5 : Evolulion temporelle d’un système de jauge 22 où les conditions initiales mettent en présence deux phases pures, lorsque B croît (du haut vers le bas) de 0.41 à 0.47. Même source que celle de la figure 3. Signalons au passage un détail technique qui a son importance. Comme on l’a déjà indiqué ces quantités ne peuvent être obtenues par différentiation des quantités mesurées, aimantation ou énergie, en raison des erreurs statistiques. Cette méthode ne permettrait pas de distinguer le signal du bruit. La technique correcte consiste à mesurer l’aimantation et l’énergie sur des échantillons s t a t i s t i q u w w n t indépendants et d’estimer leur variance comme l’indiquent les équations (23) et (24). Insistons sur l’indépendance statistique. Des mesures effectuée:; le long d u même processus de Markov portent sur des configurations en général corrélées et conduisent ainsi à une sous-estimation.
La figure 6 montre l’effet d’une taille finie sur la chaleur spécifique du modèle d’king tridimensionnel. La température critique est déterminée par extrapolation du maximum de la courbe. L’ajustement des exposants critiques est bien plus délicat et très sensible à la détermination de T,. D’autres méthodes sont nécessaires. La première consiste à invoquer des informations sur les effets de taille finie, incorporant ainsi des contraintes sur les quantités qu’on cherche à obtenir.
2.2 Effets de taille finie Les lois d’échelle ont déjà été étudiées dans les chapitres précédents et nous y reviendrons. Résumons-les ici dans l’optique présente. Nous considérons un système dans un volume Ld dépendant d’une seule échelle L (on peut aussi généraliser à des tranches ou des barreaux). I1 nous faut
VIII.2.2
SIMULATIONS NUMERIQUES
69
1 0
O8
cv 06
O1
O2
0.0
Figure 6 : La chaleur spécifique du modèle d’Ising sur des réseaux de taille croissante. La courbe en pointillé est l’estimation de la limite thermodynamique (d’après K. Binder, Physica 6 2 508 (1972)). tenir compte à la fois du déplacement de la température “critique” T,(L) et de celui des différents exposants y(L), . . .. On fait l’hypothèse que la susceptibilité se comporte comme
Pour un système fini toutes les quantités sont bien sûr régulières et il est incorrect stricto sensu d’utiliser le terme de température critique. Nous le définissons cependant ici comme la valeur correspondant au maximum de X L . Ceci signifie donc que l’exposant s’annule. Dans d’autres cas comme celui des tranches ou de barreaux, il peut y avoir un exposant y(L) non trivial. Par exemple dans le cas d’une tranche, quand la taille de l’échantillon est très grande dans d - 1 dimensions et peut être considérée en pratique comme infinie relativement à la dernière direction, y(L) interpole entre la valeur y(m) du système thermodynamique à d dimensions et y* = y(1) du système à ( d - 1) dimensions. T,(w), la longueur de Lorsque la température s’approche de T, corrélation croît d’abord selon la loi de puissance attendue t;”, jusqu’à ce qu’elle devienne de l’ordre de LI où les effets de taille finie commencent à l’emporter. Le déplacement de la température critique peut donc être estimé en supposant L N <, et son comportement est de la forme
<
70
SIMULATIONS NUMERIQUES
VIII.2.2
On s'attend par conséquent à ce que la seule variable qui gouverne le système,.outre la température, soit le rapport LI< N Lt', ce qui conduit à la loi d'échelle (Fisher 1969)
Une analyse générale confirme cette hypothèse en dimension inférieure à la dimension critique supérieure (chapitre IV, volume 1). On vérifie explicitement que cette loi s'applique dans certains cas solubles et on peut l'observer dans des simulations numériques très précises en basse dimension. Lorsque, dans la fonction ci-dessus, l'argument x tend vers l'infini, on doit retrouver le comportement critique du système infini, correspondant à L + 00. Ceci conduit, aux contraintes suivantes sur la fonction X ( z )
et
Inversement, à L iixé, le comportement de X ( s ) à s = O est gouverné par l'équation (25), et l'on trouve
X - ( s ) z ~ A(L)L(Y(L)-Y)/"s-Y(L) o
(30)
Dans le cas d'un système fini, y ( L )s'annule et X ( 0 ) est fini. On prédit donc que la hauteur du pic dans la susceptibilité est gouvernée par
Les relations (26) et (31) sont capitales pour obtenir les exposants critiques avec une précision raisonnable à partir de données semblables à celles de la figure 6. Dans les lois d'txhelle précédentes on ne tient pas correctement compte de divergences de type logarithmique x lnt. Généraliser la discussion pour incorporer un tel comportement logarithmique. La formule (27) doit être soustraite à une temjkrature fixe 2'0, en écrivant par exemple N
On en déduit que la hauteur du pic varie logarithmiquement.
VIII.2.2
SIMULATIONS NUMERIQUES
71
La même technique permet d’extraire des informations sur les énergies d’interface. Suposons par exemple des conditions au bord antipériodiques dans une direction. I1 apparaîtra une interface à température assez basse (une surface perpendiculaire à des liens frustrés), d’aire S ( L ) = L d - l , d’ordre 1/L par rapport au volume V ( L ) = L d . L’énergie libre peut être écrite asymptotiquement
+
+
F(T’L ) = V ( L ) F m ( T ) S(L)F,(T) O (l/L2)
(33)
où .Fm(T)est l’énergie libre par unité de volume du système infini et F,(T) l’énergie libre d’interface par unité d’aire. En principe les singularités de ces fonctions sont différentes’ mais si la loi d’échelle (27) s’applique, on peut les relier de la manière suivante. Ecrivons en effet un terme supplémentaire dans le développement (28)’ à IC grand, de la fonction d’échelle correspondant à la chaleur spécifique, en substituant à y l’exposant (Y et à w la quantité ( Y / Y . I1 vient
X(z) = X,Z?
+ Y,IC+ + . . .
(34)
Insérons ce résultat dans la formule (33). On en tire l’exposant a , relatif à l’énergie libre d’interface
a, = Jq! = a + u = 2 - u ( d - 1)
(35)
Trouver les inégalités qui doivent être satisfaites par les exposants pour que les développements précédents aient un sens. On trouve en particulier 0 2 1 (v < 1). Dans le cas logarithmique limite 0 = 1, on peut estimer l’amplitude de A s ( c o ) . Pour des valeurs 0 < 1 , équivalentes à l’existence de forces à longue portée, on ne pourrait plus séparer les termes de volume des termes de surface.
Dans la pratique, lorsqu’on procède à la détermination des exposants à partir des données numériques’ le paramètre le plus sensible est la température critique. Une erreur sur cette quantité induit des variations importantes sur les autres grandeurs critiques. Les lois d’échelle introduisent des contraintes qui améliorent la situation. Cependant la méthode décrite cidessus, qui implique des mesures très précises sur des échantillons de taille aussi grande que possible, conduit à des simulations très onéreuses. Dans ces conditions, il est heureux qu’une autre méthode très ingénieuse ait été développée pour traiter efficacement le régime critique.
2.3 Méthode d e renormalisation Monte Carlo Nous avons donné au chapitre IV du premier volume une description des aspects élémentaires du groupe de renormalisation dans l’espace de configuration. La technique des blocs de spins semble particulièrement bien
72
!SIMULATIONS NUMERIQUES
VIII.2.3
adaptée aux simulations numériques. Nous considérons maintenant sa mise en pratique, en rappelant d’abord les formules qui sont nécessaires dans le traitement des systèmes du type Ising. Choisissons un ensemble d’opérateurs { X a }, aussi petit que possible, pour des raisons pratiques, afin de permettre les simulations les plus rapides, et aussi grand que possible pour des raisons théoriques afin de donner l’action la plus générale, dans le cadre d’interactions de courte portée possédant la symétrie voulue. L’action s’exprime comme une superposition de termes en X , avec un ensemble {g,} de constantes de couplage
Les variables de bloc p i ( { a } ) ,définies en utilisant par exemple la règle majoritaire
sont aisées à déterminer dans un traitement numérique. Si la somme des variables d’un bloc s’annule, pi est choisi aléatoirement. Les deux ensembles { p i } et {ai} décrivent la même situation physique à des échelles distinctes dont le rapport X est celui de la taille des blocs. Rappelons qu’alors les deux actions correspondantes satisfont à la relation
En pratique cette relation n’est qu’approchée puisque, par nécessité, l’ensemble des termes X , est fini. Le point fixe g: de la transformation g(O) + g ( ’ ) est le point, critique. Dans son voisinage on peut linéariser la transformation
La méthode de renormalisation Monte Carlo (Swendsen, Wilson) donne directement accès à la matrice T plutôt qu’aux valeurs renormalisées des couplages après décimation. Ceci permet un calcul très précis des exposants critiques sans avoir à déterminer a priori la température critique (ou les couplages critiques). Si on revient à la discussion du chapitre IV et à la figure IV.2, on se souvient que l’approche au point critique dépend de la grandeur des valeurs propres de la matrice T relativement à l’unité. Dans la base qui diagonalise T , les opérateurs essentiels sont ceux qui correspondent aux
VIII.2.3
73
SIMULATIONS NUMERIQUES
valeurs propres plus grandes que un. Les constantes de couplage associées auront un flot de renormalisation qui s’écarte du point fixe. En particulier la température correspond à la plus grande valeur propre ymax dans le secteur pair et la température réduite satisfait à
Si on tient compte du fait que la relation entre longueurs de corrélation s’écrit
I
on déduit du comportement (
-
t-” que l’exposant critique
y=-
u
a la forme
In X ln Ymax
Pour calculer les autres exposants, par exemple y, il faut introduire un champ extérieur (c’est-à-dire plus généralement des opérateurs X, impairs). } voisines de la Pratiquement, on engendre des configurations { d o )très température critique. On détermine alors les configurations après décimation {CJ!~) = p i ( { d k - ’ ) } ) } et on mesure les valeurs correspondantes XLk) des opérateurs X,. Après moyenne statistique sur des configurations { d o ) } indépendantes, on obtient les quantités
On en déduit alors la matrice T en récrivant l’équation (38) sous la forme
Insistons sur le fait essentiel, qui est la possibilité d’accéder directement aux exposants sans avoir besoin d’une estimation très précise de la température critique, les coefficients de la matrice T étant des fonctions régulières des couplages. On poursuit l’étude numérique en examinant la stabilité relativement au nombre de décimations. On a aussi un contrôle sur l’écart au point critique. Si les résultats ne sont pas assez stables, l’ensemble {X,} est insuffisant et doit être modifié. Nous présentons ci-dessous les données obtenues par Swendsen pour le modèle d’king bidimensionnel. L’ensemble des opérateurs choisis est le suivant
74
SIMULATIONS NUMERIQUES
Opérateurs pairs 1- Proches voisins 2- Seconds voisins ( i l ) 3- Quatre spins aux coins d’une plaquette 4- Troisièmes voisins (20) 5- Quatrièmes voisins (21) 6- Quatre spins aux coins d’un rectangle 7- Cinquièmes voisins (22)
VIII.2.3
Opérateurs impairs 1- Un spin couplé au champ magnétique 2- Trois spins voisins aux coins d’une plaquette 3- Trois spins alignés 4- Trois spins ( 0 0 ) , (io), (21)
Les symboles (10)’ (11)’. . ., désignent les coordonnées relatives des spins en interaction. On part d’un réseau de taille 64 x 64 et du seul couplage entre proches voisins iixé à sa valeur critique connue. Sur les tables Ia et Ib, on a fait figurer les exposants dominant et sous-dominant en l’absence de champ extérieur (on ne considère que des opérateurs pairs). Les valeurs exactes attendues sont 2 - Y = 1 et -1. Le nombre d’opérateurs introduits croît le long de la verticale. On constate qu’un seul couplage est insuffisant et que l’introduction de plus de deux termes ne produit pas d’amélioration sensible dans la table Ia. En revanche on voit dans la table Ib qu’il est nécessaire d’accroître le nombre de couplages pour obtenir une évaluation précise de l’exposant du terme sous-dominant. Bien entendu cet exemple est très favorable, encore que l’on s’attende plus généralement à ce que la méthode s’applique avec un petit ensemble de couplages bien choisis. Le nombre d’itérations (par blocs 2 x 2) varie dans la direction horizontale. L’instabilité du flot est apparente sur la partie droite de la table. Elle est diie ici à des effets de taille finie, mais dans un cas plus général elle pourrait correspondre aussi à un écart à la température critique. La table IC présente une analyse similaire relative à l’exposant magnétique (ici la dimension du champ magnétique esl, 2 - ,LI = 1.875) impliquant les opérateurs impairs, analyse à laquelle s’appliquent des commentaires analogues. On poursuit l’étude en modifiant la taille du réseau (les résultats, qui ne sont pas donnés ici, confirment la validixé de la méthode). On peut encore tester la technique en utilisant les mêmes données, et en considérant deux itérations consécutives comme une seule décimation d’un facteur X2. Si on constate des différences significatives, on en conclura que certaines interactions que l’on a négligées sont en f a t importantes (inversement, remarquons qu’un bon accord ne signifie malheureusement pas que la méthode soit nécessairement correcte). (i) On n’a pas inclus les effets de taille finie dans la discussion précédente. Ceci peut être fait L l’aide d’une procédure un peu plus complexe. Cette dernière implique deux simulations indépendantes sur deux réseaux dont la taille diffère par un facteur A. Les constantes de couplage sont ajustées de telle sorte que la ( n$. 1)-ième décimation sur le plus grand réseau et la n-ième sur le plus petit donrient des valeurs identiques pour les valeurs moyennes des
VIII.2.3
75
SIMULATIONS NUMERIQUES
(a) 1 2 3 4 5 6 7
1 0.912( 2) 0.967( 3) 0.968( 3) 0.969(4) 0.969(4) 0.969( 3) 0.969( 5)
2 0.963(4) 0.999(4) 1.O01(4) 1.002(5) 1.001(5) 1.001(5) l.OOO(5)
3 0.957(2) 0.998(2) 0.999(2) 0.999(2) 0.997(2) 0.997( 2) 0.997(2)
4 0.940( 7) 0.993(6) 0.992( 6) 0.988( 5) 0.990( 5) O. 988(5) 0.984(4)
(b)
1 -2.19(3) -2.17(3) -1.11(3) -0.94(3) -1.04(3) -1.08(21)
2 -2.20(4) -2.34(6) -1.14(3) -0.94(3) -1.04(3) -1.03(4)
3
2 3 4 5 6 7
-2.20(3) -2.56(6) -1.16(3) -0.91(2) -0.98(2) -0.99(20)
4 -2.32(8) -2.56(22) -1.35(20) -0.80(8) -0.84(9) -0.76(20)
(cl 1 2 3 4
1 1.8810(1) 1.8804(1) 1.8806(1) 1.8808(1)
2 1.8757(2) 1.8758(2) 1.8758(2) 1.8759(2)
3 1.8731(4) 1.8740(4) 1.8740(4) 1.8741(4)
4 1.8706(5) 1.8735(7) 1.8732(8) 1.8737(9)
’
Table I : Détermination des exposants pour un système d’king bidimensionnel sur un réseau de taille 64 x 64 à l’aide de la méthode de renormalisation Monte Carlo, d’après Swendsen. Les erreurs sur le dernier chiffre sont indiquées entre parenthèses. ( a ) Exposant thermique dominant. ( b ) Exposant thermique sous-dominant. ( c ) Exposant magnétique. quantités X,. Comme les grandeurs physiques doivent être égales, les effets de taille finie sont identiques et disparaissent du résultat final. (ii) Différentes améliorations ont été proposées. Décrivons ici une version } engendrées avec un poids (Gupta et Cordery) où les configurations { u ( ~ )sont
avec u p =pi({#)})
dépendant des variables de blocs. Les constantes de couplage 9:’) de l’action décimée sont remplacées par des valeurs approximatives g a . L’avantage de cette méthode est que l’introduction de couplages à la fois pour les sites et pour les blocs diminue les corrélations temporelles à longue portée dues à la divergence de la longueur de corrélation. Si l’approximation était exacte, les variables de bloc seraient non corrélées
76
SIMULATIONS NUMERIQUES
VIII.2.3
(xp) = O
(45)
S’il n’en est pas ainsi, on a au premier ordre
de telle sorte qu’il esi possible de déterminer les couplages renormalisés sans erreur de troncation
La procédure peut être itérée. Si les valeurs propres de T, correspondant aux opérateurs inessentiels, sont suffisamment petites, on atteint l’action correspondant au point fixe en deux ou trois itérations. La détermination des exposants est alors poursuivie comme ci-dessus.
2.4 Equation de Langevin Nous avons déjà souligné l’importance de la dynamique engendrant le processus de Markov qui sous-tend la méthode de Monte Carlo. Mais nous ne nous sommes pas étendus sur le sujet qu’il est difficile d’analyser théoriquement. I1 a été suggéré d’employer une méthode engendrant les configurations selon un schéma dynamique plus aisé à contrôler. La méthode de quantification stochastique utilise les équations classiques du mouvement complétée par un terme additionnel engendré par un bruit blanc. Cette iEchnique a des app1ic;itions intéressantes à la détermination des fonctions de corrélation et aux simulations fermioniques. Elle trouve son origine dans une proposition de Parisi et Wu Yong Shi destinée à s’affranchir d’un choix de jauge dans les théories invariantes locales. Considérons un modèle général, correspondant à l’action S[cp]. L’évolution classique des champs soumis à un bruit additionnel dépendant du temps q ( t ) est décrite par l’équation de Langevin
Le premier terme tend à attirer le système vers son point d’équilibre classique. Le terme d’excitation est pris comme une variable gaussienne (77i(t)) =O
(%(t)7lj(t’))=azjqt - t’)
(49)
...
La notation (.) repréernte ici la moyenne stochastique sur le bruit. Nous surlignerons les quantités obtenues comme valeurs moyennes sur les champs.
VIII.2.4
SIMULATIONS NUMERIQUES
77
La loi de probabilité P(cp,t ) relative aux configurations des champs satisfait alors à une équation de Fokker-Planck qui résulte aisément de (48)’ à savoir
a
6
[
“1
6s
t )+ 2
-P(cp, t ) = - --P(cp, at 6vi 6vi
6P(cp @i
Dans la limite stationnaire P = O, on retrouve le poids de Boltzmann habituel exp S. De la sorte, toute observable A satisfait à
( A )t--t- i w A
(51)
Dans le cas d’une action possédant des symétries, en particulier par un groupe local, le résultat précédent ne s’applique qu’à la partie invariante des opérateurs A. Les composantes “longitudinales” (c’est-à-dire, en particulier, celles qui correspondent à des transformations de jauge) ne sont soumises qu’au bruit blanc. I1 s’ensuit qu’elles effectuent une marche au hasard et leur valeur (quadratique) moyenne diverge comme le temps t (chapitre I). Cette divergence n’influe pas bien entendu sur la mesure des quantités invariantes. Ces propriétés sont à l’origine de la proposition initiale, et sont encore valables dans le contexte d’une théorie des champs continue.
I1 est en principe aisé de mettre en œuvre une simulation de l’équation de Langevin. En effectuant des tirages au hasard du bruit qi(t) on suit l’évolution d’une configuration { c p } à l’aide des équations dynamiques. Les valeurs moyennes des observables se déduisent alors des moyennes temporelles
1 t
A = lim
t-*w
t
dtA
Cependant, comme dans toute simulation numérique, il est nécessaire de discrétiser le temps. Si E désigne le pas temporel élémentaire, on écrira une version discrète de l’équation de Langevin sous la forme
Nous avons utilisé une variable réduite I- = t / &et modifié l’échelle de 77 d’un facteur de telle sorte que les nouveaux soient des variables gaussiennes normales indépendantes
JE,
Le temps de calcul nécessaire est proportionnel à .E-’. I1 est donc intéressant de choisir E aussi grand que possible, ce qui nous amène à examiner l’effet de la discrétisation temporelle. En particulier, la loi de probabilité limite des champs ne sera plus exp S mais un poids de Boltzmann
78
SIMULATIONS NUMERIQUES
VIII.2.4
modifié exp S‘ impliquant une nouvelle action effective SI. En dérivant l’analogue de l’équation (50) dans le cas discret, et en développant jusqu’au premier ordre en E , on obtient une nouvelle équation de Fokker-Planck continue correspondant à
I1 est possible de redéfinir les champs de teIle sorte que le terme quadratique dans le coefficient de E s’annule en posant
Dans une théorie en Xp4, cet effet s’interprète à cet ordre comme un terme de masse additionnel na2 + m2+ +XE. Des termes inessentiels affectent aussi la constante de couplage nue. (i) Cette technique est difficile à mettre en pratique dans le cas des champs de jauge purs de groupe S ü ( n ) en raison de la structure non triviale de la variété des champs. L’équation du mouvement stochastique qui remplace (48) s’applique à un élément de l’espace tangent, c’est-à-dire de l’algèbre de Lie. Soient ta les générateurs de cette algèbre, tels que [ta,to] = if,o7tr et Trt,tp = fr6,p. Si a,, désigne la dérivée par rapport au paramètre conjugué de ta dans le groupe. l’équation de Langevin discrétisée la plus simple s’écrit
où H. est une matrice hermitienne aléatoire satisfaisant à
Après quelques transformations, cette équation du mouvement discrète conduit à une équation de Fokker-Planck à la limite continue de la forme
VIII.2.4
SIMULATIONS NUMERIQUES
79
Cette formule peut à nouveau s’interpréter comme une renormalisation des champs accompagnée d’une modification du couplage, qui s’écrivent
p -p
(1 -
(ii) Est-il possible de trouver une meilleure discrétisation de l’équation de Langevin de sorte que l’erreur soit d’ordre supérieur à E?
3. Simulations fermioniques Les intégrales grassmanniennes ont été définies par leurs propriétés algébriques et ne peuvent être calculées comme des intégrales usuelles. I1 n’existe pas de méthode permettant d’explorer stochastiquement le domaine d’intégration, et l’existence d’une “puce grassmannienne” (comme élément d’un ordinateur) demeure à ce jour une plaisanterie. En d’autres termes il est impossible de simuler les fermions à l’aide d’une méthode Monte Carlo directe et il faut effectuer les intégrales grassmanniennes en retournant à leur définition (chapitre II, volume 1).Les simulations numériques ont donc pour tâche d’estimer les déterminants ou les inverses d’énormes matrices, dans les meilleurs cas où l’on est parvenu à ramener à une forme quadratique la partie fermionique de l’action. La chromodynamique quantique est l’un des domaines où il est nécessaire de procéder à des simulations impliquant des variables fermioniques. A ce jour les programmes correspondants sont extrêmement lourds et coûteux et atteignent les limites des capacités des ordinateurs. La discussion qui va suivre risque donc de ce fait de n’avoir bientôt qu’un intérêt historique. Nous allons nous limiter au cas de théories de jauge sur réseau. Considérons un modèle où les champs bosoniques, c’est-à-dire les variables de liens U ,et les champs fermioniques qi, qi, ont des interactions dictées par l’action
où n’apparaissent que des termes quadratiques dans les fermions. I1 est généralement possible de se ramener à ce type, même dans le cas de modèles plus complexes tel le modèle de Gross-Neveu (voir chapitre X) au prix de l’introduction de champs bosoniques auxiliaires. Dans la discussion qui va suivre la présence d’indices supplémentaires, décrivant les degrés de liberté de saveur ou les composantes spinorielles, ne change rien à l’essentiel. Si on effectue les intégrales grassmanniennes, on trouve que les champs de jauge évoluent selon une action effective
80
SIMULATIONS NUMERIQUES
VIII.3
S,ff(U) = S,(U) + ln d e tD( U )
(63)
On conçoit que la nécessité d’obtenir la valeur du déterminant crée une difficulté additionnelle dans l’application de la méthode Monte Carlo. Son caractère non local introduit en outre des interactions à longue portée. Même lorsqu’on a réussi à engendrer les configurations selon la distribution statistique voulue, une autre difficulté se présente dans la mesure des observables impliquant des champs fermioniques. Nous avons en effet
Le problème est donc d’obtenir la matrice inverse D(U)-’ dépendant de la configuration {U}, qui apparaît dans les moyennes fermioniques. Dans un premier temps on se limite à une approximation qui simplifie énormément les simulations et qui revient à négliger les paires de quarks virtuels.
3.1 Approximation des variables fermioniques gelées L’hypothèse la plus violente consiste à décréter que le terme en lndet D ( U ) dans (63) n’a que peu d’influence sur la distribution des configurations des champs de jauge, du moins en un sens qualitatif, et même semi-quantitatif (on parle alors d’“approximation gelée”, en sous-entendant les variables fermioniques). L’intérêt pratique de cette hypothèse est évident, puisqu’elle évite d’évaluer (répétitivement) le déterminant, opération fort longue. Un autre intérêt (qui pourrait cependant être un défaut) est que l’action effective devient indépendante des détails du modèle fermionique (choix de la discrétisation de ces variables, nombre de saveurs, masses nues des quarks, etc...]. Ainsi les mêmes configurations peuvent être utilisées tout en modifiant les paramètres et les caractéristiques de la partie fermionique du modèle (qui interviennent cependant dans le calcul des moyennes des observables telles que celles qui sont décrites par les équations (64b)( 6 4 ~ ) )On . peut de la sorte effectuer des comparaisons précises sans erreurs statistiques. L’approximation gelée revient à découpler les paires de quarks virtuels comme s’ils avaient de très grandes masses. En effet, si l’on sépare le propagateur des quarks en une contribution cinétique et une contribution
VIII.3.1 massive, D ( U ) = A ( U ) l’action effective s’écrit
SIMULATIONS NUMERIQUES
81
+ m, et si on effectue un développement en l / m ,
i
Figure 7 : les deux termes qui interviennent dans la détermination de la masse des mésons.
à un terme additif près sans intérêt. On voit que le déterminant est en apparence négligeable lorsque m tend vers l’infini. Cet argument naïf néglige bien entendu les effets de renormalisation et peut être franchement faux dans le cas d’anomalies. Ces dernières correspondent précisément au cas où la combinaison d’un coefficient qui tend à s’annuler (une puissance inverse de m ) et un terme divergent conspirent pour engendrer un ou plusieurs termes finis dans le développement précédent. Ignorons cependant cette possibilité ici. I1 n’en reste pas moins que l’approximation gelée devient douteuse dans les cas où on s’attend à ce que la création (et l’annihilation) de paires virtuelles joue un rôle important. Considérons par exemple le propagateur mésonique ( ( & q i ) ( q j q j ) ) .Les deux termes du membre de droite de l’équation (64c) sont représentés schématiquement sur la figure 7. Le diagramme ( b ) engendre des boucles par itération, de sorte que sa contribution est fortement reliée aux termes négligés dans l’approximation gelée. Cependant la contribution de ce terme s’annule dans de nombreux cas d’intérêt en raison de règles de sélection sur le moment angulaire ou les nombres quantiques internes; il en est ainsi lorsqu’on étudie le propagateur des mésons p et 7 r . I1 est néanmoins important dans des cas tels que celui du méson q qui est un singulet du groupe de saveur (ce cas fait aussi intervenir l’anomalie mentionnée ci-dessus). Ces états ayant une masse relativement élevée, on peut supposer que l’approximation gelée est raisonnable dans la spectroscopie des mésons les plus légers 7 r , p, K , K * , etc, ainsi que des baryons légers N , A, A, C, etc.
82
SIMULATIONS NUMEFUQUES
VIII.3.1
La formule ( 6 5 ) fournit un procédé systématique pour évaluer les corrections en i / m à l’approximation gelée. Le développement correspondant dit en paramètre d e saut reste difficile à employer et n’a pas fourni jusqu’ici des améliorations très sensibles.
Les simulations utilisant l’approximation gelée ne peuvent se passer de l’évaluation de la matrice inverse G = D(U)-’. En pratique cette évaluation consomme une part importante du temps de calcul. Deux remarques permettent de simplifier cette inversion de matrice. Tout d’abord il est en général suffisant de calculer une seule colonne de la matrice G . En effet, dans la plupart des applications on cherche à obtenir les masses des mésons ou des baryons à partir de la loi de décroissance des corrélations ((Qiyq,)(ijjyqj))et ( ( & Q i i j i ) ( q j q j q j ) ) , symboliquement, en gardant l’indice i fixe et en faisant varier j. En second lieu la matrice D est maigre en ce sens qu’elle ne fait intervenir que des termes entre proches voisins. De ce fait la multiplication par cette matrice est peu coûteuse. Ces propriétés peuvent être mises à profit dans des techniques itératives. Dans la méthode de Gauss-Seidel, applicable à une matiice positive définie D , on considère la suite
Ces équations se découplent pour chaque colonne de G , et l’on espère atteindre le point fixe de la suite, G = D - l , si E est suffisamment petit. On étudiera les propriétés de convergence de cette suite dans une base qui diagonalise D et cm montrera que dans des simulations de champs de jauge effectuées à des valeurs de 0 assez grandes, la convergence est assurée pourvu que E < Cstm, c’est-à-dire en pratique pour des masses de quark élevées. Le nombre d’itérations iiécessaires pour atteindre une précision fixée à l’avance croît comme l / m pour des masses de quark faibles. On peut apporter diverses améliorations. Par exemple on pourra utiliser une procédure de relaxation du second ordre
en ajustant empiriquement les valeurs de E et p pour obtenir une convergence plus rapide. La valeur p = f de la méthode de Runge-Kutta est théoriquement la meilleure pour assurer une approche vers la limite désirée, mais des valeurs légèrement supérieures de ce paramètre fournissent des suites par excès pour un temps assez long et donnent de ce fait des meilleurs estimations quand on n’utilise qu’un petit nombre d’itérations. Une autre amélioration utilise les valeurs { G ( n )- G ( n - l ) } pour estimer les erreurs et donc la meilleure valeur à choisir pour E à l’étape suivante de l’itération. Ceci conduit à ce qu’on appelle la méthode du gradient conjugué.
VIII.3.2
SIMULATIONS NUMEFXQUES
83
3.2 Fermions dynamiques Allons maintenant au-delà de l’approximation grossière de la soussection précédente et analysons les techniques disponibles en pratique pour traiter l’action non locale complète (62). Par bonheur dans l’algorithme Monte Carlo de réactualisation, il n’est pas nécessaire de calculer chaque fois l’action complète (62). Seule sa variation SSe, est en réalité requise lorsqu’on fait varier un champ U +
U + S U . On a
de sorte qu’on retrouve le problème d’estimer G = D(U)-’. Ce calcul se présente maintenant à de nombreuses reprises, non seulement dans la mesure des observables comme c’était déjà le cas précédemment, mais aussi à chaque pas de réactualisation. Les méthodes les plus directes sont celles qui ont été présentées ci-dessus. Elles sont malheureusement très coûteuses. I1 existe cependant une méthode, dite des pseudwfermions, qui introduit des variables bosoniques complexes auxiliaires {pi} (les pseudo-fermions) et qui se fonde sur l’identité
Cette expression est évaluée par une méthode statistique grâce à une simulation Monte Carlo ordinaire portant sur les variables cp. Si la matrice D n’est pas définie positive, les intégrales (69) perdent leur sens. On s’affranchira de ce problème en utilisant une action pseudofermionique p i D t D
Nous avons maintenant affaire à deux simulations Monte Carlo, celle relative aux pseudo-fermions s’insérant à l’intérieur de celle pour les champs de jauge. En principe SS,, doit être calculée chaque fois à l’aide d’un champ de jauge réactualisé et l’algorithme des pseudo-fermions peut se révéler assez lent. A l’heure actuelle on ne calcule SSe, qu’une seule fois à la fin d’un balayage complet du réseau. Cette approximation est supposée suffisamment précise pourvu que ôU reste assez petit. Etendre la méthode de quantification stochastique pour prendre en compte les fermions et généraliser la formule (58) en y incluant l’effet du déterminant.
84
SIMULATIONS NUMERIQUES
VIII.3.3
3.3 Spectre hadronique Nous concluons ce chapitre par une rapide revue des tentatives pour prédire le spectre de niasse des particules “élémentaires” légères à partir des simulations numériques de la chromodynamique quantique sur réseau. Rappelons d’abord quelques détails du modèle. Les interactions fortes sont décrites par une théorie de jauge SU(3) des degrés de liberté de couleur qui couplent plusieurs familles de quarks. Nous nous bornerons ici aux hadrons légers d’étrangeté nulle et ne retenons donc que les quarks de masse la plus faible. Ces derniers forment un doublet isotopique pour le groupe de saveur SU(2). Les particules observées sont des états liés singulets de couleur en raison du confinement des quarks. Les opérateurs créant ces particules sont selon toute vraisemblance non locaux. Cependant comme ils possèdent une composante locale n’impliquant que des champs de quarks évalués au même point, on n’étudie pour simplifier que les longueurs de corrélation des produits d’opérateurs correspondants, qzqz pour les mésons, qzqzqz pour les baryons. On couple les indices spinoriels et d’isospin de manière à produire des états de nombres quantiques bien définis, en tenant compte des limitations imposées par le groupe ponctuel fini du réseau. Par exemple le méson T pseudo-scalaire d’isospin 1 est étudié à l’aide de l’opérateur qzZy5Tq,, où T désigne l’ensemble des trois matrices 2 x 2 de Pauli agissant sur les indices d’isospin des quarks. Nous indiquons dans la table II les principitles caractéristiques des particules les plus légères dépourvues d’étrange%. Une étude plus complète doit bien entendu inclure les quarks lourds et e n particulier le quark étrange qui figure dans des particules porteuses d’étrangeté relativement légères comme le méson K , doublet isotopique pseudo-scalaire (495 MeV). Dans la spectroscopie des hadrons légers, la chiralité joue un rôle important bien qu’il ne s’agisse que d’une symétrie approximative. Dans la limite où la masse des quarks s’annule, le théorème de Goldstone prédit que le pion a une masse nçlle. Sa masse très faible (139MeV) en comparaison de la valeur typique de l’ordre de 1GeV pour les autres particules, ainsi que la vérification expérimentale des prédictions de l’algèbre des courants, montrent l’importance de la brisure spontanée de l’invariance chirale. Les simulations Monte Carlo sont actuellement effectuées à l’aide de l’action fermionique de Susskind (VI.157) ou de celle de Wilson (VI.150). On se souvient que la première possède une symétrie chirale discrète et on s’attend dans ce cas à ce que la masse du pion s’annule avec la masse du quark. La figure 8 montre une vérification de ce comportement. Lorsqu’on utilise l’action de Wilson, l’invariance chirale est explicitement brisée par la régularisation due au réseau, mais on espère la retrouver à la limite continue. Si T désigne le paramètre qui figure dans cette action, cette limite de masse nulle ne se produira pas à la valeur naive 1/2dr du paramètre de saut K = 1 / [ 2 ( m u + d r) ]lorsque la maille u tend vers zéro, en raison des effets de la renormalisation sur la masse du quark. Ces effets ne
VIII.3.3
SIMULATIONS NUMERIQUES
Particule
85
P ( J ~ ) CMasse (MeV) 1-(O-)+ 1+(1-)O-(1-)O+ ( O - ) + 1-(1+)+ 1+(1+)1-(O+) O+ (Of)+
139 770 783, 1020 549, 958 1270 1235 980 975
i (:+)
939
$ ($+)
1232
Table II : Caractéristiques expérimentales des particules légères. Nous y faisons figurer I’isospin I, la G-parité selon le cas, le spin J , la parité P et la conjugaison de charge C. Le contenu en quark est indiqué dans la dernière colonne pour les états mésoniques.
I
Figure 8 : ( u ) Masses des états hadroniques légers dans un modèle utilisant l’action fermionique de Susskind, en fonction de la masse du quark. ( b ) La masse du pion en fonction de la racine carrée de celle du quark; le comportement linéaire est celui prédit par l’invariance chirale (d’après D. Barkai, K.J.M. Moriarty and C. Rebbi, Phys. Lett. 156B,385 (1985)).
86
VIII.3.3
SIMULATIONS NUMERIQUES
sont pas contrôlés par défaut de symétrie chirale. La valeur critique deviendra K, et l’invariance chirale sera restaurée lorsque le paramètre K tend vers K, par valeurs infkrieures. C’est bien ce qu’on observe sur la figure 9, où le point critique correspond à l’annulation de la masse du pion.
ma
I
.I
6.6
6 .I
I
1.0
I
2
Figure 9 : Masses hadroniques en fonction de l’inverse du paramètre de saut dans une simulation utilisant l’action de Wilson (d’après S. Itoh, Y. Iwasaki et T. Yoshie, Phys. Lett. B167,443 (1986)). Les simulations Monte Carlo étant très onéreuses, elles ne sont effectuées intensivement que pour une valeur fixée du couplage de jauge PJ. On est confronté dans le choix de ce paramètre à deux contraintes contradictoires. La première est de prendre ce couplage aussi faible que possible pour assurer une convergence rapide et éviter d’utiliser un trop grand réseau (l’échelle de la maille décroît lorsque BJ croît en raison de la liberté asymptotique) qui est lui aussi un facteur de coût. La seconde contrainte requiert un choix de couplage aussi grand que possible dans une plage où se manifeste l’invariance d’échelle pour permettre un passage au langage de la théorie continue et utiliser les expressions relatives à la liberté a sy m p te tique. Malheureusement’ au moment où nous écrivons ces lignes, on n’a pas encore effectué d’étude intensive de la limite continue en tenant compte des degrés de liberté fermioniques. Rappelons que dans la région continue on s’attend à ce que les masses restent constantes dans l’échelle AL donnée par (V1.31). Dans le cas SU(3) les formules (VI.22)valables pour une théorie de jauge pure doivent être modifiées selon
VIII.3.3
SIMULATIONS NUMERIQUES
87
où Nf est le nombre d’états fermioniques de saveur, deux dans le cas présent. Ce nombre ne peut excéder 16 pour respecter la liberté asymptotique (bo > O ) . Etant donné l’absence de confirmation numérique des propriétés d’invariance d’échelle en présence des fermions, on fait l’hypothèse que la plage dans laquelle cette invariance se manifeste est la même que dans le cas de jauge pure. Les données sur la tension de corde (voir la figure 16 du chapitre VI) donnent une borne inférieure PJ 2 5.7. Jusqu’ici les simulations ont été faites pour des valeurs PJ = 5.7 ou 6 . Ces choix sont peut-être trop optimistes. I1 est important de vérifier que les diverses formulations sur réseau du même modèle continu donnent des résultats compatibles. On présente m ~ fonction de m x / m pd’après une sur la figure 10 le rapport m ~ / comme compilation de diverses simulations. Cette figure illustre l’état de la question jusqu’à 1987 en montrant en outre les barres d’erreur. Avec de telles erreurs, toutes les données sont compatibles. Cependant les simulations effectuées à PJ = 6 et dans l’approximation gelée sont systématiquement inférieures à la ligne pointillée, tandis que celles effectuées à 5.7 sont au-dessus de cette ligne. Ceci semble indique qu’on n’a pas encore réellement atteint le régime asymptotique.
I
1.0
1, .. -. .. .
l.21,
,
,
I
,
,
I
,
m.lm.
0.2
O.&
0.6
0.1
1.0
Figure 10: Relation entre la masse du pion et celle du nucléon exprimées en terme de la masse du p, selon diverses simulations (d’après Bowler et al, Phys. Lett. 162B, 354 (1985)).
88
SIMULATIONS NUMERIQUES
VIII.3.3
En conclusion, l’échantillon limité que nous avons présenté parmi les résultats numériques très nombreux obtenus par plusieurs groupes, démontre un accord qualitatif remarquable avec le spectre physique. On s’attend donc à ce que des simulations plus complètes incorporant les degrés de liberté fermioniques confirmeront le rôle de la chromodynamique quantique comme théorie des interactions fortes.
Notes La première proposition pratique de simulation Monte Carlo est due à N. Metropolis, A.W. Rosenbluth, M.N. Rosenbluth, A.H. Teller et E. Teller, J. Chem. Phys. 21, 1087 (1953). On trouvera une revue générale de la méthode dans la contribution de K. Binder, Monte Carlo Investigations of Phase Transitions and Critical Phenomena dans la série Domb et Green, vol. 5B, Academic Press, New York (1976). Les applications aux théories de jauge sont discutées par M. Creutz, L. Jacobs et C. Rebbi, Phys. Reports 95 201 (1983). On trouvera des indications complémentaires dans Advances in Lattice Gauge Theory, D.W. Duke et F.J. Owens eds, World Scientific, Singapore (1985). Voir aussi la série “Topics in current physics”, Monte Carlo Methods in Statistical Physics, vol. 7 (1979) et Applications of the Monte Carlo Method, vol. 36 (1984)’ K. Binder ed., Springer Verlag, Berlin. Les algorithmes généraux intervenant dans les simulations numériques font l’objet du livre de D. Knuth, The art of Computer Programming, AddisonWesley, Reading (1973), dont le second volume discute en particulier les générateurs de nombres aléatoires. Pour une discussion du ralentissement critique, voir L. Van Hove, Phys. Rev. 93 268 (1954) et la revue de P.C. Hohenberg et B.I. Halperin, Rev. Mod. Phys. 49 435 (1977). La méthode de renormalisation Monte Carlo est présentée par K. Wilson dans Recent Developments in Gauge Theories, école d’été de Cargèse 1979, G. ’t Hooft et aleds., Plenum, New York (1980). Voir aussi les travaux de S.K. Ma, Phys. Rev. Lett. 37 461 (1976), L.P. Kadanoff, Rev. Mod. Phys. 49 267 (1977). L’article de R.H. Swendsen dans Real Space Renormalization, Topics in current physics, 30, p. 57, T.W. Burkhardt et J.M.J. van Leeuwen eds, Springer, Berlin (1982) a inspiré la discussion de la section 2.3. On doit la suggestion d’utiliser l’équation de Langevin dans les simulations Monte Carlo à G. Parisi et Wu Yong Shi, Sci. Sin. 24 483 (1981), G. Parisi, Nucl. Phys. B180 [FS2] 378 (1981) et B205 [FS5] 337 (1982).
CHAPITRE IX
INVARIANCE CONFORME
Au début des années 70, Polyakov et quelques autres tentèrent d’exploiter l’invariance conforme des modèles critiques, propriété qui va au-delà de la simple invariance d’échelle. Cette dernière multiplie les distances relatives par un facteur constant (c’est-à-dire indépendant des positions), alors que les transformations dites spéciales font intervenir un facteur de dilatation fonction de la position. Les propriétés d’invariance correspondantes permettent non seulement de fixer la forme de la fonction à deux points, mais aussi celle des fonctions à trois points au point critique. Cependant le groupe conforme est un groupe de Lie de dimension finie, et le nombre de contraintes qui en résultent est limité. Un phénomène nouveau apparaît en deux dimensions, bien connu dans la théorie des fonctions analytiques. I1 s’agit de l’existence d’une infinité de transformations conformes locales. On se propose alors d’examiner les conséquences possibles de l’invariance conforme locale en deux dimensions. Ce programme brillamment entrepris par Belavin, Polyakov et Zamolodchikov en 1983, est l’origine d’une vague d’applications nouvelles en physique statistique. Comme le sujet est encore en plein développement, le présent chapitre ne sera pas aussi élémentaire que les précédents, pas plus qu’il ne restera vraisemblablement à jour dans un proche futur. Ceci est d’autant plus vrai que ce sujet est étroitement lié à la théorie des cordes, qui vise à la description quantique d’objets étendus et propose d’englober toutes les interactions connues, en incluant les théories de jauge et la gravité. Les idées d’invariance d’échelle locale, et peut-être même de groupe de renormalisation local, ne sont pas encore complètement élucidées. Elles nous incitent cependant à examiner avec soin divers aspects des phénomènes critiques qui n’occupaient pas le devant de la scène. L’un d’entre eux est la pertinence des effets de taille finie, où, en raison de l’absence d’une échelle de longueur intrinsèque, on observe une sensibilité maximale à des effets géométriques comme ceux des frontières. De même on s’interrogera sur la signification des valeurs obtenues pour les exposants et les corrélations critiques ... I1 s’avère que pour de nombreux systèmes bidimensionnels, ceux-ci possèdent une interprétation inattendue en termes de théorie des groupes (et même de théorie des nombres), car ils sont reliés à la théorie des représentations de certaines algèbres de Lie infinies. Une troisième
90
INVARIANCE CONFORME
question, à laquelle on connaît seulement une réponse partielle à ce jour, et qui n’est pas traitée ici, est la relation avec les modèles intégrables. Finalement les questions les plus profondes sont probablement liées aux généralisations possibles: étude du voisinage du point critique, ou tentative de compréhension plus profonde des phénomènes critiques en dimension plus élevée. Le succès actuel dans le cas bidimensionnel peut être partiellement attribué à l’utilisation de fonctions analytiques, qui permettent de ramener des problèmes bidimensionnels à une situation unidimensionnelle.
1. Tenseur impulsion-énergie
-
Algèbre de Virasoro
1.1 Invariance conforme Comme les effets de taille finie jouent un rôle majeur au point critique, nous devons d’abord préciser ce que l’on entend par système critique dans un domaine borné. Ceci peut être envisagé de diverses manières, soit en dilatant le domaine, soit en exprimant que le système n’a pas de longueurs intrinsèques autres que celles dictées par la géométrie, soit finalement en étudiant le comportement à courte distance des corrélations et en vérifiant qu’il est en accord avec celui qui prévaut dans un volume infini. La caractérisation locale des systèmes critiques est cruciale pour ce qui va suivre, et sera complètement élucidée en deux dimensions. Considérons à titre d’exemple la fonction de corrélation des spins d’Ising en deux dimensions au point critique. D’après le chapitre II nous savons que la dimension du champ de spins vaut $. Dans le plan infini nous avons
On a aussi indiqué que dans une bande de largeur L(0 5 x < L ) , avec conditions limites périodiques, la fonction de corrélation correspondante s’écrit
Nous constatons que lorsque L + 00, ou r12 + O, cette expression se réduit à (1).Plutôt que de modifier la géométrie (en variant L ) on préférera caractériser intrinsèquement le modèle critique par son comportement invariant d’échelle à courte distance. Une transformation conforme dans un espace euclidien de dimension d est une transformation qui conserve les angles, mais pas nécessairement les distances. Ces transforniations forment un groupe qui inclut le groupe euclidien comme sous-groupe (translations: d paramètres et rotations: $d(d - 1)
IX.1.1
91
INVARIANCE CONFORME
paramètres), dilatations (un paramètre) et transformations conformes spéciales ( d paramètres), obtenues en composant une inversion, une translation et une seconde inversion. Ceci décrit la composante connexe du groupe conforme non compact SO(d 1,1) possédant $(d l)(d + 2) paramètres. De façon plus correcte, l'espace euclidien est complété par un point a l'infini (ce qui lui donne la topologie d'une sphère compacte), de sorte que les transformations précédentes sont alors bien définies en tout point.
+
+
Afin de comprendre globalement le groupe conforme, il est commode de faire une application de l'espace euclidien complété R d ,muni de la métrique r2 = . . r j , sur la sphère s d de l'espace euclidien Rd+',x: x2 = 1 en utilisant une projection stéréographique (conforme), schématisée sur la figure 1. Les relations entre r et x sont
+. +
+
x=-
2-
2r
i +r2
i2- i =r2 i
+
Figure 1: (a) Projection stéréographique de Sd sur Rd. (b) Le cône isotrope (cône de lumière) dans l'espace de Minkowski Ed+','.
Si l'on utilise des coordonnées homogènes, la sphère Sd peut être identifiée avec la section x+ = 1 du cône de lumière C de l'espace Minkowski de métrique :x - x: - x2. Les rayons du cône C sont en correspondance biunivoque avec les points de Rd U { C O } . Les transformations conformes sont interprétées comme des transformations de Lorentz homogènes dans Rd+'sl. Le petit groupe d'un vecteur de genre lumière s'identifie au groupe euclidien en d dimensions (le point choisi peut être considéré comme le point à l'infini). Par exemple si le vecteur de genre lumière a pour composantes (x+,x-,x)= (1,1,0), une translation A, est représentée par
92
INVARIANCE CONFORME
IX.1.1
Aa(1,l70)=(1,1,0) Aa( 1, -1, O ) =( 1,-1, O )
+ a 2 ( 1 , 1 , O ) + ( O , O , a)
(4)
Aa(O,O,v) = a . v ( 1 , 1 , 0 ) +(O,O,v)
Une inversion qui appartient à la composante non connexe à l’identité de O(d 1, I) correspond à x- -+ -x-, et une dilatation par un facteur X est représentée par une rotation hyperbolique dans le pian x+, x- sous la forme
+
Revenant à l’espace à d dimensions, une transformation conforme spéciale s’écrit r-+rl= 1
+
r + r2b 2b.r b2r2
+
Sous forme infinitésimale on a r + rl = r .+ Sr
(7)
Les déplacements euclidiens conservent la métrique et ont par conséquent un jacobien unité. Au contraire les dilatations, tout comme les transformations spéciales, ont un jacobien différent de l’unité, et dans le second cas .-Wr‘) -
D(r)
1
(1
+ 2b.r + b2r2)d
Supposons que les modèles critiques soient non seulement invariants d’échelle, mais également invariants conformes. Cette hypothèse sera progressivement étayée par la suite. Nous considérons par souci de simplicité des observables scalaires, dont la dimension est notée A . Les hypothèses précédentes impliquent que dans une transformation conforme, les fonctions de corrélation obéissent à
Dans le cas d’une fonction à 2 points, utilisant l’invariance par translation, rotation et dilatation, on obtient à une constante de normalisation C12 près
IX.1.1
INVARIANCE CONFORME
93
Sous l’action d’une transformation spéciale, il vient
Par conséquent les équations (9) et (10) ne sont compatibles que si A1 = A2
On peut définir une “base orthonormée” d’observables en choisissant les combinaisons appropriées qui diagonalisent la matrice symétrique réelle des coefficients Cob.Un simple changement d’échelle des champs remplace alors Cab par 6ab. Un raisonnement analogue permet d’obtenir les fonctions à trois points
Vérifier que (13) est bien la solution unique de la condition (9).
L’invariance conforme est à elle seule insuffisante pour déterminer la structure des corrélations à plus de trois points. Ceci découle de ce que certaines combinaisons comme ?-13T24/T23T14 (où ~ i dénote j Iri-rjl ) sont invariantes par transformation conforme. Des informations supplémentaires sont requises, et elles seront fournies dans le cas bidimensionnel par l’hype thèse d’invariance conforme locale. Contentons-nous pour le moment de traduire la condition (9) sous forme infinitésimale en écrivant
r’ =r
+ 6r
(m)
Aid
= D(r‘)
A(r’) = A(r) + 6A(r)
Exiger que la transformation infinitésimale r -+ r+6r appartienne au groupe conforme, implique que 6r soit au plus quadratique en r, c’est-à-dire de la forme
où bai, SA, 6 E i j = - 6 ~ j i et 6bi sont respectivement les paramètres infinitésimaux des translations, dilatations, rotations, et transformations spéciales. Sous forme explicite
94
INVARIANCE CONFORME
IX.1.1
+ 6Xr.V + ~ ~ E ~ ~- (r JTV ,,)+Vr26b.V ~ - 2(r.Sb)(r.V) + AA(~’X- 2r.Sb)I A(r)
bA(r) = [Sa.V
(16) Par conséquent, si 6AD(rp)dénote la variation correspondante du champ (scalaire) A,, l’équation (9) exprime que n
(Al(r1). . SA,(r,).
. .An(rn)) = O
(17)
p=l Généraliser les expressions ci-dessus au cas des champs tensoriels
1.2 Tenseur impulsion-énergie Les théories critiques dans un espace euclidien infini sont obtenues par un processus limite à partir d’une intégrale (ou d’une somme) sur des poids de Boltzmann. Les observables locales sont exprimées en termes des champs fondamentaux qui apparaissent dans ces poids, et que nous désignons collectivement par A. Les fonctions de corrélation sont des moyennes prises avec un poids de Boltzmann, le facteur de normalisation étant la fonction de partition. Si nous oiiblions le passage à la limite, nous pouvons effectuer au numérateur un changement de variables d’intégration (ou de sommation) du type A(r) -+ A(r) i-6A(r)
où Sr(r) est mairitena,nt un champ vectoriel arbitraire, c’est-à-dire qu’il n’est pas nécessairement de la forme (15). Nous supposons de plus que les observables A, se transforment comme dans (18)’ auquel cas elles appartiennent à une classe restreinte (les dimensions correspondantes sont notées Ai). Quoi qu’il en soit, nous désignons par 6A, la variation de l’observable A,. Dans ces conditions la variation totale des fonctions de corrélation contient non seulement une contribution analogue à (17)’ mais elle inclut aussi un terme provenant du comportement de la mesure (qui inclut le poids de Boltzmann) dans le changement de variables (18). Ce terme est du premier ordre en 6r, et s’annule manifestement quand 6r est constant (cas d’une translation). I1 ne peut donc dépendre que des dérivées de Sr. Comme nous nous plaçons dans le cadre d’une théorie locale, nous écrivons la forme la plus simple possible, comme postulat définissant le tenseur impulsion-énergie
IX.1.2
INVARIANCE CONFORME
95
n
(Al (r1). . . SAp(rp). . . A n ( r n ) ) p= 1
+
(19)
1
d d r ( A l ( r 1 ) . .An(rn)Tij(r)) dibrj(r) = O
Cette formule est analogue à celle qui définit le tenseur impulsion-énergie de l’espace de Minkowski, où cette construction fournit le courant de Noether des quantités conservées, impulsion et énergie. C’est ce qui explique la terminologie. Etant donné un lagrangien, on obtient sans peine un candidat classique pour Tij. On peut cependant rencontrer au cours de la quantification des difficultés, dont l’origine réside dans la définition et le comportement de la mesure d’intégration. A ce point il est donc plus honnête de considérer (19) comme un postulat, que nous appellerons identité de Ward, exprimant le comportement des corrélations sous l’action d’un changement de coordonnées différentiable infinitésimal. Dans un contexte plus général, le tenseur impulsion-énergie apparaît comme la réponse à un changement infinitésimal de métrique, ce qui assure qu’il est symétrique. Nous ne nous engagerons pas dans cette voie, bien que la plupart des applications bidimensionnelles suggèrent que l’on a beaucoup à apprendre des propriétés d’une théorie quantique sur un espace courbe. Revenant à l’équation (19)’ examinons les contraintes qu’implique l’invariance par transformations euclidiennes et par dilatations globales. Substituant les expressions correspondantes pour SA, et ôr, nous obtenons (i) Invariance par translation, 6r constant: l’équation (19) se réduit à (17). (ii) Invariance par rotation: diSr, = S ~ j i= -&ij constant. Pour que l’équation (19) se réduise à (17)’ il faut que Tzj soit symétrique
Tij(r)= Tji(r)
(20)
(iii) Invariance par dilatation: SiSrj = &SA. Pour retrouver (17) le tenseur impulsion-énergie doit être de trace nulle
Si l’on considère maintenant une transformation spéciale, telle que &Srj = 2 (r& - r,Sbi) - &,(Sb.r), le second terme de (19) s’annule identiquement compte tenu de (20) et de (21). I1 s’ensuit que dans une théorie locale l’invariance euclidienne et l’invariance d’échelle suffisent à elles seules à assurer l’invariance par le groupe conforme. Ceci constitue l’importante observation initiale. Si l’on interprète un changement infinitésimal de coordonnées dans le sens actif, le carré de l’élément infinitésimal de longueur entre points voisins est modifié suivant (gi:)
= 6ij)
96
INVARIANCE CONFORME
IX.1.2
s
Substituant $Ti,âgij for TijaiSrj, on trouve que ddrTij(r)6gij(r) apparaît comme la réponse de la mesure fonctionnelle (y compris le poids de Boltzmann) à un changement de métrique. Comme tout est rapporté ici à la métrique de l’espace euclidien gi;), nous n’avons pas jugé utile de distinguer entre indices covariants et controvariants.
Supposons que pour une variation générale de coordonnées, les variations de SA, soient locales, de la forme (18).Supposons en outre Sr arbitraire et de support compact. Après une intégration par parties, nous pouvons récrire l’équation (19)’ en identifiant le coefficient de Sr, sous la forme
n
= p= 1
{S(r
- rp)8jp)-
d
(ûjS(r - r,))} (Al(r1).. . An(rn))
(23)
Cette équation exprime la conservation du tenseur impulsion-énergie. De fait le membre de droite et par conséqueat celui de gauche s’annulent pour r appartenant à un domaine arbitraire privé d’un voisinage des points r l ,
... rn. I1 n’est pas possible pour le moment d’aller beaucoup plus loin dans le cas général. Nous nous restreignons donc désormais aux propriétés spécifiques à la dimension deux.
1.3 Transformations conformes en deux dimensions En deux dimensions, le groupe conforme global n’est autre que le groupe de Lorentz familier S O ( 3, l) . I1 peut être réalisé sous forme de transformations homographiques du plan complexe (complété par un point à l’infini). Ces transformations exhibent l’isomorphisme des groupes S O ( 3 , l ) et SL(2,C)/ { &l}.Au lieu d’utiliser deux coordonnées réelles indépendantes x et y, il est commode d’introduire les deux combinaisons complexes z = x + iy et Z = x - iy. Avec ces notations la métrique euclidienne devient antidiagonale, et il faut prêter at tention aux composantes des tenseurs. Nous écrivons
IX.1.3
97
INVARIANCE CONFORME
Nous utiliserons souvent la notation abrégée d pour ô, et avons donc
8 pour dz . Nous
Un tenseur symétrique de trace nulle tel que T est obtenu dans une base z , 2 en formant le scalaire
+ i (Tll + iT12) r”
T ~ ~=< (Tll ~ ( -~iT12) t2
où
= t1
+ i t 2 , f = t1 - i t 2 . Ainsi
Avec a , b, c, d complexes obéissant à ad - bc = 1, les transformations conformes globales s’écrivent
z,Z
+ z‘,
2‘
2’
az
+b
= f(z) = -
cz
+d
- az+b Z’ = f ( ~=) - (27)
cz
+2
On peut aussi envisager les transformations conformes globales qui changent l’orientation et correspondent à la composante non connexe à l’identité. Elles sont engendrées par la conjugaison complexe et ne joueront pas pour l’instant un rôle crucial, car nous nous occuperons principalement de transformations infinitésimales. Les champs tensoriels se transforment avec multiplication par des Ici nous rencontrons une spécificité de puissances entières de f’ et la dimension deux, où il est possible d’envisager une généralisation de la notion de tenseur comportant un nombre non entier d’indices z et 2 . Plus précisément nous définissons un champ de poids conformes ( h ,h ) comme un champ se transformant selon
7.
A ( z ,Z )
+
A’(z,2 ) = f’(z)hmhA(f(z),m)
où h ne représente pas le complexe conjugué de h. La notation suggère simplement que le poids h est associé au comportement relatif à la variable 2. La quantité h - 6 joue le rôle de moment angulaire, ou de spin, et implique que par rotation z -+ e%, A’ est multiplié par ei(h-h)p.Dans la suite nous considérerons principalement des champs de spin h - h entier. De fait ce sont les seules observables. Cependant il est naturel d’envisager également
98
INVARIANCE CONFORME
IX.1.3
le cas de fermions de spin demi-entier, et d’autres généralisations ont été examinées. La dimension A est la somme
A=h+h Pour un champ scalaire réel nous avons
h = h = ’ A2 Nous pouvons récrire l’équation (29) sous forme infinitésimale
+
( A SA)dzhdZh.== A ( z + 62,Z
+ SZ)[d(z + Sz)lh[d(Z+ 6Z)]’
Par conséquent, avec
62 := E ( z )
6A = SZA+ SZA
(33)
nous avons
S,A(z,Z) = { & ( z ) d , + h & ’ ( z ) } A ( z , Z ) & A ( z ,2) = {E(z)dz + hE’0) A ( z ,2 )
(34)
Comme on l’a déjà indiqué, la nouveauté du cas bidimensionnel est l’existence d’une classe infinie de transformations conformes engendrées par une fonction analytique arbitraire f( z ) au lieu de la fonction homographique, que nous avions utilisée jusqu’à présent (nous laissons de côté la possibilité que f puisse être une fonction analytique de 2 ). Que ces transformations soient conformes résulte immédiatement de ce que la métrique se transforme selon ~
d,zdz -t dfdf = f’(z)f‘(z)dzdZ
(35)
de telle sorte que les angles sont préservés, les longueurs étant multipliées localement par un facteur de dilatation If’(z)l.L’interprétation de telles transformations ne va pas de soi. En effet, en général (i) la fonction f ( z ) n’est pas définie dans tout le plan complexe (ii) même dans ce cas (en admettant des pôles isolés), elle ne définit pas une application bijective. Les seules applications bijectives du plan complexe (complété) sont les transformations homographiques, c’est-à-dire celles correspondant au groupe global. I1 y a alors deux interprétations possibles, toutes deux intéressantes. Dans la première, nous utilisons l’hypothèse d’invariance locale pour obtenir des quantités relatives au domaine transformé. Ci-dessous nous examinerons par exemple une telle application du plan privé d’un point sur
IX.1.3
INVARIANCE CONFORME
99
un ruban périodique. Dans la seconde interprétation, nous étudierons l’effet de transformations infinitésimales conformes locales telles que (33), avec E ( Z ) considéré au premier ordre, mais à part cela fonction arbitraire de z. I1 faut garder à l’esprit que les fonctions analytiques sont rigides, c’est-à-dire que E ( Z ) ne peut être régulier et s’annuler en dehors d’un domaine fini, tout en restant analytique. Dans un changement de coordonnées “infinitésimal” holomorphe arbitraire
sz
=s&g(Z)
62 =&g(z)
les champs qui se transforment selon
6 A ( z ,2 ) = SE [gaz
+ h(a,g) +
+ h(&g)]A ( z ,?)
(37)
sont appelés champs primaires. Insistons sur le fait que g est arbitraire, et n’est pas restreint à être un polynôme du second degré en z (auquel cas A pourrait être appelé quasi primaire). Nous traiterons de façon quasi exclusive de champs primaires, l’exception la plus notable étant, de façon surprenante, le tenseur impulsion-énergie. Pour une fonction générale g ( z , ?), nous avons
Cette quantité s’annule pour g (g) holomorphe (anti-holomorphe). Insérons cette expression dans l’équation (19). Naturellement le deuxième terme s’annule dans les régions (finies) du plan z , où g et 9 possèdent la propriété d’analyticité mentionnée ci-dessus, suggérant une propriété de covariance des corrélations de champs primaires dans des transformations analytiques générales. Rendons cet énoncé plus précis. I1 est commode de faire une transformation d’échelle sur le tenseur impulsion-énergie, de façon à insérer un facteur 1/27r dans l’intégrale de définition de T . Choisissons une paire de fonctions g , 9, s’annulant suffisamment vite à l’infini pour permettre des intégrations par partieS.Nous supposons g holomorphe, anti-holomorphe au voisinage des points 2 1 , . . ., z,, de telle sorte que nous puissions utiliser l’équation (37)’ et posons g p g(z,, Z p ) , 8, ûzl,.Nous obtenons n
100
INVARIANCE CONFORME
IX. 1.3
Comparant les deux membres de cette équation, on en déduit que
ûz (T,,(z, ??)Al. . .A,) s’annule sauf aux points z1 .: .z,. Une relation ana, . . . A,). L’équation (39) montre que la logue s’applique à a, ( T z z ( z Z)Al première de ces fonctions est méromorphe en z , avec des pôles simples et doubles situés en z1 . . . 2 , et qu’une propriété conjuguée est valable pour la seconde, de sorte que nous pouvons écrire l’identité de Ward sous la forme
Etant donné le traitement parallèle des variables z et Z , nous omettrons par la suite de répéter les équations, et nous n’expliciterons que la partie relative à z. Le lecteur prendra garde au fait que certains champs, comme A ci-dessus, peuvent dépendre à la fois de z et 2, alors qu’il résulte de l’équation (40) que T,, ne dépend que de z , dans le sens où les corrélations avec insertion de T,, sont des fonctions méromorphes de la variable z . En conséquence nous le désignerons par T ( z ) , et de façon analogue, TzZsera noté T ( t ) . Soit maintenant g( z ) analytique dans un domaine qui inclut les points z l , ..., z,, et soit C une courbe dans ce domaine qui entoure ces points une fois dans le sens positif. La forme intégrale de (40) s’écrit
et on obtient une équation analogue conjuguée pour T . Les générateurs des transformations conformes globales correspondent à des fonctions g ( z ) qui sont des polynômes du second degré en z , auquel cas le membre de droite de l’équation (41) doit s’annuler. I1 s’ensuit qu’une fonction de corrélation avec insertion de T ( z ) doit s’annuler comme z - ~pour z grand
( T ( z ) A ~z1) ( ~. .~.A,(z,, , z,))
Z’CO
z - ~ ~ (z1; z ~- . ;, z,, 2,)
(42)
(et à nouveau une équation conjuguée s’applique à T ) . La dimension canonique de T est deux (et d en dimension d ) , puisque son intégrale doit être
IX. 1.3
INVARIANCE CONFORME
101
sans dimension, comme l’action. Une conclusion hâtive aurait été que le membre de gauche de l’équation (42) s’annule comme z2-2 à l’infini. Le présent énoncé est plus fort, et implique l’invariance conforme globale. Un polynôme du second degré dépend de trois paramètres complexes, ce qui est bien sûr la dimension (complexe) du groupe SL(2,C). Combinant (42) et (40)’ nous déduisons, par un développement autour de z = 00, que les transformations conformes globales entraînent n
translations p= 1 n
( ~ ~ a+, h~p>)( A l ( z 1 , E l ) . . . An(zn, 2,))
=O
dilatations (complexes)
p= 1 11
(zig,,,
+ 2hpzp)( ~ l ( z 1E,I ) . . .~ ~ ( z2,)), ,
= O transformations spéciales
p= 1
(43) De la même façon que nous n’écrivons pas de faqon explicite les équations conjuguées, nous omettrons parfois de mentionner la variable dans les équations en z . En deux dimensions, rotations et dilatations réelles sont des transformations conjuguées. Dans le formalisme complexe, elles se combinent pour donner des dilatations complexes, ainsi que l’indique l’équation (43). Les relations (41) expriment une forme généralisée de covariance par transformation conforme locale infinitésimale. Pour aller plus loin, nous avons besoin des corrélations impliquant le tenseur impulsion-énergie, et notre première tâche consiste à étudier leur comportement dans les transformations mentionnées ci-dessus.
1.4 Charge centrale L’invariance par translation dans le plan implique que la valeur moyenne ( T ( z ) )soit une constante. Dans l’équation (42)’ cette constante a été implicitement choisie égale à zéro
(44) ( T ( z ) )= (T(E)) = O De la même façon l’invariance par translation et l’invariance d’échelle globale entraînent que la fonction à deux points correspondante doit être une fonction homogène de 212. De l’équation (42) nous déduisons donc
102
IX.1.4
INVARIANCE CONFORME
ce qui nous apprend que T a pour poids conformes (2’0) (et (T les poids (0’2)) comme prévu. Le choix du facteur $- dans la normalisation de la constante réelle c commune à T et T est conventionnel. Son objet est de produire la valeur c = 1 pour un champ scalaire de masse nulle (ainsi qu’on le verra ci-dessous, cf. section 2.1). Comme l’échelle de T est déjà fixée par des relations telles que l’équation (40)’ nous n’avons pas la liberté de fixer la valeur de c. Si la théorie admet une interprétation en termes d’un hamiltonien quantique. agissant dans un espace de Hilbert d’états muni d’un produit scalaire défini positif, et un spectre borné inférieurement, alors c doit être positive, ainsi que nous le montrerons ultérieurement. Mais cela n’est en rien nécessaire pour une interprétation statistique cohérente, et nous allons rencontrer des exemples intéressants correspondant à c < O. La constante sans dimension c est appelée charge centrale pour des raisons qui apparaîtront par la suite. Une des principales conclusions de ce chapitre sera que la connaissance de c est (presque) suffisante pour caractériser un modèle critique dans nombre de cas. Quoi qu’il en soit, elle fournit une information essentielle aux multiples conséquences. L’apparition de la charge centrale c peut s’interpréter comme une anomalie résultant du fait qu’une symétrie classique (ici l’invariance conforme locale) ne peut pas être étendue au cas quantique en raison d’effets dus à la renormalisation. Dans le contexte des intégrales de chemin, ceci peut être interprété en disant que la mesure fonctionnelle complète ne peut pas être rendue invariante. On peut aussi par exemple considérer que les équations du groupe de renormalisation expriment un comportement anormal dans une dilatation en dehors des points fixes. Nous venons de \air que ( T ( z ) )s’annule dans le plan infini. Si nous avions invariance par transformations conformes locales infinitésimales, nous nous attendrions à ce que cette valeur moyenne reste égale à zéro. Mais à l’exception des transformations engendrées par un polynôme du second degré en z , nous savons que nous ne pourrons pas, d’une façon stricte, parler d’invariance, étant donné que les transformations ne sont pas des applications bijectives du plan complexe (complété) sur lui-même. Nous ne nous attendons pa:j à ce que ( S T ( z ) )s’annule. De fait, combinant les équations (41) et (45)’ nous avons
z -+ z’ =z + 6 e g ( z ) T -+ T’ =T + ST dz’ g ( z ’ ) 2i7r (2’ - z ) ~ et par conséquent
( S T ( z ) )= &cg”‘(z)
SE
(46a)
IX.1.4
INVARIANCE CONFORME
103
On obtient une expression analogue pour T . Quand g est un polynôme du second degré, g”’ s’annule et on retrouve l’invariance attendue. L’équation (46) donne une première expression de l’anomalie. Etant donné que ( T ( z ) )= O, et que les poids de T sont (2,0), il est naturel de postuler que la loi de transformation minimale incorporant cette anomalie s’écrit
avec une expression analogue pour T.Ce comportement se différencie de celui des champs primaires, donné par l’expression (33). L’équation (47) nous apprend que T n’est pas un champ primaire. Le tenseur impulsionénergie se transforme selon une loi inhomogène, avec une contribution supplémentaire proportionnelle à l’identité. Ceci suggère que l’anomalie doit pouvoir être déduite du comportement correspondant de la fonction de partition, ou de l’énergie libre. Transcrivons ici les expressions (12) et (13) pour des fonctions a 2 et 3-points arbitraires, en omettant les variables z
Par conséquent
Vérifier que ceci est en accord avec
Considérons la généralisation de la loi de transformation infinitésimale (47) à une transformation conforme finie correspondant à une application du plan sur un domaine éventuellement différent. Nous avons maintenant z’ = f(z). A T ( z ) correspondra T’(z’). Dans l’interprétation active, la formule de transformation s’écrit
T(z)dz‘ = T’(z’)dz’’
+ &c{z‘,z}dz’
(50)
où le symbole {z’,z} désigne la dérivée schwarzienne de l’application z z’ = f(z),soit
104
IX. 1.4
INVARIANCE CONFORME
Au premier ordre en ô&, ceci se réduit à la dérivée troisième de & g ( z ) , pour f(z) = z &g(z).
+
I1 n’est pas évident d’obtenir la dérivée schwarzienne à partir de la composition de transformations infinitésimales. Nous en donnerons une preuve directe utilisant le champ libre dans la section 2 . 1 . Faisons ici une petite digression afin de donner une interprétation de la dérivée schwarzienne. Celle-ci joue vis-à-vis du groupe conforme global le même rôle que la dérivée ordinaire vis-à-vis des translations. Si nous utilisons la notation
pour la différentielle quadratique correspondante (on rappelle que z’ et z sont reliés analytiquement) la compatibilité de l’équation (50) requiert
Dans l’équation ( 5 2 c ) , on a supposé que 2 1 = f 1 2 ( z 2 ) , 22 = f 2 3 ( 2 3 ) , z3 = f 3 1 ( z 1 ) tandis que f i 2 O f23 O f31 est la transformation identité. Finalement, si z1 et z2 sont reliés par une transformation homographique, la différentielle quadratique s’annule comme conséquence de ( 5 2 b , d )
az1z2+bz1+cz2+d=O
u
(52e)
[z1,22]=0
Le birapport de quatre nombres complexes est invariant par transformation homographique. Afin de mesurer de combien une transformation donnée y = f(z) diffère localement d’une telle transformation, comparons les birapports de quatre points zi et de leurs images. Posant zij = xi - xj, nous évaluons la quantité 213242
Y13Y42
212243
Y12Y43
Q(~,I/)=---
+
pour des valeurs x; voisines d’un point 2, de la forme zi = 2 t c i . De façon analogue, nous développons les yi au troisième ordre en t. Un calcul élémentaire montre que le terme dominant en Q est d’ordre t 2 , et de la forme
IX.1.4
INVARIANCE CONFORME
105
Les propriétés (52b-e) en découlent immédiatement. Observons finalement que
Nous pouvons maintenant passer à l’interprétation de l’équation (50)’ et donc de l’anomalie. A cette fin, effectuons une application conforme du plan complexe, privé de l’origine, sur une bande périodique dans le plan u, de largeur L. La transformation correspondante est donnée par une exponentielle I
z = exp(2im/L)
(54)
im u
Re u
-;L
+L
Figure 2: Bande périodique de largeur L dans le plan de la variable u
Par conséquent
et comme ( T p ~ a i i (=~O, ) ) nous trouvons (Tbaiide(u))= &c(2./L)2
(56)
Ceci nous permet d’interpréter l’anomalie comme un effet Casimir, c’est-àdire un déplacement de l’énergie libre comme conséquence de la géométrie finie. Cet effet fut à l’origine prédit, puis mesuré, en électrodynamique quantique où il donne lieu à une force entre conducteurs neutres. Le seul fait qu’il soit mesurable bien que très faible, démontre que les interactions électromagnétiques sont à longue portée. De même nous nous attendons dans le cas présent à un déplacement de l’énergie libre dépendant de L, dû aux conditions aux limites confinantes. Comme convention de normalisation,
106
INVARIANCE CONFORME
IX.1.4
nous supposons que dans le plan infini l’énergie libre par unité de surface s’annule au point critique. En incluant le facteur 1/27r1 introduit ci-dessus, la variation de l’énergie libre totale est donnée par une formule analogue à (19), soit
où le domaine d’intégration V est la bande infinie. Choisissons en particulier Srl = S E U ~Sr2 = O , qui correspond à une dilatation horizontale de la bande. Naturellement ce n’est pas là une transformation conforme (elle est du type quasi conforme, transformant les cercles en ellipses avec un rapport fixe des axes). Mais la définition de T p yn’implique en rien une transformation conforme. Le seul terme qui ne s’annule pas dans ûpSr, est dlSrl = SE, et TI1 = T ( u )+ T ( a ) .Dans une bande infinie, la quantité In 2 est infinie. Par invariance par translation, nous nous at tendons cependant à ce qu’il existe une énergie libre par unité de longueur bien définie, en d’autres termes que 1 F ( L ) = lim - l n Z ( L , M ) M-oo
M
existe, pourvu qu’on impose une condition aux limites supplémentaire dans la direction longitudinale à une distance M . En supposant que l’énergie libre par unité de longueur possède une limite indépendante de cette condition supplémentaire, nous concluons des équations (56)-(58) que
S F ( L ) = SELet donc
dF(L) 27r = -=c - S E dL L 7r
F ( L ) = ‘c6 L Nous avons utilisé le fait que l’énergie libre FO par unité de longueur dans le plan infini s’annule. Sinon elle donnerait lieu à une contribution supplémentaire FOL au membre de droite. De manière équivalente, si l’on utilise une matrice de transfert, le logarithme de la plus grande valeur propre X O se comporte au point critique comme 1nXO = FOL + ‘c6 L 7r
(59b)
quand L devient infini. Nous examinerons dans la section 2 la validité des hypothèses conduisant à l’équation (59). Manifestement si certaines corrélations croissent avec la distance, comme cela se produit dans des modèles non unitaires, on s’attend à ce que le résultat ne soit plus valable. Pour l’instant, supposant que toutes les corrélations décroissent avec la distance, nous voyons qu’une relation comme (59) donne accès à la valeur de la charge centrale, ainsi que les études numériques l’ont amplement
IX.1.4
INVARIANCE CONFORME
107
illustré. Par exemple, pour des polymères (modèles O ( n ) ,n +. O) ou pour la percolation (modèle de Potts à Q-états, avec Q +. l ) , on trouve comme on s’y attend c = O. Nous verrons que le modèle d’king correspond à c = le modèle de Potts à 3 états à c = et le champ bosonique libre (modèle gaussien) à c = 1, pour ne mentionner que ces quelques valeurs.
4
i,
1.5 Algèbre de Virasoro L’application définie ci-dessus du plan pointé sur une bande périodique suggère l’utilisation d’un formalisme opératoriel, avec une matrice de transfert 7. Comme cette transformation correspond à l’utilisation de coordonnées polaires dans le plan, ce formalisme a reçu le nom de quantification radiale. L’évolution dans le teiiips est équivalente aux dilatations, et les va,leurs propres du générateur correspondant sont les poids conformes. Afin d’alléger les notations, nous absorbons le facteur 2i7r/L dans la définition de la variable u,de sorte que
D’après cette équation, la propagation s’effectue le long de l’axe réel u.Les valeurs moyennes dans la bande sont identifiées à des traces de produits ordonnés d’opérateurs (l’ordre étant pris le long de l’axe des “temps” R e u ) . Cette procédure permet d’associer à une observable A(u)un opérateur Â(u). La matrice de transfert est l’analogue de l’exponentielle d’un hamiltonien, et relie les opérateurs à différentes valeurs de R e u selon
Â( Re u,Im u)= ‘TRe ”Â( O, Im u)TRe
(61)
Les corrélations sont écrites pour une suite décroissante de valeurs de R e u sous la forme
Si nécessaire, on effectue des soustractions de façon à rendre ces expressions connexes. Dans un contexte quantique, cette formule n’est autre que celle de Gell-Mann et Low. Supposons pour simplifier que le modèle soit unitaire.
108
INVARIANCE CONFORME
IX.1.5
Dans l’espace euclidien, cela veut dire que 7 = exp - H , où H est hermitien et borné inférieurement. Désignons son état fondamental unique par IO), (01 étant le bra conjugué. Dans le cas d’un modèle unitaire, la limite M -f 00 projette sur l’état fondamental si nous supposons que ce dernier correspond à un point isolé du spectre. Comme la situation considérée implique une bande de largeur finie, cette supposition paraît réaliste. Nous trouvons donc
Dans le cas d’une observable réelle A, l’opérateur correspondant est hermitien
et les corrélations satisfont à la propriété de positivité par réflexion
Le second argument ü n’a pas été écrit explicitement, mais il est sousentendu. Grâce à l’application exponentielle, nous pouvons exprimer les translatioiis dans le plan u comme des dilatations dans le plan z (privé à‘un point), à condition. de tenir compte de la loi de correspondance entre opérateurs Abande(U,Ü)
= Âpla*,(Z, Z)zhZh
I1 en résulte que
Dans une application conforme z -+ z’ = z un champ primaire se transforme selon
+ & g ( z ) , avec g ( z ) analytique,
et l’équation (39) entraîne l’existence d’un opérateur ? ( z ) tel que pour jzll lz2l
> ... > lznl,
>
IX.1.5
INVARIANCE CONFORME
109
... 6 Â p ( z p ... ) Ân(zn)JO)=
où le contour C entoure tous les points zi, tandis que le contour C' laisse tous ces points à l'extérieur. Introduisant des contours intermédiaires, nous voyons que ceci est équivalent à un énoncé opératoriel
Développons maintenant T, tout comme T, en série de Laurent +W
(71) n=-w
n=-w
Le facteur z-2 a pour origine la relation (60). Nous substituons le développement (71) dans (70), où g(z) est également développé en série de Laurent. Identifiant le facteur de chacun de ses coefficients dans les deux membres, nous obtenons un ensemble de relations de commutation définissant deux algèbres de Lie de dimension infinie, appelées algèbres de Virasoro [Lj, Lrcl
= ( j - k)Lj+k
[Zj, L]= ( j
- k)Ej+rc
+ & c j ( j 2 - 1)6j+rc,o
+ &cj(j2
- l)Sj+k,O
(72)
[Lj,Zk]=O Ces algèbres furent initialement introduites par Virasoro dans le cadre du modèle dual de la physique des particules, l'ancêtre de la théorie des
110
INVARIANCE C O N F O R M E
IX.1.5
cordes, avec pour objet d’imposer ce que nous interprétons aujourd’hui comme l’invariance par reparamétrisation. Du point de vue du plan z , l’origine ne joue aucun rôle particulier, et ces opérateurs T et i? pourraient être développés au voisinage de tout autre point, obtenu comme image de l’origine par une transformation homographique. Les formules (72) admettent l’interprétation suivante. Supposons en premier lieu c = O, et examinons une des deux algèbres équivalentes. On observe alors que les opérateurs peuvent être réalisés comme opérateurs différentiels du premier ordre de la forme
Si nous nous restreignons z au cercle IzI = 1, les champs de vecteurs e, agissent sur des fonctions définies sur ce cercle, et sont les générateurs des difféomorphismes du cercle unité, c’est-à-dire d’applications bijectives indéfiniment différentiables (ici connexes à l’identité). Le terme supplémentaire dans (72)’ proportionnel à c, commute avec tous les éléments de l’algèbre. I1 indique par conséquent une extension de l’algèbre de Lie (73) par une algèbre unidimensionnelle. Comme cette dernière commute avec tous les éléments, on parle d’extension centrale, et donc de charge centrale. La situation est analogue au niveau des algèbres de Lie à celle qui prévaut en mécanique quantique, quand on cherche des représentations à une phase près d’un groupe de symétries. Par exemple les spins demi-entiers correspondent à une extension centrale de SO(3) par le groupe à deux éléments 2 2 , sous la forme de SU2. Un calcul simple montre que la forme indiquée dans l’équation (72) est la seule extension centrale de l’algèbre (73) à un changement de base près. ou l o , e*,, engendrent tous une Les opérateurs Lo, L&ll (Loi algèbre à trois dimensions, qui n’est autre que l’algèbre de Lie complexe du groupe conforme global SL(2,C). On notera que le coefficient correspondant de l’anomalie s’annule. Le générateur LOdes dilatations est diagonal dans la représentation adjointe [Lo,L-,] = PL-,, avec des valeurs propres entières. I1 permet de définir une graduation de l’algèbre enveloppante engendrée par les L,, c’est-à-dire une décomposition en sous-espaces homogènes correspondant aux valeurs propres de LO.En d’autres termes, L-, agissant sur un état propre de L o accroît la valeur propre de p . Le vide est invariant par transformation conforme globale, et il est donc annihilé par L O , L h l .Comme on suppose que T ( z )10) reste régulier quand z -+ O (de manière que (OlT(z) quand z + CO), il s’ensuit que l’on a les propriétés plus fortes
P 2 -1
L, 10) = O (01 L, = O
P l l
avec des équations analogues pour
E,.
(74)
IX.1.5
INVARIANCE CONFORME
111
(i) Montrer que pour obtenir les relations (74), étant entendu que LO et L k 1 annihilent 10) et (01,il suffit d’exiger que L2 annihile 10) à droite, ou L - 2
annihile (01 à gauche. (ii) Comme conséquence de (74), ( O lLpl O ) = O pour tout p . Montrer à partir des relations de commutation ( 7 2 ) que pour Iz11 > 1221 par exemple on retrouve l’expression
Dans un modèle unitaire, une observable hermitienne obéit à la relation Z)t = p
z - 2 q ( Z - ’ ,
2-1)
(75)
Appliquée à T ou T , cette égalité fournit une condition nécessaire pour qu’une représentation soit unitaire
L2, = L-,
,
LtP = L-,
(76)
L’équation (40) implique, si z1 + 2 2 , ?(21)Â(22) 10) se comporte comme h. 4z i2Â ( z 2)IO). Définissons l’état Ih, I;) par
I1 s’ensuit que
Lo Ih, 71) = h Ih, E )
P>O
L, Ih, h ) = E , Ih, h ) = O
et les relations conjuguées
Dans une représentation unitaire, le générateur des dilatations (réelles), LO+ EO et celui des rotations, LO- EO,sont tous deux hermitiens. Nous en concluons que l’espace des états d’un modèle critique porte une représentation du produit des algèbres {L,}x { E , } , que nous désignons par V x Une telle représentation est en général réductible, contenant des
v.
112
IX.1.5
INVARIANCE CONFORME
états tels que Ih, h ) et leurs descendants, c’est-à-dire des états engendrés par application d’un produit de Lp et de &,. Concentrons notre attention sur une de ces algèbres, disons V . Par isomorphisme, les raisonnements s’appliqueront aussi bien à Considérons une représentation possédant un vecteur appelé vecteur de plus haut poids, c’est-à-dire un état Ih) qui remplit les conditions (77). Nous omettons La dans ce qui suit d’expliciter les propriétés analogues relatives à dénomination vecteur de plus haut poids est empruntée à la théorie des représentations des algèbres de Lie. Dans le contexte présent, il s’agit plutôt d’un état fondamental dans un secteur donné. Considérons le “module de Verma” engendré par Ih) , c’est-à-dire l’espace vectoriel de dimension infinie engendré par les combinaisons linéaires finies de monômes en L,, m > O appliqués à Ih) et supposés linéairement indépendants. Cet espace se décompose en sous-espaces homogènes caractérisés par la valeur propre h+n de Lo, où n est un entier non négatif, qui sera appelé le niveau. La quantité h n est aussi parfois appelée poids de l’état correspondant. Ici ce n’est pas autre chose que le poids conforme d’un champ non primaire, qui crée cet état quand il est appliqué à l’état vide IO). Quand nous considérons les états de niveau In),nous pouvons utiliser les relations de commutation (72),ainsi que les propriétés de l’état Ih) annihilé par L,,p > O, pour montrer qu’ils se réduisent tous à des combinaisons d’états de base, impliquant seulement L,, p < O, et ordonnés de façon commode, par exemple des états de la forme
v.
v.
+
De façon analogue dans l’espace conjugué
avec les mêmes contraintes sur les indices. L’espace de ces états, de dimension infinie, fournit manifestement un espace de représentation de l’algèbre de Virasoro. L’algèbre de Virasoro est similaire aux algèbres de Kac-Moody définies comme extensions de dimension infinie d’algèbres de Lie semi-simples (appendice C), qui interviennent dans l’étude des algèbres de courants ainsi que dans celle des systèmes intégrables de dimension infinie. Un opérateur Lpt,p’ > O, appliqué à un état tel que I{p} h ) ,diminue son niveau de p‘. Par conskquent si un produit de tels opérateurs a un degré égal à n, il produira, s’il est appliqué à [ { p ),h ) un multiple de l’état fonda.mental Ih ). Nous écrivons
IX.1.5
113
INVARIANCE C O N F O R M E
O
< p1 i P2 i ... 1.Pk
o
Les coefficients ( ( p ‘ ) , { P } ) ~pour , ~ c, h et le niveau n fixés peuvent être calculés à partir de la seule donnée de l’algèbre de Virasoro et des propriétés de l’état Ih). Ils forment une matrice indexée par les partitions de l’entier n, appelée forme contragrédiente et dont on vérifie aisément qu’elle est symétrique. Dans le cas unitaire, cette forme contragrédiente n’est autre que la matrice des produits scalaires au niveau n
Nous rappelons que
On obtiendra une représentation unitaire si, et seulement si, à chaque niveau n, la forme contragrédiente est positive semi-définie. Si elle est définie positive, le module de Verma lui-même donne une représentation unitaire irréductible. En revanche si la forme contragrédiente n’est que semi-définie, c’est qu’il existe des “états nuls” engendrant des sous-espaces invariants. On devra considérer l’espace quotient pour trouver une représentation unitaire. Comme pour tout p > O
une condition nécessaire d’unitarité est que l’on ait les inégalités h 2 O et c 2 O. Nous trouvons donc seulement des poids positifs dans les modèles unitaires. Les poids négatifs, qui correspondent à des corrélations croissant avec la distance, ne sont cependant pas exclus dans le cas non unitaire. Nous avons donc unitarité
--r.
c 2 O,
h2O
(82)
Dans toute représentation le nombre d’états linéairement indépendants au niveau n ne peut excéder p ( n ) , nombre de partitions de l’entier n. Si l’on convient de définir p(0) = p ( 1 ) = 1, la fonction génératrice des partitions due à Euler s’écrit 00
On suppose IqI < 1. La fonction de Dedekind q = exp 2ir.r’ jouera un rôle essentiel dans la suite.
Q(T)
= ~ l / ~ ~ P où (q),
114
INVARIANCE CONFORME
IX.1.5
Pour étudier la forme contragrédiente on va calculer son déterminant à chaque niveau n (au niveau O c’est 1 par définition). Ces déterminants,
dont l’expression a été obtenue par Kac,
sont manifestement des polynômes en c et h. Ils possèdent la propriété que det,(c,h) s’annule si et seulement si à un niveau n’ 5 n, il existe une combinaison linéaire
annihilée par tous les L,,p > O. Si un tel vecteur existe à un niveau n’ 5 n , il engendre au niveau n un sous-espace de vecteurs annihilés par les L,, p > O. Inversement si le déterminant s’annule, certaines de ses colonnes obéissent à des relations linéaires. Les vecteurs correspondants de la forme cyp) L-pl . . . L P p kIh), pi = n sont annihilés par tous les produits de L,!, C p ! , = n. Un raisonnement par récurrence montre qu’il doit exister un vecteur singulier de degré n’ 5 n. S’il existe de tels vecteurs singuliers (ou “nuls”) tels que n’ > O, la représentation de V est réductible. Pour obtenir une représentation irréductible le sous-espace maximal invariant engendré par les vecteurs singuliers peut être éliminé en considérant l’action de l’algèbre de Virasoro dans un espace quotient. Ceci revient à dire que les champs qui créent ces vecteurs singuliers par application sur l’état du vide IO), doivent être égalés à zéro. Ceci nous permet de distinguer à c fixé des valeurs privilégiées, des poids conformes correspondant aux racines des déterminants de Kac qui sont des polynômes en h. Ces derniers peuvent être calculés en utilisant les relations de commutation. Les cas triviaux sont detc,(c,h)= 1
deti(c,h) = 2h
(85)
où l’annulation de detl pour h = O reflète le fait que 10) lui-même est un vecteur nul. Considérons le cas instructif n = 2 tel que
où les lignes et colonnes sont indexées respectivement par les partitions (2) et (1’1). En conséquence det2(c, h) = 2h [16h2
+ 2(c - 5)h + c]
(86b)
On observe que det2 contient detl en facteur. L’information nouvelle est l’existence de deux nouvelles racines, qui sont données par
IX.1.5
115
INVARIANCE CONFORME
5 - c f J(1 - c)(25 - c) 16 Ces racines sont complexes conjuguées pour c réel compris entre 1 et 25, et réelles dans les autres cas. On écarte la première possibilité et on examine les vecteurs singuliers correspondants de niveau 2, c’est-à-dire de poids h* 2. On peut vérifier directement que le vecteur
h* =
+
Li + 3
Is*) =
(88a)
1)L t l - L-2) Ih)
obéit à
Lo
1%)
= (hi
+ 2)
L,
IS&)
1 4= 0
p
>O
(88b)
Afin de vérifier (88b), nous observons que LI et L2 engendrent, via les relations de commutation, tous les L,, p > O. Pour la suite il est commode d’introduire la paramétrisation suivante de la charge centrale, pour tout m réel, complexe, fini ou infini c=l-
6 m(m 1)
+
(89)
Les valeurs h& ci-dessus prennent la forme
+
+
[2(m 1) - mI2 - 1 h+ =-m 3 4m 4m(m 1) m - 2 - [m+i-2m] 2 -1 h- = 4m(m 1) 4(m 1)
+
+
(90)
+
Ce qui précède est formulé dans le langage opératoriel. Nous pouvons aussi l’exprimer en termes du développement à courte distance d’un champ primaire A (de poids h ) avec un produit de champs T ( z ) . Afin d’alléger les notations, nous omettons à nouveau l’argument de A. Les équations (40) s’interprètent en disant que, lorsque T ( z ) est inséré dans les fonctions de corrélations, on a le développement à courte distance
A(O)(u)=hA(u)
... ainsi que
116
INVARIANCE CONFORME
T ( z ) T ( u )=
3C ~
(z-u)4
W u ) +-(.-up
1 dT(u) ++ . .. ( 2 - u ) du
IX.1.5
(91b)
Nous avons donc une correspondance A ( 0 ) H Ih), A(O)(O) H Lo Ih), A(-’) H L-, Ih). On peut répéter pour les champs dérivés A(-,) le dévelop(0) pement à courte distance ci-dessus, définissant A(-Pl?-P?)en correspondance avec L p P lL-p2 Ih) , et ainsi de suite. Le champ primaire A , ou A(O) = hA(z) a des propriétés de transformation connues; il en est de même de A(-I)(u) = ûUA(u). I1 est instructif de déterminer les lois de transformations des champs secondaires ou “descendants’’, afin d’obtenir une nouvelle interprétation des vecteurs singuliers, en termes des champs correspondants. Rappelons que si A est primaire
I1 est clair que A(-1) ne se transforme pas comme un champ primaire. Pour obtenir le comportement de A ( - 2 ) , on compare les développements de courte ) , utilisant la loi de transformation (92). distance de T ( z ’ ) A ( z )et T ‘ ( < ’ ) A ‘ ( < en Ainsi
Après des calculs assez laborieux, nous trouvons que
IX.1.5
INVARIANCE CONFORME
117
Nous laissons au lecteur courageux le soin de déduire les formules correspondantes pour A(-P1,-Pz-...)!Le moins que l’on puisse dire est que les champs secondaires ont des lois de transformation assez complexes. Comparons cependant ( 9 3 a ) au comportement de a : A ( z ) correspondant à l’état L z l Ih);nous avons
Si l’on forme la combinaison 3
x * ( z ) = 2(2h*
+ 1) û : A ( z ) - A ( - 2 ) ( z )
on vérifie sans difficulté que pour chacune des valeurs h* données par (87) ou (90)
En d’autres termes, les vecteurs singuliers correspondent aux combinaisons des champs secondaires, provenant du développement à courte distance avec le tenseur impulsion-énergie, qui se transforment comme des champs primaires avec un poids augmenté d’un entier. Cette équivalence est utile en ce sens qu’elle montre que si x est une telle combinaison, exiger que x s’annule est une condition cohérente (covariante) indépendante du choix de coordonnées. En termes de représentations, ceci revient à quotienter par les espaces invariants, obtenant ainsi des représentations irréductibles. Finalement nous verrons que l’existence de telles conditions entraîne que les fonctions de corrélations du champ initial satisfont à des équations aux dérivées partielles qui permettent essentiellement de les déterminer. Naturellement, le poids conforme h associé doit être choisi comme une racine d’un déterminant de Kac.
Considérons un champ Al tel que hl G h k . Exiger que xk s’annule entraîne que les fonctions de corrélations impliquant ce champ satisfont à des équations aux dérivées partielles du second ordre de la forme
obtenues à partir de l’équation (40) en utilisant le développement à courte distance de T avec Al. De manière analogue on obtiendra les équations
118
IX.1.5
INVARIANCE CONFORME
d’ordre plus élevé lorsqu’on aura affaire à des vecteurs singuliers de niveau plus élevé. Nous voyons ainsi que la théorie conforme offre la possibilité de déterminer certaines valeurs remarquables des poids conformes (ou des exposants critiques) ainsi que les fonctions de corrélations des champs correspondants. Dans ce but, il apparaît donc essentiel d’obtenir une expression explicite des déterminants de Kac à tout niveau. Montrer qu’au niveau 3
dets(c, h ) = 48h2 [16h2
+ 2(c - 5)h + c] [3h2+ (C - 7 ) h+ + 21 C
et obtenir les vecteurs singuliers correspondants. Montrer qu’en général det,est un facteur de det,.
1
1.6 Les déterminants de Kac C’est à Kac que l’on doit l’expression n
det,(c, h ) = cst x
( h - hT,s)p(n-TS)
(96)
I-.*=1
1
où, la charge centrale étant paramétrisée comme indiqué par la relation (89)’ les racines hr,s,indexées par deux entiers positifs T et s, s’écrivent h,s =
[T(m
+ 1)- smI2 - 1
4m(m
+ 1)
(97)
Une racine hT+ donnée apparaît pour la première fois au niveau n’ = Inf(Ts) et se propage avec une multiplicité p ( n - n’) au niveau n (la borne inférieure porte sur l’ensemble des paires T , s donnant la même valeur pour hT+.).On peut vérifier l’expression (96) pour des petites valeurs de n par un calcul direct. On note que la paramétrisation c = 1 - 6/m(m 1) est singulière pour c = 1 ou 25. Ces deux cas exigent un traitement particulier. La démonstration par Feigin-Fuchs du résultat fondamental (96)’ (97) est assez complexe, mais intéressante. C’est elle que nous allons reproduire ci-dessous. Comme les valeurs obtenues pour les poids résolvent essentiellement le problème de la détermination des exposants critiques d’une grande classe de modèles en deux dimensions, cette preuve mérite d’être présentée en détail, mais elle peut être omise sans dommage par un lecteur qui le souhaiterait.
+
il n’est pas difficile d’obtenir le degré de det,(c,h) en tant que polynôme en h. On se convainc aisément que le monôme de plus haut degré provient du produit des termes diagonaux dans la forme contragrédiente, chacun d’entre eux étant le coefficient de Ih) dans l’expression
IX.1.6
119
INVARIANCE CONFORME
cy
de degré 'Yk dans h. Nous avons donc la formule suivante pour le degré p n du déterminant de Kac de niveau n
La première somme porte que les partitions de n, et a k est ie nombre de fois qu'un entier k déterminé, 1 5 k 5 n, apparaît dans une telle partition. Nous 1 et écrivons une fonction génératrice, pour IqI < 1 , sous la forme posons po
m
W
=
p(n')qn' n'=O
00
qps r,s=l
=
qn n=O
[
; ; : ;
]
p(n - TS)
ce qui est le résultat attendu. On observera que le coefficient du terme hPn, indépendant de c, omis dans (96) s'écrit, d'après Coste,
Utilisant leurs notations, nous passons maintenant à la preuve de Feigin et Fuchs. Elle se décompose en quatre étapes.
(i) On introduit d'abord l'espace vectoriel FA,@des séries de Laurent (nous posons z = e", en autorisant des puissances arbitraires de z )
de poids -A, c'est-à-dire se transformant selon f(z)
-
f'(<), avec
120
INVARIANCE CONFORME
IX.1.6
dans une application analytique z t-> t. Le prime de f'(<) ne représente pas bien entendu une dérivée. Choisissons une base f(k)(Z) = z k , et considérons une transformation infinitésimale = z - 6cz1-j, pour j entier,
<
L'ensemble des générateurs { e j } fournit donc une représentation de l'algèbre de Lie des difféomorphismes du cercle unité, généralisant les expressions (73). Pourvu que X A' i = p p' p 1 = 0,p entier, l'intégrale
+ +
+ + +
(103a) est une forme bilinéaire invariante sur @ Fxr. De même si X p - p' 2X' p 1 = O , la forme contragradiente
+
+ +
+ A' + 1 = (103b)
est aussi invariante. Considérons maintenant le produit extérieur d'ordre n, Fxll. Montrons que le déterminant
An
An
définit une application Fxp 4 FnX-tn(n-l),nri.Pour le voir nous formons un vecteur à n-composantes fo(z), ..., f n - l ( z ) d'éléments de Fxp évalués en n points 20, ..., z n - l . Dans une application c* t , on a par hypothèse detf,!(<j) =
fi k=l
(%)'
(*) dtk
detfi(zj)
Si zi = z + c i , et si tous les ~i tendent vers zéro et sont du même ordre, nous avons
De même ti = dominants
+ ~i d
qui est la propriété requise.
IX.1.6
121
INVARIANCE CONFORME
La fonction constante appartient à Fo.0. I1 s'ensuit, en utilisant (103), que si
X = (n - 2)(n
+ i)/2n
p
= -1 - p/n
nous en déduisons que chaque fois que n fonctions l'intégrale y sur le cercle unité
y=
f
A 2inzp+n d e
I$[
fj
(104a)
appartiennent à FA,^,
t
(104b) Oik,j
fournit une quantité invariante. La définition (103a) avec p = O nous permet de conclure à l'existence d'un élément de AF-l-h.-i-r.
A
F-(n-i)fn+l)/an,p/n
An
FA,^ correspondant à l'invariant y. I1 suffit pour cela de le dual de substituer dans (104b) le développement
dk
+W
-f.(z)= dzk
q(q-l)...(q-Ic+l)zQ-k
dz'
q=-00
Par conséquent, si P désigne une permutation de n symboles, (-l)p signature de P, on trouve
xdet
:.
la
.: n-1
L'expression du dernier déterminant résulte de la formule de Vandermonde. Substituons qi -+ -qi, et rappelons que les vecteurs de base z j ont été notés Io).Nous aboutissons à la formule
122
INVARIANCE CONFORME
IX.1.6
où ( , est la forme bilinéaire (103a) pour p = O . Nous lisons sur ce développement que l’élément invariant correspondant vn, p , appartenant à
An ~ - ( n - ï ) ( n + 2 ) / 2 n , p / n i
est
r
+m
1
(ii) Dans la seconde étape, nous associons à FA+ un espace de Fock fermionique et une représentation correspondante de l’algèbre de Virasoro. A chaque entier i, positif ou négatif, nous faisons correspondre une paire ai,ut d’opérateurs obéissant aux relations d’anticommutation canoniques usuelles
= 6ij
{ai,.;}
L’état de référence IR) ou “vide” obéit par convention à
220
ai IR) = 0
i
ut IR) = O
ce qui veut dire que tous les états à une particule tels que i < O sont occupés, et tous ceux tels que i 2 O sont vides. Correspondant au choix (107) nous avons l’ordre de Wick naturel : :, où les opérateurs ai (i 2 O ) ou a l ( i < O ) sont à droite des ai(i < O ) ou a t ( i 2 O ) , en prenant en compte le signe de la permutation requise pour mettre un monôme donné dans cet ordre. Nous formons alors deux opérateurs quadratiques, une charge Q et un hamiltonien H , définis comme suit. Tout d’abord +m
: akak := E U L a k
Q= -m
k>O
-X
a k a L
k
annihile In) et commiitera avec la représentation de l’algèbre de Virasoro. Pour un secteur de charge Q = n, il est commode d’introduire un nouvel état de référence IR,n) (tel que IR,û) e IR)). Cet état est annihilé par les a;(i 2 n ) et les a t ( i < n ) . I1 correspond à l’occupation des états à une particule jusqu’à (n - 1). Si l’indice est vu comme une énergie, le hamiltonien H s’écrit
-00
k20
k
Naturellement, l’état à une particule d’indice k = O ne contribue pas à H , qui est un opérateur positif et obéit à
H IR, n ) = i n ( n - 1) IR, n )
(110)
IX.1.6
INVARIANCE CONFORME
123
expression valable pour n positif ou négatif. Observons que IR, O ) et IR, 1) ont la même énergie. Pour tout entier j différent de zéro, nous définissons des générateurs de l'algèbre de Virasoro, version quantique de (102), à savoir
L'ordre de Wick est ici sans effet, étant donné que k et k - j sont distincts. Dans le calcul des commutateurs nous utiliserons les identités
[ A B ,Cl = A {B,C } - { A ,C } B [ A B , C D ]= A { B , C } D - A C { B , D } + { A , C } D B - C { A , D } B
(112)
Les formules ci-dessus pour Q , H et Lj prennent une forme plus compacte si l'on introduit une paire de champs de Fermi
Alors
Si maintenant j , k et j j ,k , j
+ k sont tous différents de zéro
+ IC # 0
[ L j ,Lkl = ( j - b)Lj+k
Pour obtenir une expression de LO et de la charge centrale, on calcule pour j
# O le commutateur suivant
Nous arrivons ici à un point délicat, où il faut être soigneux. Une telle expression est singulière, et il est déconseillé de faire une translation sur les indices. Dans un sous-espace de charge fixée &, si l'on agit sur un vecteur
(115)
124
INVARIANCE CONFORME
IX.1.6
d’énergie finie, l’opérateur aiak - a i + j ak+j s’annule pour lk\ suffisamment grand. Par conséquent, telle qu’elle est écrite, l’expression précédente est bien définie. Supposant j positif, nous observons que
et donc
Avec
j-1
Cl=j k=O
j-1
j-1
k2 = i j ( j - 1)(2j - 1)
k = f j ( j- 1) k=O
k=O
nous définissons dans le secteur de charge Q = n
de telle sorte que
[Lj, L - j ] = 2jLo
+ h C j ( j 2 - 1)
c = - 2 [6A(A
+ 1) + 11
(117)
(118)
Manifestement l’équation (117) est aussi valable pour j négatif. Finalement, combinant les définitions (11) et (116), nous pouvons vérifier la dernière relation de commutation de l’algèbre de Virasoro.
[Lo,L j ] = -jL3
(119)
Ceci est un exemple typique de représentation, que nous notons 3 ~ , ~ dans ,,, le secteur de charge n, exhibant la charge centrale comme une anomalie quantique. Ici c est uniquement fonction de A et obéit à .(A)
= c(-1-
A)
L’adjoint de Lj (A, p ) pour X et p réels est tel que
(120)
IX.1.6
125
INVARIANCE CONFORME
La correspondance X + A‘ = -1 - A, p + p’ = p - 1 - 2X, qui laisse la charge centrale c et la partie c-nombre de Lo invariants, est identique à celle qui apparaît dans la définition de la forme contragrédiente (103b) pour p = O . Les représentations 3 ~ et +F - ~ - A + - ~ - zsont A donc contragrédientes. Incidemment, on observe que pour X = 1, qui correspond dans notre notation aux champs vectoriels (ou, de façon duale, quand A‘ = -1 - X = -2, à des différentielles quadratiques), la valeur de la charge centrale est c = -26. Ceci est la valeur cruciale dans la quantification de la corde bosonique, qui donne l’anomalie du système de fantômes de Fadeev-Popov requise pour imposer l’invariance par reparamétrisation (voir chapitre XI). Cette anomalie doit être compensée par la contribution des coordonnées bosoniques libres, qui ont chacune une charge centrale unité, et ceci conduit à la nécessité de plongement dans un espace de dimension 26 pour obtenir un modèle cohérent. Le choix de l’état de référence IR) et la définition correspondante des états de charge nulle n’avaient rien de nécessaire. L’opérateur de translation des indices définit une transformation canonique
qui engendre un isomorphisme entre les secteurs de charge nulle et de charge n. L’effet de cette translation sur l’ordre de Wick n’est cependant pas trivial. notées simplement En conséquence, les représentations et FA,~+,;O, FA,^+^, sont isomorphes. De fait la quantité p n’apparaissait qu’au travers de la combinaison p n dans (116), et la charge centrale est indépendante à la fois de p et n. On vérifie que
+
Lo IR, n)
=hn
Lj p , n ) =O
IR,n) j>O
Par conséquent FA,^;, admet IR, n ) comme vecteur de poids dominant h,. Illustrons cette construction sur l’exemple le plus simple, qui correspond Dans le secteur de charge nulle, pour tout j
àX =p =
-2.
c =1 Ce secteur implique deux types de fermions, de charge opposée et avec c = 1. On devine donc qu’il existe une théorie fermionique réelle (fermions de Majorana), possédant un seul type de fermions, qui sera étudiée ultérieurement Si 2 désigne dans ce chapitre, à laquelle est associée la charge centrale c = l’ensemble des entiers, et si l’on définit
i.
126
IX.1.6
INVARIANCE CONFORME
le champ @ est bivalué, mais les combinaisons bilinéaires sont bien définies sur le cercle unité. Posons
Dans cette expression, le symbole de Wick : : impose d’ordonner les ak, > O , à droite de ceux ayant k < O , en tenant compte des signes dus aux permutations. L’état de référence est annihilé par les opérateurs ak, k > O et
k
Lo =
Ck21/2
ka-kak est un opérateur positif. (iii) Nous prenons maintenant X égal à A0
=-
(n - l ) ( n 2n
+ 2)
où n est un entier plus grand ou égal à deux, afin de construire une fonction q ~ comme ~ , dans ~ (105) avec p = p / n . L’opérateur
est tel que
Par conséquent q5’k augmente la charge de nk, et obéit par construction à
ce qui veut dire qu’il engendre un vecteur singulier de l’espace N F A O , p = p l n + n en k i utilisant (122).Considéré comme élément de cet état peut être obtenu en faisant agir sur IR,-nk) l’opérateur la raison du prime ci-dessus) où
4J=
E
qjk
(c’était
IX.1.6
127
INVARIANCE CONFORME
et satisfait à
[ H , @ ] = k (1 - p - i n ( n + 1) - n 2 k ) 4k
[ O , d k ] = nk4k
(131b)
Posons
P PO = -
n
Comme H IR, -nk) = i n k ( n k de charge nulle
+ nk
(132)
+ 1) IR, -nk), le vecteur singulier dans l’état
obéit à &Is) = O
LO(X0, PO)
j>O
Is) =(ho
+ ek) Is)
(134)
L j ( X 0 , PO) Is) =O
avec xo et PO donnés par (127) et (132), et
e = 1 - p - in2(1+ k )
e et ho désignant
ho = i P O ( P 0 - 2x0 - 1)
Finalement la charge centrale c est donnée par (118), où l’on substitue A. Comme
(135) A0
à
L O ( x 0 , P o ) IR) = ho IR)
(136)
la construction de vecteurs singuliers a un sens (c’est-à-dire que Is) f O ) à condition que !k soit positif, soit p
< 1 - $2(k
+ 1)
(137)
Nous avons ainsi introduit trois entiers arbitraires n , p , k , de telle sorte que ek soit toujours entier. I1 en résulte que e est entier, sauf si n est impair et k pair, auquel cas est demi-entier. Afin d’écarter cette possibilité, nous supposons n pair. (iv) Revenons à la preuve de la formule de Kac. Considérons un module de Verma abstrait, de charge centrale c(X0) et de poids dominant ho, correspondant au vecteur Iho) . Utilisons la notation abrégée { L - j } pour désigner un produit ordonné d’opérateurs L - j . Au vecteur { L - j } Iho) nous faisons correspondre un des deux kets
{ L - j } Ibo) f { L - j ( X O , P O ) } {L-j) b o )
5 {L-j(-l-
IR)
X0,PO
- 1 - 2x011 IR)
D’après l’équation (121), le second ket est dual du bra (RI {Lf(Xo,po)},et ho est invariant dans la substitution correspondante.
128
INVARIANCE CONFORME
IX.1.6
Supposons que le module de Verma possède un vecteur singulier à un niveau inférieur ou égal à r. Si l’application f, qui préserve la suite des niveaux, est surjective, FA^,^,, possédera également un tel vecteur singulier. Si l’application n’est pas surjective, il doit exister dans le secteur de charge nulle un ket lu),dont l’énergie d’excitation est plus petite ou égale à r, et qui est orthogonal à l’image de f. I1 s’ensuit que (uI { L - j ( X o , P O ) } 10)= O pour tous les ensembles L - j tels que E j = r. Par conjugaison, on en conclut que lu) est ~o. si l’image par f ou un vecteur singulier pour F - ~ - x o , p o - ~ - 2Inversement, g admet un vecteur singulier à un niveau 5 r, on voit immédiatement que ceci doit également être le cas du module abstrait. Pour X et p arbitraires, considérons la quantité
Le produit bao(X, P ) ~ - ~ , - B ( X , p ) , symétrique en (Y, /3, est aussi invariant dans la correspondance X -+ - l - X , p 4 p- 1-2X. I1 est donc uniquement fonction de h (donné par l’équation (116) avec n = O ) , et c (donné par (118)). On trouve
+
+
= -(n - l ) ( n 2 ) / 2 n , p = PO = nk p/n, n pair, et donc entier, nous venons de voir que le déterminant de Kac de degré kE doit s’annuler. On vérifie que
Pour X =
A0
e = 1 - p - n 2 ( k + 1)/2
b-k,-e(Xo,po)
=0
En conséquence, le déterminant de niveau kl doit s’annuler sur un nombre infini de points de la courbe Bk,e(C,h) = O. Cette dernière est irréductible Par conséquent detkt(c,h) est divisible par Bk,e(c,IC) ou sa racine si k # lorsque IC = e, et Bk,k est un carré. 11 s’ensuit que det&(c, h ) admet ~ k , t ( ch,) comme facteur. Comme un vecteur singulier au niveau r engendre un zéro d’ordre p ( s - r ) au niveau s 2 r , la quantité
e.
divise det,(c,h)2. On vérifie que les deux expressions ont même degré en h. En conséquence, et à un facteur indépendant de h près
IX.1.6
129
INVARIANCE CONFORME
Finalement Bk,e est symétrique en k et e, et apparaît donc deux fois dans le produit (142) pour k # e, tandis que B k , k est un carré
+
De plus, en utilisant la paramétrisation c = 1 - 6 / m ( m l), on voit que
Bk,! = ( h - hk,!)(h - k k )
(143)
avec h k , ! donné par l’équation (97). Ceci permet de prendre la racine carrée dans (142) et produit la formule de Kac (96).
1.7 Représentations unitaires et minimales Achevons la discussion des conditions sur c et h requises pour qu’une représentation soit unitaire, c’est-à-dire telle que
L’3 = L-j
(144)
Supposons que le module (ou espace vectoriel) engendré par un poids dominant h soit un espace de Hilbert muni d’un produit scalaire qui donne la forme contragrédiente (79a). Deux situations peuvent se présenter : (i) soit cette forme est définie positive (ii) soit il existe des vecteurs singuliers, engendrant des sous-espaces invariants qui doivent être factorisés, l’espace quotient étant alors tel que la forme résiduelle soit à nouveau définie positive. Ces conditions sont aussi suffisantes. Nous avons déjà vu qu’une condition nécessaire d’unitarité est
Dans l’intervalle O < c < 1, Friedan, Qiu et Shenker ont montré que les seules valeurs compatibles avec l’unitarité sont telles que: (i) c a la forme (89) avec m entier, m 2 2 ( m = 2 correspond à c = O et à la représentation triviale) (ii) les poids h sont donnés par les zéros du déterminant de Kac, les deux entiers T et s prenant un nombre fini de valeurs 1 5 s 5 T 5 m - 1. En résumé
+
c =1- 6/m(m 1)
m entier 2 2
Si nous utilisons seulement la restriction 1 5 s 5 m, 1 5 T 5 m - 1, chaque poids hr,sapparaît deux fois, puisque hr3$ hm-r,m+l-s. Les représentations de ce type sont donc caractérisées par un entier m >. 3 et un ensemble fini de poids possibles, et donc un ensemble fini de
130
INVARIANCE CONFORME
IX.1.7
dimensions possibles pour les observables fondamentaies, ou primaires. Dans ce sens nous pouvons appeler les représentations correspondantes minimales. Les modules de Verma associés possèdent des vecteurs singuliers, c’est-à-dire des sous-espaces invariants. Pour la même valeur de e, il est ainsi possible d’introduire des champs appartenant à des représentations de poids h , , , où T et s sont extérieurs au domaine ci-dessus. Ceux-ci pourraient intervenir dans la construction d’autres types de modèles, qui ne seront pas envisagés ici. I1 est utile d’introduire un tableau des inclusions de sous-espaces invariants, tableau qui nous permet de comprendre le décompte des états linéairement indépendants qui subsistent à un niveau donné, une fois que les sous-espaces invariants ont été factorisés. Fixons une valeur de c satisfaisant aux inégalités (145). Feigin et Fuchs ont déterminé l’ensemble des inclusions entre modules de Verma, représenté sur la figure 3, résultant de la formule de Kac. Dans cette figure, une flèche pointe du plus grand espace vers un sous-espace. Les poids correspondants different par des produits d’entiers. De plus cinq sous-espaces tels que M , N ’ , N ” , P’, P” sont tels que M contient la somme (qui n’est pas une somme directe) N’ @ N ” , tandis que l’intersection N’ n N” est égale à la somme P’ @ P”. Pour obtenir la représentation irréductible dont le poids figure au sommet, avec r et s dans le domaine défini en (145), on doit factoriser la somme de ses deux premiers “descendants”. Nous verrons dans la prochaine section des applications de ces ensembles d’inclusions. Lorsque c est supérieur à 1, il n’y a pas de contrainte sur la charge centrale due à l’unitarité. Pour c = 1, il existe à nouveau une forme (plus simple) de réductibilité (et d’unitarité) chaque fois que h = an2 avec n entier. Comme nous ne prétendons pas donner ici une présentation exhaustive, nous nous limiterons pour l’essentiel à des valeurs de c dans le domaine c 5 1, conduisant aux exemples les plus simples. Ils incluent de nombreux modèles, possédant au plus des symétries discrètes pour c < 1. Dans le cas de la série minimale unitaire, nous illustrons les considérations qui précèdent en montrant sur la figure 4 les trois premiers exemples de grilles de poids conformes. Les attributions à des modèles concrets seront justifiées ultérieurement. I1 est intéressant d’observer que l’invariance conforme à elle seule prédit l’existence de systèmes avec un petit nombre d’exposants rationnels. Ce qui reste à trouver est la clé de correspondance dans des exemples spécifiques, ansi que la signification physique des observables. Les représentations minimales ne sont pas nécessairement unitaires, ainsi que le démontre l’exemple le plus simple présenté ci-dessous. Naturellement on peut admettre certaines pathologies, comme des corrélations croissantes, qui doivent recevoir une interprétation appropriée. Ces cas minimaux s’obtiennent en substituant dans la formule c = l - 6/m(m l)
+
IX.1.7
INVARIANCE CONFORME
[m- r , rn
131
+ i - SI
[2m- r , s]
[r
+ m ,m + 1 - SI
[3m- r , m + i - s]
[r
+ 2m, s]
[4m - r , s]
[r
+ 3m,m + I - SI
+ i - s]
[r
+ 4m, s]
[5m- r , m
Figure 3:Inclusions des modules de Verma [T’, s’] correspondant à une charge centrale c = 1- 6/m(m 1),m 2 3, et hr,,s,= [ ( ~ ’ ( m1)- ~ ’ m- ) ~ 1]/4m(m 1).
+
+
+
une valeur de m rationnelle. Par exemple si p et p’, p > p’ sont deux entiers positifs premiers entre eux, tels que m = - p’ m+l=- P (146a) P-p’ P- p ’ la valeur correspondante de c (qui n’est plus restreinte à être positive) est donnée par
c = l - 6(P - P’I2 (146b) Pp’ Les poids conformes des représentations minimales correspondantes prennent la forme
132
IX.1.7
INVARIANCE CONFORME
s=4
s=
s=2d 23
2
1
0
r=l 2 m=3
Ising
f
3
s=l
s=
r=l 2 m=4
3
5
5
r=l 2 3 m=5
4
Potts à 3 états
Ising tricritique
Figure 4: Grille des poids conformes pour les trois premiers exemples de représentations unitaires minimales. Pour p,p’ définis comme ci-dessus on peut trouver T O et SO dans le = 1. I1 s’ensuit que pour p - p’ 2 2, domaine indiqué tels que (rop il existera des poids négatifs dans la table. Le champ scalaire correspondant A h o , ~aura o des corrélations qui croissent avec la distance. Ceci était exclu dans un cas unitaire. La cohérence de ces modèles minimaux sera étudiée dans la section 3. Afin de montrer que ceci n’est pas une possibilité académique, considérons l’exemple suivant dû à Cardy, impliquant un champ scalaire unique, outre l’opérateur unité (et ses descendants comme le tenseur énergie-moment). En nous concentrant sur l’algèbre V, nous cherchons une grille à deux cases (prenant en compte la symétrie indiquée dans (147)). Avec la duplication, ceci veut dire quatre éléments dans les intervalles 1 5 T 5 p’ - 1, 1 5 s 5 p - 1 tels que p > p ‘ , et p et p‘ premiers entre eux. L a seule possibilité est une colonne unique ( r = 1, p’ = 2) de quatre poids ( p = 5, 1 5 s 5 4) égaux deux à deux. En conséquence nous avons deux poids indépendants, et les valeurs de h et c sont c = -22
h = O , -15
5
L’unique champ scalaire non trivial A- 1 - 1 a pour dimension 5 -
5
A quelle théorie des champs en interaction (au point critique) ceci pourrait-il correspondre? Le seul candidat semble être le modèle scalaire avec un terme d’interaction en i(p3 avec un couplage cubique imaginaire pur, qui coïncide avec le modèle continu effectif de la singularité de Lee et Yang. Dans cet
IX.1.7
133
INVARIANCE CONFORME
example, il n’y a pas de symétrie brisée au point critique, mais la longueur de corrélation diverge, et le modèle n’a aucune chance d’être unitaire. Désignons, comme de coutume, l’exposant critique de la corrélation à deux points par 17. I1 s’ensuit que dans ce cas bidimensionnel 17 = 2A = ce qui est bien une valeur négative (ainsi les corrélations croissent avec la distance!). L’exposant O relatif à la singularité de l’aimantation est tel que
-2,
m,
N
(150)
‘h
où h désigne ici la déviation par rapport au champ magnétique critique (externe). Les lois d’échelle impliquent que O=-
d-2+17 d+2-17
~
d=2
L - - 1
4-17
‘
(151)
en excellent accord avec les simulations numériques. I1 existe une relation entre cette partie singulière croissante de l’aimantation et le fait que, après soustraction, il reste au point critique une corrélation qui croît à grande distance.
1.8 Caractères de l’algèbre de Virasoro Pour les applications ultérieures, il est utile de connaître les caractères des représentations de l’algèbre de Virasoro. Dans une représentation caractérisée par c et par le poids dominant h, ces caractères sont des fonctions génératrices des nombres d’états linéairement indépendants au niveau n, et correspondant donc à une valeur propre h f n pour LO. A q fixé, q = exp 2inr inférieur à un en module ( I m r > O), le caractère apparaît comme la trace dans la représentation donnée de l’opérateur qLo. En d’autres termes, si dim(h + n ) est la dimension de l’espace au niveau n on définit 00
~ ( ~ (, Th) = )
Tr qL0-c/24-
dim(h + n)qn+h-c/24
q = exp 21x7
n=O
(152) On verra plus loin le rôle du facteur supplémentaire q-c/24 inclus dans cette définition. Pour des valeurs génériques de c et h, quand la représentation de poids dominant est telle que le module de Verma correspondant n’a pas de vecteur singulier, il est clair que
La forme factorisée de P ( q ) montre que la série qui définit x converge pour tout 141 < 1. Partant de l’équation (83), il n’est pas difficile de montrer que le terme dominant dans le développement asymptotique de p ( n ) , le nombre de partitions de R , est (Hardy-Ramanujan)
134
IX.1.8
INVARIANCE CONFORME
La situation est plus intéressante pour les représentations dégénérées, où le module de Verma contient des sous-espaces invariants. D’après le diagramme du type indiqué dans la figure 3, et partant d’une expression telle que celle donnée dans (153), on doit soustraire des termes analogues. A chacune des étapes intermédiaires, la somme des espaces invariants n’est pas directe. I1 en résulte que, pour r et s dans la grille conforme, la formule des caractères des représentations minimales obtenue par Rocha-Caridi s’écrit, avec X(c,h,,) E x T , S
Dans cette expression, comme dans (146), p et p’ sont des entiers premiers entre eux tels que p > p’, r varie entre 1 et p‘ - 1, s entre 1 et p - 1, avec une restriction supplémentaire, par exemple r p - sp’ > O, afin d’éviter un double comptage. La charge centrale vaut c = 1 - 6(p - ~ ‘ ) ~ / p pOn ’ . obtient les modèles minimaux unitaires pour p’ = m , p = m + 1, m entier 2 2. (i) Dans le cas minimal unitaire, la représentation irréductible correspondant à rn = 2 est trivia.le, de dimension 1. Posant x 1 dans la formule (155) on obtient l’identité (pentagonale) d’Euler
(156) n=-cc
1
(ii) I1 est possible de présenter l’expression (155) des caractères sous une forme plus compacte, qui nous sera utile par la suite, en introduisant la notation suivante. Soit N = 2pp’ un entier pair. Au lieu d’indexer le caractère par le couple r, s correspondant à hr,6 dans (147), utilisons un entier X T P - sp’ modulo N . Observons que si wo TOP sop‘ mod N , avec rop - sop’ = 1 (étant donné que p et p‘ sont premiers entre eux), nous avons 1 mod 2N et woX rp sp’ mod N . Finalement on substitue à P ( q ) la fonction de Dedekind
=
wi
+
+
n
q(,r) = q 1 / 2 4 ~ ( q ) = q 1 / 2 4
- qn)
1
où nous utilisons comme ci-dessus la notation q = exp 2ia7. La formule (155) peut alors être récrite
IX.1.8
135
INVARIANCE CONFORME
(158a) montrant que
Ces caractères peuvent être exprimés à l’aide de fonctions elliptiques. Dans l’appendice A nous rappelons quelques propriétés des séries 0 de Jacobi qui sont utiles dans ce contexte.
I1 existe d’autres formules non triviales pour les caractères, correspondant aux sous-espaces invariants irréductibles inclus dans les modules de Verma réductibles. On note aussi que pour c = 1 et h = aa2 (a entier), on a une chaîne linéaire d’inclusions qui conduit au caractère
2. Exemples Donnons maintenant quelques exemples élémentaires de champs conformes. Nous reprendrons la discussion générale dans la section 3.
2.1 Modèle gaussien L’exemple le plus simple, et celui qui est en un sens la pierre angulaire de nombre de réalisations explicites, est le modèle du champ neutre de masse nulle gaussien, ou libre. L’action correspondante s’écrit, avec p(x) réel
La normalisation est en accord avec notre définition du tenseur impulsionénergie. Avec un signe fixé par l’équation (57)’ ce dernier prend familière
La fonction à deux points fait intervenir une échelle arbitraire R I qui est un facteur de coupure infrarouge
136
INVARIANCE CONFORME
IX.2.1
Dans l’expression (161)’ on sous-entend une prescription d’ordre de Wick afin de donner un sens aux fonctions de corrélation de T , ainsi que nous le discutons ci-dessous. Le comportement logarithmique des corrélations du champ ‘p montre que ce dernier ne peut être pris comme un champ primaire orthodoxe (l’attribution éventuelle de poids conformes serait (0’0)). En revanche les dérivées de ‘p, ou certaines exponentielles en ‘p, sont candidats à être des observables. Les corrélations correspondantes auront un comportement en lois de puissances, et devront être telles que l’échelle arbitraire R disparaît, ainsi que nous l’avons vu au chapitre IV. Afin d’obtenir la charge centrale, nous calculons la fonction de corrélation ( T T ) , en omettant les auto-contractions du champ ‘p au même point. Ceci fournit l’expression attendue
et la quantité complexe conjuguée pour centrale est égale à l’unité c=l
( T T ) . Par
conséquent la charge
(164)
Ce résultat explique le choix de la normalisation de la fonction à deux points qui conduit à la définition de la charge centrale. La théorie du champ libre permet de comprendre comment l’anomalie calculée pour une transformation infinitésimale devient la dérivée schwarzienne dans le cas d’une transformation finie. La structure universelle implique que le calcul effectué pour c = 1 peut être généralisé en insérant n’importe quelle valeur de la charge centrale. La prescription de Wick peut être comprise comme une procédure de soustraction à courte distance, après une séparation des points correspondant aux arguments de T
expression à insérer dans une fonction de corrélation. Dans la formule ci-dessus, seule la singularité dominante à courte distance a une importance. Prétendons maintenant que dans ilne application conforme cp(z,Z) = (p(u,O). Dans le nouveau système de coordonnées, avec u = f ( z )
Nous avons ajouté et soustrait un terme de telle sorte que la partie entre (du/dz)2 dans la limite où les points coïncident, crochets s’identifie à
s(u)
IX.2.1
137
INVARIANCE CONFORME
tandis que le second terme correspond à l’anomalie. Posons zz=z,
21=2+6,
u12
--212
f’ + $ 6 f f ‘ + ~ 6 2 f f f ’ + . . .
L’anomalie s’écrit
en accord avec l’équation (50) pour c = 1.
En partant du champ cp, nous pouvons définir des familles variées d’opérateurs, et parmi elles les exponentielles (ordonnées de Wick) eiaq. La quantité a est analogue à une charge, étant donné que les fonctions de corrélation prennent la forme de poids de Boltzmann, impliquant des potentiels de Coulomb classiques (c’est-à-dire logarithmiques en dimension deux) entre paires de points. De telles corrélations n’ont de sens que si la charge totale s’annule, ainsi que nous allons bientôt l’expliquer. L’ordre de Wick implique l’omission des auto-contractions et l’on trouve
Si, au lieu d’utiliser la prescription de Wick, nous avions conservé les auto-contractions avec un facteur de coupure ultraviolet A = a-’, l’expression (a / R )* ;” , ce ci-dessus aurait été multipliée par un produit de facteurs qui montre que l’ordre de Wick revient à une renormalisation multiplicative (infinie) de eiap. Cependant ce facteur dépend aussi de l’échelle infrarouge R. Choisissant de normaliser les opérateurs à une valeur donnée Ro, nous pouvons étudier la dépendance résiduelle en R de la forme R-”/’, u = f f j ( Y k = ( C c ~ j )Ainsi ~ . les corrélations sont-elles indépendantes de R si et seulement si les charges satisfont à la condition de neutralité: C a j = O. Si cette condition est violée, les corrélations s’annulent à la limite R -+ CO. Cette discussion montre également que la dimension de eiap est $a2.
n
cja3+xjzk
En particulier
138
IX.2.1
INVARIANCE CONFORME
Ceci veut dire que e‘””, ou encore mieux les formes réelles cos acp et sin acp, ont les poids conformes
(i) Quand a: est entier, le caractère associé est donné par l’équation (159), et le module de Verma correspondant admet un vecteur singulier au niveau a+ 1. Ce niveau est 2, si a = 1,auquel cas h = h. = et la corrélation (166) se
a
1
réduit à C l 2 = ( ~ 1 2 2 1 2 ) - 2 . Ceci est en accord avec l’équation (87), où, pour = 1, h+ = h- = Vérifier que l’équation (95) est satisfaite, étant donné
4.
c
que
-c6 2
(21’2,212)
621
=
(-+ --7 c 2 ’* ;:
212
an.
(212,
E n )
(ii) Nous avons supposé que le champ ’p prend des valeurs réelles arbitraires. Cependant le lagrangien est invariant par une translation dans l’espace des champs ‘p --i ‘p cst et par une réflexion ’p + -‘p. Ces propriétés peuvent être utilisées pour restreindre l’espace des valeurs des champs à des configurations où les points ‘p et ’p 2xp sont identifiés ( p est une constante), ce qui implique que ‘p prend ses valeurs sur un cercle (de rayon p), comme c’était le cas pour le modèle XY. Rien n’est changé dans les corrélations entre opérateurs de vertex (les exponentielles), pourvu que nous supposions que les charges
+
+
in P =+i
(:
+ m p ) in
(=) 2 - 21
- +i
(:
- mp)
in
(-) E
- E2
2
- 21
(168)
L’existence d’un terme imaginaire entraîne que, dans la translation terme croisé dans l’action donne (in/p)[‘p(i) -‘p(2)]. Quand on calcule l’action classique correspondante et que l’on procède aux soustractions nécessaires, on trouve ‘p -+ ‘p+ ‘pci le
IX.2.1
139
INVARIANCE CONFORME
avec
En conséquence, l’opérateur de vertex généralisé On,m a un spin entier égal à nm. Le fait que le produit de la charge par la “vorticité” (ou charge magnétique) soit entier rappelle la propriété analogue déduite par Dirac pour le mouvement quantique d’une charge ponctuelle dans le champ magnétique d’un monopôle. Les poids conformes des opérateurs On,m dépendent d’un paramètre continu p. Ils apparaissent dans la discussion de plusieurs modèles à c = 1, qui possèdent une ligne continue d’exposants variables, comme le modèle d’Ashkin-Teller ou le modèle à “six vertex” (voir section 3.6). De la même façon on peut utiliser la symétrie
2.2 Modèle d’Ising Nous pouvons reformuler le modèle d’king critique présenté au chapitre
II dans le contexte de l’invariance conforme. Nous rappelons que l’action au point critique est effectivement celle d’un champ de Majorana libre. L’action et les fonctions de corrélation à deux points s’écrivent
($(a)$(z2)) = v
a 2
($(Zl)4(%))
= 1/z12
Les corrélations sont impaires dans l’échange 1 H 2, en raison de la statistique de Fermi, l’une est holomorphe, l’autre antiholomorphe. Le théorème de Noet her fournit l’expression du tenseur impulsion-énergie
avec une prescription d’ordre normal, de sorte que,
Les équations (171) et (173) sont compatibles avec le fait que $ a des poids O), et $ (O, Ainsi $ et $ ont-ils des spins demi-entiers, comme on s’y attendait. L’identité de Ward est en accord avec ces attributions, car il s’ensuit que
(i,
a).
140
INVARIANCE CONFORME
IX.2.2
La charge centrale est obtenue en calculant la corrélation
I1 est naturel de s’attendre à ce que le modèle soit construit à partir des représentations minimales (unitaires) de l’algèbre de Virasoro pour c = !j, c’est-à-dire m = 3. Nous avons vu que la table de Kac fournit les poids O, $, et nous pouvons identifier les observables de spin entier, en fait zéro, comme étant celles avec h = L, selon le schéma
hi
La densité d’énergie possède une interprétation simple en termes du champ de Majorana, tandis que le spin a a une expression non locale en L’exposant critique r] est donné par la relation fonction des champs r] = 2A, = comme on s’y attendait. La divergence logarithmique de l’intégrale sur la corrélation énergie-énergie ( E E ) implique que l’exposant de la chaleur spécifique s’annuie, a = O (à un logarithme près) et v = 1. Les autres exposants critiques sont donnés par l’analyse standard des lois d’échelle, comme étant ni = et /3 = En résumé, une fois que la valeur de la charge centrale c = est connue, l’hypothèse minimale donne les autres exposants, ainsi qu’un moyen de calculer les corrélations critiques. On ne gagne pas grand-chose dans le cas présent, où l’intégrabilité (et une longue histoire) nous a fourni les résultats depuis longtemps. Nous pouvons en revanche utiliser cette connaissance pour vérifier le formalisme. Mais la voie est maintenant oiiverte pour l’application du même raisonnement à d’autres cas, où l’on en sait beaucoup moins, et où la puissance de la théorie des champs conformes devient évidente.
a,
$,?p.
4
i.
sont les deux solutions h* des équations (87)-(90) Comme f et impliquant l’existence de vecteurs singuliers au niveau 2, les fonctions de
4’
IX.2.2
INVARIANCE CONFORME
141
corrélation correspondantes obéissent à des équations aux dérivées partielles du second ordre. D’après le chapitre II nous savons que
(E(
I
1) ‘. . 4 2 n ) ) = Pf -
(177)
:il2
Prenons comme exemple la fonction à quatre points. Avec
On vérifie que
1
1 212
213
214
Le cas de la fonction de corrélation à quatre spins est plus intéressant, car ce n’est pas le module carré d’une fonction analytique, mais une combinaison des solutions indépendantes de l’équation correspondante. Récrivons d’abord l’expression (178) pour n = 2, avec T : ~= zij Z i j , comme
1 212
213
214
La fonction de corrélation est réelle, symétrique et positive. D’après la condition de factorisation asymptotique
sa normalisation se déduit de celle de la fonction à 2 points, que nous prenons égale à (a(l)(r(2)) = f i / r : ; * . En utilisant l’invariance globale, et le birapport
142
IX.2.2
INVARIANCE CONFORME
x = -212234 214232
où x prend les valeurs O , 1, écrivons
00
quand
21
coïncide avec
22, 23
ou
24,
nous
Les puissances dans les préfacteurs sont en accord avec les poids (1/16,1/16) de u. L’équation prend la forme hypergéométrique
{
x(1 - .)
62
az
+ (4 - z) - + 1 le}
f =O
d z .
Une solution générale est une combinaison de Nous avons la même équation pour la dépendance en 2. En conséquence, avec a&& des constantes
Ignorant la constante multiplicative globale, il nous reste trois constantes à déterminer à l’aide de la symétrie (et de la réalité) de la solution dans tout échange ( z i , , ? i ) u ( z j , , ? j ) . On exige aussi l’invariance par monodromie de la solution, ce qui signifie que la fonction de corrélation soit univaluée. Ceci peut être vérifié en suivant un chemin qui entoure l’une des singularités, O , 1, 00. L’analyse de ces contraintes donne a++ = a--, a+- = a-+ = O . En rétablissant la normalisation, on trouve
Prenant le carré de cette expression, on constate qu’elle est en accord avec le résultat attendu (178).
2.3 Modèle de Potts à trois états Le modèle de Potts a été introduit au chapitre IV. Ici nous nous restreignons au modèle à trois états. Sur un réseau carré la fonction de partition s’écrit
IX.2.3
143
INVARIANCE CONFORME
Le “spin” O = ei’+’ prend comme valeurs les racines cubiques de l’unité, et l’exposant est tel que la contribution de spins voisins est bUu,. Le modèle admet une symétrie globale Z 3 , et obéit à une relation de dualité possédant pour point fixe
eBc=l+J3
(180)
Plus généralement, pour un modèle à Q-états eoc = 1 + J&. Le cas Q = 2 correspond au modèle d’Ising (à un changement d’échelle près pour ,O). Pour Q > 4, on sait que le modèle possède une transition du premier ordre, tandis que pour Q 5 4 la transition est continue. Baxter (1980) a obtenu deux exposants critiques dans le cas Q = 3 ( Y = l3
,O=’
9
(181)
à condition de supposer que le modèle de Potts à trois états est dans la même classe d’universalité que le modèle des hexagones durs, modèle dont il a obtenu la solution. Ce dernier est un modèle de gaz sur réseau, où les “molécules” de forme hexagonale ont leurs centres aux noeuds d’un réseau triangulaire. Les hexagones couvrant six triangles élémentaires ne peuvent pas se recouvrir. On calcule une fonction génératrice pour le nombre de telles configurations. Le problème admet une symétrie Z 3 , correspondant aux trois sous-réseaux sur lesquels le gaz peut se “cristalliser”. Comme le modèle des hexagones durs et le modèle de Potts à trois états admettent tous deux une symétrie Z3 et sont des modèles “ferromagnétiques” avec des interactions à courte portée, il est très vraisemblable qu’ils appartiennent à la même classe d’universalité.
Des lois d’échelle vd = 2 - (Y, et
p = i v ( d - 2 + q ) , il s’ensuit
que
+
Le champ réel 2 cos cp = a 0. devrait avoir pour poids conformes (&, &). De même, l’opérateur thermique (couplé à l’écart à la température critique), désigné comme ci-dessus par E , a pour dimension A, = $ ( d - (Y/.) = La théorie des champs conformes devrait donc contenir les champs scalaires
4.
Nous parcourons maintenant les tables de Kac donnant les représentations unitaires de l’algèbre de Virasoro (figure 4). On constate que pour
144
IX.2.3
INVARIANCE CONFORME
5,
on trouve les deux poids et où le second admet un vecteur singulier au niveau deux. La table contient bien plus de candidats comme poids conformes, et les attributions précédentes sont encore provisoires. Un traitement numérique utilisant la méthode de rubans esquissée dans la section 1.4, confirme la valeur c = Des arguments supplémentaires seront présentés dans la section 3.
2.
Vérifier la cohérence des attributions précédentes en utilisant la fonction à trois points
( E ( z ~ , ~ ~ ) c o s ( P ( z ~ , Z ~ ) C O S 2( 3P) () Z=~ cst ,
1 Z12hc Z13hc Z232hm-he
x (c.c)
(185)
qui devrait obéir à l’équation différentielle
[
2(2h3+
-
2,3
((21
ho - zk)2
1
-41
+ z1
- zk
(€(1)COS(P(2)cos(p(3))= o .
Ceci requiert que
condition satisfaite pour he = $, h, = dans le cas du modèle d’king).
& (de même que h,
=
i, h,
=
&
I1 s’avère que les poids conformes figurant dans la table de Kac pour m = 5 n’apparaissent pas tous dans le modèle de Potts. Ceci sera discuté
dans la section suivante, où l’on examinera des exigences de nature plus globale. Ainsi que nous le verrons, la table suivante fournit la correspondance entre les poids possibles et les champs scalaires primaires
IX.2.3
145
INVARIANCE CONFORME
Seules les rangées avec s = 1, 3 apparaissent dans le modèle. Nous donnons d’abord la liste des champs scalaires en incluant la dégénérescence (c’est-à-dire le nombre de tels champs primaires indépendants). Par exemple, on s’attend à ce que le champ de spin ait une dégénérescence égale à 2.
Ao,o A 5i ’ 52 AI 7 A:,:
ident it é énergie
A&&
champ de spin
I E
X Y (T
2
A 23 ’ 2 3
2 tels champs 2 tels champs
(187)
On doit ajouter à cette liste des champs de moment angulaire non nul (respectivement f 3 et f1)
ce qui engendre une grande diversité d’observables. I1 est possible de définir une extension du modèle de Potts à Q états à des valeurs continues de la variable Q entre O et 4. La charge centrale est donnée par la formule c = 1 - 6/m(m 1), où m et Q sont reliés par
+
a Q = 4 ~ 0 s ’m+l
(189)
Les cas m = 2, 3, 5 correspondent à la percolation (bien que c = O , on utilise une suite infinie de représentations non triviales), au modèle d’king et au modèle de Potts à trois états. Le cas Q = 4 apparaît comme le cas limite où m --+ 00, c -+ 1. Voir section 3.6.
8
Si l’on tient pour correcte la valeur c = dans le cas Q = 3, on peut, en suivant Dotsenko, calculer la fonction de corrélation de quatre opérateurs énergie E. Cette dernière doit satisfaire à un cas particulier de l’équation (95), à savoir
Posons
146
IX.2.3
INVARIANCE CONFORME
En substituant, nous obtenons à nouveau une équation hypergéométrique
[
x(1- x)-
a l
d2 + 3 2 2 - 1)-da: - & f(x,?i) = O 8x2
Rappelons que I'kquation hypergéométrique
[
- x)--d2 dx2
+ (y - (1 + a + B)x)-d
1
- aB f(x) = 0
dx
admet pour solution
f(x) = A F ( a , B ; y ; x )
+ B xlF7(1 - x)7-u-8
F(l
- a, 1 -
B; 2 - y; x)
où F est la série de Gauss
-
r(Y)
avec ia notation ( a ) , = r(a
+ n ) / r ( a ) = a ( a + i ) ...(a+ n - 1).
Ici (y = - 8 p = ..-I 5, y = 5' équation en 3 , on déduit que
-5. Du fait que f(x,z) obéit à la même
Nous voulons à nouveau trouver les constantes fonction de corrélation soit uniforme. Posons
uij
de telle façon que la
IX.2.3
147
INVARIANCE CONFORME
Dans un prolongement autour d’une boucle fermée évitant les singularités à 2 = O, 1, 00, le vecteur F est transformé linéairement par une matrice à coefficients constants. Ces matrices de monodromie sont indépendantes de déformations continues des chemins à condition d’éviter les singularités. Elles sont engendrées par deux boucles élémentaires entourant des points 5 = O et z = 1 (la boucle autour de 2 = 00 est équivalente à leur produit). Appelons go et g1 les actions respectives sur F . On a
Pour obtenir 91, il est commode de transformer F en un vecteur 3 équivalent, adapté à la recherche des solutions régulières et singulières à 2 = 1, c’est-à-dire
(
3=
F ( a ,p; a - .)7-a-W(1
+ p + 1 - y; 1-).
- a, 1 - p; 1 + y - a - p; 1 - 2)
)
(199)
De la représentation intégrale (195) on déduit que
Comme
il s’ensuit que
Les deux transformations (198) et (202) deviennent unitaires pour a, p, y réels et AA’ < O (ce qui est vérifié dans le cas présent) si l’on fait un changement d’échelle sur les composantes de F suivant
148
INVARIANCE CONFORME
IX.2.3
ce qui conduit à
I1 en résulte que la combinaison (Fil2- I F Z l 2 /AX’ est invariante sous l’action de go et gl, et par conséquent pour le groupe de monodromie complet. I1 s’ensuit qu’à un facteur multiplicatif près, l’expression finale pour la fonction de corrélation est
B)
Les deux coefficients sont positifs, puisque r(- et -I?( - f ) sont tous deux positifs. De plus l’expression complète est symétrique dans ses arguments. (i) Vérifier la symétrie de la fonction de corrélation dans une permutation des arguments. (ii) En appliquant la même procédure dans le cas de corrélations impliquant deux spins et deux énergies, déduire l’expression obtenue elle aussi par Dotsenko (cos (p(l)&(2)cos (p(3)€(4)) =
Bien que la méthode soit très puissante, on conçoit que les expressions explicites deviennent rapidement assez complexes. I1 existe aussi des représentations intégrales qui sont discutées dans la littérature. I1 est néanmoins réconfortant de voir de tels résultats émerger d’une approche aussi générale. Ils permettent de vérifier la cohérence de la théorie, en particulier sous la forme de celle des développements à courte distance. Plutôt que de poursuivre dans cette direction, ou de présenter d’autres modèles, nous nous tournons vers l’étude de ces conditions de cohérence, vues sous l’angle de l’invariance modulaire] en suivant les idées mises en avant par Cardy.
IX.3
149
INVARIANCE CONFORME
3. Invariance modulaire Dans cette section nous allons obtenir une classification des classes d’universalité des modèles minimaux en étudiant les contraintes imposées par l’invariance modulaire.
3.1 Fonction de partition sur un tore Dans la section 1.4, nous avons montré la relation entre la charge centrale et les effets de taille finie (déplacement Casimir de l’énergie libre) dans une bande périodique. Nous voulons revenir en détail sur ce point. Rappelons que la matrice de transfert par unité de longueur sur une bande périodique de largeur L s’écrit
( L+ ~ Eo -
kc>
où le facteur exp( i n c / L ) correspond précisément à l’effet mentionné cidessus. La normalisation est telle que l’énergie libre par unité de surface s’annule à la limite d’un volume infini. Dans un domaine rectangulaire de taille (L’Ad), en imposant des conditions périodiques sur les bords, la fonction de partition prend la forme
Les conditions aux limites périodiques entraînent que le domaine possède la topologie d’un tore, ce qui justifie le titre de cette section. Généralisons la construction en accompagnant la translation de “temps’’ M par une translation d’“espace” additionnelle (figure 5). Alors que dans le plan l’opérateur Lo + Eo engendre des dilatations, et i(L0 - E O ) des rotations, après transformation exponentielle ces combinaisons deviennent des générateurs des translations d’espace et de temps. Si nous imposons des conditions aux limites périodiques correspondant au parallélogramme de la figure 5b, la fonction de partition deviendra
où nous avons posé
w1 = L’
~2
q = exp 2im-
=N
+ iM q = exp -2inT
7
= Wâ/W1
(210)
150
INVARIANCE CONFORME
IX.3.1
N
L
L
Figure 5: ( a ) Un domaine rectangulaire périodique. (b) Un domaine périodique plus général; utilisant la notation complexe W I et w 2 sont les générateurs du réseau correspondant tels que lwll = L, 1.121 = dM2+N”.
Nous faisons la convention que ImT > O, de sorte que IqI < 1. L’intérêt de ce choix de conditions aux limites est de mettre en évidence l’indépendance des termes correspondants aux variables T et ;i (ou q et rj). Décomposons l’espace des états en représentations irréductibles du produit des algèbres (V, caractérisées par des poids dominants (h,h). A ces représentations seront associés des opérateurs primaires de même poids. Soit N h , le ~ nombre de fois où la représentation ( h ,h) apparaît dans cette décomposition. Si le nombre de représentations irréductibles distinctes est fini (ou dénombrable), nous pouvons utiliser la définition des caractères conformes donnés par les équations (152), (155), (158) pour écrire
v),
Les entiers IVh,&sont positifs. De plus l’unicité dé l’état fondamental, ou état du vide, invariant par les transformations globales (dans le plan le groupe SL(2,C), sur le tore, les translations), impose la normalisation &,O = 1. Comme nous utilisons des représentations “réelles”, x , , ~ ( ; i= ) X ~ ~ ( T ) . Dans un domaine rectangulaire, q = rj = e x p ( - 2 ~ M / L ) , considérons le cas où M I L -f 00, q -f O. Si nous supposons que tous les opérateurs primaires ont une dimension positive A = h h > O, nous retrouvons le comportement limite
+
ainsi que nous l’avions afErmé dans la section 1. Tout état tel que A, = h h n donnera lieu à une correction relative exponentiellemenmt petite, exp( -2nA,M/L). Le spectre de la matrice de transfert engendre ainsi
+ +
IX.3.1
151
INVARIANCE CONFORME
l’ensemble des dimensions conformes de la théorie, donné par les rapports de valeurs propres Xn/Xo = exp(-27rAn/L)
(213)
qui sont tels que ln(X,/Xo) se comporte en L-l. Cependant, si certains opérateurs ont une dimension négative, le comportement dominant (212) sera modifié, comme nous l’avions anticipé dans la section 1.4, et l’on trouvera
La succession des valeurs propres de la matrice de transfert sera déplacée de -Ainf X n / h = exp(-2r(An
- Ainf)/L)
(215)
Ceci montre que l’on doit être prudent dans l’interprétation des résultats numériques. Un exemple de ce phénomène est fourni par la singularité de Ainf = On prédit (et de fait on observe Lee et Yang, avec c = numériquement) que teff = f . Plus généralement dans un modèle minimal (équation (146) et (147)) caractérisé par une paire ( p , p ‘ ) , on a dans le cas le plus extrême
-?,
Ainf =
1-(P-P‘I2
2PP‘
-2.
Ceff
6
= 1 - -> O PP’ -
La fonction de partition dans un domaine périodique obéit à des contraintes de cohérence globale. D’après l’invariance euclidienne, l’espace et le temps jouent des rôles symétriques. Nous pouvons les échanger, de telle sorte que, dans un rectangle de taille L, M , la fonction de partition prend ~ Ni l’une ni l’autre de ces les formes équivalentes 2 = T r ( 7 ~=) Tr(7~)~. expressions n’exhibe explicitement cette symétrie, et on conçoit qu’imposer une telle invariance impose une limitation très forte dans le choix des coefficients du développement (211). En termes plus généraux, un tore peut être considéré comme le quotient du plan complexe par un réseau de translations A, engendré par deux périodes indépendantes w1 et w2. Un autre choix de périodes fondamentales w i et w i engendre le même réseau A, pourvu que la relation entre (w1,wz) et ( w i , w i ) soit linéaire à coefficients entiers dans les deux sens, c’est-àdire inversible et de déterminant un. Ces conditions préservent l’aire ainsi
152
INVARIANCE CONFORME
IX.3.1
que l’orientation d’une cellule fondamentale. Le groupe des transformations associées est le groupe modulaire SL(2, Z ) . De plus, l’invariance par rotation et par dilatation entraîne que seul le rapport des poids r = w2/w1 est la seule variable significative. Les transformations ci-dessus agissent sur r comme transformations homographiques avec des coefficients entiers et un déterminant un, les matrices f A étant identifiées. On donne parfois le nom de groupe modulaire à S L (2 ,2 )/ 2 2 (écrit aussi PSL ( 2 ;Z ) , groupe projectif linéaire sur les entiers), et la contrainte d’invariance des fonctions de partition (ou de covariance des fonctions de corrélations sur un tore) est appelée invariance modulaire.
3.2 Formule limite de Kronecker Revenons au modèle gaussien, afin de vérifier l’invariance modulaire dans un cas élémentaire. L’espace des états est l’espace de Fock du champ libre. Dans une version hamiltonienne, les modes propres correspondent à un moment quantifié p , prenant des valeurs qui sont des multiples entiers de 2.ir/L. Les modes de propagation vers la droite correspondent aux valeurs positives de p,, les modes de propagation vers la gauche à p , négatif. La condition de périodicité spatiale implique que ces modes sont associés à la propagation sur un cercle. Nous soustrayons le mode nul (correspondant à une valeur constante du champ), qui conduirait à un résultat infini, en effectuant une renormalisation multiplicative de la fonction de partition 2. Pour chaque mode bosonique, le nombre d’occupation prend des valeurs entières non négatives, et la charge centrale est c = 1. Nous nous attendons donc à ce que la fonction de partition soit un produit de facteurs statistiques de Bose de la forme
en accord avec l’équation (153) pour c = 1, h = O. Nous avons utilisé ici la définition (157) de la fonction de Dedekind ~ ( 7 ) . Une preuve directe de (217), susceptible de généralisations ultérieures, est connue depuis le travail de Kronecker dans les années 1880 dans le contexte de la théorie des nombres. La preuve consiste en une évaluation directe de l’intégrale de chemin et exhibe un facteur inattendu, qui fait défaut dans l’expression (217), et qui est essentiel pour l’invariance modulaire. C’est pour cela que nous n’avons écrit la forme (217) que comme une relation de proportionnalité. Appelons ICi les générateurs du réseau dual de A,
IX.3.2
INVARIANCE CONFORME
153
où A = Imw2Wl est l’aire du tore. Les valeurs propres du laplacien sont données par
En,,,, = ( 2 ~ ) ’Inllc’
+ nzk212
(219)
où les n1,2 sont entiers. La fonction propre normalisée correspondant au mode nul sur 7 = C/A est cpo = A - + . En omettant ce mode nul, l’intégrale fonctionnelle exprimant la fonction de partition est formellement égale à
Z1 =ID. Ai6 (Ld’xcpcpo)
=A$’ ,
exp (-$Ld’x(Vcp)’)
1
(220)
-
1 1 . 1 , ~ Ez1,nz ~
Le facteur A i est destiné à rendre le résultat final sans dimension. Dans l’équation (220), le produit sur les modes est divergent ultraviolet car les valeurs propres Enl ,n2 ne sont pas bornées. Le prime dans le produit indique l’omission de la contribution n1 = nz = O. La régularisation (et renormalisation) standard d’un tel produit infini utilise le procédé dit régularisation C. Cette terminologie a pour origine le prolongement analytique de la fonction C de Riemann utilisée dans l’étude de la distribution des nombres premiers. Introduisons la fonction analogue
absolument convergente’ et donc analytique, pour R e s > 1. Comme nous allons le voir ci-dessous, cette fonction possède un pôle à s = 1, mais admet un prolongement analytique jusqu’à s = O. En comparant les expressions (220) et (221), on définit la fonction de partition renormalisée 21 par la formule dG ds Désignons comme précédemment le rapport w2/w1 par r , et posons 4 = exp2ii-rr. Pour R e s > 1, nous insérons la définition de Eni,nzdans (221), ce qui donne l’expression
Zr = A* exp $-(O)
qui possède une propriété d’invariance modulaire explicite. Si nous subcwi, w2 = bwi awb, et donc r = stituons dans G(s), w1 = dwi
+
+
154
INVARIANCE CONFORME
+
IX.3.2
+
(UT' b)/(cr' d), a d - bc = 1, on voit immédiatement que G(s) est invariant. Par conséquent le prolongement analytique assure que cette propriété restera vraie pour 21. Revenant à (223), le premier terme fait intervenir la fonction C(s) = Cïm-', qui a un pôle simple de résidu unité à s = 1 et telle que 2C(O) = -1, 2C'(O) = -1n2n. Dans le second terme, la somme sur m donne une fonction périodique de nr, de période unité. Elle admet donc un développement en série de Fourier de la forme
dy e2inp(nRe~-y) [y2
&g:
+
dy e 2 i s p ( n R e ~ - y )
-
1 n2Im r 2 ]
1"
d t ts-ïe-t(y2+n2imT2)
d t ts-3/2e-[tnZ~rnr2+n2(p2/t)-2inpnReT ]
4)
Pour p = O, l'intégrale se réduit à î ( s - lnImr11-28. Nous isolons ce terme, sommons sur n # O, et utilisons l'équation fonctionnelle pour la fonction de Riemann
Changeant t en Iap/nImrI t , donne
IX.3.2
155
INVARIANCE CONFORME
2,
La dernière somme double est une fonction entière paire de s et le membre de droite est donc pair en s + 1- s, ce qui fournit le prolongement analytique requis de G(s). Comme pour 2 > O
et que C(2) = r 2 / 6 , on trouve au voisinage de s = O
Finalement
G(0) = -1 Remarquant que Jw1J /All2 = i/(Im 7 ) l I 2 , on trouve, d'après l'équation (222)' la valeur précise de la fonction de partition 21 2 1
1
=
(227)
( I m . > ' i 'I ( M3
qui dif€ère de (217) par le préfacteur (Im T ) - + . Ce facteur est essentiel pour assurer l'invariance modulaire, qui était en évidence tout au long du calcul. L'origine de ce facteur tient à la soustraction du mode nul. 1
On déduit de l'équation (227) que lq(~)1(Im T)4 est invariant modulaire. Pour être précis, l'action des deux générateurs T 4 T 1 et T 4 -7-l du groupe modulaire sur V ( T ) est donnée par
+
Dans une transformation générale T + 7' = (a7
=
~ ( 7 ' ) EA(CT
+ b)/(cT + d) nous avons donc
+ d )1
2~(7)
(229)
où E A est une racine vingt-quatrième de l'unité. La détermination de ces phases à partir de la théorie des nombres, qui n'est pas nécessaire ici, est due à Jordan et Dedekind.
Dans le cas du champ libre, la fonction à deux points peut être aisément calculée sur le tore. Elle doit satisfaire à
156
IX.3.2
INVARIANCE CONFORME
Le facteur 2~ additionnel dans le membre de droite est en accord avec la normalisation à courte distance (équation 162) tandis que le terme 1/A représente la soustraction du mode nul, rendant -A inversible dans le sous-espace orthogonal. I1 est entendu que la fonction S et la fonction de corrélation doivent être doublement périodiques. La solution de l’équation (230) est exprimée en termes d’une des fonctions û (appendice A), que nous normalisons selon
-00
où, comme précédemment, nous utilisons la notation q = exp(2ir.r) tandis que y = exp(2irz/wl), et, comme d’habitude, P(q) = nY(1- qn). On vérifie qu’on a
= exp (--2r
[
(Im ~ 1 2 / w 1 ) ~ Imr
2
(232)
est doublement périodique, symétrique dans I1 est aisé de montrer que l’échange 1 H 2, et que son comportement à courte distance est de la forme r 1 2
-
212212
(233)
I1 sera utile dans la suite de connaître les valeurs r12 quand z12 a des coordonnées rationnelles .dans la base w1, w2. Soit N , k et e des entiers. Alors
où Dk/N,e/N(T) =q
- &(Üe(N-e)/N2-1)
IX.3.2
157
INVARIANCE CONFORME
Par construction D k / N , e / N ( T ) s’annule quand k et e sont tous deux multiples de N . Vérifier que cette fonction possède les propriétés
Les fonctions D admettent une autre interprétation qui est la suivante. Revenons au calcul de la fonction de partition du champ libre, mais, au lieu de supposer le champ doublement périodique, exigeons que, après un cycle autour de w1 et w 2 , il soit multiplié par une phase (naturellement le champ est alors complexe). Plus précisément, pour X et 1-1 entiers, nous convenons we
Les modes propres correspondent à des valeurs propres de la forme
-
(n2
+
6)
k1 +
(n1
+ $) k2 =
{
(n1+
$)
w1+
(n2
+ 6)
w 2 )
(240) Nous n’avons pas à effectuer la soustraction du mode nul lorsque k ou 1 (ou les deux) sont différents d’un multiple de N . Finalement, au lieu de calculer la racine carrée du déterminant inverse, nous calculons simplement le déterminant. Définissant
nous trouvons en répétant les calculs précédents et après un prolongement analytique
Ainsi D k / N , e / N (T) apparaît-il comme un déterminant renormah6 sur des modes correspondant à des conditions aux limites du type (239). (i) Vérifier l’équation (242).
158
INVARIANCE CONFORME
IX.3.2
(ii) Dans le cas du champ libre, obtenir la valeur moyenne (constante) du tenseur impulsion-énergie sur un tore. En effectuant une déformation 6 x p = 6 ~ p ” x ” ,où 6c est une matrice infinitésimale, nous avons
(Tpy(x)) 8 ” z ” = ( T p v ( x ) )68‘” = ( T ( z ) )[ô€’’ où ( T ( z ) )=
- 6c22 + i(6ci2 + 6c21)] + C.C.
(T)est indépendant de z ,
Insérant l’expression (227) de Zi, nous obtenons
La dernière somme semi-convergente doit &re comprise comme une double limite, où l’on somme d’abord symétriquement sur p , et ensuite sur n.
3.3 Modèle d’Ising D’après l’expression (171) de l’action dans le cas d’un champ de Fermi libre, et prenant en compte la statistique antisymétrique, nous obtenons la fonction de partition sur un tore comme un produit de deux Pfaffiens sont les opérateurs de Cauchy-Riemann. Cette Pf(d)Pf(a), où d et quantité est également la racine carrée du déterminant du laplacien, soit (det - A ) l j 2 . Cependant, les conditions aux limites doivent être choisies de façon appropriée. D’après les résultats du chapitre II, les champs 1c, et $ doivent être antipériodiques le long d’un des générateurs w1, w2 au moins. Désignons par O ou les conditions périodiques ou antipériodiques, en accord avec les notations de la sous-section précédente. Nous venons d’obtenir la valeur de (det -A) comme 1 D k p ~ / ~ ( 7 avec ) 1 ~ ,k, = O, 1. D’après le chapitre II, il s’ensuit que nous avons
a
fr
Le terme ID0,oI s’annule, ce qui reflète la présence d’un mode nul. Ce résultat est en accord avec les calculs directs de Kaufmann, Ferdinand et Fisher. On remarque que partant d’un des termes non nuls dans (244), l’invariance modulaire requerrerait la présence des deux autres. De fait, d’après les équations (236) et (237) nous obtenons l’action des transformations T + T 1 et T --+ - 7 - l . Ces derniers engendrent des permutations sur les trois déterminants
+
IX.3.3
159
INVARIANCE CONFORME
2 5)
Ceci peut aussi être compris en suivant l’effet du changement de base (w1,w2) indiqué sur les conditions aux limites correspondantes. I1 en résulte que la combinaison (244) est invariante modulaire. Les diverses conditions aux limites qui apparaissent dans cette expression sont appelées “structures de spin”. Trois d’entre elles contribuent à la fonction de partition. I1 est maintenant possible de faire le lien avec le développement en caractères, conformément à l’équation (211). Les fonctions D i r c , +s’expriment naturellement comme des carrés. Définissant
O
O 00
d 2l 1o ( ~ )= qh n ( l
+ qn)
(247)
1
qui obéissent aux relations 1
d+,+(7-)dO,+(.)d+,O(‘) di,$(‘)
= qiû
+
(248)
= dO,+(r) 16di,o(.)
On reconnaît alors que les caractères prennent la forme des combinaisons
xc,h,
1
avec c = 5 et h = O,
$
ou
&,
(249a)
160
INVARIANCE CONFORME
- 2I
{
$(1
+$+a)
IX.3.3
p+t)}
- n(1CO O
+CO
=- 1
[(24k+5)*-1]/48
(Q
-
Q
[(24k+11)2-1]/48
1
(249b)
1 p(q)
+Oo
=-
[(24k-2)’-1]/48
(Q
- Q [(24k+10)z-1]/48
I;=-CO
(249c) Par conséquent on peut récrire la fonction de partition du modèle d’Ising comme forme sesquilinéaire dans les caractères correspondants
en accord avec la discussion générale. Cette formule met en évidence le contenu physique du modèle, avec trois opérateurs primaires, à savoir l’identité, la densité d’énergie et le spin. La déduction directe confirme la valeur c = $ de la charge centrale, ansi que les poids conformes (O, O), et &) respectivement. L’invariance modulaire est également claire, ainsi que nous l’avons vu ci-dessus.
(h,
(a, 2)
On peut aussi obtenir les diverses fonctions de corrélations sur le tore. Considérons d’abord 16:s champs fermioniques. Nous rappelons que dans le plan
avec l’expression complexe conjuguée pour les champs $. En supposant le champ S) de poids ( $ , O ) , il s’ensuit que sur un ruban périodique, obtenu par la transformation zplaii = exp(2ia/L)z,,ban, on a l’expression
IX.3.3
161
INVARIANCE CONFORME
-
Cette fonction est antisymétrique dans l'échange z1 2 2 , et antipériodique $(z + L) = - @ ( z ) (d'où l'indice $). I1 existe cependant une autre possibilité, impliquant un champ périodique @(z L) = @ ( z )(indice O ) , à savoir
+
Sur un tore, des corrélations analogues satisfaisant à a1 ($(Zi)@(tZ))
= 4 1 , 2)
(254)
sont distinguées par un double ensemble de conditions périodiques et antipériodiques, lesquelles interdisent l'existence de modes nuls. Les indices k , e prenant les valeurs O , 1 et k , e n'étant pas simultanément nuls, nous écrivons
Le premier indice i k se réfère au comportement dans la direction w2, le second au comportement dans la direction w1. En utilisant la function F ( z ) introduite en (231), et y = exp(2inz/wl), on peut vérifier que les expressions requises sont
Les facteurs de normalisation s'écrivent
162
INVARIANCE CONFORME
IX.3.3
On retrouve les expressions (252) et (253) dans la limite d’un ruban. Ces dernières sont appelées fonctions de corrélation avec conditions aux limites de Neveu-Schwarz et Ramond respectivement, dans le contexte de la théorie des cordes. On tire de l’équation (255) la fonction de corrélation énergieénergie sur un tore, somme pondérée de trois termes
Le prime dans la somme indique l’omission du secteur (0,O). Bien que ID0,ol s’annule, ce secteur périodique-pérodique peut donner des contributions à d’autres quantités. Nous verrons par exemple dans la section 3.8 que la valeur moyenne ( E ( z , Z)) est une constante non nulle, qui provient uniquement de ce secteur
De même ce secteur contribue aux corrélations spin-spin (Di Francesco, Saleur et Zuber). En utilisant les notations des fonctions 0 (appendice A) nous avons
de sorte que
et, à un facteur multiplicatif près,
u=2
avec
el(Z,T)
N
2-0
e;(o,T)z, e ; ( o , T ) = 2 n 9 ( ~ ) ~ .
L’expression (261) se comporte à courte distance comme on s’y attend. On peut aussi se convaincre que la fonction de corrélation est doublement
IX.3.3
163
INVARIANCE CONFORME
périodique. Le point remarquable est que cette fonction est une somme de
E
contributions provenant de quatre secteurs, sous la forme 2, (ou), / Z,, où, au numérateur, le secteur doublement périodique (v = 1) donne une = O. Chacune des quantités contribution non nulle, en dépit du fait que 2, partielles 2, (au),,relative à une structure de spin donnée, satisfait à une équation qui généralise sur un tore l’équation correspondante de Belavin, Zamolodchikov et Polyakov valable dans le plan et qui a été obtenue par Eguchi and Ooguri. Pour tout opérateur A associé à une représentation possédant un vecteur singulier au niveau 2, on a ainsi
c,
qui ont Ces équations font intervenir les fonctions de Weierstrass p et respectivement un pôle double et simple à l’origine, ainsi que la constante QI, ces quantités étant définies par les relations
Notons que C(z,T ) n’est pas doublement périodique et que la constante 01 a déjà fait son apparition dans l’équation (243). En utilisant les mêmes notations, la fonction de corrélation ( E ) donnée par l’équation (258) s’écrit
Les fonctions de corrélation d’ordre plus élevé sur un tore peuvent aussi être obtenues sous forme fermée.
3.4 La classification A-D-E des modèles minimaux Revenons à la discussion de la section 3.1, et en particulier à l’équation (211)’ où la fonction de partition est écrite comme une forme sesquilinéaire dans les caractères de l’algèbre de Virasoro, avec des coefficients entiers non négatifs. Une telle expression résulte d’une formulation hamiltonienne, ayant fait choix des axes de temps et d’espace. Cependant un tel choix
164
INVARIANCE CONFORME
IX.3.4
est en fait arbitraire. Dans une transformation modulaire, la fonction de partition doit être invariante, ce qui conduit à des contraintes sur le contenu opératoriel des modèles. Dans la sous-section précédente, nous avons montré par un calcul direct (équation (250)) un exemple typique impliquant une telle somme de trois termes. En un sens, la fonction de partition gaussienne (équation (227)) est aussi un cas limite de cette situation. Dans cette section, nous allons exposer les résultats obtenus en imposant la contrainte d’invariance modulaire dans le cas général, où la charge centrale prend la valeur rationnelle c = 1 - 6(p - ~ ’ ) ~ / p pavec ’ , le cas particulier mais important des modèles unitaires tels que p et p’ soient des entiers consécutifs. De façon remarquable, une classification complète peut être décrite en des termes reliés à la classification de Cartan-Killing des algèbres de Lie simples (de façon spécifique, une sous-famille appelée “simplement lacée”). Cette même classification A-D-E , où A désigne l’algèbre de Lie des groupes unitaires, D celle des groupes orthogonaux en dimension paire et E les trois algèbres de Lie exceptionnelles Ec, E7 et Es, apparaît dans des circonstances variées, en apparence sans relation. Un autre cas fameux est celui des sousgroupes finis du groupe des rotations tridimensionnelles (à une conjugaison près). Le fait que nous puissions obtenir une description complète de tous les modèles minimaux est, jusqu’à un certain point, tout à fait surprenant. I1 montre la puissance de l’invariance conforme appliquée aux modèles critiques bidimensionnels. Bien que toutes les implications de ce résultat n’aient pas encore été dégagées au moment où nous écrivons ces lignes, nous savons grâce aux travaux sur les modèles intégrables (Baxter, Andrews et Forrester, Pasquier) que l’on peut construire des modèles sur réseau qui correspondent à chacun des comportements critiques prédits. La relation avec les modèles intégrables n’est cependant pas encore claire. Quoi qu’il en soit, il est d’une certaine importance d’obtenir, même dans un domaine restreint, une description complète des classes d’universalité critiques. Afin de mener à bien le présent programme, nous devons décrire l’action du groupe modulaire sur les caractères de l’algèbre de Virasoro. Ce groupe est engendré par les deux transformations
T S
T-+T+1 T -+ -T-l
(265a)
qui satisfont aux relations
S2 = ( S T ) 3
(265b)
Dans la section 1.8, nous avons montré qu’on peut indexer les représentations par un entier X défini modulo N = 2pp‘. Les caractères sont alors donnés sous forme compacte par l’équation (158). Rappelons que dans une transformation modulaire, la fonction de Dedekind, qui apparaît dans les dénominateurs, se transforme comme indiqué en (228). En utilisant la formule de Poisson
IX.3.4
INVARIANCE CONFORME
165
(266) on trouve ainsi que
T
(267~)
L’action de la transformation T est diagonale, étant, à une phase près, la multiplication par exp(2i7rX2/2N), tandis que celle de S n’est autre que la transformée de Fourier finie sur les entiers modulo N. La transformation de ~ ,, , mais ~ l’égalité x x = X - X restaure la Fourier a un carré égal à G X , - ~ ~ , ~ N propriété S2 = I. On vérifie sans peine que les deux transformations (267) sont compatibles avec la propriété d’antisymétrie x x = - x w o ~Rappelons . que wo est donné par wo = rop+sop’ mod.N, avec T O , so tel que rop-s0p’ = 1, identité qui exprime que les entiers p et p’ sont premiers entre eux. Nous pourrions bien sûr utiliser les symétries de x x pour restreindre la somme du membre de droite de (267b). Ceci, cependant, masquerait la relation entre les caractères de l’algèbre de Virasoro et un ensemble de fonctions analogues qui apparaissent dans l’étude des représentations de l’algèbre de KacMoody Ai1), c’est-à-dire l’algèbre des courants SU(2) locaux. Une classe intéressante de représentations de poids dominants de l’algèbre de Lie infinie correspondante est caractérisée par une anomalie (analogue à la charge centrale), appelée dans ce contexte le niveau, qui est désignée par un entier k , prenant les valeurs 0’1,... . Ces représentations de dimension infinie peuvent être décomposées comme sommes des représentations usuelles de SU(2), celle de spin le plus petit étant non dégénérée, de dimension X = 2jmin 1. Nous donnons dans l’appendice C un bref survol de cette théorie. La raison pour introduire ici les caractères de Kac-Moody SU2 tient à la relation étroite avec les caractères de l’algèbre de Virasoro. On va voir qu’il existe un parallèle dans la recherche de fonctions de partition invariantes modulaires.
+
les caractères de l’algèbre A r ) (définis Nous désignerons par x”xff(~) dans l’appendice C) pour les distinguer des caractères de l’algèbre de Virasoro qu’on pourrait appeler caractères conformes. Pour une représentation de niveau k de Ai’), nous posons N = 2( k 2)’ qui est à nouveau un entier pair. Le caractère s’écrit
+
166
IX.3.4
INVARIANCE CONFORME
Remarquons la ressemblance avec le cas des caractères de Virasoro (équation (158)), et observons que xXff se prolonge en une fonction périodique impaire de X (de période N )
Dans le cas présent, le rôle de l’involution X + WOX est joué simplement par la symétrie X + -A. La similitude se poursuit lorsqu’on considère les propriétés de transformation modulaire, que l’on doit comparer à (267)
x;ff ( T + 1) = e2ix(X2/2N-i) xxa f f (7) Xiff(-l/T)
-1
=-
(270~)
e2ixXX’/N
aff XXt (7-1
(270b)
X‘EZINZ Ainsi que l’ont suggéré Gepner et Witten, on peut développer un programme analogue de classification des fonctions de partition de type (211) en termes des caractères affines au lieu des caractères conformes, en imposant des conditions analogues sur les coefficients, pourvu que la somme sur X porte i: = O . sur un domaine fondamental 1 5 A 5 frN - 1 puisque xgff = x Dans les deux cas, les solutions invariantes modulaires peuvent être trouvées en deux étapes. Dans la première étape commune, on recherche simplement des matrices N x N avec des éléments arbitraires (appelons-les N ) ,qui commutent avec les deux matrices
où X et A‘, ainsi que les indices de N , portent sur les entiers modulo N . On trouve que de telles matrices N peuvent être écrites comme des combinaisons d’un ensemble linéairement indépendant défini comme suit. Soit S un diviseur positif quelconque de a N , unité incluse, et a le plus grand commun diviseur de S et 8 = N/26, noté a = (S,8).Manifestement a2 est un diviseur de SN. Définissons la matrice N x N (Ra)x,x, de sorte que celle-ci ait des éléments de matrice nuls à moins que a ne divise à la fois X et A’, auquel cas ( R ~ ) A= ,~J
SX’,wX+CN/a
(272)
cES/aS
L’entier w mod N/a2 est obtenu comme suit. Comme S/a et $/a sont premiers entre eux, on peut trouver des entiers p et a tels que p S / a - a S / a = 1, alors w = $ / a + aS/a (mod N / a 2 ) .On note que w2 = 1 (mod 2 N /a 2 ) , en accord avec le fait que dans la définition (272) X‘/a = wX/a (mod N/cr2).
IX.3.4
INVARIANCE CONFORME
167
On vérifie que 0 6 commute à la fois avec T et S. On peut encore montrer, comme l’ont fait Gepner et Qiu, que inversement toute matrice N possédant cette propriété est une combinaison linéaire des matrices 0 6 et que ces dernières sont linéairement indépendantes. On remarque que si S = $ N , B = 1, Q = I, w = 1, et =I. La partie difficile est de trouver la superposition correcte des 0 6 telle X : ( T ) ( Y ~ ~ ~ ) A X( T~)X, Aqui I est invariante modulaire, se que l’expression réduise, quand elle est sommée sur les caractères fondamentaux (conformes ou affines), à une combinaison à coefficients non négatifs entiers. La normalisation dans le cas affine requiert que le coefficient de xTaff(~)xYff(~) soit l’unité. Dans le cas conforme, le coefficient de l’état fondamental analogue, correspondant à h = h = O, doit aussi être égal à l’unité. En utilisant la ,~ notation A, ceci correspond à un coefficient unité pour xi-,,( ~ ) x , - (T). La difficulté provient de I’antisymétrie des caractères dans les involutions X + w O X ou X + -A respectivement. Décrivons d’abord la solution pour les fonctions de partition affines, où nous écrivons la combinaison requise sous la forme
4
Le coefficient prend en compte l’antisymétrie X - X = - X X qui entraîne que chaque produit X ; X X , est compté deux fois. On démontre que deux séries infinies et trois solutions exceptionnelles remplissent tous les critères. Pour être concis, nous écrivons la solution c y 6 s / 6 apparaissant dans (273) en posant n = N/2, et nous rappelons que 0, agit comme la matrice unité
Quand n est impair, la solution est unique. Quand n est pair, il existe en général deux solutions distinctes, et trois quand n = 12, 18 ou 30. La signification de ce résultat apparaît de façon plus claire quand ces combinaisons invariantes (273)-(274) sont explicitées dans la table I. On peut alors faire le lien avec la classification A-D-E des algèbres de Lie simplement lacées (appendice C), en remarquant que les éléments diagonaux (O, 1 ou 2) dans la matrice (274), ainsi que le montre la table, sont reliés aux degrés des polynômes invariants fondamentaux de Casimir de l’algèbre de Lie correspondante. L’algèbre enveloppante d’une algèbre de Lie simple admet un sous-ensemble de polynômes invariants. Ces derniers peuvent, à leur tour, être écrits comme des polynômes dans un ensemble de T d’entre eux, T étant le rang de l’algèbre de Lie. Si l’on soustrait
168
3
x
m
t-
-
+ x
m -
+ x + s + x + N <
m -
-
Y V
u3
n
xm
V
+ x x + x * < + x + N x +
x
u3
n
-
INVARIANCE CONFORME
r3
4
N
s
t
s
+d
@a
Q
$AI II
r
IX.3.4
IX.3.4
INVARIANCE CONFORME
169
1 au degré de ces polynômes invariants fondamentaux (le premier est toujours quadratique), les éléments diagonaux ci-dessus indiquent combien de polynômes de ce degré se trouvent dans cet ensemble. Par exemple, dans le cas de l’algèbre de Lie Es, nous trouvons dans la table que les invariants de Casimir ont des degrés 2, 8, 12, 14, 18, 20, 24 et 30. Ces degrés sont parfois appelés nombres de Coxeter. Ceci fournit la correspondance entre fonctions de partition et algèbres de Lie. Son origine n’est pas encore entièrement comprise. I1 semblerait que nous ayons emprunté une voie buissonnière en classant ces invariants affines, s’il ne se révélait que la solution du problème conforme est simplement reliée au précédent. En effet, rappelons que dans ce cas N = 2pp’. Revenant alors à la notation originelle des poids conformes et au prix d’un doublement de l’espace des valeurs, il s’avère que nous pouvons considérer les caractères conformes comme portant une paire d’indices correspondant à un espace tensoriel de dimension 2p’ x 2p. Les éléments du commutant de T et S peuvent aussi être considérés comme des produits R p @ 0 6 et les fonctions de partition correspondantes sont données par une paire de combinaisons choisies parmi celles qui apparaissent dans l’équation (274). Le rôle de n est joué successivement par p’ et p . Comme p et p’ sont premiers entre eux, l’un d’entre eux est nécessairement impair, l’invariant correspondant étant alors du type A. NOUSobtenons ainsi le principal résultat de cette section, qui est une classification des fonctions de partition conformes en deux séries infinies et trois sous-séries exceptionnelles de modèles minimaux, compatibles avec les exigences d’invariance conforme et d’invariance modulaire. Les fonctions de partition sont énumérées dans la table II, où l’on suppose, pour fixer les idées, que p est impair. Dans le cas particulier unitaire, si m est impair on fera la correspondance p + m, p’ = m + 1 et si m est pair, p + m + 1, p’ = m. Nous trouvons alors deux séries infinies et trois paires de modèles exceptionnels. Le facteur $ apparaissant dans la table II reflète la symétrie xT+ = xp~-r,p-s, quand nous revenons à l’indexation en termes d’entiers r , s (A = r p - sp’) que nous avons utilisée dans la table, où chaque invariant est désigné par une paire d’algèbres de Lie. L’analyse détaillée de chacun des modèles apparaissant dans la table sort du cadre de notre discussion. Nous nous contenterons de quelques remarques. Concentrons d’abord notre attention sur le cas unitaire. Dans la série ( A - A ) , le premier candidat correspond à m = 3, p = 3, p’ = 4, et donc dans la présente notation ( A 3 ,A 2 ) . Ceci n’est évidemment rien d’autre que le modèle d’king. En général dans cette série A-A (appelée série principale), la fonction de partition s’écrit simplement
qui décrit une généralisation du modèle d’Ising, avec un seul opérateur sca-
170
3 - +
x U
-?
rrr, a -
")
m
4.
t-
4
P)
x + x + x +
s
+
?
O)
?
O)
x + x 4
+4 x
3 1N
4
+ x v 'MI; a 4 2
II
m
3 1N
II
O
a '
I
"
4
6 V
a '
II
a '
I
3
n
y"
V
h 3
4
m
INVARIANCE CONFORME
h
3
I
h 3
3
4 P
I
N
4 +,
s
V
6 V
IX.3.4
IX.3.4
171
INVARIANCE CONFORME
laire Ah,h pour chaque valeur distincte dans la table de Kac. En particulier, le modèle correspondant à m = 4, c = est le modèle d’king tricritique. En générai, la série unitaire A-A décrit l’ensemble de modèles scalaires multicritiques, de degré de plus en plus élevé (appendice A, chapitre V), avec un lagrangien effectif de la forme
Le cas k = 2 est à nouveau le modèle d’king ( m = 3), et une valeur de k générale correspond à la valeur m = k 1 . La charge centrale c = 1 - 6/( k 1)( k 2) tend vers celle du champ bosonique libre (c = 1), lorsque k 00, en accord avec l’intuition. D’après Zamolodchikov, le ,champ primaire de poids h = = h2,2 = ;(k + l ) ( k 2) ( k _> 2) correspond au champ cp. Les puissances plus élevées : pn : ont des poids h = I;. = hn+1,2+1 = [(n 1)2- 1 ] / 4 ( k+ l ) ( k 2) pour n = 1 , 2, ..., k - 1 , et h = h = hn-k+2,n-k+l = [(n+ 3)2 - 1]/4(k l ) ( k 2) pour n = k , . . ., 2k - 2. Le champ : p2”l : s’obtient comme un descendant de cp sous la forme a& en raison des équations de mouvement. Ainsi que nous le montrerons dans la section suivante, tous ces modèles sont naturellement associés à la brisure spontanée d’une symétrie 2 2 . Quand m = 5 et c = $, on trouve deux possibilités. Dans le modèle multicritique de la série principale, tous les opérateurs primaires sont scalaires, tandis qu’une deuxième possibilité relève de la série (A, O) (appelons-la série complémentaire), à savoir p = 5, p’ = 6, et donc (A4,O4). En utilisant la ~ ,la notation Xh,, , la fonction de partition correspondante notation x ~ ,puis s’écrit
+
+
+
+
+
+
+
+
Si comme on l’a vu plus haut le modèle de Potts à trois états correspond $ de la charge centrale, il y a plusieurs façons de s’assurer que (276) est la version correcte. On peut par exemple exiger la présence de deux correspondant aux deux opérateurs de “spin” opérateurs de poids sin cp et cos p. Un autre argument, que l’on décrira dans la prochaine section, montre que seule l’équation (276) correspond à la brisure d’une symétrie Z3, comme cela doit être le cas. I1 existe aussi une preuve “microscopique” quasi directe, utilisant une description en termes d’un gaz de Coulomb, qui est en accord avec le choix précédent, description que nous discuterons dans la section 3.6. Nous supposons donc que la fonction de partition (276) décrit correctement le contenu du modèle de Potts à 3 états et nous notons l’existence d’opérateurs de moment angulaire f3, f l . A l’exception de la série principale A-A, on trouve toujours de tels champs tensoriels.
à la valeur
&, &,
172
IX.3.4
INVARIANCE C O N F O R M E
Huse a observé que la série principale A-A était réalisée au point critique des modèles SOS de Andrews, Baxter et Forrester. Pasquier a généralisé leur construction de façon à inclure tous les autres cas unitaires figurant dans la table II. Naturellement le modèle ip3, ou singularité de Lee et Yang (section et la fonction 1.7), apparaît dans la table. La charge centrale est c = de partition est dans la série ( A ,A )
-y
(-44,Al
1
= lXh=Ol
2
+ IXh=-$
l2
(277)
La preuve des résultats de cette section, accompagnée de nombreux commentaires, figure dans les travaux cités en référence dans les notes.
3.5 Frustrations et symétries discrètes Supposons que l’une des théories décrites ci-dessus soit la limite critique d’un modèle sur réseau, avec des interactions entre plus proches voisins portant sur des variables discrètes ai,j prenant un nombre fini de valeurs. Supposons de plus qu’un groupe fini G opère globalement sur ces variables de telle sorte que l’action soit invariante. Quand le réseau est restreint à un domaine fini de taille L , M , au lieu de considérer des conditions aux l , a1,j j ou bien o i , ~ + = 1 a i , l , comme cela était limites périodiques ( ~ ~ + = implicite jusqu’à présent, nous pouvons introduire des conditions aux limites frustrées sous la forme a ~ + l , = j g l a l , j , a i , ~ + 1= g * a i , l , où g 1 , 9 2 E G . La cohérence de ces conditions implique que les éléments g1 et 9 2 commutent. En prenant ia limite continue, nous avons donc des fonctions de partition 5 ustrées Z,, , g 2 , qui sont maintenant covariantes par le groupe modulaire. Pour fixer les idées, cherchons dans quelles circonstances G est un groupe cyclique G 2 / k 2 , les variables discrètes ui,j donnant naissance à un des champs primaires de poids conforme ( h , h ) . Faisons agir le groupe 2 l k 2 par des phases (correspondant aux représentations unidimensionnelles), de telle sorte que le champ correspondant uh,h obéisse à la condition
où n1 et
722
sont des ent,iers. D’après la définition de h et
h., nous avons
+
u h , ~ ( z nlwl) = exp [2ir(h - h)nl]u h , h ( z )
(279)
ce qui veut dire que k l / k h - h. mod 1. Prenant kl et k premiers entre eux, et utilisant les valeurs de h et h. dans la table de Kac d’un modèle minimal, nous en concluons que k doit diviser 4pp’ ou 4m(m 1) si nous nous restreignons à des modèles unitaires. Nous obtenons ansi une condition nécessaire pour que 2lk.2 puisse être considéré comme groupe de symétrie.
+
IX.3.5
173
INVARIANCE CONFORME
Désignons par Z k l , k 2 la fonction de partition correspondant aux conditions aux limites (278). Elle n’est invariante que pour un sous-groupe du groupe modulaire qui respecte ces conditions. Considérons en particulier Zk,,o. Si nous posons T’ = (a7 b)/(c.r d ) , on voit que l’invariance de Zkl ,O requiert a = d = f l mod k et b = O mod k , pourvu que nous supposions kl et k premiers entre eux, et une condition de réalité Zk1,0 = Z-~,,O.Ceci définit un sous-groupe, appelons-le r o ( k ) ,du groupe modulaire complet r. La condition aux limites frustrée dans la direction w1 ne nous empêche pas de considérer Zk,,o comme la trace de la matrice de transfert dans un certain sous-espace des états, qui peut être décomposé en parties irréductibles pour la paire d’algèbres de Virasoro. Par conséquent, nous devons aussi trouver des entiers non négatifs Nh,h tels que
+
+
Cette expression doit être invariante sous l’action de r 0 ( k ) . Admettant qu’il en soit ainsi, si nous effectuons une transformation conforme arbitraire y E r sur l’argument de T (et 7 ) ’ on engendre à partir de Zk,,o une fonction Z ~ , , O ( invariante ~T) pour le groupe conjugué yr0(k)y-l. Le nombre de telles y’ si fonctions est égal au nombre de classes d’équivalence (à droite), y y‘-ly E r o ( k ) , lui-même égal à
-
dk
= $k2
II
(1-f)
p premier
Le symbole p I k signifie que p divise k. Chacune des fonctions ci-dessus est invariante par r(k ) , le plus grand sous-groupe commun à tous les y r o(k)y-l. Ce groupe, appelé sous-groupe principal de congruence (de niveau k ) , est un sous-groupe invariant de I?. Le quotient fini r/r(k)est le groupe modulaire sur les entiers modulo k. Les fonctions Z k 1 , 0 ( Y ~ ) au nombre de d k correspondent en fait a d’autres conditions aux limites z k ; ,k; = 2 - k ; , - k ; . Chacune d’entre elles est invariante à gauche par un groupe yr0(k)y-’/r(k) isomorphe à S / k Z , le groupe de symétrie cyclique. Ces autres fonctions de partition sont à nouveau des formes sesquilinéaires du type (280)’ où les coefficients ne sont cependant plus restreints à être des entiers positifs. Naturellement, dans cette notation, Zo,o est la fonction de partition non frustrée décrite dans la section précédente. L’indice de r(k)dans I?, ou l’ordre de I’/l?(k), est kdk. A titre de vérification, appliquons ces considérations successivement au modèle d’king et au modèle de Potts à trois états, m = 3 et 5 dans la série unitaire. Quand k 5 4, le groupe î o ( k ) est engendré par les transformations T -t T k et T + T / T 1. Dans le cas du modèle d’Ising, nous nous
+
+
174
IX.3.5
INVARIANCE CONFORME
attendons à un groupe de symétrie S / 2 2 , soit k = 2. Utilisant la notation x h pour les caractères, la forme la plus générale de la fonction de partition frustrée &,O est
La première parenthèse est 20,~’ la fonction de partition non frustrée, tandis que dans le second terme les combinaisons ~ 2 x et 0 ~ 0 x correspondent 4 à des opérateurs fermioniques primaires. La transformation T + -7-l engendre Z O ,sous ~ la forme
Dans la limite d’un ruban, les termes dominants de ZOJ et &,O doivent être identiques, étant donné que le renversement de spins très éloignés ne devrait pas affecter le comportement aymptotique dominant. Ceci implique N I N2 = 1. Si de plus nous supposons que N2 # O, pour obtenir une fonction &,O non triviale, nous voyons que l’on doit avoir Ni = O, N2 = 1.
+
MIL
Comme conséquence, posant T = iM/L, si nous prenons la limite -+ 00, nous nous attendons à ce que ~l,O/ZO,O= exP(-Mf)
(284)
où f est l’énergie libre d’interface par unité de longueur. Dans un modèle auto-dual tel que le modèle d’Ising, la dualité relie cette énergie d’interface au comportement de la fonction de corrélation spin-spin au point critique et donne pour un système fini de largeur L = luil,f = rq/L. Comparant aux expressions ci-dessus, on aboutit au résultat bien connu q =
4.
Nous pouvons appliquer le même argument au modèle de Potts à trois états ( A 4 , 0 4 ) avec m = 5 (voir l’équation (276)). On vérifie que
Z1,O = z2,o = (xo + x3)*
xzj + (xo + x 3 ) x;
est invariant par î 0 ( 3 ) , en accord avec l’existence d’une symétrie 2 / 3 2 de ce modèle. Cette fonction montre aussi l’existence d’un “pseudo-fermion” de spin dans ce modèle. Le rapport 21,0/20,0 dans la limite d’un ruban D’autre part, le calcul permet de confirmer la valeur de l’exposant 7) = de 2 0 , 1 donne le comportement des opérateurs primaires relativement au groupe de symétrie discret. Par exemple dans le cas du modèle de Potts
.i
&.
IX.3.5
175
INVARIANCE CONFORME
2
(285b) Dans le cas générique de la série principale de modèles ( A ,A ) , on trouve une généralisation de l’expression (282) n-1
m
r=l s = l
qui est aussi invariante par r0(2), ce qui indique une symétrie 2 / 2 2 du modèle restreint SOS, ou modèle multicritique. L’opérateur ayant la dimension la plus faible dans (286) donne l’énergie libre d’interface
+ + + + +
Lf =2a min(hr,,
hr,m+i-s)
( m - i)(m 3) =a 4m(m 1) ( m - 2)(m 2) =a 4m(m 1)
m impair
m pair
La relation Lf = a 7 semble rester valable jusqu’à m = 4, où elle est en accord du modèle tricritique. avec la valeur 1) =
&
On peut montrer de même que les deux modèles unitaires exceptionnels tels que m = 11 ou m = 12, correspondant à l’algèbre de Lie E6, ont aussi une symétrie 2 / 2 2 . Par exemple pour m = 11
a
En comparant avec 20.0, on peut distinguer grâce à cette expression quels sont les opérateurs qui sont pairs ou impairs sous l’action du groupe 2 / 2 2 . Le lecteur est invité à montrer qu’aucun des modèles minimaux n’admet de symétrie continue, en observant qu’ils ne contiennent pas d’opérateurs de dimension (1, O) et (O, 1) comme candidats pour les courants (Friedan, Qiu et Shenker).
3.6 Modèles non minimaux Nous avons développé ci-dessus l’étude des cas où les opérateurs primaires sont en nombre fini, et où la charge centrale est un nombre rationnel inférieur à l’unité, les poids conformes appartenant à une table Kac finie.
176
IX.3.6
INVARIANCE CONFORME
I1 existe néanmoins une variété de théories qui violent une ou plusieurs des conditions ci-dessus. Nous en décrivons maintenant quelques exemples. Dans la section 2.1, en discutant le modèle gaussien, nous avons observé qu’au lieu de considérer un champ cp prenant des valeurs réelles arbitraires, nous pouvions le considérer comme une variable angulaire en identifiant cp et cp 2np. Ceci nous a conduit à définir (équations (169) et (170)) des opérateurs mixtes On,nl(z,Z ) de poids conformes hn,m = a(n/p pm)2, hn,m = hn,--,’ où n et m sont des entiers relatifs donnant l’intensité de charges “électriques” et “magnétiques” situées en un point de coordonnées ( z ,Z ) . Considérons maintenant un tel modèle dans la géométrie d’un tore. Comme cp est une variable angulaire, son graphe peut s’enrouler plusieurs fois autour du cercle unité, quand on décrit un chemin non contractible sur un tore. Ces champs sont tels que
+
+
cp(z + kwl
+ k’w2) - cp(z) = 27rp(km + k’m’)
(289)
où la variable Z est omise. Considérons l’intégrale de chemin dans un tel secteur. Les champs obéissant à la condition (289) peuvent être écrits comme une superposition cp = pper+ cpciaSs d’un champ fluctuant périodique Vper et une solution particulière de (289)’ cpclass, linéaire en z , Z , et donc harmonique
L’action est Sp,iriodique + r p 2 Imr - m‘I2 /Im T et la fonction de partition dans le secteur m, m’ s’écrit (291a) où &(T) est la fonction de partition gaussienne donnée par l’équation (227). Partant de cette définition, il est clair que dans une transformation modulaire on trouve (291b) Ceci montre que le groupe modulaire agit par transformation linéaire sur les entiers m et m’. Si l’on somme sur les valeurs de m et m‘ avec un poids constant sur les orbites du groupe, on obtient un invariant modulaire. Zo,o(~). Un autre invariant évident L’exemple le plus simple est &(T) est obtenu en sommant sur toutes les paires m, m’. Nous multiplions par un préfacteur p afin de normaliser le comportement à grand T ( q petit) et nous obtenons
IX.3.6
177
INVARIANCE CONFORME
Posant comme de coutume q = exp 2 i n ~ la , formule de Poisson appliquée à la somme sur m’ donne
où les poids h,,,, = a(n/p+mp)2et En,, = hn,-m ne sont autres que ceux attribués ci-dessus aux opérateurs On,,. Cette expression est appelée fonction de partition coulombienne, en raison des interactions logarithmiques de paires entre charges électriques et magnétiques. Comparant avec les expressions (292) el (293)’ on voit qu’un facteur p/Im T* a disparu. Pour q petit, indique que la charge centrale est encore l’unité. le comportement (q@)-h Toutes les dimensions An,, = a ( n 2 / p 2 n2p2)sont non négatives et varient continûment avec p, tandis que les moments angulaires &, = nm sont entiers. Pour une valeur de p générique, qhn.71s/q(T) est le caractère d’une représentation irréductible ( c = 1,hn,,) de l’algèbre de Virasoro. I1 est aussi clair que Z ( ~ , T=) Z ( p - l , ~ ) . Une application de ces résultats concerne le modèle X Y . Rappelons que le flot de renormalisation conduit la fonction à deux points vers une limite critique, avec un exposant 77 = à des corrections logarithmiques près, qui traduisent la présence d’un opérateur marginal de dimension 2. Identifions l’opérateur de spin du modèle X Y avec 0 * 1 , 0 de telle sorte que q = = 2A+1,0. Ceci suggère le choix du paramètre p = 2. Les opérateurs magnétiques correspondants 0 0 , * 1 ont alors pour dimension 2, ce qui signale que les champs attachés aux tourbillons deviennent essentiels. Quoi qu’il en soit, on voit que la fonction de partition Z(2, T ) = Z( T ) est un candidat pour le modèle S Y au point final de la ligne critique, qui devrait donc avoir une charge centrale unité. Une autre possibilité est de considérer
+
a,
4
i,
(294b)
178
INVARIANCE CONFORME
IX.3.6
avec
(294c)
On observe que la combinaison qui figure dans (294a) se simplifie en Zquot.(P)
=
= zquot.(P-l)
+
[Z(P)+ 22(2) - Z(1)l
(294d)
On décrit ainsi une famille de modèles possédant les mêmes dimensions variables avec p que précédemment, ainsi bien que certaines dimensions indépendantes de p. Ces modèles ont été identifiés à ceux de la ligne critique du modèle d'Ashkin-Teller. Nous renvoyons aux articles originaux cités dans les notes pour une description de ce modèle impliquant deux ensembles spins, ai = f l , ri = f l , en interaction. L'action correspondante est S = Puaiaj ,&rirj PUraiajrirj,avec une interaction à quatre spins. Lorsque ,Burs'annule on trouve deux systèmes d'Ising découplés. On observe que Zquot.(l) = Z(2) décrit encore le modèle XY. On peut se représenter l'ensemble des modèles coulombiens (invariants O(2)) et des modèles quotients à c = 1 comme l'indique la figure 6. Sur les deux lignes continues on peut distinguer des points spéciaux correspondant à des symétries supplémentaires. Ceci est le cas de Z(i), qui décrit un modèle de symétrie SU(2) x SU(2), ou Z(&), qui coïncide avec un modèle de spineurs de Dirac avec,
+
+
tandis que ZqUot.(fi)= Z;sing. I1 existe encore de nombreuses autres valeurs significatives qu'il ne nous est pas possible de décrire ici. En outre Pasquier a construit trois autres modèles de charge centrale unité qui ne se trouvent pas sur les lignes continues et qu'on peut faire correspondre aux trois algèbres de Lie affines exceptionnelles simplement lacées Ê6 ++(22(3)
+ Z(2) - Z(1))
+ Z ( 3 ) + Z(2) - Z(1)) Ê8 -4 (Z(5)+ Z ( 3 ) + Z(2) - Z(1))
Ê 7
+$
(Z(4)
(296)
IX.3.6
179
INVARIANCE CONFORME
000 Ê,
, _ _ _ _ __ _ -
1
SU(2)x SU(2)
O
1
fi
Ê,
II*i”,l’
c
01y
A
Ê,
y
*
(2
I I I I I
a l
Figure 6 : Modèles de charge centrale c = 1. La ligne horizontale se rapporte aux théories ayant une symétrie O ( 2 ) avec un champ périodique de période 2ap, et la ligne verticale aux modèles quotients. Les parties en pointillé sont équivalentes par p p - l . Les trois points supplémentaires décrivent trois cas exceptionnels. -f
On peut aussi utiliser le formalisme coulombien pour engendrer les fonctions de partition de modèles non minimaux et de charge centrale c < 1, décrivant le modèle de Potts à Q-états pour Q variant continûment dans l’intervalle O < Q < 4, et le modèle O ( n )pour n continu variant entre -2 et 2, le domaine où il existe une théorie critique. Ces sytèmes sont définis par l’intermédiaire de leur développement de haute température. I1 est possible de trouver une chaîne d’arguments plausibles permettant d’identifier ces modèles avec des modèles à six vertex intégrables, ou des gaz de Coulomb soumis à des restrictions spécifiques. Les démonstrations complètes sortent du cadre de ce chapitre et nous nous bornerons à décrire les résultats. Pour p dans l’intervalle de 1 à f i ,posons
n = - 2cosap2 eo = f ( p 2 - 1) mod 2
(297a)
de sorte que n varie entre 2 et -2. La fonction de partition correspondante est donnée par
z(n;
=
2
I
Tp2 lmT - m‘ 2
exp --
(T)
m’.m
4
1m.r
cos [aeo(m’,m)]
(297b)
Dans cette expression (m‘,m)est le plus grand diviseur commun de m’ et m. D’après la discussion précédente, l’invariant modulaire le plus général construit à partir d’une superposition de Zmt,, autoriserait une fonction arbitraire de (m’,m). La démonstration des équations (297) fait intervenir deux étapes. Dans la première on établit la relation entre les paramètres
180
IX.3.6
INVARIANCE CONFORME
continus n et p. La seconde étape consiste dans l’interprétation de la “charge de défaut” eo. Comme on l’a indiqué ci-dessus on décrit un modèle avec n continu par l’intermédiaire d’un développement de haute température sur réseau. On perd la relation entre la fonction de partition Z et la trace d’une matrice de transfert. En d’autres termes, en redéveloppant Z ( n ,T) en série de puissances fractionnaires de q et q , nous n’avons aucune garantie que les coefficients soient des entiers positifs, sauf dans les cas p2 = 1, $, $ correspondant respectivement à n = 2, 1, O. Pour p2 = 1, eo = O mod 2, le cosinus dans l’équation (297b) se réduit à l’unité, la fonction de partition Z ( n = 2 , ~ se ) confond avec Z ( p = = Z ( p = 2 , ~ ) c’est-à-dire , celle du modèle X Y , comme on s’y attend. De même quand n = 1, l’expression ci-dessus s’identifie à la fonction de partition du modèle d’king, tandis que pour n = O, sa valeur est égale à l’unité. Le rôle de eo est de corriger les facteurs de poids attachés aux boucles non contractibles sur le tore. Dans la limite d’un ruban, c’est-à-dire quand T 4 +im, le terme dominant dans la double somme (297b) correspond à m = O, ce qui conduit au comportement suivant, après sommation sur m’,
3;~)
où on utilise la détermination de eo dans l’intervalle [O, 11, c’est-à-dire eo = p2 - 1. La charge centrale est donc égale à (298~) Paramétrisons c sous la forme usuelle 1- 6/m(m +1). En vertu des équations ( 2 9 7 ~et ) (298u), nous avons
p2
m+l =m
n=2cos-
7.r
eo=-
m
1
c=l-
m
m(m
+ 1)
(298b)
Vérifions que pour n = 1, où m = 3, nous retrouvons bien le résultat du nous subdivisons la somme dans (297b) en modèle d’king. Comme eo = termes des valeurs de (rn‘,rn) modulo 6
5,
E= m’,m
(m‘,m)=O mod 6
+;
-; ( m ’ , m ) = f l mod 6
(m’,rn)=fZ mod 6
( m ‘ , m ) = 3mod 6
Chaque terme peut être exprimé comme une fonction de partition coulombienne pour une valeur différente du paramètre p. Par exemple
(m’,m)=O mod 6
IX.3.6
181
INVARIANCE CONFORME
en tenant compte du préfacteur p dans (297b). De la même façon
=;z
($J)
- iZ(3p,7)
( m ’ , m ) = 3 iiiod 6
( m ’ , m ) = f 2 iiiod 6
=z (&, 7)- p
( P , T) -
;z ( $ p , T ) + i Z ( 3 p , T )
(m’,m)=*l iiiod 6
En rassemblant ces résultats, nous voyons que pour eo = l’équation (297) se réduit à
3 et
p =
f
i
t
I1 n’est pas encore évident à ce point que nous ayons atteint le résultat cherché. Nous laissons au lecteur le soin de vérifier que c’est bien le cas.
Toutes les fonctions de partition minimales de la table II peuvent être récrites comme de telles sommes finies de fonctions de partition coulombiennes. On pourra vérifier ce point, ainsi que le fait que, pour n = O, m = 2, c = 1, eo = la fonction de partition se réduit à l’unité. Diverses quantités relatives aux polymères peuvent être obtenues dans la limite n + O. Lorsque n + -2, c’est-à-dire m + 1, on trouve Z ( n = - 2 , ~ )= O, mais la dérivée en n n’est pas nulle,
a,
On trouve ainsi une fonction de partition fermionique égale au carré de l’inverse de celle du champ gaussien libre. Ceci est en accord avec la correspondance entre les modèles bosoniques O ( n ) avec n = -2 et les modèles fermioniques (complexes). Le modèle de Potts critique pour Q variant continûment entre O et 4 peut être étudié de manière analogue. On pose
eo =
2 m+l
-
c=l-
La fonction de partition s’écrit alors
6 m(m
+ 1)
(300a)
182
IX.3.6
INVARIANCE CONFORME
On peut examiner les cas particuliers, comme Q = 1, 2 , 3. Dans le dernier cas, on retrouve la fonction de partition du modèle à 3 états donnée par l’équation (276). La valeur limite pour m -+ 03, Q --t 4 et c -+ 1 est elle aussi intéressante, et apparaît sur la figure 6. On remarque que le premier terme de l’équation (300b) est analogue à la fonction de partition O ( n ) .
3.7 Fonctions de corrélation dans un demi-plan Nous venons d’explorer en détail des situations géométriques simples, le plan, le cylindre ou le tore. En un sens, aucune de ces situations ne met en jeu de véritable effet de bord. Si au contraire on veut étudier un modèle critique dans un demi-plan, on est réellement confronté à de tels effets. Avant de passer à la limite continue considérons une régularisation sur réseau avec des conditions aux limites libres. On peut se convaincre qu’au point critique ceci revient à exiger l’annulation de l’aimantation à la frontière. Plus précisément, cette dernière condition est compatible avec (i) l’annulation des corrélations à grande distance (ii) l’invariance conforme globale dans le demi-plan supérieur (clest-à-dire l’invariance par le groupe SL(2,R)) étant donné que le point à l’infini appartient à la frontière. Le domaine que nous envisageons est donc le demi-plan supérieur I m z > O. Si l’on ajoute un point à l’infini, ce domaine est conformément équivalent à l’intérieur du disque unité, et est invariant par les transformations conformes globales réelles de SL(2,R ) / Z 2 , sous forme de transformations homographiques z + z’ = (az P ) / ( r z S), où (Y,B, y, 6 sont réels et a6 - &,y = 1. La même transformation s’applique donc à la variable 2. En particulier, ce groupe ne contient que des translations et des dilatations réelles. I1 s’ensuit que même la fonction à deux points devient non triviale. Son comportement differe suivant les directions parallèles et perpendiculaires à la frontière. Pour le voir, nous associons à chaque point du demi-plan supérieur son image symétrique par rapport à l’axe réel. Pour tout couple de points z1 et 2 2 dans le demi-plan supérieur, et leurs images 41 et 22, on peut former le birapport u,invariant par S L (2 , R ),
+
+
O
2 2 , 22
(301) sur zi,
IX.3.7
183
INVARIANCE CONFORME
z
(z - 21)(z2 - 22) - (zl - z:)(z; - 2;) (z - 22)(z2 - 51) (.I - 2;)(z; - 2 ; )
+ ZI
(302)
L’invariance globale implique donc que la fonction de corrélation G(1,2) de deux opérateurs primaires ah,^ satisfasse à la relation
Le groupe SL(2, R)dépend de trois paramètres réels. On peut donc imposer sur zi et za trois conditions, par exemple d’être imaginaires purs tels que 2; z; = 2i, c’est-à-dire
+
Par souci de simplicité, prenons le cas d’un champ scalaire, c’est-à-dire tel que h = h. Nous avons alors, avec z = 2 iy
+
g(u) = iLah
(&,h
(i [1
+ J1-.])A h , h (i [I - m))
(305)
Ainsi il nous reste à determiner une fonction d’une variable réelle g(u). En dimension supérieure à deux, le sous-groupe du groupe conforme global qui laisse un demi-espace invariant conduit à un résultat analogue, où y1 et y2 sont les distances à la frontière et 1x1 - 2 2 1 est remplacé par la longueur de la composante parallèle du vecteur r1 - r2.
Dans les circonstances présentes, la fonction à deux points est analogue à la fonction à quatre points dans le plan, avec z1, z2, z3 et z4 remplacés par z1, 21, z2, 52. I1 y a un doublement similaire pour les corrélations d’ordre plus élevé. Afin de voir cette relation de façon plus précise, nous examinons le tenseur impulsion-énergie et exigeons qu’en coordonnées cartésiennes il n’y ait pas de flot d’impulsion-énergie à travers la frontière. En utilisant des coordonnées complexes, ceci revient à dire qu’à la frontière T,,(z) = Tzz(z). Cette relation permet d’étendre T(z) E T,,(z) analytiquement dans le demiplan inférieur par réflexion Imz
T(z) = T ( z )
(306)
où 2 appartient manifestement au demi-plan supérieur, et le membre de droite est donc bien défini. Ceci revient à dire que nous utilisons maintenant
184
IX.3.7
INVARIANCE CONFORME
la partie diagonale du produit de deux algèbres de Virasoro. En répétant le raisonnement de la section 1.3, on arrive à une formule analogue à (40) (Cardy)
On peut en déduire des conséquences analogues à celles dans le plan, pour des champs primaires correspondant à des représentations possédant des vecteurs singuliers, auquel cas nous obtenons des équations différentielles pour les fonctions de corrélations. Illustrons ceci sur l’éternel exemple du modèle d’Ising pour la fonction de corrélation spin-spin. En adaptant les calculs de la section 2.2, on trouve une équation hypergéométrique qui admet une solution en termes de radicaux, telle que
+
A condition que a+ a- soit différent de zéro, le comportement à courte distance pour y1 et y2 finis est celui qui est attendu
Si, au contraire, et à nouveau pour y1 et y2 finis, nous faisons tendre 1x1 - 2 2 ) vers l’infini, nous avons
ce qui veut dire que si a+ # O, la fonction de corrélation tend vers une constante. Si nous exigeons que dans une telle situation ( ~ 1 ~ 7 2tende ) vers zéro, nous sommes obligés de conclure que a+ = O, ce qui veut dire qu’à une constante multiplicative près ((T102)
cst
=7 (x-2
1
-xi)
1
(YlY2)S
En conséquence, quand
1x1 - 221 + CO
et que y1 et y2 sont finis, on trouve
IX.3.7
185
INVARIANCE CONFORME
(311a) Notons 711 l’exposant du dénominateur, il vient
711 = 1
(311b)
I1 s’agit là d’un nouveau résultat obtenu grâce à l’invariance conforme. Le point à l’infini doit être considéré comme faisant partie de la frontière. L’équation (311a) implique donc par invariance conforme globale que le champ s’annule sur la frontière. Par exemple
Le membre de droite s’annule bien sur la frontière mais avec une puissance fractionnaire (la fonction a donc une dérivée infinie). On peut mettre l’expression complète (310) sous une forme suggestive, qui peut être comparée à la fonction à quatre points dans le plan. En prenant le carré de ( 0 ~ 0 2 ) et en posant zij = zi - z j , zij = zi - Z j , on a (u1.2)
= 2
Z12Z12 ( Z l I 222 212 zïz
) ( -
212212
21I z22z12z ï2
)+
(313)
ce qui montre la symétrie dans l’échange simultané 1 H 2, i t* 3 et l’antisymétrie dans l’échange 1 ++ I ou 2 ++ 2, ce dernier cas étant défini par prolongement analytique. Donnons une autre application de cette même situation géométrique en utilisant la transformation conforme z -+ t L t=ylnz 17r
qui envoie le demi-plan supérieur sur une bande O < R e t < ir, avec des conditions aux limites libres (par opposition aux conditions aux limites périodiques). Si nous écrivons maintenant t = x iy, la fonction de corrélation ci-dessus (élevée au carré) devient
+
+ + iyl - iy2) + iyl - iy2)
sin(7r/2L)(xl x2 sin(7r/2L)(xl - 2 2
- (22
-+
-22)
1
(315)
186
INVARIANCE CONFORME
IX.3.7
On remarquera l’invariance par translation dans la direction y, et l’annulation quand x1 ou 2 2 = O ou L. Nous trouvons aussi, d’après l’équation (50)’ la valeur moyenne (T) dans ce ruban, en supposant qu’elle s’annule dans le demi-plan. Ainsi, pour toute charge centrale c
( T )= +/L2 I1 s’ensuit que l’énergie libre par unité de longueur se comporte comme
+
F(L) = FOL &cr/L
(317)
Le coefficient du terme en 1/L est le quart de celui trouvé dans le cas d’un ruban avec conditions périodiques, où, au lieu de (316)’ nous avions = icn/L2. Ceci suggère que l’expression (316) résulte de la substitution L -t 2L. On observera néanmoins que les fonctions de corrélation ne sont pas faciles à trouver, comme en témoigne l’équation (315).
3.8 Le voisinage du point critique Implicitement la connaissance des propriétés critiques devrait nous permettre de comprendre les propriétés d’un modèle dans tout le domaine critique, caractérisé par une longueur de corrélation finie, ou, dans le langage de la physique des particules, par un spectre de masse finie. Des travaux sont poursuivis dans deux directions. La première direction consiste à obtenir une meilleure compréhension de la relation entre modèles intégrables et leur limite invariante conforme. I1 y a de nombreuses indications selon lesquelles les deux sujets ont beaucoup en commun, si l’on en juge par l’arrièreplan mathématique. La deuxième direction, à savoir l’étude des théories quantiques des champs massifs continus, est d’importance capitale. Dans cette section finale, nous présentons quelques observations sur ce sujet. Revenons aux calculs effectués dans la section 3.2 et examinons la foncobéissant tion de partition d’un champ complexe massif libre sur un tore I, aux conditions aux limites (239). Désignons la fonction de partition correspondante par
En modifiant légèrement les calculs effectués dans la section 3.2, nous trouvons après quelques étapes laborieuses
IX.3.8
187
INVARIANCE CONFORME
où t désigne la quantité
2
Si A = lwll I m r désigne l’aire du tore, $ ( z ) = I”(z)/I’(z) la dérivée logarithmique de la fonction J? d’Euler, et y = -$(l) la constante d’Euler, les quantités yelN sont données par
+at4
1’
+oo
dA(1- A) n=-m
1
+
[ ( n C/N)2 + A P ] +
(321) On observe l’apparition d’un terme logarithmique, qui disparaît dans la différence TelN - yo, et qui est fonction de t uniquement. Appliquons le résultat ci-dessus au cas particulier d’un champ scalaire réel périodique, auquel cas
Zscalaire
1 = - = exp nIm T Do0
+at4
x
{E
{
1’
- t + t2 In [4ae-7 (Im r / A ) i ]
dA(1 - A)
00
C ( n 2+ At2)-$ 1
(1 - exp(2innRer - 2nImrJ;iL+t“))
n=-oo
Le produit infini est réel et positif. La démonstration montre que Zscalaire est invariant modulaire, bien qu’exprimé au moyen de variables adaptées à un
188
IX.3.8
INVARIANCE CONFORME
choix de base. La quantité t mesure en unités sans dimensions la déviation au point critique. On peut interpréter le numérateur exp BnIm T c(t, Im T), où c ( 0 , I m ~ )= 1, comme définissant une charge centrale dépendant de l’échelle. L’apparition d’une dépendance en In(1m T / A ) ~dans / ~ le coefficient de t2 reflète la nécessité d’une renormalisation ultraviolette de la chaleur spécifique, qui est la dérivée seconde par rapport à m. Finalement, le dénominateur apparaît comme une expression naturelle dans un formalisme de matrice de transfert, en décomposant le champ en modes propres, où les moments discrets 2n n/ lull sont associés aux fréquences propres J(2nn/Jul I)2 m2.En extrayant le mode nul responsable d’une divergence potentielle, nous retrouvons le résultat critique
+
Appliquons les formules précédentes pour obtenir la fonction de partition du modèle d’Ising au voisinage du point critique, en introduisant la masse m proportionnelle à T - T,.D’après le chapitre II nous savons que nous avons à sommer sur les quatre conditions aux limites périodiques ou antipériodiques. On tiendra compte d’un signe relatif éventuel par un prolongement analytique en m que nous prenons d’abord positif. On trouve ainsi
c’est-à-dire
+t2 l n 4 -
1
it4
1
dX(l - A)
Y5
n=l
1
[ ( n- $)2
f n=-00
(1 fe
+At72
1
[n2
+ At212
)]
2 i n n R e ~ - 2 ~ I ~ ~ m
(325)
IX.3.8
189
INVARIANCE CONFORME
Les valeurs absolues ont été supprimées, étant donné que tous les produits infinis sont réels positifs, et l’expression se réduit à 24 au point critique ( m = O). Les seuls termes qui dépendent du signe de t figurent dans les facteurs exponentiels de et DO,Oet leurs facteurs relatifs au mode potentiellement nul. En les combinant nous obtenons un terme (exp(7rImTt) f exp(-7rImTt)). Le spectre relativiste des états est celui auquel on s’attend. I1 en était de même dans le cas scalaire. Non seulement la charge centrale devient dépendante de l’échelle, mais également les dimensions des divers opérateurs. Par exemple les opérateurs de spin et de désordre, que l’on ne pouvait distinguer au point critique, deviennent deux opérateurs distincts avec des “dimensions” dépendant de l’échelle reliées par dualité, c’est-àdire t ts -t. Ainsi que nous l’avons remarqué, l’apparition d’un terme en t2 ln(Im.r/A)i dans la charge centrale est une manifestation des propriétés de renormalisation de l’opérateur $$ de dimension un. Dans une série perturbative dans le terme de masse, on rencontrera une soustraction ultraviolette au second ordre, reliée à la divergence logarithmique de la chaleur spécifique. L’invariance modulaire n’est pas explicite sur l’équation (325). Mais un développement en puissances de la variable m fera apparaître cette invariance de façon très claire. Désignons comme ci-dessus par 2’ et 21 les fonctions de partition critiques des modèles d’king et gaulsien Dij(0) (avec i, j = O, en omettant la respectivement, et soit Dij combinaison (O, O) car Do0 = O). En développant (325) nous obtenons
il
+ O((mA3)3) (326) Le terme linéaire en m correspond au fait que la valeur moyenne de l’opérateur d’énergie ne s’annule pas dans le secteur de spin. Cet effet a été mentionné précédemment. L’échelle de longueur arbitraire qui apparaît dans le terme m2 In A4 correspond à une renormalisation additive de la chaleur spécifique, ainsi que l’on s’y attendait. Finalement, l’existence de termes impairs aussi bien que pairs en m montre que sur un tore le maximum de la chaleur spécifique, maximum qui remplace la divergence dans le plan infini, n’est pas situé à m = O (T = T,)mais dépend du rapport modulaire. On remarque que la chaleur spécifique contient une contribution entropique due aux structures de spin fermioniques distinctes. Ces résultats exacts propres au modèle d’Ising correspondent à l’un des couplages aux termes essentiels, à savoir la masse. En général on ne peut traiter le voisinage du point critique que par une méthode perturbative.
190
INVARIANCE CONFORME
IX.3.8
Cependant une telle méthode n’est pas triviale, car elle incorpore la connaissance des propriétés critiques. Afin d’esquisser la procédure, examinons un système sur un tore, en supposant que l’une des périodes w1 est réelle. L’évolution dans le temps est régie par un hamiltonien
27r
Ho =-
(Lo + E o -
W1
hc)
(327)
+
La coordonnée sur le tore est écrite u = u1 iu2, et le potentiel est une somme sur des perturbations locales avec des coefficients de couplage G aux champs essentiels de dimension inférieure à deux. Par souci de simplicité, considérons le cas où la somme se réduit iiun terme unique, avec ‘p un champ primaire scalaire de poids ( h ,h). Restreignons notre attention au calcul de la charge centrale variable, bien que le formalisme ne soit en rien limité à ce cas. Soit P l’opérateur moment et 10) l’état fondamental. Au lieu de calculer la fonction de partition complète, considérons l’élément de matrice suivant, où T désigne l’opérateur d’ordre dans la variable temporelle u2 20=(01exp{-Im~2H+iPRew2} 10)
I1 est commode de revenir au plan pointé en utilisant
- Ix I < - 1, et l’ordre sur L’intégrale porte alors sur un anneau p = e-2x1ri1r< la direction radiale. I1 est aussi naturel d’employer un coefficient de couplage sans dimension 2-2h
g = G ( g )
(330)
Dans la discussion précédente nous avions G = m, h = !j, et on utilisait la variable t au lieu g pour rappeler qu’elle jouait le rôle de température réduite. Dans le cadre du modèle d’Ising nous pouvons maintenant considérer le cas d’une perturbation magnétique où G joue le rôle du champ
IX.3.8
INVARIANCE CONFORME
191
magnétique et cp celui du spin (h = &). Les couplages essentiels sont tels que 2 - 2h > O, auquel cas pour G fixé, g croît comme lwll + 00, et la théorie des perturbations est dangereuse à moins que G + O, afin de maintenir g fini. Ceci est le cas le plus intéressant, car il peut engendrer un flot vers une classe d'universalité différente. On peut envisager deux possibilités typiques. Dans la première, la dimension conforme 2h de cp est voisine de 2, et on peut développer une théorie des perturbations près de la marginalité, dans le paramètre 2-2h supposé petit. Au contraire, on peut effectuer un développement direct en g. Ce dernier est a priori sûr. Si 2h désigne un nombre fractionnaire entre O et 2, le comportement ultraviolet est régulier (à l'exception d'une divergence logarithmique au second ordre, quand 2h = 1, ce qui est le cas rencontré ci-dessus). Les singularités infrarouges sont supprimées par la géométrie finie, et la série est vraisemblablement convergente, étant donné que les quantités physiques sont analytiques en g dans les circonstances présentes (cette propriété est manifeste dans l'exemple précédent). Nous avons uniquement besoin des corrélations de cp au point critique car on a le développement
Si le hamiltonien H possède un état fondamental pour g # O, nous présumons que In 2IIm.r aura une limite finie quand ImT + +m. Ceci justifie la définition d'une charge centrale variable selon C(g) = 12 lim
(332)
P+O
Si nous supposons que les fonctions de corrélation impaires s'annulent dans le développement (331), ceci veut dire que l'on a la série C(g) = c
+ g2c2 + g4c4 + . ..
(333)
où le terme d'ordre zéro est la charge centrale usuelle. En insérant la fonction de corrélation à deux points (334) qui normalise le couplage g, on en déduit
r(nf2h) c2=6cn+h n=O n!I'(2h) O0
1
(
)
2
1
=61
dX Xh-'F(2h, 2h; 1; A)
(335)
192
IX.3.8
INVARIANCE CONFORME
expression qui a un sens pour 2h < 1. I1 est possible de retrouver de cette façon la charge centrale variable du modèle d'king pour une perturbation thermique du type de celle calculée précédemment (à condition de prendre garde à la singularité logarithmique de Cz),en effectuant des calculs analogues à tous les ordres. On peut aussi calculer la dimension des opérateurs le long du flot. Nous laissons au lecteur le soin de poursuivre les calculs dans cette voie. Un progrès très intéressant serait de trouver des expressions compactes pour ces quantités au lieu d'un développement en puissances du couplage. Diverses indications suggèrent que cet espoir n'est pas exclu.
Appendice A: Séries et produits 6 de Jacobi Nous rassemblons ici quelques formules relatives aux fonctions 6 elliptiques de Jacobi. Elles sont associées à un tore, quotient du plan complexe par un réseau de translations A engendré par 1 et T tel que ImT > O. Nous avons posé de façon constante q = e x p 2 im , 141 < 1. On écrit aussi y = exp2i7rz où z est une variable complexe. Les quatre fonctions 6 de Jacobi définies par
+m
-CO
+CO
-m
n<1 CO - q n ) n<1+ 03 yqn+l)(l O
1
+CO
-03
m
1
O
+y-lqn)
1X.A
193
INVARIANCE CONFORME
sont des fonctions entières de z. On établit aisément leur comportement dans des translations du réseau A, ainsi que la position de leurs zéros. L’égalité des sommes et des produits est due à l’identité de triple produit de Jacobi. Cette dernière est la source d’un grand nombre de relations, parmi lesquelles l’identité pentagonale d’Euler
1
-00
D’autres formules utiles sont (Euler)
1
ainsi que l’identité de produit quintuple de Watson 00
JJ(1 - $)(1 - yqn)(l - y-Iqn-l)(l - &p-1)(1
-y-
q2n-1)
1
-00
La fonction de Dedekind s’écrit r ] ( T ) = q%l)
(A-5)
La fonction û1 s’annule à l’origine. Si 1’011désigne par le symbole prime la dérivée par rapport à la variable z , on trouve la relation 1
= ~e,(o,T)e3(o,T)e,(o,~) = q3(.) (-4.6) 27r Les quantités ûi(O,T ) (2 5 i 5 4) sont parfois appelées constantes 8. On a --o;(o,T)
194
1X.A
INVARIANCE CONFORME
Elles satisfont à l’identité de Riemann (A.8a) Cette identité est équivalente à la formule
qui exprime que sur un réseau hypercubique à quatre dimensions C les centres des hypercubes peuvent être divisés en deux sous-réseaux entiers C* engendrés par les vecteurs ( i c i , ~ E Z $, ~ 3 , 9 ~ 4avec ) ~i = f l et ~i = f l . Ces deux sous-réseaux sont reliés par une symétrie par rapport à tout hyperplan perpendiculaire à un axe de coordonnées, et chacun d’eux est isométrique au sous-réseau Cililpairc C ( Cinipaircorrespond à une somme des coordonnées impaire). Dans l’étude des transformations modulaires on a eu besoin de la somme de Gauss suivante. Soit w une racine primitive N-ième de l’unité (w= e2ixIN ), on a la relation
ni
De façon équivalente, quand N O, 1, 2, 3 mod.4, la somme est 1+ i, 1, O, i respectivement. Les propriétés de transformation modulaire résultent de la formule de Poisson. Posons
Si A = f a
(c
i)
désigne une matrice unimodulaire à éléments entiers on
(A.ll)
1X.A
où
INVARIANCE CONFORME
195
est une racine vingt-quatrième de l’unité. Les fonctions û permettent de construire des fonctions méromorphes doublement périodiques en prenant des rapports ou des dérivées. Le prototype en est la fonction de Weierstrass telle que EA
(A. 14) qui est une fonction méromorphe paire avec un pôle double à l’origine (ainsi qu’aux points qui s’en déduisent par translation du réseau), et deux zéros dans le parallélogramme des périodes. Elle obéit à l’équation différentielle non linéaire du premier ordre, où le prime désigne la dérivée par rapport à z , T étant fixé, +PI2 - p
-
15e4p - 35e6
(-4.15)
avec (A.16) Les racines du polynôme cubique du nombre de droite de (A.15) sont, par symétrie, les valeurs p ( $ ) , ~ ( $ 7 )et’ p ( f ( 1+ T)). Le discriminant de ce polynôme, multiplié conventionnellement par 24, est relié à la fonction q Par
196
INVARIANCE CONFORME
1X.A
Appendice B: Algèbre super-conforme Nous avons vu en diverses circonstances comment des variables commutantes et anticommutantes apparaissent sur un pied d’égalité. Nous décrivons ici une généralisation naturelle des transformations conformes au plan super-complexe, paramétrisé par une paire de variables J = ( z , B ) et f ( 5 , où 8 et sont des variables anticommutantes. Un superchamp analytique fonction de t et 0 uniquement est de la forme
e),
e
4(J) = Po(.) + BPlb)
(B-1)
L’opérateur de Cauchy-Riemann admet alors une racine carrée naturelle
Par la suite nous écrivons d pour d / d z . L’intégrale de supercontour désigne
tandis qu’une intégrale définie
est telle que
Une fonction super-analytique admet un développement en série de Taylor
Comme
1X.B
197
INVARIANCE CONFORME
le théorème des résidus s’écrit
Les transformations super-conformes sont telles que l’application satisfasse à
5
-+
5’
(B.ll)
D = D(û’)D’
ce qui signifie que l’opérateur différentiel D se transforme de façon homogène. Ceci n’est pas le cas des transformations super-analytiques générales, où D = (Dû’)D’ + [D(z’)- e’D(e’)]DI2 Les transformations super-conformes globales dépendent de trois paramètres complexes ( Z O , z1, W O ) et de deux paramètres anticommutants &,&. Elles peuvent s’écrire
6 + 5’
z’ = zo -
wo- eeo - z1 -
eel
e/ = eo +
e - el z1 eel
-
(B.12)
-
Ceci définit une extension supersymétrique du groupe SL(2,C). Les transformations super-conformes locales obéissant à (B.11) correspondent à un champ super-vectoriel v(5) engendré par le super-tenseur impulsion énergie
de telle sorte que
(B.14) Dans la formule (B.13)’TB(z) est le tenseur bosonique ordinaire de dimensa contrepartie fermionique de dimension $, où l’on doit sion 2 et TF(z) comprendre que la dimension de 8 est celle de 23. Si 4 est un superchamp primaire de dimension h, nous avons
+
+
Svq5 = [va $ D ( v ) D h(dv)] 4
(B.15)
de sorte que la relation (B.14) est équivalente au développement à courte distance
198
INVARIANCE CONFORME
1X.B
La charge centrale apparaît dans la formule correspondante pour le produit
ou encore
6,T = [va
+ SD(lJ)D + ;a4 T +
(B.18)
Sous forme finie, les formules de transformations (B.15) et (B.18) prennent la forme
4(E) = 4 ’ ( E ’ ) ( m 2 h T(E)= T ‘ ( E ‘ ) ( W 3 + &c
{E‘, E )
(B.19)
la super-dérivée Schwarzienne étant écrite comme
(B.20) Dans une transformation super-conforme particulière
{E’, E } se réduit à 8 {z’, z } où {z’, z } est la dérivée Schwarzienne ordinaire. Le développement de Laurent de T (B.21) conduit dans le cadre de la quantification radiale à l’ensemble suivant de relations de commutation et d’anticommutation (où nous utilisons la notation [A,BI+ = AB BA pour l’anticommutateur)
+
Dans le développement (B.21) la somme sur les indices des générateurs de l’algèbre de Virasoro porte sur des entiers, comme dans le cas usuel. Mais pour les partenaires G;?,il existe deux choix qui définissent ce que l’on
1X.B
INVARIANCE CONFORME
199
appelle le secteur de Neveu-Schwarz (N-S), avec n E 2 + qui conduit à des champs de spineurs univalués (de même que T F )dans le plan z , ou le secteur de Ramond (R), avec n E 2 et des champs de fermions bivalués (de même que T F )dans le plan z. Ces propriétés sont inversées dans un ruban périodique, en accord avec la formule (B.19) où les champs N-S-fermioniques sont antipériodiques, et les champs R-fermioniques sont périodiques. On engendre donc en fait deux algèbres super-conformes distinctes. Nous nous sommes bornés à la dépendance en des champs. Naturellement on a des propriétés semblables pour la dépendance en (. Pour abréger, et par abus de langage, nous continuerons à omettre cette dépendance parallèle. L’opérateur Lo agit comme un hamiltonien, le vide 10) appartenant au secteur N-S étant annihilé par les cinq générateurs L O ,L*I, Gk1/2 des transformations globales super-conformes. Les vecteurs de poids dominant Ih) des secteurs N-S sont alors en correspondance biunivoque avec les superchamps h ( J ) par Ih) = &(O) 10). Le secteur R possède la caractéristique additionnelle que Go agit comme une charge supersymétrique. Ce générateur commute avec LO et GO = Lo - &c. En général, les états R de poids dominant se présentent donc en paires lh*) avec Ih-) = Go lh+). On appelle champs de spin les champs conformes ordinaires O * ( z ) qui échangent les secteurs R et N-S en engendrant les états Ih*) à partir du vide, O*(O) [O) = Ih*). La condition Go Ihf) = O entraîne l’existence d’une supersymétrie engendrée par Go dans le secteur R (en d’autres termes le module de Verma engendré par Ih-) se découple de la théorie). Ceci n’est possible que si h+ = &c. Soit F l’opérateur qui compte le nombre de champs fermioniques. La quantité I? = (-l)F est appelée opérateur de chiralité. Les états R appariés ont une chiralité opposée, puisque Go anticommute avec r. Les champs de spin de même chiralité sont relativement locaux. I1 n’en est pas de même des champs de spin de chiralité opposée. Restreignons-nous ici à la description de représentations unitaires des algèbres superconformes. Si c 2 $ et h 2 O, toutes les représentations fournies par les modules de Verma sont équivalentes à des représentations unitaires. Cependant quand c < il n’existe qu’une suite discrète de représentations unitaires (dégénérées). Elles sont analogues à celles trouvées dans le cas unitaire pour l’algèbre conforme ordinaire. Soit M un entier supérieur ou égal à deux, la charge centrale de cette série unitaire discrète est donnée par
9,
(B.23) qu’il s’agisse du cas N-S ou du cas R. Les poids appartiennent à la table finie
200
1X.B
INVARIANCE CONFORME
hT,S
=
+
[ ( M 2)T 8M(M
+ 2)
-4
+k(1-
(B.24)
(-l)T-s)
Ici T - s est pair pour les représentations de l'algèbre N-S et impair pour les représentations R. Pour M = 2 nous avons la représentation triviale. Quand M est impair, h = &c n'est pas dans la table, de sorte que la supersymétrie est brisée dans le secteur R, tandis que pour M pair, hlM,+M+l= &c et la supersymétrie peut être préservée. Plus généralement on établit des formules pour les déterminants des formes contragrédientes, aussi bien que pour les caractères. En particulier pour les représentations unitaires (B.24), il y a trois types de caractères. La charge centrale étant sous-entendue, q = e2ilrr,T et s indexant les poids, nous les désignons par x N S ,g N S , zR
{
)(E:(T)
q { [ 2 n ~ ( ~ + 2 ) + ~ ( ~ + 2 ) - ~ ~ ] z - 4 } / 8 M(Mf2)
=Tr(-l)FqLo
T -s
X E s (7) = Tr qL0
p= 1
T
1- q p
- s G O mod
2
1 mod 2
n=-co
{[211hf(M+2)+l( M + 2 ) - s M ] Z - 4 } / 8 h f ( M + 2 )
-
(B.25) Une classification des modèles minimaux cohérents (et en particulier des modèles unitaires) peut être obtenue suivant les raisonnements de la section 3.4 en utilisant l'invariance modulaire sur un tore. Bornons-nous à montrer ici comment le formalisme se relie à la physique statistique, en rappelant l'interprétation du premier modèle non trivial de la série de charge centrale (B.23) correspondant à M = 3 (Friedan, Qiu et Shenker). Ce modèle s'avère être unique, et coïncider avec celui correspondant à la valeur m = 4 de la classification conforme ordinaire. Dans les deux cas c = et les poids
&
1X.B
201
INVARIANCE CONFORME
6 ,a,
possibles dans le cas de l’algèbre de Virasoro étaient (figure 4) h = O, - et &, tandis que, d’après l’invariance superconforme plus forte, nous avons hi,^ = O, h2,2 = & dans le secteur NS et h1,2 = h2,1 = & dans le secteur R. Ce modèle s’identifie a u modèle d’king tricritique. En indexant par V les représentations de l’algèbre de Virasoro, le secteur pair par la symétrie 2 2 est sous-tendu par deux représentations de type N-S
6
&,
(B.26)
tandis que le secteur impair par 2 2 est le secteur R, qui contient des opérateurs de type magnétique, avec
(B.27) En insérant le préfacteur habituel q-cf24 dans les caractères, on a la table de correspondance
Sur un tore de rapport modulaire r , la fonction de partition correspondante prend la forme
(B.29)
202
1X.B
INVARIANCE CONFORME
Appendice C: Algèbre des courants La théorie des champs conformes se généralise à des systèmes présentant des symétries continues. Un exemple est fourni par des modèles CJ généralisés, où les champs prennent leurs valeurs dans un groupe de Lie G. Le lagrangien cinétique est complété par un terme topologique qui permet la réalisation d’une invariance locale G, x Gz engendrée par une paire de courants conservés ~ ( z J) (, z ) ( ~=J a J = O). Le tenseur impulsion-énergie est donné par une expression quadratique en termes des courants, lesquels ont des poids conformes (1,O) et (0,l) respectivement. Les coefficients de J et J , dans un développement de Laurent, compris comme des opérateurs, engendrent une paire d’algèbres de Kac-Moody (ou algèbres affines) commutantes, de dimension infinie. Dans le texte nous avons rencontré les caractères de l’algèbre SU(2) affine, en discutant la classification A-DE des modèles minimaux. Ceci justifie que nous décrivions ici de façon succincte quelques aspects de la relation entre théorie des groupes et invariance conforme.
C . l Algèbres de Lie simples Le lecteur est certainement familier avec la classification de CartanKilling des algèbres de Lie simples à coefficients complexes et leurs représentations de dimension finie. La description qui va suivre peut être complétée grace à la très vaste littérature sur le sujet, et a pour seul objet de présenter quelques notations utilisées dans le texte. Les algèbres de Lie simples se présentent en quatre familles infinies et cinq cas exceptionnels. Les quatre familles sont réalisées en termes des transformations infinitésimales correspondant aux groupes classiques de matrices complexes, suivant la table
e21
Ae C 2 2 Be e 2 3 Ce e 2 4 De
+
groupe linéaire spécial s L ( e 1) groupe orthogonal en dimension impaire SO(2.t 1) groupe symplectique SP(2l) groupe orthogonal en dimension paire SO(2e)
+
e,
La restriction sur le rang le nombre maximal d’éléments commutants linéairement indépendants, qui engendre une sous-algèbre de Cartan, est destiné à éviter les isomorphismes en basse dimension, tels que Al BI CI, Ca B 2 , D2 Al x A l , 0 3 As. Les cinq cas exceptionnels sont moins familiers; ce sont les algèbres de Lie Gz, F4, Es, E7, Ea, où l’indice indique le rang. Toutes les algèbres de Cartan, c’est-à-dire les algèbres abéliennes maximales, sont conjuguées dans le groupe. Les éléments de l’une d’entre elles, N
N
-
N
N
IX.C.1
203
INVARIANCE CONFORME
notée I<, peuvent être diagonalisés simultanément dans n’importe quelle représentation, et en particulier dans la représentation adjointe. L’ensemble de ces valeurs propres sont des éléments dans l’espace dual K * , et sont appelées racines dans le cas de la représentation adjointe. Si e, (un élément de l’algèbre de Lie) désigne un vecteur propre commun, ceci veut dire que pour tout k appartenant à K on a
[IC, e,] = (CY Ik) e,
(C-1)
Le fait que l’algèbre de Lie soit simple implique que les racines engendrent K* . De plus il existe une forme invariante bilinéaire symétrique non singulière, notée ( , ), telle que
( a , b ) = @,a) (a,b) = O pour tout a + b = O (C.2)
( [ a ,bl c) = ( a , [b,CI) 7
Les racines se présentent en paires {CY, -(Y},celles-ci étant les seules proportionnelles à (Y.D’après l’identité de Jacobi, si deux racines CY et p sont telles que CY + p # O (i) si CY + p est une racine, le crochet [e,, eo] est proportionnel à ea+O, (ii) si cy + ,B n’est pas une racine, alors [e,,ep] = O. Si CY ,LI = O, les éléments
+
IC, = [e,,e-,l
-
(e,,e-,)
(C.3)
(al
engendrent K (la correspondance signifie que ( k a ,IC) = (e,, e-,) avec les e, normalisés de façon telle que ( k a , k a )= 2(e,,e-,)
#0
(cy
\IC))
(C.4)
La restriction de la forme bilinéaire à I< reste non singulière. Le triplet {e,, e-,, IC,} engendre une algèbre S L ( 2)
[e, , e-,] = IC,
[kY,e*,I = f2e*,
dont une réalisation familière est donnée par des matrices 2 x 2
k a + ( 1O
u)
-1 O )
ainsi qu’une forme bilinéaire induite
(ab
+ be, + ce-,,
uICa
+ be, + ce-,)
= (IC,, IC,)
{u2
+ bc}
(C.5)
204
INVARIANCE CONFORME
IX.C.1
L’élément ep est un état propre de IC,
où Aa,o doit être entier, ce qui résulte des propriétés des représentations finies de l’algèbre SL,(2) ((7.5) agissant sur les états eo+sal s entier (IC, est l’analogue de deux fois la composante z du moment angulaire et a par conséquent des valeurs propres entières). Comme par dualité il découle de ((7.3) et (C.4) que
il est naturel de transférer la forme bilinéaire sur l’espace dual des racines K* par la formule
(C.10) auquel cas nous pouvons aussi écrire
(C.11) Supposant ( a ,P ) # O, les éléments engendrent une représentation de SL,(2) qui doit conterir ün élément avec une valeur propre IC, opposée à celle de ep. Cet élément correspond à
I1 s’ensuit que l’ensemble des racines contient, pour chaque racine qui s’en déduit par réflexion dans l’hyperplan perpendiculaire à a
0, celle (C.12)
Ces réflexions engendrent un groupe ponctuel appelé groupe de Weyl. I1 fait le lien entre la théorie des algèbres de Lie simples et la cristallographie. Le groupe de Weyl agit transitivement sur des ensembles de racines de base { a l l . . . ,at}, également appelés racines simples, en termes desquelles toutes les racines peuvent s’écrire a = Cniai où tous les ni sont des entiers de même signe (ou zéro). En conséquence le nombre de racines est pair et se subdivise en racines positives ou négatives (notées a > O ou a < O). Les 3l éléments Ici IC,,, e{*) f e+,t forment un ensemble de générateurs pour l’algèbre de Lie et obéissent aux relations suivantes (ChevalleySerre)
IX.C.1
INVARIANCE CONFORME
205
((7.13)
La matrice de Cartan
e x e à éléments entiers (C.14)
caractérise par conséquent complètement l’algèbre à des permutations simultanées des lignes et des colonnes près. Ses éléments diagonaux sont égaux à 2, et pour i # J , A,, # O implique A,, # O (tous deux étant négatifs). Les algèbres de Lie simplement lacées A , D ,E sont telles que toutes les racines sont de même longueur, et en conséquence la matrice de Cartan est symétrique. Les éléments non diagonaux non nuls de A,, sont codés dans un diagramme de Coxeter-Dynkin, où e points sont associés aux racines simples. Les paires de points {i, J} sont joints par A,,A,, = O, 1 , 2 , 3 lignes. Si A,, = O, les racines correspondantes sont orthogonales et les réflexions w, et w, commutent. Si les racines ne sont pas orthogonales (w,w,)~’~J = 1, où l’entier m,,, vaut 3, 4 ou 6 selon que i et j sont reliés par 1, 2 ou 3 lignes. Le diagramme est connexe (dans le cas contraire l’algèbre se scinderait en une somme directe de sous-algèbres commutantes). La description donnée ci-dessus caractérise seulement le groupe de Weyl, indépendamment de la longueur des racines. On montre que soit les racines simples sont de longueur égale, auquel cas il n’y a pas de lignes multiples dans le diagramme, soit elles sont divisées en deux groupes, racines longues et racines courtes. Si A,,AJ, = 1, (a,,a,) = (a,,a,) tandis que si (a,,a,) > (a,,a,) et A,, # O, alors A,, = -1 et A,, = -2 ou -3. Ainsi il suffit de mettre une flèche sur les lignes multiples pointant de la racine longue vers la courte. L’ensemble des diagrammes possible est représenté comme suit
Ae
-----
Be
-----
ce
---------
206
IX.C.1
INVARIANCE CONFORME
E6
T
E8
(C.15)
Les racines { a }engendrent un réseau sur les entiers appelé le réseau des racines. Les coracines 2 a / ( a ,a ) engendrent un second réseau, isomorphe au précédent à un facteur d’échelle près, sauf dans les cas Be et Ce où cette dualité échange les réseaux des racines. Ces deux algèbres ont donc le même groupe de Weyl. Le réseau des racines est invariant par le produit semi-direct du groupe de Weyl et d’un groupe de translation discret. Une description équivalente est que ce groupe inhomogène est engendré par n 1 réflexions dans les hyperplans limitant un simplexe (qui est un domaine fondamental). En prenant l’origine à l’un des sommets, C des hyperplans sont orthogonaux aux C racines simples, et le (e 1)-ième hyperplan est orthogonal à une e y i a i = O, yo = 1, avec des coefficients yi racine a0 donnée par la relation Co entiers positifs. Ces entiers caractéristiques yi obéissent à plusieurs relations intéressantes. Leur somme h = Et Ye, appelée nombre de Coxeter, est reliée à la dimension de l’algèbre de Lie, notée dim, par
+
+
+
dim = C( 1 h )
(C.16)
IX.C.1
INVARIANCE CONFORME
207
de sorte que Ch est pair et égal au nombre de racines. La notation h est standard, et ne doit évidemment pas être confondue avec celle des poids conformes. Par ailleurs, le produit des entiers y est relié à la dimension du groupe de Weyl IWI par l’identité
(C.17) On définit des quantités analogues relatives aux coracines, et en particulier un nombre de Coxeter dual, noté g (qui s’identifie à h pour une algèbre simplement lacée). Le déterminant de la matrice de Cartan intervient quand on étudie les représentations irréductibles de dimension finie de l’algèbre de Lie. Ces dernières sont associées à des points sur le réseau dual (sur les entiers 2) du réseau des coracines, appelé réseau des poids. Par définition pour chaque poids q et chaque racine a, 2(q, a ) / ( a a, ) est donc un entier. Le réseau de poids est lui aussi invariant par le groupe de Weyl et contient comme sousréseau celui des racines, avec un indice égal au déterminant de la matrice de Cartan. Le réseau des poids est engendré par e poids fondamentaux qi, 1 5 i 5 e, tels que
(C.18) Ces poids dominants ont un produit scalaire non négatif avec les racines simples, et chaque poids peut être appliqué sur un poids dominant par un élément du groupe de Weyl. La somme q, des poids fondamentaux est telle que e
q, =
qi = I
4
a
(C.19)
Cr>O
Les représentations irréductibles de dimension finie possèdent un vecteur de poids dominant, noté q, vecteur qui est annihilé par les représentants des e!’). Les poids q, associés aux valeurs propres des générateurs de la sousalgèbre de Cartan (c’est-à-dire que la valeur propre de IC, est 2(a, q,)/(a, a ) ) sont de la forme q - Cpiai, où les pi sont non négatifs. Les poids de la représentation adjointe sont les racines, et la racine dominante I) = -a0 est une racine longue. Les caractères correspondants xs sont donnés par une formule due à Weyl, et se présentent comme des fonctions d’un vecteur x de dimension C variant dans le tore de Cartan
208
INVARIANCE CONFORME
IX.C.1
((2.20)
Dans cette formule mult(q’) est la multiplicité du poids q’ dans la représentation, et, dans la somme sur le groupe de Weyl, E ( W ) vaut plus ou moins, selon la parité de son expression en termes des réflexions génératrices. Le dénominateur admet une forme factorisée
(C.21) a>O
Le passage à la limite x
+ O,
donne la dimension de la représentation
(C.22) L’invariant quadratique de Casimir (à un facteur multiplicatif arbitraire près) a la forme (q + q m , q + 9,) - ( s m ,s m ) = (9,q + 2qm)
(C.23)
I1 ne suffit cependant pas à caractériser la représentation quand le rang e est supérieur à un. Considérons les polynômes dans les composantes des poids, et parmi eux distinguons ceux qui sont invariants par le groupe de Weyl comme l’invariant quadratique ci-dessus. Ces derniers peuvent être à leur tour exprimés comme des polynômes en e polynômes fondamentaux qui généralisent la forme quadratique (q,q). Leur degré est donné dans la dernière colonne de la table III. Le degré le plus élevé est le nombre de Coxeter h, le produit de tous les degrés est l’ordre du groupe de Weyl, et le double de leur somme est dim(G) e, où dim(G) est la dimension de l’algèbre de Lie. Si l’on soustrait l’unité à ces degrés (obtenant ce que l’on appelle des exposants), on retrouve les indices des éléments diagonaux non nuls (avec leur multiplicité) apparaissant dans les fonctions de partition invariantes A-D-E discutées dans le texte. La table inclut également une colonne donnant le nombre de Coxeter dual g, qui est la valeur de l’invariant de Casimir quadratique (C.23) dans la représentation adjointe, lorsque l’on normalise à l’unité la racine longue. Rappelons qu’on a h = g pour les groupes .simplement lacés. Observons au passage qu’on a la formule suivante due à Freudenthal
+
(C.24)
IX.C.1
209
INVARIANCE CONFORME
où ( ( Y c ~ ( Y ~est ) le carré de la longueur d’une racine longue. La table inclut une colonne donnant la dimension de l’algèbre, une autre donnant l’ordre du groupe de Weyl, et une dernière donnant la structure des quotients du réseau des poids par le réseau des racines, considérés comme groupes additifs (l’ordre étant detAij) On pourrait généraliser la discussion précédente aux algèbres de KacMoody infinies admettant des matrices de Cartan dégénérées, ou de façon globale à des “groupes de lacets” (c’est-à-dire des applications du cercle dans un groupe de Lie) et leurs extensions centrales. Nous nous bornerons à suggérer cette généralisation, en présentant les modèles dits de WessZumino-Witten. Ces derniers sont caractérisés par le fait qu’une symétrie globale est étendue en symétrie locale (ou symétrie de jauge). On verra que ces modèles ont une structure reliée à l’invariance conforme. C.2 Modèles de Wess-Zumino-Witten Le modèle O non linéaire à deux dimensions est une théorie des champs massive, asymptotiquement libre, et globalement invariante par un groupe de symétrie continu. Essayant de trouver un point fixe infrarouge non trivial, Witten a été conduit, dans le cas où le champ u prend ses valeurs dans un groupe de Lie compact G, à ajouter un terme topologique qui suggère perturbativement l’existence d’une telle théorie critique. Afin de simplifier la discussion, nous supposerons que le groupe de Lie compact possède une algèbre de Lie simple (qui sera ensuite étendue sur les complexes). Le terme topologique possède la structure typique d’une anomalie que l’on rencontre en étudiant un modèle de fermions couplés à un champ de jauge. Nous n’insisterons pas ici sur cet aspect bien qu’originellement cette construction bosonique ait eu pour but de trouver une équivalence bosonfermion dans le cas non commutatif. Le point de départ est l’action du modèle O X>O
((7.25)
Nous supposons que la quantité u prendses valeurs dans une représentation unitaire fidèle de G et le symbole Tr représente la trace dans cette représentation, à un facteur approprié près. Comme on a la relation ((7.26)
et que pour u unitaire, u-’a,u est une matrice antihermitienne dans la représentation de l’algèbre de Lie, on voit que S(O) est positif (le poids de Boltzmann doit être compris comme exp -S). La même formule montre que tout ce dont on a réellement besoin est d’une forme invariante bilinéaire sur l’algèbre de Lie, que l’on peut identifier à la forme unique de ce type (d’où
dim
IWI
C(C+ 2)
(e + l ) !
Poids/Racine
2/(C+ 1 ) 2 q 2 e 1) 2eC! 2/22 C(2C+ 1) 2eC! 2/22 L(2C - 1) 2[-1C! C pair: 2 / 2 2 x 2 / 2 2 C impair: 2 / 4 2 14 12 id. 52 1152 id. 78 51840 2/32 133 2903040 2/22 248 696 729 600 id.
+
g
degrés des invariants
C + l 2,3, ...,C + i 2C-1 2,4, ...,2C C + l 2,4, ...,2C 2(C - 1)2,4,. . . ,2(C- l ) , l
4 9 12 18 30
2,6 2,6,8,12 2,5,6,8,9,12 2,6,8,10,12,14,18 2,8,12,14,18,20,24,30
Table III : Données concernant les algèbres de Lie simples.
IX.C.2
INVARIANCE CONFORME
211
la restriction à une algèbre de Lie simple), à un facteur multiplicatif près. Ainsi
Tr(u-’a,u)(u-’a,u)
(u-laau’ .-laau)
(C.27)
NOUSnormaliserons la forme bilinéaire en convenant que la longueur des racines longues est prise égale à l’unité. On verra plus bas l’intérêt de ce choix non conventionnel qui doit être présent à l’esprit, si l’on veut comparer les expressions qui vont suivre à celles d’autres auteurs. Dans un système de coordonnées arbitraires, ou dans un espace courbe de métrique g a b , le lagransen dans ,s’(O) est remplacé par l’expression invariante conforme +jgubTr(&u-’ûbu). En tout cas il est invariant par un groupe global de la forme G x G, par la substitution u 4 u-l ainsi que par toute réflexion dans le cas de la métrique de l’espace euclidien. Afin de justifier l’addition du terme S ( l ) ,on compactifie l’espace euclidien en une sphère bidimensionnelle que nous désignons ici C2 pour éviter les confusions (il faut bien entendu tenir compte d’un changement éventuel u(z)donne une image de de système de coordonnées). I1 en résulte que 2 C2 dans le groupe, qui peut être déformée continûment en un point (l’énoncé précis est que le deuxième groupe d’homotopie 7r2(G) s’annule), de sorte que nous pouvons étendre u(x)à une application u(y) de la boule B (l’intérieur de la sphère unité de l’espace tridimensionnel) dans le groupe. Ceci nous permet d’écrire un second terme -f
où w est la 1-forme w = u-ldu. Dans la seconde expression, les produits doivent être compris à la fois comme des produits extérieurs sur les formes et des produits intérieurs sur les représentants des éléments de l’algèbre de Lie (ainsi W,,W = [w/\,w] apartient a l’algèbre de Lie). L’extension de C2 à B n’est pas unique. En recollant deux telles extensions sur la sphère C2, on voit que la différence entre les valeurs possibles de S ( l ) est donnée par une intégrale similaire portant sur une sphère C3, correspondant à un élément d’une classe du troisième groupe d’homotopie 7r3(G).Dans le cas de groupes de Lie simples, ce dernier admet un générateur unique et les deux valeurs de S(’) ne peuvent difféEr que par un multiple de l’intégrale sur ce générateur. La normalisation de Tr ou de la forme bilinéaire ( , ) est choisie de façon telle que cet arbitraire se réduit à un multiple entier de 27ri. Cet arbitraire n’affecte donc pas exp --S(’) pourvu que le coefficient 6 soit un entier. Nous devons donc avoir
212
IX.C.2
INVARIANCE CONFORME
((7.29)
Pour comprendre le sens de cette restriction, consis irons par exemple un sous-groupe SU(2) dans G et représentons de façon fidèle u sous la forme expi$a.n où n est un vecteur unitaire sur C2 de coordonnées (sin O cos ‘p, sin O sin ‘p, cos O), avec O I: 8 < 7r, O 5 ‘p < 27r. Ici a désigne les matrices de Pauli et $ varie entre O et 7r. Cette paramétrisation utilise bien sûr le fait que SU(2) est topologiquement équivalent à C3. Tenant compte de ce que w = u-ldu, un calcul simple donne l’expression (wA,w,,w) = 6(03, a3) sin2 $d$,
sin8dOAd’p
Le générateur du troisième groupe d’homotopie est donné par l’application identité C3 + SU(2). Comme sin2 $d$,,
sin OdBAd’p= 27r 2
nous avons dans ce cas (C.30) Le générateur a3 est équivalent à l’élément IC, intervenant dans les équations (C.5)’((7.6). Pour la cohérence de l’intégrale de chemin, il s’ensuit que la condition de quantification est que, pour toute racine c y , i k ( k , , k a ) soit un entier. Mais ( @ , a = ) (ka,ka)= 4/(ICa,ICa). Ainsi pour toute racine a , le coefficient k dans l’expression (C.28) doit satisfaire à
IC E ( a , a ) 2
(C.31)
La condition la plus forte correspond au cas des racines longues. Nous avons fixé par convention la normalisation de la forme quadratique de façon que (ae,ae)= 1, ce qui entraîne que k doit être un entier. Le même calcul montre que IC pourrait encore être restreint si G n’est pas un groupe simplement connexe. Par exemple si G est le groupe SO(3) au lieu de SU(2), le coefficient k doit être pair. Bien que la 3-forme ( W ~ , W , , W ) soit fermée mais non exacte, nous pouvons la paramétriser de façon telle qu’elle apparaisse localement comme la différentielle d’une 2-forme (non uniforme). Pour S U ( 2 ) par exemple nous pourrions écrire
87r
‘p sin2 $d$A
sin 8dO
IX.C.2
INVARIANCE CONFORME
213
qui est une intégrale non uniforme sur un espace bidimensionnel avec des singularités à û = O et x . Nous décidons donc que l'action totale est la somme
s = s(0)+ $1)
((3.32)
et calculons sa variation afin d'obtenir les équations du mouvement classiques
Cette variation ne fait intervenir qu'une intégrale bidimensionnelle. En utilisant des coordonnées complexes { z , 2 ) , on en déduit
+
(A-' - ak) 8 ( u - ~ ~ u (A-' )
+ $ k ) d ( u - ' ~ u )= O
((2.34)
Quand le facteur X satisfait à la condition A=-
4
(C.35)
lkl
nous avons soit 6' (u-ldu) = O si k est positif, soit a (u-ldu)= O si k est négatif. Prenant k > O pour fixer les idées, une solution classique se factorise sous la forme uciass = uï( z ) ~ , '
(z)
(C.36)
Pour cette valeur de A, l'action totale prend la forme
tandis que
S(U+SU) = S ( U )+ k
(~-~S~,d(u-'du))
(C.37b)
Posons ut = ue-tH, où H est un élément de l'algèbre de Lie. En utilisant les identités précédentes, on peut intégrer S(u,) de zéro à un et obtenir l'identité remarquable
214
INVARIANCE C O N F O R M E
S(1Lv-l) = S ( u )
+ S(v-1) + IC
s ‘B
- (v-ldv,u-ldu)
IX.C.2
((2.38)
De plus si nous déformons une solution classique ul(t, z)iiZ’(t, 2) de paramètre t variant de t = O à 1 de telle sorte qu’à t = O elle soit l’identité et qu’à t = 1 elle prenne la valeur ( C . 3 6 ) ,on déduit de l’équation (C.37b) que l’action reste constante et en fait égale à zéro. L’équation ( C . 3 8 ) montre alors que, pour le choix particulier X = 4/ lkl, l’action est invariante par le groupe de jauge G z @ G,
u ( z ,z) 4 u1(z)u(z, z)Q(z)
(C.39)
La question est maintenant de comprendre comment cette symétrie est représentée au niveau quantique. Si 1,011 garde X et IC comme paramètres, un calcul à une boucle montre qu’au premier ordre, la fonction ,LI de CallanSymanzik s’a~iiiuleencore pour X = 4/ Ilcl, tandis qu’elle révèle une anomalie quantique (un terme de Schwinger) dans les commutateurs des courants qui engendrent la symétrie (C.39). Plutôt que de chercher à déduire de l’intégrale de chemin les réponses non perturbatives précises, on peut essayer de trouver un ensemble cohérent de fonctions de corrélation compatibles, en utilisant les identités de Ward de l’invariance conforme conjointement à celles de l’invariance de jauge. Les courants conservés J ( 2 ) = $ICudu-l
dJ=O
J ( z ) = $ku-ldu
dJ=O
(C.40)
prennent leurs valeurs dans l’algèbre de Lie et les lois de conservation qui expriment l’analyticité de J (l’antianalyticité pour J ) ne constituent qu’une reformulation des équations du mouvement classiques (si nous remarquons que a J = -u(dJ)u-’). Comme dans le cas du tenseur-impulsion énergie, ces lois de conservation doivent être comprises pour des insertions dans les fonctions de corrélation, à des termes de contact près. Dans une variation infinitésimale du type ( C . 3 9 ) ,où O ( z ) et fi@) sont des éléments infinitésimaux de l’algèbre de Lie, le champ se transforme selon
u ( z ,2 ) -t u(2,z)- O ( z ) u+ un@) u-1(2, 2 ) -+ u - y z , 2 ) - n(z)u-l + u-1O(z)
(C.41)
Ces relations sont endendues en termes d’une représentation matricielle fidèle. A leur tour les courants se transforment selon ((7.42)
rx.c.2
INVARIANCE CONFORME
215
Tenant compte du fait que les courants sont eux-mêmes les générateurs de transformations de jauge infinitésimales, on interprète ces équations comme un énoncé concis, équivalent à l’existence de deux algèbres de KacMoody infinies, exactement comme l’équation (47) engendrait les algèbres de Virasoro. Jusqu’ici J et 7 sont considérés comme des champs classiques intervenant comme arguments dans des fonctions de corrélation. En d’autres termes, leurs coefficients dans un développement sur une base de l’algèbre de Lie sont des quantités commutantes. Si un champ A se transforme suivant une représentation de G, 8 Gz, l’équation ((7.26)implique que sa variation infinitésimale s’écrit
SnA(z’, 2’) =
/
( O ( z ) ,J ( z ) )A(z’,2’)
(C.43)
où le contour encercle le point z’. On a évidemment l’analogue pour la variation SQA. Cette formule est entièrement parallèle à l’équation (41) correspondant à une transformation infinitésimale de coordonnées. Nous l’appliquons maintenant à la variation du champ J ( z ) et développons J sur une base ta de l’algèbre de Lie, avec
(C.44) Les constantes de structure totalement antisymétriques sont définies par [ t a , t b ] = ifabctc
(C.45)
Dans une représentation unitaire, les générateurs t sont hermitiens et coïncident dans le cas de S U ( 2 ) avec $ca.L’équation ((7.43) se traduit par le développement à courte distance
J ” ( z ) J b ( z ’ )= ‘IC
fia b
( z - 2’)2
+-i ( z - 2’)J C ( z ‘ )+ . . .
(C.46)
où les termes omis représentent des termes réguliers, et on a utilisé l’antisymétrie des constantes de structure. Le premier terme du membre de droite représente l’anomalie quantique, analogue de la charge centrale pour l’algèbre de Virasoro. Le développement est en accord avec le caractère commutatif des coefficients J a ( z ) (c’est-à-dire qu’il est invariant dans un échange simultané ( a , z ) e ( b , z ’ ) ) .Pour abréger, nous omettons la contrepartie dans la variable 2. La formule (C.46) est complétée par celles donnant la relation avec le tenseur-impulsion énergie, et exprimant que J ( z ) a pour poids conformes (1,O)
T (z)T(z’) =
C
2( z - 4
4
+ ( 2 -2z’)2 T(2’) +
1 ~
(2
- 2’)
dT( 2 ’ ) + . . . (C.47)
216
INVARIANCE CONFORME
T ( z ) J " ( z ' )=
1
( z - z')2
P(z')+
1 ~
(z - z')
aJa(z') + ..
IX.C.2 (C.48)
En utilisant la quantification radiale, on peut définir des opérateurs correspondants ? ( z ) , j(z), agissant sur les champs conformes, et donc aussi sur l'espace vectoriel des états. Nous développons ces opérateurs en série de Laurent de puissances de z et omettons, pour alléger les notations, le chapeau sur les opérateurs coefficients
Les développements à courte distance sont alors équivalents à l'ensemble des relations de commutation
Cette dernière équation définit l'algèbre de Kac-Moody, la seule extension centrale, à équivalence près, de l'algèbre du groupe des lacets [ j g , j & ] = ifabcjn+m. A nouveau nous sous-entendons les contreparties en 2, correspondant aux mêmes valeurs de k et e. L'unitarité d'une représentation requiert
(J:)+ = JEn
(C.51)
Un champ primaire, créant un état de poids dominant, sera caractérisé par une paire de poids conformes (h,h) relativement à l'algèbre de Virasoro, aussi bien que par une paire de représentations de dimension finie (R,'IZ) pour les algèbres de Lie finies {J,"} , { @ }. Celles-ci peuvent aussi être indexées par leur poids dominant. Un tel champ évalué à l'origine (et avec dépendance dans la variable conjuguée), lorsqu'il agit sur le vide, engendre un état fondamental Ih,R) annihilé par les opérateurs L, et J," pour n positif. Compte tenu de la spécificité de modèle, nous nous attendons à ce que le tenseur impulsion-énergie s'exprime en termes des courants J et que la charge centrale soit reliée au groupe G et au niveau k . De fait, classiquement le tenseur impulsion-énergie est quadratique dans les courants, forme suggérée à la fin des années soixante par Sugawara (dans un contexte fermionique), et élaborée par de nombreux auteurs. Exprimée en termes d'opérateurs, cette relation s'écrit T(Z)
1
=-
2x
: a
P(z)P(z) :
(C.52)
IX.C.2
INVARIANCE CONFORME
217
pour une valeur appropriée du coefficient x. L’ordre normal requiert que les opérateurs d’indice n < O soient placés à gauche des opérateurs d’indice n 2 O. Partant de la forme diagonale du produit scalaire sur l’algèbre de Lie, l’expression (C.52) est le seul candidat pour un invariant quadratique (ainsi que T doit l’être). On note l’analogie avec le câs d’un champ scalaire, où T était proportionnel à ( 3 ~ )I1~est . ici proportionnel à son équivalent Tr 3u-ldu. La constante x intervenant dans (C.52) est fixée par une condition de cohérence entre algèbres. Pour le voir, appliquons les deux membres de l’équation à un état de poids dominant J h , R ) où h dénote la plus petite valeur de Lo. Ne retenons que les termes en z-’. Ceci s’écrit (C.53) et donne ce que l’on pourrait appeler un état singulier, si l’on pense en termes du module engendré par l’ensemble des opérateurs { L-n} { J-m} Ih, R). Agissant successivement avec L1 et Ji”,on trouve
Pour utiliser les relations de commutation (C.50)’ nous remarquons que l’opérateur CbJob JO,agissant dans la représentation irréductible R de poids dominant qa, donne la valeur correspondante de l’invariant quadratique de Casimir
+ 2%)
((2.55)
c 7 7 .= (977.7972
tandis que, d’après (C.45)’ la quantité analogue dans la représentation adjointe est
(C.56)
= (-(Yo,
-a0
+ 2%)
&,,c,
On peut vérifier que c a d j n’est pas autre chose que le nombre de Coxeter dual (rappelons que (ae,ae) = 1). Revenons aux équations (C.54)’ nous trouvons
218
IX.C.2
INVARIANCE CONFORME
et par conséquent le facteur de normalisation 22 prend la valeur
(C.57)
22=k+g tandis que le poids conforme est relié à la représentation
R par (C.58)
Dans le cas du groupe SU(2), si nous caractérisons la représentation par son moment angulaire j , sachant que g prend la valeur 2 (ainsi qu’il résulte de (C.55) en faisant l’identification f a b c -t &abc ou en utilisant la relation CR = j ( j 1) pour j = 1)’nous avons 22 = IC 2 et h = j ( j l ) / ( k + 2). La valeur de la charge centrale est obtenue en demandant que l’état vide soit invariant par le groupe G , et a par conséquent un poids h = O. En calculant
+
+
+
et en utilisant les règles de commutation de l’algèbre de Kac-Moody, on trouve en insérant la valeur de x obtenue précédemment k c = dim(G)k+g
((7.59)
Ici dim(G) est la dimension de l’algèbre de Lie de G. Dans le cas de SU(2), on a donc c = 3 k / ( k 2). En général, pour les groupes simplement lacés, c varie entre le rang du groupe (correspondant à k = 1) et sa dimension quand k tend vers l’infini. La construction s’étend sans peine aux algèbres de Lie semi-simples par produit direct et peut même inclure des facteurs abéliens (avec une valeur correspondante g = O), et elle coïncide alors avec la théorie du champ libre compactifié sur un cercle. I1 existe plusieurs généralisations de la construction précédente. Nous nous bornerons à décrire ici une observation remarquable faite par Goddard, Kent et Olive. Supposons que l’algèbre de Lie simple G contienne une sousalgèbre simple H. Soit k le niveau de G (l’entier caractérisant l’anomalie dans l’équation (C.51~)). Quand on se restreint à la sous-algèbre, le niveau peut différer de k dans le rapport de racines longues. En effet si (at, at) = 1 pour G, la restriction de la forme quadratique à l’algèbre de Lie H donne en général une valeur fractionnaire pour la normalisation de sa racine longue. Supposons que les premiers indices au nombre de dim(H) se réfèrent à H . On a alors les expressions suivantes des tenseurs impulsion4nergie
+
IX.C.2
219
INVARIANCE CONFORME
((7.60)
diin( H )
Par conséquent, les charges centrales correspondantes sont données par
CG
k = dim(G) -
k
C H = dim(H)-
+ QG
k' k'
+ gH
((7.61)
où (C.62) est plus grand ou égal à k , puisque ( a c , a c ) ~ / ( a e , c . rest c ) ~un entier. Des règles de commutation (C.50b),il résulte que L,(G/H) E L,(G) - L,(H) commute avec les courants de la sous-algèbre H, et donc aussi avec L,(H). Ainsi l'algèbre de Virasoro relative à G se scinde en deux parties qui commutent TG
= TH
+ TG/H
((7.63)
Comme les charges centrales sont additives, on obtient pour le modèle quotient G f H
Supposons les représentations unitaires. Si CGIH = O, la représentation correspondante est triviale, et les représentations des algèbres de Virasoro et de Kac-Moody pour G et H sont équivalentes, en dépit de leur allure très différente. Ceci conduit à des constructions opératorielles non triviales. Par exemple si G est un groupe de Lie simplement lacé, si IC = 1, et si H est le tore abélien maximal (correspondant à la sous-algèbre de Cartan) nous avons CG = CH = rang de G = e. Ainsi CGIH = O, et nous sommes conduits à une présentation de la théorie non abélienne en termes de e champs scalaires périodiques, avec construction associée pour les courants restants (non diagonaux) en termes des exponentielles de ces champs scalaires. Une autre application est une construction de la série des représentations minimales unitaires de l'algèbre de Virasoro. Une possibilité est de considérer l'inclusion G = S p ( 2 ( m- 1))3 Sp(2(m - 2 ) )@ Sp(2) = H , le niveau original étant k = 1, et le sous-groupe héritant dans ce cas d'un niveau IC' = k = 1. Nous avons
220
IX.C.2
INVARIANCE CONFORME
CG
CH
(m - 1)(2m - 1) 6 = 2m - 5 m+l m+l 6 (m - 2)(2m - 3) 1 = 2m - 6 = m m
+
=
+
+
et par conséquent
(C.65~) Une autre possibilité est d’utiliser pour G le groupe SU(2) x SU(2) et pour H le sous-groupe diagonal SU(2). Dans G, les niveaux des deux facteurs peuvent être choisis à volonté. Le choix (m - 2 , l ) donne pour H le niveau ( m - 1), et pour la charge centrale
C(SU(2),,,4
3(m - 1) 3(m - 2) +1m m+l 6 =Im ( m 1)
xsU(2)l)/sLr(z),,,~l =
(C.65b)
+
c’est-à-dire une fois de plus la série unitaire minimale. Ces observations peuvent être utilisées pour compléter la preuve du théorème de Friedan, Qiu et Shenker, selon lequel les représentations de Virasoro correspondant aux valeurs de m entier plus grandes ou égales à deux sont les seules à être unitaires et de charge centrale inférieure à l’unité. C.3 Représentations et caractères des algèbres de Kac-Moody
Nous pouvons seulement ébaucher ici la théorie des représentations des algèbres de Kac-Moody. Nous nous limitons aux représentations unitaires, et montrons d’abord comment l’on retrouve dans un cadre algébrique le fait que le niveau k doit être entier (par opposition à la déduction topologique précédente) et quelles sont les restrictions supplémentaires sur la représentation R de G qui conduisent aux représentations dites intégrables de l’algèbre de Kac-Moody. Rappelons que pour l’algèbre de Lie de G dans la représentation adjointe, le poids dominant est la racine (longue) positive ,$ = -(Yo
(C.66)
Montrons alors que le niveau k est un entier non négatif tel que (C.67)
IX.C.3
221
INVARIANCE CONFORME
Bien que notre expression soit écrite avec la convention (+,+) = 1, nous avons rétabli ici une normalisation arbitraire, afin de rappeler que 2($, qR)/(+, +) est un entier non négatif. Pour démontrer cette propriété, considérons la sous-algèbre SU(2), dans l'algèbre de Kac-Moody, dans la généralisation évidente de la base de Chevalley-Serre, qui résulte des règles de commutation
k a , e-,] = -2e1, a
[ k g ,ef] = 2ef
[ O
-1
Ceci montre que les générateurs
peuvent jouer le rôle de
,ea,e-, respectivement, car ils interviennent comme générateurs de SU(2) dans les équations (C.56).La représentation de l'algèbre de Kac-Moody peut être décomposée en états de poids définis pour la sous-algèbre { J t } , qui satisfont à
Pour tout q dans cette décomposition, la quantité k - 2 ( a , q ) doit être un entier. Appliquons ceci & la racine dominante a = -a0 = et tenons compte de (+, $J) = 1. Nous trouvons que k - 2(+, q)/($J, +) doit être entier, et donc que k est aussi entier. De plus si l'état de poids dominant correspond à une représentation R avec un poids dominant q R , nous devons avoir
+
-a
e,
lsn) = 0
Dans le cas d'une représentation unitaire, (e;")'
= ea,. En conséquence
Ainsi k 2 2(a,qR)et la condition la plus restrictive provient de la racine dominante $J normalisée à l'unité, ce qui conduit à la restriction (C.67) sur les représentations R possibles.
222
INVARIANCE CONFORME
IX.C.3
Prenons par exemple SU(2), nous avons (q,qR)/(q, +) = j moment angulaire entier ou demi-entier. I1 s’ensuit que pour l’algèbre de KacMoody correspondante, notée Ai’), k doit être un entier non négatif tel que k 2 2 j 2 O. Nous conclurons cet appendice en décrivant les caractères des représentations unitaires des algèbres de Kac-Moody. Elles sont dérivées des modules formés de l’ensemble des états obtenus par action d’un produit d’opérateurs Z , ( n > O) sur un état de poids dominant IqR) et ses partenaires, donnant une représentation R du groupe de Lie fini sous-jacent G. Rappelons que nous avons une représentation associée de l’algèbre de Virasoro caractérisée par les valeurs
k
c = dim(G) -
(C.68)
k+g
de la charge centrale et du poids conforme h, où CR = (qn,q R 2q,) . Naturellement nous choisissons pour le niveau k un entier. Comme dans le cas de dimension finie, le caractère est une fonction génératrice des multiplicités des poids de G , intervenant à un degré n dans une décomposition sur des états diagonalisant la sous-algèbre de Cartan de {J,”} . Ecrivons ces multiplicités sous la forme mult,(q), et notons que la valeur correspondante de l’opérateur de graduation LOest h, = h n. Si x est un vecteur arbitraire dans l’espace des racines de dimension e, et si T est un nombre complexe dans le demi-plan supérieur, définissons le caractère par la formule
+
+
(C.69) où la somme sur q porte sur le réseau des poids de l’algèbre de Lie finie de G. Nous avons inclus un facteur exp(-&2in~c), comme dans le texte, de telle sorte que si on les applique au cas x = O, les formules précédentes deviennent
x ~ , k ( OT,) = TrR,k exp 2 i n ~(Lo - &c)
(C.70)
L’expression de Weyl-Kac des caractères (qui généralise l’équation ((7.20)) donne x comme un rapport de deux sommes sur le groupe de Weyl (fini) de G, selon
IX.C.3
INVARIANCE CONFORME
223
où, comme ci-dessus, q, est la somme des poids fondamentaux (égale à la demi-somme sur les racines positives) et les fonctions 0 généralisées sont
Dans cette formule C représente le réseau engendré sur les entiers par les racines longues, et s’identifie pour des groupes simplement lacés au réseau des racines. Nous avons rétabli une normalisation arbitraire pour la forme quadratique invariante. Naturellement lorsque k = O et R est l’identité, x se réduit à l’unité. I1 existe une forme factorisée pour le dénominateur dans l’équation (C.71)’ analogue à l’équation (C.21)’ qui conduit à des identités remarquables sur les fonctions 0, généralisant l’identité de triple produit de Jacobi (appendice A). Insérant la définition (C.72) dans (C.71)’ et divisant par un facteur commun égal à la quantité Gq,,, (x)apparaissant dans la formule de Weyl, nous obtenons plus explicitement
(C.73)
En particularisant cette formule à la valeur x = O, et en désignant par dim, la dimension de la représentation R de poids dominant q , on trouve
((2.74)
SU(2). Cette algèbre Comme cas particulier, considérons le cas où G possède une unique paire de racines fa,C est le réseau des racines aZ, le nombre de Coxeter dual est g = 2, et q, = $a. Alors qn = 2 j( $ a ) , qR q, = ( 2 j l ) ( $ a ) et y = p a où p prend des valeurs entières. Finalement dimqR ( k g)y = 2 j + 1 + 2(k 2)p. Le caractère s’écrit
+
+ + +
+
224
INVARIANCE CONFORME
IX.C.3
Posant comme dans la section (3.4)
N = 2 ( k + 2)
X=2j+1
(C.76)
on voit que cette expression coïncide avec celle donnée par l’équation (268)
où nous avons utilisé l’identité de Jacobi pour obtenir la seconde égalité. La construction de Goddard, Kent et Olive des représentations de la série unitaire minimale se traduit en une identité entre caractères de l’algèbre de Lie affine de SU(2) et de l’algèbre de Virasoro. Pour E = O ou +,cette relation s’écrit
où le prime signifie que la somme porte sur les valeurs de j’ telles que j - j’ est entier si E = O, et demi-entier si E = En particularisant pour x = O, et en utilisant comme dans (C.76) la notation (A,N),ceci s’écrit pour 15 X 5 m - 1 et 2~ = O ou 1
8.
Notes Une première discussion du rôle de l’invariance conforme est due à A.M. Polyakov, JETP Lett. 12, 381 (1970). L’algèbre de Lie infinie qui lui est associée dans le cas bidimensionnel a été introduite dans le cas des modèles duaux par M.A. Virasoro Phys. Rev. D1, 2933 (1970). On
1X.Notes
INVARIANCE CONFORME
225
trouve dans le livre de I.T. Todorov, M.C. Mintchev et V.B. Petkova, Conformal Invariance in Quantum Field Theory, Pubblicazione della classe di scienze della scuola normale superiore, Pisa (1978) des informations complémentaires sur des tentatives antérieures de formuler des théories invariantes conformes cohérentes. Les articles fondamentaux à l’origine des applications présentées ici sont ceux de A.A. Belavin, A.M. Polyakov, et A.B. Zamolodchikov, J. Stat. Phys. 34, 763 (1984) et Nucl. Phys. B241, 333 (1984). L’ouvrage collectif Vertex Operators in Mathematics and Physics édité par J. Lepowsky, S. Mandelstam et I.M. Singer, Springer Verlag, New York (1985) contient plusieurs contributions, parmi lesquelles celle de D. Friedan, Z. Qiu et S. Shenker sur les représentations unitaires des algèbres de Virasoro et superconformes, et leurs applications à la physique, et celle de A. Rocha Caridi sur les caractères correspondants. La formule du déterminant de Kac est annoncée par V.G. Kac, Springer Lecture Notes in Physics 94, 441 (1979). Nous avons suivi la démonstration de B.L. Feigin et D.B. Fuchs dans Funct. Anal. et Appl. 16, 114 (1984), 17, 241 (1983). Les articles de V.S. Dotsenko, Nucl. Phys. B235 [FS il] 54 (1984) et du même auteur avec V.A. Fateev, Nucl. Phys. B240 [FS12] 312 (1984) et B251 [FS 131 691 (1985) traitent des modèles minimaux et des fonctions de corrélations. La fonction de partition du modèle d’king sur un tore a été obtenue dans le travail de Ferdinand et Fisher, cité au chapitre II. La relation entre la charge centrale et l’effet Casimir sur un ruban est discutée par H.W.J. Blote, J.L. Cardy, M.P. Nightingale, Phys. Rev. Lett. 56, 742 (1986) et I. Affleck, Phys. Rev. Lett. 56, 746 (1986). J.L. Cardy a écrit un article de revue sur les applications statistiques de l’invariance conforme dans la série de Domb et Lebowitz, vol. 11 Academic Press, New York (1986). Quelques-unes de ses contributions importantes sont J. Phys. A17, L385 (1984), Nucl. Phys. B270 [FS 161 186 (1986) sur l’invariance modulaire, Nucl. Phys. B240 [FS 121 514 (1984) sur la géométrie semi-infinie, Phys. Rev. Lett. 54, 1354 (1985) sur la singularité de Lee et Yang. Les conséquences de l’invariance d’échelle dans ce cas avaient déjà été discutées par M.E. Fisher, Phys. Rev. Lett. 40, 1610 (1978). L’interprétation de la série principale des modèles minimaux dans le cas unitaire par D.A. Huse, Phys. Rev. B30, 3908 (1984) repose sur le travail de R.J. Baxter, J. Phys. A13, L61 (1980) et G.E. Andrews, R.J. Baxter et P.J. Forrester, J. Stat. Phys. 35, 193 (1984). Sur ce sujet, voir aussi A.B. Zamolodchikov, Sow. J. Nucl. Phys. 44, 529 (1986). La théorie des champs sur un tore est présentée dans un travail commun avec J.B. Zuber dans Nucl. Phys. B275 [FS 171 580 (1986) tandis que la classification A-D-E des modèles minimaux, énoncée comme une conjecture dans un travail avec A. Cappelli et J.B. Zuber, Nucl. Phys. B280 [FS 181
226
INVARIANCE CONFORME
1X.Notes
445 (1987), a été démontrée par ces mêmes auteurs dans Comm. Math. Phys. 113, 1 (1987), et indépendamment par A. Kato, Mod. Phys. Lett. A2, 585 (1987). Une relation importante avec les caractères affines est discutée par D. Gepner and E. Witten, Nucl. Phys. B278, 493 (1986), D. Gepner, Nucl. Phys. B287, 111 (1987), et une pièce du puzzle prouvée par D. Gepner et Z. Qiu, Nucl. Phys. B285 [FS 191 423 (1987) dans le cadre d’une discussion plus large. Un travail ultérieur dans la ligne des modèles intégrables est dû à V. Pasquier, Nucl. Phys B285 [FS19], 162 (1987). T. Eguchi et H. Ooguri ont généralisé les équations de Belavin-Polyakov-Zamolodchikov à des surfaces de Riemann de genre arbitraire dans Nucl. Phys. B282, 308 (1987). Des formules explicites pour les fonctions de corrélation du modèle d’king ont été obtenues par P. Di Francesco, H. Saleur et J.-B. Zuber, Nucl. Phys. B290 [FS20], 527 (1987). Frustrations et symétries sont étudiées par G. von Gehlen, V. Rittenberg, J. Phys. A19 L625 (1986), J.-B. Zuber, Phys. Lett. B176, 127 (1986) et J.L. Cardy, Nucl. Phys. B275 [FS 171 200 (1986). Les modèles d’Ashkin-Teller (J. Ashkin et E. Teller, Phys. Rev. 64, 178 (1943)), de Potts, et les modèles à six et huit vertex sont présentés dans le livre de R.J. Baxter, Exactly Solved Models in Statistical Mechanics, Academic Press, New York (1982). L’interprétation des modèles statistiques en termes de gaz de Coulomb est l’objet d’une revue de B. Nienhuis, J. Stat. Phys. 34, 731 (1984), où l’on trouvera des références aux contributions originales. En particulier les opérateurs combinés charge-monopole et leurs corrélations apparaissent dans le travail de L.P. Kadanoff et A.C. Brown, Ann. Phys. (New York) 121, 318 (1979). Leur étude dans le contexte conforme se trouve dans P. Di Francesco, H. Saleur et J.B. Zuber, J. Stat. Phys. 49, 57 (1987), S.K. Yang, Nucl. Phys. B285 [FS19] 183 (1987), S.K. Yang et H.B. Zheng, Nucl. Phys. B285 [FS19] 410 (1987). Les déviations à la criticalité sont examinées par A.B. Zamolodchikov JETP Letters 43, 730 (1986) et dans le travail de l’un des auteurs avec H. Saleur, J. Stat. Phys. 48, 449 (1987). Une référence aux fonctions elliptiques et modulaires, qui inclut les formules limites de Kronecker, est A. Weil Elliptic Functions according to Eisenstein and Kronecker, Springer Verlag, Berlin (1976). Le traitement des fermions dans le contexte de l’invariance conforme trouve son origine dans le travail de P. Ramond, Phys. Rev. D3,2415 (1971) et A. Neveu et J.H. Schwarz, Nucl. Phys. B31, 86 (1971). Pour la théorie des champs superconforme et ses applications à la physique statistique, on se reportera à la contribution de D. Friedan, Z. Qiu et S. Shenker dans le livre Vertex Operators in Mathematics and Physics déjà cité, et à leur article Phys. Lett. 151B, 37 (1985), ainsi qu’à M.A. Bershadsky, V.G. Knizhnik, M.G. Teitelman, ibid. 31 (1985), et H. Eichenherr, ibid. 26 (1985). P. Goddard, A. Kent et D. Olive, Comm. Math. Phys. 103, 105 (1986) et A. Meurman et A. Rocha-Caridi, Comm. Math. Phys. 107, 263
IX .Notes
INVARIANCE CONFORME
227
(1986) discutent la construction des caractères. La classification des modèles minimaux superconformes est explorée par D. Kastor, Nucl. Phys. B280 [FS 181 304 (1987), Y. Matsuo et S. Yahikozawa, Phys. Lett. 178B, 211 (1986), et A. Cappelli, Phys. Lett. 185B, 82 (1987). Les modèles de l’appendice C sont décrits par A. Polyakov et P.B. Wiegmann, Phys. Lett. B131, 121 (1983), et E. Witten, Comm. Math. Phys. 92, 455 (1984). La structure conforme est élaborée par V. Knizhnik et A.B. Zamolodchikov, Nucl. Phys. B247, 83 (1984), D. Gepner et E. Witten, Nucl. Phys. B278, 493 (1986), P. Goddard et D. Olive, Int. J. of Mod. Phys. A l , 303 (1983); ce dernier article passe en revue les algèbres de Lie et de Kac-Moody. La théorie des algèbres de Lie est décrite dans nombre de livres, parmi lesquels J.P. Serre Algèbres de Lie semi-simples complexes, Benjamin, New York (1966) et J.E. Humphreys Introduction to Lie Algebras und Representation Theory, Springer Verlag, Heidelberg (1972). Les algèbres de Kac-Moody et leurs représentations sont présentées par V.G. Kac Infinite Dimensional Lie Algebras, 2ème édition, Cambridge University Press (1985), qui contient de nombreuses références à la littérature mathématique. Finalement, il est bon de rappeler qu’une théorie des champs en termes de courants fut proposée par H. Sugawara, Phys. Rev. 170, 1659 (1968) et développée par de nombreux auteurs, comme une partie de l’algèbre des courants, avec des résultats qui anticipaient plusieurs de ceux décrits dans le présent chapitre, comme en témoigne l’article de R. Dashen et Y. Frishman, Phys. Rev. D11, 2781 (1975). Parmi les développements importants qui ne sont pas couverts ici figurent l’étude des corrélations de courants et leurs remarquables propriétés de monodromie, ainsi que la relation entre les constructions bosonique et et fermionique. L’invariance conforme des théories des champs bidimensionnelles a des applications importantes pour la théorie des cordes, un aspect qui sera brièvement décrit au chapitre XI.
CHAPITRE X
SYSTEMES DESORDONNES ET METHODES FERMIONIQUES
Les systèmes réels présentent des défauts de types variés. I1 est donc important d’examiner leur effet sur les résultats obtenus dans les cas purs. Dans la dernière section de ce chapitre, nous présentons le critère de Harris qui permet d’estimer si un faible désordre perturbe un système critique. A un niveau plus fondamental, on peut également chercher à mettre en évidence de nouveaux phénomènes intrinsèquement liés à la présence de défauts. Par exemple, la dynamique des dislocations dans un cristal peut expliquer la transition solide-liquide. De même dans l’étude du modèle X Y , nous avons été conduits à analyser le rôle des tourbillons. Les potentiels aléatoires dus aux impuretés produisent la localisation des fonctions d’ondes (Anderson, 1958)’ propriété qui est liée à la transition isolant-conducteur. La localisation apparaît aussi dans des circonstances classiques mettant en jeu des ondes optiques ou acoustiques. Ce sujet a suscité une intense activité. On ne peut toutefois pas prétendre à une compréhension complète à l’heure actuelle même si le cas d’un faible désordre est bien maîtrisé grâce à des arguments de groupe de renormalisation. L’influence des champs magnétiques a ouvert un nouveau domaine de recherche lié à l’effet Hall quantique. Les systèmes magnétiques à interactions aléatoires etjou frustrées ont aussi stimulé des développements très originaux. On s’attend à trouver une phase verre de spin où les moments magnétiques sont figés dans des directions aléatoires, ainsi qu’une pléthore d’états métastables ou “vallées’’ dans les valeurs de l’énergie libre. Les applications des méthodes développées pour traiter les verres de spin vont des réseaux de neurones aux supraconducteurs à haute température récemment découverts, en passant par les problèmes d’optimisation. Cette liste illustre la diversité du sujet. L’archétype des systèmes désordonnés reste la théorie des matrices aléatoires élaborée par Wigner et Dyson dans l’étude des spectres nucléaires à laquelle nous consacrons un ample paragraphe. Plus généralement dans ce chapitre, nous présentons des illustrations simples des méthodes de théorie des champs, et tout particulièrement de l’utilisation de variables anticommutantes. Ces morceaux choisis inciteront peut-être le lecteur intéressé à poursuivre l’étude de cette branche importante de la physique statistique.
230
SYSTEMES DESORDONNES
x.l
1. Modèles unidimensionnels 1.1 Le potentiel aléatoire gaussien Considérons le hamiltonien d’une particule quantique se déplaçant sur une droite en présence d’un potentiel aléatoire ayant une distribution gaussienne. Une méthode ingénieuse due à Halperin (1965) permet d’obtenir le spectre. I1 est intéressant de comparer ce résultat exact à celui fourni par la méthode heuristique des répliques qui est généralement utilisée dans ce contexte. Nous rencontrerons dans cette étude un exemple élémentaire de supersymétrie, dite symétrie BRS (Becchi-Rouet-Stora). Cette dernière apparaît dans le traitement des systèmes contraints et fut initialement formulée dans la quantification des théories de jauge. Outre les spectres on est, bien sûr, intéressé par diverses autres propriétés de ces systèmes comme la structure des fonctions d’ondes ou la moyenne de produits de fonctions de Green (afin d’obtenir des coefficients de transport). Malheureusement, ces questions sont en général très délicates et on ne connaît pas de solution analytique. Cependant un modèle désordonné discrétisé nous permettra de montrer, en toute généralité, que les fonctions d’ondes sont localisées à une dimension. Cette propriété est vérifiée dès que la partie aléatoire du hamiltonien ne présente pas de corrélations à longue portée. A première vue, nous semblons alors confrontés à un paradoxe. D’une part, nous obtenons un spectre moyen continu mais d’autre part, la présence de fonctions d’ondes localisées, donc normalisables, entraîne d’ordinaire un spectre discret. I1 est en fait vraisemblable que outre une partie discrète et une partie continue, le spectre de tels systèmes désordonnés contient génériquement une partie singulière, phénomène peu familier dans le cadre des applications élémentaires de la mécanique quantique. Notons que des propriétés similaires apparaissent lorsque le hamiltonien d’un système possède plusieurs périodes incommensurables. Ce serait, par exemple, le cas pour le spectre d’une particule dans un quasicristal. Soit donc le hamiltonien
H =
Ti2
2m
a2 + V ( x )
ax2
où V est un potentiel aléatoire, de valeur moyenne nulle, et n’ayant aucune corrélation entre points distincts. I1 s’agit certes d’un cas extrême mais qui a le mérite, comme nous l’avons signalé ci-dessus, de permettre un traitement exact. I1 faut ici distinguer les moyennes quantiques, notées avec des parenthèses, des moyennes sur le désordre, notées à l’aide de crochets. Le potentiel est décrit par un processus gaussien centré dont nous écrivons la fonction de corrélation sous la forme
x.l.l
231
SYSTEMES DESORDONNES
Plus précisément, on obtient toutes les moyennes à l’aide de la fonction génératrice (exp i
/
dxg(x)V(x)) = exp - i D
/
dzg2(x)
(3)
où g(z) est une fonction de carré intégrable. Nous allons chercher à calculer la moyenne sur le désordre de la fonction de Green à points coïncidants. Pour z complexe, introduisons la quantité
L’invariance par translation (et réflexion), après moyenne sur le désordre, montre que le résultat ne dépend pas du point x. Dans la limite où z tend vers l’axe réel, la partie imaginaire de G(z) donne la densité moyenne de niveaux d’énergie par unité de longueur, le nombre total de niveaux étant proportionnel à la taille du système. Précisément plaçons le système dans une boîte de longueur L avec conditions aux limites périodiques. Alors p(E), la moyenne sur le désordre de la densité de niveau, est donnée à la limite thermodynamique ( L + co) par 1 p ( E ) = Im-G(E - io) = ((x IS(E - H)I x))
(5)
n-
Le nombre moyen de niveaux par unité de longueur, qui ont une énergie inférieure à E, s’écrit alors
Comme le potentiel n’est pas borné, nous nous attendons à un spectre variant de -00 à +co. I1 est commode d’introduire des unités réduites pour les longueurs et les énergies en posant
v = A-2v x=T
h
A 3
m2
H
=z
A-2H
= A-2 (-LA 2
+V )
(7)
(V(z)V(y)) = 6( 3 - y)
E =A-2E Dans la suite, nous omettrons d’indiquer les barres. Dans ces nouvelles unités D et m/h2 prennent une valeur unité. A très haute énergie, le potentiel est négligeable. I1 est donc vraisemblable que le nombre total d’états par unité de longueur tende vers sa limite classique (un état par cellule AxAp/27r)
232
x.l.l
SYSTEMES DESORDONNES
& i
Efm
En revanche le comportement à E résultera de l'expression exacte.
-+ -00
est beaucoup moins intuitif et
1.2 Equation de Fokker-Planck Soit V une configuration du potentiel, $ la fonction d'onde correspondant à l'énergie E , solution de l'équation de Schrodinger. Cette dernière est donc une fonctionnelle de V. Sa dérivée logarithmique f vérifie une équation de Ricatti du premier ordre
Lorsque l'on interprète la coordonnée spatiale x comme une variable d'évolution, une analogie apparaît avec le mouvement brownien. Nous voulons exploiter l'indépendance des valeurs du potentiel évalué en des points distincts. Soit P(<,x) la densité de probabilité de f ( x ) 1 27r
P(<,x) = (6(f(x) - I)) = - /dae-'"t
(eiaf(z))
(10)
En dérivant par rapport à x la valeur moyenne du membre de droite et en utilisant l'équation (9)' on obtient ( f z ( x ) + 2E - 2V(z))ei"f(") La propriété caractéristique de la distribution gaussienne (3) nous donne avec D = 1,
En utilisant cet te expression dans la formule ci-dessus, on trouve
Intégrons maintenant l'équation de Ricatti pour des valeurs croissantes de x, en partant de la valeur de f en un point xo, que nous faisons tendre vers
x.1.2
233
SYSTEMES DESORDONNES
-00. I1 est clair que f(z) ne dépend que des valeurs de V pour y la fonction retardée définie par
et s’annulant pour y condition
< z. Soit
> z. D’après l’équation (9) cette quantité satisfait à la
dont une solution est donnée par
Lorsque y t z,
r(z,y) tend vers la limite apparemment mal définie
r(z,
=2qo)
(15)
Cette difficulté apparaît fréquemment dans ce type de problème. Pour la surmonter en préservant la symétrie z + -2, on peut discrétiser le modèle ou bien désingulariser la fonction de corrélation V - V en remplaçant la distribution 6 par une approximation u,(x-y) où u, est une fonction paire, positive, très piquée autour de l’origine, d’intégrale unité et tendant vers S quand E tend vers zéro. Cela revient à remplacer le facteur û(z - y) uE(z’)dz’ et û(0) par u,(z’)dz’. En dans (14) par l’intégrale J:iy conséquence e(o) est remplacée par moyenne entre û(-O) et û(+O), et donc 6f(z)/ôV(z) = ï ( z , z) = 1. Compte tenu de cette interprétation, nous obtenons en intégrant l’équation (il)par rapport à la variable a l’équation de Fokker-Planck pour la distribution P ( [ ,x)
i,
SOoo
où E joue le rôle de la variable de configuration et x celui du temps. L’équation implique la conservation de la probabilité totale J d[P(t, z) pourvu que P décroisse à E grand. Pour 2 tendant vers l’infini, P tend vers un processus stationnaire limx+oo P(<,z) = p ( t ) vérifiant
2 ($+ 2E + at
234
SYSTEMES DESORDONNES
x.1.2
Ainsi p ( t ) décrit une distribution de la dérivée logarithmique t = $ I / $ indépendante de x. En intégrant l’équation (17) par rapport à 6, nous obtenons
La constante po est déterminée par la condition de normalisation
qui implique
Nous voulons obtenir la relation entre p(E) et la densité spectrale p ( E ) .Dans ce but, réintroduisons la boîte avec x E (O, L). Etant donné une valeur Eo pour f (O) demandons que f ( L ) = EL. Nous obtenons un spectre discret E l , E2, . . .. Nous faisons alors tendre L vers l’infini et trouvons
On s’attend à ce que la limite du membre de droite soit finie. D’après l’équation (9)on a
-(af . BE
= O) = O
Si nous remplaçons dans cette équation d f / d E par la fonction g(x) définie par la relation
nous obtenons
Ainsi
et
x.1.2
SYSTEMES DESORDONNES
235
Notons que df / d E est négatif. En conséquence, la quantité
est reliée à la densité spectrale par
En procédant comme précédemment pour P ( [ ,z) on montre sans peine que
D’après l’équation ( 2 4 ) , P ( [ , z )se comporte comme zp(E) pour z grand, positif. Le membre de gauche de cette équation tend donc vers p ( E ) si z + +m, indépendamment de E. Multiplions les deux membres par ~ ( - 5 ) et intégrons sur E. En tenant compte de la normalisation de p ( < ) , nous obtenons
Une intégration par parties montre grâce à ( 1 7 ) que le second terme s’annule et nous obtenons la relation cherchée entre la densité spectrale et la probabilité p(E)
P(E) = 2
/
dEP(OP(-E)
(25)
On peut en fait déduire une formule plus explicite de l’équation (18). Dérivant cette dernière par rapport à E , on obtient
& = 2--d a p + (E2 + 2 E ) a?, d E + 2p ~IE a t a ~ Multiplions les deux membres par p ( [ ) et intégrons par rapport à [ en utilisant (18) et la condition de normalisation de p . On trouve
236
SYSTEMES DESORDONNES
x.1.2
I1 s’ensuit que Po = N ( E )
En insérant cette relation dans (18)’ nous voyons que N ( E ) est déterminé par les conditions
L’équation (27) n’est autre que la transformée de Fourier de l’équation d’Airy. En tenant compte de la condition sur le comportement asymptotique, sa solution s’écrit
La normalisation implique que
Choisissons - q comme variable d’intégration. Nous parvenons à l’expression finale de N ( E ) - l sous forme d’une intégrale
Quand E + 00, le terme en u3 peut être négligé par rapport à E u , et nous retrouvons le résultat semi-classique attendu comme l’indique l’équation (8). La méthode du col permet aussi d’estimer l’intégrale lorsque E -+ -00 et fournit l’estimation
I1 n’est pas surprenant de trouver que N ( E ) tende vers zéro rapidement quand E + -00. Toutefois, le comportement précis est moins prévisible. On parle parfois à propos de ces densités exponentiellement petites de “queue de distribution de Lifshitz”. Le comportement de N ( E ) est indiqué sur la figure 1. Observons que Jz/(E)-l est une fonction entière dont le développement s’écrit
N(E)-l =
7
100
3G
(-2.3*E)ny (2n6+ 1) n!
x.1.2
SYSTEMES DESORDONNES
237
Figure 1 : Densité d’états intégrée par unité de longueur pour un potentiel aléatoire gaussien.
I1 est instructif de retrouver l’équation de Fokker Planck (16) en utilisant un raisonnement valable pour des systèmes plus généraux. Poursuivons l’analogie qui consiste à considérer x comme une variable temporelle. Récrivons alors l’équation (9) sous la forme
V(x)= E
+ i (a, af + f ’)
Pour obtenir la probabilité E‘(<, x;
<
L’intégration sur porte sur les fonctions vérifiant <(xo) =
<
238
SYSTEMES DESORDONNES
x.1.2
où (d/dz)-l doit être compris comme la fonction de Green retardée ro(z, y) vérifiant a/azïo(z, y) = 6(z - y), soit îo(x,y) = û(x - y). Ainsi
Comme la distribution ï o est retardée, seul le premier terme du développement en série du logarithme donne une contribution non nulle. Nous avons déjà examiné le problème posé par la quantité mal définie ïo(y, y) = û(0) et conclu En conséquence, nous obtenons que sa valeur devait être prise égale à
i.
J
= JO exp
dyt
(33)
Nous remplaçons alors J par sa valeur dans l’expression (32) et absorbons JO dans la normalisation de l’intégrale fonctionnelle. Nous intégrons sur V en utilisant la distribution 6. Utilisant la notation pour d
i
L’intégrale fonctionnelle qui reste à effectuer est une expression familière de l’amplitude de transition euclidienne d’une particule quantique fictive décrite soumise au potentiel ( E ) * -t. Cette par la coordonnée <, de masse interprétation entraîne que P doit satisfaire à une équation de Schrodinger de la forme
4,
On peut remplacer l’expression (30) par l’équation
i it2+
x.1.2
SYSTEMES DESORDONNES
qui s’identifie à l’équation de Fokker-Planck ( 1 6 ) . Au passage nous avons aussi obtenu une représentation de la solution par une intégrale fonctionnelle et trouvé un lien naturel entre la dynamique quantique euclidienne et la théorie probabiliste du mouvement brownien. Profitons de cet exemple pour faire quelques remarques concernant le traitement du jacobien. Dans le cas précédent, nous avons pu le calculer explicitement. Cette situation n’est bien entendu pas la règle, mais le traitement que nous allons développer ci-dessous indique qu’il est possible de poursuivre les calculs assez loin en l’absence d’une expression pour J. I1 s’agit en fait de remplacer le jacobien J par l’intégrale fonctionnelle d’un poids de Boltzmann bien choisi. Supposons le changement de variables V ci 5 bien défini. C’est l’hypothèse cruciale qui, hélas, n’est pas toujours réalisée dans des situations plus complexes. Si cette hypothèse est vérifiée, le jacobien ne s’annule pas et la valeur absolue peut être omise, c’est-à-dire que J peut être considéré comme un déterminant. I1 admet donc une représentation par une intégrale fonctionnelle sur des variables anticommutantes S, et $
La contribution des fermions à l’action s’écrit
Nous obtenons alors un lagrangien effectif
Dans une variation arbitraire de
5, S,, $ il vient
Cette quantité s’annule pour
où 6a est une variable anticommutante, comme si Letf était supersymétrique. Ceci est l’exemple annoncé de la symétrie BRS qui apparaît lorsqu’une contrainte est introduite dans une intégrale fonctionnelle, avec le jacobien associé,
239
240
x.1.2
SYSTEMES DESORDONNES
celui-ci étant écrit comme une intégrale gaussienne sur des variables de Grassmann. Dans notre exemple la contrainte est fournie par l’équation dynamique
(9). La structure des variations (11) nous permet de définir un opérateur de dérivation s tel que, pour toute fonctionnelle A des champs, on ait
85
=$
s 4 = (ici+ t 2 )+ E )
s* = O
L’opérateur s échange les champs bosoniques et fermioniques et par itération s2t
=O
s2$
=O
(43)
Ainsi s est nilpotent (de carré nul) dès que vérifie les équations du mouvement ( i d / d z E ) 11, = O . Par référence à la théorie de la diffusion, on parle, un peu improprement, de condition de couche de masse. Dans certaines applications, il est avantageux de définir un opérateur réellement nilpotent, par exemple dans le contexte de la renormalisation où l’on voudrait caractériser les contretermes par la propriété d’invariance sA = O. On saura alors a priori que tout A de la forme SU vérifie cette condition et, dans certains cas, on obtiendra ainsi la solution la plus générale. Pour s’assurer que s2 = O , on utilise une représentation des distributions 6 en transformée de Fourier pour imposer les contraintes. Cela revient à ajouter au lagrangien un terme avec un champ multiplicateur de Lagrange a, initialement imaginaire pur, et à ne pas effectuer l’intégrale sur V. Le nouveau lagrangien effectif s’écrit alors $J
+
Len =iv”+a(:(i+52)+E-V)+4(’-+t)* d da: Sa variation
6 L e= ~ (V - a)6V
+ 6a (ici+ 5’) + E - V )
s’annule pour
et l’opérateur s devient s$ = Q
s<=*
s*=o
sa=o
sv=o
I1 est alors tel que s2 = O . Sous cette nouvelle forme, la définition de s ne dépend pas des contraintes. Celles-ci sont en fait codées dans le lagrangien effectif. La supersymétrie cachée de l’équation de Fokker-Planck n’a bien entendu de sens que dans le langage des intégrales fonctionnelles.
X.1.3
SYSTEMES DESORDONNES
241
1.3 La méthode des répliques La méthode des répliques est destinée, comme nous allons le voir, à permettre l’évaluation de moyennes comme celle de la résolvante (4). Remplaçons l’argument complexe z par E-io avec E réel, quantité que nous notons simplement E , en sous-entendant la partie imaginaire infinitésimale négative. Nous écrivons aussi G ( E ) pour ((x I[H - E]-’I x)). Si, au lieu d’opérateurs agissant sur un espace de dimension infinie, nous traitions des matrices de dimension finie, la quantité dont il s’agit de trouver la moyenne serait le rapport d’un mineur au déterminant de la matrice. Le potentiel aléatoire apparaît ainsi à la fois au numérateur et au dénominateur et conduit en général à des calculs inextricables. Nous cherchons un moyen de contourner cette difficulté. Interprétons tout d’abord ( H - E)-l comme le propagateur d’un champ scalaire auxiliaire. En utilisant l’invariance par translation de la moyenne sur le désordre, nous écrivons
G ( E )= L-03 lim
(1 L -‘L
d z (x 1 H2 -1 E x))
Le facteur i dans l’exposant est choisi en accord avec la prescription E - io pour assurer la convergence de l’intégrale. Apparemment nous n’avons pas beaucoup progressé car il nous faut toujours prendre la moyenne d’un logarithme. Remarquons cependant que si n est une variable continue
a
-Zn dn
-f
n-0
In Z
(45)
Pour tout entier n, Zn est la fonction de partition de n répliques, identiques et indépendantes. Elles contiennent le même potentiel aléatoire, lequel apparaît linéairement dans l’action. Cette propriété nous permet d’effectuer explicitement la moyenne sur la distribution gaussienne de ce dernier. Si le prolongement analytique en n a un sens, il fournit alors le résultat désiré
242
X.1.3
SYSTEMES DESORDONNES
(44). Cette méthode repose sur l’existence de ce prolongement analytique. I1 est donc intéressant de confronter les conséquences de cette hypothèse avec les résultats précédents. Notons que l’utilisation de la méthode des répliques dans l’étude des milieux désordonnés a des traits communs avec la technique utilisée dans la physique des polymères. Soit donc un champ à n composantes (bien sûr n est initialement un entier). Nous avons 2 d d G ( E )= lim -- lim L-+W L dE n-+O d n
L’action s’écrit
avec le lagrangien
C(@) = + ( d a y + (V - E ) @
(48)
Nous obtenons sans difficulté la moyenne sur V pour tout n puisqu’il s’agit d’une intégrale gaussienne. Nous supposons que le résultat conserve un sens pour n arbitraire. Ainsi
G(E)= lim L-00
2 d lim L dE n-+O d n
--
e n p i l i L da: [$(a@)’- E @ -:L
+ $(a’)’
1
(49)
En dimension supérieure à un, une expression similaire conduirait à une variante de la théorie ‘p4. Par chance, à une dimension, nous pouvons nous ramener à un problème de Schrodinger de la manière suivante. Pour L -00, i nous nous attendons à ce que l’intégrale de chemin possède un terme dominant de la forme exp -$iLe(n)
(50)
où e(.) désigne l’énergie de l’état fondamental d’une équation de Schrodinger associée. Les variables de configuration % sont les coordonnées dans un espace à n dimensions, et a: est encore une fois interprété comme un temps. Ainsi
X.1.3
243
SYSTEMES DESORDONNES
= {-A@
e(.)$(@)
+ 2E@’
-
i(@’))”)$(a)
(51)
Comme le potentiel est complexe, la notion d’énergie du fondamental implique un abus de langage. Si e(.) admet un prolongement analytique, on s’attend à un développement
e ( n ) = ne0 + n2e1 + . . . tandis que d G ( E )= -i-eo(E) dE
d -Reeo dE
(E)
(53)
Supposons que eo(E) s’annule quand E + -m. Nous obtenons ainsi la densité de niveaux intégrée par unité de longueur en termes du coefficient du terme dominant 1
N(E) = -Reeo(E)
(54)
7r
Pour tout n nous demandons que l’état fondamental soit invariant par le groupe de symétrie des répliques, ici O ( n ) . L’apparition d’une symétrie entre les répliques est a priori tout à fait naturelle. Dans ce contexte unidimensionnel, on n’attend pas de brisure de cette symétrie. Utilisons à la place du champ vectoriel @, la variable scalaire q=
(55)
2
et récrivons l’équation (51) en développant chaque quantité en puissances de n, ce qui explicite le prolongement analytique dans cette variable. En particulier, nous écrivons $ = $0 + n$i + . . . , et
{n
i
+ ne0 + n‘el + ...
I
+ nG1 + -..) = 2q
{
a2 -@
+ 2 E - 2iq
I
($0
+ n$1+
avec pour conséquence le système d’équations d2
{ -dq2
I$}
=O
+2E-2iq {eo
+
$O
=2q{
...
d2 -@
f 2 E - 2iq
I
$1
244
X.1.3
SYSTEMES DESORDONNES
Nous cherchons une solution + O ( q ) bornée au voisinage de l’origine, ainsi que sa dérivée, et tendant vers zéro à l’infini. La deuxième équation entraîne que eo est l’opposé de la dérivée logarithmique de $0 à l’origine
La première équation du système (57) admet un prolongement pour q sous réserve de poser +0(-4)
< O, (59)
= +O(Q)*
condition qui est compatible avec l’équation. Nous normalisons la solution en imposant la condition =1
(60) qui assure la continuité à l’origine. En tenant compte des équations (54) et (58)’ la discontinuité de la dérivée de $0 à l’origine produit un terme inhomogène. Dans l’équation vérifiée par le prolongement de +O à l’ensemble des valeurs réelles de la variable +O@)
nous reconnaissons la transformée de Fourier de l’équation (27) en posant
La condition $o(O) = 1 équivaut à demander que l’intégrale de p ( J ) soit l’unité. L’équation (59) entraîne que p ( c ) est réel (et positif) et l’équation (61) se traduit par une équation du premier ordre pour p ( < )
($+ 2 E + 2-d<
d,
p(<) =N(E)
<
Ainsi à la limite n + O , les variables q = $a2et sont conjuguées, et $o(q), p ( < ) sont reliées par une transformation de Fourier, résultat plutôt surprenant pour lequel nous n’avons pas d’interprétation simple. Nous concluons que dans cet exemple, l’emploi de la méthode de répliques est pleinement justifié. (i) Calculer Imeo(E) et montrer que
d
G ( E ) = - i-eo(E) dE
=$
(& #) -
- iap(E)
X.1.3
SYSTEMES DESORDONNES
L a solution $o(q) de l’équation (57) pour O < q est un point stationnaire de l’action effective
Si nous substituons nous obtenons
$0 à 1) et
< 00,
normalisée à $ 0 ( 0 ) = 1,
si nous intégrons par parties le terme cinétique,
La dérivée deo(E)/dE est égale à la dérivée partielle de S(7) par rapport à E évaluée pour 17 = $0
La partie réelle de cette équation équivaut à
qui est la formule (25). Appliquons maintenant le théorème du viriel sous la
où les valeurs à q = O sont en fait des limites quand q -+ +O. Comme $0(0)~= 1, et (d$o(0)/dq)2 = e:, une intégration par parties montre que la dernière intégrale vaut -ideo(E)/dE d’après (67). Ainsi
. de0 i-+eg=2E dE qui est la relation désirée entre la partie réelle de eo(E) (c’est-à-dire v , V ( E ) ) et sa partie imaginaire. En prenant la partie imaginaire de deux membres, nous obtenons
dN +
- 2NImeo = O dE qui est la relation (64).
245
246
X.1.3
SYSTEMES DESORDONNES
(ii) Exprimer H ( E ) à l’aide des deux solutions indépendantes AZ(x) et
B i ( z ) de l’équation d‘Airy d2u ,322 = xu et montrer que 23
N(E)=
{
n2 A i ( - 2 + E ) 2
(71)
+ Bi(-23E)2
(iii) Montrer que le second coefficient e i ( E ) dans le développement ( 5 2 ) de e ( n ) est donné par
et que sa valeur permet d’estimer les fluctuations du spectre autour de sa moyenne p ( E ) . Plus précisément, dans une boîte de taille L , où L -+ CO, définissons le nombre de niveaux vL(E)dE d’énergie entre E , E d E . Nous avons
+
avec
‘J
e o ( E ) = lim : dE’p(E’) ln(E‘ - E €-+O
1
e l ( E ) = € ; lim -+O 2i~S”E;dE:.(E;,E:)ln(Ei
+ ie)
-E+iai)ln(E2-E+isz)
(74)
où nous prenons la branche principale du logarithme avec la coupure le long de l’axe réel négatif. En particulier pour E -t +CO e1 N
-1 +-+...9 -
4(2E)
16(23)5
(75)
1.4 Réseau aléatoire unidimensionnel Comme second exemple, nous allons étudier le laplacien sur un réseau aléatoire unidimensionnel. De tels réseaux ont été introduits en dimension quelconque pour rétablir des symétries continues en moyenne tout en conservant un facteur de coupure ultraviolet. Nous renvoyons le lecteur au chapitre XI pour une discussion détaillée. Ici nous n’introduisons un tel réseau
X.1.4
SYSTEMES DESORDONNES
247
aléatoire qu’en tant qu’exemple élémentaire de système désordonné discret à une dimension. Ce modèle est une variante de celui des chaînes harmoniques aléatoires introduites et étudiées par Dyson (1953). Considérons un ensemble de N points choisis au hasard et indépendamment dans un intervalle de longueur L avec une probabilité uniforme. Dans la limite où N et L tendent vers l’infini à densité S = l/a = N / L fixée, les intervalles successifs e entre points consécutifs deviennent des variables indépendantes obéissant à une loi de Poisson de p(e)de = -,Pela a Nous utiliserons dans la suite l’échelle de longueur microscopique a comme unité de longueur, de sorte que nous poserons 6-l = a = 1. Les N points engendrent un réseau et nous définissons le laplacien d’un champ scalaire ‘p défini sur les sites du réseau par la relation
(Ap)n =
Vn+i - P n - p n - Pn-i en
en-i
(77)
Nous nous intéressons au spectre des valeurs propres R 2 O telles que
(A
+R)p =O
(78)
Soit p(R)dR la densité spectrale par unité de longueur, c’est-à-dire par site dans les unités employées. Elle vérifie la condition de normalisation
1”
dRp(S1) = 1
(79)
qui traduit le fait que pour N sites, à conditions aux limites données, l’opérateur possède N valeurs propres. Cette propriété reflète l’existence d’un facteur de coupure aux courtes distances et implique une décroissance suffisamment rapide de la densité spectrale à R grand. Contrairement au cas d’un réseau régulier, le spectre n’est pas borné. Nous verrons que la queue de la distribution p à grand R provient d’états localisés autour de régions (improbables) où les distances entre les points du réseau sont anormalement faibles. Nous pouvons en fait transformer le problème pour le ramener à celui d’un réseau régulier avec un potentiel aléatoire. Définissons les quantités Qn
=
P n + i - Pn en
où Qn correspond au gradient du champ p. Ces quantités vérifient alors 1’équation
Q n + i - 2Qn
+ Qn-i
= -WQn
(81)
248
SYSTEMES DESORDONNES
X.1.4
qui est une équation de Schrodinger à énergie nulle sur un réseau régulier avec un potentiel -Ren, où R joue le rôle d’une constante de couplage. Posons provisoirement (82)
w=-R
Pour w réel et positif, nous sommes sûrement hors du spectre, de sorte que les solutions croissent exponentiellement Qn
w>O
N
n-cc
On a omis un éventuel préfacteur dans (83) car il est sans importance dans la suite. Le facteur y(w) est appelé exposant de Lyapounov par référence à l’étude des instabilités dans les systèmes dynamiques classiques (comme précédemment, n peut être interprété comme un temps). La connaissance de y(w) nous permet d’obtenir la densité spectrale. Supposons que Qn soit donné en deux points consécutifs, par exemple n = O et n = -1. Résolvons l’équation ((81) par itération. On en déduit que pour n > O, Qn est un polynôme de degré n en w. Pour n grand, les racines de ce polynôme tendant vers l’opposé des valeurs propres R
Ainsi y(w) =
LW
dRp(R) ln(w
+ 0)
p(R) =-1 lim Im-(-0 dy TE-++O
- iE)
dw
La seconde formule (85) suppose implicitement un prolongement analytique de la fonction y(w), jusqu’au bord d’une coupure le long de l’axe réel négatif. Comme précédemment, nous transformons l’équation linéaire aux différences finies du second ordre (81) en une équation non linéaire mais du premier ordre, analogue discret de l’équation de Ricatti. En remplaçant R par -w, on pose
R, =-Qn+i Qn
~,=2+we,--
1
Rn-i
On déduit de (83) que R, se comporte comme expy(w) pour n + KI pour une configuration donnée des {e,}. Ainsi, en moyenne,
X.1.4
SYSTEMES DESORDONNES
249
y(w) = lim (lnR,) n-+m
1
p(R) = -1mT
d lim (In R,) dwn-+Ca
w=-n-ie
Tirons également de l’équation (86) une représentation intégrale pour la probabilité Pn(Rn)dRn que cette quantité prenne la valeur R, à dRn près, supposant donnée la valeur initiale Ro (nous choisissons Ro = 1 pour fixer les idées). I1 suffit pour cela d’observer que Rn-l ne dépend que des . .. qui sont indépendantes de Nous obtenons donc variables e,-,, un analogue discret de l’équation de Fokker-Planck
en.
(88) La condition Ro = 1 et la restriction w > O entraînent que le support de P, est inclus dans l’intervalle [l,CO]. Supposons que P, tende vers une distribution asymptotique pour n -+ CO. Cette distribution est alors donnée par la solution stationnaire P(R)
=lm lm dR‘P(R‘)
1
1
O
W
(89) W
Le raisonnement qui nous a conduits à l’équation précédente ne dépend pas de l’expression explicite de la loi de probabilité pour la longueur des intervalles pourvu que ces derniers soient des variables indépendantes. La résolution de (89) est rendue délicate par la présence de la fonction 8 sous le signe d’intégration. Si l’on parvient à tirer P ( R ) de l’équation (89) on obtiendra l’exposant de Lyapounov à l’aide de la relation y(w) =
iw
d R P ( R ) In R
(90)
Bien entendu P dépend du paramètre w. Plutôt que de chercher une solution complète de l’équation (89)’ il est intéressant de développer diverses méthodes d’approximation (qui ont un champ d’application plus vaste). Trouver yo(@) et po(S2) en l’absence de désordre, c’est-à-dire quand les variables e,, âu lieu d’être aléatoires, sont fixées à la valeur 1. Ainsi P ( R ) = 6(R - A) où A est la plus grande racine de l’équation à laquelle se réduit (86)
250
X.1.4
SYSTEMES DESORDONNES
A2 - ( 2
+ w)A + 1 = O
A=1
+SU+
I
(w+ $ u 2 )
(91)
I1 en résulte que
1
PO(R)
=z
1
-
["(1-$R)]2
1
*-O
1 [1+$2+.'.] I 2x02
O
(92)
Nous allons considérer deux limites complémentaires. La première est celle d'un faible désordre, la seconde celle des hautes fréquences. Si nous faisons l'hypothèse que les variables e, fluctuent peu, nous nous attendons à une approximation valable aux grandes longueurs d'onde, donc aux basses fréquences, les moins sensibles au désordre local. A cet effet, introduisons le paramètre X tel que
e, R,
(e,) + Xz, =A, exp (AB, + X2C, + X3D, + X4E, + = (en)
+ A (e, - (a,))
=
. -)
(93)
de sorte que ( 2 , ) = O . Si IZ -+ 00, A, tend vers la valeur A donnée par (C) . . ., les valeurs l'équation (91). Avec ces définitions et en notant (B), moyennes de B,, C,, . . ., on a y ( w ) = yo(w)
+ x ( B )+ X2 ( C )+ ...
(94)
On posera à la fin des calculs X = 1. Substituons l'expression (93) (avec A, remplacé par A ) dans l'équation (86). En utilisant (91)' on obtient
A2 [exp (AB, + X2C,
+ ...) - 11 =
X ( A - 1)2z, - [exp - (ABnw1 + X2CnW1 +.
.) - 11 (95)
Identifiant les puissances successives de A, on déduit les relations de récurrence suivantes
.. qui montrent l'utilité des développements lorsque A - 1 est très petit, c'està-dire w lui-même petit. Posons
X.1.4
251
SYSTEMES DESORDONNES
y=-
A-1 A+lZ
(97)
On a alors
(i) Obtenir les équations (98). (ii) Montrer que si l’on écrit
où les termes suivants impliquent des produits de deux moyennes de puissances de la variable aléatoire y ou plus. (iii) Vérifier que les termes les plus singuliers en A - 1 dans les contributions du cinquième et sixième ordre sont 3
( F ) =(Y2) A2 - 1 (G)
+...
(Y3)
(A2 - i)2
(Y3y
+ .. .
Nous tirons de ces expressions le comportement de y(w) pour w tendant vers zéro. Comme A - l = w z 1+
$
~
+
6
~ 92
+...
(103)
nous avons jusqu’à l’ordre w2 inclus
y(w) = W ; -
+&w2
+ [16 (2’) - 8 (z4) + 24 ( z 2 ) > + ” 24 ( z 2 ) (z3) - 15
iw
(2’)
- &wa
[16 - 16 (z3) 15 (z’)’]
+O(ua) (104)
252
X.1.4
SYSTEMES DESORDONNES
Spécialisons maintenant ces expressions au cas d’une distribution poissonnienne, et posons X = 1. On a dans ce cas
(2) =1
(z3) = 2
(z4) = 9
...
Par prolongement analytique Re?(-R - iE) = i R 1
Imy(-R - i&)
+ AR2+ O p 3 ) +o ( R ~ )
(106)
La correction dominante à la densité spectrale moyenne est donc
Cette méthode systématique permet théoriquement de calculer des termes d’ordre plus élevés dans le développement de p(R). La comparaison entre (107) et (92) est instructive. Dans les deux cas, le terme dominant est la densité de niveaux du laplacien dans le continu. La première correction est de signe opposé et seize fois plus petite dans le cas d’un réseau aléatoire. Ainsi, même à une dimension, le spectre d’un réseau aléatoire fournit une bien meilleure approximation du spectre continu à basse fréquence que celui du réseau régulier. Les équations (104) et (106) mettent aussi en lumière un phénomène nouveau et intéressant. Dans le cas d’un réseau régulier, le prolongement analytique y(-R - iE) est imaginaire pur lorsque E tend vers zéro pour des valeurs de R positives. Dans le cas d’un réseau aléatoire, il apparaît aussi une partie réelle positive. Cette quantité s’interprète naturellement comme l’inverse d’une longueur de localisation finie. Ainsi, avec une probabilité unité, lorsque R appartient au spectre, les fonctions propres sont non seulement oscillantes mais décroissent exponentiellement. Le comportement de cette longueur de localisation à R faible est de la forme 8
L(R) = R -
+ + O(R)
Naturellement L(R) devient infini lorsque R t O. Ceci exprime que la localisation disparaît à la limite continue. L’expression de la longueur de localisation nous donne une règle empirique pour trouver le domaine de validité de l’approximation de faible désordre. Cette dernière a un sens pourvu que la longueur de localisation soit grande devant la distance moyenne (e,) entre les points. Remarquons enfin que les intervalles e, pouvant être aléatoirement petits, le spectre n’est pas borné.
X.1.4
253
SYSTEMES DESORDONNES
Pour les hautes fréquences, nous avons besoin d’une méthode différente. La discussion précédente suggère que lorsque s1 tend vers l’infini, les états sont fortement localisés, de sorte que l’exposant y est déterminé par de petits groupes de sites. Pour w grand, traduisons cette propriété en tronquant le développement de R, en fraction continue, développement qu’on obtient à partir de l’équation (86),
1
R, = 2 + we, 2
+ wen-l
-
(109)
1
2
+ wen-l - . . .
Nous factorisons 2 +we, et prenons la moyenne de In R, sur la distribution de Poisson. Si y = 0.57722.. . désigne la constante d’Euler, nous obtenons
(142 +we)) = In2
+
Le)
-
(2
In !jw- y
+ - - - (”*+’ w
2.2!
w
(2)3-...](110)
3.3! w
Posons
C = e7 = 1.78107.et observons que pour p 2 1
On obtient ainsi
Le dernier terme, qui est le premier où apparaît la distribution de trois intervalles successifs, est d’ordre (In w ) ~ / et w~ négligeable dans un calcul à l’ordre w - ~Nous . trouvons donc dans la limite des hautes fréquences w
2
w
+ 1) c + -w (in 2c -1 W2 [(in % - il2+ r] - 41 + û
y(w)=ln
-
où la constante 77 est donnée par
( [el3)
254
SYSTEMES DESORDONNES
M ..
17 =
1
Nous concluons que pour R I d T dR
p ( ~ =) --Imy(-R
1
477n2(n + 1 ) 2 -+
cc
-
- ic)
= 0.13070..
a-00
-&
2
4
R2
R3
[
R
]+
- + - In - -
2c
[(in&-1)2+17-4-~2
1
+...
(115)
Les logarithmes apparaissant dans ces expressions sont dus à ce que la distribution de probabilités p(C) a une limite finie à l’origine. Pour R grand, la longueur de localisation tend vers zéro comme l / In R, justifiant ainsi la méthode. Au prix de calculs plus lourds, on peut obtenir d’autres termes dans ce développement asymptotique. Nous comparons les résultats ci-dessus à ceux d’une simulation numérique sur la figure 2. Observons que le comportement de p ( 0 ) en 2/R2 à l’infini est en accord avec le fait que p(R) soit intégrable. (i) Nous n’avons pas utilisé toute l’information contenue dans (89). On peut en fait extraire de cette dernière une solution analytique. A cet effet, posons P(R)dR = p(x)dx
R = l + C l
2 2 0
(116)
Utilisant cette notation, nous avons
wx2p(x) =
1-
1
(117)
Sup(0,z-1)
1-
et
d x p(x) = 1
Pour x dans l’intervalle (0,l) on a ainsi 1
012<1
P(X) =
1 exp - wx
où a est une constante positive déterminée par la condition de normalisation (118)
(119)
X.1.4
SYSTEMES DESORDONNES
255
Figure 2 : ( a ) Comparaison des développements à SZ petit ou grand (courbes continues) avec les données d’une simulation numérique (pointillés) pour la densité d’états intégrée. ( b ) Comparaison analogue pour l’inverse de la longueur de corrélation. ( c ) La densité d’états dans le continu (ligne continue), sur un réseau régulier (line brisée) et sur un réseau aléatoire (ligne pointillée). Pour obtenir p(x) lorsque x définie par la relation
2 1, nous substituons à
p(x) la fonction q(x)
256
X.1.4
SYSTEMES DESORDONNES Ainsi q(z) vaut 1 pour O intégro-différentielle
5
I
<
1 et est en général solution de l’équation
qui montre que q(z) est déterminée dans l’intervalle n valeurs sur O 5 I < n. Précisément on a
5
I
< n + 1 par
ses
La fonction q(z) est donc positive et décroissante. Elle se comporte comme /r(z)à l’infini. De plus
wl-x
n=l
Déduire l’expression y ( w ) et retrouver son développement à haute fréquence. Exprimer la solution de l’équation (122) en utilisant une transformée de Laplace. (ii) Obtenir les résultats précédents par la méthode des répliques.
2. Gaz bidimensionnel d’électrons en présence d’un champ magnétique 2.1 Niveaux de Landau
-
L’effet Hall quantique
Nous allons illustrer l’utilisation des variables anticommutantes sur un exemple inspiré de l’effet Hall quantique. Cet effet correspond à l’existence de plateaux dans la conductivité Hall en fonction d’un fort champ magnétique à température suffisamment basse. Expérimentalement, les électrons sont piégés dans une couche bidimensionnelle. La quantification de la conductivité Hall s’accompagne d’une chute brutale de la résistance longitudinale (ou de la conductance comme on le verra), les effets dissipatifs disparaissant au centre des plateaux. Rappelons quelques résultats élémentaires relatifs à un gaz d’électrons (charge e, masse m ) sans interactions, contraints à se déplacer dans le plan (x,y)en présence d’un champ magnétique transverse B. Les niveaux d’énergie sont quantifiés et fortement dégénérés (Landau). Choisissons un potentiel vecteur de la forme
choix de jauge dit symétrique. Le hamiltonien s’écrit
x.2.1
Ho = -(p 1 2m
257
SYSTEMES DESORDONNES
- eA)’ = --”
2m
[(a, + $.y>
+ (a,
-~
’1
B x ) (126)
Convenons pour simplifier que la charge soit positive et introduisons des variables X et Y sans dimension (127a) Remplaçons la donnée du champ magnétique par celle de la fréquence de Larmor w=-
eB 2m
(127b)
Le hamiltonien prend alors la forme
=hw
[(-a + $) (à + $ 2 ) + +]
où 1,011 a introduit une notation complexe
a- = - a
a=- a
z=X+iY
az
az
Les opérateurs
vérifient les relations de commutation bosoniques [a,at] = 1
(131)
e = O, 1,2’.. .
(132)
[a,a] = [ U t ’ a+] = O
En conséquence, le spectre de Landau s’écrit
Et = hw
(e+ a)
A la limite thermodynamique ce spectre est infiniment dégénéré, l’espace propre associé à l’énergie Et étant engendré par les fonctions d’onde I , m = 0 , 1 , 2,... Les fonctions d’onde du niveau fondamental vérifient
(133)
258
SYSTEMES DESORDONNES
x.2.1
et on a une base orthonormale de solutions qui s’écrit zrn
e-t~/2
= --
m = O, 1’2,. . *
Jmr&
(134)
Ces fonctions engendrent l’espace de Bargmann-Fock de fonctions entières après factorisation de e - i Z Z / f i G u0,o (cf chapitre II). Nous absorbons ce facteur dans la définition de la mesure de sorte que d2z dp(z) = -e-’’
(135)
7r
où d2z = dRe z dIm z . (i) Donner l’expression explicite des fonctions définies par l’équation (133). (ii) Examiner la signification du nombre quantique m. Quelles sont les conséquences de l’invariance par translation et par rotation? On tiendra compte des changements de jauge correspondants. ~ à une distribution de (iii) Montrer que pour m grand, U O , correspond probabilité concentrée dans une couronne de largeur A(?) E f i autour du rayon moyen r2 = m 1e-(~2-m)2/2m
e-r’T2m
Iu0,m12 =
~
am!
N
m-oo
a
&GE
(136)
En déduire que le nombre d’états du niveau fondamental, dans un disque circulaire d’aire A = a R 2 ,est donné asymptotiquement par le rapport du flux B A au quantum de flux cpo = h / e
N = -e B A 2ah
(137)
si on revient aux unités de départ. Ce résultat est en fait indépendant du choix de la base et de la forme du contour pour N grand. Son interprétation est claire. Le flux magnétique à travers l’aire A multiplié par la charge électrique est le produit de N par la constante de Planck h. De manière équivalente, 2 a N est l’augmentation (1/2n) $(e/fL)A. d x de la phase de la fonction d’onde quand on parcourt la frontière de l’échantillon. Montrer que ces résultats s’étendent au cas des niveaux excités.
Le point important est la dégénérescence macroscopique des niveaux de Landau en l’absence d’interactions, dès que la longueur caractéristique
x.2.1
259
SYSTEMES DESORDONNES
d%/eB (qui est la racine carrée de l'aire associée au flux élémentaire 90)est petite devant la taille du système (c'est-à-dire quand N donné par l'équation (137) est grand). Cette dégénérescence donne lieu à des effets non triviaux. Considérons une situation idéale où nous négligeons toute interaction des électrons entre eux et avec le substrat. Nous ignorons également les contributions des spins électroniques que l'on suppose alignés le long du champ magnétique intense. Enfin, nous supposons le mouvement confiné dans un plan. Introduisons un champ électrique infinitésimal E parallèlement à ce plan (donc orthogonal au champ magnétique B ) . Classiquement, ce champ peut être compensé par un mouvement uniforme du gaz d'électrons à une vitesse v choisie de manière à annuler la force de Lorentz e ( E v A B ) . Cet effet purement cinématique est indépendant de la charge. La vitesse correspondant e
+
v=-
EAB B2
engendre un courant de Hall donné par j H = env =
en
-E
B2
AB
(139)
où n est la densité (superficielle) de charge. Ce courant ne donne lieu à aucun effet dissipatif (jH.E = O). En notation matricielle
où ZH est la matrice de conductivité (ici antidiagonale)
Nous ajoutons un terme ohmique phénoménologique diagonal a 0 pour tenir compte des impuretés et des interactions. La matrice de conductivité totale est donc
et son inverse, la résistivité, s'écrit
Dans la limite où a 0 est négligeable, nous avons un paradoxe apparent : ozz et pzz tendent simultanément vers zéro. Considérons le cas où le potentiel chimique est situé entre deux niveaux de Landau, ce qui signifie que les niveaux de nombre quantique C = O, 1,
260
x.2.1
SYSTEMES DESORDONNES
. . ., L sont totalement remplis et les autres sont vides. D’après l’équation (137)’ la densité électronique est
eB n = -(L 2nfi
+ 1)
I1 s’ensuit que la constante de Hall, le terme antidiagonal quantifié selon
(144) OH
=
gZy,est
Soit 5 la section transverse de l’échantillon, et I le courant longitudinal total. En ignorant les effets de bord, la densité de courant est j = I / < ,tandis que si VHest la différence de potentiel transverse, le champ électrique E = v H / [ . Finalement, indépendamment de la géométrie et de tout autre paramètre
Ces valeurs sont les plateaux de l’effet Hall quantique (entier). En fait on observe aussi d’autres plateaux pour des valeurs fractionnaires du nombre d’occupation des niveaux de Landau et on pense qu’ils sont dus aux interactions entre les électrons. L’effet Hall quantique, manifestation spectaculaire de la mécanique quantique à l’échelle macroscopique, tire une partie de son importance du fait qu’il implique des constantes fondamentales et peut permettre une détermination extrêmement précise de ces dernières. Ceci tient à ce que l’on observe que les valeurs (146) ne sont pas modifiées par la présence d’impuretés variées ou par l’effet d’une température finie mais faible, et sont mesurées avec une étonnante précision. La description ci-dessus est bien sûr quelque peu caricaturale. Naïvement, on pourrait penser qu’un certain nombre d’états sont localisés par différentes sortes de défauts - impuretés ... - et donc ne contribuent pas à la conductivité. Des arguments de topologie et d’invariance de jauge montrent que le domaine de validité de (146) s’étend au-delà du cas idéal et s’applique aux situations réelles moyennant certaines hypothèses (cf appendice -4).Cependant, la largeur des plateaus dépend des conditions expérimentales et une théorie complète doit pouvoir aussi expliquer le comportement observé. Nous étudierons ici seulement l’effet des impuretés sur la densité d’état (Wegner 1983). I1 apparaît que le problème admet une solution analytique intéressante.
2.2 Spectre à une particule en présence d’impuretés Cherchons à décrire l’effet des impuretés sur les niveaux de Landau. En pratique, nous nous limiterons au cas du niveau fondamental C = O, et à
x.2.2
261
SYSTEMES DESORDONNES
celui d’un champ magnétique suffisamment intense, pour pouvoir ignorer les excitations, l’écart fLw entre les niveaux étant supposé beaucoup plus grand que les perturbations considérées. On prendra pour modèle des impuretés un potentiel aléatoire V(x) ajouté au hamiltonien (126). En utilisant les unités réduites définies en (127)’ nous écrivons
H=Ho+V
(147)
On suppose les corrélations du potentiel à courte portée et même, à la limite, de portée négligeable. L’origine des énergies est choisie en général en demandant que
bien que, dans certains cas, il soit plus commode d’ignorer cette condition. Notre hypothèse de localité sur les corrélations se traduit sur la fonctionnelle caractéristique par l’expression (exp -i
1
d 2 x a ( x ) V ( x ) ) = exp
1
d2zg(cu(x))
(149)
La fonction g ( a ) s’interprète comme la transformée de Fourier de la distribution de potentiel en un site expg(a) =
1
dVP(V)eëiav
Ainsi un bruit gaussien correspond à
(i) Un modèle poissonnien d’impuretés aléatoires est décrit par une densité uniforme p de centres diffuseurs de portée nulle (Friedberg et Luttinger, 1975). La densité de probabilité de trouver N centres aux points XI, . . ., X N dans un domaine d’aire A est donnée par l‘(xi,. . . , X N ) = eëPdpN/N!
Le potentiel d’intensité X s’écrit N
V(x) = x
S(X
i=l
Montrer qu’il en résulte que
- Xi)
(153)
262
x.2.2
SYSTEMES DESORDONNES (ii) Une distribution lorentzienne de potentiel
X P ( V )= -
I
7r (V2
+ X2)
correspond à une fonction g non analytique
Comme précédemment, nous obtenons la densité spectrale moyenne par unité de surface à l’aide de la résolvante
Cette résolvante est représentée par une intégrale fonctionnelle sur un champ complexe cp selon
zJD(cpp)cp(x’)p(x’)expiJdZxp(E+io1
H)cp (158)
où le facteur de normalisation s’écrit 2=
J
D(cpp)expi
J
d 2 x p ( E+ io - H)cp
(159)
Ces notations abrégées anticipent sur le fait que l’action effective est l’intégrale d’une densité locale. Dans la suite, la partie imaginaire infinitésimale de l’énergie sera sous-entendue. Elle est en accord avec le choix de signe dans l’exponentielle. Au lieu d’utiliser la méthode des répliques pour effectuer la moyenne sur le désordre, nous exposerons une autre méthode qui paraît plus satisfaisante mathématiquement. A cet effet, nous représentons 2-l’ qui n’est autre que d et ( E - H ) , par une intégrale fonctionnelle sur un champ fermionique complexe auxiliaire ($,
4)
2-’ = det(E - H ) = /D($q)expi/d’x$(E
-
H)$
(160)
On peut interpréter l’introduction de telles variables fermioniques en notant qu’un tel champ complexe est équivalent à la soustraction de deux degrés de liberté bosoniques. En conséquence
x.2.2
263
SYSTEMES DESORDONNES
Sous cette forme, nous pouvons calculer la moyenne sur V grâce à l’équation (149) en choisissant a(x) = p(x>cp(x) $ ( x ) $ ( x ) . Cependant avant d’effectuer cette opération, nous introduisons l’approximation qui consiste à négliger les transitions induites par le potentiel entre niveaux de Landau distincts. Ainsi dans l’intégrale (161)’ les seuls états qui contribuent correspondent au niveau fondamental. Cela revient à n’intégrer que sur les champs ‘p et vérifiant les conditions
+
+
Ainsi c p = e -1~ ”- u ( z )
+ = e-;Zz
v(z)
(163)
où u (bosonique) et v (fermionique) sont holomorphes en z (fi et fi sont antiholomorphes). Nous n’avons pas inclus de facteur T - ~ dans / ~ (163) pour préserver la symétrie entre les intégrales bosoniques et fermioniques. Le jacobien correspondant à ce choix de base vaut l’unité car les contributions des bosons compensent celles des fermions. Après moyenne sur V , nous obtenons donc
où l’action S s’écrit
S=
I
d2zeëZZ{i&(fiu + fiv)
+ y(e-”(fiu
+Vu))}
(165)
Utiliser l’invariance par translation (accompagnée d’une transformation de jauge) pour montrer que, dans l’approximation où on ne conserve que le niveau de Landau fondamental, toute la dépendance spatiale de la résolvante moyenne peut être factorisée sous la forme
264
x.2.2
SYSTEMES DESORDONNES tandis que
est indépendant de x.
L'action S est supersymétrique. Pour le voir, introduisons outre des coordonnées commutantes z , z,deux coordonnées 8, anticommutantes normalisées de telle sorte que
e
J dûdëe-eë = ï / r
(168~)
afin de maintenir le parallèle avec /d2ze-"'
(168b)
=T
Nous définissons un super-champ holomorphe 4 (et son conjugué (p antiholomorphe) comme une fonction de z et 0 qui traite u et v sur un pied d'égalité
Ainsi
Le premier terme est invariant par les "rotations" dans le super-espace, rotations qui contiennent aussi bien des transformations ne mélangeant pas z et e que des transformations qui s'écrivent sous forme infinitésimale
se = zw se = zw
sz = we
sz = ew
+
Ces transformations laissent la forme quadratique zZ û e invariante. Ici ( w , W)est considéré comme un paramètre anticommutant infinitésimal. Fait remarquable, le deuxième terme de l'action (170) est lui aussi invariant. Pour le voir, supposons que g(a) admette un développement en série M
gnan
= n=l
Notons que g(0) est nul comme conséquence de la normalisation de la loi de probabilité du potentiel. Si on ne dispose pas d'un développement comme
x.2.2
SYSTEMES DESORDONNES
265
(172)' on approchera g ( a ) par des fonctions régulières. Nous avons ainsi une série de termes d'interaction de la forme
Par un calcul explicite on montre qu'on a l'identité suivante [T
/
dSd8e-0ëd;q5] - -T n
/
dûdeeëneë(d;q5)n
(174)
Etablir la relation (174).
'Introduisons la fonction h ( a ) ,associée à g(a)par m
h ( a )=
%Y"
n=l
n
=
JO"
(175)
où la propriété g(0) = O est cruciale pour assurer que h ( a ) est bien défini. Avec cette notation, l'action s'écrit
qui est explicitement invariante dans les rotations du super-espace. Cette propriété est à l'origine des simplifications spectaculaires qui vont apparaître dans le calcul de l'intégrale fonctionnelle. En utilisant l'invariance par translation dans le super-espace telle que
montrer que
( 4 ( z , e ) 4 ( z f , e f ) )= Cexp{zz'
+e#}
où C est la quantité, indépendante de la position, que nous voulons calculer
Noter que l'équation (177) signifie qu'on a
(177)
266
x.2.2
SYSTEMES DESORDONNES
Nous évaluerons la fonction à deux points (q5$), dans un développement perturbatif qui utilisera au mieux le formalisme supersymétrique holomorphe. Le propagateur est l’inverse de l’opérateur apparaissant dans la partie quadratique de l’action. Pour toute fonction super-holomorphe, nous avons l’identité
e’) =
f(z’,
s
d2zdf3d8f(z, e) exp { z‘Z
+ 0’8 - Z Z - 6’8}
(180)
qui généralise le noyau reproducteur de l’espace de Bargmann. Nous en déduisons que le propagateur est proportionnel à exp(z’z 0’8). Les interactions proviennent du second terme de l’action (176). Un vertex d’ordre 2n contient un facteur gaussien exp -n { Z Z e#} . Illustrons les règles de Feynman par le calcul de la contribution à une boucle à la valeur moyenne (4$) (figure 3).
+
+
Figure 3 : Contribution à une boucle à la valeur moyenne ($$). Dans le cas d’un bruit blanc gaussien
g(a) = -+wd le calcul fait apparaître (i) le produit de trois propagateurs ( i / ~ &exp ) ~ { zf
h(a)= -awa2
(181)
+ ea + <(+ ww +
(ii) un facteur de vertex
-rw exp -2 { <( + WG} (iii) un facteur de symétrie égal à l’unité (le champ est complexe), (iv) enfin une intégrale sur les variables et w, qui conduit à
<
(-Tw) exp { zz’ x
/
+ eë’}
d2
(182)
x.2.2
267
SYSTEMES DESORDONNES
Nous obtenons le préfacteur exponentiel attendu qui contient toute la dépendance dans les variables externes. I1 reste à effectuer l’intégrale gaussienne sur le super-espace. Sa valeur est égale à l’unité. Cela provient d’une compensation parfaite entre un déterminant bosonique et un déterminant fermionique qui, en vertu de la symétrie entre les variables z et 8, sont identiques. Ici nous retrouvons les intégrales précédentes
s
d2<exp
--
7r
s
dwdW exp -wW = 1f n
(183)
Le phénomène observé sur cet exemple se produit à tous les ordres. La combinaison des facteurs de vertex et des propagateurs conduit à des intégrales gaussiennes sur le super-espace. I1 apparaît des termes linéaires et ,quadratiques dans l’exponentielle. Une fois le préfacteur at tendu factorisé, il ne reste qu’une intégrale gaussienne supersymétrique qui comme précédemment, et pour les mêmes raisons, vaut l’unité. En clair, tout diagramme donne exp(z.2 + 88’) multiplié par un facteur que l’on obtiendrait dans une théorie à zéro dimension. La réduction dimensionnelle, d + d - 2 , est caractéristique de la supersymétrie sous-jacente dans ces questions. Elle fut observée pour la première fois par Parisi et Sourlas dans un contexte différent (section 5). La conclusion de cette discussion est que nous obtenons l’expression suivante pour la moyenne de la résolvante
La quantité considérée est le quotient de deux intégrales, chacune portant sur le plan complexe de la variable 9. Rappelons que E = E - ihw. Comme
dt exp 7r {iEt
+ h(t)}
(185)
on obtient explicitement la densité d’états sous la forme
où g ( a ) , définie par l’équation (150), représente l’effet du désordre local. A titre d’illustration, nous allons évaluer l’expression (186) pour les différents exemples introduits plus haut. Le lecteur vérifiera les intégrales correspondantes. Nous réintroduisons également le facteur dimensionné
268
x.2.2
SYSTEMES DESORDONNES
eB K=TL qui jusqu’ici était pris égal à l’unité. (i) Bruit blanc gaussien (figure 4) g ( a ) = - w z1a
v=
2
K
2
p(E)= - T2 1‘
(187)
; ; w K2
( E - ;tiw>
eV2
+ (2r-i :s
dzex2)2
I
1
1
1
I
2.0
1.0
O
1.0
2.0
-
Figure 4 : Courbe de la densité d’états normalisée p ( E ) / p ( O ) en fonction de v dans le cas d’un bruit gaussien (équation (188)). Le nombre total d’états est s d E p ( E ) = K 2 / 2 r . A grande énergie, p ( E ) décroît comme
en accord avec une analyse semi-classique. Au centre de la bande, v nous avons
+
O,
qui ressemble à une gaussienne mais plus aplatie. (ii) Distribution poissonnienne de centres diffuseurs à courte portée (figure 5) g ( a ) = p(eëixa - i)
21r
v = -(E
-
ihw)
XK2
K2
1
p ( E ) = -ImF(v)
F ( v ) = dv In
[l“
7rX
{
d t exp ivt - f
21r
f = - (191)
1’
$(l - e-ia)}]
x.2.2
269
SYSTEMEÇ DESORDONNES
Nous avons supposé que le paramètre A, qui décrit l’intensité du potentiel, était positif. Le nombre f sans dimension mesure la densité d’impuretés par unité d’aire embrassant un quantum de flux. On observe des singularités quand f prend des valeurs entières comme indiqué sur la figure 5 qui représente la densité d’états intégrée. Le spectre correspond à des valeurs v > O. Quand v + O, nous trouvons
(1 - f)6(v) 1
B(f)vf-2
+ A(f)v-f + .. . +...
+ . ..
O < f < i f = l
1< f < 2 f =2 f >2
(192)
Evaluer les constantes apparaissant dans les développements asymptotiques singuliers ci-dessus
O < f < l
Le phénomène le plus frappant se produit pour O < f < 1, où une fraction 1- f des états du niveau de Landau fondamental n’est pas affectée par la présence des centres diffuseurs. Comme le montre la figure 5, la densité d’états présente des singularités plus faibles aux autres valeurs entières de U.
(iii) Distribution lorentzienne (équations (155)-( 156)). La densité d’états est, comme P ( V ) ,une lorentzienne
La discussion précédente, même si elle conduit à des résultats plutôt intéressants concernant la densité d’états, ne fournit cependant pas d’éléments pour expliquer la robustesse des paliers de l’effet Hall quantique. Elle ne clarifie pas non plus ce que l’on doit entendre par localisation en présence d’un champ magnétique.
270
SYSTEMES DESORDONNES
x.3
Figure 5 : la densité d’états intégrée du modèle poissonnien pour différentes valeurs de la densité d’impuretés f. (u) f = ( b ) f = 1 (c) f = a2 .
3. Matrices aléatoires Wigner, Dyson et d’autres ont suggéré de comparer le spectre de systèmes complexes comme des noyaux lourds, avec ceux de hamiltoniens aléatoires, possédant des distributions aussi générales que possible, compte tenu des symétries. Le principe fondamental est que ces lois soient invariantes par un groupe de transformation, tenant à la structure de l’espace de Hilbert des états. Ce groupe est soit le groupe unitaire, soit le groupe orthogonal réel quand on impose une condition de réalité (comme la symétrie par renversement du temps) ou bien le groupe unitaire symplectique.
x.3
271
SYSTEMES DESORDONNES
Si on introduit des hypothèses supplémentaires ad hoc comme l’indépendance statistique des éléments de matrice dans n’importe quelle base, la loi de probabilité est déterminée à un facteur multiplicatif près. Certaines propriétés caractéristiques de ces ensembles statistiques, en particulier l’écart entre niveaux successifs, donnent une représentation très fidèle du nombre de spectres observés depuis ceux des atomes et noyaux jusqu’à la distribution des zéros non triviaux de la fonction zeta de Riemann. A vrai dire on ne possède pas de bonne théorie qui explique cet accord. Ces observations suggèrent une certaine forme d’universalité spécifique aux systèmes discrets, dont le mécanisme n’est pas encore totalement compris.
3.1 Loi du demi-cercle Nous entreprenons notre étude par l’exemple le plus simple. I1 concerne des matrices hermitiennes N x N . Les éléments de matrice vérifient Hij = H;i pour 1 5 i , j 5 N . Nous nous intéressons à la limite N 4 CO. Sous les hypothèses mentionnées plus haut, la loi de distribution est une gaussienne N
P ( H ) d H = cst exp - { $ p N Tr H2}
dHii
i=l
n
d ReH, d ImH,
l
(195) Le préfacteur est déterminé par la normalisation. L’introduction du facteur N dans l’exponentielle fait que la limite N + CO peut être étudiée à ,O fixé. Ce point sera justifié plus bas. L’ensemble statistique décrit par (195) est l’ensemble gaussien unitaire. Nous voulons analyser la distribution p(A)dA des valeurs propres, où A est la matrice réelle, diagonale, des valeurs propres, H étant diagonalisée à l’aide d’une matrice unitaire U
H = UtAU (196) Pour fixer les idées, nous supposons que U est unimodulaire; il reste cependant encore N - 1 phases indéterminées. Pour exprimer la distribution p(A)dA à partir de p ( H ) d H , nous développons H au voisinage d’une matrice diagonale A en écrivant U sous la forme U = I + iSK, où SK est une matrice infinitésimale hermitienne de trace nulle. Au premier ordre H = A i [A, SKI . Nous introduisons cette paramétrisation dans (195) et calculons le jacobien associé. En séparant l’intégrale sur le groupe spécial unitaire, nous obtenons
+
p(A)dA = cst
n
l
r (Xi - Xj)2exp
N
l
n
dXi
(197)
Montrer que dans le cas orthogonal réel, la distribution des valeurs propres s’écrit
272
X.3.1
SYSTEMES DESORDONNES
tandis que pour le groupe unitaire symplectique on a
Dans tous les cas, nous nous intéressons aux propriétés asymptotiques de ces distributions quand la taille N des matrices tend vers l'infini. Les expressions ci-dessus suggèrent une interprétation en termes d'un gaz coulombien unidimensionnel avec des interactions logarithmiques entre particules. Définissons en général la fonction de partition
Les valeurs a = 1 , 2 , 4 correspondent respectivement au cas orthogonal unitaire et symplectique. Le calcul de Z(a,B) donne la normalisation de la distribution p(A)dA. Remarquons que a > O correspond à un potentiel répulsif à courte distance. Plutôt que d'essayer de calculer Z explicitement, nous allons obtenir son comportement asymptotique en utilisant la méthode du col. Ordonnons les Xi par valeurs croissantes comme indiqué en (200) et introduisons une variable x = i/N qui prend ses valeurs en des points équidistants dans l'intervalle [O, 11. Pour N grand, x tend vers une variable continue et 1
-
F(X.) l
1
=JO
(
F X
-Nl
(2) -
1
dxF(X(x)) =
s_,
+O0
d MX ) F( X)
Cette relation définit une densité p(A) de valeurs propres telle que
(201)
X.3.1
273
SYSTEMES DESORDONNES
L’action prend la forme
dX i X 2 p ( X ) - ;a
dXdX‘p(X)p(X‘) In IX - A’[
(203)
Le point stationnaire en p nous donne une approximation thermodynamique pour Z ainsi que pour la distribution de valeurs propres. Introduisant un multiplicateur de Lagrange pour tenir compte de la contrainte de normalisation (202)’ nous obtenons
où nous supposons que X appartient au support de p(X). La condition de normalisation suggère que ce support est borné. Dans la suite, nous chercherons donc une solution de ce type. En dérivant les deux membres de l’équation (204) par rapport à X nous obtenons
où le signe devant l’intégrale signifie qu’il faut prendre une partie principale et où X appartient toujours au support de p . I1 est commode d’introduire une fonction F ( z ) analytique hors de ce support et se comportant comme z-l à l’infini
D’après l’équation (205)’ quand z tend vers X appartenant au support de p avec une partie imaginaire infinitésimale positive, F ( X io) tend vers 2X/Xi - irp(X), tandis que, hors du support de p , F(X)est réel. I1 est clair que ImF(z) < O pour Imz > O. Les ensembles statistiques considérés sont invariants dans la symétrie H c) - H , de telle sorte que p(X) = p(-A). I1 existe alors une seule fonction vérifiant toutes les propriétés ci-dessus, analytique dans un plan coupé le long du segment [-A,, XO]; elle s’écrit
+
F(z)=
2 z
+
J
q
=
2[.- J 3 - q Ag
(207)
La distribution asymptotique cherchée, de support [-Xo, Xo], est alors
’/ ;
p(X) = - 1 - TAO
274
X.3.1
SYSTEMES DESORDONNES
Elle ne dépend que du rapport alp. Dans une échelle bien choisie, elle est indépendante de l’ensemble statistique considéré, qu’il s’agisse des valeurs a = 1, 2 ou 4. Le choix du facteur N dans le poids de Boltzmann initial avait pour objet de conduire à cette loi limite, appelée loi du demi-cercle de Wigner pour des raisons évidentes. On a en effet
(i) Vérifier que la distribution (208) est bien normalisée. (ii) Montrer que l’équation du col (204) est vérifiée et calculer Z(a,B). Partant de l’équation (205) et intégrant dans l’intervalle [-Xo, XO] on obtient l’équation (204) avec une constante donnée par
<
où $(x) est la dérivée logarithmique de la fonction r(z) d’Euler 00
n=O
n+x
4)= -y+2 In 3
y étant la constante d’Euler. I1 s’ensuit que $(2) = 1-y et $J( Ainsi <=In(%)
Si on néglige les fluctuations autour du col, la fonction de partition vaut donc
3.2 Méthode fermionique Reprenons la discussion précédente et montrons encore une fois qu’on peut utiliser des variables anticommutantes de manière efficace, conformément au thème général de ce chapitre. Nous considérons comme précédemment la moyenne de la résolvante ( z - H ) - l pour l’ensemble unitaire ( a = 2, X i = 4/p). Posons
X.3.2
275
SYSTEMES DESORDONNES
(2iia) La structure du membre de droite résulte de l’invariance par transformation unitaire. Ainsi N F ( z ) est la valeur moyenne de la trace, ce qui s’exprime comme 1
(211b) +io) nPour Imz > O, nous écrivons F ( z ) comme la valeur moyenne du propagateur d’un champ scalaire libre complexe à N composantes (y,Cp). Le dénominateur associé est représenté par une intégrale de Grassmann sur un champ fermionique lui aussi à N composantes (+,q). En conséquence p(X) = --ImF(X
(P. cp (exp i
{a.- H)cp + $(z - W $ } )
D’après l’équation (197)’ dans l’ensemble unitaire gaussien nous avons 1 (exp-iTr(HK)) = exp--TrK2 2PN
Nous appliquons cette identité à la matrice
en sorte que
1 --
2PN
[(cp. d2- ( 4 .+I2 + 2 ( 4 . cp)(Cp.
$11)
I1 est commode d’introduire une représentation du terme quartique
qui permet d’effectuer l’intégrale fermionique sous la forme
(214)
276
SYSTEMES DESORDONNES
X.3.2
et det M = ( p - iz)N-l On obtient ainsi l'expression suivante
iz p . 'p - $ - ( p a1 PN Passons en coordonnées polaires pour les variables angulaire
~ 'p
p -) i ,~ B N p 2 }
(215)
et utilisons l'intégrale
Nous en tirons la représentation suivante, valable pour tout N , en termes d'une intégrale double
(.-> S_, d p l m duuN(p iz)N-l - iz + L)exp {izu 1 BN
F ( z ) = -3 2i P N
+m
(p
-
- sj?;y;v2-
;PNp'}
(217)
Une des deux intégrales peut être effectuée sous forme fermée. Nous nous contenterons d'observer que pour N + CO, on peut utiliser la méthode du col. Nous laissons au lecteur le soin de vérifier que l'on obtient
qui coïncide avec le résultat (207) pour a = 2 et A i = 4/P. La méthode fermionique présente l'avantage de donner accès aux corrections à la méthode du col et en particulier d'examiner les queues exponentielles dans la distribution des niveaux.
X.3.2
277
SYSTEMES DESORDONNES (i) Obtenir les queues exponentielles de la distribution des niveaux. (ii) En utilisant la méthode fermionique, trouver la valeur asymptotique
de
3.3 Espacements des niveaux La loi du demi-cercle ne décrit pas la plupart des spectres de manière réaliste. En revanche la distribution des écarts entre niveaux prédite par les ensembles gaussiens semble avoir un domaine de validité beaucoup plus large. Nous n’examinerons en détail que le cas unitaire, les deux autres étant laissés en exercice au lecteur. Reprenons la loi de probabilité des niveaux ( a = 2)
L’échelle a été choisie de telle sorte que, à /3 fixé, les niveaux restent dans un intervalle fixé quand N + CO, avec une probabilité unité. En conséquence l’écart entre les niveaux est d’ordre N-’ . Si nous voulons que cette distribution ait une moyenne fixée (indépendante de N ) , nous devons multiplier les niveaux par un facteur N . Soit x(X) la fonction caractéristique de l’intervalle [XO, X i ]
Ainsi, 1- x est la fonction caractéristique du complémentaire de l’intervalle [Ao, Xi]. La quantité
E(Ao, X i ) =
1n
[dXj(l - x(Xj)]p(Xi . . . , X , N )
(221)
iLj
est la probabilité de ne trouver aucun niveau dans l’intervalle [A, XI]. combinaison linéaire
La
278
x.3.3
SYSTEMES DESORDONNES
donne la probabilité de ne trouver aucun niveau entre A0 et A1 sachant qu'il y en a au moins un dans [A, - ~ A o A,,] ainsi que dans [Al, A 1 6x11. Dans la limite où 6x0 et 6x1 tendent simultanément vers zéro, on aura, avec une probabilité unité, au moins un niveau en A0 et au moins un en A l . Supposons que, dans des unités appropriées, E(Ao,A1) ne dépende que de Al - A0 et non de la demi-somme + ( A 0 A i ) lorsque N + m. On peut alors prendre ce point $(A0 A l ) au centre du spectre pour simplifier. Nous voyons que
+
+
+
A2
est la probabilité de trouver deux niveaux successifs à la distance A1 - Ao. Le point important est qu'il s'agit de niveaux successifs. En effet, on peut également étudier la distribution de probabilité de deux niveaux quelconques et il est probable que son comportement à courte distance coïncide avec celui de l'écart entre niveaux successifs. Toutefois les deux quantités ne sont pas reliées à grande distance. Pour calculer E(A0, Ai), nous utilisons à nouveau une analogie entre la loi de probabilité (219) et un gaz de fermions à une dimension dans un potentiel harmonique. Soulignons que ces fermions ne sont pas reliés à ceux qui apparaissaient dans la section précédente (3.2). En fait p(A1'.. . ,)A, est le carré du module d'une fonction d'onde antisymétrique
où n/-' est une constante de normalisation. La fonction d'onde .JI est un déterminant de Slater obtenu à partir des N premières fonctions propres d'un oscillateur harmonique. Celles-ci vérifient
a=-
Donc
Jz ' (&A+--
a)
' ")
(224)
x.3.3
SYSTEMES DESORDONNES
279
Ainsi nous trouvons
En conséquence p(X1, .. . , A N ) est donnée par
et vérifie la condition de normalisation souhaitée
Retrouver la fonction de partition Z ( a = 2 , p ) en utilisant l'expression ci-dessus.
Passons au calcul de E ( X 0 , X l ) . Comme (1 - x ( X ) ) ~ = 1 - x(X), si on
pose
E(Xo,Xi) =
/n
1 d X j z ldetd(h)12
l<j
En développant le déterminant et en effectuant l'intégration, on trouve
280
SYSTEMES DESORDONNES
x.3.3
Gaudin a remarqué que si on restreint le noyau de Darboux-Christoffel
à l’intervalle [A, A l ] , et si on considère ses N valeurs propres E et vecteurs propres cp dans le sous-espace engendré par les fonctions +j(A), l’équation aux vecteurs propres
(233~) peut être récrite
(233b)
où l’on a posé cp = CO<j
et E(Xo,A,) s’exprime en fonction des valeurs propres produit E(AO’A1)
(1 - 5s)
=
Es sous la forme d’un (235)
l<s
Nous cherchons donc la valeur asymptotique du noyau ICN(X,A’) quand N est grand. On l’obtient en utilisant une approximation semi-classique pour les fonctions +j(A). Nous nous restreignons à un domaine de largeur 1/N autour de l’origine et rappelons que K = $,BN est d’ordre N . Dans l’équation vérifiée par +N (A)
nous pouvons négliger K2A2 (d’ordre l) comparé à K ( 2 N + l) (d’ordre N 2 ) . Ainsi, pour A(2NK)+fini et N 03, nous trouvons que -f
x.3.3
281
SYSTEMES DESORDONNES
On peut facilement calculer + N ( O ) et +h(O)à partir des définitions (225). Pour N impair, d m + N + 1 ( 0 ) - f i + N - 1 ( 0 ) = O et
En reportant ces valeurs dans la définition (232)’ on trouve le développement asymptotique de K N valable près de l’origine
K:N(X’X’)
-
sin [ ( ~ N K ) +-( xXI)]
N-03
7T(X
- A‘)
(238)
D’après l’équation (208)’ la densité de niveaux au centre de la distribution est p(0) = 2/7rX0 où = 4//3 = 4N/PN. En conséquence
où D est l’espacement moyen entre deux niveaux consécutifs. Nous pouvons ainsi récrire la forme asymptotique du noyau K , fonction de X - A’ 1 sin [T(X - X‘/D)]
K(X,X‘) = -
D (A.[
- X’/D)]
On choisit désormais D comme unité en posant
X=DX
(241)
Notons p(x) les fonctions propres de K: dans un intervalle - k t 5 x 5 ft ( t > O). Nous avons ainsi l’équation aux valeurs propres
Le noyau est pair, ce qui entraîne que l’on peut décomposer les fonctions propres en fonctions paires ‘p(f)(z) et impaires cpf-)(z). Dans les deux cas, avec E = f l
L’identité
282
x.3.3
SYSTEMES DESORDONNES
sin a(x
+ 2’) +
exp 2i7rxx”lt
exp 2iax”x’lt
di
Jz
(244)
+
montre que le noyau sin a ( x x’)/a(x x‘) est le carré du noyau exponentiel t - 3 exp 2inxx‘lt dans l’intervalle 5 x 5 f t . Nous pouvons donc prendre pour p(€)(x) un vecteur propre de ce noyau exponentiel correspondant aux valeurs propres &y(+) ou iJzy(-)
-it
Nous avons la relation
Par un changement de variable, x = fty
= F‘*)(y)
(247)
le système ci-dessus s’écrit
et
(249)
s=l
E ( t ) =E(+)(tp4-1 ( t ) Les y sont également des fonctions de t. Ce paramètre est l’écart entre les valeurs propres (de la matrice aléatoire originelle) en unités relatives. Dans ces unités, la relation (222) entre E ( t ) et q ( t ) reste valable. Les équations aux valeurs propres (248) apparaissent dans d’autres contextes, en particulier en théorie de la communication.
Pour résumer, dans le système d’unités défini par 2 = X/D, avec le noyau lCt(a:,x‘) = sinn(a: - x‘)/n(a: - a:’) restreint à l’intervalle nous avons
[-it,it],
x.3.3
283
SYSTEMES DESORDONNES
E ( t ) = det(1 - l c t ) = exp -
OÛ
TrKt
7 1
q(t)
(250)
d2E(t)
= 7
Pour t petit, nous pouvons développer T r K t en puissances de t , le terme dominant étant t n ,
Ainsi
E ( t ) =1- t
+ k7r2t4 - k7r4t6 + &7rV + O(t'0)
+
q ( t ) =$(7rt)2 - & , r t ) 4 &(7rt)û
+ O(P)
(252)
Le comportement de q ( t ) en t2 pour t petit reflète la présence du facteur répulsif à courte distance pour les valeurs propres, comme le montre la loi de probabilité (219). La convergence du développement (252) est limitée par le premier zéro du détermina.nt E ( t ) . (i) Le résultat correspondant pour l'ensemble gaussien orthogonal est donné par E ( + ) @ )(équation (249)) avec le développement
Notons que comme prévu, q ( + ) ( t ) est linéaire a t petit. (ii) Montrer que pour t
-+
00
et trouver les préfacteurs.
La compréhension des propriétés d'universalité de la loi des écarts est un problème ouvert. De même on ne sait pas s'il existe des systèmes qui présentent des déviations intéressantes.
284
SYSTEMES DESORDONNES
x.4
4. Approximation planaire L’étude des ensembles gaussiens de matrices aléatoires est un cas particulier des théories des champs à valeurs dans un ensemble de matrices, lorsque la taille N des matrices croît indéfiniment. Par analogie avec le modèle vectoriel à n composantes dans la limite n grand, on s’attend a priori à des simplifications significatives dans la limite N -t m. Cette idée est due à t’Hooft (1974) dans le contexte des théories de jauge. La discussion de ces simplifications montre que l’on est amené à considérer un nouveau développement perturbatif, de nature topologique, dont le terme dominant est donné par la resommation de tous les graphes de Feynmann qu’on peut dessiner sur un plan (ou sur une sphère par compactification). Ceci justifie le terme d’approximation planaire. Bien que ce sujet semble assez éloigné de celui de ce chapitre, il constitue une extension naturelle des méthodes utilisées pour les ensembles gaussiens, et il conduit à une évaluation du nombre de triangulations aléatoires des surfaces, établissant par ce biais un lien avec un autre aspect de l’étude des systèmes désordonnés (cf chapitre XI). Nous nous limiterons à des considérations en basse dimension, ce qui permet de montrer les phénomènes intéressants et de résoudre quelques problèmes d’analyse combinatoire.
4.1 Analyse combinatoire Considérons un champ scalaire matriciel noté M ( x ) . I1 s’agit d’une matrice N x N hermitienne. Un lagrangien invariant par l’action adjointe du groupe unitaire S U ( N ) s’écrit sous la forme
L = i Tr 8, M a , M
+ i Tr M 2 +
g p N 1 - i PTr M p
(255)
P
Nous justifierons plus tard le choix du facteur N 1 - i p pour le couplage d’ordre p. Montrons que, à constantes de couplage fixées, seuls les graphes planaires survivent dans le développement perturbatif à la limite N -+ cm. Ici la partie importante des règles de Feynman est celle qui reflète la nature matricielle du champ. Les autres éléments sont familiers : propagateurs, intégrales, . . .. I1 est commode de représenter les propagateurs du champ M par des lignes doubles avec des orientations opposées, associées à chaque indice. Etudions la dépendance en N d’un graphe ayant P propagateurs et V p vertex de type p V = & c p V p ) . Pour simplifier, nous ne considérons que des graphes connexes vide-vide. Si on compte chaque propagateur deux fois, on compte p fois chaque vertex, donc
(
2P = cpvp (256) 31P De plus, chacune des B boucles internes peut être considérée comme une face d’une surface polyédrale orientée. En recollant ces faces le long des
X.4.1
SYSTEMES DESORDONNES
285
propagateurs, on obtient une surface fermée, connexe, orientable qui vérifie la formule d’Euler
x = 2 - 2H = V - P + B
(257) où x est la caractéristique d’Euler et H dénote ici le genre (pour éviter toute confusion avec les constantes de couplage g p ) . Après sommation sur les indices internes, chaque boucle produit un facteur N , de telle sorte que, outre les facteurs usuels, la contribution d’un graphe contient le produit
II 3
( g p ~ l - : ~ ) v I ’NB =
I Igp (35p
9
)
~ 2 - 2 H
(258)
A la limite N m, la contribution dominante à l’énergie libre (la fonctionnelle génératrice des diagrammes vide-vide connexes) provient des graphes tracés sur une surface de genre nul (x= 2, H = O ) , c’est-à-dire des graphes planaires. Les corrections d’ordre N P 2 proviennent des graphes tracés sur un tore etc... Le raisonnement ci-dessus peut être généralisé au cas où des sources sont présentes à condition qu’elles soient affectées de puissances de N convenables. Nous posons --f
1 E ( g ) = - lim -F(g) = - lim Z N ( g ) (259) N-CC N 2 N-CC A titre d’exemple, limitons-nous à une théorie en ‘p4 (94 g), et énumérons les poids associés aux premiers graphes planaires, jusqu’à l’ordre g 3
Etendre les considérations précédentes a u lagrangien quartique
C = T r û p A ll a p M i + T r M M t
+
(261~)
avec
a=1 cy
=2
a =4
All orthogonale réelle hf hermitienne
A4 complexe
(2616)
286
X.4.1
SYSTEMES DESORDONNES
Les groupes de symétrie correspondants sont S O ( N ) , S U ( N ) et S U ( N ) x S U ( N ) . Les termes dominants sont les mêmes dans les trois cas, mais la dépendance en N des corrections varie avec le type de matrice envisagé.
Dans le cas à zéro dimension, on ignore la dépendance dans la variable de configuration. Ainsi E ( g ) est une fonction génératrice des facteurs combinatoires comme ceux donnés par l’équation (260). La méthode utilisée dans la section précédente s’étend au cas présent. Nous exposons le calcul dans le cas d’une interaction quartique, mais on peut plus généralement traiter le cas d’une interaction polynômiale quelconque même non bornée inférieurement. A une constante de normalisation indépendante de g près, nous avons
exp - N 2 E ( g ) = cst =
1n
IsisN
J d M exp - { i Tr M 2 + 9 Tr &I4} N
dXi
II
(Xi - Xj)2exp-
i
l
N
où { X i } désignent les N valeurs propres réelles de la matrice hermitienne M . La méthode du col donne
avec la condition de stationnarité
(263b) Ordonnons les valeurs propres et, dans la limite N grand, substituons à cette suite discrète la fonction continue telle que X i = f i X ( î / N ) . Ceci nous conduit à l’approximation suivante
Nous définissons la densité normalisée de valeurs propres u(X) par dx = u(X)dX
X.4.1
SYSTEMES DESORDONNES
287
où u(X) est positive, paire, de support inclus dans un intervalle [-2a, 2a] et vérifiant f2a
1= L ‘ d x = [ 2 a
dXu(X)
Ainsi
La fonction analytique 2a
F ( z )= [ 2 a
dPU(P)
(267a)
est définie dans le plan complexe privé de la coupure [-2a,2a]. Elle est impaire, réelle sur l’axe réel privé du segment [-2a, 2a], et se comporte en z-l quand z tend vers l’infini. De plus, elle vérifie
F(X f io) = $A
+ 2gX3
inu(X)
- 2 a 5 X 5 2a
(267b)
L’unique fonction F possédant ces propriétés s’écrit
~ ( z=) fz+ 2gz3 - (S + 4ga2 + 2gz2) Jzz-4az
(268)
Le facteur devant la racine carrée assure une décroissance de F ( z ) en z-l à l’infini pourvu que 12ga4 + a2 - i = O
(269)
Pour g petit, on peut développer a2 en série convergente
249
= 1 - 12g
+ 2(12g)2 - 5( 12g)3+ ...
(270)
Dans l’équation (268), la racine carrée est choisie positive pour z réel, z 2 2a. La discontinuité de F le long de la coupure donne une expression pour .(A) qui généralise la loi du demi-cercle
En revenant à (264), on trouve E(g) sous la forme
288
SYSTEMES DESORDONNES
X.4.1
Tenant compte de l’expression de a’ comme fonction de g on aboutit à la série
=2g - 18g’
+ 288g3 - 6048g4 + . .
en accord avec les premiers termes donnés en (260). A la différence du développement perturbatif complet , l’approximation planaire produit une série convergente, donc analytique, dans un voisinage du point de couplage nul g = O. La singularité la plus proche provient de l’expression de a2(g). Elle est située sur le demi-axe réel négatif, à une valeur g --.AL c
-
(274)
48
Ceci permet d’obtenir le comportement asymptotique des coefficients de la série (273)
(i) La même méthode fournit des expressions pour les fonctions de Green à l’approximation planaire. Ainsi
LZu +2a
G z p ( g ) = (TrM2p) =
dXu(X)XZP
Les valeurs moyennes des puissances impaires sont évidemment nulles. De l’équation
on tire
(2P)! -~ p ! ( p - l)!
2 k=O
(2k
+ P - I)!
(-12g)k
+ + l)!
k!(k p
De même, on peut engendrer les fonctions de Green connexes, définies par récurrence par les relations
(277)
X.4.1
289
SYSTEMES DESORDONNES
et on trouve (3p - 1)!3l-F G2p(g) = (p - 1)!(2p - l)!
2 p=l
+
(-12g)'(2IC p - l)! (IC - p + l)!(k 2p)!
(279)
+
Finalement, si on exprime les fonctions de corrélations une-particule-irréductibles (les fonctions de vertex) par ï z = [G;]-l -r4
=G4 [G;Ip4
-r6
=GE [G;]l-6
-rs =Gg [G;]-'
(280a)
- 3 [G4I2[G;Ip7
- 8GSG4 [G;]-'
+ 12 [G4I3 [G;]-lo
... leur fonction génératrice (l'analogue de l'énergie libre exprimée en fonction de l'aimantation après une transformation de Legendre) 00
(280b) p=l
vérifie l'équation algébrique
+ r)2+ g a 4 r ( i + r - r2/& - a2(2+ a 2 ) +
3 2 ( i -2)(i
=O
(280c)
dont on déduit le développement en puissances de g. (ii) On peut aussi étudier systématiquement les corrections à l'approximation planaire. Cela revient à compter les diagrammes tracés sur un tore, un double-tore, etc. Notons les contributions correspondantes E1 (g), Ez(g), . . .. Dans le cas hermitien ( a = Z), nous avons
Pour obtenir les termes successifs du développement on utilise le comportement aux grands ordres des polynômes orthogonaux relativement à la me(g/N)X4). Ces polynômes généralisent les polynômes de sure dX exp -( ;A2 Hermite qui figuraient dans la section précédente. On est alors conduit aux expressions
+
290
SYSTEMES DESORDONNES
X.4.1
=A in(2 - a 2 )
Ei(g)
I (I -a2)3 Ez(g) =---(82 6! (2 - u 2 ) 5
+ 21a2 - 3a4)
... où a2 est toujours donné par l’équation (270). Pour E H ( g ) , on peut montrer que le terme dominant est de la forme
(iii) Nous avons discuté ci-dessus le cas d’une interaction quartique mais la méthode s’étend à n’importe quelle interaction polynômiale et en particulier à un terme cubique. Afin de donner un sens à l’intégrale fonctionnelle, on peut supposer que la constante de couplage est imaginaire pure. Dans ce cas les résultats sont intéressants pour les applications aux triangulations des surfaces, après une transformation de dualité. Esquissons brièvement les calculs. On souhaite évaluer, à N grand, l’intégrale suivante
exp - N 2 E ( g ) =
II
dXi
(Xi
- Xj)2exp-
l
’ 1 ; N
Utilisons la méthode du col avec Xi
=f
i x
(i)
dXw(X) = 2dx
Nous obtenons les équations
2a
5 X 5 2b
l:
dXv(X) = 2
Dans le cas présent le support de .(A) est dissymétrique sauf à la limite g + O. La fonction F ( z ) ayant .(A) comme discontinuité le long de la coupure [2a, 2b], réelle hors de cet intervalle et se comportant en 2/2 à l’infini, s’écrit
Posons (T
= 3g(a + b )
X.4.1
291
SYSTEMES DESORDONNES
Le comportement de F à l’infini donne la condition
18g2
+ u( 1 + u ) (1+ 20) = O
.=-:Em
l
(72g2)k r ( + ( 3 k - 1))
r (S(k+i))
k!
En conséquence E(g) - E ( 0 ) = -
+ + + 4 in(i + 2u) + ) ~
u(3u2 60 2) 3( 1 O ) ( 1 2 ~
+
Toutes ces expressions sont analytiques au voisinage de l’origine. La première singularité se trouve à
La fonction génératrice des fonctions de Green connexes
+(j)= 1
+
m
jpGp
(291a)
1
obéit à l’équation (291b) On peut aussi modifier les fonctions de Green en éliminant les contributions des tadpoles correspondant à G I = G i . A cet effet, on introduit un terme X i dans l’action. On fixe alors la valeur du linéaire supplémentaire p paramètre p de manière à annuler la fonction à un point. La quantité modifiée $ satisfait à 3942
+( j
- 3g)4
- j ( 1- pj
+j 2 ) = O
(292a)
où g est relié à p par
(292b)
4
En éliminant 7, on obtient une expression pour en terme de graphes ayant E lignes externes et V sommets (les autres caractéristiques topologiques étant fixées par la condition de planarité et le fait que les sommets sont trivalents)
292
SYSTEMES DESORDONNES
X.4.1
En résumé, dans le cas combinatoire d'une théorie des champs à zéro dimension, la méthode fournit des équations algébriques qui donnent accès au développement en puissances de g. I1 serait extrêmement intéressant de poursuivre ce programme dans des cas plus réalistes. Malheureusement, cela n'a pu être totalement réalisé, sauf en un sens phénoménologique, excepté dans le cas à une dimension, c'est-à-dire pour la mécanique quantique.
4.2 Approximation planaire en mécanique quantique En général, les graphes ayant une topologie donnée doivent être pondérés par des intégrales de Feynman non triviales. I1 est donc tout à fait remarquable que l'on puisse obtenir des expressions explicites à l'approximation planaire dans le cas unidimensionnel où le propagateur vaut (p2+ l)-' ( p est un moment réel). Considérons ainsi un ensemble de N 2 oscillateurs anharmoniques couplés de telle sorte que les variables de configuration soient les N 2 coefficients d'une matrice N x Ar hermitienne et que le hamiltonien soit invariant par l'action du groupe S U ( N ) . Nous cherchons donc l'énergie de l'état fondamental d'un système décrit par le hamiltonien
H=-SA+V
9 V ='2 Tr h12+ Tr M4 N
On pourrait aussi bien étudier des potentiels plus généraux. Pour l'état fondamental nous avons
HS, = N 2 E ( g ) q
(295)
et la fonction d'onde 11, est invariante par les transformations unitaires
q(121)= ?$(rr+AlU)
+
Ainsi est une fonction symétrique des valeurs propres de A l , ce qui rappelle la séparation en variables angulaires et radiales dans d'autres problèmes. On a 1L S, ({A,}) et
X.4.2
293
SYSTEMES DESORDONNES
Remplaçons la fonction symétrique notée 4,définie par
+ ({A,})
par une fonction antisymétrique
qui décrit un ensemble de fermions libres dans un potentiel quartique (dans notre exemple). L’équation (296) nous donne par la méthode variationnelle l’équation de Schrodinger suivante pour qfJ
Le facteur 1/N dans le potentiel assure un comportement correct à la limite ili -+ m. Le passage aux coordonnées polaires {A,} n’engendre pas de termes supplémentaires dans le potentiel mais cette propriété ne subsiste pas lorsque l’on étudie d’autres ensembles de matrices. L’antisymétrie de 4 est l’analogue des conditions aux limites à l’origine dans le cas des coordonnées polaires usuelles. *Appelons el < e2 < e3 < . . . les énergies successives relatives au harniltoriien 5 une particule
et soit f?F l’énergie tlii riiveau de Frirnii, c’est-à-dire celle du niveau occupé de plus haute 6ncrgic. Nous avons
lil,
N =
H(e,.. - e k ) 1
-
Ces expressions sont esactes pour tout K.En fait, il serait plus approprié d’écrire EN(^) pour N fini car le comportement E N ( g ) N 2 E ( g )ne 00. Bien entendu les quantités e h ne sont s‘applique q i i ’ i la limitc N en général pa5 connucs cxactcrricrit. Heureusement, puisqu’on ne s’intéresse --f
294
ÇYSTEMEÇ DESORDONNES
X.4.2
qu’à la limite N grand, seuls les états très excités contribuent à l’expression dominante de N 2 E ( g ) .L’approximation semi-classique est alors suffisante. Nous pouvons remplacer les sommes finies par des intégrales sur l’espace des phases classique et nous obtenons
Intégrons sur la variable p et effectuons un changement d’échelle sur X et eF de la forme fix, e F + N E . Nous obtenons une paire d’équations qui donnent la solution sous forme paramétrique
I1 s’agit en fait d’intégrales elliptiques. La seconde équation exprime que E ( g ) est indépendant de E à g fixé. Ces équations sont un exemple frappant des simplifications qui apparaissent à l’approximation planaire. En éliminant E, nous obtenons pour E ( g ) une fonction analytique au voisinage de l’origine. Ceci semble contredire les propriétés de la solution exacte pour laquelle le point g = O est une singularité essentielle provenant de l’instabilité par effet tunnel à g < O . Dans l’approximation planaire, la singularité la plus proche de l’origine apparaît pour une valeur négative du couplage telle que le niveau de Fermi atteigne le maximum du potentiel
Jz
gc = -%
(303)
On ne s’attend pas en principe à ce que l’approximation planaire donne de très bon résultats à N fini et donc a fortiori pour N = 1. Le tableau suivant montre des résultats numériques (dus à Hioe et Montroll 1975) pour l’oscillateur anharmonique (noté EeXacte) comparés au résultat de l’approximation planaire. L’accord est étonnamment bon sur une large plage de couplages
X.4.2
295
SYSTEMES DESORDONNES
9
Eoianaire
Eexacte
0.01 0.1 0.5 1.0 50 1000
0.505 0.547 0.651 0.740 2.217 5.915
0.507 0.559 0.696 0.804 2.500 6.694
(304)
Pour g grand, l’accord est moins satisfaisant. Le comportement asymptotique de l’approximation planaire déduit de l’équation (302) est donné par
(305)
tandis que la solution exacte se comporte comme
5. Système de spins en interactions aléatoires Pour terminer, nous présentons encore deux applications des variables anticommutantes aux systèmes désordonnés. La première est due à Parisi et Sourlas et concerne un système de spins soumis à un champ magnétique aléatoire. Même si 1’011 n’accède pas ainsi à une compréhension quantitative complète de ce système au voisinage de sa dimension critique supérieure, on peut expliquer simplement une propriété observée perturbativement. Nous allons ainsi relier le comportement d’un système désordonné à celui d’un système pur en dimension inférieure. Dans la deuxième sous-section, nous présentons les résultats de Dotsenko et Dotsenko relatifs à une situation opposée. I1 s’agit d’un cas où le désordre a un effet marginal d’après le critère de Harris. Nous examinerons plus précisément l’effet d’un faible désordre au voisinage du point critique à deux dimensions. Malgré certaines critiques, la méthode d’analyse et les résultats sont intéressants. Ces difficultés reflètent une fois de plus les subtilités inhérentes aux systèmes désordonnés.
5.1 Champ extérieur aléatoire et transmutation dimensionnelle Considérons un modèle d’king, que nous approximons à la limite continue par un modèle (p4 couplé à un champ aléatoire extérieur gaussien.
296
X.5.1
SYSTEMES DESORDONNES
Les quantités physiques sont des moyennes sur le désordre. La moyenne thermique sera notée ici ( 4 ) et la moyenne sur le désordre par (A). Si h désigne le champ magnétique, l’énergie libre s’écrit
F ( h ) =ln/Dcpexp-/ddx{C(x)
F=
s
D h F ( h )exp -$
/
+ h(x)p(x)} (307)
ddxh2(x)
où C(x) = + ( d d 2+ V(cp)
v = +m2cp2+ sip4
(308)
La méthode des répliques remplace le calcul de F par celui de la moyenne Z ( h ) n loù Z ( h ) est la fonction de partition, à la limite où n tend vers zéro. Dans le développement perturbatif les termes les plus divergents à la limite infra-rouge correspondent aux graphes où apparaît le plus grand nombre d’insertions de h2. En resommant ces contributions on démontre q e ( h ) est alors dominée par l’approximation de champ moyen tandis que F ( h ) est obtenue par la moyenne de cette approximation sur le désordre. Introduisons le champ moyen cph, solution de l’équation -A‘P/L(x)
+ V’(Ph(X)) + h(x) = 0
(309)
Dans cette approximation, la fonction à deux points est donnée par
S (-Acp(x)
+ V‘(cp(x))+ h(x)) exp -$
/
ddxh2(x)(310)
X
Dans la seconde expression, nous avons utilisé la définition de c p h ( x ) déduite de l’équation de champ moyen. Le produit de fonctions 6 est accompagné d’un jacobien qui est la valeur absolue du déterminant des dérivées secondes de l’action par rapport à cp(x). Si la correspondance entre h et cp était V”(cp)) biunivoque, on pourrait oublier la valeur absolue car det(-A ne s’annulerait jamais. On suppose implicitement cette propriété dans la théorie perturbative et nous ferons de même ici, sans justification sérieuse, dans la resommation des logarithmes dominants. De nombreux systèmes désordonnés (comme les verres de spin) sont tels que l’approximation de champ moyen se revèle d’une telle complexité que même cette hypothèse apparaît injustifiée.
+
X.5.1
297
SYSTEMES DESORDONNES
Nous suivrons donc Parisi et Sourlas en ignorant le signe de valeur absolue pour le déterminant et nous en analyserons les conséquences. Ce déterminant s’exprime à son tour comme une intégrale sur des variables de Grassmann et le produit de fonctions 6 comme une intégrale d’une exponentielle sur un champ auxiliaire imaginaire pur a ( x ) . Ceci conduit à la représentation
,Nous nous attendons à ce que le lagrangien effectif possède une symétrie BRS. Soit ü un paramètre infinitésimal anticommutant et E un vecteur à d dimensions. La transformation en question est du type A + A SA pour A = (cp, $, $, a ) ,avec 6A = ÜsA
+
scp = - E.X$ s+ =O
=2&.a$ s a =&.Xa
+ 2E.dcp
(312)
La variation de l’action est l’intégrale d’une dérivée totale S
s
ddXLeR(X)= 2ü
I
ddx&.d{$ [-Acp
+ V’(cp)]}
(313)
qui s’annule pourvu que la quantité entre crochets tende vers zéro à l’infini. Montrer que
Comment modifier le formalisme pour avoir s2 = O ?
Introduisons alors un super-champ @ fonction de x et de deux variables anticommuantes e et ë
@(x,e, 8) = V(X)
+ ë+(x) + $(x)e + eëa(x)
(315)
Nous choisissons la normalisation des intégrales de sorte que
/
dëdû
=1
Dans le super-espace, le laplacien est défini par
aa a, = a+ ae ae 7-
(317)
298
SYSTEMES DESORDONNES
X.5.1
où les dérivées agissent à gauche. On constate que l’action effective dans l’intégrale fonctionnelle (311) prend la forme
Seff= /ddxd$dû {-$@As@ + V ( @ ) } = / d d x {$(-A
+ V”(p))$ + a(-Acp + V’(p)) - ; a 2 }
(318)
Nous laissons le soin au lecteur de vérifier cette identité surprenante à première vue. Elle entraîne l’invariance par rotation dans le super-espace. L’introduction de deux coordonnées grassmanniennes entraîne la propriété suivante. Tout se passe comme si on diminuait la dimension de l’espace Rd de deux unités dans les intégrales des quantités invariantes par rotation. Pour le voir, considérons une intégrale dans l’espace (x,û,$) et soit f une fonction à décroissance suffisamment rapide à l’infini. Considérons alors l’intégrale
/
Iddxdëdûf(x2 + O$) 7r
1
= -Ir
1
ddxfr(x2)
Passons en coordonnées polaires avec x2 = r2 et Sd = 27rid/ï(;d) l’aire de la sphère unité dans l’espace à d dimensions. Nous obtenons pour d > 2 après une intégration par parties
qui confirme l’affirmation pour des intégrales simples. Le lecteur intéressé montrera que ce résultat s’étend à plusieurs variables et produit la réduction dimensionnelle de deux unités que l’on observe perturbativement, laquelle apparaît justifiée par cette analyse globale. La conclusion de Parisi et Sourlas est que le modèle supersymétrique à d dimensions est équivalent à une théorie purement bosonique en d - 2 dimensions. En ce qui concerne le modèle de spins en champ aléatoire que nous venons d’analyser, ce résultat s’applique au mieux au voisinage de la dimension critique supérieure (c’està-dire six pour le système désordonné, équivalent à une théorie 9”). Le comportement à plus basse dimension n’est pas bien compris et nous ne pousserons pas plus loin son étude.
5.2 Modèle d’Ising bidimensionnel désordonné Examinons finalement un effet marginal du désordre sur le comportement critique. Considérons un système au voisinage du point critique.
X.5.2
SYSTEMES DESORDONNES
299
Notons 0 l’écart à la température critique. La contribution d’un opérateur local essentiel K de dimension A 5 d a la forme SS =
I
ddq(x)K(x)
où g est une constante de couplage de dimension L A - d . En l’absence de
perturbation, la longueur de corrélation E se comporte en e-”. L’analyse dimensionnelle suggère que si g est non nul, la partie singulière de l’énergie libre par unité de volume est de la forme
L’exposant IC positif
IC = ~ ( -dA)
(322)
caractérise la transition entre deux comportements distincts. La fonction f est régulière A l’origine (c’est ce qui nous a fait extraire le facteur e2-,). Dans le cas où g est un champ aléatoire figé, on supposera que la partie singulière de l’énergie libre totale prend une forme généralisant l’équation (321)
où ‘p est une fonctionnelle régulière au voisinage de zéro. Supposons en outre que g(x) soit de moyenne nulle. Nous avons approximativement
In z(e,g(x)) = e2-a’po
//
+ +e2-a-2k
d d ~ l d ~ 2 g ( ~ l ) g ( ~ 2 )x2) ~ 2+. ( x.l.,
(324) Si l’intégrale du membre de droite est bien définie, l’effet dominant du désordre doit être d’ordre û2-a-2k avec un exposant plus petit que celui du système pur. L’argument ci-dessus devient douteux dès que
ou, en utilisant la relation 2 - Q = ud,
A<
id
(325b)
comme l’indiquerait un développement perturbatif. L’inégalité précédente fournit le critère de Harris (1974). Un faible désordre ne modifie pas le comportement dominant si cette inégalité est satisfaite. I1 est donc intéressant de considérer une situation marginale où A = i d . Le modèle d’Ising bidimensionnel avec fluctuation des couplages nous donne
300
X.5.2
SYSTEMES DESORDONNES
un exemple de cette situation. L’opérateur K est ici l’opérateur énergie de dimension A = 1. La marginalité du désordre se traduit par le fait que la théorie des champs associée est juste renormalisable. Comme l’ont montré Dotsenko et Dotsenko, ce modèle, introduit dans un tout autre contexte par Gross et Neveu, est asymptotiquement libre dans le régime infrarouge, domaine qui nous intéresse. Même si certains aspects du raisonnement qui va suivre restent sujets à controverse, en particulier l’utilisation délicate de la méthode des répliques, la théorie des champs correspondante est particulièrement intéressante. Nous nous plaçons dans la théorie critique continue qui s’exprime en terme d’un champ de Majorana réel avec un terme de masse aléatoire m ( x ) de moyenne nulle. Nous cherchons la moyenne du logarithme de la fonction de partition Z M (où l’indice M fait référence à Majorana)
(326~) (3268) Parmi les différentes méthodes d’analyse, nous choisissons de suivre celle due i Shankar qui a le mérite de montrer succinctement le phénomène principal. Comme nous nous bornerons à étudier l’effet du désordre sur l’énergie libre, nous pouvons multiplier cette dernière par 2, ce qui revient à élever Zn: au carre pour obtenir un modèle fermionique complexe qui introduit une symétrie O(2). Notons ($I,&) , ( $ 2 , q 2 ) les deux copies du champ de Majorana et définissons le champ de Dirac U. =
(41 - i42,+1 - $2)
Un facteur c3 a été inclus dans la définition de l’adjoint l’opérateur de Dirac s’écrit =
(+; &)
(327)
de telle sorte que
(328)
Nous utiliserons indifféremment les notations x,(z,z)ou même z pour désigner les coordonnées d’un point. Ainsi
2s
Z D = Zizf =
D(u,ii)exp-So
(329a) (329b)
X.5.2
30 1
SYSTEMES DESORDONNES
L’indice m rappelle que l’opérateur de Dirac contient un terme de masse variable. Le calcul de Z D est en principe immédiat puisque c’est le déterminant de l’opérateur D,. Comme d’habitude les modes voisins des modes nuls posent un problème. Nous supposerons qu’ils ne compromettent pas le traitement qui va suivre. C’est le point faible de cette méthode. Avant d’effectuer la moyenne sur le désordre, rappelons les formules de bosonisation pour le champ de Dirac (chapitre II). Elles proviennent de la symétrie O(2) entre les copies des champs de Majorana, ou en termes du champ de Dirac complexe, de l’invariance par la transformation
Le théorème de Noether nous fournit un courant conservé
(331~) a z j z+ dZj2 = O
(331b)
Dans la théorie de masse nulle, nous pouvons exprimer les courants en fonction d’un champ scalaire libre de masse nulle cp, par les relations j” =4241
+
hap
j Z=
+
-ha9
(332)
Ces formules signifient que les fonctions de corrélation calculées dans les théories des champs correspondantes sont égales. Rappelons que pour m = O , avec a et b désignant les points xa et xb
Nous vérifions que les fonctions à deux points sont bien égales
Vérifier l’égalité des corrélations d’ordre supérieur.
Le champ aléatoire m(x) est couplé à l’opérateur énergie qui peut également s’exprimer sous forme bosonique
302
SYSTEMES DESORDONNES
X.5.2
Le facteur de coupure ultraviolet A = a-l, qui spécifie la dimension relative des opérateurs, compense l’absence d’ordre normal
Un des avantages de cette formulation réside dans l’existence d’une expression locale pour l’aimantation (ou spin) en fonction du champ bosonique alors que son expression fermionique est non locale. En effet le produit des variables de spin ulu2 relatives aux deux copies correspond alors à u1u2 + &A$
sin (p/&
(335)
ce qui permet de calculer le carré des corrélations sous forme bosonique. Le facteur A i rappelle la dimension du champ et remédie à l’absence d’ordre normal.
Nous sommes maintenant prêts à prendre la moyenne sur m(x). Supposons que m(x) fluctue autour d’une valeur moyenne m. Au lieu de calculer la moyenne de In ZM (ou In 2;) évaluons plutôt la chaleur spécifique à m = O. I1 suffit de dériver deux fois la moyenne sur m(x) et de poser m = O. Ceci implique l’intégrale de la fonction à deux points de l’opérateur énergie E , c’est-à-dire la moyenne de
3
(E(x)E(x’))= Zgl
I
D(cp)A2COS & p ( x )cos &‘p(x’) exp -SB
(336a) (336b)
‘J
Sg)= n.
d2xm(x)ACOS h c p
(336c)
Pour abréger nous écrirons : cos acp : pour Aff2I2cos a’p. I1 nous faut encore préciser la distribution de probabilité de la variable m(x). Le seul cas analytiquement soluble est celui de la distribution gaussienne
O ( m )=
J d2xm2(x) + J ’DmO(m(x)) J ~m + J d2xm2(x) exp -(1/2g2) exp -
(337a)
c’est-à-dire telle que
m(21)m(x2) = 92 6( 2 ) (Xi - x2)
(337b)
où g2 caractérise l’intensité du désordre. Nous avons le choix entre deux possibilités pour calculer la moyenne. D’une part, nous pouvons introduire
X.5.2
SYSTEMES DESORDONNES
303
n répliques du champ bosonique, puis faire tendre n vers zéro, ou d’autre
part, introduire un partenaire fermionique. Les résultats sont les mêmes et nous choisissons la première méthode. En conséquence
(E(x)E(x’))= lim n+O
/
D(cp) : cos f i q ’ :: cos fi$ : exp -S(cp)
(338a)
L’indice de réplique c varie de 1 à n. Si nous avions effectué un calcul analogue en partant de l’action de Dirac, nous aurions obtenu le modèle de Gross-Neveu avec une symétrie û(2n). Cette invariance n’apparaît pas explicitement dans la version bosonique. L’action complète avec uc, üc et m(x) est la plus simple sur laquelle on puisse étudier complètement la renormalisation. Quoi qu’il en soit, l’équation (338) indique que nous avons une théorie renormalisable, mis à part la question de la limite n -+ O. I1 est clair que nous devons en analyser le comportement infra-rouge et en particulier celui de la constante de couplage g2 effective qui représente l’effet du désordre. Le modèle de Gross-Neveu admet une solution exacte à n = 1. Dans ce cas, le comportement critique est l’un de ceux examinés au chapitre IX. La charge centrale est égale à 1et les exposants critiques varient continûment en fonction de g. Remarquons en effet que d’après les équations (332) et (333), nous avons, pour un champ de Dirac, une expression formelle du carré du courant l’t.z-’-
23 3
-
- 2+2+1+1+2
=
a
(&+l
+42+2)2
(339)
En termes bosoniques, ceci entraîne la correspondance suivante
-acpacp
(:cos2 Jz(P :)
2
H
(340)
valable pour les insertions dans les fonctions de corrélation. On peut aussi vérifier cette équivalence par une analyse soigneuse de la renormalisation du modèle qui montre que les termes diagonaux dans le lagrangien d’interaction (338b) peuvent être remplacés par un terme cinétique modifé
(341) Quand le nombre de composantes n est égal à l’unité, cette action décrit manifestement un champ scalaire libre de masse nulle où le champ est 1 multiplié par un facteur (1 + g2/27r) a . Cette modification en apparence
304
X.5.2
SYSTEMES DESORDONNES
innocente modifie la dimension de tout opérateur de la forme K , =: cos a(p :, de A, = +a2en A,(g) = $ a2 ( 1 + g2/2n)-l, ce qui se traduit par des exposants variant continûment avec g. Pour une valeur de n arbitraire, la fonction p doit s'annuler à n = 1, ce qui signifie qu'elle contient au moins un facteur ( n- 1). Comme nous allons le voir, ce facteur apparaît à la première puissance, ce qui entraîne que p(g) change de signe quand n - 1 s'annule. En conséquence, au voisinage de g = O les propriétés à longue et à courte distance s'échangent quand n traverse la valeur un. Alors que pour n > 1, le modèle est asymptotiquement libre à courte distance et présente une brisure spontanée d'une symétrie discrète engendrant dynamiquement une masse fermionique, nous avons le comportement opposé de liberté asymptotique infrarouge pour n < 1, ce qui est la situation favorable dans le cas présent. Effectuons maintenant les calculs nécessaires. Grâce aux remarques précédentes et à la forme (341) de l'action, nous pouvons effectuer une renormalisation finie des champs en posant
(I + 97274
pC= Cp"
(342)
Définissons
et rappelons que la prescription d'ordre normal des exponentielles implique une puissance appropriée de A. Nous sommes ainsi conduits à l'action
Plus précisément, nous aurions dû introduire une échelle de masse arbitraire p pour normaliser la puissance supplémentaire de A, qui à l'ordre dominant en g2 doit être interprétée comme (A/p)1-1/(1+gz/2r) 1+(g2/2n) ln(A/p). Cette première renormalisation ne suffit pourtant pas à rendre toutes les fonctions de corrélation finies, en particulier la fonction à deux points de l'opérateur énergie (338). Un contreterme supplémentaire est nécessaire : cosaCp" :: c o sa g d : bien que nous ayons pour l'opérateur produit CcZd déjà introduit une renormalisation pour les facteurs individuels. D'après (344), la dimension de l'interaction a été décalée de 2 à 2/(1+ g2/27r). Ceci doit être compris perturbativement en g 2 , et n'est justifié qu'a posteriori quand on se sera convaincu que seule la limite g2 -+ O présente un intérêt.
-
X.5.2
305
SYSTEMES DESORDONNES
Pour voir apparaître les divergences supplémentaires, il suffit d'examiner le développement perturbatif de la fonction E E . Nous pouvons effectuer ce calcul de deux manières différentes dont la comparaison est révélatrice. Ou bien nous utilisons la forme (344), le champ et le théorème de Wick, mais cela demande de distinguer entre composantes diagonales et non diagonales de Ou bien nous revenons à l'expression (338b), plus symétrique, impliquant le champ cp, et c'est seulement après avoir calculé le premier contreterme non trivial que nous éliminons les interactions diagonales. En effet, pour n # 1, la valeur de g 2 qui apparaît dans la correspondance entre
+
€a , ~ i - i / ( 1 + 9 ~ / 2 = ) , p
Ea = :
(345)
:
Avant de prendre la limite n O , les moyennes qui apparaissent sont ( E a ( x 1 ) E b ( x 2 ) )et il est plus simple d'écrire les règles de Feynman directement dans l'espace de configuration avec -f
(E"(Xl)Eb(X2))= s a b f ( x l- x 2 ) Prenons a
1 f ( x )= 2 1x1a2
(346)
# b et calculons les contributions successives
+... Le facteur ( n - 2 ) est typique des corrélations non diagonales comme on le voit sur l'équation (344). Une soustraction élimine la divergence supplémentaire, si nous posons
qui provient de l'intégrale divergente logarithmiquement
(347)
306
SYSTEMES DESORDONNES
X.5.2
A l’ordre dominant en g;,
Les deux contributions ont conspiré pour transformer le facteur n - 2 en n - 1 comme prévu. Par comparaison dans le cas des fonctions diagonales, un terme similaire (proportionnel à n - 1 cette fois) est compensé par des contretermes diagonaux supplémentaires dans l’action. Ces derniers sont nécessaires pour maintenir la valeur correcte de la constante de couplage dans la relation entre
Ainsi à l’ordre dominant, le flot de groupe de renormalisation au voisinage de g = O s’écrit A-g(A) d dA
G
P(g(A)) = -(n - 1)-g 3 ( N 2T
(350)
ce qui entraîne la liberté asymptotique ultraviolette pour n > 1. Pour n < 1, la conclusion est inversée. A grande distance la constante de couplage g effective décroît et la théorie de perturbation devient appropriée. Le coefficient de g5 dans p ( g ) est lui aussi universel. D’après Wetzel, on a
B ( 9 ) = -(n
-
(351)
et le terme en g5 s’annule égaiement pour n = 1.
La situation est similaire à celle de la théorie ‘p4 en quatre dimensions analysée au chapitre V: section 4.2. Nous pouvons adapter la discussion de cette section et en particulier l’équation (V.248)’ où l’on calcule la chaleur spécifique, c’est-à-dire l’intégrale de (338a). Le terme le plus singulier provient à nouveau de la pa,rtie inhomogène appelée b(g) au chapitre V. A l’ordre le plus bas, c’est une constante indépendante de g proportionnelle à la divergence logarithmique de l’intégrale d2x ( E ( x ) E ( O ) ) ~ relative au système pur. Le terme singulier de la chaleur spécifique noté r o , 2 au chapitre V sera désigné ici c(û,9).I1 s’écrit
où l est une échelle de longueur infrarouge, mesurée en unité de la maille a de réseau et choisie de manière à pouvoir négliger le terme homogène de (V.248). Cela signifie que à l’échelle l , la variable de température û ( l ) est d’ordre 8 0 , où ûo est finie. Or û ( l ) = û l à l’ordre le plus bas puisque v = 1
X.5.2
307
SYSTEMES DESORDONNES
pour le système pur, ce qui entraîne e N ûo/û. Pour calculer c ( û , g ) nous avons besoin de g ( l ) , solution de (350) pour n = O, ce qui nous donne
(353) et de la dimension anormale y2(g) qu’on peut tirer de la renormalisation multiplicative de l’opérateur E
(354) Ainsi, en remplaçant b ( g ) par b(0) nous obtenons
Les intégrations sont immédiates et on en tire cst
(356)
qui est le résultat surprenant, obtenu par Dotsenko et Dotsenko. I1 montre qu’il subsiste une singularité très faible en In In l / û , lorsque 6 devient exponentiellement petit, 8 5 exp-n/g2. Cet effet subtil ne peut être obtenu par un développement de faible désordre. L’observation directe de cette singularité donnerait une confirmation spectaculaire des méthodes de groupe de renormalisation. La version bosonique ne donne pas accès à la moyenne de la fonction de corrélation à deux spins. On peut pourtant montrer, en suivant Shankar et en utilisant des arguments de groupe de renormalisation analogues à ceux développés ci-dessous, que la moyenne du carré de cette fonction au point critique est de la forme
avec des corrections logarithmiques typiques d’une théorie asymptotiquement libre au comportement en 1~1-4 du système pur. Comme on a l’inégalité
ceci implique que
308
X.5.2
SYSTEMES DESORDONNES
L’équation (357) rappelle la propriété analogue du modèle X Y à l’extrémité de la ligne critique (IV.184),le rôle du désordre étant joué par les tourbillons. Cependant le facteur logarithmique qui apparaît dans le membre de droite de l’inégalité (358) pourrait disparaître dans un traitement plus approfondi. Le lecteur intéressé pourra analyser les moyennes des carrés des fonctions de corrélation de spin d’ordre plus élevé.
Appendice A : L a conductivité de Hall en tant qu’invariant topologique Nous décrirons dans cet appendice un argument dû à Laughlin sur la quantification de la constante de Hall pour un système à N corps en interaction couplés minimalement. Cet argument relie cette quantification à un invariant topologique. Nous suivrons la présentation due à Avron et Seiler. L’idée consiste à relier la topologie non triviale de l’appareil expérimental destiné à mesurer ou à produire le potentiel de Hall aux propriétés d’invariance de jauge et de périodicité des fonctions d’onde quand on fait varier les flux magnétiques par multiples du quantum cpo = h / e . La relation avec un invariant topologique implique une insensibilité à de petites variations dues à des impuretés ou défauts de toutes sortes, qui expliquerait la robustesse de l’effet observé. Considérons un hamiltonien à N corps Ho qui prend en compte le champ magnétique extérieur (intense et fixe), les interactions entre les particules et avec un fond (éventuellement aléatoire). Nous nous plaçons à basse température afin d’ignorer tout effet thermique, l’hypothèse essentielle étant que, en l’absence de courant et de voltage, le système est dans un état pur non dégénéré. Nous pouvons alors introduire une différence de potentiel Hall très faible et mesurer un courant dans le circuit principal comme l’indique la figure 6 . Le hamiltonien Ho inclut un potentiel vecteur A0 dont le rotationnel est le champ intense B (de circulation nulle autour de Cl et C2 comme indiqué sur la figure). Pour prendre en compte le générateur et obtenir une variable conjuguée du courant 12,nous ajoutons à A. un terme cp1Al ~ Z Atel Z que
+
donc tel que le potentiel total vérifie
(A.2a)
X.A
SYSTEMES DESORDONNES
309
-B
Figure 6 : L’appareillage de Hall, spires et sources comprises. On remplace ces dernières par des flux magnétiques variables. D’après les équations de Maxwell, si tromotrice dans la boucle (pl
-
hl
‘pl
varie, il apparaît une force élec-
dx.E = -Vi
(A.2b)
Le flux ‘pl est introduit adiabatiquement jusqu’à un régime linéaire correspondant à une valeur VI très faible. On a donc grossièrement (pl = -tVl, ou d’une manière plus correcte à des temps négatifs, (pl = -V1evt/q pour q tendant vers zéro. Si A désigne la somme A0 + p1Al + p2A2, un hamiltonien typique sera de la forme
H = P
1 h -2m ( - Vip
- eA(xp))’
+ V({x})
Si nous introduisons deux coupures pour rendre l’espace de phase connexe, Al et A2 peuvent être considérés dans une jauge convenable comme des gradients de fonctions ill et il2, telles que il, augmente d’une unité pour un tour de long de Ca. Dans ce domaine simplement connexe, nous pouvons, par une transformation de jauge, ramener A à A0 et H à H o , au prix d’écrire = exp[ie/hC((plill (p2h2)]$Io.La fonction d’onde $0 est discontinue et s’accroît d’un facteur exp[iecp,/h] quand x p traverse la coupure correspondante. Nous voyons alors que le problème est périodique lorsque les flux sont augmentés d’un quantum h/e, et HO (avec les conditions aux limites) définit un système de mécanique quantique doublement périodique dans les paramètres ( p l , 9 2 . Avant toute transformation de jauge, l’opérateur densité de courant est une somme
+
310
X.A
SYSTEMES DESORDONNES
J =e c v p= P
jp
v p= m
P
tL (;VP i
-eA(xp)
et
L'hypothèse de la théorie à un corps (correspondant à des particules indépendantes) qui consiste à dire que le niveau de Fermi est situé dans un intervalle entre deux niveaux de Landau est remplacée ici par celle que le système est dans un état pur non dégénéré I$) que nous supposerons normalisé. En conséquence
En exprimant A , comme le gradient de Ra et en tenant compte de la conservation du courant, il ne nous reste qu'une contribution de bord qui provient de la discontinuité de A,,
Ceci fournit une première justification pour l'introduction du flux 9 2 permettant de calculer le courant I2 comme une réponse. La fonction d'onde $ vérifie une équation de Schrodinger dépendant du temps, et en utilisant pl = -tVi par souci de simplicité, nous obtenons
d I$) = H(cp1, P2) I$> (A.5) 891 En dérivant cette équation par rapport à cp2, et en prenant le produit I$) scalaire avec le bra conjugué ($1, nous obtenons en remplaçant ($1 par I2 -inv1-
E
La conductivité de Hall définie par la relation 12
= aHV1
est alors donnée par une formule de type de Kubo, qui s'écrit
(A.6)
X.A
SYSTEMES DESORDONNES
311
Plutôt que de calculer les dérivées puis de prendre les limites Vi (et donc 9 2 tendant vers zéro, on convient de remplacer cette expression par sa moyenne sur les flux dans un intervalle [O, (pol. Cette moyenne est justifiée par la petitesse du quantum de Aux cpo devant les flux macroscopiques. Ceci nous permet d’utiliser une approximation adiabatique à l’ordre dominant pour Vi infinitésimal. Cette approximation entraîne que si $ est initialement vecteur propre du hamiltonien H fonction de (p, il le demeure (à une phase près bien entendu). I1 est naturel de prendre cet état comme étant l’état fondamental (normalisé) pl) et
H ( 9 i ’ 9 2 ) In((P1,’P2))
= E(cpl,(p2)Ifl((pl’(P2))
(A4
où la valeur propre est doublement périodique de période cpo. Ainsi dans l’équation (A.7)’ nous approximons le premier terme du membre de droite par d/d(p:, ($IHI+) N d/d(p2E((pl,cp2)dont la moyenne est nulle et nous identifions la conductivité de Hall avec l’expression
En utilisant une notation compacte pour la 2-forme intégrée sur le tore 7 dans l’espace des flux, on peut encore écrire
où P est le projecteur sur I$) approximé à l’ordre dominant par 1R)(RI, projecteur sur l’état fondamental. Ces deux projecteurs sont indépendants de la phase de cet état. Les propriétés physiques sont doublement périodiques dans les flux mais ce n’est pas le cas du hamiltonien, ni de l’état R. Par un accroissement de yo7 H est transformé en un opérateur équivalent à une transformation unitaire près. Pour y remédier, nous effectuons une transformation de jauge (unitaire) sur les états, qui revient à utiliser A, = VA, en introduisant des coupures dans l’espace physique. Ainsi, avec
(A.ll)
IO) =UIRo) le hamiltonien H devient Ho avec conditions aux limites périodiques dans La situation est similaire à celle de la physique des l’espace (p pour 1%).
312
SYSTEMES DESORDONNES
X.A
solides pour les ondes de Bloch dans un potentiel périodique, p jouant le rôle de quasi-impulsion. Nous avons alors P = UPoUt. Cette transformation affecte l’intégrand de l’équation (A.lO) par l’addition d’une dérivée totale qui ne contribue pas à l’intégrale. Comme POest maintenant périodique, cela montre que la définition de ( ( T H ) est raisonnable car périodique en p. I1 en résulte aussi, comme nous allons le voir, sous réserve de la validité de l’hypotèse de non-dégénérescence, que c’est un entier en unité de e 2 / h . Nous omettrons dorénavant l’indice zéro, étant entendu que P(p) est un projecteur régulier doublement périodique et de rang unité. Le théorème stipule que l’intégrale K = I2i7r /L T r d PP d P
(A.12)
est un invariant topologique de valeur entière. Un résultat classique de von Neumann et Wigner assure que la condition de croisement de deux niveaux est en général de codimension trois, c’est-à-dire qu’il faut au moins un espace à trois paramètres. A champ extérieur fixé, pl et p2 ne permettent donc pas de dégénérescence en général. Pour expliquer l’effet Hall fractionnaire, on devrait considérer un état dégénéré pour généraliser l’argument qui va suivre. Nous nous limiterons ici au cas de l’effet Hall entier et à l’hypothèse de non-dégénérescence. L’invariant K est analogue à certaines expressions qui apparaissent dans les théories de jauge et peut s’interpréter comme l’intégrale de la courbure d’un certain espace fibré. Pour conclure cet appendice, nous allons montrer que K est bien un entier. Considérons un lacet paramétrisé par la variable s dans l’espace des flux et introduisons l’équation d’évolution d
(A.13)
avec P ( s ) P ( p l ( s ) , p 2 ( s ) ) ,pa(s+ 1) = pa(s).Le membre de droite étant antihermitien, l’évolution le long de ce lacet est unitaire. Si P(O)lX(O)) = IX(O)), il en résulte que I X ( s ) ) demeure un vecteur propre de P de valeur propre unité. I1 en est de même pour l’espace orthogonal complémentaire correspondant à la valeur propre zéro. Sous ces hypothèses après un tour complet IX(1)) = e’C(r)lX(O)).La phase eit(r) est une phase dite de Berry introduite dans son étude des invariants adiabatiques. Pour la calculer, rappelons que le long du lacet P = 1O)(RI, où s2 est l’état fondamental de HO qui présente des discontinuités aux coupures. Par conséquent
En insérant cette relation dans l’équation (A.13)’ nous voyons que la projection (s2lX) vérifie
X.A
313
ÇYÇTEMEÇ DESORDONNES
(A.14) avec IX(O)), IX(1)) tous deux proportionnels à IR((pl(O), (p~(0))).Ainsi la phase est donnée par (A.15) Si on choisit maintenant y homotope au lacet trivial sur le tore 7, il définit deux régions Si et Sz. L’intégrale curviligne s’écrit alors de deux manières distinctes comme intégrale de surface. Grâce à l’hypothèse de nondégénérescence, on peut exprimer ces intégrales à l’aide du projecteur P
exp/(dRlR) = exp Y
/LI
Tr d P P d P = exp
/12
TrdPPdP
(A.16)
Si y est contracté en un point ainsi que Si, les deux premières intégrales se réduisent à l’unité, ce qui entraîne que K est un entier, comme on l’avait annoncé. On peut objecter à cette discussion que la définition de la conductivité de Hall n’implique pas nécessairement une moyenne. Mais ceci est compensé par la grande généralité de l’argument fondé uniquement sur la géométrie du dispositif et l’invariance de jauge en mécanique quantique. Finalement, mentionnons que les phases de Berry comme celle introduite plus haut apparaissent dans de nombreuses circonstances où intervient la topologie de l’espace des paramètres d’un système quantique (ou de tout système admettant un principe de superposition).
Notes La localisation des fonctions d’ondes due au désordre fait l’objet d’un papier classique de P.W. Anderson Phys. Rev. 109,1492 (1958). Le lecteur trouvera d’abondantes références aux travaux qui ont suivi dans le cours de D. Thouless publié dans l’ouvrage Ill Condensed Matter, Les Houches, R. Balian, R. Maynard et G. Toulouse éditeurs, North Holland (1979) et les articles de D. Thouless, E. Abrahams et F. Wegner dans Common Trends in Particle and Condensed Matter Physics. E. Brézin, J.-L. Gervais, et G . Toulouse éds. Phys. Reports 67 (1980). L’analyse du potentiel aléatoire gaussien est due à B. Halperin, Phys. Rev. A139, 104 (1965). Pour les problèmes de diffusion à une dimension on consultera l’article de revue de S. Alexander, J. Bernasconi, W.R. Schneider et R. Orbach, Rev. Mod. Phys. 53, 175 (1981). Un autre cas exactement
314
SYSTEMES DESORDONNES
X.Notes
soluble est traité par J.P. Bouchaud, A. Comtet, A. Georges, P. Le Doussal, Europhys. Lett. 3, 653 (1987). La méthode des répliques a été introduite par S.F. Edwards et P.W. Anderson, J. Phys. F5, 965 (1975). La supersymétrie qui apparaît lorsque l’on représente les jacobiens des sytèmes contraints par des intégrales de Grassmann fut d’abord observée dans les théories de jauge par C. Becchi, A. Rouet, et R. Stora. On en trouve un exposé dans Renormalization Theory, G. Vel0 et A.S. Wightman éditeurs, Reidel, Dordrecht (1976). L’étude du spectre des chaînes d’oscillateurs aléatoires est due à F.J. Dyson, Phys. Rev. 92, 1331 (1953) et D.J. Thouless, J. Phys. C5, 77 (1972). B. Derrida et R. Orbach, Phys. Rev. B27, 4694 (1983) discutent le développement à faible désordre. L’exemple présenté dans le texte est extrait d’un article écrit en collaboration avec E.J. Gardner and B. Derrida, J. Phys. A17, 1093 (1984). Pour une revue sur l’effet Hall quantique, voir K. von Klitzing, Rev. Mod. Phys. 58, 519 (1986) et The Quantum Hall Effect, R.E. Prange et S.M. Girvin éditeurs, Springer Verlag, New York (1987). Le calcul du spectre en champ magnétique intense en présence d’un potentiel aléatoire est dû à F . Wegner, 2. Phys. B51, 279 (1983). La généralisation présentée dans le texte est issue d’une collaboration avec E. Brézin et D. Gross, Nucl. Phys. B235 [FS 111, 24 (1984). La quantification de la conductivité Hall comme conséquence de l’invariance de jauge est discutée dans R.B. Laughlin, Phys. Rev. B23, 5632 (1981). Nous suivons dans l’appendice A l’argument dû à J.E. Avron et R. Seiler, Phys. Rev. Lett. 54, 259 (1985). C’est à M.V. Berry, Proc. Roy. Soc. London A392, 45 (1984) qu’on doit une étude des phases qui apparaissent parmi les invariants adiabatiques. Les ensembles de matrices aléatoires ont été introduits et étudiés par E.P. Wigner, F.J. Dyson, M.L. Mehta, M. Gaudin et d’autres auteurs. On trouvera une étude détaillée dans l’ouvrage de M.L. Mehta Random matrices and the statistical theory of energy levels, Academic Press, New York (1967). Pour l’utilisation dans ce contexte de variables anticommutantes, on consultera l’article d’E. Brézin dans les comptes rendus de la 8ème rencontre de Sitges, L. Garrido éditeur, Lecture Notes in Physics 216, 115, Springer, Berlin (1985). L’approximation planaire est due à G. ’t Hooft, Nucl. Phys. B72, 461 (1974) ibid, B75, 461 (1974). Les aspects algébriques ont été analysés par J. Koplik, A. Neveu et S. Nussinov, Nucl. Phys. B123, 109 (1977). Notre présentation s’inspire d’un travail en collaboration avec E. Brézin, G. Parisi et J.-B. Zuber, Comm. Math. Phys. 59, 35 (1978) ainsi qu’avec D. Bessis et J.-B. Zuber, Adv. in Appl. Math. 1, 109 (1980). Le comportement d’un système de spins en champ aléatoire est analysé par Y. Imry et S.K. Ma, Phys. Rev. Lett. 35, 1399 (1975). La réduction dimensionnelle et le rôle de la supersymétrie ont été démontrés par G. Parisi et N. Sourlas, Phys. Rev. Lett. 43, 744 (1979). K.B. Efetov, Adv. in Phys.
X.Notes
SYSTEMES DESORDONNES
315
32,53 (1983) passe en revue les applications des variables anticommutantes aux systèmes désordonnés. A.B. Harris, J. Phys. C7,1671 (1974) donne un critère caractérisant l’effet d’un faible désordre sur une transition continue. Vi.S. Dotsenko et VIS. Dotsenko Adv. in Phys. 32, 129 (1983) ont étudié le cas du modèle d’Ising bidimensionnel. Nous nous sommes inspirés du travail postérieur de R. Shankar, Phys. Rev. Lett. 58,2466 (1987). La théorie des champs sousjacente est due à D.J. Gross et A. Neveu, Phys. Rev. D10,3235 (1974). Pour la renormalisation à deux boucles de ce modèle, voir W. Wetzel, Phys. Lett. 153B,297 (1985).
CHAPITRE XI
GEOMETRIE ALEATOIRE
De nombreux modèles statistiques font intervenir des éléments géométriques aléatoires. On peut en citer des exemples empruntés à la théorie des liquides, des membranes, des polymères, des défauts dans les structures ordonnées, des microémulsions, des interfaces ... Les théories de jauge font intervenir des surfaces aléatoires, ainsi que les théories de champs fondées sur des objets étendus comme les cordes, et la théorie quantique de la gravitation nécessite une généralisation à des variétés de dimension supérieure. On a vu que la théorie quantique locale des champs a des liens étroits avec celle des chemins aléatoires. On peut alors se poser la question de trouver un modèle universel, généralisant celui des courbes browniennes, décrivant des variétés browniennes et en premier lieu des surfaces de ce type (Polyakov (1981)). Malgré de nombreux efforts en ce sens, on n’a pas obtenu à ce jour un tel archétype universel. Mais ce problème a suscité des études qui ont mis à jour des structures mathématiques très intéressantes. Nous nous bornerons ci-dessous à une présentation succincte du sujet. Dans la première section nous discutons les réseaux aléatoires dans l’espace euclidien. Christ, Friedberg et Lee (1982) ont suggéré que si on substituait de tels réseaux aux réseaux réguliers dans l’étude de divers modèles, la moyenne sur le désordre engendrerait une invariance de translation (et de rotation) continue, tout en préservant un facteur de coupure à courte distance. Le formalisme pourrait s’étendre à d’autres types de variétés mais nous ne nous y engagerons pas. Et nous nous abstiendrons de développer l’analyse des modèles standards sur de tels réseaux en observant que même la théorie des champs libres y soulève de délicats problèmes typiques des milieux désordonnés. Certaines des méthodes qui s’appliquent dans ce cadre peuvent être utiles dans l’étude des liquides ou des verres. La seconde section est consacrée aux surfaces aléatoires, à la fois dans un contexte discret ainsi que directement dans une version continue. C’est alors qu’apparaît la question de l’invariance par reparamétrisation, analogue à la covariance générale de la théorie de la gravitation. Nous nous heurtons alors à l’anomalie quantique correspondante qui a déjà été discutée à propos de l’invariance conforme au chapitre IX. Nous décrivons en détail le modèle continu de Polyakov, la dimension magique 26, ainsi qu’un analogue discret, relié comme on le verra à la théorie quantique planaire.
318
GEOMETRIE ALEATOIRE
XI.1
1. Réseaux aléatoires La géométrie aléatoire appartient à une tradition mathématique respectable, comme en témoigne le célèbre problème de l’aiguille de Buffon. On en trouve un exposé classique dans un ouvrage de Santal0 sous le nom de géométrie intégrale. Au début des années soixante, Berna1 envisage l’application des empilements aléatoires de sphères à la description des fonctions de structure des liquides. Ici nous présentons un sujet voisin, celui des réseaux poissoniens dont nous étudions les propriétés locales. Comme il a été mentionné ci-dessus, ces réseaux permettent de conserver un facteur de coupure ultraviolet tout en maintenant en apparence des invariances continues de translation et de rotation, en supposant que les quantités extensives possèdent une propriété d’“auto-moyennage” , terme barbare qui, comme en thermodynamique, implique qu’un grand système typique réalise, avec un poids égal, toutes les configurations locales possibles. La description de ces réseaux nous offre l’occasion d’introduire en termes élémentaires un certain nombre de concepts d’intérêt topologique et géométrique. En outre l’étude de modèle sur ces structures est une introduction naturelle à la théorie des champs sur un espace courbe quelconque, en ce sens que l’utilisation d’un réseau arbitraire est une analogue discret du choix d’un système quelconque de coordonnées en géométrie continue.
1.1 Réseaux poissonniens et statistique locale Choisissons N points au hasard de l’espace euclidien à d dimensions uniforme. Considérons la limite où N tendant vers l’espace tout entier) tout
N
-+
00,
R
-+
00,
indépendamment dans une région de volume R, avec une probabilité et R tendent vers l’infini (la région en maintenant la densité fixe
N/R
-+
p = a-d
(1)
La quantité a = p - l / d joue le rôle de longueur élémentaire. Nous utiliserons des unités telles que a = 1, donc p = 1 . Comme on l’a vu au chapitre X, si la dimension d est égale à 1, les points peuvent être ordonnés, de telle sorte que les intervalles C entre points successifs deviennent des variables indépendantes à la limite avec une distribution
Ceci justifie le nom de réseau poissonnien. Considérons le cas bidimensionnel. La généralisation en dimension plus élevée ne présentera pas de difficulté. La construction qui va suivre est due à Dirichlet et Voronoi. Associons à chaque point Mi du réseau la cellule Ci formée des points du plan dont la distance à Mi est inférieure ou égale à celle de tout autre point du réseau Mj,j # i. La cellule Ci est un polygone convexe fermé, comme intersection de demi-plans. Pous chaque paire i, j
XI.1.1
319
GEOMETRIE ALEATOIRE
l’intersection Ci n Cj est soit vide, soit un segment de la médiatrice du segment MiMj qui appartient à la frontière de Ci comme de Ci. Dans ce cas nous disons que la paire ( M i , M j ) est une paire de voisins. Nous appelons qi le nombre de coordination local, c’est-à-dire le nombre de voisins de Mi, ou encore le nombre de côtés de la cellule Ci. Si pour un triplet i # j # IC, l’intersection Ci n Cj n Ck est non vide, c’est un sommet de chacune des cellules correspondantes, centre du cercle circonscrit au triangle ( M i ,M j , M k ) que nous appelons 2-simplexe élémentaire comme le segment ( M i ,M j ) était un 1-simplexe élémentaire. Le plan est alors pavé de tels 2simplexes comme il était pavé de cellules Ci. Les deux ensembles sont en relation de dualité. Soit NO= N le nombre de points Mi, égal au nombre de cellules, Ni le nombre de liens entre voisins et N2 le nombre de 2-simplexes égal au nombre de sommets des cellules. Nous avons la relation d’Euler
No - Ni
+ N2 = x
(3)
où la caractéristique x (2 pour la sphère, O pour le tore...) n’est pas extensive, c’est-à-dire dans la limite de volume infini x / N -t O. En coupant le plan le long du bord des cellules nous obtenons NOmorceaux (les cellules) possédant 2Nl = C i q i arêtes et 3N2 sommets. Comme chaque cellule a autant de sommets que d’arêtes (ceci constituant la relation d’Euler à une dimension) nous trouvons
(4)
No=Cl i
De la sorte, si nous définissons le nombre de coordination moyen selon
les relations précédentes impliquent que
ni = 6
Ni lim - = 3
NO
N2
lim - = 2
NO
De manière équivalente, si na désigne le nombre moyen de a-simplexes q) incidents sur un O-simplexe (un point du réseau) (de sorte que ni on a n1
= 122 = 6
(7)
Le cas bidimensionnel a ceci de particulier que les relations ( 6 ) et (7) sont vérifiées localement pour le réseau triangulaire régulier. On peut
320
XI.1.1
GEOMETRIE ALEATOIRE
donc considérer de façon imagée qu’un réseau aléatoire bidimensionnel est équivalent topologiquement à un réseau triangulaire possédant des défauts. Ces derniers sont assimilés aux points où le nombre de coordination local diffère de six et sont porteurs de l’analogue d’une “charge” (le défaut à six) dont la somme totale est nulle en vertu des relations (6). Introduisons à présent des propriétés métriques. Nous utiliserons les notations
eij = distance entre les voisins ( M i ,Adj) C i jk
= aire du simplexe
(Mi, Adj ,Mk)
(eij) = el (lijk)
= .e2
De manière analogue nous posons
oi = aire de la cellule
Ci
(Ci)= ~2
oij = longueur de l’arête perpendiculaire au lien (ij) ( u i j ) = u1
La densité de points étant égale à l’unité par convention, nous avons u2 = 1
e,
=
(8)
Le calcul de e, et o1 est plus complexe et le type de raisonnement typique des problèmes de réseaux aléatoires. Désignons par (i, j , k) un 2-simplexe et soit O le sommet dual commun aux cellules Ci,Cj ,CI,.Le cercle I? de rayon R centré en O est circonscrit au triangle (z,j,k) (figure 1).Par construction, il ne peut y avoir d’autre point du réseau à l’intérieur de î , car pour C # i, j , k la distance lOMlI est supérieure ou égale à IOMil, IOMjl, and 1OMkI.
Figure 1: La construction de Dirichlet-Voronoi en dimension 2.
XI.1.1
GEOMETRIE ALEATOIRE
321
Etant donné un point A41 appartenant au réseau, la probabilité que deux autres points M2 et M3, situés dans les aires infinitésimales d2x2 et d223 respectivement, forment un simplexe élémentaire est donc d p = - 1x S ( N - l ) ( N - 2 ) ~ 722
où le facteur de normalisation nT1 intervient puisqu'il y a n 2 2-simplexes incidents en moyenne en un point donné, le terme !j(N - 1)(N- 2) compte le nombre de choix de paires parmi les N - 1 points restants, tandis que le dernier facteur exprime la probabilité que les N - 3 autres points appartiennent à l'extérieur du cercle r. A la limite N + CO' la densité de probabilité cherchée dp = L12e - 7 i R 2
d222d223
(9)
a une expression qui rappelle la distribution de Poisson (2). Utilisant pour paramètres le rayon R du cercle circonscrit et les angles polaires 91, 9 2 , 9 3 de OM1, OM2, OM3, tels que
vérifier que la densité de probabilité (9) est correctement normalisée
Pour obtenir e l , la distance moyenne entre voisins, nous calculons la moyenne de lM1M2[ = 2R lsin $ ( ( p a - pi)l avec pour poids dp, c'est-à-dire
avec pour résultat 32 9T
Ci = - =
1.1317684
322
XI.1.1
GEOMETRIE ALEATOIRE
(i) La procédure employée ci-dessus qui consiste à calculer le côté moyen d’un simplexe et à l’égaler à la distance moyenne entre voisins est justifiée par le fait que chaque lien appartient à deux simplexes et deux seulement. Ainsi on a
el
=-Ce.. -Ni 1
liens
2N1
eij
triangles T &,ES
=-3N2 x moyenne d’un côté d’un triangle 2Ni et 3N2/2N + 1. A trois dimensions le nombre de tétraèdres possédant une arête commune n’est pas une constante, de sorte que la moyenne d’une arête d’un tétraèdre n’est pas égale à la distance moyenne entre voisins. Le raisonnement précédent ne s’applique alors qu’au calcul de l’aire moyenne d’une face triangulaire. A défaut d’une autre méthode, les quantités dénotées ci-dessous t , i , en dimension arbitraire d seront en fait les moyennes des éléments correspondants d’un simplexe typique. (ii) La quantité e1 obtenue ci-dessus pour un réseau aléatoire est à comparer à la quantité correspondante d’un réseau triangulaire régulier de même densité, à savoir 2 3 3 - * = 1.0745699, montrant comme on s’y attendait qu’un réseau aléatoire est un peu plus lâche. (iii) A l’aide de la densité de probabilité (9) vérifier que e 2 est égal à $ comme il se doit, tandis que sa variance relative est relativement grande
Meijering a obtenu le périmètre moyen d’une cellule à l’aide d’un ingénieux raisonnement. Soit M un point du réseau. Attachons à tout autre point Mk la médiatrice A, du segment M M k . Le nombre de ces médiatrices à distance comprise entre r et r d r est égal au nombre de points Mk à distance comprise entre 2r et 2r 2dr, c’est-à-dire 8nrdr. La fraction de longueur d’une telle droite à distance comprise entre R et R t- d R est (R2 - r2)-i2RdR (figure 2). La longueur totale moyenne, candidate à appartenir à la frontière de la cellule à distance R à d R près, est obtenue en intégrant le produit de ces deux facteurs en r entre les bornes O et R, à savoir
+ +
167rRdR
1 dlT7 rdr
= 16rR2dR
Un élément de cette longueur appartient effectivement à la frontière de la cellule entourant M si le cercle de rayon R I centré sur l’élément de longueur (et passant donc par M) ne contient aucun point du réseau dans
XI.1.1
323
GEOMETRIE ALEATOIRE
M Figure 2 : Construction géométrique intervenant dans l'argument de Meijering.
Dimension du simplexe
Nombre
Nombre moyen incidents par site
O
No = N
no = 1
1
Ni = 3 N
2
N2
n1 = 6 122 = 6
= 2N
Taille moyenne
Taille moyenne (dual)
tl=g e2
=
+
u2 = 1 g 1 = -2
3
Table I : Moyennes locales pour un réseau aléatoire bidimensionnel de densité unité. son intérieur, ce qui a pour probabilité e-XR2.Donc la fraction du périmètre de la cellule à distance R à d R près est
16rR2ëRR2dR En intégrant sur R nous obtenons le périmètre moyen
P = i6r
1"
R2e-"R2dR = 4
(11)
Comme chaque cellule a en moyenne six côtés, nous trouvons 01
= 72j
(12)
à comparer avec la valeur 233-4 = 0.62204032 pour un réseau triangulaire régulier. La table I rassemble ces résultats sur les moyennes de quantités locales pour un réseau bidimensionnel.
324
GEOMETRIE ALEATOIRE
XI.1.1
I1 est possible d’écrire une expression analytique intégrale pour la probabilité p , de trouver une cellule à n côtés. Soit MO a l’origine du système de coordonnées l’un des points du réseau et Mi,. . ., M , de coordonnées XI, . . ., x,, ses voisins. Soit A l’aire de l’union des cercles centrés en Mi,. . ., M n i et passant par MO. Enfin notons x( M i , . . . , M,) une fonction caractéristique qui vaut 1 si les médiatrices des segments ( M o , M i ) engendrent un polygone convexe à n côtés et O autrement. Alors
En effectuant numériquement l’intégration on obtient les valeurs figurant dans n p , = 6 soit aussi la la table II. Bien que la valeur moyenne q = plus probable avec une fréquence approximative de trente pour cent, d’autres nombres de coordination apparaissent avec une fréquence appréciable. Pour n grand, p,, décroît très rapidement selon une loi de la forme nWali, où le coefficient a est compris entre 1 et 2. La figure 3 donne une représentation graphique de l’histogramme correspondant.
I
n
3 4 5 6 7 8 9 10 20 35 50
I
Pn
(1.127 f 0.008)10-2 (1.077 h O.OO1l)lO-l 0.258 I-t 0.002 0.294 zk 0.003 0.198 A= 0.003 0.090 0.020 (2.88 0.07)10-2 (6.95 f 0.20)10-3 (1.5 f 0.8)10-13 3.6.10-40 1.5.10-73
Table II : Distribution de probabilité p n d’observer une cellule à n côtés. On peut étudier encore la distance moyenne A, d’un point du réseau à la frontière de la cellule à n-côtés à laquelle il appartient, et l’aire moyenne A , de cette cellule. On constate que A , est approximativement linéaire en n, de in+constante, pour n grand, comme si la cellule croissait dans la forme A , un milieu “hostile”. Le rapport A,/Ai semble converger vers T , suggérant qu’à certains égards une très grande cellule se comporte comme un cercle. N
La construction de Dirichlet et Voronoi se généralise en dimension supérieure. Donnons quelques détails à trois dimensions. Soit NO = N le
XI.1.1
325
GEOMETRIE ALEATOIRE
3
1
5
6
7
8
9
1
0
n
Figure 3 : Histogramme représentant les probabilités p,. nombre de points, Ni d’arêtes, N2 de triangles et N3 de tétraèdres. La caractéristique d’Euler s’annule en dimension impaire, de sorte que No
-
Ni
+ N2
-
N3 = O
(14)
Chaque triangle est commun à deux tétraèdres, et il y a quatre triangles sur la frontière d’un tétraèdre, ce qui se traduit par
Si n, désigne comme précédemment le nombre moyen de simplexes de type u incidents en un point du réseau
Les propriétés topologiques à elles seules impliquent que
ne laissant subsister qu’une seule inconnue, 723 par exemple. La probabilité de trouver un tétraèdre avec un sommet Ml à l’origine des coordonnées et trois autres M2, M 3 , A44 en x2, x3, x4 à d3xi près s’écrit
où R désigne le rayon de la sphère circonscrite au tétraèdre. Ainsi
326
XI.1.1
GEOMETRIE ALEATOIRE
Pour évaluer cette intégrale on fait choix de variables d’intégration appropriées. Soit O le centre de la sphère circonscrite et u1, u2, us, u4 des vecteurs unitaires portés par OMl, OM2, OM3 et 0M4. Appelons R3w le volume du tétraèdre tel que
le signe étant choisi pour rendre w positif. Alors
n 4
1 d3xi = RawdRd2û~d2û2d2Û3d2û~ 3! 2 = 2
-
où d2û est la mesure sur la sphère. On trouve alors que n3
= 72n (w)
où (w)est la moyenne sphérique 4
(23)
i=l
Nous donnerons ci-dessous (équation (36)) la généralisation à d-dimensions de cette intégrale. Cette formule appliquée à d = 3 fournit n3
n1 = 2
I=
gr2= 27.0709.. .
+ gr2= 15.53546...
n2 = %a2 = 40.6064.. .
(24)
où nous avons utilisé l’équation (17). Une autre façon d’exprimer ce résultat est d’écrire dans la limite N + m N2/N =
48
2
Ni/N = 1
+ 24
2
(25)
Bien entendu ces fréquences ne correspondent à aucun réseau régulier. Le volume moyen d’un tétraèdre en unités naturelles est l’inverse de rapport N3/N, c’est-à-dire
XI.1.1
327
GEOMETRIE ALEATOIRE
De la densité de probabilité (18) on déduit l'aire moyenne d'un triangle
et la longueur moyenne d'une arête (avec les restrictions exposées ci-dessus)
En ce qui concerne le réseau dual ~3 = 1. L'argument de Meijering donne l'aire moyenne de la frontière d'une cellule sous la forme aire moyenne de la frontière = d'où il s'ensuit u2 en divisant par
(F)';r($)
= 5.821
(29)
n1
Ces données sont rassemblées dans la table III tandis que la table IV présente les résultats analogues en dimension quatre. Le nombre de coordination moyen croît très vite avec la dimension. I1 = 37.778 à quatre dimensions à comparer à la valeur 8 est déjà égal à pour un réseau hypercubique régulier.
y
Les calculs précédents sont déjà assez ardus. Très peu de résultats sont connus en dimension générique d. Donnonsen quelques-uns ci-dessous. que d
(i) Comme chaque (d - 1)-simplexe est commun à deux d-simplexes et 1 tels ( d - 1)-simplexes bordent un d-simplexe, on a
+
2Nd-i = (d $- 1)Nd
nd-1
= $dnd
(31)
La relation d'Euler appliquée à la frontière d'une cellule, homéomorphe à une sphère, s'exprime sous la forme
Plus généralement, si n k , m ( k > m , ( n k , o simplexes incidents sur un m-simplexe, on a
nk)
désigne le nombre de k-
d
(-1)k-m-I k=m+l
De manière équivalente, comme
nl;,m = 1 - (-1)
d-ni
(33)
328
al
x
d d al O
al
+
-E 2
-i
O l-l
vi
.3
z
42
fi O
8
P
n a,
CI CI
3
u..
3
3
M
E
z
v1
al
I?
3 3 .3
al
B i
.4
2fi
GEOMETRIE ALEATOIRE
cùm
XI.1.1
XI.1.1
GEOMETRIE ALEATOIRE
nk,m =
2
k=m
329
( k + l)! NI, ( k - m ) ! ( m l)! Nm
+
+
( k I)! ( - l ) d - k N k = Nm ( k - m ) ! ( m l)!
+
Le cas m = d est trivial. Les équations pour m = d - 1 et d - 2 donnent une information équivalente et ainsi de suite. Ainsi les équations (35) laissent subsister 2 d - 1 (d pair) ou $(d - 1) (d impair) inconnues parmi les quantités N I I N , . . ., N d / N . En dimension deux, les identités topologiques sont suffisantes pour calculer ces fréquences, en dimension trois et quatre il reste une inconnue, etc ... (ii) Passons au calcul de n d , le nombre moyen de d-simplexes incidents en un point. Généralisant l'expression (11) on obtient en général
où V est le volume de la sphère circonscrite au d-simplexe (xi = O,x2, . . . ,x,j+l) dont nous notons R le rayon. Ainsi V = d-l RdSd où Sd est l'aire de la sphère unité
Prenant l'origine au centre de la sphère avec û1,. . ., ûd+l des vecteurs unitaires le long de OM1, . . ., OMd+1 et Wd désignant la généralisation évidente de l'expression (20) relative au cas tridimensionnel, on trouve
où (wd)est la moyenne d'un déterminant (d
+ 1) x (d + 1)
+
Les indices a , p varient de O à d, A,o = 1 ûa . ûo, et l'intégration est sur des vecteurs unitaires à d 1 dimensions. Pour un simplexe régulier
+
ûa.ûo = 6 , ~- (1 -6,p)/d
et wreg = [d!dfd]
-1
(1 +d)i(l+d).Les extrémités
des d vecteurs û i , . . . , û d sont les sommets d'un (d - 1)-simplexe de volume A dans un hyperplan à une distance h de l'extrémité de ÛO et w = hA/d. Soit Û un vecteur unitaire le long de la normale à cet hyperplan avec deux orientations possibles. En général
(34)
(35)
330
GEOMETRJE ALEATOIRE
d
J
f ( c i ,..., Cd)fldd-'Ûk 1
=
J
XI.1.1
d
idd-'û(d-
i)!Afldd-lÛk 1
Posons Ûk = cosûkû +sin û k 9 k où Yk est un vecteur unitaire à ( d - 1) dimen~ Yarguments k. des sions orthogonal à 0 , et dd-'ûk = ~ i n û k - ~ d c o s û ~ d ~ -Les fonctions 6 sont cosûk - cos&, k 2 2, et contraignent Û a être orthogonal à tous les 9 k . Nous substituons f hA/d et observons que A = sinûd-lwd-1. Effectuant l'intégrale sur ûo, on a
où le dernier rapport provient de la moyenne sur la hauteur h. Ainsi
Développons le déterminant d x d comme une somme sur un produit de cycles et observons que chaque cycle donne une contribution factorisée. Utilisons les propriétés
On obtient
Groupons les termes ayant même décomposition cyclique. Soit aie 2 O le = d. Le nombre nombre de cycles de longueur e, de telle sorte que de partitions ayant cette décomposition cyclique est
Cela,
XI.1.1
331
GEOMETRIE ALEATOlRE
d!
n(=,
eatat!
et leur signature est (-l)p = (-l)Ee(e-l)af.
Ainsi
t
=coefficient de td dans
(1
+ t ) (1 + E)
d-1
-
1 (d - l)d-l
En combinant ces informations nous obtenons
En conséquence
Asymptotiquement pour d grand
2 1 1 -e4 ( 2 ~ d ) 2~ di
N
nd d-ca
(37)
Le volume moyen d'un d-simplexe est ed
d+1 =nd
Une généralisation des raisonnements présentés en basse dimension donne aussi "l'aire'' moyenne P de la frontière d'une cellule
p = 2d+l
'r d
(2 -
1) d
1 r(d-i)
2-1jd
[r ( i d + 111
En divisant par n d - 1 donné par les équations (31) et (36) nous obtenons la quantité e d - 1
(39)
332
GEOMETRIE ALEATOIRE
XI.1.1
Jusqu’ici nous n’avons étudié que des moyennes locales. Bien que les points du réseau soient choisis au hasard indépendamment, la construction de Dirichlet engendre des corrélations à grande distance, dont il serait intéressant d’obtenir une estimation. Ceci est un problème difficile dont on ne semble pas connaître la solution. Un sujet voisin concerne les empilements aléatoires, en particulier de sphères. Illustrons la puissance des arguments élémentaires de topologie combinatoire, analogues à ceux employés ci-dessus, en décrivant les cinq polyèdres réguliers tridimensionnels (encore appelés solides platoniciens). Un sous-groupe fini de rotations agit transitivement par des permutations des No sommets, N i arêtes et N2 faces, ce qui signifie que les éléments de chaque classe sont tous équivalents. Soit q le nombre de coordination, c’est-à-dire le nombre de sommets voisins d’un sommet donné et ïj le nombre d’arêtes de chaque face. Chaque arête est commune à deux faces et joint deux sommets et la caractéristique d’Euler x vaut 2, ce qui s’écrit
ou encore
Ceci eviraîne que (4 - q ) N o
+ (4 - ïj)N2 = 8, de sorte que q ou ïj est inférieur
à 4. Comme chacun d’eux est supérieur ou égal à 3 (sinon on ne peut avoir
de solide) on en déduit que les faces sont des triangles (6 = 3) ou que chaque sommet a trois voisins ( q = 3). Les relations précédentes impliquent en outre que (6 - q)No = 12 2(ïj - 3)N2, qui montre que q ne peut prendre que les valeurs 3,4 et 5 puisque le membre de droite est supérieur ou égal à 12. I1 en est de même pour 4.. Donc on a q = 3 et 4 = 3 , 4 , 5 ou 6 = 3 et q = 3 , 4 ou 5 avec une complète dualité. On tire encore des expressions ci-dessus la valeur de l’entier
+
Pour q = 3 et 6 = 3 , 4 , 5 (ou ïj = 3 et q = 3 , 4 , 5 ) on trouve respectivement N1 = 6, 12, 3 0 ; ceci conduit à la table suivante des cinq polyèdres réguliers. Dans la première colonne nous donnonS.la description des faces (correspondant à la valeur ïj pour le nombre de leurs côtés) et nous indiquons dans la dernière colonne l’ordre du groupe de rotations propres laissant le solide invariant et égal à 2N1 puisqu’il agit transitivement sur les arêtes orientées, comme on s’en assure aisément. Le lecteur peut-il étendre ces arguments en dimension plus grande?
XI.1.1
333
GEOMETRIE ALEATOIRE
Faces
4 triangles
-
-
Ni
N2
4
Ordre du - - groupe de rotations 6 4 12
3
6
12
8
24
4
8
12
6
24
3
12
30
20
60
5
20
30
12
60
-
-
ii
No
3
-
(Tétraèdre) 8 triangles
(Octaèdre)
6 carrés (Cube ou hexaèdre) 20 triangles (Icosaèdre) 12 pentagones (Dodécaèdre)
-
Table V : Polyèdres réguliers à trois dimensions. Si on ajoute à la liste précédente de groupes finis de rotations les deux séries infinies de groupes cycliques et diédraux, on retrouve la classification A-D-E, rencontrée dans la section 3-4 du chapitre IX.
1.2 Equations des champs discrétisées Nous voulons maintenant utiliser un réseau aléatoire pour y étudier un modèle statistique ou de théorie des champs faisant appel aux propriétés métriques associées aux points, aux liens ... En réalité nous avons obtenu deux réseaux. Le premier est un réseau simplicial L correspondant aux O, 1, 2, ... simplexes. Un @simplexe est un point i (et nous posons ti i),un 1-simplexe est un lien joignant deux voisins (ij) à la distance t i , = t j i et orthogonal à l’hyperplan de la face commune à deux cellules voisines, etc. dimensions. Nous Le réseau dual est constitué de cellules à d, d - 1, appelons i la cellule à d-dimensions à laquelle appartient i et notons oi son (hyper-) volume, ( i , j ) désigne ainsi la cellule à ( d - 1) dimensions duale du lien (ij) et commune aux cellules i et j , d’“aire” uij, et ainsi de suite. Nous définissons les O-formes comme les fonctions définies sur les sites, i + vi.De manière analogue FIest l’ensemble de 1-formes antisymétriques définies sur les liens orientés, cpij = -‘pji. En généralisant cette notion F2 est composé des 2-formes antisymétriques attachées aux 2-simplexes pijk = - p j i k - ... , et ainsi de suite. En parallèle soit Fd l’ensemble des d-densités, c’est-à-dire les fonctions $i associées aux cellules i supposées orientées. L’ensemble des (d- 1)-densités $ ; j , définies sur les (d- 1)-cellules orientées, constitue Fd-1,et a h s i de suite. Les orientations de la cellule (ij. . .) et du simplexe dual sont choisies de manière compatible, c’est-à-dire que leur produit est unité.
334
GEOMETRIE ALEATOIRE
XI. 1.2
Les formes cpi, cpij, c p i j k , . . . peuvent être considérées comme la restriction au réseau de champs scalaire, vectoriel, tensoriel, ... définis dans l’espace continu sous-jacent selon la correspondance
I1 existe une notion naturelle de dualité entre les espaces vectoriels 3pet Avec cp dans FP, $ dans F d - p , nous avons
Fd-p.
p=o p=l p=2
... Les factorielles en dénominateur compensent la multiplicité intervenant dans les sommes qui s’étendent sur les sites, les paires ordonnées de voisins, les triplets ordonnés de voisins, etc. On pourrait étendre cette dualité exprimée ici pour des quantités réelles en une forme sesquilinéaire pour des quantités complexes au prix d’une modification inessentielle. La dualité elle-même peut être transformée en une identification de la forme
e z j k ...p i j k
q i j k ...
(43)
... = a i j k ...
où l’on n’entend évidemment pas de sommation sur les indices répétés. Pour tout p, ceci entraîne entre les dimensions la relation
Le facteur dimensionnel est le volume d’une cellule pour p = O. Pour p = 1, c’est d fois la somme des volumes de deux pyramides de sommets i et j respectivement et de base aij, et ainsi de suite. Nous écrivons la correspondance (43) $ = (p ou cp = I).
XI.1.2
GEOMETRIE ALEATOIRE
335
Ceci nous permet de définir sur FP un terme de potentiel quadratique (ou terme de masse) de la forme
soit explicitement
p=o i
p=l p=2
... Pour construire un terme cinétique nous avons besoin des analogues discrets du gradient et de la divergence ainsi que leur généralisation. Pour ce faire, définissons l'opérateur d (l'analogue de la différentielle extérieure) comme une application linéaire de FP dans Fp+l (donnant zéro sur 3 d ) telle que
Evidemment le carré de cet opérateur est nul d2 = O tandis que d'après (42) son transformé
d applique Fp dans F p + l
(48) d'après
(49) Explicitement
336
XI.1.2
GEOMETRIE ALEATOIRE
et 22
(52)
=0
L’opérateur divergence d* s’obtient alors en ramenant d à agir sur les espaces 3pgrâce à la correspondance (43) d’après le diagramme commutatif dusté 3 P
d*
-
Fd-p
1 dueté 3p-1
1 Fd-pfl
0
(53)
Par exemple d* applique 3; dans 30. Nous partons de cpij et appliquons la correspondance (43) qui fournit +ij = @ i j = e i j u i j c p i j . Agissant avec d nous obtenons
et revenant à 3 0 ’ toujours grâce à la relation (43), nous trouvons
dont on voit que c’est bien l’analogue discret de la divergence. Par exemple on interprète aisément l’équation (54) comme la loi de Gauss qui égale le flux du champ électrique à l’intégrale de la densité de charge. On a encore d*2 = 0
-
(55)
et d* annihile 3 0 . On pourrait de même construire un opérateur d* lui aussi nilpotent. Nous sommes alors en mesure de définir un terme cinétique dans une action en écrivant
En particulier pour les scalaires et les vecteurs
XI.1.2
GEOMETRIE ALEATOIRE
337
Comme dans la théorie continue la dimension de K est
[KI = [pI2[ l ~ n g u e u r ] ~ - ~
(58)
Pour décrire des champs libres de masse nulle, nous utilisons le terme cinétique comme action. Les équations des champs classiques sont alors obtenues en considérant les extrema de K sous la forme 6K =
(.16p) = O
ce qui se traduit par d*dp = O
(59)
L’opérateur d*d a la dimension de l’inverse du carré d’une longueur et applique 3pdans Fp. Considérons d’abord le cas scalaire. Comme d*FO = O, nous pouvons remplacer d”d par (d*d + dd*) = (d + d * ) 2 = -A , où A est le laplacien agissant sur les scalaires, tel que
La quantité sans dimension positive
peut s’interpréter comme la probabilité d’effectuer un saut du site i à un site voisin j. Elle satisfait à Pj,i =
1
j
Ainsi
Montrer que les fonctions rpj
=a
+ k.xj
où k est un vecteur constant, sont harmoniques, c’est-à-dire qu’elles satisfont à
(64)
338
GEOMETRIE ALEATOIRE
XI.1.2
Lorsque p 2 1, les équations des champs (59) ne sont pas équivalentes à l’équation de Laplace, pas plus que les équations de Maxwell (qui correspondent au cas p = 1) pour le quadripotentiel n’entraînent que les composantes de ce dernier soient harmoniques, sauf choix de jauge particulier. I1 existe ici aussi une invariance de jauge de la forme p + p’ dp“. Ainsi pour p = 1, nous explicitons l’équation (59) sous la forme
+
Si on imagine que continu A,(x)
est la restriction au réseau d’un champ vectoriel
montrer que l’équation (66) s’interprète comme une version discrétisée des équations de Maxwell
OU
Fpu = a,Au - &A,. Dans le continu on a donc
Plus généralement le laplacien est défini pour tout tenseur antisymétrique dans la version discrète comme
-A = d*d
+ dd* = (d + d*)’
(67)
Ainsi -A s’exprime comme le carré d’un opérateur dit de Dirac-Kahler qui {
On a suggéré d’utiliser cette équation comme substitut à l’équation de Dirac sur un réseau, bien que les propriétés de transformation de @ ne correspondent pas à celle d’un spineur.
I1 est bien entendu possible d’étudier sur un réseau aléatoire d’autres types d’équations. On a par exemple envisagé une approche numérique des théories de jauge quadridimensionnelles sur de tels réseaux. La tâche apparaît formidable. Même les modèles bidimensionnels présentent de sérieuses
XI.1.2
GEOMETRIE ALEATOIRE
339
difficultés, qui proviennent en partie de l'interaction entre le désordre géométrique ou topologique et la dynamique intrinsèque. A priori deux échelles de longueur sont en compétition. En tout cas l'objectif est de comprendre comment les symétries continues sont approchées à grande échelle.
1.3 Spectre du laplacien L'exemple le plus simple de comparaison entre le comportement d'un système dynamique sur un réseau aléatoire ou régulier est fourni par l'étude du spectre du laplacien donné par les équations (60) et (63). Nous avons déjà discuté le cas unidimensionnel au chapitre X, section 1.4. Considérons maintenant quelques propriétés générales en dimension quelconque. Un obstacle majeur est qu'il n'est pas possible d'utiliser l'analyse de Fourier. Considérons un volume grand mais fini contenant N sites et soient qda) et w, les fonctions propres et valeurs propres du laplacien. Les fonctions propres sont normalisées selon
Une fonction arbitraire, telle que
admet un développement de la forme
a
tel que
a
Les fonctions p(") qui jouent ici le rôle des ondes planes et les valeurs propres wa demeurent des quantités stochastiques. Nous nous intéressons à leur valeur la plus probable ou plutôt à leur valeur moyenne. Lorsque le nombre de sites N tend vers l'infini, l'indice (Y prenant N valeurs, soit Np(w) le nombre de valeurs propres dans un intervalle dw autour de w . Par définition
Dans la limite thermodynamique à densité de points fixée, on s'attend à ce que p(w) tende vers la densité de valeurs propres la plus probable. Nous allons chercher à déterminer le comportement de p(w) dans les deux
340
GEOMETRIE ALEATOIRE
XI. 1.3
régions des faibles et des grandes valeurs de w . Lorsque w -+ O, si on peut approximer les fonctions propres par des ondes planes à grande échelle, on s’attend à ce que dwp(w) N ddk/(27r)d avec w = k 2 , c’est-à-dire
Pour se convaincre que cet te estimation est raisonnable, nous envisageons l’argument suivant. Etudions l’action du laplacien sur les fonctions cpi(k) = e x p i k . x i
(75)
Considérons les quantités locales
Pour k petit, wi(k) est d’ordre k2, d’après les équations (64) et (65). La quantité
s’interprète comme la valeur moyenne de l’opérateur (-A) dans l’état cp(k). Lorsque N --> 00, il n’existe pas de direction priviligiée dans le réseau, de sorte qu’il est légitime de prendre la moyenne de (77) sur les directions du vecteur d’onde k 00
1 r ( i d ) e2s-1 22s s! I?( i d s)
k2’ w(k) = X(-l)s-l-s=l
+
où la dernière moyenne signifie
et peut être évaluée à l’aide de la méthode de Meijering exposée à la section 1.1. Le résultat est que
2d dn 2
w(k) = --]LI’( 1 + i d ) 2 s=l
XI.1.3
GEOMETRIE ALEATOIRE
341
Cette expression compliquée se simplifie en dimension d = 1 ou 2 où elle se réduit à
où I o ( z )est la fonction de Bessel modifiée
-
Dans tous les cas w ( k ) se comporte comme k2 pour k petit. Ceci renforce la plausibilité de l’estimation (74). Le même calcul pour k2 quelconque nous permet aussi dedéduire une conclusion intéressante. En dimension 1 nous observons que w ( k ) n’est pas borné, ce qui prouve que le support -(w) n’est pas borné non plus. Cependant en dimension supérieure est borné lorsque k2 tend vers l’infini. Par exemple pour d = 2, w ( k ) + 27r( 1 - l / Ikl +. . En général, cette limite s’obtient en négligeant le terme oscillant dans la moyenne (76) e ) .
-
lim w ( k ) = 7rd k-ca
r ( 2 - 2/d)
+
[ï(l i d ) ]2’d
ce qui permet d’affirmer que le support spectral de -A s’étend au moins jusqu’à cette valeur. Pour w petit et en dimension assez grande, il est très vraisemblable que les fonctions propres sont étendues, avec probabilité unité. A l’autre extrême, pour w grand, nous nous attendons à des états localisés. Un argument très grossier, fondé sur cette hypothèse, fournit une estimation de p ( w ) pour w tendant vers l’infini. E,n considérant la forme du laplacien donné par (60) ou (63), on constate que ce sont les liens “faibles”, où la quantité u i j / C i j est très grande, qui jouent un rôle important pour localiser les fonctions d’onde. Imaginons que l’un de ces termes u i j / C i j est, de manière très improbable, exceptionnellement grand en raison du fait que les points i et j sont très voisins. Une approximation très violente consiste à supposer qu’il correspond à cette situation une fonction propre cp essentiellement concentrée sur les deux sites voisins i et j de telle sorte que
Ainsi
342
GEOMETRIE ALEATOIRE
XI.1.3
en supposant évidemment que le membre de droite est très grand (avec une très faible probabilité). Comme i et j sont très proches nous pouvons considérer à la limite que les deux cellules voisines constituent une partition d’une cellule unique C,par un plan médiateur d’un segment infinitésimal (ij) de longueur I!, la coupant en deux parties de volumes respectifs (T+et O-, et ayant à l’intérieur de C une aire (TO. Alors
w
- ($+ $) 1
?“O
(86b)
où p(C)d4 se comporte comme Sdtd-ldI!. Dans (86b)la moyenne est a la fois sur la cellule C et sur la distribution du plan médiateur. On trouve ainsi
I1 ne faut pas prendre trop au sérieux le coefficient numérique, mais la loi de décroissance en puissance est en accord avec la normalisation de p(w), équation (73)’ et est bien vérifiée lorsque d = 1. Bien entendu l’existence d’une telle queue de distribution est spécifique d’un réseau aléatoire et n’a pas d’analogue dans le cas d’un réseau régulier. L’argument précédent implique que son existence est due à la présence d’états localisés. I1 existe donc vraisemblablement un seuil de localisation w, dont la détermination n’est pas aisée sauf en dimension 1 où w, = O. On ne connaît même pas la dimension critique inférieure (peut être d = 2) telle que w, devienne positif. (i) Montrer qu’on déduit de l’équation (83) la règle de somme
lm [w
î ( 2 - 2/d)
dwp(w)w = a d
+ $41 2 / d
Ceci est infini pour d = 1 en raison d’une divergence logarithmique à w grand en accord avec l’estimation (87), et croît finalement comme d pour d grand en raison de la petitesse de p ( w ) pour w très petit ou w très grand. (ii) Obtenir l’inégalité
XI.1.3
GEOMETRIE ALEATOIRE
343
où q est le nombre de coordination moyen. Montrer que cette inégalité devient une égalité pour un réseau régulier. Comme q croît très rapidement avec d pour un réseau aléatoire et que p ( u ) tend à être très piqué, il est vraisemblable que (89) devient asymptotiquement une égalité.
2. Surfaces aléatoires Nous ne nous étendrons pas à nouveau sur les raisons qui justifient l’intérêt porté à l’étude des surfaces aléatoires. Comme nous l’avons déj à mentionné une formulation fondamentale suffisamment élémentaire fait toujours défaut. La présentation donnée ci-dessous sera donc nécessairement fragmentaire. Nous devons d’abord donner une définition appropriée du mot surface puisque cette notion implique divers degrés de structure internes et externes. En premier lieu, nous avons des propriétés topologiques comme la connexité, l’orientabilité, la classe caractéristique d’Euler, le nombre de frontières.. . La généralisation en dimension plus élevée entraînerait l’utilisation du langage des groupes d’homologie et de cohomologie si on fait en outre l’hypothèse d’une structure différentiable. Nous avons ensuite les propriétés métriques, le transport parallèle et la courbure associée ainsi que les généralisations à d’autres espaces fibrés et leur connexion. On peut aussi étudier des structures complexes. Au-delà des structures intrinsèques on peut encore envisager les plongements des surfaces dans d’autres variétés, en pratique surtout les espaces euclidiens (ou minkovskien). Un cas important est celui des interfaces, généralement dans R3 bien entendu. L’existence de frontières non triviales est un aspect important de la différence entre surfaces et courbes. Un exemple typique est le probleme de Plateau qui consiste à trouver les surfaces minimales bordées par une courbe donnée. Citons encore les problèmes posés par les boucles de Wilson dans les théories de jauge. Une autre question qui n’était pas mise au premier plan dans le cas des courbes, où elle aurait pourtant pu se poser, est celle de l’invariance par reparamétrisation, appelée encore covariance générale en théorie de la gravitation. Un problème associé est celui d’engendrer une surface selon un processus dynamique. Une courbe peut être considérée comme la trajectoire d’un point sans structure évoluant au cours du temps. Mais une surface est engendrée par une courbe (encore dite une corde) impliquant un nombre infini de degrés de liberté (d’où le nom de “théorie des champs de cordes” en usage courant dans la littérature anglo-saxonne. I1 est vrai que son équivalent en français a une résonance un peu étrange.) En résumé, le concept de surface ouvre un domaine très large de questions mathématiques et physiques. Nous entreprendrons cette étude par la considération des variétés bidimensionelles linéaires par morceaux, ou surfaces triangulées.
344
GEOMETRIE ALEATOIRE
XI.2.1
2.1 Surfaces triangulées Soit une assemblée de triangles euclidiens (donc équipés d’une métrique plate) et des relations d’incidence compatibles entre leurs côtés (avec identification correspondante des sommets). Ceci implique évidemment l’égalité des longueurs pour les côtés identifiés. Pour simplifier nous supposons l’assemblage obtenu, variété différentiable sauf peut-être aux sommets, connexe sans frontière et orientable. Sa topologie est alors décrite par la caractéristique d’Euler x = 2 - 2g où g (que nous notions par commodité H au chapitre X, section 4) est le genre ou nombre d’anses. Les relations d’incidences permettent de définir la notion de paires de voisins, arête ou lien, et celle de 2-simplexes (les triangles initiaux). La construction permet le calcul des distances. Si comme précédemment No, NI et N2 désignent les nombres de sommets, d’arêtes et de triangles (tous supposés finis), ils obéissent aux relations
en sorte que en termes de N
E
No et
x on a
No =N NI =3(N - x) N2 =2(N - x) Nous discuterons ci-dessous la question des triangulations inéquivalentes et leur poids statistique. Une façon pratique de procéder à la construction précédente est de choisir un modèle, ou espace des paramètres, fixe, surface triangulée connexe et orientable, d’appliquer ses N sommets dans l’espace euclidien Rd et d’interpoler linéairement entre les images des paires de voisins. Ceci produit dans l’espace cible une autre surface triangulée (peut-être avec des auto. intersections). De manière équivalente nous pouvons considérer que cette application engendre une autre métrique sur le modèle original. Par exemple nous pouvons partir d’une triangulation régulière d’une partie finie du plan euclidien avec identification des bords pour aboutir à un tore (g = 1) et considérer diverses applications dans Rd.I1 y a bien entendu de nombreuses autres façons d’engendrer des surfaces linéaires par morceaux, par exemple celles rencontrées au chapitre VI dans l’étude des champs de jauge, comme collections de plaquettes d’un réseau régulier avec des règles d’assemblage définies. Les triangles sont euclidiens, de sorte que leurs angles intérieurs 81, Ba, O3 ont pour somme T. Pour chaque triangle nous avons donc 1 = (8, 6%-tû 3 ) / r , avec chaque angle 8 compris entre O et 7ii. En prenant la somme de l’unité sur tous les triangles nous obtenons N2, mais nous pouvons en substituant l’identité précédente proceder à cette somme en deux temps, à savoir pour chaque sommet faire la somme des angles 8 relatifs
+
XI.2.1
345
GEOMETRI E ALE A’ïOI R E
aux triangles incidents sur ce sommet (appelons-la 6&)’puis dans un second temps faire la somme sur les sommets. Ainsi 1V;L = C,8,/n. D’après (90) ceci est encore égal à 2N - 2x = -2x + 2Cz1. L’identification produit la relation
qui est la version discrète de la formule de Gauss-nonnet en termes des angles de défaut 2n - 6. Lorsque l’angle de défaut s’annule à un sommet, les triangles incidents peuvent être assemblés dans l’espace plan et le terme correspondant ne contribue pas à x. On a donc l’interprétation suivante : angle de défaut frustration par rapport à une situation plane e courbure. Une courbure positive correspond à un angle de défaut positif (6i < 23~)’ une courbure négative à un angle de défaut négatif (2n < 6i) et a une “surabondance” de matière localement. Ceci s’interprète bien dans l’exemple d’une sphère de rayon T et de , produit des inverses des rayons principaux, tous les deux courbure R = l / ~ ’ le ogaux & T dans ce cas. Pour un triangle sphérique d’angles intérieurs 0 1 , a’, ~ 3 l’aire A est donnée par R A = (a1 +a:!t a 3 - 7r). L’angle total dont tourne un vecteur tangent dans une circumnavigation autour d i i triangle (en arrondissant les angles au sommet) est 19 = (7r - ai) ( T - a 2 ) (7r - a ~ =) 27r - R A , soit RA = 2.rr - 6’ l’angle de défaut total. S u r la surface triarigulée la courbure est concentrée aux sommets avec R A tendant vers une limite finie lorsque A tend vers zéro, de sorte que R tend à avoir une singularité en fonction 6 aux sommets. Avec la normalisation précédente (qui peut différer dc celle employée dans d’autres textes) il s’ensuit que la formule de Gauss-Bonnet s’écrit
+
,
+
dans ia version continue, avec x = 2 pour une sphkre ou R = T-’
et A = ~
T
T
~
.
Dans le cas des surfaces la courburc cst une quantité scalaire. Dans la version (91) il y a une dissymétrie entre courbure positive (l’angle de déficit étant majoré par 2n avec B = O) et courbure négative qui n’est pas bornée inférieurement (6 prenant des valeurs aussi grandes qu’on le veut). On peut se proposer d’étudier la généralisation a u x variétés linéaires par morceaux de dimension plus grande que deux, o ù des simplexes à d dimension remplacent les triangles. La caractéristique d’lluler x = No - N i N z - N3+. . . demeure un invariant topologique. i
+
+
+
-
+
-
346
<:ISOkiI
XI.2.1
outre les régions où 15:s simplexes s’assemblent sans frustration dans l’espace euclidien ne donnent aucune contribution à x, comme c’était le cas lorsque d = 2. Ce problème n’est dans l’état des choses que partiellement résolu. Considérons un p-simplexe de la triangulation incident en un sommet donné et arrondissons l’“angle solide” correspondant jusqu’à lui faire épouser une forme sphPrique occupant une fraction p ( P ) de l’“aire” de la sphère unité notée ici Sp-i (c’est-à-dire à ( p - 1) dimensions dans un espace y dimensionnel). Le cas d’un simplexe unidimensionnel (p = l ) , un lien, correspond à la sphère So, réduite à deux points. On convient alors de prendre p(’) = $. Pour un sommet ( p = O ) on choisit p(O) = 1. Si on fait la somme des p ( P ) sur les p 1 sommets du psimplexe on obtient l’unité. La somme de qu’on peut écrire, en sommant d’abord les l’unité sur les ysimplexes est A’,,, p ( p ) relatifs à ctiaque sommet, somme qu’on note p:’)
+
puis sur les sorrirnets i
D’ou l’expressioii de la c;ir;ictéristique d’Euler d
=
7X ( - l ) p p , ( p ) I
,=O
Lorsque d = 2 nous retrouvons la formule (91), mais en dimension plus élevée, cette expression ne permet pas de voir que les régions plates ne donnent aucune contribution. I1 est possible de réexprimer (93) en termes des angles intérieurs, mais en tout cas la relation avec une intégrale d’une forme définie à l’aide du tenseur de courbure n’est pas apparente (Cheeger, Müller et Schrader). Nous notons aussi ici que Regge a donné une forme discrète pour l’action quadri-dimensionnelle de Hilbert-Einstein pour la gravitation. Dans le cas d’un complexe simplicial tel que ceux envisagés ci-dessus cette expression prend la forme
généralisant l’équation (92). La somme porte s u r les 2-simplexes (des triangles) d’aire a2 et O est la somme des “angles diédraux” des quadri-simplexes s’articulant s u r le triangle en question. I1 faut une analyse fine (Feinberg, Friedberg, Lee et Ren) pour se convaincre que par passage à la limite continue on obtient à un facteur prhs l’expression classique
(93)
XI.2.1
GEOM ETRI E A L EA'I'OIRE
347
Revenant aux surfaces triangulées, équipées de leurs propriétés métriques, nous pouvons aisément généraliser les équations de champs développées dans le cadre des réseaux aléatoires. Dans la suite nous nous bornerons pour l'essentiel aux champs libres de masse nulle. Si la surface était différentiable, décrite localement à l'aide de paramètres a' et < y 2 et d'une métrique définie positive gab(a) telle que g = det g a b , et gab l'inverse de gab, nous écririons l'action sous la forme invariante
s=
J
d2fffiigab(ff)8npdbp
(94)
Nous supposons pour simplifier que la surface est sans bord, et observons qu'en général il est nécessaire d'introduire un recouvrement par plusieurs ouverts portant les systèmes de coordonnées indiqüés afin d'obtenir l'expression de l'intégrale ci-dessus. Si au lieu de prendre des valeurs dans R, 'p décrit une application de la surface dans une variété riemannienne ddimensionnelle M , possédant des coordonnées locales pp et une métrique GFu('p), on écrit l'action sous la forme
décrivant un modèle (T de type général. Dans le cas particulier où M coïncide avec l'espace euclidien Rd,muni de la métrique Gpu('p)= bWu7l'action (95) se ramène à la somme de d copies de l'action scalaire (94). Considérons d'abord l'action à une composante et étendons sa définition à une surface triangulée, linéaire par morceaux. Sur chaque triangle ayant des sommets de coordonnées x1 x2,x3 introduisons des coordonnées barycent riques
Si cp prend la valeur
'pi. aux
sommets nous le prolongeons par linéarité selon
q ( a )= ct 1$01
+
+ a"'p3
(97)
définissant ainsi une extension harmonique naturelle à l'intérieur du triangle. Calculant alors l'action (94) comme une somme sur les triangles, nous trouvons
Sdiscret
=
['pZ(x3 - xk)
+ v,(xk
+
- x,) cp~(x, - xl)la/ l Z 3 k
(98)
(vk)
La somme porte sur les triangles d'aire par la formule
e,,,
reliée & la longueur des côtés
348
GEOMETRIE ALEATOIRE
XI.2.1
L’action est invariante par les translations, rotations et accroissements constants du champ. Dans la suite nous omettrons le suffixe discret, le contexte permettant de reconnaître quand il s’agit de surfaces triangulées. En dépit du fait que la notion de dualité semble faire défaut a priori, il est possible de donner à l’expression (98) une forme semblable à celle obtenue dans le cas d’un réseau aléatoire plan (équation (57a)). Les quantités e, = 1, e13,et P2:k ont des définitions évidentes, la seconde étant la longueur du côté (23) et la troisième l’aire du triangle ( i j l c ) comme ci-dessus. Définissons mp3k = 1,O,], O,, correspondant à un réseau dual virtuel de la façon suivante. Considérons un triangle particulier et notons le (1,2,3) avec pour angles intérieurs aux sommets 81,&,û3 compris entre O et 7r. La contribution correspondante à l’action (98) est alors
Les coefficients sont algébriques mais par construction la somme est positive. Soit p le rayon du cercle de centre O circonscrit au triangle. Nous avons
Figure 4 : Construction des quantités duales.
où pcosûi est la distance algébrique de O au côté jlc (positif si i et O sont du même côté de la corde (jlc)). Seuls deux triangles (2321) et (2392) possèdent , en commun le côté (23). Nous définissons alors la quantité algébrique ~ 2 3 la
XI.2.1
349
GEOMETRIE ALEATOIRE
longueur du lien virtuel dual à (23), comme la somme des quantités p l cosBi, et p2 cos Bi, relatives à ces deux triangles uij
= p i cos Bii
+ p z cos Bi,
(101)
En conséquence le coefficient de (pi - ( ~ jdans ) ~ l'action peut s'écrire $ u ; j / e i j . Ceci est bien en accord avec la définition dans le cas d'un réseau plan et produit l'expression
La positivité de l'action entraîne l'inégalité
I1 reste à définir les quantités ui, aires des cellules i virtuelles, qui ont à . . - A , où A est l'aire totale. Un satisfaire à l'identité ci'i = c ( i j k ) e1Jk choix naturel vérifiant cette condition est le suivant
j(i)
qui se réduit dans le cas plan à l'aire de la cellule de Dirichlet Voronoi. Dans le contexte présent certains des ui peuvent cependant être négatifs. On observera des côtés que la construction est bien définie si on connaît les longueurs des triangles. Donc tout ce qui est requis est la donnée des triangles possédant une métrique et des relations d'incidence entre côtés, indépendamment de tout plongement global. Ayant ainsi défini les quantités e et O il est possible d'étendre la définition des opérateurs d et d' donnée aux équations (47), (53) et (54) avec la restriction évidente qu'on a affaire à des variétés à deux dimensions. Ainsi
(104a) et
(104b)
Le laplacien scalaire s'écrit
350
XI.2.1
GEOMETRIE ALEATOIRE
I1 nous permet en l’absence de termes de bord de récrire les équations (98) et (102) sous la forme
i
Sur une surface compacte connexe, l’action est positive et finie dès lors que ‘p n’est pas une constante, comme il résulte immédiatement de (98). Ceci entraîne que les seules fonctions harmoniques sont des constantes et -A est un opérateur non négatif. Pour des champs pseudo-scalaires, l’action, analogue mais distincte de (102), est
où ( i j k i ) et ( i j k p ) sont les deux triangles qui ont en commun le côté (ij). Au moins dans le cas où tous les uij sont positifs, la surface étant orientable, la seule fonction pseudo-scalaire harmonique est un multiple constant de q i j k , le tenseur totalement antisymétrique d’orientation prenant des valeurs f l sur chaque triangle. Pour les champs vectoriels, montrons que I’harmonicité est équivalente à l’annulation simultanée du rotationnel et de la divergence [(dd’
+ d*d)’plij = O * { (d‘p)ijk = O , (d*’p)i = O }
(108)
En effet si ‘pij est harmonique, +i = (d*
+
la dernière égalité résultant de I’antisymétrie
4
où la dernière égalité résulte de l’addition des deux contributions relatives à un terme yoij. Ainsi = O et l’équivalence (108) est démontrée. Le dénombrement des champs vectoriels harmoniques linéairement indépendants donne une relation topologique classique. I1 y a a priori N i composantes linéairement indépendantes. (108) implique ( N o - 1) ( N z - 1) condiui(d*cp)i = O . II n’y a donc tions puisque eijkqijk(d’p)ijk = O et
4
ci
+
XI.2.1
35 1
GEOMETRIE ALEATOIRE
+
que Ni - NO - N2 2 = 2 - x = 2 9 champs de vecteurs harmoniques linéairement indépendants. Rappelons que le même résultat s’applique dans le cas continu et que lorsqu’on s’est donné en plus une structure complexe, ceci correspond à l’existence de g champs de vecteurs holomorphes ou de mai nière équivalente à l’existence de g différentielles abéliennes de première espèce (c’est-à-dire holomorphes).
2.2 Anomalie conforme et action de Liouville Etant donné une surface compacte, connexe, sans bord, avec sa structure métrique, nous voulons passer de la théorie des champs classiques de masse nulle à sa version quantique. Ceci revient à utiliser dans le cas discret l’exponentielle de l’action scalaire (102) comme poids de Boltzmann dans une intégrale de chemin sur le champ ‘pi. Pour l’instant nous supposons la géométrie donnée et telle que la surface soit suffisamment régulière pour que les quantités (T soient toutes positives. Nous allons définir l’intégrale gaussienne de telle sorte que le résultat de l’intégration soit proportionnel à la quantité [det’( -A)] -1’2 où le prime implique l’omission du mode nul, ce qui équivaut à évaluer le déterminant dans l’espace orthogonal au sous-espace unidimensionnel des champs constants relativement à la norme carrée Ciui’ps.I1 est entendu que les valeurs ‘pi sont réelles. Pour une surface triangulée par un nombre fini de triangles l’opérateur -A est représentable par une matrice N x N , avec N = NO le nombre de sommets. Soient E l , ..., EN-^ les valeurs propres positives de -A et EO = O l’unique valeur propre nulle correspondant à ‘p = Cste. L’ensemble correspondant de fonctions propres orthonormalisées est noté ‘p(O), ‘p(l), . . ., cp(N-l). Si on développe cp sur cette base (n)
Pi =
CnVi
(110)
O<_n<_N-l
on vérifie que
Nous définissons la fonction de partition Z selon
z=
1
[det’( -A)]
-
1 (nr-1E,)
Les fonctions propres réelles normalisées satisfont à
li
352
GEOMETRIE ALEATOIRE
XI.2.2
(113) i
Les ai étant positifs il s'ensuit que
O
\ O
/
i
et
On peut alors récrire la définition (112) sous forme de l'intégrale
intégrale qui pourrait être aisément généralisée pour inclure un terme de source de la forme Ci J,cpi OU Ci aijivi. On ne peut guère espérer aller plus loin dans le cas d'une surface triangulée tout au moins lorsqu'il s'agit d'expressions exactes. Cependant si on fait l'hypothèse, peut-être un peu optimiste, qu'au prix d'une renormalisation, l'intégrale discrète est une approximation valable d'une théorie continue sur une surface régulière, avec une action de type (94)'il est possible d'obtenir des informations plus intéressantes. En effet dans le cadre continu nous observons que l'absence de terme de masse implique dans le cas classique que l'action possède une invariance conforme, en ce sens que la combinaison f i g a b reste invariante si on effectue un changement d'échelle local de la forme gab((Y) --f p 2 ( a ) g a b ( a ) .Le facteur qui affecte localement les longueurs est donc p(a). Bien que cette invariance soit vérifiée au niveau classique, elle est brisée au niveau quantique et conduit à l'anomalie conforme amplement discutée dans le cadre du chapitre IX. A deux dimensions, il est toujours possible dans le voisinage d'un point, homéomorphe à l'intérieur d'un disque, de trouver un choix de coordonnées tel qu'une métrique arbitraire prenne la forme
Par exemple, sur l'hémisphère nord d'une sphère de rayon r, une projection stéréographique produit pour le carré de l'élément de longueur
XI.2.2
GEOMETRIE ALEATOIRE
353
Dans un tel voisinage, les coordonnées elles-mêmes sont des fonctions harmoniques comme dans le cas plan (d’où le nom de coordonnées thermiques parfois employé par référence à l’équation de la chaleur qui se réduit à l’équation de Laplace dans le cas statique). La courbure R (= T-’ pour la sphère) est donnée Par
où A est le laplacien dans l’espace courbe et A0 le laplacien dans l’espace plat relatif à gab’ G 6ab. Si dans chaque ouvert de coordonnées on utilise des coordonnées thermiques, le facteur p disparaît dans l’expression de l’action, mais pas dans celle du laplacien, évidemment.
Dans le cas continu et pour une surface compacte, le spectre du laplacien est discret et l’on peut toujours utiliser un développement du type (110) mais s’étendant cependant à un ensemble infini dénombrable de fonctions propres. L’expression de la fonction de partition, (det’ - A ) - + , requiert alors des soustractions. Si nous les ignorons dans un premier temps nous pouvons écrire formellement pour une variation de l’énergie libre
Le mode nul est toujours donné par l’équation (115). Portons notre attention sur une variation relative à un changement conforme infinitésimal de la forme gab + (1 26&)g,bi où 6~varie de point à point. Ceci induit une variation des valeurs propres et des fonctions propres et pour un champ ~ ( adonné, ) une variation des composantes C, de son développement. Par hypothèse, la quantité EnCi est cependant invariante en raison de l’invariance conforme de l’action. Ainsi dans l’expression (120) la variation ne provient que du jacobien de la transformation Cn -+ Cn 6Cn. Comme on a omis le mode nul, on obtient
+
+
bin2 = L’invariance du champ
Comme
nous avons
‘p
( (Cabc, -)) asco ac, aco Oo
--
entraîne que
354
GEOMETRIE ALEATOIRE
XI.2.2
et
Ainsi on obtient
La moyenne gaussienne qui intervenait dans l'équation (121) a disparu, la variation étant indépendante des variables d'intégration. Cependant la quantité E=," [p(n)]2 est infinie en raison de la présence d'un nombre infini de modes, lié à l'emploi de la théorie continue. I1 s'agit là d'une divergence ultraviolette. Au lieu d'employer ici la régularisation nous utiliserons un 2 procédé équivalent qui consiste à substituer à [p(n)(a)]le noyau de la chaleur à points coïncidents U ( s ;a , a )
E=,"
Cette méthode a été suggérée par Fujikawa dans de nombreuses circonstances similaires. En général le noyau de la chaleur est symétrique, de la forme
La distribution invariante 6 satisfait à
Ainsi nous avons
XI.2.2
355
GEOMETRJE ALEATOIRE
et nous nous intéressons au comportement à s petit. Nous nous attendons à trouver des termes singuliers proportionnels à s-l dans ce cas bidimensionnel sans frontière (en présence d’une frontière on s’attend à une contribution supplémentaire en s-*) qu’il faudra soustraire pour obtenir la partie finie cherchée. Dans l’espace euclidien
et Ueuclidieii(S;a , a ) = 1/(4ns) indépendamment de a , en raison de l’invariance par translation. Dans un espace courbe, si R(a)désigne la courbure, l’analyse dimensionnelle suggère une expression de la forme
puisque s a pour dimension une longueur au carré et R l’inverse d’une longueur au carré de sorte que X doit être une constante universelle. I1 suffit donc de connaître l’expression du noyau de la chaleur pour une variété courbe quelconque, une sphère de rayon T par exemple, pour en déduire la valeur de la constante A. Utilisant la métrique (118) sur une sphère au voisinage du point de coordonnées cy1 = cy2 = O , on en déduit aisément le noyau de la chaleur dans ce cas
Donc 1 Ucourbe(S;0,CY) = - [I 4-iR(a)S 44TS
*
*]
(129)
Pour une métrique localement de la forme (117), il résulte de l’équation (119) que
356
GEOMETRIE ALEATOIRE
XI.2.2
Pour ce choix de métrique, nous avons g = p4, et donc aôg/g = ôlnp. En portant ces expressions dans la forme régularisée (126)’ nous obtenons en négligeant les termes qui s’annulent avec s,
- i l n -A
A0
+ -/d2ap21np(-Alnp)] l 2 4 ~
(131)
Le développement à temps court (129) du noyau de la chaleur peut être généralisé au cas où les points sont très voisins, sans nécessairement coïncider, sous la forme
où d a o est la distance géodésique de a: à B. Le facteur (47rs)-l s’interprète dans le cas plat comme l’inverse de l’aire d’un cercle de rayon retf = 2 6 . Ceci est en accord avec le fait que U est une densité de probabilité pour un mouvement brownien. Sur une surface courbe (courbure R), un cercle de même I rayon infinitésimal a pour aire aR-’2(1 - cosû) où û = R2ren = 2R3&, soit une aire 4as (1 - !jRs + . . .) . Ceci donne l’interprétation de la correction dominante dans l’équation (129). Le lecteur peut-il généraliser cet argument (i) pour inclure la seconde correction dans l’équation (132) (ii) pour étendre la formule à une variété à d dimensions.
Le terme infini, proportionnel à s-l dans l’équation (131)’ doit être renormalisé et remplacé par un terme fini avec un coefficient arbitraire de dimension [ l ~ n g u e u r l -. ~Le moyen le plus sûr de rendre l’argument plausible est de confiner la variation infinitésimale d’échelle à un domaine à support compact relatif à un ouvert de coordonnées. I1 faut être prudent dans le maniement des expressions obtenues cidessus, qui doivent être utilisées en tenant compte correctement des conditions aux limites. Par exemple en enlevant un point à une sphère, considérons le système de coordonnées correspondant à l’élément de longueur (118). Bien que l’intégrale suivante
sn2
d2a:p21np(-Alnp) E
sn2
d2aInp(-Aolnp)
soit finie, celle qu’on déduirait d’une intégration par parties
ne l’est pas. En général comme -A In p = R, il est clair que si l’intégrale de R n’est pas nulle, c’est-à-dire si la caractéristique d’Euler n’est pas nulle, il résulte de
XI.2.2
357
GEOMETRIE ALEATOIRE
1 x=2n
1
d2ap2R
(133)
que la quantité In p possède nécessairement des singularités. Pour éviter cette difficulté on pourrait se restreindre à la topologie d'un tore (x = O) qui admet bien une métrique euclidienne.
La conclusion est donc que l'invariance conforme classique de la théorie des champs libres de masse nulle ne peut être maintenue au niveau quantique. Dans ce cas l'énergie libre normalisée dépend du facteur d'échelle local sous la forme valable pour une surface compacte d2ap2 [In p( -A In p )
+ p2]
(134)
Nous avons introduit une aire arbitraire A0 pour rendre 2 sans dimension, et une échelle de masse p elle aussi arbitraire tenant compte du fait que J d 2 a p 2 = A. Le second terme du membre de droite de l'équation (134) est appelé l'action de Liouville, et le résultat précédent est dû à Polyakov (1981). Le terme indépendant de l'échelle p peut lui aussi nécessiter une renormalisation. Nous y reviendrons par la suite. L'équation (134) se traduit par une anomalie relativement à l'invariance d'échelle de la forme
où dA = d 2 a& est l'élément d'aire infinitésimal invariant, et la métrique est transformée selon gab -+ e26*g,b. On peut encore donner de l'action de Liouville une expression équivalente obtenue de la façon suivante. Soit G(a,P) la fonction de Green soustraite sur la surface
A l'aide de cette définition on a
Si pour simplifier nous supposons que ?I s'annule,
011a
alors
358
GEOMETRIE ALEATOIRE
XI.2.2
Cette expression se prête à une discrétisation simple (toujours pour
x
= O ) . Le second terme est proportionnel à l’aire. Quant au premier nous
procédons à l’identification d A R - + q i = (I-$) de sorte que telle que
(139)
ci
qi = O . Définissons une fonction de Green discrète massive
Alors le premier terme du membre de droite dans l’équation (138) peut s’interpréter pour une surface triangulée comme
i,3
Le mode nul qui apparaît dans la limite m2 + O est sans conséquence puisque qi = O . Cette action non locale rappelle celle d’un gaz coulombien bidimensionnel où les charges seraient remplacées par la courbure locale.
ci
2.3 Sommes sur des surfaces régulières Nous allons poursuivre en présentant le modèle de Polyakov pour les surfaces aléatoires, modèle qui sert de fondement à la théorie des cordes. Nous ne discuterons pas ici les applications à une unification des interactions (incluant la gravitation) en physique des particules, unification qui justifie bien entendu les efforts déployés dans l’élaboration de cette théorie. Le résultat suprenant de l’analyse qui va suivre est que 26 est une borne supérieure à la dimension d’un espace de plongement pour lequel les expressions obtenues gardent un sens. Dans cette dimension magique le modèle quantique jouit d’une invariance de reparamétrisation (et d’une invariance conforme). Ceci est le cas de la version commutante (ou bosonique) présentée ci-dessous et deviendrait d = 10 dans le cas d’une version généralisée incluant des degrés de liberté anticommutants (fermioniques). D’ailleurs cette extension pourrait avoir son intérêt en physique statistique, car il y a quelque espoir d’interpréter certains modèles tridimensionnels, et parmi eux le modèle d’king en termes de surfaces aléatoires fermioniques en utilisant leur version de jauge duale.
XI.2.3
GEOMETRIE ALEATOIRE
359
Malheureusement pour poursuivre cette étude dans le cas continu, il est nécessaire d’introduire des outils mathématiques assez complexes. I1 est suggéré au lecteur, qui n’a pas la familiarité voulue, mais qui est intéressé par ces questions, de se reporter aux revues citées dans les notes, en particulier celles de Friedan et d’Alvarez qui ont développé le travail de Polyakov et qui décrivent en détail le bagage mathématique nécessaire. Dans le cas continu on a vu que pour un chemin aléatoire il était plus expédient d’utiliser comme action non la longueur de la trajectoire mais une action quadratique dans la vitesse
où r est un paramètre le long de la courbe, le temps propre dans le cas relativiste ou la longueur selon la métrique induite sur la trajectoire par celle de l’espace ambiant. Bien que cette expression ne soit pas invariante de reparamétrisation, on pourrait la généraliser en introduisant une fonction monotone T = f ( s ) et formuler l’intégrale de chemin de manière qu’après un “choix de jauge” l’action reprenne la forme (142). Dans le cas de surfaces plongées dans Rd,on désire aussi remplacer l’action de Naumb-Goto (proportionnelle à l’aire calculée avec la métrique induite) par une forme quadratique analogue à (142). Au lieu de fixer une métrique spécifique, Polyakov a suggéré par analogie avec la gravitation quantique de faire la moyenne sur toutes les métriques possibles définissant l’élément de longueur infinitésimale
L’intégrale de chemin prend alors la forme
z=
Ag
topologies
(144) La quantité A0 s’interprète comme une activité (nue) conjuguée à la caractéristique x donnée par (133). Le terme proportionnel à l’aire A = / d 2 a Jg , calculée avec la métrique g, nous laisse la possibilité d’absorber une quantité similaire avec un coefficient infini par une renormalisation adaptée. La fonctionnelle du vide (144) n’implique qu’une somme sur des surfaces compactes orientables pour la simplicité et nous nous restreindrons encore à des surfaces connexes. Si cela n’était pas le cas on devrait vraisemblablement inclure des facteurs combinatoires. Les d champs correspondant aux composantes X p ( a ) engendrent une application de la surface dans Rd et la partie principale de l’action s’écrit
360
GEOMETRIE ALEATOIRE
XI.2.3
Bien entendu on pourrait prendre pour espace cible une variété à d dimension de métrique G,,(X) comme on l’a mentionné plus haut (équation (95)). Nous ne le ferons pas ici. L’action quadratique (145) est semblable à celle du cas unidimensionnel, avec en outre les facteurs géométriques appropriés, g = det gab et gab l’inverse de gab. Elle possède trois types d’invariance. (i) Invariance de reparamétrisation, accompagnée bien entendu par le changement correspondant de métrique. (ii) Changement d’échelle de la métrique gab + p2gab, où p2 peut dépendre du point sur la surface. La combinaison f ig a b reste alors inchangée et on parle d’invariance de Weyl ou invariance conforme. La transformation change les longueurs mais ne modifie pas les angles. Les métriques qui se déduisent les unes des autres par un tel changement d’échelle sont dites appartenir à la même classe conforme. Si on considère uniquement son effet sur la métrique on constate alors qu’une reparamétrisation peut s’interpréter en partie comme un changement d’échelle. Cette remarque jouera son rôle dans la suite. (iii) Enfin l’action est aussi invariante lorsqu’on agit sur X par une transformation du groupe euclidien. Les translations constituent la partie dangereux de ce groupe (c’est-à-dire conduisant potentiellement à des facteurs infinis). On s’en affranchira en traitant à part le mouvement du centre de masse, ou mode constant. Inversement si on ajoute à l’action (145) les termes conjugués à In& et pz on obtient la forme la plus générale n’impliquant X que par l’intermédiaire de ses dérivées, renormalisable et compatible avec ces invariances. Une échelle de longueur physique dans l’espace cible est absorbée dans la définition de X. Cherchons à donner un sens à l’expression formelle (144) et plus précisément à chaque terme de cette somme individuellement. On raisonne donc désormais à topologie fixée. L’objectif est d’extraire un facteur correspondant au “volume”, bien entendu infini, du groupe des changements de coordonnées différentiables, dit encore groupe des difféomorphismes. Ceci revient à fixer la jauge, tout en désirant conserver les bénéfices de l’invariance de jauge. On va voir que la théorie quantique ne permet de maintenir l’invariance conforme (lorsque la valeur renormalisée de p2 est nulle) que lorsque la dimension vaut 26 comme on l’a annoncé ci-dessus. Lorsque p i s’annule, les équations du mouvement obtenues par variation successive de gab et .Y@ s’écrivent
XI.2.3
361
GEOMETRIE ALEATOIRE
Nous reconnaissons en (146) l’annulation du tenseur impulsion-énergie symétrique et de trace nulle, qui entraîne que gab est proportionnel à la métrique d a X p & X r induite par l’espace euclidien sur la surface. Les champs coordonnées Xp doivent alors être harmoniques par rapport à cette métrique. Ceci est en fait la condition à laquelle satisfont les surfaces minimales (c’està-dire les surfaces qui minimisent l’aire localement). Si on utilise ces équations dans l’expression de l’action on obtient l’aire totale. I1 est clair que ceci prendrait un sens plus précis dans le cas de surfaces à bord fixé.
E,
Rappelons une propriété énoncée ci-dessus (équation (117)) selon laquelle au prix d’un changement de coordonnées toute métrique peut être rendue diagonale au voisinage d’un point. On peut même s’assurer que le facteur conforme est l’unité en ce point et que son gradient s’y annule. Une propriété supplémentaire est que dans chaque classe conforme il existe une métrique go de courbure constante. Ceci revient à dire qu’étant donné la métrique 9, il existe une fonction $ de telle sorte qu’en écrivant g = e2*g0, 90 soit de courbure constante Ro. D’après (119) ceci revient à trouver une solution de l’équation de Liouville classique
-A$ = R - e-2* Ro
(148)
Le lecteur se rappelle que la théorie de l’uniformisation des surfaces de Riemann compactes implique que dans le cas où x = O un tore s’obtient comme le quotient du plan complexe par un réseau de translations, tandis que si x < O la surface s’interprète comme le quotient du demi-plan complexe supérieur par un sous-groupe discret de S L ( 2 R ) . Une métrique de référence de courbure constante est dzdz, ou dzdE/(Imz)2 dans les deux cas respectivement. Nous avons présenté le cas de la sphère précédemment. Pour vérifier l’assertion, utilisons des coordonnées complexes z = ( Y I + i d , E = ai-io2. Une métrique générale s’écrit ds2 = gzzdz2 gzzdZ2 2g,ïdzdE, (grï = G, g r ï = & z ) avec les conditions de positivité gzï > g z r g ï ï , gzz > O . Posons
+
+
(149a)
La positivité se traduit par X
> O,
< 1, et la métrique
s’écrit
362
XI.2.3
GEOMETRIE ALEATOIRE
ds2 = X Idz
+ pdZI2
(149b)
On cherche alors un changement de coordonnées régulier u = u ( z , Z ) , 21 = u ( z , Z ) tel que dans les nouvelles coordonnées la métrique prenne la forme
(anti) diagonale ds2 O: dud21. I1 faut bien entendu prêter attention à l’invariance selon le groupe crystallographique. D’après ce qui précède ceci revient à résoudre l’équation de Beltrami auf ôZ = p auf 6’2.
Considérons alors un terme particulier dans la somme (144). Cherchons à fixer la jauge sachant que g est conformément équivalent à une métrique go donnée, de courbure constante (c’est-à-dire g = e2$goi variable). Pour cela étudions les variations 6 g au voisinage de g. On peut définir une norme au carré sur les déformations
+
qui se généralise naturellement aux autres champs tensoriels. Ceci fournit un élément de volume D g par analogie avec les variétés riemanniennes au prix d’une extension à un nombre infini de variables. Notons que cette définition implique la métrique g. La variation 6g peut alors s’écrire comme la somme de deux termes orthogonaux selon (150)’ un terme 6h de trace nulle et un terme proportionnel à g lui-même (proportionnel à la trace) Sg = 2Svg
+ Sh
(151)
La propriété d’orthogonalité implique que Dg se factorise au voisinage de g en
D g = VvDh
(152)
où chacun des facteurs est indépendant de la paramétrisation. On voudrait que cette factorisation corresponde respectivement à l’intégration sur le facteur conforme et sur le groupe de reparamétrisation agissant sur la métrique de référence go. Pour cela voyons comment agit un changement de coordonnées infinitésimal. On a
soit
où nous avons défini le champ de vecteur infinitésimal covariant
XI.2.3
GEOMETRIE ALEATOIRE
363
associé à la reparamétrisation et D désigne la dérivée covariante impliquant le symbole de Riemann-Christoffel r
On évitera cette débauche d’indices tensoriels en choisissant judicieusement la métrique de référence. Par changement d’échelle on a
a$gab = 26’$gab
(156)
+
S$)g avec la décomposition orthogonale (151) Comparons la somme (6, et observons que ceci revient à soustraire sa trace à 6,g. Ainsi
que nous écrivons
où Pl est un opérateur différentiel du premier ordre qui applique les champs de vecteurs (d’où l’indice 1) dans les champs de tenseurs symétriques de trace nulle. Nous remplaçons alors les variables ‘p et h par ’$ (associé au facteur conforme) et v qui représente l’effet des changements de coordonnées en prenant garde au fait que ce changement de variables introduit un déterminant jacobien fonctionnel (le déterminant de Faddeev-Popov correspondant) (1594 Le jacobien a la forme
Comme seule nous intéresse la valeur absolue de ce déterminant nous utilisons au lieu de det Pl la quantité positive (det P!Pl)i où l’opérateur Pi Pl a l’avantage d’appliquer champs de vecteurs sur champs de vecteurs. Ainsi
364
GEOMETRIE ALEATOIRE
+Y
V p V h = V$Vv det Pl Pl
XI.2.3
(159b)
On pourrait représenter le déterminant comme une intégrale grassmannienne sur des champs de “fantômes”. Cette technique familière est utile dans la théorie des champs de cordes, pour donner une forme compacte au développement (144) qui s’interprète alors comme série perturbative d’une théorie quantique putative. Cette analogie met en parallèle les diagrammes de Feynman tracés à l’aide de lignes et ceux qui interviennent ici représentables à l’aide de surfaces. L’intégrale grassmannienne, analogue à celle sur les champs X, prend une forme plus simple lorsqu’on utilise des variables complexes, mettant en évidence l’invariance conforme. Nous laissons le soin au lecteur d’établir son expression.
Pour définir la mesure Vu,nous utilisons une norme sur les champs de vecteurs qui a la propriété d’être indépendante du représentant g à l’intérieur de la classe conforme, c’est-à-dire de la variable $, et qui s’écrit par analogie avec (150)
L’intégrale (formelle et infinie) J Vu s’interprète alors comme le “volume” du groupe de reparamétrisation. I1 nous faut prêter attention au fait que l’opérateur Pl peut avoir des modes nuls, c’est-à-dire annuler certains champs de vecteurs (dits champs de Killing conformes) qui correspondent aux reparamétrisations laissant la métrique invariante à un facteur près. En effet l’intégrale sur ce sous-espace est déjà incluse dans l’intégrale sur 11. Pour éviter un double comptage et définir un jacobien positif (det’P?Pl)*, nous devons donc intégrer v sur l’espace orthogonal au sous-espace de dimension finie des modes nuls. Ceci a l’inconvénient que l’intégrale résultante ne représente qu’une partie du “volume” du groupe de reparamétrisation. Observons finalement que nous avons admis implicitement jusqu’ici que toute variation infinitésimale de métrique est de la forme (6+ 6,) g. Ceci n’est pas toujours le cas et il nous faut examiner la question indépendamment. I1 n’y a pas de problème en ce qui concerne la partie concernant la trace. En revanche il faut se demander si toute variation de trace nulle 6h appartient à l’image de l’opérateur P i . I1 n’en est pas ainsi en général et pour x 5 O cette image est orthogonale à un sous espace de dimension finie, dont nous noterons la mesure V h M , qui est appelé l’espace de Teichmüller ou espace des modules. A la vérité les variations de ce type appartiennent à l’espace tangent à l’espace de Teichmüller qui lui-même est un recouvrement de l’espace des modules dont la structure globale est relativement complexe. Nous avons donc plus précisément
+
XI.2.3
GEOMETRIE ALEATOIRE
365
‘PlPl)‘
(1594
2)g = DhMDVLD$ (det
où le prime indique qu’on doit prendre le déterminant dans l’espace orthogonal aux modes nuls. Exprimons la série (144) comme une somme sur des contributions relatives à des topologies distinctes
z=czx X
Un terme de cette série s’écrit alors
e-’;
Sd2&&(det’PlP1)’
(det’ [-A])-’d
(161)
Nous avons effectué l’intégrale sur les champs X, en séparant la contribution des modes nuls de translation normalisés C[ (d’où le prime dans l’écriture du déterminant du laplacien, calculé bien entendu à l’aide de la métrique 9). Comme toutes les quantités sont invariantes par reparamétrisation, l’intégrale J Du* se factorise et nous l’omettons purement et simplement à titre de première renormalisation multiplicative de 2,. L’intégrale restante demeure cependant formelle car bien entendu les déterminants sont encore mal définis. Ce faisant nous suivons la tradition heuristique des physiciens qui partent d’expressions infinies dépourvues de sens pour aboutir aux quantités renormalisées bien définies, plutôt qu’en introduisant axiomatiquement le produit final qui obscurcirait la démarche. A ce point le lecteur pourrait s’inquiéter (et nous partageons son inquiétude) de ce que les contributions correspondant à des topologies différentes pourraient correspondre à des intégrales distinctes sur le groupe de reparamétrisation. Ceci signifie qu’à ce stade la façon de combiner les différents Z, en une somme unique demeure un problème ouvert. Nous devons maintenant nous préoccuper de la définition des déterminants et de l’intégration sur l’espace des modules. D’après la section 2.2 nous nous attendons à voir réapparaître l’action de Liouville donnant la dépendance en $. Ceci nous entraîne à faire un détour par une discussion assez technique qui a son propre intérêt et qui généralise notre discussion précédente un peu schématique du champ libre scalaire de masse nulle. Dans l’étude des déterminants figurant dans l’équation (161) nous continuerons à utiliser les coordonnées complexes z = a1 ia2,2 = al - ia2. La métrique s’écrit g = e2$go, et nous prendrons une métrique de référence go de
+
366
XI.2.3
GEOMETRIE ALEATOIRE
la forme ds2 = e2iodzdZ, correspondant à une courbure constante. Ainsi seul gzf est non nui et positif et gz” = .:9; Considérons des transformations analytiques (donc conformes, c’est le point clé) agissant sur des tenseurs ayant aussi bien des indices covariants que contravariants. La métrique g nous permet de monter ou d’abaisser ces indices (sa loi de transformation est bien entendu gzïdzdE = gLZdz’dZ’) de sorte que nous pouvons nous limiter à des indices covariants par exemple, auquel cas (cf chapitre IX) la transformation des tenseurs est caractérisée par le fait que th,hdzhdZhsoit invariant. Les suffixes h , h, tous deux entiers ici, désignent respectivement les nombres d’indices du type I et du type Z. Lorsqu’on n’envisage que des changements de coordonnées analytiques, la loi de transformation des tenseurs se simplifie en ce sens que th,ï, est simplement multiplié par un facteur. I1 est en fait plus commode ici de substituer aux h indices covariants un nombre égal d’indices z contravariants. Nous notons alors le tenseur th = (gzZ)ht h , h et sa loi de transformation s’écrit
Pour se conformer à l’usage courant dans ce contexte nous adopterons une convention opposée à celle du chapitre IX en désignant par n (et non s) la différence h- h (s = -n). A R. fixé (positif ou négatif) l’ensemble des quantités tensorielles (à une seule “composante”) qui se transforme selon la loi (162) sera noté 7“. Les opérateurs qui nous intéressent, tels -A et Pi, appliquent des tenseurs symétriques de trace nulle sur d’autres tenseurs du même type. A deux dimensions et raisonnant sur les réels de tels tenseurs n’ont que deux composantes indépendantes.
Pour s’en assurer dans le cadre de la géométrie euclidienne, associons à un tel tenseur le polynôme homogène Pn(z, y) = T i i...,2 2 ...z k Y k’
zk+k,=n
+
qui possède a priori n 1 coefficients indépendants. Le tenseur est symétrique si le laplacien usuel û 2 / û x 2 + d 2 / b y 2agissant sur Pn donne zéro. Ceci entraîne l’annulation d’un polynôme homogène de degré R. - 2, c’est-à-dire n - 1 conditions si n >_ 2 (ou zéro si n = O ou l), laissant ainsi deux coefficients t - ( z iy)”. Si indépendants arbitraires tels que Pn(z,y)= t+(z - iy)” le tenseur est réel, t+ et t - sont complexes conjugués. L’argument s’étend sans difficulté dans l’espace courbe. En coordonnées complexes l’une des composantes appartient à I n ,appelons-la t , tandis que la seconde composante E aurait n indices Z contravariants conformément à la convention ci-dessus. Cette composante est multipliée par (gzz)n, le résultat appartenant ainsi à I-”. L’ensemble des tenseurs (réels) symétriques de trace nulle de rang n peut donc être considéré comme appartenant à In@ I - n ,sous la forme
+
T
+
{ t , (gzr)” E }
où il est entendu que t E I”.On notera Sn le sous-espace de I n@7-n obtenu
(163)
XI.2.3
367
GEOMETRIE ALEATOIRE
comme ci-dessus à partir d'un tenseur réel, laissant de côté le cas plus simple n = O, où l'on n'a qu'une seule composante. En utilisant la forme particulière de la métrique on construit les deux composantes de la dérivée covariante D z et D , (en y ajoutant un suffixe n si nécessaire)
On déduit du carré de la norme
lltl12 =
J
d2q/5(gzz)nft
(165a)
un produit scalaire invariant, comme on le vérifie aisément.
a
Essentiellement D' est équivalent à l'opérateur à une décoration près et les facteurs qui interviennent dans la définition de D, sont là pour effectuer le passage de D z à D, lorsque ces opérateurs agissent sur l'espace tensoriel voulu. Nous étendons la norme à Sn de manière que si T s'écrit comme en (163) on ait (T1,7'2) =
J
d2ciJg(grz)n (zit2
+ t1z2)
(165b)
L'opérateur adjoint de D z agit de In+' dans F , et on vérifie que
I1 y a maintenant deux définitions possibles du. laplacien agissant sur 'Tn. Ou bien nous montons un degré dans l'échelle des n à l'aide de D z et nous redescendons avec D , , ou nous faisons les opérations dans l'ordre opposé. D'où les deux opérateurs ai+'
Le facteur 2 est inclus pour que la définition coïncide avec le laplacien usuel dans l'espace plat (si Laplace avait vécu assez longtemps, il aurait à coup sûr changé le signe dans la définition de son opérateur pour le rendre positif!). Ces opérateurs sont positifs semi-définis. Dans l'espace Sn,les opérateurs agissent sur les deux composantes conjuguées
368
XI.2.3
GEOMETRIE ALEATOIRE
La notation est choisie de telle sorte que Pl et P i sont les opérateurs intervenant dans la formule (161). Les laplaciens associés agissant sur S sont alors
Pour la suite il est important de noter la relation suivante entre les spectres des opérateurs P i Pn et Pn PL (en particulier pour n = 1). Ces opérateurs sont tous deux non négatifs mais peuvent avoir des modes nuls qui engendrent leur noyau. Pour un Qpérateur O, le noyau de Of est orthogonal à l'image de O, et on a une relation analogue en échangeant les rôles de O et Ot. Donc en termes de compléments orthogonaux on a la correspondance
Le membre de gauche est aussi le complément de kerP,, celui de droite de kerPi. Pour préciser cette correspondance, soit {T,} une base orthonormale des modes propres de valeur propre non nulle de -AL+), les valeurs propres correspondantes étant notées A, (le produit scalaire est entendu au sens des équations (165))
2PLPnT, = A,T,
A,
>O
(171)
Par conséquent 2PnPi(PnT,) = A,(PnT,) et PnTT est vecteur propre de pour la même valeur propre A,. Ces modes propres sont orthogonaux. Pour les normaliser nous remarquons que
en admettant les valeurs propres non dégénérées. De la sorte les quantités
{ ?,'
= f i n T T } forment une base orthonormale de [ker
(- AL-+\)]
I
,
justifiant l'équation (170). Dans le cas particulier où n = 1, les modes nuls de Pl sont les vecteurs de Killing conformes, tandis que les tenseurs harmoniques de trace nulle à deux indices, modes nuls de P l , engendrent l'espace des variations de la métrique qui ne peuvent être obtenus ni par changement d'échelle ni par changement de coordonnées et sont donc associés à l'espace des modules, qui est à l'origine d'une intégration sur cet espace de dimension finie dans les equations (159c) et (161). En général les modes nuls sont des tenseurs harmoniques dans leurs espaces respectifs. Nous passons maintenant au calcul des déterminants en utilisant comme précédemment la méthode du noyau de la chaleur. Ainsi
XI.2.3
369
GEOMETRIE ALEATOIRE
In det‘ (-AL+))
=-
lrn $
Tr’exp ta;+’
puisque
In X p , la somme portant sur I1 s’agit donc d’une régularisation brutale de les valeurs propres positives et E jouant le rôle de facteur de coupure ultraviolet, le carré d’une longueur élémentaire. On doit se souvenir que pour n # O, l’opérateur -AL+’ agit sur la somme directe de deux espaces. Comme dans la section 2.2, la méthode pour extraire la partie singulière de (172) consiste à étudier le comportement du noyau aux temps courts. Le calcul est parallèle à celui que nous avons déjà effectué. Nous allons cependant le présenter en assez grand détail en ce qui concerne les laplaciens qui interviennent ici, en utilisant une adaptation de la méthode de perturbations. (+)
Soit a un point où nous voulons évaluer le noyau G(a, a ;t ) = (al etAn la). I1 s’agit en fait d’une matrice 2 x 2 diagonale. Nous savons que G se comporte comme t-’ lorsque t tend vers zéro et que les longueurs varient comme t1/2. Considérons les termes jusqu’à l’ordre t o
où G-1, Go, matrices 2 x 2 diagonales, dépendent bien entendu du point a. En reportant ce développement dans (173) nous obtenons
lndet’ (-AL+))
=
-:
/d2a&TrG-,i
In& [/d2a&TrGo
-dimKer
+termes finis (1746)
Le second terme en In& provient de la prescription consistant à sommer sur les modes non nuls. Envisageons maintenant une variation du facteur d’échelle i, dans la relation g = e2$go. Supprimant tous les indices pour un mode non nul de Sn, la relation
x ( T ,T ) = 2 ( P T IPT) s’écrit explicitement
X/d2a&(gZt)”
tf = 2
J
d2z&(gZr)n+1 (gz2&) (gZrat)
370
GEOMETRIE ALEATOIRE
XI.2.3
Nous en concluons que la normalisation entraîne la relation âX
+ X2(n + 1) (T,6$T) = 4n ( P T ,ô$PT)
Si nous nous souvenons que f i T = T est le mode normalisé correspondant dans l'équation ci-dessus peut encore s'écrire
- (n + 1) (T,6 @ T ) }
6X = 2X {n (Fila$?') En conséquence
6lndet' (-Ai+))
=L
O D
dt
cf
&X,e-txr
r
Pour évaluer cette quantité, nous avons aussi besoin du développement anaEcrivant en une colonne les deux éléments de logue à (174) pour l'opérateur nous avons
AL2).
Pour obtenir une expression analogue à (130) nous allons employer ici une méthode perturbative en posant gzz = +e2$ et en utilisant un système de coordonnées tel qu'au point O: où nous voulons évaluer le noyau, pris comme origine nous ayons $ ( O ) = O , û+(O) = a$(O) = O . Avec les notations usuelles de la mécanique quantique nous écrivons P2 = -4@, c'est-à-dire (moins) le laplacien plat. Alors
Comme IzI est d'ordre sous la forme e-P2t-tV
4,il nous suffit d'un développement au premier ordre = e-P2t -
dtfe-P2(t-t')Ve-t'p2 + . , ,
Pour les composantes supérieure et inférieure nous avons respectivement
XI.2.3
371
GEOMETRIE ALEATOIRE
v+=vo-v, v- = v, + VI + v2 I/,
=-
+ 2ZEaa@(0)+ 2a2@(0)]
[2202@(0) V2
= 8n0a@(O)
(
I I
Nous cherchons à calculer Tr O etan( + ) O ) , où ia trace signifie la somme sur les composantes supérieure et inférieure de sorte que au premier ordre la contribution de VI disparaît. Celle de Vi a déjà été obtenue en (130). I1 est intéressant de la reproduire en utilisant la méthode présentée ici où elle apparaît doublée en raison de la trace, comme l’est le terme d’ordre zéro. En outre V2 = 2nA@(O)donne lieu dans la trace à un terme dont le coefficient est
En rassemblant ces résultats, on a
où nous avons distingué successivement les différentes contributions. Ainsi si f est une fonction diagonale dans l’espace de configuration et en nous rappelant que d’après l’équation (119), R = -A@, (176a) Un calcul analogue donne Tr je‘*-+‘ (-’
=JdaJgj{
&
- W 67r R
} +O(&)
(176b)
Finalement lorsque n = O , si A désigne le laplacien scalaire, nous avions obtenu ci-dessus (176c) Une conséquence immédiate et remarquable de ces calculs est l’observation suivante qui conduit à un cas particulier du théorème de l’index dû à Atiyah et Singer. L’index est l’entier
in = dim [kerP,] -dim [kerPi] qui est la différence entre la dimension et la codimension de l’opérateur. Comme - A n ) = 2PnPn et = 2P,,Pi ont un spectre de valeurs propres non nulles identiques, on a pour tout t,
(177)
372
XI.2.3
GEOMETRIE ALEATOIRE
Puisque cette quantité est indépendante de t on peut la calculer pour t -+ O à l’aide des équations (176) en y faisant f E 1. Le terme singulier en t-l se compense dans la différence et les termes finis donnent alors la relation entre l’index et les propriétés topologiques, c’est-à-dire dans le cas présent la caractéristique d’Euler
La différence entre les nombres de tenseurs harmoniques réels de rang n et n 1 est donc un invariant topologique.
+
Lorsque n = 1, l’index est 3x . Les dimensions calculées en (177) et (178) sont celles d’espaces vectoriels réels. Le nombre de champs de vecteurs de Killing conformes linéairement indépendants (dim [KerPl]) est la dimension (sur les réels) d u groupe des difféomorphismes analytiques ou groupe conforme global tel qu’il était nommé au chapitre IX. Donc dim [KerPl] = 6 , 2 , O suivant que x = 2 , 0 ou négatif correspondant au groupe SL(2,C) pour la sphère et aux translations complexes pour le tore. Les surfaces de Riemann de genre plus grand que un n’admettent au plus qu’un groupe fini d’automorphismes. Donc dim [KerP!] = dim(KerP1) -3x est nul en genre nul, deux en genre un, et 6(g - 1) en genre plus grand que un, toutes ces quantités étant calculées sur les réels. Rappelons que c’est la dimension de l’espace des modules. Ce résultat est bien connu pour g = O (pas de module) et g = 1 (un module complexe).
Nous avons maintenant tous les outils nécessaires pour extraire des déterminants les termes divergents et finis dépendant du facteur conforme $. D’après les équations (174) et (176a)
Indet‘(-Ak+))
= -&/d2afi+lni
[(n+;)x-dim[KerP,]]
+fini
Ceci est dimensionnellement correct puisque E a la dimension d’une longueur au carré. Le coefficient de in E est bien entendu un nombre pur. Cette formule est cependant insuffisante puisque nous cherchons à obtenir aussi la dépendance en $ de la partie finie qui contient l’anomalie. A part le terme logarithmique qui contient la dimension du noyau de Pn (et qui sera éliminé dans la suite) les divergences résiduelles peuvent être absorbées par une renormalisation de A0 et de la “tension” nue p i dans l’équation (161). La formule variationnelie (175) contient des traces tronquées. Si on utilise à la place les traces complètes il faut soustraire la contribution des modes nuis. une base du noyau de Pn. Considérons la matrice symétrique finie
(179)
XI.2.3
373
GEOMETRIE ALEATOIRE
Rappelons que t(O) est analytique en z et peut être choisi indépendamment de $. On a donc
Le projecteur sur le noyau de Pn peut alors s'écrire, en termes d'une notation évidente,
et
En ce qui concerne le projecteur
pn+l sur
?io)
le noyau de P i , les fonctions
sio)
:(O)
correspondantes telles que (gzz)n+l = t , sont analytiques en 2 . Choisissons ces indépendants de $. Le même raisonnement appliqué à la matrice
z
montre que -2nTr6$Pn+1 = 6lndet H,
(183)
Combinons les équations (175) et (176ab) avec les résultats précédents. NOUS trouvons que sous l'action d'une variation d'échelle, et en posant g = c'+go avec R = e-'@ [Ro - Ao+o]
6 In det' (-Ai+))
=
$1
d2aJgo6+
e'@
-+ E
6n(n
+ 1) + 1 (Ro- Ao+) 3
I
$6 In det H, det fi,
(184)
Soit
In det' (-Ai+')
-
27rE
=
1
d2a&e2*
-
6n(n
+ 1) + 1 J d'ad% { s ~ " ~ a ~+l ~2RoSi) la~l~ 6.rr + In det Hn det fi,, + fn
(185)
374
XI.2.3
GEOMETRIE ALEATOIRE
Le terme fn est indépendant de $I mais contient encore des singularités. Nous obtenons l’action de Liouville parmi les termes finis comme on s’y attend. On observe en outre que les termes singuliers dépendant de 11, sont les mêmes que ceux qui figuraient dans l’équation (179). En comparant ces deux expressions, on en conclut que
+In (det Hn det fi.)
+ Fn
(186)
Cette fois-ci Fn est une quantité finie indépendante de 11, (et donc uniquement fonction des modules, ou si l’on veut de la métrique de référence). En dernière analyse c’est ie terme le plus difficile à obtenir, mais aussi le plus intéressant. Au chapitre IX nous avons vu un exemple d’évaluation dans la discussion du champ libre sur un tore. Nous avons besoin de l’expression (186) pour n = 1. Le fait que -Ai+’ diffère de PJPl par un facteur 2 n’est bien entendu d’aucune ... peut être absorbé dans conséquence, puisque tout facteur constant 2, la définition de la mesure d’intégration. Nous laissons le soin au lecteur de reprendre le même calcul dans le cas du laplacien scalaire, avec les conventions de régularisation utilisées ci-dessus, en prenant garde au terme topologique. Le résultat s’écrit
6,
‘s
lndet‘(-A) = --
47rE
d2û&e2*
+ [ax - 11
avec FOfini et ne dépendant que des modules. En ce qui concerne la dépendance dans le facteur d’échelle cette expression est en accord avec (134) puisque indet’(-A). In 2 =
-+
Le dernier ingrédient nécessaire avant de mettre bout à bout les expressions précédentes est la mesure d’intégration. La mesure sur l’espace des modules (de dimension finie) a été écrite ’ D h M . Nous pouvons utiliser un développement de h sur la base du noyau de in P i pour écrire dh = x d T u r u U
Donc
XI.2.3
375
GEOMETRIE ALEATOIRE
Ce terme est absent si g = O, c’est une intégrale double pour g = 1 et en général l’indice u varie de 1 à 6(g - 1). Rassemblant les résultats des équations (186) pour n = 1 et (187) où nous soulignons que Fi et FO sont fonctions des r , les paramètres modulaires, nous obtenons
Nous avons encore manqué un peu de soin en écrivant la mesure. En effet (cf. l’équation (173) où intervient la combinaison sans dimension E X ) chaque intégrale gaussienne initiale devait faire intervenir la mesure dzs-3. D’où dC: -+ dC:aË*, ( n z L d T Y )+ ( n u d r u ) a - ’ d i m ( k e r p ~ ) . De plus S V u l n’est pas le ‘‘volume” entier du groupe des différomorphismes lorsque g = O ou 1 (où la dimension de kerP1 est non nulle). I1 manque le “volume” infini du groupe conforme global. Donc on voudrait factoriser VuLx “volume” du groupe global et diviser par un facteur normalisation (que nous prenons égal à l’unité) multiplié par a-dim(kerP1)(où dim(kerP1) est bien entendu la dimension de ce groupe). Le fait qu’un facteur est absent de l’exposant
5
L
résulte de ce que les valeurs propres de ( P i P l ) * qui s’annulent auraient une dimension 1 dans une régularisation. Toutes ces subtilités se réduisent à dire que le facteur
(XOE$@-~))
E
-
+
~
~
doit ~ ~être ( remplacé ~ ~ ~ par ~ la ~ quantité )
Nous pouvons alors définir les quantités renormalisées =Xoe12(26-d)
P2 =p;
+
1 (1 - T1 d )
La mesure complète sur l’espace des modules s’écrit dM, = n d r u d e t k i ( d e t H l ) + U
376
GEOMETFUE ALEATOIRE
XI.2.3
A première vue il semble que les facteurs dans cette formule dépendent de l’échelle d’après les équations variationnelles (181) et (183) et toute l’expression dépend bien entendu des modules (comme la métrique de référence go en principe). Pour g > 1, det Hi = 1. Après compensation des facteurs E , la mesure s u r les modes nuls de translation peut s’écrire $J
où les X : désignent les coordonnées du centre de masse puisque le développement de X p commençait par la contribution de ces modes C; x
(s
+
du&Ge2“)-’ . . .. Finalement nous factorisons le “volume” du groupe des difféomorphismes et nous posons
S(T) =
f [dFO(T) - Fl(T)]
(194)
qui est la partie la plus significative de l’action.
Le produit final de l’analyse précédente est l’expression due à Polyakov et Friedan
1 11 1 d
ZRen X =Ax
-011,
dMTexp -Stat
dX:
I1 est clair que dans la dérivation que nous avons reproduite, de nombreux points méritent une clarification. I1 en est ainsi en particulier de trouver le domaine précis d’intégration dans l’espace des modules, de préciser la mesure d’intégration, de calculer la partie finie de l’action S ( T ) . Comme on l’a souligné la manière de superposer les différents termes 2, correspondant à différentes topologies peut être mise en doute. Un point cependant ne fait pas de doute. La théorie bosonique contiiiue des surfaces aléatoires décrite ci-dessus perd tout sens en dimension plus grande que 26, car la contribution du terme “cinétique’’ en devient alors négative. En dimension inférieure à 26, il apparaît un nouveau degré de liberté, le champ 11, précisément, associé à l’anomalie conforme. C’est ce qu’on appelle la théorie de Liouville. La dimension 26 est marginale. Si l’on se place alors au point p2 = O , la contribution de se factorise (au prix d’une définition peut-être plus correcte de la mesure dM,) et peut être absorbée dans une renormalisation multiplicative supplémentaire de 2,. La théorie est alors invariante d’échelle.
+
XI.2.3
GEOMETRIE ALEATOIRE
377
On peut envisager deux types d’observables pour étudier le comportement de ces surfaces aléatoires. Les observables non locales s’apparentent à celles qu’on utilisait dans les théories de jauge et font intervenir des courbes frontières. La dérivation précédente peut en fait être généralisée en présence de frontières données en imposant soigneusement l’invariance de reparamétrisation de la frontière elle-même. Suivant le type de conditions imposées au bord il apparaît différents termes supplémentaires, proportionnels à l’aire enfermée par la courbe frontière aussi bien que son périmètre. Dans le contexte de la physique des particules ceci conduit au modèle dit de la corde ouverte. D’autres observables sont locales en ce sens qu’on demande aux surfaces de passer par un certain nombre de points fixes {x”} dans l’espace cible. Ceci revient à introduire dans l’intégrale fonctionnelle des facteurs du X = J ( d d p / ( 2 7 r ) d exp(-ip. ) x)exp(ip. X), dont la dépentype c ~ ( ~ )-( x) dance exponentielle en X est appelée opérateur de vertex. Ces quantités permettent d’étudier des corrélations dans la surface. Au terme de ce survol préliminaire, la théorie continue des surfaces aléatoires apparaît comme un domaine relativement complexe, requérant des méthodes mathématiques avancées pour en extraire des résultats intéressants. I1 existe aussi des versions discrètes permettant des études numériques que nous voulons brièvement décrire en conclusion.
2.4 Modèles discrets I1 semble à première vue qu’un modèle discret évite la question de l’invariance de reparamétrisation. Nous allons voir que cette idée est un peu trop optimiste. I1 est bon de remarquer qu’a priori une triangulation ne fournit pas une approximation uniforme d’une surface régulière comme c’est le cas pour une ligne brisée, rectiligne par morceaux, dans le cas d’une courbe. Un exemple classique est celui de l’approximation d’un cylindre vertical de rayon a par des triangles obtenus en joignant les sommets de polygones réguliers horizontaux, à n côtés, inscrits dans le cylindre, centrés sur l’axe à des points d’ordonnées k b ( k entier), chacun étant tourné d’un angle a / n par rapport au précédent (figure 5). Considérons une couche de K familles de 2n tels triangles. L’aire cylindrique est 2aabK. Par ailleurs chaque triangle a une 4a2 sin2(a/2n), de sorte que le rapport de l’aire aire ;.2asin(n/n) x Jb2 triangulée à l’aire continue est
+
n sin . r { i a n
;cl’
+ -sin2 . ;2
Faisons tendre n vers l’infini. Si le rapport a2/b2 est maintenu constant, ce rapport tend vers 1. Si nous autorisons a2/b2 à dépendre de n, nous pouvons obtenir toute valeur plus grande que 1 bien que l’aire de chaque triangle élémentaire tende vers zéro.
378
GEOMETRIE ALEATOIRE
XI.2.4
Figure 5 : Approximation d’un cylindre par une triangulation régulière
Considérons le modèle le plus simple. Nous fixons le type topologique, le cas du tore = O étant le plus simple à traiter, et appliquons les sommets d’une triangulation régulière d’un tore plat dans l’espace Rd.Prenons le cas le plus simple d’une action proportionnelle à l’aire induite, la contribution de chaque triangle étant e i j k . Intégrons sur tous les points, sauf un pour tenir compte de l’invariance par translation. On obtient
x
Nous avons ainsi un facteur de coupure à courte distance analogue à E+ dans la théorie continue, pris comme unité ou absorbé si l’on veut dans le coefficient /3. Nous nous intéressons au cas où le pas de la triangulation devient infinitésimal et où, comme on l’a dit ci-dessus, cette dernière est un réseau triangulaire régulier sur un tore plat à N sites, 3N liens et 2 N triangles. Sur l’espace de base nous avons ainsi une invariance de translation discrète. Si nous multiplions X par A, la fonction de partition 2 se transforme en
Par conséquent pour N tendant vers l’infini
P(4,d
=id
(197)
Ceci suggère d’employer la méthode du col en grande dimension d. On introduit des variables conjuguées pour chaque lien afin d’imposer la condition
XI.2.4
379
GEOMETRIE ALEATOIRE
(Xi - Xj)2 = e$. Rappelons que l’aire eiih est donnée en fonction des côtés par la relation (99). La fonction de partition s’écrit
ei3
exp -
{
X j k [(Xj - Xk)2 - e j k ]
+ PS
(ik)
Supposant le champ moyen homogène du lien) la méthode du col conduit à 2 -exp -Se,,(X1
se,,
=N
= Al
lj,
= I indépendamment
e) (199)
[ i d ln A - 3xe2 + +Ape21
Les conditions de stationarité en
A=-
(Xjk
e et X s’écrivent
d 6e2
oAe2= d
en accord avec l’équation (197). I1 en découle que Serf = ;Ndln(/3/2&). Pour ces valeurs de X et e, le modèle se réduit à un produit de d champs gaussien sans masse découplés, quand on étudie la valeur moyenne d’une observable dépendant des coordonnées X. Pour donner un exemple, puisque ((Xi - XJ) = 2 1 le rayon de giration défini comme
e
(201a)
prend la valeur
R2
-
N - 7 T
I& ---e2 4
1 In N = - (aire élémentaire} In N
(201b)
7T
avec un comportement logarithmique qui résulte de la singularité infrarouge standard du propagateur de masse nulle bidimensionnel. Ce résultat est à comparer avec le comportement proportionnel à N de la quantité analogue pour une courbe brownienne. Dans l’équation (201b) le préfacteur (l/a)(aire élémentaire) est spécifique de la triangulation et d’ordre d. I1 y a des corrections relatives en puissances de l / d quand on poursuit le développement autour du col. Dans le cas présent la correction dominante (1 (2/d) . . .) a pu être observée dans des simulations numériques. En conclusion un modèle fondé sur une topologie déterminée et une triangulation fixée, défini par un poids de Boltzmann en exp( -Aire), engendre un effondrement des surfaces (de dimension de Hausdorff infinie)
+
+
380
XI.2.4
GEOMETRIE ALEATOIRE
comme en témoigne l’équation (201) et il semble qu’aucune modification simple comme celle qui reviendrait à inclure un terme de Liouville discret ne permet d’éviter cette conclusion. Pour obtenir des résultats plus raisonnables et plus proches de l’image continue, il faut se poser la question de trouver un analogue discret à la reparamétrisation. A genre fixé cet analogue ne peut être que d’envisager toutes les triangulations inéquivalentes I plutôt que de se limiter à l’une d’entre elles, ce qui a conduit l’effondrement catastrophique discuté ci-dessus. Afin de simplifier, et en analogie avec le cas continu, on assigne une métrique de référence à chacune de ces triangulations en prenant chaque lien entre voisins de longueur égale. Les triangles sont équilatéraux et on peut donc associer à chaque site un élément d’aire cri = +ni dans des unités convenables (l’équivalent du facteur de la théorie continue) où ni est le nombre des voisins. L’aire intrinsèque totale est alors égale au nombre N2 de triangles
Js)
A=
Cui= N~ i
La courbure en un site de l’espace est donnée par l’angle de défaut
et satisfait à la relation
Un terme impliquant le carré de la courbure s’écrirait sous la forme
Pour obtenir une action analogue à celle utilisée dans le continu, on ajoute au terme proportionnel à l’aire (202) un terme quadratique dans les coordonnées du plongement X i utilisant pour ce faire la métrique de base. A caract,éristique x donnée on somme alors sur toutes les triangulations inéquivalentes I comportant un nombre arbitraire de triangles. En outre on intègre sur les Xi avec la mesure
[(2)
z>X =
2d
(+
ddXi] ( 2 r ) id Sd
.ixi)
?
qui revient à omettre l’intégrale sur la position du centre de conséquence
XI.2.4
GEOMETRIE ALEATOIRE
381
La somme sur les triangulations remplace la somme sur les métriques, et k ( 7 ) est un facteur combinatoire égal à l’ordre du groupe de symétrie d’une triangulation. On pourrait se permettre d’ajouter des termes en puissances plus élevées de la courbure du type (205) pour voir qu’ils n’affectent pas les résultats dans la limite continue. Enfin le coefficient /3 est l’analogue de pg dans la section précédente, c’est-à-dire encore une tension de corde nue. L’opérateur discret qui définit la partie quadratique en X dans l’action a des termes diagonaux égaux à ni = 3ai et des termes non diagonaux égaux à zéro ou moins un s’ils correspondent à un lien. Ceci n’est pas exactement le laplacien discret (au signe près) qui s’obtient en multipliant lignes et 1 colonnes par azr
En omettant l’intégrale sur le mode nul, on trouve par conséquent que
où chaque terme dépend de la triangulation 1.Le fait que det’(-A) est divisé par l’aire A provient de l’omission du mode nul. On constate que comme dans la théorie continue la dimension d joue le rôle d’un paramètre. De manière analogue on pourrait considérer des fonctions de Green correspondant à fixer les images {X,} d’un certain nombre de points
r
1
à une normalisation près, ceci supposant bien entendu que le réseau contient plus de points que l’ensemble {X,} . A genre fixé, la fonction de partition 2, admet un développement en série de puissances de e-P puisque A est un entier. On s’attend à ce que ce développement ait un rayon de convergence fini comme les exemples cidessous le suggèrent. Donc le modèle semble bien défini au moins pour
382
GEOMETRIE ALEATOIRE
XI.2.4
P > Pc. Au point critique Pc certaines singularités apparaîtront et on étudiera le comportement critique comme à l’accoutumée. La fonction à un point G1 est indépendante de X par invariance par translation et elle est égale à -802,. L’analogie avec la mécanique statistique suggère d’appeler susceptibilité (et non chaleur spécifique) la seconde dérivée de 2, par rapport à P, proportionnelle à l’aire moyenne. Au voisinage du point critique on définira l’exposant y par le comportement
- (P
d2 -2, 8P2
1 - Pc)’
Si y est positif, l’aire moyenne diverge tandis qu’elle reste bornée si y est négatif. Lorsque P tend vers ,Oc, on s’attend à ce que la fonction à deux points se comporte à grande séparation comme
avec des exposants 7 et v. A triangulation fixée on peut encore définir un rayon de giration
où les crochets signifient une moyenne par rapport à la partie de la mesure dépendant de X. On peut alors écrire une fonction génératrice par rapport à toutes les triangulations
Si on développe en puissance de
le rapport b,/a, fixée
P
est un rayon de giration moyen à aire intrinsèque A = n
(x2)A
La limite à n --+ de ces surfaces.
00
bn/an
(215)
fournit un candidat pour la dimension de Hausdorff dh
XI.2.4
GEOMETRIE ALEATOIRE
(X2)A
-
A-C€
A2/dH
383
(216)
Montrer que si m (bc)s’annule, on s’attend aux relations d’échelle
Dans la suite nous supposerons pour plus de simplicité que la topologie est plane (x= 2, le plan étant compactifié en une sphère par adjonction d’un point à l’infini). David a observé que le modèle des surfaces triangulées cidessus est équivalent, à des termes inessentiels près, à une théorie q53 planaire avec propagateur exponentiel, généralisant la discussion donnée au chapitre X, section 4. Dans ce contexte q5 est une matrice hermitique N x N et N tend vers l’infini. La théorie du champ q5 est fondée sur l’action suivante dans l’espace euclidien cible ,S@=
I
9 Tr q53 d d X Tr q5 e A 4+ -
JN
(218)
action qui n’est évidemment pas bornée inférieurement, mais qui ne sert qu’à engendrer la série perturbative. Dans la limite planaire ( N + 00) les diagrammes sont duaux de triangulations I du plan (figure 6). I1 est possible de modifier le lagrangien pour éliminer les diagrammes en “tadpoles’’, et les insertions d’énergie propre, en ajoutant un polynôme du second degré en q5. Les règles perturbatives engendrent le facteur combinatoire k (7) apparaissant dans l’équatiron (207). La contribution restante résulte de l’intégrale de Feynman avec un propagateur en exp - (XI - X2)2 dans l’espace de configuration joignant deux sommets du diagramme planaire.
Figure 6 : Dualité entre diagrammes planaires (doubles lignes) et triangulations (lignes interrompues).
384
XI.2.4
GEOMETRIE ALEATOIRE
On intègre alors sur tous les X sauf un. I1 faut prendre garde au fait que ceci n’est pas directement l’intégrale sur X dans (207) puisque les X sont indexés par les sommets du graphe planaire et non ceux de la triangulation duale. A un facteur près l’intégrale de Feynman est ici (det’K)-td, où det’K est un mineur quelconque de la matrice d’incidence K du graphe planaire, Kab = -1 si a et b sont voisins, Ka, = nombre de voisins du site a,les autres éléments de matrice étant nuls. D’après le théorème de Kirchoff (chapitre VII), det’K est le nombre d’arbres tracés sur le graphe planaire, contenant tous les sommets. Chacun d’eux est en dualité avec un arbre analogue du graphe dual, c’est-à-dire de la triangulation 7. Cette propriété est spécifique de la topologie planaire et il faudrait envisager des modifications pour traiter le cas de surfaces de genre plus élevé. Sur la figure 7, nous montrons un exemple de cette dualité. n
Figure 7: Exemple de dualité entre arbres d’un graphe planaire (indiqués par des lignes grasses et des lignes interrompues).
En conséquence (det’K)-ld = (det’KT)-ld ne diffère du résultat attendu [(det -A)/A]-td que par des facteurs provenant dans ce dernier oz!d= exp In oi. Comme cas de la mesure d’intégration (206)’ soit oz = +ni = 2 [i - ozRi/r],
ni
no)‘
= exp { 4dAln2 - (2 - ln2) ?jdx
i d ci
+ ...}
(219)
i
en utilisant les propriétés de triangulations planaires (2Ni = 3N2, No Ni + N2 x & O-&). Les termes omis contiennent des puissances plus élevées de la courbure et sont probablement inessentiels (ou pourraient être absorbés par une modification de l’action nue). Le premier terme dans (219) équivaut à une renormalisation additive de p et le second est le terme topologique attendu.
ci
XI.2.4
GEOMETRIE ALEATOIRE
385
Du point de vue de la renormalisation, le modèle 453 planaire défini par l’action (218) est donc équivalent à un modèle de Polyakov discret. I1 faut une renormalisation du propagateur pour éviter les insertions de masse propre (correspondant aux triangulations où un sommet n’a que deux voisins et qui peuvent être omis) et un terme supplémentaire. linéaire en 4’ pour éviter les tadpoles’ c’est-à-dire les triangulations avec certains sommets identifiés. Considérons la fonctionnelle du vide connexe de la version 453. La série en e-fl est équivalente au développement perturbatif ordinaire en g pour la théorie planaire. Nous avons quelque expérience en ce qui concerne les propriétés de convergence et les singularités de ce dernier. L’équation (209) fournit une extrapolation en d. En particulier pour d = O (sic!) nous ,pouvons utiliser les résultats du chapitre XI notamment l’équation (X.290) qui montre un rayon de convergence fini en g 2 = e-2p correspondant au développement 1 O3 (72e-2fl) (zk) d=O =Z (k 2)! r ( f r c + 1)
z~
+
Le terme général de la série se comporte en e-2(fl-flc)kk-%. Ceci correspond à un comportement singulier de 2, au voisinage de pc en n (0 - pc)z et l’exposant y défini pour la seconde dérivée en /3 est négatif
y = -A (221) d=O 2 qui signifie que l’aire moyenne ne diverge pas au point critique. Ces conclusions ne sont pas affectées si on introduit dans le lagrangien les termes nécessaires pour supprimer tadpoles et insertions d’énergie propre. Bien entendu il s’agit d’un cas hautement irréaliste. I1 est possible de trouver aussi une solution explicite dans le cas d = -2 (Kazakov, Kostov, Migdal) où on trouve une somme ayant pour poids le nombre d’arbres complets du diagramme, équivalente à une théorie fermionique complexe. La série correspondante a aussi un rayon de convergence fini avec
d=-2
(222)
y=-1
Par ailleurs, Zamolodchikov a montré que la théorie perturbative appliquée à une valeur, non physique, de d grand et négatif produit les valeurs
d+-m
y = ‘6( d - 7 ) ,
u=o
Dans les références citées dans les notes, les auteurs donnent bien plus de résultats sur les cas solubles, d = O et d = -2 où la longueur de corrélation
(223)
386
XI.2.4
GEOMETRIE ALEATOIRE
diverge à la transition avec un exposant très petit, correspondant à une dimension de Hausdorff très grande. Ce résultat semble valable en WZ(@,)-~
dimension plus grande. Sur un réseau régulier on peut aussi étudier une théorie de champ moyen à d grand positif (chapitre VI). On se souvient que cette théorie correspond à
des polymères de cubes branchés avec d-++cc
y = ’2
1
Y = - = ’
dH
Une extrapolation hardie de ces résultats partiels semble indiquer que -y croît pour d -t 00 , tandis que la dimension de Hausdorff avec d et tend vers demeurerait très grande voire infinie.
On ne peut pas dire qu’on ait atteint un degré de compréhension très satisfaisant dans la théorie des surfaces aléatoires, sujet très riche et complexe. Nous n’avons pas discuté la somme sur les diverses topologies et nous n’avons pas non plus inclus d’informations sur les quantités géométriques extrinsèques. Par exemple, dans certaines applications physiques on peut avoir à considérer des cas où la tension est très faible ou nulle et ou la courbure moyenne (la somme des inverses des rayons de courbure principaux) joue un rôle prépondérant. D’autres degrés de liberté de membranes aléatoires peuvent aussi jouer un rôle important. I1 reste donc quantité de problèmes ouverts et la géométrie aléatoire semble promise à un bel avenir.
Notes La statistique géométrique est présentée dans l’ouvrage de L.A. Santal0 Integral Geometry and Geometrical Probability, Addison-Wesley, Reading (1976). Certaines applications à la physique de la matière condensée sont décrites par R. Collins dans Phase Stability of Metals and Alloys, P.S. Rudman, J. Stringer et R.I. Jaf€ee éditeurs, McGraw-Hill, New York (1967), et R. Zallen dans Fluctuation Phenomena, E.W. Montroll et J.L. Lebowitz éditeurs, North-Holland, Amsterdam (1979), et dans le livre de J.M. Ziman Models of Disorder, Cambridge University Press (1979). Les réseaux aléatoires poissonniens ont été étudiés par N.H. Christ, R. Friedberg et T.D. Lee, Nucl. Phys. B202, 89 (1982) B210 (FS6) 310, 337 (1982). Le travail de J.L. Meijering a paru dans Philips Research Report 8 , 270 (1953). Voir aussi l’article de H.G. Hanson, J. Stat. Phys. 30, 591 (1983) pour des considérations voisines. La contribution des auteurs en collaboration avec M. Bander est résumée dans New Perspectives in Quantum Field Theories, J. Abad, M. Asorey et A. Cruz éditeurs, World Scientific, Singapore (1986). Pour une étude des modèles statistiques sur des
XI.Notes
GEOMETRIE ALEATOIRE
387
réseaux aléatoires bidimensionnels voir D. Espriu, M. Gross, P.E.L. Rakow et J.F. Wheater, Nucl.Phys. B265 [FS15], 92 (1986). Les fermions de Dirac-Kahler sont discutés dans le travail de P. Becher et H. Joos, 2. Phys. C15, 343 (1982). C’est T. Regge qui a donné une formulation discrète de la gravitation dans un important article, Nuovo Cimento 19,558 (1961). Les problèmes de courbure d’une variété linéaire par morceaux et les questions de limite continue sont étudiés en profondeur par J . Cheeger, W. Müller et R. Schrader, Comm. Math. Phys. 92, 405 (1984). G. Feinberg, R. Friedberg, T.D. Lee et H.C. Ren, Nucl. Phys. B245, 343 (1984) abordent des questions analogues dans le cadre de la gravitation. Le modèle dual des interactions fortes en physique des particules a don,né naissance à une théorie des surfaces à la suite des travaux de Y. Nambu publiés dans Symmetries and Quark Models, édité par R. Chaud, Gordon et Breach, New York (1970), et T. Goto, Prog. Theor. Phys. 46, 1560 (1971) ainsi que d’autres auteurs. L’étude des surfaces aléatoires en tant que généralisation du mouvement brownien a été reprise par A.M. Polyakov, Phys. Lett. 103B, 207 (1981). Une revue incluant de nombreuses références, une discussion générale et de nombreux résultats exacts est due à J . Frohlich dans Applications of Field Theory to Statistical Mechanics, édité par L. Garrido, Lecture Notes in Physics 216, Springer, Berlin (1985). Notre présentation est fondée sur l’analyse de O. Alvarez, Nucl. Phys. B216, 125 (1983) et les leçons de D. Friedan aux Houches publiées dans Recent Advances in Field Theory and Statistical Physics, édité par J.-B. Zuber et R. Stora, North-Holland, Amsterdam (1984). L’inclusion de termes de courbure extrinsèque dans l’action trouve son origine dans les travaux de W. Helfrich, 2. Naturforsch. C28, 693 (1973) et J. Physique 46, 1263 (1985). Voir aussi A.M. Polyakov, NucZ. Phys. B268, 406 (1986). K. Fujikawa, Phys. Rev. D21, 2848 (1980), D23, 2262 (1981) a i n t r e duit des méthodes originales pour calculer les anomalies dans le cadre des intégrales fonctionnelles, méthodes utilisées dans le texte. La théorie des interfaces entre phases a une très longue histoire. Parmi des travaux récents citons D.J. Wallace et R.K.P. Zia, Phys. Rev. Lett. 43, 808 (1979), M.J. Lowe et D.J. Wallace, Phys. Lett. 93B, 433 (1980), J. Phys. A13, L 381 (1980), F . David, Phys. Lett. 102B, 193 (1981). Les modèles de surfaces discrets ont été introduits dans le contexte des théories de jauge par J.-M. Drouffe, G. Parisi et N. Sourlas dans un travail cité au chapitre VI, par D. Weingarten, Phys. Lett. 90B, 285 (1980), T. Eguchi et H. Kawai, Phys. Lett. llOB, 143 (1982), 114B, 247 (1982), par B. Durhuus, J . Frohlich et T. Jonsson, Nucl. Phys. B225 [FS9], 185 (1983), Phys. Lett. 137B, 93 (1984). D.J. Gross, Phys. Lett. 138B, 185 (1984), A. Billoire, D.J. Gross et E. Marinari, Phys. Lett. 139B, 75 (1984) et B. Duplantier, Phys. Lett. 141B, 239 (1984) ont considéré des modèles impliquant une triangulation fixe. La version discrète du modèle de Polyakov
388
GEOMETRIE ALEATOIRE
XI.Notes
et sa relation avec la limite planaire sont dus à F. David, Nucl. Phys. B257 (FS14), 543 (1985), V.A. Kazakov, I.K. Kostov et A.A. Migdal, Phys. Lett. 157B, 295 (1985) et J. A m b j ~ r n ,B. Durhuus et J. Frohlich, Nucl. Phys. B257 (FS14),433 (1985). Les calculs analogues dans la limite continue sont dus à A.B. Zamolodchikov, Phys. Lett. 117B, 87 (1982) et J. Jurkiewicz et A. Krzywicki, Phys. Lett. 148B, 148 (1984). Cette liste est loin d’être exhaustive. La littérature sur la théorie des cordes et des supercordes est devenue énorme. De nombreux travaux originaux sont rassemblés dans les volumes Dual Theory, édité par M. Jacob, North Holland, Amsterdam (1974 et 1984) et Superstrings, édité par J.H. Schwarz, World Scientific, Singapore (1985). M.B. Green, J.H. Schwarz et E. Witten ont donné une présentation très complète dans Superstring Theory, Cambridge University Press (1987).
INDEX
Cet index concerne les deux volumes de l'ouvrage. Les nombres en italique se réfèrent aux pages du volume 1, ceux en caractères romains à celles du volume 2.
Abe 154 Action de Hilbert-Einstein 346 Action de Liouville 351, 357, 373 Action de Nambu-Goto 359 Action de Villain 200, 324 Aimantation spontanée 59, 69 Algèbre de Clifford 51, 62 Algèbre de Kac-Moody 112, 165, 201, 220 Algèbre de Lie 322, 164, 202 Algèbre de Lie simplement lacée 164 Algèbre de Virasoro 107 Algèbre enveloppante 167 Algèbre super-conforme 195 Algorithme de Metropolis 54 Algorithme du thermostat 53 Alvarez 358 Amplitude de Born 276 Amplitudes critiques 186 Amputation 234 Analyse dimensionnelle 232 Anderson 229 Andrews, B u t e r , Forrester 164, 171 Anomalie 263, 102 Anomalie conforme 351 Approximants de Padé 41 Approximation de Bethe 119 Approximation de champ moyen 106
Approximation de MigdalKadanoff 175 Approximation des ondes de spin 194 Approximation gelée 80 Approximation planaire 283 Arbres de Cayley 14 Avron, Seiler 308 Baker, Nickel, Green, Meiron 310 B u t e r 143 B u t e r , Andrews, Forrester 164 Becchi-Rouet-Stora (BRS) 230, 239, 297 Belavin, Polyakov, Zamolodchikov 89, 163 Bender, Wu 40 Berezin 47 Berezinskii 197 Berlin-Kac 137 Berna1 317 Birapport 104 Bosonisation 94, 301 Boucle de 't Hooft 342 Boucle de Polyakov 59 Boucle de Wilson 335, 343 Boules de glu 374 Brézin, Le Guillou, Zinn-Justin 304 Brisure spontanée de symétrie 110 Caianiello 92 Caractères de Virasoro 133
390 Caractères des groupes 324 Caractéristique d’Euler 319, 343, 372 Cardy 132, 183 Cartan-Killing 164, 202 Cauchy 82 Cercles de Fisher 136 Champ de Dirac 300 Champ de Killing 364 Champ de Majorana 90, 139, 300 Champ libre 21 Champ moyen 105, 342 Champ primaire 99 Champs de Higgs 341 Champs de jauge 321 Champs euclidiens 21 Charge centrale 101 Cheeger, Müller, Schrader 346 Cheng-Wu 86 Chevalley, Serre 205 Christ, Friedberg, Lee 317 Chromodynamique quantique 322, 79 Classement topologique 241 Classification A-D-E 163, 332 Coleman 194 Complexe dual 339 Complexe topologique 336 Comptage de puissance 256 Conditions aux limites de NeveuSchwarz et Ramond 161, 198 Conductivité de Hall 308 Confinement 336 Construction de Dirichlet-Voronoi 318 Construction de Wulff 88 Convergence superficielle 257 Coracines 206 Correction du premier ordre 152 Corrections aux lois d’échelle 295 Couplage minimum 322 Courant de Noether 95 Creutz 63 Critère de Harris 295
INDEX
Critère de Landau-Ginzburg 155, 163 Cumulants 75, 234, 7 David 383 Degré canonique 232 Di Francesco, Saleur, Zuber 162 Diagrammes 1 Diagrammes articulés 245 Diagrammes de Coxeter-Dynkin 205 Diagrammes de Feynman 151 Diagrammes en arbre 151, 242 Diagrammes primitivement divergents 257 Diagrammes vide-vide 239 Différentielle quadratique 104 Dimension anormale 172, 237, 268 Dimension canonique 23, 237 Dimension critique inférieure 140 Dimension critique supérieure 140 Dimension d’échelle 92 Dimension de Hausdorff 379, 386 Dimension dynamique 237 Dotsenko 145, 148 Dotsenko, Dotsenko 295, 299, 307 Dualité de Kramers et Wannier 59 Dualité 58, 336 Dyson 304, 229, 246, 269 Décimation 173 Dérivée schwarzienne 103, 136 Déterminant de Faddeev-Popov 363 Déterminant de Kac 113, 118 Déterminant de Slater 278 Déterminant de Toeplitz 72 Déterminant de Vandermonde 74 Développement de basse température 24 Développement de couplage fort 357 Développement de haute température 32, 16 Développement en E 231, 284, 304 Développement en caractères 361 Echantillonnage sélectif 51
INDEX
Effet Casimir 105, 149 Effet Hall quantique 256 Effets de taille finie 68 Eguchi, Ooguri 163 Energie d’interface 70 Ensemble de Julia 190 Equation d’Airy 236 Equation d’état 163 Equation de Beltrami 362 Equation de Callan-Symanzik 229, 267, 278, 303 Equation de diffusion 3 Equation de Dirac 91 Equation de Fokker-Planck 76, 232 Equation de Langevin 76 Equation de Ricatti 232 Equation hypergéométrique 145 Equations de Painlevé 96 Equations du mouvement 142 Espace de Fock-Bargmann 49 Espace de Teichmuller 364 Espacements des niveaux 277 Exposant de Lyapounov 248 Exposants critiques 6, 123, 274 Facteurs associés à un groupe d’invariance 254 Fantômes de Faddeev-Popov 329, 30 Feigin-Fuchs 118 Ferdinand, Fisher 158 Fermions de Kogut-Susskind 383 Fermions de Wilson 380 Fisher 229, 231, 284, 70 Fisher-Gaunt 154 Fixation de jauge 29 Flot de renormalisation 209, 265 Fock-Bargmann 258 Fonction [ de Riemann 153 Fonction de Dedekind 113, 134, 193 Fonction de Green 7 Fonction de partition coulombienne 177
391
Fonction de partition frustrée 70, 83 Fonction de Weierstrass 195 Fonctions d’onde d’un oscillateur 278 Fonctions de corrélations connexes 234 Fonctions de Green 233 Fonctions de Green renormalisées 260 Fonctions de Green une particule irréductibles 234 Fonctions de Schwinger 233 Fonctions de vertex 234 Fonctions elliptiques 192 Fonctions génératrices 232 Forme contragrédiente 113 Formule d’Euler 285 Formule de Baker-CampbellHausdorff 327 Formule de Freudenthal 208 Formule de Gauss-Bonnet 345 Formule de Gell-Mann-Low 107 Formule de Hardy-Ramanujan 133 Formule de Kronecker 152 Formule de Kubo 310 Formule de Poisson 201, 164 Friedan 358, 376 Friedan, Qiu, Shenker 129, 175, 200, 220 Frustration 342, 172 Fujikawa 354 Gaudin 279 Gaz de Coulomb 192, 200, 272 Générateur de nombres aléatoires 55 Genre 285 Géométrie aléatoire 317 Gepner, Qiu 166 Gepner, Witten 166 Goddard, Kent, Olive 218, 224 Gradation 110 Graphe 1 Graphe tadpole 238 Gross-Neveu 299
392 Groupe de lacets 209 Groupe de renormalisation 265 Groupe de renormalisation Monte Carlo 49 Groupe de Weyl 204 Groupe dual 338 Groupe modulaire 152 Groupes d’homologie et de cohomologie 34 0 Haffnien 92 Halperin 230 Hioe, Montroll 294 Hohenberg 194, 215 ’t Hooft 283 Huse 171 Hypothèse d’hyper-homogénéité 162 Hypothèse d’échelle 162 Identité de Ward 142, 95, 99 Identité pentagonale d’Euler 134, 193 Identités de Ward-Slavnov 329 Intégrale de chemins il Intégrales de Feynman 241 Intégrales de Grassmann 47 Intégrales gaussiennes 21 Invariance conforme 90 Invariance d’échelle 87, 171 Invariance de jauge 322 Invariance de Weyl 360 Invariance modulaire 148 Invariant de Casimir 167, 208, 217 Jauge axiale 325 Kac 222 Kadanoff 165 Kadanoff-Ceva 85 Kaufmann 158 Kazakov, Kostov, Migdal 385 Lagrangien 229 Laplacien discret 3 Laughlin 269, 308 Lemme de Szego 72 Liberté asymptotique 321, 31, 306 Limite planaire 383 Limite thermodynamique 22
INDEX
Lipatov 304, 40 Loi de l’aire 336 Loi de Poisson 247 Loi du demi-cercle 271, 287 Loi en périmètre 336 Lois d’échelle 159 Longueur de corrélation 38 Longueur de localisation 252 Marche au hasard 1 Marche avec retour exclu 30 Matrice de Cartan 205 Matrice de transfert 36, 60, 133 Matrices aléatoires 269 Matrices de Dirac 378 Ma 49 McBryan-Spencer 218 McCoy-WU 75 Meijering 322 Mermin-Wagner 215 Mesure de Haar 21 Méthode de renormalisation Monte Carlo 71 Méthode des répliques 240 Méthode des variables de bloc 165 Modes de Goldstone 105, 115, 117 Modèle O(n) 116 Modèle X Y 190, 177 Modèle 2, 64 Modèle u 25, 105, 30, 347 Modèle d’Ashkin-Teller 139, 178 Modèle d’king 32, 57, 158, 188 Modèle d’Ising tricritique 201 Modèle de Gross-Neveu 79 Modèle de Heisenberg classique 25, 105 Modèle de Potts 173, 142, 178 Modèle de Wess-Zumino-Witten 209 Modèle des hexagones durs 143 Modèle gaussien 32, 135, 175 Modèle gaussien discret 202 Modèle hiérarchique 189 Modèle S.O.S. 80, 202, 372 Modèle sine-Gordon 203 Modèle sphérique 137
INDEX
Modèle vectoriel à n composantes 24, 254, 22, 30, 178 Modèle à six vertex 139 Modèles minimaux 130 Modules 364 Module de Verma 111 Monodromie 146 Mouvement brownien 232, 356, 379 Nickel 304 Niveau de Fermi 293 Niveaux de Landau 256 Nombre de boucles 242 Nombre de configurations 33 Nombre de Coxeter 167, 206, 208 Nombre de Coxeter dual 207 Noyau de Darboux-Christoffel 279 Noyau de la chaleur 324, 354, 368 Noyau reproducteur 266 Onsager 47, 57, 66, 73 Opérateur de Casimir 325 Opérateur de Laplace-Beltrami 324 Opérateur de vertex 139 Opérateurs de désordre 85 Opérateurs essentiels 171 Opérateurs inessentiels 171, 300 Opérateurs marginaux 171, 214, 300 Ordre de Wick 242, 122 Paramètre de saut 81 Paramètres nus 233 Parisi, Sourlas 267, 295 Parisi, Wu Yong Shi 76 Pasquier 164, 171, 178 Peierls 26 Pfaffien 55 Phase de Berry 312 Phénomène de Goldstone 125 Pippard-Ginsberg I62 Plaquette 58, 324 Poids 207 Poids conformes 97 Poids dominant 217 Point critique 39, 268
393
Point fixe infrarouge 168 Points multicritiques 311 Polyakov 317, 357, 376 Potentiel aléatoire 230, 260 Potentiel effectif 152, 235, 2-44 Probabilité de saut 337 Problème du doublement 378 Processus de Markov 5, 51 Produit quintuple de Watson 193 Propriétés d’intersection 16 Pseudo-fermions 83 Quantification radiale 107 Quantification stochastique 76 Queue de distribution de Lifshitz 236 Racines 203 Ralentissement critique 53, 62 Rapports d’amplitude 308 Rayon de giration 379, 382 Regge 346 Règle majoritaire 180 Règles de Feynman 238, 329 Régularisation C 153 Régularisation dimensionnelle 24 5 Relation d’Euler 4 Relation de Clausius-Mossotti 107 Renormalisation dans l’espace réel 159, 165 Renormalisation de fonction d’onde 259 Renormalisation perturbative 259 Renormalisation phénoménologique 220 Représentation adjointe 207 Réseau aléatoire 246 Réseau aléatoire 317 Réseau de Bethe 14 Réseaux 42 Schéma de renormalisation de Bogoliubov, Parasiuk, Hepp, Zimmermann 259 Schéma de soustraction minimale 329 Shankar 300, 307 Simulations microcanoniques 57
394 Singularité de Lee-Yang 123, 127, 129, 132, 151, 171 Somme de Gauss 194 Somme sur les chemins 9, 26 Somme sur les surfaces 358 Sous-algèbre de Cartan 202 Spectre hadronique 84 Sugawara 216 Super-champ 264, 297 Super-dérivée schwarzienne 198 Super-renormalisabilité 257 Supersymétrique 263 Surfaces aléatoires 343 Swendsen 49, 72 Symbole de Riemann-Christoffel 362 Séries 8 192 Séries de couplage fort 32 Séries de Gauss 146 Table de Kac 130, 143, 172 Temps de thermalisation 53 Tenseur impulsion-énergie 94 Tension de corde 336, 370 Tension superficielle 83 Terme de Schwinger 214 Théorie de Kirkwood-Yvon 107 Théorie de Liouville 376 Théorie perturbative 237 Théorème d’Elitzur 333 Théorème de Goldstone 293, 29, 84 Théorème de Kirchoff 5, 383 Théorème de l’index de AtiyahSinger 371 Théorème de Mermin-Wagner 140, 192 Théorème de Nielsen-Ninomiya 380 Théorème de Noether 94
INDEX
Théorème de Peter-Weyl 21 Théorème de von NeumannWigner 312 Théorème de Weinberg 268 Théorème de Wick 23, 55, 92, 96, 238, 28 Théorème du viriel 245 Tourbillons 194, 197, 138 Transformation de dualité 177, 201 Transformation de Jordan-Wigner 61 Transformation de Legendre 152, 156, 234, 10 Transformation de Mobius 96 Transformation étoiletriangle 180 Transformée de Laplace 149 Transition de Curie 57 Transition de Kosterlitz-Thouless 192, 197 Transition déconfinante 344 Transition de phase du deuxième ordre 68 Transition rugueuse 89, 202, 370 Transmutation dimensionnelle 295 Universalité 32 Variables anticommutantes 4 7 Variété triangulée 343 Vecteur de Killing 368, 372 Vecteur de plus haut poids 111 Wegner 260 Weyl 207 Wigner 229, 269 Wilson 49 Wilson 229, 231, 284, 304, 321, 72 Yang 73 Yang, Mills 321, 327 Zamolodchikov 30, 171, 385