Les Explications causales ()

Deuxième partie.
Explications physico-géométriques et réductionnisme a

par R. Garcia et J. Piaget

L’ambition constante de l’épistémologie génétique a été de chercher à relier les questions qui se posent à propos des niveaux les plus élémentaires de la connaissance à celles que soulève la théorie de la pensée scientifique elle-même. En fait, des problèmes tels que ceux de la formation du nombre, du rôle des correspondances ou « applications » des rapports entre les notions de temps et de vitesse, des relations entre la permanence des objets et la localisation spatio-temporelle, etc., nous ont sans cesse, non seulement permis mais même obligés à tenter de pareils rapprochements, car il semble presque évident que les destinées actuelles de tels concepts ou structures ne sont pas entièrement indépendantes de leur mode d’élaboration dès leurs racines préscientifiques.

Deux problèmes se sont en particulier présentés à nous récemment, à propos de la psychogenèse des explications causales, qui paraissent se retrouver à toutes les étapes du développement de la physique et dont un certain nombre de travaux récents de la physique théorique ont renouvelé les termes. Le premier est celui des relations entre les opérations géométriques du sujet et l’espace des objets, en tant que celles-là relèvent de structures logico-mathématiques et celui-ci de l’expérience physique. Le second concerne les relations entre cet espace physique et la dynamique, la question étant d’établir jusqu’à quel point la géométrie des objets demeure nécessairement solidaire d’un modèle dynamique, et non pas seulement cinématique, ou si elle en devient indépendante et peut même

aboutir, comme le pensent certains contemporains, à un retour au postulat cartésien d’une réduction totale des phénomènes à des « figures » et des « mouvements ».

C’est une discussion de ces deux problèmes que nous aimerions présenter en cette note, en combinant les ressources de l’épistémologie génétique et de l’analyse épistémologique inhérente à la physique théorique, cet essai constituant donc une tentative de recherche interdisciplinaire.[*]

[*Note FJP : nous appuyant sur ce que laisse penser à la fois le style de la section I sur « Les données de l’épistémologie génétique » et celui de la section II sur « Les positions des physiciens », mais aussi la dernière affirmation de la première section de la partie II du volume 26 des EEG qui désigne explicitement Rolando Garcia comme l’auteur de la seconde section (v. ci-après page 155), nous avons décidé d’attribuer à Piaget l’écriture de cette première section.]

I. Les données de l’épistémologie génétique

§ 1. Opérations géométriques
et espace des objets

Rappelons d’abord que, à remonter aux formes les plus élémentaires du savoir, on vérifie à tous les niveaux la distinction essentielle entre les connaissances physiques (au sens large) et les liaisons logico-mathématiques, comme l’admettent tant d’auteurs y compris les positivistes contemporains. Seulement cette opposition ne se réduit pas à celle des jugements synthétiques et analytiques, comme l’a prouvé Quine et comme nous l’avons contrôlé en montrant l’existence de nombreux intermédiaires génétiques entre eux1. Elle ne saurait non plus être ramenée à la distinction du langage et de l’expérience : d’une part, en effet, on trouve dès le niveau des schèmes sensori-moteurs antérieurs au langage des relations d’ordre, des emboîtements, des correspondances, etc., qui relèvent déjà de structures logico-mathématiques ; d’autre part, à côté de l’expérience physique qui tire son information des propriétés de l’objet, on peut parler d’une expérience logico-mathématique lorsque l’information est abstraite des actions ou opérations exercées par le sujet sur les objets ou des propriétés (ordre, classes, sommes, etc.) que ces actions introduisent momentanément dans les objets. En une telle perspective on peut donc admettre que la connaissance physique cherche à atteindre l’objet, en le décentrant du sujet, tandis que les liaisons logico-mathématiques expriment en leur source les coordinations générales de l’action, y compris celles qu’on retrouve en tout langage formalisable et finalement en toute structure opératoire.

(1) Vol. IV des Etudes.

Cela dit, le propre des espaces du sens commun est de pouvoir donner lieu à la fois à des constructions opératoires de nature déductive, comme c’est le cas des espaces mathématiques, et à des constatations physiques relevant d’expériences portant sur les objets. Dès les niveaux les plus élémentaires et même sensori-moteurs on peut distinguer ces deux pôles : la construction du groupe pratique des déplacements entre 12 et 18 mois comporte ainsi des mécanismes inférentiels, tandis que les multiples perceptions relatives aux formes et grandeurs des objets relèvent assurément de données inhérentes à l’expérience physique.

En ce qui concerne l’aspect opératoire et déductif de l’espace, il est en particulier frappant de constater le parallélisme étroit qui relie génétiquement la formation des opérations spatiales et des opérations logico-arithmétiques, bien que les premières portent sur le continu et les relations de voisinage tandis que les secondes groupent les objets discrets selon leurs ressemblances et différences qualitatives : l’emboîtement des parties d’un continu, l’ordre des positions, la mesure par synthèse de ces partitions et du déplacement ordonné de l’unité, les coordonnées, etc., se construisent ainsi en correspondance (mais non pas par filiation simple) avec les inclusions de classes, les sériations, le nombre par synthèse des emboîtements et de l’ordre, les structures multiplicatives (produits cartésiens, multiplications sériales, etc.), à deux ou trois dimensions logiques, etc.

Quant aux constatations empiriques relevant de l’espace physique, il est à noter avec soin que, si elles atteignent bien certaines propriétés des objets, c’est-à-dire certaines données existant indépendamment des activités du sujet, elles ne les rejoignent que par l’intermédiaire des opérations précédentes, ou de préopérations qui les annoncent, et qui sont alors « appliquées » à ces objets. Dès la perception des « bonnes formes » géométriques, telles qu’un cercle ou un carré, il intervient des schématisations au double sens du « schéma » simplificateur de Gonseth et des « schèmes d’assimilation » sur le rôle desquels l’un de nous a constamment insisté : par exemple si l’on cherche à mesurer la résistance d’une bonne forme perceptive (entre autres en ajoutant aux côtés supérieur et inférieur d’un carré des pennures comme dans l’illusion de Müller-Lyer, ce qui

tend à les rendre perceptivement inégaux), on constate que cette résistance varie en fonction du niveau opératoire du sujet, etc. La conservation des longueurs en cas de déplacement (ce qui revient par exemple à admettre l’indéformabilité d’une réglette déplacée de quelques centimètres) n’est reconnue par le sujet (vers 9 ans) que s’il parvient à évaluer ces longueurs métriquement (intervalle compris entre les extrémités) et à corriger ainsi les estimations ordinales initiales (ordre des points d’arrivée ou considération des dépassements dans le sens du mouvement, d’où le critère « plus long = arrivant plus loin »). L’horizontalité du niveau de l’eau n’est admise que moyennant l’emploi de références interfigurales, tandis que, jusque vers 9 ans, cette surface n’est prévue qu’en fonction de référence intrafigurale, donc de la forme du récipient qu’on incline, etc.

En un mot, il existe dès les débuts un espace opératoire et des propriétés spatiales inhérentes aux objets, mais le premier ne dérive pas simplement des secondes, ni l’inverse, et les secondes ne peuvent être atteintes que par l’intermédiaire du premier. Seulement les opérations spatiales dont nous avons parlé jusqu’ici ne sont encore, en cette dernière situation, que des opérations « appliquées » à l’objet, c’est-à-dire utilisées par le sujet lui-même dans ses lectures de l’expérience, en tant qu’instruments d’enregistrement ou d’assimilation à l’intention de ses propres constatations, mais sans référence à la causalité des objets.

Un second problème se pose alors aussitôt : en quoi consiste cet espace physique ou espace des objets ? Est-il lui-même de nature opératoire ou sa structure est-elle différente, et plus ou moins étrangère à celle des opérations dont se sert le sujet pour les atteindre ? Dans le cas de l’horizontalité du niveau de l’eau, par exemple, il est clair que, pour le sujet devenu capable de le constater, c’est l’eau elle-même qui donne à sa surface une forme plane et horizontale et ce n’est pas l’expérimentateur, bien qu’il incline le bocal en des positions variées : comment alors s’y prend-elle (dans l’interprétation du sujet) ? Du point de vue de cette recherche de l’explication causale, c’est donc l’eau, en tant qu’objet indépendant du sujet, qui devient un opérateur spatial puisqu’elle se donne une forme et qu’elle la reconstitue sans cesse malgré les changements

d’orientation du récipient. Nous parlerons en ce cas d’opérations « attribuées à l’objet » et non plus seulement « appliquées » par le sujet en tant qu’instruments nécessaires de lecture.

Or, les multiples recherches sur la causalité nous ont montré que celle-ci se réduit précisément à des ensembles d’opérations attribuées aux objets, autrement dit à des structures opératoires considérées comme inhérentes à ce que « font » les objets en leurs interactions multiples. Le problème est alors d’établir le rôle de l’espace physique, ou des opérations spatiales attribuées aux objets, au sein de ces structures causales.

§ 2. L’espace des objets
et la causalité physique

Une première différence évidente entre l’espace opératoire du sujet et l’espace physique des objets est que ce dernier est spatio-temporel, tandis que les opérations spatiales du sujet sont extratemporanées. C’est ainsi qu’un déplacement opératoire n’est qu’un changement de position (à six paramètres lorsqu’il est métrisé), tandis qu’un mouvement réel ou physique prend du temps et comporte donc une vitesse. Même les formes statiques des solides sont fonction de la durée, puisqu’elles se conservent plus ou moins longtemps selon le degré d’indéformabilité des objets qu’elles caractérisent. A tous les niveaux de développement, la géométrie des objets est donc solidaire d’une cinématique, et ceci ne soulève pas de problème psychogénétique étant donné le caractère très précoce de la notion de vitesse, d’abord fondée sur l’intuition ordinale du dépassement (comme les longueurs elles-mêmes) bien avant d’être considérée comme une relation e : t. La seule question à signaler à ce point de vue des structures spatio-temporelles est l’hétérogénéité initiale des espaces pleins et vides. Lorsque, par exemple, aucun solide n’est interposé entre deux objets A et B, la distance AB est, jusque vers 7-8 ans, jugée plus grande que si l’on place un mur entre A et B : en ce cas l’épaisseur du mur est d’une autre nature spatiale et est donc à défalquer, tandis que si le mur a des trous la distance reste la même. L’homogénéisation des longueurs pleines et des distances vides

soulève donc un problème et il est probable que sa solution est liée à la constitution des systèmes de référence, donc aux relations interfigurales, mais puisque celles-ci dépendent également du progrès des interactions causales, comme on va le voir, cette question rentre donc dans l’ensemble de celles qui restent à aborder.

En effet, si l’espace physique est solidaire d’une cinématique, l’analyse psychogénétique montre également que, à tous les niveaux de développement, il est lié de près à des interprétations dynamiques. Une raison de caractère général le fait comprendre dès l’abord : c’est que jusque vers 9 ans la force n’est pas dissociable du mouvement, non seulement parce que aucune force n’est concevable sinon en mouvement (« élan », etc.), ce qui dure jusque vers 11-12 ans, mais encore parce que, jusqu’à 7-8 ans inclusivement, tout mouvement englobe une force, sous la forme d’un « moteur interne » (comme l’admettait Aristote) et même si est reconnue en plus la nécessité d’un « moteur externe ». La notion primitive semble être celle de l’« action » au sens de fte ou de mve, ce qui rend toute cinématique solidaire d’une dynamique. L’indifférenciation du mouvement et de la force s’est d’ailleurs retrouvée périodiquement dans l’histoire de la physique, et l’on en discerne encore des traces actuelles en de mauvais manuels à propos de la « force » centrifuge, ce qui a donné lieu à de sévères remarques de Hertz.

Un premier exemple de cette solidarité entre l’espace physique et la dynamique est celui de la conservation des longueurs, déjà cité du point de vue des opérations « appliquées » par le sujet à la constatation des faits, mais qu’il importe de reprendre maintenant dans la perspective des opérations « attribuées » à l’objet. En effet, de ce second point de vue, le mouvement d’une réglette A que l’on déplace par rapport à une autre B, après que le sujet ait vérifié par superposition la congruence A = B, relève d’un opérateur spatial, mais la question (pour l’enfant jusque vers 9 ans) est de savoir lequel. Or, s’il peut se réduire à un simple opérateur de déplacement au cas où la longueur de l’objet est reconnue invariante, il peut également consister en un opérateur d’allongement ou d’étirement, comme si la réglette était élastique. En fait l’observation montre, et c’est ici qu’intervient la dynamique, que ces deux opérateurs demeurent longtemps indifférenciés, et cela pour des

raisons à la fois dynamiques (nature du mouvement transmis en tant que fte) et géométriques (défauts des références). D’une part la réglette est censée s’allonger et non pas seulement se déplacer : le sujet affirmera ainsi froidement que le dépassement de A par rapport à B est plus grand que le dépassement réciproque pourtant perçu de l’autre côté (B par rapport à A). D’autre part, lorsqu’on lui fait repérer l’allongement d’un élastique (ou celui de trois ressorts mis bout à bout après que l’enfant ait vérifié leurs étirements égaux lorsqu’ils sont suspendus parallèlement et munis des mêmes poids), cet allongement est conçu comme un simple déplacement des extrémités tirées (avec absence complète de distributivité ou de dilatation homogène, même dans le cas des trois ressorts). Il y a donc indifférenciation entre les déplacements (additifs) et les allongements (multiplicatifs) et la raison en est sans doute que le mobile passif comporte encore un « moteur interne ». Lorsque, au contraire (vers 9-10 ans), les notions de mouvement et de force sont suffisamment différenciées, le mobile passif subit simplement les effets d’une force active et ses mouvements peuvent alors être distingués selon les deux classes du déplacement et de l’allongement, par comparaison des points de départ (fixes dans le cas de l’élastique ou des ressorts retenus, variables dans le cas de la réglette) et des points d’arrivée ainsi qu’en référence avec un système extérieur. On constate du même coup que ces relations simplement géométriques (références internes ou externes) qui auraient pu sembler être accessibles indépendamment de toute dynamique, ne s’élaborent en fait qu’une fois suffisamment différenciés les forces et les mouvements.

Cette solidarité des références spatiales et de la dynamique, déjà claire mais surprenante en un problème aussi simple que la conservation des longueurs, est encore plus évidente dans le cas des coordonnées naturelles, verticale et horizontale. C’est ainsi que l’horizontalité de la surface de l’eau n’est anticipée (lors des inclinaisons du récipient) et même constatée (sinon la lecture comme telle demeure inexacte) qu’au niveau où elle est comprise causalement. Jusque vers 9 ans l’eau est « légère » et se répand n’importe où. Lorsqu’elle devient « lourde », elle tend au contraire vers le bas et, en cas de niveau momentanément incliné, les couches supérieures tendent donc à glisser

sur les inférieures jusqu’à égalisation à un niveau moyen horizontal. De même, en ce qui concerne la verticale, une baguette inclinée lâchée en certaines situations est censée, jusque vers 9 ans, tomber dans le sens même de son inclinaison et non pas verticalement, tandis qu’au niveau où s’élaborent les coordonnées naturelles, sa chute est verticale quelle que soit son orientation de départ : or, ici encore ce progrès dynamique dans l’interprétation du rôle du poids interfère nécessairement, comme dans le cas de l’eau, avec l’élaboration des références spatiales. Rappelons à cet égard que pour les jeunes sujets il faut plus de force pour retenir sur place un wagon sur un plan incliné que pour le faire monter car, immobile, il a tendance à descendre tandis que tiré vers le haut, cette tendance disparaît du fait même. Dès 8-9 ans cette tendance devient générale et c’est la conquête tardive de cette dynamique de la descente ou de la chute qui intervient dans les réussites des épreuves précédentes.

Un autre domaine où les facteurs spatiaux s’entrecroisent sans cesse avec la dynamique est celui des directions. Lorsque les jeunes sujets poussent ailleurs que face au centre une plaquette avec un crayon ils ne s’attendent pas à la voir tourner mais pensent lui imprimer un mouvement « droit » en avant. De même lorsqu’une boule en heurte une autre de côté la boule passive est censée partir dans le prolongement du trajet de l’active, etc. Dans les épreuves de ce genre, la coordination des translations et des rotations ou les déviations des deux boules lorsque le choc n’est pas donné en plein fouet ne sont comprises qu’une fois admis le rôle des résistances et la géométrisation ne progresse qu’en fonction de la solution progressive des problèmes dynamiques. De même, la loi de l’égalité des angles d’incidence et de réflexion, dans le cas des chocs contre une paroi rectiligne, n’est prévue que dans la mesure où le sujet entrevoit des modèles du type action et réaction.

En un mot, l’espace physique acquiert certes une structure opératoire en raison des opérations géométriques du sujet lui-même, car il ne saurait attribuer aux objets d’autres opérations spatiales que celles dont il s’est rendu maître en ses propres actions. Mais cela ne signifie pas que cette géométrisation se développe à sens unique dans la direction du sujet aux objets : c’est au contraire dans la mesure où les problèmes

dynamiques requièrent de nouvelles structurations que celles-ci sont peu à peu élaborées, de telle sorte que, en fin de compte, tout l’espace des objets pourrait être déduit de leur dynamique. Certes, celle-ci comporte elle-même des opérations spatiales, et, comme on l’a vu, la lecture comme telle des relations en jeu suppose déjà des opérations appliquées. Mais lorsqu’il s’agit de passer de l’application à l’attribution, l’espace des objets ne saurait être dissocié des autres composantes et c’est au sein des interprétations causales, dans la totalité de chaque système explicatif particulier, que s’achève la géométrisation. Il est donc possible de conclure que si correspondants entre eux que soient les opérations géométriques du sujet et les opérateurs spatiaux prêtés aux objets, les premières restent davantage liées aux opérations logico-arithmétiques, tandis que les seconds acquièrent une signification constamment dynamique.

§ 3. Les questions de réduction
ou d’assimilation réciproque

Les explications causales que peut atteindre l’enfant, même au stade de 11-12 à 15 ans au cours duquel se développent les opérations propositionnelles ou formelles, la combinatoire et les groupes de quaternalité, ne sont pas assez poussées pour que l’on puisse rechercher avec fruit si elles témoignent d’une réduction progressive de la mécanique à la géométrie ou si elles s’engagent dans la direction d’une assimilation réciproque entre les deux ensembles de facteurs. Certes leur union toujours plus intime, en particulier dans le cas des compositions vectorielles (11-12 ans), au sein desquelles le sujet comprend la modification des résultantes en cas d’intensités constantes et de directions variables ou l’inverse, semble témoigner d’une intégration progressive et à double sens. D’autre part, la solidarité constante que nous avons signalée entre l’espace physique et la dynamique paraît suggérer que, si elle s’impose dès la genèse, elle doit constituer un caractère plus ou moins constant de cet espace des objets.

Le moment est donc venu de passer à une comparaison avec l’histoire des sciences et le but du présent paragraphe n’est que

de poser certains problèmes, la suite de cet article étant destinée à y répondre. On y trouvera à cet égard une analyse des différentes positions adoptées par la physique, du xviie siècle à nos jours. Après que Descartes eut rêvé d’une physique (mais sans réussir à la constituer) entièrement réduite à la géométrie (figures et mouvements), celle-ci portant sur une « étendue » parallèle à la « pensée », donc à l’algèbre (avec fusion des deux dans la géométrie analytique), Newton réintroduit le dynamisme, mais en concevant l’espace avec le temps comme un contenant, et la dynamique comme un contenu, les relations entre les deux étant celles d’un ajustement nécessaire mais sans interaction proprement dite.

Avec la théorie de la relativité, l’économie est faite d’une force d’attraction à distance et la gravitation devient réductible à un système de mouvements inertiaux, dont les trajectoires suivent les courbures d’un espace riemanien. A première vue il y a là une géométrisation intégrale, donc un retour à l’idéal cartésien, avec réduction totale de la dynamique à l’espace-temps, et c’est ainsi que l’ont interprétée divers auteurs (Meyer-son et parfois H. Weyl, etc.). Mais Einstein lui-même admettait avec plus de profondeur une assimilation réellement réciproque : si les graves suivent les courbures de l’espace, celles-ci sont en fait provoquées par les masses, de telle sorte qu’il y a encore une dynamique et un espace ou un espace-temps mais entretenant entre eux des relations de solidarité inconnues de Newton. En effet, tandis que celui-ci s’en tenait à des rapports de contenant à contenu, ces derniers deviennent chez Einstein interdépendants (une telle interaction ayant été entre autres finement analysée par Brunschvicg).

Avec un certain nombre de contemporains par contre (voir § § 9 et 10), toute masse, d’une part, et tout processus dynamique, d’autre part, se réduisent à des formes ou à des transformations géométriques, de telle sorte qu’aucun corps ni aucun événement physiques ne sont plus à situer dans l’espace : ils sont eux-mêmes des parties de l’espace, la réduction rêvée par Descartes paraissant ainsi devenir une réalité effective.

Mais si nous comparons cette phase actuellement ultime de la pensée physique à ce que nous a montré la genèse, deux groupes de problèmes se posent inévitablement, et c’est de leur solution que dépendront l’interprétation épistémologique, idéa-

liste ou réaliste, de ces travaux et finalement la survie ou l’élimination du dynamisme.

I) Le premier ensemble de questions tient à la nature des opérations utilisées : s’agit-il d’opérations appartenant seulement à la géométrie du sujet et lui permettant de construire des modèles indépendamment d’une convergence de détail avec une réalité existant indépendamment de nous, ou s’agit-il d’opérations « attribuées à des objets », même si ces objets ne présentent plus aucun rapport avec ce que nos perceptions (subjectives mais usuelles) associent ordinairement à ce terme et ne demeurent « objectifs » que d’un point de vue cognitif élargi et intellectuellement épuré ?

a) Un sous-problème préalable consiste, une fois rappelé que les opérations spatiales du sujet sont extemporanées, à nous demander ce qu’implique le caractère spatio-temporel des espaces physiques utilisés par les théories en question. Il serait insuffisant de répondre que mathématiquement le temps est constitué simplement d’une quatrième dimension : la question est de savoir si l’irréversibilité propre à cette dimension, contrairement aux trois autres, fournit déjà quelque indication sur le caractère « appliqué » ou « attribué » des opérations qui l’utilisent. Or, dire qu’un électron est expulsé par un photon ou qu’un photon disparaît et transfère son énergie hv (ou lui est identique mais alors change de forme), ne serait-ce pas, même si l’on traduisait ces événements en pures opérations géométriques, attribuer ces opérations aux événements comme tels ? En effet, si le sujet-physicien peut aisément, grâce à ses propres opérations, remonter de là aux moments antérieurs où l’électron n’était pas encore expulsé ni le photon anéanti, les opérations utilisées pour interpréter le processus ne peuvent par contre pas être inversées car il s’agit des événements eux-mêmes en leur irréversibilité (et le groupe PCT qui imaginait pouvoir les inverser n’était précisément pas attribuable au réel). Le caractère spatio-temporel et non pas exclusivement spatial est donc un premier indice du caractère « attribué » des opérations en jeu, puisque le temps se rapporte à des événements et que ceux-ci impliquent une causalité.

b) Le second sous-problème revient à nous demander ce qu’est épistémologiquement un objet physique et si cette notion

disparaît en cas de géométrisation intégrale. Le propre d’un objet de pensée, ou logico-mathématique, est que les opérations du sujet peuvent le transformer à leur guise : un losange, par exemple, peut être déplacé, changé de dimensions, étiré par transformations affines, projeté, etc., ou modifié en toute autre figure, à la seule condition de se donner des règles cohérentes de transformations. Celles-ci sont donc illimitées pourvu qu’elles ne soient pas contradictoires, et la question n’est pas de les rendre possibles, mais seulement de choisir, parmi l’infinité des possibles, les plus intéressantes d’entre elles. Un objet physique au contraire obéit à des lois que ne saurait changer le sujet et celui-ci ne peut le transformer qu’à l’intérieur du cadre fixé par ces lois. Si tel est le cas, ce n’est pas en le concevant comme réductible à des éléments spatio-temporels que l’on change sa nature d’objet, même s’il prend tour à tour les formes d’un paquet d’ondes ou d’un corpuscule et même si on conçoit celui-ci comme une sorte de partie de l’espace en écartant tout ce que nos perceptions tactilo-kinesthésiques et visuelles attachent aux différents « corps » que nous appelons communément « objets » à notre échelle.

c) En troisième lieu une différence essentielle oppose les opérations du sujet à celles qui sont attribuées aux objets ainsi conçus : tandis que les premières ne sauraient être contredites par l’expérience, la validité des secondes est subordonnée à son contrôle. Or, il est clair que, si la spatialisation des objets de la physique facilite la construction de modèles déductifs, elle ne saurait en rien les dispenser de la confirmation par les faits expérimentaux eux-mêmes. Il y a donc là une raison décisive pour considérer les opérations en jeu comme attribuées à des objets.

Au total il semble évident que les êtres spatio-temporels ou cinématiques auxquels les nouvelles théories cherchent à réduire la physique n’en sont pas moins conçus comme indépendants du sujet : cela signifie que les opérations caractérisant leurs structures leur sont attribuées et ne sont pas subjectives au sens de l’idéalisme. D’autre part, comme une telle attribution paraît constituer le caractère le plus général de l’explication causale, le problème est alors de chercher à établir si cette causalité se réduit à une déduction cinématique ou si elle comporte quelque dynamisme.

II) Le second groupe de problèmes qu’il s’agit d’aborder est donc à centrer sur le sens de cette causalité et sur ce qu’elle laisse subsister de dynamisme éventuel. De façon générale les analogies entre les compositions opératoires et la causalité reviennent à ceci que toutes deux comportent une synthèse de transformations, rendant compte de la nouveauté des résultats, et de conservation assurant la liaison entre les états de départ et d’arrivée. La différence est par contre que les compositions opératoires sont dues à l’activité du sujet, tandis que la causalité est l’œuvre des objets conçus en tant qu’opérateurs. Or, dans les modèles causaux habituels où interviennent des masses, des actions, des forces et des énergies, le parallélisme entre la causalité et les opérations ne demeure qu’approché dans la mesure précisément où ce dynamisme reste étranger aux structures intemporelles. Dans le cas d’une géométrisation entière du réel l’isomorphisme entre les objets et les opérations du sujet tend au contraire à devenir complet : faut-il alors en conclure à une élimination du dynamisme et de la causalité elle-même ?

a) Une première raison d’en douter est que, si la réalité physique est conçue comme le siège de transformations spatiotemporelles, il subsiste une différence assez fondamentale entre elles et les transformations géométriques dues au sujet. En ce qui concerne celles-ci, le pouvoir est, on vient de le voir, entre les mains du sujet lui-même : dire que ce dernier ne constitue qu’un siège ou un théâtre et que les opérations jouent le jeu à elles seules ne change rien à l’affaire, car chaque opération est un acte et c’est leur ensemble (effectif ou virtuel) qui constitue le sujet. Lorsque, au contraire, une série de réactions se produit au sein d’un système, ce n’est pas en considérant chaque élément comme une figure spatio-temporelle, donc une « forme », que l’on échappe à cette évidence d’une interaction entre de telles « formes » : en effet, si ces « formes » ne sont pas celles que construit le sujet, donc si elles constituent des objets en tant qu’indépendantes de nous, il est alors clair que ces « formes » agissent les unes sur les autres, se transforment les unes les autres et exercent donc un pouvoir les unes sur les autres. Or, tandis que le pouvoir des opérations logico-mathématiques demeure intemporel, un pouvoir spatiotemporel implique une succession dans le temps et rien n’em-

pêche donc de l’assimiler à une relation causale, puisqu’il y a à la fois action d’un « objet » sur un autre, en tant que ces objets, quoique géométriques, ne dépendent pas de nous, et enchaînement des antécédents aux conséquents, en tant qu’ils possèdent aussi une cinématique.

b) S’il en est ainsi, on est alors conduit à supposer l’existence d’une dynamique, si épurée soit-elle par rapport aux intuitions habituelles. Dans le langage courant, il existe des corps et des mouvements, la dynamique intervenant lors des changements des uns ou des autres. A géométriser tout cela, les corps deviennent des « formes » et c’est à elles que sont attachés les mouvements. Mais comme chacune de ces formes conserve le pouvoir d’en modifier d’autres ainsi que leurs mouvements, c’est alors ce « pouvoir » qui joue un rôle dynamique et ce rôle est indispensable puisqu’il se confond avec la réalité même des transformations objectives dont l’existence ne saurait être niée. L’espace-temps n’est alors que la coordination de telles interactions, autrement dit le « champ » caractérisé par la connexion entre ces événements (voir la fin du § 10).

c) En effet, le grand intérêt de cette dynamique est qu’elle reste immanente aux opérateurs en jeu. Or, comme ceux-ci sont isomorphes (puisque géométriques) aux opérations du sujet, leur dynamisme, quoique proprement physique, peut échapper à l’analyse dans la mesure où l’on oublie que les « formes » en jeu sont en fait des objets, puisque autonomes et non organisés par nous. Par contre, dans la mesure où l’on explicite tous les présupposés physiques du système, une telle géométrisation, non seulement n’a rien d’idéaliste, mais encore apparaît comme un aboutissement logique de cette perpétuelle assimilation réciproque des structures spatiales et dynamiques qui s’ébauche dès les stades élémentaires du développement de la causalité : cette assimilation est même devenue si complète qu’on peut parler à son égard d’un « géométrisme dynamique » ou, comme va le dire Garcia, d’une « géométrodynamique », et non pas seulement de deux moments successifs de la doctrine.

II. Les positions des physiciens

§ 4. Les courants de pensée réductionnistes
dans la mécanique

A partir du moment où les physiciens du xviie siècle aboutissent à l’élaboration de la théorie de la mécanique — élaboration qui trouve en Newton son apogée — , le problème de l’interprétation des concepts de base sur lesquels repose la théorie reste posé. La relation entre la géométrie et la mécanique (c’est-à-dire entre l’espace physique muni de certaines propriétés géométriques, d’un côté, et la matière, de l’autre), est le nœud central des différends entre les diverses interprétations.

Newton établit la doctrine qui deviendra la position « officielle » de la physique jusqu’à la fin du xixe siècle. L’espace existe indépendamment des objets qui l’occupent et le temps existe indépendamment des objets et des processus qui durent. Il est vrai que Newton a géométrisé la physique, dans la mesure où les lois qu’il a énoncées et les opérations qu’il a définies ont réduit la solution des problèmes mécaniques à l’application d’une méthode de calcul. A. Koyré, dans ses Etudes newtoniennes (p. 29) considère qu’une des caractéristiques les plus importantes de la révolution newtonienne est « la géométrisation de l’espace, c’est-à-dire la substitution de l’espace-dimension, homogène et abstrait, de la géométrie euclidienne (pourtant considéré alors comme réel) à l’ensemble continu, concret et différencié des « lieux » de la physique et de l’astronomie prégaliléennes ». Et il ajoute : « En fait cette caractérisation est à peu près équivalente à la mathématisation (géométrisation) de la nature et par conséquent à la mathématisation (géométrisation) de la science. » Or, sa géométrisation ne résout pas le problème, mais elle le présente d’une façon encore plus aiguë. L’espace a sa

propre géométrie, qui est celle d’Euclide. Les choses qui occupent cet espace ont des propriétés qui peuvent s’exprimer par des nombres (par exemple : la masse). Ces nombres sont considérés comme étant des valeurs des arguments de fonctions qui sont reliées entre elles au moyen de principes (ou des lois). Le mouvement des corps peut, dès lors, être « expliqué » par le comportement de ces fonctions. Les propriétés géométriques des fonctions correspondent donc aux propriétés du mouvement. Mais le mouvement lui-même est déterminé par les propriétés des objets.

Avant les Principia de Newton, Descartes avait déjà essayé de réduire la physique à la mécanique, et celle-ci à la géométrie. La seule propriété de la matière qui est retenue par Descartes est l’étendue, qui est une propriété géométrique : « Ceux qui prétendent distinguer la substance matérielle de l’étendue ou de la quantité, ou bien ne mettent aucune idée sous le nom de substance, ou bien ont l’idée confuse d’une substance immatérielle. » Néanmoins, Descartes n’accepte pas l’existence d’un espace physique indépendant, c’est-à-dire d’un espace vide. Il y a une ambiguïté jamais résolue chez les cartésiens : l’étendue est liée aux corps mais elle s’identifie aussi avec l’espace. Pour cette raison, Descartes rejette l’espace absolu mais, en même temps, il traite l’espace comme une notion fondamentale dans son essai de géométrisation de la mécanique.

Huyghens et Leibniz vont « contester » la position de Newton avec plus de profondeur et de cohérence que les cartésiens. L’espace et le temps absolus sont rejetés. Les propriétés géométriques de l’espace physique, ainsi que les relations temporelles, sont données par les événements physiques.

A partir de cette période historique on pourrait, dans une certaine mesure, parler d’un jeu dialectique qui passe par différentes étapes, dans lesquelles la conception que les savants se font du mouvement oscille entre une subordination de la géométrie aux propriétés de la matière et une emphase résolue du côté des aspects géométriques. Huyghens, Leibniz, Riemann, Clifford, Mach et Einstein sont dans le premier groupe. Descartes, d’Alembert, Lagrange, Hamilton, Hertz et quelques-uns parmi les relativistes contemporains (comme Meisner et Wheeler), sont dans le deuxième. Aucune de ces deux listes n’est, bien entendu, exhaustive, ni la distinction toujours très nette ;

notre intention n’est pas de faire une analyse historique approfondie mais plutôt de montrer deux courants de pensée qui constituent, à notre avis, deux lignes de progrès qui convergent. La position newtonienne restera, néanmoins, même après la profonde révision de ses fondements qui a été faite à partir de la fin du xixe siècle. Whitehead essayera, quand même, de retourner au dualisme espace structuré - matière, à l’intérieur du contexte relativiste. Dans son livre The Principle of Relativity il déclare emphatiquement : « Il est inhérent à ma théorie de maintenir l’ancienne division entre physique et géométrie. La physique est la science des relations contingentes de la nature et la géométrie exprime its uniform relatedness. »

§ 5. Huyghens et leibniz contre newton

La mécanique de Newton est basée sur une théorie du mouvement absolu. Dans l’Introduction aux Principia, Newton donne des définitions d’espace et de temps absolus. L’espace et le temps sont caractérisés comme des entités qui existent indépendamment des objets et qui fournissent la mesure des événements spatio-temporels. L’espace newtonien doit être considéré comme étant au repos. Quand il introduit l’accélération dans ses lois du mouvement, il est évident qu’il s’agit de l’accélération par rapport à l’espace.

Il est important de souligner, néanmoins, que le besoin d’introduire un espace absolu provient, chez Newton, de la dynamique et non de la cinématique. L’état de mouvement d’un corps se manifeste par l’occurrence de forces. Dans la célèbre polémique entre Leibniz et Clarke, celui-ci — qui parle évidemment en représentation de Newton — invoque la force centrifuge comme la preuve dernière et irréfutable d’un mouvement absolu. Curieusement, l’Introduction aux Principia contient une déclaration explicite de l’auteur d’après laquelle il « n’a pas considéré leurs principes en physicien, mais en simple géomètre ».

Malgré l’énorme révolution que la conception newtonienne de la mécanique a signifiée, les bases mêmes sur lesquelles la

nouvelle structure fut édifiée ont été « contestées » depuis son origine. Du point de vue qui nous intéresse ici, les deux contestateurs les plus importants — à part les cartésiens — ont été Huyghens et Leibniz.

D’après Leibniz, seulement les objets physiques et ses états sont présupposés comme « donnés » et c’est sur la base de certaines relations entre eux que nous construisons ensuite l’ordre du temps et de l’espace. La causalité est la relation physique qui conduit à l’ordre dans le temps. Si deux états physiques sont en relation de cause à effet, la cause est définie comme l’état antérieur et l’effet comme l’état postérieur. « Le temps c’est l’ordre des choses non simultanées. » Et « l’espace est l’ordre des choses coexistantes ». D’après Leibniz il n’y a « aucune réalité absolue hors des choses ».

Leibniz est un relativiste dans sa conception du mouvement. Néanmoins, il admet que « en réalité chaque corps a un certain degré de mouvement ou, si vous voulez, de force », et de là à conclure qu’« il existe dans la nature quelque chose que la géométrie ne peut pas déterminer ». A part l’étendue, qui est purement géométrique, il y a quelque chose qui est plus important et qui détermine le mouvement : la force. Le mouvement acquiert ainsi une signification métaphysique : « Ayant tâché d’approfondir les principes mêmes de la mécanique, pour rendre raison des lois de la nature, que l’expérience faisait connaître, je m’aperçus que la seule considération d’une masse étendue ne suffisait pas, et qu’il fallait encore employer la notion de la force qui est très intelligible, quoiqu’elle soit du ressort de la métaphysique. » Néanmoins Leibniz rejette la conception newtonienne de la gravitation qu’il trouve inexplicable. Dans sa lettre à Huyghens, datée d’octobre 1690, il déclare : « Après avoir bien considéré le livre de M. Newton que j’ai vu à Rome pour la première fois, j’ai admiré, comme de raison, quantité de belles choses qu’il y donne. Cependant je ne comprends pas comment il conçoit la pesanteur, ou attraction. Il semble que selon lui ce n’est qu’une certaine vertu incorporelle et inexplicable, au lieu que vous l’expliquez très plausiblement par les lois de la mécanique. »

Huyghens, dans sa réponse, manifeste son accord à propos de ce jugement sur Newton : « Pour ce qui est de la cause du reflux que donne M. Newton, je ne m’en contente nullement,

ni de toutes les autres théories qu’il bâtit sur son principe d’attraction, qui me parait absurde, ainsi que je l’ai déjà témoigné dans l’Addition au Discours de la pesanteur. Et je me suis souvent étonné, comment il s’est pu donner la peine de faire tant de recherches et de calculs difficiles, qui n’ont pour fondement que ce même principe. » Cependant, dans une autre partie de sa correspondance avec Leibniz, il apparaît comme un relativiste plus cohérent que celui-ci : « Je ne peux pas être d’accord avec vous en ce qu’un nombre de corps qui sont mutuellement en mouvement relatif aient un certain degré de mouvement ou de force véritable. » Malheureusement, Huyghens n’a pas réussi à résoudre le problème newtonien de la rotation absolue.

§ 6. Le cartésianisme
de d’alembert a hertz

6.1. Le XVIIIe siècle

Descartes voulait baser la physique tout entière sur la mécanique qu’il se représentait comme une pure géométrie du mouvement.

Les idées essentielles de Descartes sont résumées dans les deux passages suivants de ses œuvres :

A propos de la matière il affirme :

A propos de la matière il affirme :

En ce qui concerne le mouvement, il le définit comme :

En ce qui concerne le mouvement, il le définit comme :

Il faut remarquer que la contribution effective de Descartes au développement de la mécanique est pratiquement nulle. Dans sa fameuse polémique avec Leibniz il ressort clairement que son idée de quantité de mouvement est erronée dans la mesure où il la conçoit comme étant une grandeur scalaire et non vectorielle. C’est pourquoi ses déductions sur le comportement des systèmes mécaniques, en particulier ses célèbres sept règles sur le choc de corps élastiques, sont fausses. Néanmoins, Mach lui-même, si implacable pour juger ses erreurs, lui reconnaît un mérite singulier.

Il faut remarquer que la contribution effective de Descartes au développement de la mécanique est pratiquement nulle. Dans sa fameuse polémique avec Leibniz il ressort clairement que son idée de quantité de mouvement est erronée dans la mesure où il la conçoit comme étant une grandeur scalaire et non vectorielle. C’est pourquoi ses déductions sur le comportement des systèmes mécaniques, en particulier ses célèbres sept règles sur le choc de corps élastiques, sont fausses. Néanmoins, Mach lui-même, si implacable pour juger ses erreurs, lui reconnaît un mérite singulier.

On pourrait affirmer que tout le xviiie siècle, à commencer par Euler, les Bernoulli et Clairault, et surtout à travers d’Alembert et Lagrange, va chercher, d’une façon ou d’une autre, ce point de vue « plus général » qui permettrait de contourner les difficultés propres à la formulation newtonienne.

D’Alembert occupe une position très particulière dans cette liste à cause de sa façon explicite de se pencher sur l’analyse des concepts de base. Dans son Traité de dynamique, non seulement « les lois de l’équilibre et du mouvement des corps sont réduites au plus petit nombre possible, et démontrées d’une manière nouvelle » — d’après le sous-titre de l’ouvrage — mais on trouve là aussi « l’examen d’une autre question importante, proposée par l’Académie royale des Sciences de Prusse, si les lois de la statique et de mécanique sont de vérité nécessaire ou contingente ».

Dans le « Discours préliminaire » de cette œuvre, d’Alembert affirme dès le début que « la certitude des mathématiques est un avantage que ces sciences doivent principalement à la simplicité de leur objet ». Néanmoins, toutes les parties des mathématiques n’ont pas la même simplicité. En réalité, « il n’y a (…) que celles qui traitent du calcul des grandeurs et des propriétés générales de l’étendue, c’est-à-dire l’algèbre, la géométrie et la mécanique, qu’on puisse regarder comme marquées au sceau de l’évidence ». Or, les trois ne se trouvent pas dans le même plan. Il y a une gradation qui va de l’algèbre à la géométrie, et de celle-ci à la mécanique, en augmentant la

complexité de leur objet et, en conséquence, en diminuant leur degré d’évidence. La raison doit être cherchée — d’après d’Alembert — dans le fait que « l’obscurité semble s’emparer de nos idées à mesure que nous examinons dans un objet plus de propriétés sensibles ».

C’est précisément de ce point de vue — c’est-à-dire de la position relative des sciences en ce qui concerne la « certitude » qui lui est propre, que d’Alembert juge de son œuvre : « On a appliqué heureusement l’algèbre à la géométrie, la géométrie à la mécanique, et chacune de ces trois sciences à toutes les autres, dont elles sont la base et le fondement. »

Pour d’Alembert le mouvement et ses propriétés générales sont le premier et le principal objet de la mécanique. Mais l’existence du mouvement est « supposée sans aucune autre hypothèse particulière ». Les trois principes à partir desquels il va essayer de trouver la solution de tous les problèmes du mouvement sont les principes de la force d’inertie, du mouvement composé et de l’équilibre. Les trois sont, pour d’Alembert, des vérités nécessaires.

Pour d’Alembert le mouvement et ses propriétés générales sont le premier et le principal objet de la mécanique. Mais l’existence du mouvement est « supposée sans aucune autre hypothèse particulière ». Les trois principes à partir desquels il va essayer de trouver la solution de tous les problèmes du mouvement sont les principes de la force d’inertie, du mouvement composé et de l’équilibre. Les trois sont, pour d’Alembert, des vérités nécessaires.

Le concept de force ne rentre dans la mécanique de d’Alembert qu’en tant qu’impulsion produite par des chocs. La seule définition de force utilisée est de type cinématique, donnée par une relation de la forme ft = v.

Le programme de d’Alembert est nettement de style cartésien. Mais il s’éloigne des cartésiens — qu’il traite, d’ailleurs, d’une façon dédaigneuse — sur deux points fondamentaux. Le premier se réfère à l’identification entre la matière et l’extension.

D’Alembert rejette l’idée de considérer l’étendue et la matière comme une même chose. Au contraire, il considère deux sortes d’étendue :

D’Alembert rejette l’idée de considérer l’étendue et la matière comme une même chose. Au contraire, il considère deux sortes d’étendue :

mesure de la distance d’un corps à un autre, et dont les parties envisagées comme fixes et immobiles puissent servir à juger du repos ou du mouvement des corps. Il nous sera donc toujours permis de concevoir un espace indéfini comme le lieu des corps, soit réel, soit supposé, et de regarder le mouvement comme le transport du mobile d’un lieu dans un autre. »

Bien que les idées exprimées ici soient newtoniennes, le programme suivi pour traduire en équations les lois du mouvement est, comme nous l’avons déjà indiqué, clairement cartésien.

La deuxième divergence à l’égard des cartésiens est l’éta-blissement d’une différence fondamentale entre la géométrie et la mécanique.

La deuxième divergence à l’égard des cartésiens est l’éta-blissement d’une différence fondamentale entre la géométrie et la mécanique.

Cette considération du rôle du temps dans la mécanique ne sera pas complètement comprise, comme chacun sait, jusqu’à la théorie de la relativité.

La ligne de pensée de d’Alembert sera continuée par Lagrange dans sa Mécanique analytique, considérée par les historiens de la science comme « l’œuvre qui résume et couronne tout l’effort du xviiie siècle vers l’élaboration d’une mécanique rationnellement organisée » (R. Dugas, Histoire de la mécanique).

Lagrange considère que le principe du levier et le principe de la composition de forces sont suffisants pour servir de fondement à la statique, mais il s’oppose à ceux qui réduisent ce dernier « à n’être qu’un résultat de constructions géométriques ou d’analyse ».

Lagrange considère que le principe du levier et le principe de la composition de forces sont suffisants pour servir de fondement à la statique, mais il s’oppose à ceux qui réduisent ce dernier « à n’être qu’un résultat de constructions géométriques ou d’analyse ».

Néanmoins, il développera sa statique sur la base d’un seul principe plus général, le principe des vitesses virtuelles, dont il affirme :

Néanmoins, il développera sa statique sur la base d’un seul principe plus général, le principe des vitesses virtuelles, dont il affirme :

Il semblerait que Lagrange continue, dans une certaine mesure, la ligne de pensée de Leibniz (c’est l’opinion de Duhem, par exemple), en situant le concept de force, en tant que notion fondamentale, au point de départ de sa construction de la mécanique. Mais cette ressemblance, qui n’est qu’une apparence, comme nous allons le voir, s’appuie sur le fait que la « mécanique analytique » commence avec la définition de « force ou puissance » comme « la cause, quelle qu’elle soit, qui imprime ou tend à imprimer du mouvement au corps auquel on la suppose appliquée ». Hertz fera remarquer plus tard que Lagrange « doit certainement avoir aperçu la difficulté logique d’une telle définition ». Cependant, Lagrange ne fait aucune élaboration postérieure de ce concept de force ; par contre, il continue la procédure adoptée par d’Alembert, en exprimant la force par la vitesse divisée par le temps.

Lagrange, contrairement à d’Alembert, ne fait aucune analyse des concepts fondamentaux. Son but est de « réduire la mécanique à des opérations purement analytiques » et il l’atteint avec une parcimonie et une rigueur extraordinaires. En ce faisant, il manifeste, indirectement, un cartésianisme implicite.

La notion de force apparaît dans les équations de Lagrange comme subsumée dans un concept élargi : celui de force généralisée. De cette façon, il perd son caractère de concept fondamental, irréductible à d’autres concepts. La structure qui en résulte s’écarte donc de la tradition leibnizienne.

6.2. Hertz et l’Évanouissement de la force

Dans son Introduction à son ouvrage Les principes de la mécanique, Hertz résume clairement les fondements de ce qu’il appelle the customary representation of mechanics. Les principaux bâtisseurs de cette « représentation » dans son déroulement historique sont, d’après Hertz, Archimède, Galilée, Newton et Lagrange. Les idées de base sont celles d’espace, temps, force et masse. L’idée de force est introduite comme la cause du mouvement, existant avant le mouvement lui-même

et indépendamment de lui. Les interconnexions sont expliquées de la façon suivante :

et indépendamment de lui. Les interconnexions sont expliquées de la façon suivante :

Hertz soumet à un examen critique approfondi cette façon de fonder la mécanique, et il essaie de la reconstruire sur des fondements plus clairs, en réduisant au minimum les concepts fondamentaux. Ses Principles of Mechanics — dernière œuvre écrite peu avant sa mort, quand il n’avait que 37 ans — provoquent l’admiration — sinon l’acceptation totale — de deux critiques aussi sévères que Mach et Boltzmann.

Principles of Mechanics

De son côté, Boltzmann affirmera que :

De son côté, Boltzmann affirmera que :

Etant donné les caractéristiques de la reconstruction de la mécanique réalisée par Hertz, les deux jugements qui viennent d’être cités acquièrent une grande importance, dans la mesure où ils montrent clairement jusqu’à quel point un certain degré d’arbitraire était admis comme inévitable par les physiciens qui ont travaillé avec le plus d’intensité sur les problèmes du fondement de la mécanique, dans la période de transition entre le xixe et le xxe siècle.

Dans sa reconstruction de la mécanique, Hertz utilise seule-

ment les trois concepts fondamentaux, et indépendants, de temps, espace et masse, considérés en tant qu’objets d’expérience. Il cherche, tout d’abord, les connexions entre ces idées par couples. Les relations entre l’espace et le temps constituent la cinématique. Il n’y a pas de relations qui connectent uniquement la masse et le temps. Par contre, entre la masse et l’espace il y a des relations et elles sont importantes. Certaines positions et certains changements de position sont prescrits comme possibles pour les masses, en toute indépendance du temps, tandis que tous les autres sont considérés comme impossibles. Ces connexions ne sont applicables qu’aux positions relatives des masses entre elles. Elles doivent être respectées de même que certaines conditions de continuité. Hertz construit, sur cette base, la mécanique, en faisant la connexion entre les trois notions fondamentales dans une même loi : « Tout mouvement naturel d’un système matériel indépendant consiste en ceci que le système continue avec une vitesse uniforme le chemin le plus rectiligne possible. » Comme Hertz lui-même l’indique, cette loi condense dans un seul et même principe le principe de l’inertie et le principe de la moindre contrainte de Gauss. Il l’exprime ainsi : « Si les connexions du système pouvaient être momentanément détruites, ses masses se disperseraient avec un mouvement en ligne droite et de vitesse constante ; or, comme ceci est impossible, elles essaient de se rapprocher autant que possible d’un tel mouvement. » C’est à partir de ce principe, et en s’appuyant surtout sur les moyens que la mécanique analytique de Lagrange lui offre, que Hertz reconstruit la mécanique.

Cet essai de reconstruire toute la mécanique sur une seule loi de moindre contrainte a deux conséquences importantes. Premièrement, le concept de force en tant qu’idée fondamentale disparaît. Il est remplacé par celui de liaison entre les masses. Deuxièmement, Hertz est forcé de faire une supposition hasardeuse : « En ce qui concerne les masses, nous établirons que, outre les masses reconnaissables par les sens, des masses cachées peuvent être introduites par hypothèse. » Le remplacement des forces par des « liaisons » oblige à supposer que, quand celles-ci ne sont pas visibles, il y a des masses cachées animées de mouvements cachés. Cette idée quelque peu surprenante n’est pas, néanmoins, moins acceptable ou moins

troublante que les actions à distance admises dans la mécanique newtonienne. Si les idées de Hertz ne trouvent pas de partisans et de continuateurs ce n’est pas à cause du fait qu’elles soient rejetées pour des raisons théoriques. « Le modèle construit par Hertz indépendamment de l’expérience — souligne Boltzmann — possède une perfection et une évidence certaines ; il ne contient que peu d’éléments arbitraires. » Mais une telle mécanique est difficile à concevoir dans ses applications pratiques. Le jugement définitif de Boltzmann est celui-ci :

troublante que les actions à distance admises dans la mécanique newtonienne. Si les idées de Hertz ne trouvent pas de partisans et de continuateurs ce n’est pas à cause du fait qu’elles soient rejetées pour des raisons théoriques. « Le modèle construit par Hertz indépendamment de l’expérience — souligne Boltzmann — possède une perfection et une évidence certaines ; il ne contient que peu d’éléments arbitraires. » Mais une telle mécanique est difficile à concevoir dans ses applications pratiques. Le jugement définitif de Boltzmann est celui-ci :

L’œuvre de Hertz reste, ainsi, comme une œuvre dont la valeur est seulement académique, mais elle peut être considérée comme l’aboutissement du type de spéculation caractéristique du xviie siècle. Hertz ferme ainsi, à la fin du xixe siècle, le cycle commencé avec Galilée, Descartes, Newton et Huyghens. Après un siècle et demi d’efforts, la construction demeure inachevée. Le xxe siècle trouvera des meilleures solutions, mais non sans avoir dû préalablement pénétrer plus profondément encore dans les fondements et avoir soumis à la critique non seulement les idées de masse et de force, mais aussi, et surtout, les concepts d’espace et de temps. Cette œuvre sera celle d’Einstein, lequel reprendra — probablement sans le savoir — la ligne de pensée qui commence avec Leibniz.

§ 7. La renaissance
des idées leibniziennes

Dans sa fameuse conférence de 1854 — publication posthume faite par Dedekind, en 1867 — Riemann introduit une idée révolutionnaire sur les rapports entre la géométrie et la physique. Riemann généralise la théorie développée par Gauss

à propos du concept de courbure d’une surface en l’appliquant au cas des variétés d’un nombre arbitraire de dimensions. Il arrive ainsi à concevoir l’idée — qu’Einstein reprendra plus tard — d’un espace illimité mais fini :

à propos du concept de courbure d’une surface en l’appliquant au cas des variétés d’un nombre arbitraire de dimensions. Il arrive ainsi à concevoir l’idée — qu’Einstein reprendra plus tard — d’un espace illimité mais fini :

La notion centrale utilisée ici est celle de subordination des propriétés de l’espace aux propriétés de la matière. Le paragraphe le plus important de cet exposé de Riemann établit que :

La notion centrale utilisée ici est celle de subordination des propriétés de l’espace aux propriétés de la matière. Le paragraphe le plus important de cet exposé de Riemann établit que :

L’interprétation la plus claire des idées de Riemann a été faite par H. Weyl dans son livre Temps, espace, matière (p. 84) :

Temps, espace, matière

que l’espace en soi n’est pas autre chose qu’une multiplicité tridimensionnelle amorphe et que c’est le contenu matériel qui le remplit qui lui donne sa forme et détermine ses rapports de mesure. »

Einstein ira plus loin encore que Riemann. D’après sa Théorie générale de la relativité, un espace vide, c’est-à-dire un espace sans champ, n’existe pas. Si le champ gravitationnel est éliminé il ne reste « absolument rien, pas même un espace topologique », car les fonctions qui décrivent le champ gravitationnel « ne décrivent pas seulement le champ, mais aussi simultanément les propriétés de structure topologiques et métriques de la multiplicité »1.

L’élimination de la notion d’espace du fondement de la mécanique avait été déjà proposée par Mach vers la fin du xixe siècle. Mach critiqua la conception de Descartes d’après laquelle toute la physique était basée sur une mécanique conçue comme une pure géométrie du mouvement. Descartes n’avait pas une idée claire de la masse et, en conséquence, il n’a pas pris en considération le fait qu’« une mécanique n’est possible que lorsque les situations des corps dans leur dépendance réciproque sont déterminées par un rapport de forces fonction du temps » (Mach, La mécanique, p. 272).

D’après Mach l’espace complètement vide n’a pas de structure. Les propriétés géométriques de l’espace sont déterminées exclusivement par la matière qui l’occupe. Dans une certaine mesure, on peut dire qu’il y a ici une reformulation de la position de Leibniz et de Riemann. Mais Mach continue un peu plus loin encore l’analyse et remet en question le concept d’inertie tel qu’il apparaît dans les lois de Newton. « Dire qu’un corps conserve sa vitesse et sa direction dans l’espace est simplement une manière abrégée de s’en référer à l’univers entier. » Le mouvement d’un corps K n’est pas rapporté à l’espace. Au lieu de cela on fait l’étude directe des relations de K avec tous les corps de l’univers. Ainsi « au lieu de dire que la vitesse d’une masse M de l’espace reste constante en grandeur et en direction, on peut dire aussi que l’accélération moyenne de cette masse M par rapport aux masses m, m’, m", …, situées aux distances r, r’, r", …, est nulle, ou bien que cette dernière

(1) A. Einstein, La relativité et le problème de l’espace, Paris, Gauthier-Villars, 1956.

expression est équivalente à la première si l’on envisage un nombre suffisant de masses suffisamment grandes et éloignées. L’influence mutuelle des petites masses plus rapprochées, qui sont en apparence indépendantes les unes des autres, disparaît ici d’elle-même » (ibid., p. 227).

L’idée centrale de Mach est que toutes les masses sont en relation mutuelle. Même dans le cas le plus simple, dans lequel apparemment nous ne traitons que de l’action mutuelle entre deux masses, il est impossible de laisser de côté le reste de l’univers. Mach répond ainsi à la dernière question de Clarke, que la mort de Leibniz laissa sans réponse. Il n’y a pas de rotation absolue. Dans l’expérience du seau rempli d’eau et animé d’un mouvement de rotation, les forces centrifuges apparentes « sont éveillées » par le mouvement relatif de l’eau « par rapport à la masse de la terre et aux autres corps célestes ». « D’après moi — dit Mach — il n’existe somme toute qu’un mouvement relatif et je n’aperçois à cet égard aucune distinction entre la rotation et la translation. Une rotation relativement aux étoiles fixes fait naître dans un corps des forces d’éloignement de l’axe ; si la rotation n’est pas relative aux étoiles fixes, ces forces d’éloignement n’existent pas. Je ne m’oppose pas à ce qu’on donne à la première rotation le nom d’absolue pourvu que l’on n’oublie pas qu’elle n’est autre qu’une rotation relative par rapport aux étoiles fixes. Pouvons-nous fixer le vase d’eau de Newton, faire ensuite tourner le ciel des étoiles fixes, et prouver alors que ces forces d’éloignement sont absentes ? Cette expérience est irréalisable, cette idée est dépourvue de sens, car les deux cas sont indiscernables l’un de l’autre dans la perception sensible. Je considère donc ces deux cas comme n’en formant qu’un seul et la distinction qu’en fait Newton comme illusoire » (ibid., p. 231).

Une conséquence directe de ce point de vue est qu’il n’y a pas de différence essentielle entre la gravitation et l’inertie. Les mêmes forces mécaniques sont interprétées comme gravitation ou comme inertie suivant le système de coordonnées choisi comme référence. En conséquence, et contrairement à ce que Newton soutenait, il n’y a aucun type de force inertielle qui puisse être pris comme indication d’un mouvement absolu.

Mach apparaît, ainsi, comme le premier physicien relati-

viste (malgré lui, puisqu’il s’est déclaré antirelativiste dans son ouvrage posthume : Les principes de l’optique physique). Einstein fait souvent référence à ce qu’il appelle le « principe de Mach », c’est-à-dire à la dépendance de l’inertie (transla-tionnelle et rotationnelle), par rapport à la distribution à grande échelle et au mouvement de la matière.

§ 8. La conception de la géométrie
dans la théorie de la relativité

8.1. L’axiomatisation de la géométrie euclidienne et le développement des géométries non euclidiennes ont constitué des jalons décisifs dans le processus d’éclaircissement progressif du vieux problème des relations entre la géométrie et le monde physique. Probablement la meilleure synthèse du problème a été faite par Einstein lui-même. « Comment est-il possible que la mathématique, qui est le produit de la pensée humaine et indépendante de toute expérience, puisse s’adapter d’une si admirable manière aux objets de la réalité ? », se demande Einstein. Et il continue : « A cette question il faut, à mon avis, répondre de la façon suivante : Pour autant que les propositions de la mathématique se rapportent à la réalité, elles ne sont pas certaines, et pour autant qu’elles sont certaines, elles ne se rapportent pas à la réalité » (Einstein, La géométrie et l’expérience).

Dans cette célèbre affirmation d’Einstein est contenue d’une façon nette la distinction entre géométrie mathématique et géométrie physique. C’est cette dernière, c’est-à-dire la géométrie de l’espace physique, qui reste en tant que problème. La théorie de la relativité constituera, à cet égard, la plus profonde révision de ses fondements de toute l’histoire dont nous traitons ici.

Cette révision se fait en deux étapes qui correspondent, successivement, au domaine de la relativité restreinte et à celui de la relativité générale.

8.2. Dans 1’« Introduction » au mémoire dans lequel il a exposé pour la première fois sa théorie de la relativité restreinte

(Sur l’électrodynamique des corps en mouvement), Einstein part de « la conjecture que ce n’est pas seulement dans la mécanique qu’aucune propriété des phénomènes ne correspond à la notion de mouvement absolu, mais aussi dans l’électrodynamique. Pour tous les systèmes de coordonnées pour lesquels les équations mécaniques restent valables, les lois électrodynamiques et optiques gardent également leur valeur ».

Einstein introduit cette conjecture — qu’il va élever « au rang d’une hypothèse » — à partir des asymétries de l’électrodynamique de Maxwell, appliquée aux corps en mouvement, et des résultats négatifs de la célèbre expérience de Michelson-Morley pour démontrer le mouvement de la terre par rapport au « milieu où se propage la lumière ».

En appliquant ainsi aux phénomènes électromagnétiques le concept de relativité qui est valable dans la physique new-tonienne pour les phénomènes mécaniques, Einstein introduit, tout d’abord, une révolution méthodologique : il traduit les résultats expérimentaux en un principe fondamental, et c’est à partir de ce point qu’il reformule les fondements conceptuels sur lesquels la physique classique était construite. La même ligne de pensée le conduit à introduire une autre supposition (qui n’est, en réalité, qu’un corollaire de l’antérieure, quand celle-ci est appliquée aux équations de Maxwell) : « La lumière se propage toujours dans le vide avec une certaine vitesse « indépendante de l’état de mouvement de la source lumineuse. » Sur cette base Einstein construit une électrodynamique des corps en mouvement « simple et exempte de contradictions ».

Le dernier paragraphe de l’Introduction du mémoire déjà cité présente un intérêt tout particulier pour le sujet que nous traitons ici :

Le dernier paragraphe de l’Introduction du mémoire déjà cité présente un intérêt tout particulier pour le sujet que nous traitons ici :

C’est précisément l’analyse de la fonction que les corps rigides et les horloges remplissent qui va constituer le début de

la grande révolution einsteinienne dans les concepts fondamentaux de la physique.

8.3. Ce n’est pas le but de notre travail de développer les principes de la théorie relativiste ni d’établir les différences précises entre la théorie de la relativité restreinte et la théorie de la relativité générale. Il suffira avec un bref rappel de quelques faits fondamentaux.

Dans la relativité restreinte, l’espace et le temps n’ont plus des rôles complètement indépendants ; ils sont remplacés par le concept d’une multiplicité à quatre dimensions. Un point dans cette multiplicité représente un événement déterminé par trois coordonnées spatiales et une coordonnée temporelle. Deux points-événements dans un système de référence d’inertie rapporté à des coordonnées cartésiennes déterminent ainsi un intervalle qui peut s’exprimer au moyen de la relation de Minkowski :

ds2 = c2dt2 — dx2 — dy2 — dz2 (1)

(c = vitesse de la lumière).

Ce fait a été exprimé par Minkowski dans un mot célèbre :

Ce fait a été exprimé par Minkowski dans un mot célèbre :

L’affirmation n’est pas, néanmoins, entièrement correcte. Le fait de considérer le temps en tant que quatrième coordonnée qui s’ajoute aux trois dimensions spatiales afin de déterminer un espace-temps quadridimensionnel, n’ajoute au temps aucun caractère particulier. En réalité, ce procédé est parfaitement valable à l’intérieur de la mécanique classique pré-relativiste.

La relation entre espace et temps introduite par la relativité a une signification plus profonde que la relation (1). Elle peut se résumer dans les points suivants :

a) Il y a deux procédés fondamentaux pour mesurer des intervalles de temps : compter des événements périodiques et mesurer des distances (spatiales) dans le cas de processus non périodiques. Dans les deux cas on associe à un certain type de processus un intervalle de temps, ce qui entraîne certaines suppositions à propos des mécanismes physiques qui règlent ces processus ;

b) Il n’y a aucune possibilité de déterminer empiriquement l’égalité de deux intervalles successifs de temps. Les lois qui conduisent à établir l’isochronisme des oscillations d’un pendule, par exemple, contiennent implicitement la supposition de l’égalité des intervalles successifs de temps dans un certain système de base. Toute « démonstration » ou « vérification » est donc circulaire ;

c) La comparaison des instants du temps pendant lesquels ont lieu deux événements distants entre eux dans l’espace — en particulier la définition de la simultanéité de deux événements distants — se base toujours sur l’envoi de signaux d’un point à un autre point de l’espace. Ceci présuppose une connaissance de la distance et de la vitesse du signal. L’identification de la lumière en qualité de signal qui se propage plus vite que n’importe quel autre et qui possède, en outre, une vitesse finie, oblige à introduire des définitions avec un certain degré d’arbitraire par rapport aux vitesses (par exemple, la supposition que la vitesse de propagation dans deux directions opposées est la même). Ces définitions comportent, à leur tour, une définition de simultanéité également arbitraire. La définition de la simultanéité est ainsi dépourvue de signification absolue ;

d) Le lien intime entre les concepts d’espace et temps devient manifeste dès qu’on considère les difficultés rencontrées quand on essaie de passer de la définition de la longueur d’un segment de droite « en repos » à la définition de longueur d’un segment qui se déplace avec une vitesse donnée. D’une façon ou d’une autre on arrive à une définition du type : « La longueur d’un segment de droite en mouvement est la distance entre les positions simultanées de ses points extrêmes. » Les mesures spatiales dépendent donc de la définition de simultanéité.

C’est cette dépendance réciproque entre les concepts fondamentaux utilisés pour définir les relations spatiales, d’une part, et les relations temporelles, de l’autre, quand il s’agit d’événements distants entre eux, qui donne sa vraie signification à la proposition de Minkowski déjà citée. Néanmoins, pour chaque observateur, les coordonnées spatiales et la coordonnée temporelle conservent une signification physique immédiate. Dans l’univers de Minkowski il y a

encore des intervalles du genre-espace et des intervalles du genre-temps.

8.4. Le principe de relativité, suivant lequel tous les systèmes inertiaux sont équivalents aussi bien en ce qui concerne les phénomènes mécaniques que les phénomènes électromagnétiques, donne aux systèmes de référence inertiaux une position privilégiée. Les lois physiques acquièrent leur formulation la plus simple quand les mouvements sont référés à de tels systèmes. Ils constituent en outre des étalons pour déterminer les accélérations.

Mach, dans sa critique de l’idée newtonienne d’une accélération absolue, a été conduit — comme nous l’avons indiqué dans la section 4 — à identifier l’inertie avec les effets gravitationnels. Mais la gravitation elle-même reste aussi incompréhensible qu’elle l’était dans la formulation de Newton, dans la mesure où Mach doit encore postuler l’action à distance. Einstein va garder l’idée centrale de la formulation de Mach — qu’il appellera « principe de Mach » — mais il va intervertir, pour ainsi dire, les termes de la relation : c’est la gravitation qui sera expliquée, dans une certaine mesure, par l’inertie, et pas l’inverse. Celle-ci sera la tâche de la théorie de la relativité générale. Le point de départ d’Einstein est le Principe d’équivalence qu’il introduit avec son fameux exemple de l’ascenseur qui est coupé de son point d’attache et tombe en chute libre vers la terre. Les lois de Newton, appliquées à des expériences à l’intérieur de l’ascenseur — considéré comme un laboratoire — montrent que tous les phénomènes mécaniques se passent comme si l’ascenseur était un système inertial. Einstein va postuler cette équivalence comme valable pour tous les phénomènes physiques. Un laboratoire en « chute libre » vers une masse avec un champ gravitationnel puissant agit donc de la même façon qu’un laboratoire éloigné de l’attraction de n’importe quelle masse et immobile par rapport aux « étoiles fixes ».

D’après Newton la force gravitationnelle peut être mesurée en termes de coordonnées d’un système inertial. Les effets gravitationnels s’ajoutent donc au système inertial.

D’après le principe d’équivalence un champ gravitationnel peut être transformé de telle façon qu’il disparaisse en tant que

tel et qu’il reste seulement en tant qu’effet de l’inertie. Un événement quelconque peut ainsi être associé à un système inertial de coordonnées. Néanmoins, un tel système n’a qu’une validité locale. C’est-à-dire que, dans le voisinage de l’événement en question, un intervalle ds est déterminé par l’expression de Minkowski (1). Mais ce système inertial ne peut pas s’étendre indéfiniment dans l’espace. Dans la théorie d’Einstein il n’y a pas d’autres systèmes inertiaux que ces systèmes locaux. Il n’y a pas de système privilégié par rapport auquel on puisse déterminer le champ gravitationnel. Le champ est différent pour des systèmes de coordonnées en état de mouvement. Or, le relativisme n’est pas total. Il y a un invariant qui exprime l’état de l’univers en ce qui concerne l’action réciproque de ses masses. Cet invariant apparaît du fait que chaque système de coordonnées, conjointement avec son champ gravitationnel, c’est-à-dire le champ exprimé en termes de ces coordonnées, est équivalent à n’importe quel autre système de coordonnées avec son champ gravitationnel correspondant.

Du point de vue mathématique ceci signifie que le champ gravitationnel peut être représenté par un tenseur dont les composantes changent avec le système de coordonnées. Mais le tenseur lui-même est un invariant. Ce tenseur coïncide avec le tenseur qui définit la métrique de l’espace1.

(1) Pour ceux qui ne sont pas familiarisés avec le calcul tensoriel, il est indiqué d’introduire ici quelques définitions.

Un espace riemanien est une multiplicité dans laquelle la« distance » ou« intervalle » entre deux points voisins (x1, x2,…, xn) et (x1 + dx1, x2 + dx2,…, xn + dxn) est définie par l’expression :

ds2 = gikdxidxk (2)

Les gik sont des fonctions des coordonnées. L’expression qui définit la valeur de l’intervalle ds s’appelle la métrique de l’espace. Cette expression constitue une généralisation du théorème de Pythagore. Etant donné que ds est un scalaire, sa valeur doit être indépendante du système de coordonnées, c’est-à-dire :

ds2 = gikdxidxk = g’ikdx’idx’k.

A partir de ceci on peut facilement démontrer que les gik sont les composantes d’un tenseur covariant de rang deux.

Les considérations faites plus haut à propos de la relation entre le champ gravitationnel et les systèmes inertiaux, dans la théorie de la relativité, peuvent s’exprimer de la façon suivante. Dans un système de coordonnées inertial (galiléen), la métrique est donnée par la relation de Minkowski (1) :

ds2 = — dx2 — dy2 — dz2 + c2dt2

qui est un cas particulier de la forme (2), dans lequel :

x1 = x ; x2 = y ; x3 = z ; x4 = ct

Les gik combinent donc les effets de gravitation et d’inertie. L’action à distance disparaît. Le mouvement d’une planète n’est pas déterminé par la force d’attraction, exercée à travers l’espace vide, par le Soleil et les autres planètes, mais par l’état du champ métrique dans le voisinage immédiat de la position de la planète. L’espace acquiert, ainsi, une fonction qui va plus loin que le rôle de « milieu » à travers lequel les forces se propagent ou le « champ » agit. L’espace c’est le champ lui-même, et sa configuration détermine les mouvements possibles des corps.

Or, le champ métrique change quand la position des corps est modifiée. Ce changement n’est pas instantané. Il s’agit d’un effet qui se propage d’un point à un autre point de l’espace avec une vitesse finie : la vitesse de la lumière. Il y a donc une relation entre « l’état du champ métrique » et la distribution des masses. La théorie de la relativité générale culmine avec cette relation dont il importe d’expliciter la nature en fonction de la perspective ici adoptée. Dans ce but nous prendrons comme point de départ la théorie électromagnétique de Maxwell, réinterprétée du point de vue de la théorie de la relativité.

8.5. La méthode utilisée par Maxwell dans son Traité d’électricité et de magnétisme continue la ligne de Lagrange. Les lois qui gouvernent les phénomènes électromagnétiques doivent s’exprimer par des équations « qui fassent éclater aux yeux leur analogie avec les équations de certains mouvements ». Mais on ne fait aucune hypothèse concernant la nature de ces mouvements. Dans la mesure où le phénomène peut être traduit au moyen des équations de Lagrange, les grandeurs qui caractérisent le système peuvent être mises en correspondance

et les composantes gik se réduisent à la forme galiléenne :

g11 = g22 = g33 = 1 ; g44 = — 1 ; gik = 0 pour i ≠ k (3)

En présence d’un champ de gravitation les gik peuvent toujours se réduire, dans une région de l’espace infiniment petit et pour un intervalle de temps infiniment court, à la forme galiléenne, au moyen d’une transformation appropriée des coordonnées (c’est-à-dire au moyen de l’utilisation d’un référentiel inertial « local »). Mais il n’y a aucune transformation qui permette de réduire les gik à la forme galiléenne (3) dans tout l’espace. En d’autres termes : en présence de champs gravitationnels l’espace-temps est « localement plan », mais il est un espace-temps « courbe » au-delà du voisinage du point considéré. Les champs de gravitation sont équivalents à des systèmes non inertiaux et, en conséquence, ils sont déterminés par le tenseur métrique.

avec les variables et les vitesses qui fixent la configuration et le mouvement d’un certain système mécanique.

Dans la théorie électromagnétique, chaque particule chargée crée un champ électromagnétique dont les propriétés sont caractérisées par un vecteur à quatre dimensions Ai (fonctions des coordonnées spatiales et du temps) appelé potentiel électromagnétique. Quand une particule chargée se déplace dans le champ elle est influencée par ce champ mais, en retour, son mouvement modifie le champ lui-même.

Le mouvement d’une particule avec une charge e suffisamment petite pour que son déplacement n’influence pas le champ, peut être décrit facilement à partir d’un principe de moindre action1. L’« action » de la particule est constituée par deux termes. Le premier terme correspond à l’intégrale d’action due à la particule considérée comme « libre », c’est-à-dire en l’absence de champ. Cette action est :

Sm = — mc ; (ds = ).

Le deuxième terme correspond à l’interaction de la particule avec le champ. Si on représente par Ai le potentiel du champ à l’instant t au point où se trouve la particule de charge e, l’action est

Smf = .

Le principe de moindre action établit que

δS = δ(Sm + Smf) = 0.

Dans le cas le plus général d’un système composé d’un champ électromagnétique et des particules qui s’y trouvent, l’action peut être considérée comme étant constituée de trois parties : a) L’action due aux particules considérées comme libres ; b) L’action due à l’interaction des particules avec le champ ; c) L’action du champ en l’absence de charges. Pour trouver les équations du mouvement des particules, le champ est supposé connu et on omet donc c). Pour trouver les

(1) Nous suivons ici la méthode de Landau et Lifchitz.

équations du champ, les mouvements des charges sont supposés connus et on fait varier seulement les potentiels du champ. On arrive ainsi aux équations de Maxwell :

 

(— g)-1/2 [(— g)1/2 Fik] = 0

où g = |gik|, et Fik est appelé tenseur du champ électromagnétique. Les composantes covariantes sont :

Fik = — 

Fik sont les composantes contrevariantes du mĂŞme tenseur.

Les composantes spatiales du tenseur Fik (celles définies par i, k = 1, 2, 3) sont liées au champ magnétique ; les composantes temporelles (celles définies par i = 4 ou k = 4) sont les composantes du champ électrique.

A partir du même principe de moindre action qui conduisit aux équations du mouvement, on peut aussi définir un tenseur tel que le vecteur Pi ayant pour composantes les intégrales des Tik :

Pi = — λ ik dSk

coïncide avec le vecteur impulsion du système (dSk est un élément d’une hypersurface contenant tout l’espace à trois dimensions). Le tenseur Tik est le tenseur d’énergie-impulsion du système.

On peut démontrer que, dans le cas d’un champ électromagnétique sans sources, les équations de Maxwell permettent d’exprimer le tenseur d’énergie-impulsion en fonction du tenseur du champ électromagnétique et du tenseur métrique :

Tik= (FilFkl — δik)

On peut suivre ensuite un chemin parallèle à celui qui a conduit aux équations de Maxwell et arriver, également à partir d’un intégral d’action, aux équations du champ gravitationnel

d’Einstein. (Ce traitement, qui n’a pas été, néanmoins, celui originairement suivi par Einstein, offre une grande simplicité et donne une grande unité au développement de la théorie. Cf. par exemple, la Physique théorique de Landau et Lifchitz, t. II : Théorie du champ.)

La seule différence est que le champ gravitationnel est considéré ici comme la modification de la métrique de l’espace-temps, c’est-à-dire la modification de ds en fonction des dxi. Par le principe de moindre action :

δS = mc δ = 0.

Ce qui signifie que dans un champ gravitationnel une particule se meut de telle manière qu’elle décrit une géodésique. L’équation du mouvement se trouve donc en calculant l’intégrale de :

δ(ds) = δ(gikdxidxk).

Le tenseur d’énergie-impulsion Tik des corps macroscopiques est d’ailleurs défini en considérant que le flux de l’impulsion à travers l’élément de surface d’un corps est la force agissant sur cet élément.

Le principe de moindre action, appliqué au champ gravitationnel, conduit ainsi, directement, aux équations d’Einstein :

Rik— gikR = Tik

où : est la constante de gravitation d’Einstein ;

R est un invariant appelé courbure scalaire de l’espace ;

Rik est le tenseur de Ricci défini en fonction des gik et de leurs dérivées exclusivement ;

Tik est le tenseur d’énergie-impulsion qui représente aussi bien les phénomènes gravitationnels qu’électromagnétiques.

Ces équations du champ gravitationnel constituent un surprenant amalgame de géométrie et de physique. Mais, avant d’analyser sa signification, nous allons exposer le dernier pas avancé dans cette direction par la physique relativiste.

§ 9. Les fondements théoriques
de la géométrisation complète de la physique relativiste

Le surgissement de la géométrodynamique à partir des travaux de Misner et de Wheeler a mis en évidence un fait assez singulier de l’histoire de la physique. Immédiatement après avoir formulé la théorie de la relativité générale, Einstein essaya de construire une « théorie unifiée » capable de combiner les lois de l’électromagnétisme et de la gravitation dans un seul système. Ses efforts se sont prolongés sa vie durant. Ils avaient pour but de rendre compte de tous les résultats de la mécanique quantique à partir d’une théorie unifiée du champ. « Quand Einstein meurt (en 1956), son but semblait aussi éloigné que toujours » — dit Born dans son livre Einstein’s Theory of Relativity. Cependant, déjà en 1925, G. Y. Rainich, dans un article intitulé « Electrodynamics in the General Relativity Theory » (publié dans les Transactions of The American Mathematical Society), avait réussi à combiner dans un même système d’équations les équations de Maxwell et les équations de la gravitation d’Einstein, démontrant ainsi que, dans certaines conditions très générales, le champ électromagnétique est entièrement déterminé par la courbure de l’espace-temps. Cet article resta ignoré jusqu’à ce qu’il fût redécouvert par Charles Misner, après que celui-ci arriva, en 1956, aux mêmes résultats mais par une voie indépendante.

Il y a trois faits surprenants dans cette histoire. Le premier, que pendant plus de trente ans personne, pas même Einstein, se soit aperçu des résultats de Rainich. Le deuxième, la simplicité de la méthode utilisée par Rainich et Misner, et le fait que les équations du champ unifié puissent être obtenues « sans rien ajouter » aux équations de Maxwell et d’Einstein (dès lors le nom de « théorie déjà unifiée » utilisé par Misner et par Wheeler). Le troisième, le fait que cette « théorie unifiée » n’a pas permis d’avancer suffisamment dans le chemin de l’explication des résultats de la mécanique quantique.

La procédure peut être brièvement décrite de la façon sui-

vante. Les équations de Maxwell présentées dans la section précédente :

= 0

(— g)-1/2 [(— g)1/2 Fik] = 0

décrivent le champ électromagnétique en termes des champs eux-mêmes. Le tenseur d’énergie-impulsion Tik est ensuite calculé à partir des champs au moyen de la relation que nous avons déjà présentée et qui est, en coordonnées curvilignes, de la forme :

Tik =

Ce tenseur d’énergie-impulsion est lié à la métrique de l’univers par les équations du champ de gravitation ou équations d’Einstein :

Gik ≡ Rik — GikR = Tik

oĂą est la constante de gravitation einsteinienne.

La géométrodynamique va renverser le sens du processus : les équations du champ s’écriront en termes du tenseur énergie-impulsion et ensuite les champs se dériveront du tenseur. Mathématiquement, le problème est résolu en exprimant les composantes du tenseur F en termes des Gik, à partir des deux dernières relations, et en substituant les valeurs ainsi obtenues dans les deux premières relations. Rainich et Misner ont réussi ce programme, facile à formuler mais mathématiquement complexe dans sa réalisation effective. Le résultat s’exprime dans un système d’équations qui peut être écrit :

— = 0

où les α sont définies exclusivement en termes des Gik.

Dans la mesure où Rik et R sont à leur tour définies en termes du tenseur métrique g, de composantes gik, il s’ensuit que ce

dernier système d’équations qui relie les α entre elles ne contient que des propriétés de l’espace-temps einsteinien. On arrive ainsi à une description purement géométrique : les équations sont entièrement géométriques et elles décrivent des situations physiques dans lesquelles il peut y avoir aussi bien des champs gravitationnels que des champs électromagnétiques. D’après Misner et Wheeler ces résultats surprenants fournissent un appui considérable à un point de vue qu’ils expriment de la façon suivante : « Il n’y a rien dans le monde sauf l’espace courbe vide. Matière, charge, électromagnétisme et d’autres champs ne sont que des manifestations de la courbure de l’espace », Physics is Geometry (Classical Physics as Geometry, Annals of Physics, 2 (1957), p. 526).

Plus précisément, les résultats montrent que : a) Le champ gravitationnel en un point n’est rien d’autre qu’un autre nombre donné à la courbure de l’espace-temps en ce point (« la masse dépourvue de masse » !) ; b) Le champ électromagnétique en un point est déterminé par la variation de cette courbure dans le voisinage de ce point (« champ électromagnétique dépourvu de champ électromagnétique » !). Il convient de préciser, même si nous n’allons pas nous attarder là-dessus, que l’espace courbe dont on parle n’est pas topologiquement équivalent à l’espace euclidien : les ainsi appelées « charges électriques » ne sont, dans cette théorie, que des manifestations des régions de l’espace à connexion multiple.

Il faut cependant tenir compte du fait que tous ces résultats ne s’appliquent qu’à la physique classique et relativiste. En ce qui concerne la mécanique quantique, la situation est plus complexe et le progrès presque inexistant (malgré certains résultats intéressants obtenus par Wheeler). On ne voit pas, d’ailleurs, comment aborder le problème. Ceci est dû au fait qu’il ne semble pas possible d’obtenir les équations de Rainich et de Misner à partir d’un principe variationnel comme dans le cas des équations de Maxwell et d’Einstein, d’après la méthode esquissée dans la section précédente. Ceci impose des limitations à l’application de la théorie au domaine atomique. Dirac a montré clairement que, quand on réussit à formuler une théorie classique en partant d’un principe d’action de Hamilton, il est ensuite possible d’appliquer certaines règles standard pour obtenir une première approximation à une théorie quan-

tique (Lectures on Quantum Mechanics, Belfer Graduate School of Science, Yeshiva University, 1964). Plus encore : « En réalité, sans faire usage des méthodes de Hamilton on ne peut pas résoudre quelques-uns des problèmes les plus simples dans la théorie quantique » (ibid., p. 3).

En laissant de côté les difficultés qu’on retrouve dès qu’on essaie de quantifier la géométrodynamique, il nous intéresse de souligner ici que la réduction de la physique relativiste à une géométrie de l’espace courbe vide pose des problèmes d’un grand intérêt du point de vue épistémologique, dont nous allons nous occuper dans ce qui suit.

§ 10. Réductionnisme ou synthèse

Les équations de la gravitation dans la théorie générale de la relativité constituent l’apogée des idées — déjà citées — de Riemann : « Il faut, donc, ou que la réalité sur laquelle est fondé l’espace forme une variété discrète, ou que le fondement des rapports métriques soit cherché en dehors de lui, dans les forces de liaison qui agissent sur lui. » Einstein réussit cet amalgame de géométrie et de physique dont Leibniz avait déjà eu l’intuition. En écrivant ces équations sous la forme :

Gik ≡ Rik — gik R = Tik

le tenseur Tik, tenseur énergie-impulsion, agit comme une source du champ gravitationnel. Mais, aussi bien Rik que R ne contiennent que le tenseur métrique g et ses dérivées. En conséquence, les Gik constituent des entités purement géométriques. Les dix quantités g représentent donc en même temps le champ métrique et le champ gravitationnel qui ne sont que des aspects différents d’une même chose.

Néanmoins, ces équations ont été diversement interprétées depuis la date de leur formulation, faite par Einstein en 1916. Au début, elles ont été interprétées comme constituant un triomphe du cartésianisme, c’est-à-dire comme une réduction

de la mécanique à la géométrie. Weyl, par exemple, considéra qu’elles modifiaient « la vieille conception » de la physique, qui pourrait s’exprimer ainsi :

de la mécanique à la géométrie. Weyl, par exemple, considéra qu’elles modifiaient « la vieille conception » de la physique, qui pourrait s’exprimer ainsi :

La nouvelle conception amène, selon Weyl, à la conséquence suivante :

La nouvelle conception amène, selon Weyl, à la conséquence suivante :

Et il ajoute :

Et il ajoute :

Malgré l’autorité de Weyl, il semblerait plus cohérent d’interpréter les équations d’une autre façon : ce n’est pas que la théorie de la gravitation ait été géométrisée ; c’est que la géométrie est devenue l’expression du champ gravitationnel. Avec cette interprétation la géométrie est définitivement établie sur des bases solides. Non seulement la géométrie de l’univers peut s’établir empiriquement, mais, en plus, elle peut s’expliquer par le seul effet des forces. Un défenseur caractéristique de cette position est Reichenbach (The Philosophy of Space and Time, pp. 256-257). Il accepte que la combinaison du mouvement des planètes avec le mouvement d’une particule libre dans une seule et même loi qui établit le mouvement tout au long d’une géodésique suggère une conception purement géométrique de la gravitation. Mais, ajoute-t-il, les changements dans le champ métrique sont dus à des changements dans la distribution de la matière, qui se propagent à la vitesse de la lumière. Non seulement le champ métrique est déterminé par « un véritable processus physique de propagation causale » mais, en plus, « l’effet du champ métrique sur la planète peut être interprété comme une véritable force physique qui le guide dans son chemin ».

Cette conception de la théorie einsteinienne constitue, clairement, la conséquence extrême des idées de Leibniz. Il n’y

a pas d’espace ni de temps indépendant de la matière ; il n’y a pas d’« action à distance » à travers un espace vide. Il n’y a que de la matière et des forces qui agissent sur elle. Tout le reste — l’espace et le temps y compris — n’est qu’une conséquence.

Paradoxalement, cette « physicalisation » de la géométrie est à nouveau controversée quand la géométrodynamique réussit l’unification du champ gravitationnel et du champ électromagnétique en un seul système d’équations. En effet, la théorie « déjà unifiée » de la relativité générale aboutit à un système d’équations dans lesquelles n’apparaissent que des relations entre des variables qui désignent des entités géométriques. Ces équations s’obtiennent par élimination des variables qui désignent des entités « physiques » entre les équations de Maxwell du champ électromagnétique et les équations d’Einstein du champ gravitationnel. Ce détour à travers des relations qui ne sont pas de nature purement géométrique semble inévitable. Mais avant d’analyser ce problème, considérons quelques-unes des conséquences immédiates de la théorie :

a) Dans la mesure où les équations de la dynamique se transforment en équations qui ne relient rien d’autre que des entités géométriques, la seule grandeur qui subsiste est la longueur. Des mesures de poids (ou de masse), exprimées en grammes, par exemple, ne sont que des abréviations convenables de relations entre des longueurs exprimées en centimètres ;

b) Il n’y a plus des « constantes physiques ». La vitesse de la lumière, par exemple, n’est qu’un nombre qui exprime des relations entre diverses unités de longueur just as 5280 is the factor of conversion between miles and feet ;

c) Les charges électriques ne sont pas des entités étrangères qui existent dans l’espace, mais des caractéristiques de l’espace. En réalité, elles ne sont qu’une manifestation de régions de l’espace à connexion multiple ;

d) Les objets sont des noms attribués à des localisations de certains types de courbure dans l’espace vide.

Pourrait-on penser à un cartésianisme plus absolu que celui qui est exprimé par ces quatre propositions ?

Toutefois, ceci n’implique pas que la physique — ou même

la mécanique classique et relativiste — soit « tout simplement » une géométrie. Dans cet espace courbe vide il y a encore des mouvements et des interactions soumis à des lois qui doivent être postulées en plus des postulats de la géométrie et qui sont soumises à la confirmation (ou infirmation) expérimentale.

Dans cet espace courbe vide il y a encore des « phénomènes physiques ». Où se trouve donc le lien entre les équations « purement géométriques » de la « théorie unifiée » et ces « phénomènes physiques » ? La réponse doit être cherchée précisément dans la définition des concepts « géométriques » qui interviennent dans les équations ; en particulier, dans la nature des g qui expriment la métrique de l’espace. La relation fondamentale ds2 = gik dxi dxk détermine la valeur de l’intervalle s dans l’espace-temps. Dans la définition des g les éléments de la matrice qui correspondent à la variable « temps » ne peuvent pas être remplacés par les autres.

La notion d’« intervalle » dans l’espace-temps de Minkowski, utilisée par la théorie restreinte de la relativité et définie par la forme quadratique ds2, comprend une distinction entre « intervalles du genre temps » et « intervalles du genre espace » qui a un caractère absolu. Un intervalle est du genre temps ou du genre espace en toute indépendance du système de référence. La « fusion » d’espace et temps dans la théorie restreinte de la relativité n’est pas, donc, complète. Du point de vue mathématique la distinction est claire, puisqu’un intervalle du genre temps est représenté par un nombre réel, tandis qu’un intervalle du genre espace est représenté par un nombre imaginaire. La théorie générale de la relativité utilise un espace-temps riemanien qui est « localement » identique à l’espace-temps de Minkowski. Ceci signifie, simplement, que tout espace riemanien est un espace euclidien dans un domaine infinitésimal. L’espace et le temps apparaissent amalgamés dans la représentation de l’espace-temps (euclidien) de Minkowski uniquement dans la mesure où, outre une région de « futur absolu » et une région de « passé absolu », il y a des régions — par rapport à un « point » (spatio-temporel) — dans lesquelles le passé et le futur sont indéterminés. Mais il y a un futur « absolu ». Sa définition n’est reliée à rien d’autre qu’à la propagation de signaux et à l’existence d’une vitesse de propagation limite. Au cœur même de la « métrique » spatio-temporelle on trouve

donc les événements physiques, les signaux qui se propagent, la succession d’événements qui s’identifient comme appartenant à une chaîne causale. Si la physique relativiste peut être réduite à des relations dans lesquelles n’intervient que le tenseur métrique de l’espace à quatre dimensions, il n’est pas moins vrai que ce tenseur est dénué de toute signification en dehors d’un monde où il y a des événements physiques et des chaînes causales.

Arrivés à ce point, il est difficile de dire si on a réussi une géométrisation complète de la mécanique, ou l’inverse. Il semble plutôt qu’il s’agisse d’une convergence de concepts vers une synthèse commune, bien plus que d’un processus de réduction d’une discipline à l’autre. En dernière analyse, il ne reste qu’un « champ » dont les différentes parties interagissent et subissent des déplacements mutuels. Qu’on appelle « géométrique » ou « physique » un tel champ, il semble être une décision arbitraire. Le fait que les paramètres qui interviennent dans les équations « unifiées » soient considérés comme des éléments géométriques résulte bien plus d’une tradition historique que d’une affirmation basée sur une distinction qui puisse être fondée sans tomber dans un cercle vicieux. Seules des recherches génétiques sur l’origine des notions qui interviennent dans les équations de base pourraient donner à cette distinction le fondement requis.