Introduction : le problème de l’explication. L’explication dans les sciences : colloque de l’Académie internationale de philosophie des sciences avec le concours du Centre international d’épistémologie génétique. Genève 25-29 septembre 1970 (1973) a 🔗
Cournot déjà distinguait en mathématiques deux sortes de démonstrations : celles qui demeurent simplement logiques, fournissant la vérification d’un théorème mais n’en donnant pas la raison et celles que nous appellerons explicatives parce qu’elles atteignent la raison de cette proposition. Nous dirons en effet qu’expliquer c’est répondre à la question du « pourquoi », c’est comprendre et non pas seulement constater, autrement dit dégager la « raison » sur le terrain des sciences déductives et la « causalité », bien que le mot soit dangereux, dans le domaine des sciences physiques.
Or, tant la raison que la cause comportent deux caractères antithétiques et dont la réunion fait problème. Le premier de ces aspects est, bien entendu, la nécessité intrinsèque : dégager la raison d’une réalité quelconque, formelle ou réelle, c’est montrer qu’elle est nécessaire, et par conséquent c’est s’appuyer sur un modèle déductif. Mais, en même temps, trouver la raison c’est saisir ce qu’il y a de nouveau, c’est justifier une construction effective, sinon on ne comprend plus le changement sur le terrain des réalités physiques ou la production de nouveautés propres aux découvertes mathématiques. En d’autres termes, chercher la raison ou l’explication, c’est admettre implicitement l’insuffisance d’un simple réductionnisme. Celui-ci peut d’ailleurs se présenter sous deux formes. Nous appellerons, en premier lieu, réductions externes celles qui consistent simplement à faire rentrer dans une loi plus générale une loi plus ou moins particulière ou spéciale. Le réductionnisme externe serait donc sans plus l’emboîtement du spécial dans le général, ce qui, bien entendu, n’explique rien mais se borne à déplacer le problème : si l’on indique ainsi la raison de la loi particulière, il reste à trouver celle de la loi générale.
Mais il existe en plus un réductionnisme que l’on pourrait appeler interne et qui cherche la raison d’une réalité nouvelle dans la supposition qu’elle était préformée ou prédéterminée en quelque réalité antérieure. On pense aussitôt alors à l’œuvre si instructive et courageusement paradoxale d’Émile Meyerson, qui voulait ramener l’explication à l’identification : expliquer, c’est montrer ce qui était préformé dans l’état antérieur. Par exemple (et Meyerson cite souvent ce mot de Bossuet) « le bouton explique la rose », expliquer signifiant ici au sens propre sortir de ses plis ou dégager dans l’effet ce qui était déjà antérieurement contenu dans la cause. Mais Meyerson lui-même a tout fait pour montrer que son identification échoue. Elle échoue sur le terrain physique parce qu’elle n’explique pas le divers et que le « réel » reste alors irrationnel. Son identification n’explique même pas non plus les mathématiques, puisque, s’il en reconnaît la constructivité, il en conclut sans la moindre hésitation qu’elles cessent par conséquent d’être rigoureuses dans la mesure où elles introduisent du neuf, et ne restent exactes et nécessaires que dans la mesure où elles en demeurent à des identités. Mais cet échec de l’identification, pour ainsi dire voulu par son protagoniste, ne constitue qu’un exemple et, en tous les domaines, on retrouve un insuccès analogue du réductionnisme. La réduction intégrale des mathématiques à la logique dont rêvaient Russell et Whitehead dans les Principia n’est plus soutenable aujourd’hui depuis les théorèmes de Gödel et de bien d’autres. Dans le domaine physique, les réductions qu’on a cherchées pendant des décades, de l’électro-magnétisme à la mécanique, ont échoué et l’on aboutit toujours à une assimilation réciproque à la place d’une réduction simple (même dans le cas de la dynamogéométrie contemporaine de Mismer et Wheeler). Autrement dit, il ne semble pas que l’explication dans les sciences soit compatible avec le réductionnisme sous les deux formes que l’on vient de rappeler.
Mais alors, l’explication ou recherche de la raison des choses comporte un paradoxe : il s’agit de concilier la nécessité, d’un côté, avec la production des changements ou la construction des nouveautés, d’un autre côté. Autrement dit, il s’agit de comprendre les nouveautés comme nécessaires et c’est là notre problème central. Elles ne sauraient être conçues comme préformées, sans quoi elles ne seraient pas nouvelles. Mais elles ne peuvent pas non plus être considérées comme contingentes sans quoi elles ne seraient pas nécessaires et on ne les « comprendrait » plus. Ceci paraît contradictoire, mais il y a quand même là une double exigence de la pensée. La raison veut comprendre le divers et se refuse à le considérer, avec Meyerson, comme de l’irrationnel. Mais, d’autre part, la raison veut que toute construction soit nécessaire, sinon nous retombons effectivement dans l’irrationnel.
Sur le terrain des sciences déductives, la solution de l’explication semble être cherchée de plus en plus aujourd’hui dans la direction des structures. Que l’on pense aux structures mères des Bourbaki avec leurs combinaisons et leurs différenciations ; ou encore aux catégories de Mc Lane et Eilenberg (des classes avec les fonctions qu’elles comportent) donc aux morphismes de tous genres. Cela reviendrait donc à dire que la raison d’une proposition d’un théorème est atteinte dans la mesure où on peut l’appuyer sur une structure. Et, en effet, le premier caractère remarquable d’une structure est sa nécessité intrinsèque. Une structure comporte, comme chacun sait, non seulement des lois de composition mais encore un auto-réglage lui permettant de conserver ses deux propriétés fondamentales de ne jamais sortir de ses propres frontières (c’est-à -dire qu’en combinant deux éléments de la structure on trouve encore un élément de la structure) et, d’autre part, de ne jamais faire appel à des éléments extérieurs à elle, celle-ci se suffisant donc à elle-même. La structure possède ainsi une nécessité intrinsèque, première condition que nous disions être celle de toute explication. Mais, le deuxième caractère remarquable de la structure est qu’elle est un instrument de construction. Elle est même fondamentalement un organe de construction puisqu’elle constitue un système de transformations et non pas une forme statique quelconque, sans quoi tout serait structure. C’est un système de transformations avec leurs lois de composition, engendrant donc des réalités qui sont nouvelles sans être irrationnelles, puisqu’elles sont déterminées par les lois de ces compositions. La constructivité propre aux structures se manifeste en outre par le fait qu’elles ne se réduisent pas les unes aux autres, mais se combinent entre elles : il n’y a pas identité, il y a complémentarité entre les structures. Par exemple, dans le cas des structures mères de Bourbaki, les structures algébriques et les structures d’ordre peuvent se combiner, mais ne se réduisent pas l’une à l’autre, les structures algébriques et les structures topologiques de même, etc. Rappelons enfin qu’une structure peut se différencier indéfiniment, en complétant ses lois de composition, c’est-à -dire en introduisant des axiomes limitatifs qui font que, du groupe, on passera à des sous-groupes déterminés et ainsi de suite.
Notons dès maintenant, car cela sera utile pour nos conclusions, que les structures fondamentales dont ont parlé les Bourbaki et, depuis lors, les partisans de l’idée de catégorie, paraissent constituer non pas des abstractions simplement formelles, mais des réalités fortement enracinées dans la pensée naturelle. En étudiant les premières structures logico-mathématiques chez l’enfant, on retrouve les ébauches de structures mères : on trouve des structures comportant des opérations inverses qui correspondent aux structures algébriques, des structures de relations dont la réversibilité repose sur des réciprocités et qui correspondent ainsi aux structures d’ordre et, bien sûr, des structures topologiques. Je me rappelle, il y a des années, un colloque parisien intitulé : « Structures mentales et structures mathématiques ». Les deux conférences de départ étaient données par Dieudonné pour les structures mathématiques et par moi-même pour les structures mentales. Je ne savais rien à cette époque du travail des Bourbaki, les ignorant par défaut d’information mathématique, tandis que Dieudonné ne voulait rien savoir de la psychologie. Or, il s’est trouvé que nos deux exposés convergeaient sur certains points d’une manière si étonnante au point de vue des trois structures mères que Dieudonné eut cette parole décisive : « C’est la première fois de ma vie que je prends la psychologie au sérieux ; c’est peut-être la dernière, mais c’est en tout cas la première. » Quant à l’idée de catégorie, qui est plus fondamentale même que celle d’ensemble, on la trouve également sous des formes triviales chez le jeune enfant et cela bien avant même le niveau des opérations réversibles et dès la formation des notions pré-opératoires et de ce que nous pouvons appeler des « fonctions constituantes » (covariations sans encore de réversibilité 1).
À passer aux problèmes des sciences physiques, la raison, au sens de Cournot, devient la raison suffisante de Leibniz, qui est la causalité, la causa seu ratio de Descartes, donc la recherche du mode de production des phénomènes, à laquelle croient un très grand nombre de physiciens. Certes toute une école a contesté la légitimité de ce besoin d’expliquer : le positivisme de Comte s’oppose à la recherche de l’explication. Comte prétend que la science est au service de l’action et que celle-ci exige simplement la prévision des phénomènes ; or, pour prévoir, il suffit de la légalité, donc d’une bonne description, ce qui renvoie à la métaphysique tout ce qui est causalité. Mais, même à adopter le point de départ de Comte, il est étrange qu’à vouloir réduire la science aux besoins de l’action, on la limite aux questions de prévisions, puisque l’action consiste précisément à produire quelque chose et non pas simplement à prévoir, la connaissance du mode de production des phénomènes étant essentielle à toute action technique. Mais peu importent les restrictions positivistes : il semble bien qu’aujourd’hui aucun physicien créateur ne s’en tient aux lois ; il y a toujours, implicitement ou explicitement, recherche du pourquoi de la loi, donc du mode de production.
Or, le fait remarquable au point de vue épistémologique, est que toute explication causale finit par rejoindre la notion de structure au sens logico-mathématique. On retrouve ainsi la structure de groupe à toutes les échelles, de la microphysique à la mécanique relativiste, en passant par les groupes cristallins et tout ce que l’on voudra. Dans tous les domaines de la physique actuelle on construit des modèles, qui sont des structures déductives tendant à atteindre la nécessité sans s’en tenir à la simple constatation ou description des phénomènes. Le problème essentiel qui se pose à l’épistémologie est celui de la nature de tels modèles : sont-ils subjectifs ou rejoignent-ils la réalité ?
Subjectifs en ce sens que ce seraient de simples instruments intellectuels destinés à simplifier les problèmes, une sorte d’économie de la pensée ou encore de représentation destinés à satisfaire le besoin d’images précises ? Ou bien le modèle atteint-il le réel, par approximations successives ? Bien entendu, aucun modèle n’est entièrement conforme au réel, preuve en soit que chacun est sans cesse transformé et affiné. Mais le but du modèle demeure-t-il ou non d’expliquer le réel ? Certes on y discerne d’abord une nécessité déductive qui dépasse les faits eux-mêmes, une nécessité que ne comportent pas les observables et eux seuls, même si par observables on entend non pas simplement les constatations particulières mais encore les relations fonctionnelles entre les faits, autrement dit toutes les lois. Quelle est alors la nature de cette nécessité ? Demeure-t-elle purement logico-mathématique ou exprime-t-elle l’un des caractères du réel lui-même ? Tel est le problème de la causalité. J’emploie ce terme dont je sais bien les dangers, en tant que synonyme de l’explication en physique. La causalité du sens commun est certes une pseudo-notion, dont tout le monde a fait la critique et bien des esprits se refusent à employer ce vocable en le renvoyant à la même catégorie que la finalité, etc. Mais elle reste une notion valable si on la définit en termes de structure.
J’aimerais donc en présenter une interprétation possible, qui n’a rien de bien original et demeure conforme à la tradition rationaliste 2, mais qui s’est imposée à nous pour des raisons psycho-génétiques, c’est-à -dire en étudiant les débuts et le développement de la causalité, en ses différentes étapes depuis ses formes les plus élémentaires et sensori-motrices, jusqu’au moment où l’adolescent rejoint la pensée scientifique. Or, la causalité apparaît alors à tous ses niveaux et sous toutes les formes comme impliquant à la fois la production d’une nouveauté, parce que l’effet est nouveau par rapport à la cause, et qu’il y a donc transformation, et, d’autre part, une liaison nécessaire sans quoi on ne peut plus parler de causalité. On retrouve donc ici cette union de la construction et de la nécessité que nous rappelions tout à l’heure dans l’opération logico-mathématique. Autrement dit, en toute explication causale, on reconnaît toujours ces deux aspects indissociables et solidaires, que Meyerson a voulu dissocier, mais au prix de l’échec qu’il a en quelque sorte avoué lui-même : une transformation, d’une part, et une conservation d’autre part. Dès les niveaux les plus élémentaires, la transmission d’un mouvement par exemple, implique cette nouveauté d’un mouvement acquis par l’objet passif à partir de l’objet actif ; mais il y a en même temps conservation de quelque chose, conservation de l’impulsion, ou de l’« action », etc. Mais si nous rencontrons donc à nouveau sans cesse, comme dans le cas des structures opératoires logico-mathématiques, cette même dualité d’une transformation, donc d’une production, et d’une nécessité due à une conservation, la causalité se réduit-elle alors simplement à l’ensemble des opérations logico-mathématiques du sujet ? Oui et non. En toute explication causale on utilise, bien entendu, une certaine structure logico-mathématique de quelque niveau soit-elle. Mais la différence avec la structure formelle est que, dans le cas de la causalité, les opérations ne sont pas simplement appliquées par l’enfant ou par le sujet physicien au phénomène qu’il étudie, mais elles sont, de plus, attribuées à ces objets, c’est-à -dire que l’objet lui-même est censé faire quelque chose, qu’il est actif, autrement dit qu’il devient lui-même un opérateur. Les opérations sont celles du sujet sans quoi celui-ci ne saisirait pas ce qui se passe dans l’objet ; or il découvre dans l’objet des opérations plus ou moins analogues aux siennes, mais des opérations effectuées par les choses elles-mêmes, les objets devenant donc au sens strict des sortes d’opérateurs. Certes, cette causalité suppose un système d’inférences et de constructions logico-mathématiques qui dépassent les observables. Mais les modèles ainsi atteints, nous n’y croyons que dans la mesure où nous pouvons attribuer une part de leur structure à la réalité elle-même comme si les objets se comportaient d’une manière analogue au sujet qui opère : d’où l’impression de « comprendre », de pouvoir assimiler et dominer le réel qu’on cherche à expliquer. Si banale soit-elle, cette interprétation s’est imposée à nous pour des raisons psychogénétiques mais son intérêt est que, en étudiant la causalité chez l’enfant, on retrouve ainsi dès les sources des sortes d’invariants fonctionnels qui se perpétueront jusqu’aux formes supérieures de l’explication scientifique.
Il va de soi qu’au point de départ, la causalité chez l’enfant demeure entièrement anthropomorphique ou égocentrique : ce sont ses propres actions qu’il attribue aux objets et cela ne présente guère d’intérêt épistémologique, sinon de montrer la relation entre la vision élémentaire des phénomènes et l’action propre du sujet. Par exemple, lorsqu’une boule va heurter une paroi contre laquelle elle sera réfléchie (phénomène que nous avons étudié jadis avec B. Inhelder du point de vue des relations entre l’angle d’incidence et l’angle de réflexion) les petits déclarent que la boule arrive près de la paroi mais qu’elle l’évite et ne la touche pas sous peine d’y être arrêtée : elle est alors censée partir d’un autre côté, en décrivant même une belle courbe. Voilà certes une explication psychomorphique, qui est simplement l’attribution d’une action humaine ou de l’action propre à l’objet, mais cela est à noter à titre de point de départ.
Dans la suite, au fur et à mesure que se forment les opérations logico-mathématiques chez l’enfant ou plus précisément les coordinations opératoires (transitivité, réversibilité, distributivité, etc.), elles sont alors attribuées aux objets dans l’ordre de leur constitution et ceci selon une correspondance vraiment étroite qu’on peut décrire pas à pas au cours du développement. Examinons, par exemple, la transmission du mouvement, sous une forme particulière étudiée avec Mme Szeminska, Mme Ferreiro et d’autres, qui a été révélatrice. On donne à l’enfant une série de boules contiguës en rangée linéaire et l’on fait arriver une autre boule sur un plan incliné contre la première de la rangée. On demande d’abord à l’enfant de prévoir ce qui va se passer et, d’après lui, jusqu’assez tard, toutes les boules vont partir ; lorsqu’il constate le départ de la dernière seule, les explications se différencient selon l’âge. Chez les petits du niveau psychomorphique rappelé tout à l’heure, il y a évidemment un mystère, mais qu’ils écartent vite en supposant que la boule tombée est passée par derrière les autres, qu’elle est venue taper la dernière et a repris sa place ; etc. Mais, dès le niveau de six ans à peu près, l’enfant admet que la boule active a tapé la première des passives, que la première s’est déplacée et a cogné la seconde, qui s’est déplacée à son tour et a cogné la troisième, etc. L’hypothèse est donc celle d’une série de transmissions immédiates, un enchaînement de translations successives, mais sans notion de transmission médiate : il n’y a pas d’intermédiaires à proprement parler, chaque élément devenant actif à son tour par des mouvements propres. Par contre, dès sept-huit ans en moyenne, dès que l’enfant arrive sur le plan logico-mathématique à la transitivité, cette transitivité est aussitôt incorporée au phénomène à expliquer et elle devient transmission semi-interne. L’enfant dira : le « coup » ou l’« élan » a traversé les boules, il a passé à travers, etc. Mais cela n’est pas encore une transmission purement interne, le sujet continuant à croire qu’il faut de légères translations molaires. Il y a cependant là une corrélation étroite entre la découverte de la transitivité sur le terrain logico-mathématique et l’acceptation sur le terrain physique d’une transmission médiate, qui n’est plus simplement une succession de transmissions immédiates. La transmission purement interne apparaît enfin vers dix-onze ans, à l’âge où, dans sa pensée logique, le sujet commence à raisonner sur des possibles qui dépassent le perceptible.
Examinons un autre problème : celui du poids et des contrepoids. On présente par exemple un dispositif tel qu’il s’agisse de faire un pont entre deux boîtes représentant des montagnes. L’enfant posera des planches qui dépassent les boîtes, et si elles les dépassent trop, il faudra imaginer de placer des contrepoids, ce que l’enfant découvre très tôt. Mais ce contrepoids, il le conçoit simplement comme « retenant » l’objet et, par conséquent, il s’astreint par prudence à ce que celui-ci soit bien retenu de tous les côtés : il mettra donc un contrepoids sur la partie de la planche située sur le support, c’est entendu, mais il en mettra aussi un de l’autre côté (non soutenu), afin qu’il tienne bien, sans voir que cela fait tout basculer (sans donc se rappeler que le poids appuie aussi bien qu’il retient et qu’en appuyant il ne retient pas toujours mais entraîne à la chute, etc.). Par contre, dès le niveau de l’opération réversible dans le développement logico-mathématique, l’enfant arrive à concevoir des opérations inverses qui se composent avec les directes : il conçoit alors les relations entre poids d’une tout autre manière, les poids n’ayant d’action sur une balance qu’en relation les uns avec les autres ; l’équilibre est alors conçu comme dû à la neutralisation entre deux actions de sens opposé, ce qui suppose la réversibilité opératoire, mais attribuée aux objets dès qu’elle est conçue sur le plan logico-mathématique.
Passons à la question de l’action et de la réaction, rapport nullement facile à concevoir puisqu’il a fallu Newton pour en formuler la loi. Pour les petits, et jusqu’assez tard cette fois, jusque vers dix ans, la réaction ne se fait pas en sens inverse de l’action. Par exemple, en une expérience que nous avons faite dans le temps avec B. Inhelder, un tube rempli d’eau, en forme de U, est muni d’un piston d’un côté que l’on peut charger de poids pour déplacer le niveau du liquide de l’autre côté ; ou bien, on peut faire varier la densité du liquide et en mettre un qui soit plus dense que de l’eau pure. Que va faire ce liquide plus dense ? Jusque vers dix ans, du fait qu’il pèse plus il montera par conséquent plus haut, son poids s’additionnant à celui qu’on met sur le piston. Au contraire, vers onze-douze ans il comporte une force de réaction orientée en sens inverse : le piston presse d’un côté, mais l’eau résiste de l’autre et, si l’on augmente la densité du liquide celui-ci va s’opposer davantage et le niveau montera moins qu’avec de l’eau pure. Pourquoi attendre si tard ? C’est qu’à ce niveau de onze-douze ans commencent à se constituer des groupes de quaternalité, des groupes de transformations où la réciproque est combinée avec l’inverse et où les deux sont à la fois distinguées et coordonnées. Jusque là il n’y a que des inversions ou des réciprocités, non coordonnées entre elles. Pour comprendre l’action et la réaction, il faut en revanche une coordination entre ces deux transformations à la fois distinguées et composées entre elles. Ici, de nouveau, c’est la structure logico-mathématique qui est immédiatement attribuée aux objets.
On pourrait donner bien d’autres exemples. Cellérier, que nous entendrons à ce colloque, a fait une jolie expérience sur la distributivité et la linéarité, la distributivité étant figurée par l’extension d’un élastique : on observe alors jusque tard une confusion entre l’allongement et le simple déplacement, parce que pour comprendre l’étirement et sa propagation homogène, il faut à nouveau recourir à une structure opératoire ; par contre sitôt atteintes la distributivité et la proportionnalité, le problème de l’élastique est compris et dominé. Bref, à tous les niveaux de développement nous retrouvons une correspondance entre les étapes de la causalité et la formation des opérations logico-mathématiques. On répondra que c’est bien naturel. Mais nous ne commençons pas par demander à l’enfant ses idées sur le terrain logico-mathématique pour lui poser ensuite la question physique ; la question physique est posée d’emblée et l’enfant ne songe nullement à des analogies quelconques avec ce qu’il peut savoir des structures logico-mathématiques. C’est sans s’en douter, d’une manière totalement inconsciente, que les structures qu’il construit sur ce terrain sont attribuées aux objets dans l’autre domaine. De telles attributions d’opérations signifient ainsi que les objets eux-mêmes deviennent pour le sujet des sortes d’opérateurs, des sources de transitivité, de réversibilité, de réciprocité, de distributivité, etc. Ces faits montrent ainsi une correspondance étroite entre les structures opératoires et les structures causales. Quelle est la marche ? Les structures opératoires se développent-elles en toute autonomie pour être ensuite, au fur et à mesure de leur découverte, attribuées aux objets et projetées dans le réel, selon un développement à sens unique, ou bien, est-ce au contraire la causalité qui soulève des problèmes contraignant le sujet à construire de nouveaux instruments logico-mathématiques ? C’est vers cette seconde solution que nous nous orientons, ou plutôt vers l’idée d’une action réciproque. En particulier dans les problèmes de coordination spatiale il semble très net que ce sont presque toujours des problèmes dynamiques et physiques qui obligent à de nouvelles constructions géométriques. Mais celles-ci ne sont pas pour autant tirées du seul réel : il faut un sujet pour les effectuer et il faut des opérations pour construire de telles structures. Il y a donc une étroite relation entre le sujet et l’objet et, psychologiquement, cela n’est pas surprenant, étant donné que l’organisme est à la fois la source du sujet au point de vue psychologique, puisque la vie mentale dérive de l’action qui est conditionnée par le système nerveux et par les régulations de l’organisme et que, d’un autre côté, l’organisme est un objet parmi les autres appartenant au monde physique. C’est donc par l’intérieur de l’organisme que se fait la jonction entre les mathématiques et le réel. On s’est souvent occupé du pourquoi de cet accord surprenant entre les mathématiques et la réalité, mais si le sujet est le produit d’un organisme qui est lui-même un objet, l’accord devient en quelque sorte endogène. Quoi qu’il en soit de ce problème, le but de cette introduction était de souligner la complexité de la question de l’explication, mais, d’autre part, sa simplification possible si l’on se réfère au parallélisme étroit qui existe entre les opérations et la causalité, donc entre les structures propres aux sciences déductives et celles que l’on retrouve sur le terrain des sciences du réel.