Structures opérationnelles et cybernétique (1953) a

L’Association de Psychologie scientifique de langue française n’a pas seulement pour but de rapprocher les psychologues parlant le français. Elle s’est aussi donnée pour tâche de favoriser la compréhension réciproque de leurs points de vue respectifs. C’est sans doute pour cette raison que l’on bien voulu inscrire au programme de cette première session, consacrée à l’étude des relations entre la neurologie et la psychologie, une communication du psychologue de langue française qui semble se préoccuper le moins du système nerveux et qui n’en parle presque jamais. C’est avec d’autant plus de plaisir que j’ai saisi cette occasion de montrer que même l’étude du développement des structures logiques conduit à certaines convergences avec l’analyse des structures nerveuses et avec celle des modèles cybernétiques.

Lorsque l’on prend pour objet de recherche le développement des opérations logiques et surtout lorsque l’on utilise l’algèbre logistique pour décrire les structures de ces opérations, on se heurte constamment à trois sortes de malentendus. On est pour le moins accusé d’intellectualisme, c’est-à-dire que l’on paraît substituer des abstractions aux réalités expérimentales. On est ensuite soupçonné de préférer la logique à la psychologie. Enfin — et ceci est le pire — on donne l’impression de s’orienter vers la philosophie et de tourner le dos à la physiologie.

En réalité, comme nous avons cherché à le montrer ici même (Année psychol., vol. jubil. Piéron, p. 27-38), de telles objections sont simplement dues à un résidu des traditions scolaires, qui sont responsables de la survie de la logique classique et de l’ignorance, où demeurent la plupart des chercheurs quant aux ressources de l’algèbre logistique (laquelle coïncide avec certaines des parties de l’algèbre générale et participe ainsi directement des mathématiques). Dans les pays anglo-saxons où le symbolisme logistique est plus répandu et constitue presque un langage courant, le calcul logique est au contraire utilisé par les cybernéticiens et par certains neurologues eux-mêmes, comme on s’en aperçoit par exemple en feuilletant The Bulletin of Mathematical Biophysics de l’Université de Chicago.

Il ne me semble donc pas dénué d’intérêt, dans une session consacrée aux relations entre la psychologie et la neurologie, de faire quelques courtes remarques sur les convergences existant entre les recherches que nous avons pu faire sur les structures de l’intelligence et la manière dont la cybernétique pose le problème des structures.

I

Rappelons d’abord brièvement l’état de la question des structures du point de vue du développement de l’intelligence.

On peut en premier lieu distinguer trois grands types de structures dont l’apparition successive marque les étapes du développement intellectuel de l’enfant.

Au point de départ, c’est-à-dire dans la zone frontière entre l’organique et le mental, la structure la plus élémentaire est sans doute constituée par le rythme. Si l’on utilise le terme de réversibilité dans son sens courant d’un retour au point de départ, le rythme est caractérisé par une sorte de réversibilité stéréotypée avec alternance des trajets AB et BA parcourus par deux mouvements distincts. Surtout représenté sur le terrain des réflexes, le rythme se manifeste encore, aux débuts de l’intelligence sensori-motrice, dans les divers types de « réactions circulaires ».

Puis viennent les diverses variétés de régulations structurales (par opposition aux régulations énergétiques ou affectives), caractérisées par des corrections en fonction du résultat obtenu, avec retour, total ou partiel dans la direction du point de départ. Il faudrait citer ici toute une gamme de conduites, allant des régulations perceptives à ces régulations représentatives qui interviennent encore entre 4 et 7 ans dans la pensée préopératoire et donnent lieu à des renversements du jugement en fonction de l’exagération même des erreurs. Par exemple lors de l’étirement progressif d’un boudin de pâte à modeler le sujet admettra un accroissement de matière en fonction de la longueur de l’objet jusqu’au moment où celui-ci devenu trop mince, lui fera croire à une diminution de substance. Plus plastiques que le rythme, les régulations n’aboutissent qu’à une semi-réversibilité, par compensations approchées.

Lorsque les régulations atteignent la réversibilité complète, elles se transforment en opérations. Les opérations sont des actions (effectives ou intériorisées), entièrement réversibles et coordonnées en structures d’ensemble présentant chacune certaines lois de totalité. Ce sont ces structures d’ensemble qui caractérisent l’intelligence en son achèvement.

Avant de les décrire, insistons encore sur le fait que le développement de l’intelligence est ainsi orienté selon une réversibilité progressive manifeste dès les rythmes élémentaires (mais alors liée à une certaine forme stéréotypée), plus plastique mais incomplète dans le cas des régulations, cette réversibilité devient à la fois mobile et complète dans le cas des opérations. Elle se présente d’ailleurs sous deux formes différentes et complémentaires : l’inversion, ou négation d’une opération par son inverse (par exemple + n − n = 0) et la réciprocité ou symétrie (par exemple A = B et B = A).

On peut, d’autre part, distinguer deux paliers successifs d’organisation des opérations, chacun étant caractérisé par la formation de certaines structures d’ensemble.

Le premier de ces paliers débute vers 7-8 ans avec la constitution les opérations concrètes. Celles-ci portent sur les objets eux-mêmes, par opposition aux énoncés ou propositions, et n’utilisent que des structures de classes, de relations et de nombres (sans d’ailleurs épuiser la logique des classes ou des relations). Telles sont, par exemple, les classifications (ou emboîtements hiérarchiques de classes), les sériations (ou enchaînements de relations asymétriques transitives), les correspondances et autres structures multiplicatives (les tables à double entrée ou matrices consistant en une multiplication de deux classifications), etc. Or, ces structures initiales, que nous avons appelées « groupements élémentaires », sont caractérisées, outre leurs propriétés positives, par un certain nombre de différences eu égard aux structures achevées du palier suivant. Ce ne sont ainsi que des « semi-réseaux » par défaut de « bornes » soit inférieures soit supérieures. Ce ne sont que des groupes imparfaits faute d’associativité complète : par exemple (A + A) − A n’équivaut pas à A + (A − A). Et surtout l’inversion et la réciprocité y sont représentées chacune à part (l’inversion pour les structures de classes et la réciprocité pour celles de relations), sans réunion des deux en une structure totale.

De 11-12 à 14-15 ans se constitue par contre un second type de structures opératoires, qui marquent l’achèvement du système. La pensée devient alors hypothético-déductive, c’est-à-dire qu’elle porte dorénavant sur des propositions et non plus seulement sur des objets. En d’autres termes, il se constitue une logique des propositions, qui se superpose à celle des classes et des relations et qui se caractérise par un certain nombre d’opérations nouvelles : l’implication (p ⊃ q : « si l’hypothèse p est vraie, alors la conséquence q s’ensuit nécessairement »), la disjonction (p ∨ q : « ou p ou q ou tous les deux »), etc. Mais cette logique n’est pas seulement verbale. Comme l’a montré B. Inhelder dans sa communication au Congrès international de psychologie de Stockholm, ces mêmes opérations sont celles qui interviennent dans l’induction expérimentale des lois physiques et qui permettent, dès 11-12 ans et surtout dès 14-15 ans, de dissocier les facteurs en jeu dans une loi physique et d’organiser des preuves rigoureuses (dont l’enfant du niveau concret est encore incapable).

Ces opérations propositionnelles ou formelles sont alors caractérisées par des structures nouvelles, qui permettent de réunir toutes les opérations en un système unique. Ce système est d’abord caractérisé par des lois de réseau (lattice). On appelle réseau un système semi-ordonné dont chaque couple d’éléments possède une « borne supérieure » ou « join » (leur réunion ∨) ainsi qu’une « borne inférieure » ou « meet » (leur conjonction : .). Le réseau s’obtient par la construction d’un « ensemble des parties », se superposant aux ensembles simples qui caractérisent les groupements élémentaires. Et cet ensemble des parties se construit lui-même par le moyen d’une combinatoire : ce sont donc les opérations combinatoires qui différencient, en définitive, le réseau formel des groupements concrets. Mais le système formel se caractérise également par des lois de groupe et d’un groupe à quatre transformations (Vierergruppe). À une opération telle que p ⊃ q correspond ainsi une inverse N, qui est p . q, une réciproque R, qui est q ⊃ p, et une corrélative C qui est l’inverse de la réciproque, soit C = NR = p . q. Jointe à la transformation identique I, ces transformations constituent donc un groupe commutatif :

NR = C ; NC = R ; CR = N et CNR = I

L’intérêt psychologique de ce groupe consiste notamment en la possibilité d’en tirer un schéma qualitatif de proportions, tel que

I/C = R/N car I . N = C . R et I ∨ N = C ∨ R

Par exemple : (p ∨ q)/(p . q) = (p | q)/(p . q) ou (p/q) = (q/p) ou (p/q) = R (p/q)

Il est intéressant de noter que ces structures de réseau et de groupe, dont nous avons constaté empiriquement l’existence dans les actes d’intelligence du niveau de 12 à 15 ans, correspondent aux structures fondamentales de la pensée mathématique. On sait, en effet, que les Bourbaki, en leur célèbre Traité, font reposer les mathématiques sur trois structures fondamentales : les structures algébriques, dont le prototype est le groupe, les structures d’ordre dont la forme la plus représentative est le réseau, et les structures topologiques, relatives au continu qui ne nous concerne pas ici.

Du point de vue du fonctionnement de l’intelligence, ces structures présentent deux significations complémentaires. Génétiquement, tout d’abord, elles constituent les formes d’équilibre vers lesquelles tend le développement. On peut considérer, en effet, l’évolution de l’intelligence comme une équilibration progressive. Et, comme tout état d’équilibre (y compris les formes d’équilibre mobile, dont relève l’équilibre opératoire) se caractérise par la compensation des transformations virtuelles, donc par la réversibilité, cela revient au même de dire que le développement de l’intelligence est une marche vers un équilibre de plus en plus stable et de soutenir qu’il est orienté dans la direction d’une réversibilité progressive. En effet, les structures sensori-motrices et perceptives ne connaissent encore que des états momentanés d’équilibre (avec déplacements continuels de l’équilibre) et qu’une réversibilité très incomplète. Avec les régulations représentatives préopératoires, il y a double progrès vers l’équilibre et vers la réversibilité, mais l’un et l’autre demeurant inachevés. Les opérations concrètes, qui fournissent un premier modèle de réversibilité entière, constituent également un premier exemple d’équilibre stable, puisque les opérations de classification, de sériation, de correspondance, de numération, etc., qui s’élaborent sur ce premier palier opératoire se conserveront ensuite la vie durant, quelles que soient leurs différenciations ultérieures (et la variété des applications nouvelles auxquelles elles donneront lieu). Mais le champ d’équilibre des opérations concrètes est encore limité à chaque domaine respectif de structuration, tandis que, avec les opérations propositionnelles ou formelles, un seul grand système s’organise, qui réunit en un même tout les deux formes de la réversibilité (inversions et réciprocités) ainsi que l’ensemble des opérations logiques : l’équilibre est ainsi atteint sous sa forme la plus large, indépendamment, à nouveau, des particularisations ultérieures.

Du point de vue du fonctionnement actuel de l’intelligence, les mêmes structures interviennent dans la solution des problèmes. Un problème peut, en effet, être considéré comme l’expression d’une lacune dans le système, donc d’un déséquilibre partiel. Résoudre le problème revient alors à combler la lacune au moyen des opérations du groupe ou du réseau, c’est-à-dire à rétablir l’équilibre sur le point où un déséquilibre local ou momentané s’était manifesté.

II

Il est maintenant aisé de constater que toutes ces notions se retrouvent sous une forme soit identique soit analogue sur le terrain de la cybernétique c’est-à-dire dans les théories élaborées par les cybernéticiens ou dans le fonctionnement même des machines et des servomécanismes qui fournissent des modèles des activités cérébrales et mentales.

La cybernétique constitue d’abord, de toute évidence, une mathématisation de la pensée. Mais il ne s’agit pas seulement d’une mathématisation dans ce sens étroit et essentiellement quantitatif qui est celui de la perspective courante sous laquelle on recourt aux mathématiques en psychologie : cela serait tout au plus vrai des machines construites en vue du calcul élémentaire, par opposition aux servomécanismes supérieurs, lesquels, eux, sont capables de résoudre des problèmes. La mathématisation dont il s’agit est donc à concevoir au sens le plus large, impliquant l’intervention des « structures » selon la signification indiquée plus haut. C’est ainsi que les machines à calculer électroniques admettent une arithmétisation possible de leurs liaisons, ce qui entraîne a fortiori une possibilité de logicisation. De plus, l’arithmétique en jeu dans leurs « informations » est une arithmétique binaire (= module 2) qui est donc directement isomorphe à l’algèbre booléenne (logique).

La cybernétique comporte, en effet, une théorie de l’« information » qui étudie les formes générales de la transmission des messages. Or, bien que la théorie mathématique de l’information soit de nature probabiliste et s’apparente de façon très suggestive au calcul de l’entropie en thermodynamique, il reste ce fait essentiel que les connexions élémentaires intervenant en un système d’informations sont pour la plupart (c’est-à-dire dans la mesure où elles ne sont pas trop indéterminées) isomorphes aux liaisons de la combinatoire logistique. C’est ainsi que C. E. Shannon a fourni une théorie du « réseau » (lattice) constitué par tout système d’informations 1. Il est vrai que ce réseau est un peu plus large que celui de la logique des propositions : il n’est pas toujours distributif, et, s’il peut être complémenté (c’est-à-dire si x ≤ y donne x + z = y) l’élément complémentaire de première espèce z n’est pas toujours unique. Mais ceci n’exclut en rien une logicisation des informations suffisamment déterminées. De même D. M. MacKay distingue de ce même point de vue trois formes possibles de la « quantité d’information » et utilise la logique de Wittgenstein (fondée sur la notion de « propositions atomiques » ou indécomposables) pour « quantifier » de telles notions 2. À cet égard, les cybernéticiens utilisent donc la logique symbolique dans le sens précisément où nous préconisons son emploi pour décrire les opérations de l’intelligence : sans se référer en aucune manière à une logique normative, c’est-à-dire sans avoir à attribuer aux machines une conscience du vrai et du faux, la théorie de l’information recourt néanmoins à la logistique en tant qu’instrument d’analyse des structures opératoires, et c’est en quoi il y a convergence avec le point de vue développé plus haut.

Il est, d’ailleurs, à remarquer à cet égard que les structures logistiques ne s’accordent pas seulement avec les modèles inertes des modèles mécaniques : c’est jusque sur le terrain des connexions neuroniques que l’on a poussé l’application des instruments d’analyse fournis par la logistique. C’est ainsi que dans un très intéressant article de The Bulletin of Mathematical Biophysics 3, W. S. McCulloch et W. Pitts ont fourni des modèles de structures neuroniques exprimés en langage d’opérations propositionnelles : négations, disjonctions, conjonctions, implications et équivalences. Le choix des opérations propositionnelles leur a été dicté par l’analogie entre la loi du tout ou rien propre à l’activité nerveuse et la dualité affirmation-négation propre à la logique bivalente des propositions (cf. p. 117 et p. 131). Il y est fait usage de même de l’anneau booléen (un anneau étant un groupe complété par l’emploi d’une opération auxiliaire). Quant à l’objection qui pourrait être faite d’une discrépance entre le caractère absolu ou inconditionné des structures logiques et le caractère statistique ou probabiliste des activités nerveuses, on y répond d’avance en un second article, dû à H. D. Landahl, W. S. McCulloch et W. Pitts, sur les conséquences statistiques du calcul logique des réseaux nerveux 4 : il y est proposé une méthode mathématique de conversion des relations logiques en relations statistiques, qui assure d’emblée la correspondance entre les deux sortes d’expressions. On sait que Boole établissait déjà une telle correspondance entre l’algèbre de la logique et celle des probabilités. Les mêmes réflexions sont susceptibles de s’appliquer alors aux relations entre la forme logique de la transmission des informations dans une machine et les fluctuations statistiques qui peuvent se produire avant que l’équilibre soit atteint. C’est ainsi que Turing a adapté un schéma analogue à celui de McCulloch et Pitts aux machines binaires.

Une autre convergence frappante entre les modèles cybernétiques et ce que nous enseigne l’analyse des structures intervenant à titre de formes d’équilibre sur les paliers successifs du développement mental, tient, en effet, au rôle joué dans les deux cas par les processus d’équilibration. La solution d’un problème au moyen de servomécanismes tels que, par exemple, ceux de l’homéostat d’Ashby s’effectue, comme on le sait, grâce à une succession d’équilibrations et de rééquilibrations progressives, avec auto-correction des « feed backs », qui rappelle mutatis mutandis la manière dont travaille l’intelligence en évolution, d’abord par régulations larges, puis de plus en plus circonscrites, et ensuite par opérations de mieux en mieux équilibrées en fonction de toutes les transformations possibles du système 5.

Or, cette équilibration repose, comme le fonctionnement de l’intelligence, sur un principe fondamental de réversibilité. On connaît à cet égard la fortune acquise par le schéma du « feed back », ce processus d’adaptation et de finalité mécaniques (si l’on peut s’exprimer ainsi) qui relie le point d’arrivée d’une transformation du système au point de départ de cette même transformation, de manière à en régler l’ajustement jusqu’à la solution du problème. Le « feed back » est donc comparable à une régulation, c’est-à-dire, dans les conceptions dont nous nous servons, à une opération non encore équilibrée, l’arrivée au point d’équilibre caractérisant alors l’opération elle-même. Le « feed back » fonctionne, en effet, tant qu’il y a déséquilibre, c’est-à-dire tant que le problème posé à la machine n’est pas résolu (c’est l’erreur qui détermine le retour d’énergie), tandis qu’il aboutit à une simple liaison réversible comparable à un jeu d’opérations, au point où l’équilibre est atteint, c’est-à-dire où la solution est obtenue.

On pourrait même, au risque de côtoyer la spéculation proprement dite, interpréter dans le langage de la réversibilité l’ingénieuse comparaison due à Wiener entre la quantité d’information et l’entropie. On sait que pour cet auteur la quantité d’information, qui est la mesure du degré d’organisation du système, équivaut à l’inverse de l’entropie de celui-ci (comparaison qui n’est d’ailleurs acceptée en général qu’avec prudence, bien qu’elle se légitime du fait que l’entropie est le logarithme de la probabilité de l’état, donc la mesure du désordre du système). On pourrait donc soutenir, en adoptant un tel langage, que la quantité d’information exprime par le fait même le degré de réversibilité du système, en attribuant alors l’activité anti-entropique (le retour à l’ordre) à une sorte de démon de Maxwell, lequel prendrait en l’occurrence la figure d’un démon logique, chargé de la sélection des informations.

Quoi qu’il en soit de ces dernières réflexions, le fait évident reste qu’une machine à résoudre des problèmes est comparable à un système d’opérations autant qu’elle l’est à un modèle mécanique des activités cérébrales. Quand Shannon applique l’algèbre de Boole aux aiguillages des circuits électriques de la machine 6 et quand on compare le système nerveux aux machines binaires, on se livre à deux sortes d’analogies qui s’imposent du fait que la machine comme le cerveau aboutit à des solutions exprimables en termes opératoires. Le fonctionnement de la machine étant arithmétisable, il est a fortiori logicisable.

Les discussions sur la structure logique et sur les limitations des modèles cybernétiques témoignent à cet égard d’une curieuse convergence avec les discussions que l’on peut conduire sur la nature de la formalisation logique elle-même et sur ses limites. C’est ainsi que Turing soutient que la machine est formalisable à cette réserve près que l’on ne saurait démontrer sa non-contradiction par ses propres moyens 7 : or, c’est le cas, comme on le sait, de tout système logique ou arithmétique, et cela en vertu du théorème de Gödel et de différents travaux, dont ceux de Turing lui-même, qu’il applique ainsi indifféremment à la machine décrite en termes d’opérations logiques ou aux systèmes logiques décrits en termes de machines. De même, en une intéressante note 8, faisant suite à une série d’articles sur la question de savoir en quel sens les machines à résoudre des problèmes sont comparables aux mécanismes de la pensée, Polanyi soutient que les limites assignées à la formalisation logique de la machine sont les mêmes que celles dont témoignent tous les systèmes formels : la pensée peut utiliser la machine comme elle utilise un mécanisme opératoire quelconque ; seulement c’est à condition de s’appuyer sur un ensemble d’intentions psychologiques préalables qui permettent la formalisation mais ne sont pas par elles-mêmes formalisables. En un mot, la machine ne constitue, comme le système des opérations logiques, qu’un simple instrument, lequel permet de résoudre les problèmes, mais non pas d’en inventer de nouveaux en dehors des frontières de la structure donnée.

C’est donc sans aucune ambiguïté que l’on peut faire correspondre aux structures de la machine les grandes structures logiques fondamentales. On retrouve naturellement, de ce point de vue, les structures combinatoires qui relèvent du « réseau ». Mais on retrouve aussi la structure de « groupe », car si le « feed back » n’est mathématiquement exprimable que par des intégrales compliquées tant qu’il y a déséquilibre, l’arrivée au point d’équilibre peut se traduire en langage de « groupe ». En outre la structure booléenne des machines binaires implique le groupe INRC.

III

En conclusion, la théorie opératoire de l’intelligence conduit à une schématisation des structures de la pensée, telles qu’elles interviennent dans les conduites intellectuelles psychologiquement observables. La cybernétique, d’autre part, constitue une schématisation de mécanismes généraux d’information et de combinaison qui interviennent en particulier dans les processus nerveux. Il est donc naturel qu’il existe une correspondance relative entre ces deux sortes de schémas et cette correspondance est sans doute le présage d’un isomorphisme entre les structures opératoires psychologiques et certaines structures nerveuses 9.

Mais on peut se demander — et il nous plaît de terminer ces quelques réflexions par une question pratique — à quoi sert pour le psychologue lui-même l’étude de telles structures opératoires. Leur utilité principale est de permettre la prévision de certains synchronismes ou de certaines successions dans l’apparition des schèmes opératoires et de conduire à l’explication de ces formations synchronisées ou successives.

En connaissant les lois d’une structure d’ensemble, on peut, en effet, déduire l’ensemble des opérations possibles du système et par conséquent prévoir l’existence de liaisons entre des opérations en apparence dénuées de toute parenté, ce qui explique leur apparition synchronisée. Pour ne donner qu’un exemple, pourquoi la compréhension ou la construction des proportions mathématiques se présentent-elles au même niveau que l’apparition des opérations propositionnelles ? C’est que, malgré l’hétérogénéité complète qui semble séparer ces deux sortes de schèmes opératoires, la logique des propositions comporte un groupe INRC (voir plus haut sous I), dont il est possible de tirer un schéma de proportions qualitatives : or, c’est effectivement par l’intermédiaire d’un tel schéma que les sujets de 12-13 ans en arrivent à découvrir les proportions métriques, au niveau même où ils commencent à manier les opérations de la logique propositionnelle.

On voit alors que la structure d’ensemble est susceptible d’acquérir une valeur explicative en tant que forme d’équilibre, que cet équilibre soit simplement celui des constructions mentales en cours (et solidaires les unes des autres par l’intermédiaire de cette structure totale) ou que, comme il est plus probable, il englobe des facteurs de maturation nerveuse dans la mesure où les structures en jeu sont isomorphes à celles des connexions cérébrales.