Source et copyright à la fin du texte

 

Repris dans Perrenoud, Ph. : L’évaluation des élèves. De la fabrication de l’excellence à la régulation des apprentissages, Bruxelles, De Boeck, 1998, chapitre 4.

 

 

 

 

Les procédures ordinaires d’évaluation,
freins au changement des pratiques pédagogiques

Philippe Perrenoud

Faculté de psychologie et des sciences de l’éducation
Université de Genève
1992

 Sommaire

I. Le temps qui reste

II. Un rapport perverti au savoir

III. Travailler sous la menace, est-ce apprendre ?

IV. Une transposition didactique conservatrice

V. Le travail scolaire, préparation à l’évaluation

VI. L’obsession de l’équité formelle détourne des apprentissages de haut niveau taxonomique

VII. Une évaluation arbitraire, peu favorable au travail en équipe pédagogique

Changer l’évaluation pour changer la pédagogie ?

Références


Quelles sont les procédures ordinaires d’évaluation des élèves, dans la plupart des écoles publiques ? En simplifiant, je les caractériserai comme suit :

  1. Après avoir enseigné une partie du programme (un chapitre, quelques leçons, une suite de séquences didactiques présentant une unité thématique), le maître interroge quelques élèves oralement ou administre à toute la classe une épreuve papier-crayon.
  2. En fonction de leurs performances, les élèves reçoivent des notes ou des appréciations qualitatives qui sont consignées dans un registre et éventuellement portées à la connaissance de leurs parents.
  3. À la fin du trimestre, du semestre ou de l’année, on fait d’une façon ou d’une autre une synthèse des notes ou des appréciations accumulées, sous la forme d’une moyenne, d’un profil, d’un bilan quelconque.
  4. Combiné à des appréciations synthétiques de même nature pour l’ensemble des disciplines enseignées, ce bilan contribue à une décision en fin d’année scolaire, admission ou transfert dans telle section, accession à tel niveau, obtention ou non d’un certificat, etc.

Ce modèle général connaît de multiples variantes : selon qu’il y a ou non des notes chiffrées, selon l’échelle et la signification des notes, ou encore l’éventail des appréciations qualitatives disponibles, selon qu’il y a ou non découpage de l’année en trimestres ou en semestres, selon le poids des interrogations orales par opposition aux épreuves écrites ou à d’autres travaux personnels, selon la manière de fixer les barèmes (a priori ou a posteriori) ou encore selon le mode de synthèse trimestrielle ou annuelle, ou le nombre d’appréciations nécessaires pour composer une moyenne ou un bilan trimestriel ou annuel.

Le trait constant de toutes ces pratiques, c’est de soumettre régulièrement l’ensemble des élèves à des épreuves qui mettent en évidence une distribution des performances, donc de bonnes et de mauvaises performances, sinon de bons et de mauvais élèves. On dit parfois que cette évaluation est normative, au sens où elle adopte le principe de la courbe normale ou courbe de Gauss et fabrique de toute façon une distribution. Elle est essentiellement comparative : les performances des uns se définissent par rapport aux performances des autres plutôt qu’à des maîtrises attendues ou à des objectifs.

C’est aussi une évaluation très peu individualisée (la même pour tous au même moment, selon le principe de l’examen), mais où chacun est évalué individuellement pour une performance sensée refléter ses compétences strictement personnelles.

Aujourd’hui, cette description ne convient plus à tous les systèmes scolaires. Certains ont déjà rompu, au moins partiellement, avec ce mode d’évaluation, pour se tourner vers une évaluation plus descriptive, critériée, formative. L’analyse de ces systèmes montre qu’en faisant sauter le verrou de l’évaluation traditionnelle, on facilite la transformation des pratiques d’enseignement vers des pédagogies plus ouvertes, actives, individualisées, faisant davantage de place à la découverte, à la recherche, aux projets, honorant mieux les objectifs de haut niveau, tels qu’apprendre à apprendre, à créer, à imaginer, à communiquer. Cela ne veut pas dire qu’il suffit de changer l’évaluation pour que le reste se transforme comme par miracle. Le changement des pratiques pédagogiques se heurte à d’autres obstacles. C’est ainsi que la rénovation de l’enseignement du français, en Suisse romande, a certainement été limitée par le système d’évaluation, mais qu’il y a d’autres facteurs de résistance à une pédagogie de la communication orientée vers la maîtrise pratique de la langue (Dokic, Favre & Perrenoud, 1986 ; Weiss & Wirthner, 1991).

En quoi et pourquoi les procédures d’évaluation encore en vigueur dans la majorité des écoles du monde, font-elles obstacle à l’innovation pédagogique ? C’est à cette question que j’entends proposer des éléments de réponse, en illustrant le caractère systémique des pratiques pédagogiques.

Les mécanismes analysés plus loin ne sont pas tous à l’œuvre en même temps et ils ne sont pas partout assez forts pour empêcher totalement l’innovation. Ce sont pourtant des freins qu’il faut prendre en compte dans une stratégie de changement des pratiques pédagogiques.

Je distinguerai sept mécanismes complémentaires :

L’évaluation absorbe souvent la meilleure part de l’énergie des élèves et des enseignants ; il ne reste pas grand chose pour innover.

  1. Le système d’évaluation classique favorise un rapport utilitariste au savoir. Les élèves travaillent " pour la note ". Toutes les tentatives de pédagogie nouvelle se heurtent à ce minimalisme.
  2. Le système d’évaluation traditionnel participe d’une sorte de chantage, d’un rapport de force plus ou moins explicite, qui place maîtres et élèves, et plus généralement jeunes et adultes dans des camps opposés, empêchant leur coopération.
  3. La nécessité de mettre régulièrement des notes ou des appréciations qualitatives sur la base d’une évaluation standardisée favorise une transposition didactique conservatrice.
  4. Le travail scolaire tend à privilégier des activités fermées, structurées, bien rodées, qui peuvent être reprises dans le cadre d’une évaluation classique.
  5. Le système d’évaluation classique force les enseignants à préférer les compétences isolables et chiffrables aux compétences de haut niveau (raisonnement, communication), difficiles à enfermer dans une épreuve papier-crayon et des tâches individuelles.
  6. Sous des dehors d’exactitude, l’évaluation traditionnelle cache un grand arbitraire, difficile à concerter dans une équipe pédagogique : comment s’entendre quand on ne sait pas ce qu’on évalue vraiment ?

Examinons ces mécanismes plus en détail. Certains mettent en évidence les stratégies des élèves ou des parents, d’autres celles des enseignants, parfois les choses sont entremêlées. C’est pourquoi je n’en propose pas une classification bien nette.


I. Le temps qui reste

Lorsqu’on demande à un maître de préciser son identité professionnelle, il se situera d’ordinaire comme éducateur et comme enseignant, rarement comme évaluateur. Mais si l’on considère son emploi du temps, on verra que, surtout au secondaire, l’évaluation peut prendre au moins le tiers, parfois la moitié ou davantage du temps disponible. Cela aussi bien en classe, avec les élèves, que dans le temps de préparation. L’élaboration des épreuves et leur correction représentent un fardeau bien connu des enseignants. Mais surtout, une bonne partie des heures en classe sont dévolues à l’administration d’épreuves écrites, qu’il s’agisse d’épreuves composées par le maître lui-même ou d’épreuves standardisées imposées à toutes les classes, à quoi s’ajoute le temps de restituer ces épreuves, éventuellement de les corriger en classe. Plus tout le temps qu’il faut pour les annoncer, donner des pistes et des consignes pour s’y préparer, définir et éventuellement négocier avec les élèves ou des collègues la date des épreuves, leur forme, leur niveau d’exigence. Plus tout le temps requis par les négociations collectives ou individuelles qui prennent corps une fois que l’épreuve est rendue, lorsqu’il faut ajuster le barème, se pencher sur les corrections contestées, rectifier certaines notes ou " bricoler " certains arrangements pour permettre à un élève d’obtenir sa moyenne de justesse.

Les pratiques courantes d’évaluation prennent non seulement un temps considérable, mais elles absorbent beaucoup d’énergie et d’ingéniosité, tant du côté des maîtres que des élèves. Même si c’est une routine pour les enseignants, il faut constamment ajuster les anciennes épreuves à ce qu’on a réellement enseigné cette année-là, renoncer à certaines questions ou certains problèmes qui ne conviennent plus, introduire de nouveaux thèmes, reformuler certaines consignes. Même si l’enseignant ne crée pas de toutes pièces les instruments d’évaluation chaque année, il ne cesse de les remanier et d’hésiter entre diverses solutions : partir d’une ancienne épreuve ou d’une épreuve administrée par un collègue, partir de zéro et composer une épreuve de toutes pièces, combiner les deux méthodes, etc. Autour de l’évaluation se noue une compétition entre les élèves, un stress, des sentiments d’injustice, des peurs par rapport aux parents, à l’avenir, à l’image de soi. L’évaluation implique les familles et mobilise aussi leurs espoirs et leurs angoisses, qui pèsent directement et indirectement sur les élèves et les enseignants.

Ce tableau, pour impressionniste qu’il soit, suffit à indiquer que l’évaluation n’est pas une mince affaire et que, pour faire tourner la machine, on a besoin de temps, d’énergie, d’ingéniosité, de multiples décisions et négociations qui laissent finalement peu de ressources pour penser à rénover son enseignement, à se lancer dans des expériences didactiques, à transformer ses méthodes ou son style de gestion de classe.

Le premier obstacle est donc simpliste, mais très important : l’évaluation absorbe souvent la meilleure part de l’énergie des élèves et des enseignants ; il ne reste pas grand chose pour innover. En réalité, le phénomène n’est pas linéaire : l’évaluation ne prend pas constamment la même fraction de temps, il y a des temps forts et des temps faibles. Il y a des semaines où les épreuves se succèdent parce que l’échéance se rapproche, qu’il faut avoir le nombre voulu de notes dans son registre pour " faire ses moyennes ". Tout le monde est alors sur les dents. Une fois cette période achevée, on tente d’oublier un moment l’évaluation, pour se laisser vivre ou simplement mettre l’accent sur les apprentissages. Mais ce répit est trop court pour donner véritablement l’envie et la possibilité d’innover, sachant que quelques semaines plus tard il faudra recommencer en vue de la prochaine échéance. En définitive, l’évaluation scande le temps scolaire d’une façon peu compatible avec les rythmes de l’innovation parce que, relativement mal vécue mais apparemment incompressible, elle pousse beaucoup d’enseignants à un fonctionnement en dents de scie, alternance entre stress et détente, ni l’un ni l’autre n’étant favorable à la transformation des pratiques pédagogiques.

Dans l’enseignement secondaire, le fractionnement du temps, tant pour les élèves que pour les maîtres, accentue considérablement le sentiment de stress.

Une évaluation plus formative ne prend pas moins de temps. Mais elle donne des informations, identifie et explique des erreurs, suggère des interprétations quant aux stratégies et attitudes des élèves, et donc alimente directement l’action pédagogique, alors que le temps et l’énergie voués à l’évaluation traditionnelle ne servent qu’à faire tourner la machine évaluative.


II. Un rapport perverti au savoir

Les choses étant ce qu’elles sont, il faut avoir de bonnes notes (ou leur équivalent qualitatif) pour progresser dans sa carrière scolaire et accéder aux filières les plus enviées. Bien entendu, en principe, les notes sont là pour évaluer des compétences réelles. Et si elles commandent l’accès au degré suivant ou à des filières exigeantes, c’est en théorie parce qu’elles garantissent un niveau d’acquisition. Mais en pratique, c’est le résultat qui compte. Avec deux effets pervers bien connus : d’une part le bachotage, d’autre part la tricherie.

Le bachotage est une façon honnête, mais idiote, d’être capable d’une performance d’un jour ; elle ne manifeste pas une véritable compétence mais un entraînement intensif qui permet de faire illusion le temps d’une épreuve écrite ou d’une interrogation orale. Cela ne veut pas dire qu’en une nuit un élève qui n’a rien compris, n’a pas travaillé auparavant et ne sait rien pourra devenir un bon élève. Cela veut dire que le métier d’élève expérimenté consiste à asseoir quelques bases et à en " mettre un coup " juste avant l’épreuve ou l’examen pour s’empresser d’oublier dès le lendemain ce qui aura été mémorisé ou exercé dans des conditions de stress peu favorables à un rapport serein au savoir.

L’autre stratégie, moins honnête, c’est la tricherie, élevée au rang des beaux-arts, voire de l’industrie dans certains établissements ou certaines classes. Là, les élèves apprennent que l’important c’est de donner une réponse juste, peu importent les moyens de la trouver.

Mais je ne voudrais pas réduire l’effet du système d’évaluation au bachotage et à la tricherie. Même si ces deux perversions disparaissaient, le système de notation conserverait un effet majeur sur le rapport au savoir : lorsque le piège scolaire (Berthelot, 1982) se referme, il est normal que chacun cherche à s’en tirer le mieux possible ; pour cela, le réalisme commande non pas d’apprendre pour le plaisir, de s’intéresser à la réalité, de se poser des questions, de réfléchir, mais d’être prêt le jour de l’épreuve décisive. Même s’il n’y a pas bachotage, il y a appauvrissement des démarches intellectuelles, de la curiosité, de la créativité, de l’originalité au profit de " ce qui paye ", autrement dit de ce qui peut être convertit en notes bonnes ou honorables.

Le système d’évaluation classique favorise un rapport utilitariste, voire un rapport cynique au savoir (Perrenoud, 1986 a). Les connaissances, les savoir-faire ne sont finalement valorisés que s’ils permettent d’avoir de bonnes notes ; pour beaucoup d’élèves, et de parents, il est inutile de chercher plus loin.

Après plusieurs années d’un tel régime, il devient très difficile d’intéresser les élèves au savoir pour le savoir, pour le sens qu’il donne à la réalité, pour l’enrichissement personnel qu’il apporte, pour la mise en mouvement ou la satisfaction de l’esprit qu’il favorise. Tous les professeurs du monde savent qu’à partir de 8 ou 10 ans, lorsqu’ils proposent un travail, la première question de leurs élèves n’est pas " Qu’est-ce que ça va nous apporter ? Est-ce important, est-ce intéressant ? Allons-nous apprendre quelque chose ? ", mais " Est-ce pour une note ? " Sachant que si la réponse est non, il n’y aura pas lieu de déployer des efforts surhumains…

Toutes les tentatives de pédagogie nouvelle, d’école active, d’évaluation formative, de différenciation de l’enseignement se heurtent à ce cynisme, à ce minimalisme, à ce rapport stratégique et utilitariste à l’apprentissage. Et on ne saurait en vouloir aux élèves : ils sont tout simplement réalistes et, comme tout acteur social, investissent en longue période dans ce qui leur assure véritablement des profits.

Les parents font le même calcul et encouragent la plupart du temps leurs enfants à avoir des résultats, parfois par n’importe quel moyen. L’important, dans la course d’obstacles que représente le cursus scolaire, c’est de sauter le prochain obstacle et donc d’avoir des notes suffisantes pour… Certes, cela suppose des apprentissages réels, la maîtrise de certains savoirs et savoir-faire. Mais d’une certaine manière, ce n’est pas sur ces acquis que l’on se concentre, mais sur le " Sésame, ouvre-toi " que représente une évaluation favorable.


III. Travailler sous la menace, est-ce apprendre ?

Si les élèves travaillent pour la note, cela veut dire qu’ils travaillent ! Tant les parents que les maîtres utilisent les notes, parfois de façon éhontée, pour obtenir un minimum, parfois un maximum d’investissement dans le travail scolaire.

Cela n’a rien d’étonnant : dans tous les groupes où l’adhésion aux normes n’est pas librement consentie, un jeu de sanctions et de récompenses incite les acteurs à se conduire correctement et à travailler normalement. C’est ce qui se passe dans beaucoup de situations de travail dans les entreprises et les administrations. La carotte et le bâton, la fierté d’être distingué ou la peur du gendarme sont des moteurs que l’école n’invente pas. Mais elle les fait fonctionner à plein régime. Lorsque la liberté des enfants et des adolescents dépend de leurs notes, lorsque leur argent de poche varie à la hausse ou à la baisse en fonction de leurs résultats scolaires, lorsqu’on leur retire amour et estime s’ils font des contre-performances, qu’on les aime et qu’on les loue dans le cas contraire, on exerce une forte pression sur leur comportement à l’école. Les enseignants n’ont pas exactement les mêmes ressources que les parents, mais ils peuvent aussi accorder, en récompense de bons résultats scolaires, certains privilèges, à commencer par leur confiance et leur considération ; à l’inverse, les mauvais élèves peuvent craindre, selon les cas, les moqueries, l’hostilité, la mise à l’écart ou la prise en charge psychopédagogique lourde. Enfin, derrière les notes, parents et enseignants évoquent constamment la réussite ou l’échec scolaire.

Le système d’évaluation traditionnel participe donc d’une sorte de chantage, d’un rapport de force plus ou moins explicite, qui place maîtres et élèves, et plus généralement jeunes et adultes dans deux camps différents, les uns essayant de préserver leur liberté et leur tranquillité, les autres s’efforçant de les faire travailler, pour leur bien, bien entendu. Le contrat pédagogique traditionnel est un contrat partiellement conflictuel, comme le contrat de travail classique. Il module la pression que l’un des contractant peut exercer sur l’autre, et prescrit les limites à la pression aussi bien qu’à la résistance (cf. Chevallard, 1986).

Il est évident qu’un tel contrat ne peut qu’entraver toute évolution vers les pédagogies nouvelles, l’école active, la prise en charge de son propre apprentissage par l’élève. L’évaluation pédagogique traditionnelle est un jeu du chat et de la souris, un affrontement de stratégies et de contre stratégies. Il est très difficile, dans ces conditions, de créer une relation véritablement coopérative entre enseignants et élèves, alors que, une heure plus tard ou une semaine plus tard, les premiers vont juger les seconds sans aménité. C’est d’ailleurs pourquoi il est si difficile de conjuguer, dans la même relation pédagogique et le même espace-temps, évaluation formative et évaluation certificative. Car la première suppose transparence et collaboration, alors que la seconde se situe davantage dans le registre de la compétition et du conflit, donc du faux semblant et de la stratégie.


IV. Une transposition didactique conservatrice

Chevallard (1985) a montré que la transposition didactique la plus classique, en mathématique comme dans les autres disciplines, empruntait l’image d’une progression régulière dans un " texte ", le texte du savoir, autrement dit le curriculum découpé en tranches, chapitres, leçons, en pages qu’on tourne les unes après les autres. Du point de vue de l’enseignant, ce mode de transposition a beaucoup d’avantages, notamment sous l’angle de la planification et de la correspondance entre le programme annuel et le temps d’enseignement disponible chaque semaine. Rien n’est en effet plus commode et plus sécurisant que de pouvoir découper le programme en petites unités, autant que possible indépendantes les unes des autres, de sorte que pour chacune on peut prévoir un temps de sensibilisation, d’explication, d’exercice et de contrôle.

Il serait donc injuste de mettre sur le seul compte de l’évaluation traditionnelle la prégnance de ce mode de transposition. Il reste que la nécessité de mettre régulièrement des notes ou des appréciations qualitatives sur la base d’une évaluation standard renforce terriblement le mode classique de transposition didactique. Quoi de plus simple en effet que de traiter un chapitre, de faire une épreuve, de mettre une note et de passer plus loin ? Ainsi, au bout du trimestre ou du semestre, on pourra faire une moyenne ou une synthèse, éventuellement en faisant, par acquis de conscience, une épreuve récapitulative. De même en fin d’année. Les moyens d’enseignement mis à disposition des enseignants renforcent cette façon de faire. Et même les grilles critériées, si elle deviennent les organisateurs de l’enseignement.

L’ennui, c’est que cette simplicité se paye très cher du point de vue pédagogique. Elle rend difficile toute différenciation de l’enseignement : les élèves doivent progresser au même rythme et on passe au chapitre suivant lorsqu’une proportion " décente " de la classe semble avoir acquis l’essentiel des notions et savoir-faire. Dans cette logique, hormis certaines révisions, une fois que la page est tournée, on n’y revient pas. Si bien que ce sont assez souvent les mêmes élèves qui, lorsqu’on passe au chapitre suivant, n’ont rien compris ou rien consolidé et se trouvent, en fin d’année, en situation d’échec irrémédiable. Plus globalement, ce type de transposition didactique privilégie, comme le montre Chevallard, le temps de l’enseignement et le temps de l’enseignant, par opposition au temps de l’apprentissage et au temps de l’enseigné. En effet, toute approche constructiviste et génétique du développement et des connaissances démontre que le savoir ne se construit jamais de façon linéaire, qu’il y a toujours des anticipations, des retours en arrière, des reconstructions intensives et des phases de latence. Un enseignement qui voudrait suivre les rythmes de l’élève ne peut s’enfermer dans un découpage strict en chapitres. Une pédagogie active différenciée, par exemple, devrait faire éclater le principe d’une progression parallèle de tous les élèves sur les mêmes contenus. L’évaluation n’est pas le seul, mais c’est un verrou, et de taille !


V. Le travail scolaire, préparation à l’évaluation

Même l’évaluation la plus traditionnelle n’est, en principe, pas un but en soi, mais un moyen de vérifier que les élèves ont acquis les connaissances. Il est certes recommandé, lorsqu’on enseigne, d’avoir une idée assez précise de la façon dont on s’y prendra pour évaluer les acquis, ce qui évite d’introduire un trop grand divorce entre les contenus et les modalités de l’enseignement et les contenus et les modalités de l’évaluation. Mais, poussée à l’extrême, cette correspondance devient une perversion : l’enseignement ne se définit plus que comme la préparation à la prochaine épreuve et l’activité d’apprentissage devient une activité d’entraînement au sens où on le dit de certains sportifs qui font et refont les exercices sur lesquels on les jugera le jour de la compétition.

Cette forme de correspondance donne un poids démesuré à l’exercice scolaire papier-crayon. Et en effet, on constate que dans la plupart des classes, le travail scolaire ressemble comme deux gouttes d’eau aux exercices qu’on trouvera dans les épreuves écrites. La seule différence, c’est que dans un cas il n’y a pas de notes ou d’appréciation qualitative, que " ça ne compte pas ", alors qu’au moment de l’évaluation, on introduit un peu plus de cérémonie, de stress et d’équité formelle (Perrenoud, 1984, 1986 b, 1987).

L’évaluation est dans ce domaine un carcan très fort. Les maîtres qui tentent de s’éloigner des exercices scolaires les plus proches des épreuves papier-crayon le savent bien : lorsqu’on fait travailler des élèves en groupes, lorsqu’on donne de l’importance aux situations de communication, aux recherches, aux problèmes ouverts, aux enquêtes, aux activités-cadres, on doit affronter une angoisse qui peut devenir insoutenable. Elle a plusieurs facettes. Elle tient d’abord à l’incertitude sur le rapport au programme, sur la nature des fonctionnements intellectuels qu’on a favorisés, sur ce que les élèves apprennent vraiment. D’autres angoisses touchent à la gestion du temps ou à la respectabilité de telles activités aux yeux des collègues, des parents, voire des élèves. S’y ajoute à la peur de ne pouvoir évaluer dans les formes traditionnelles : lorsqu’on envoie les élèves sur le terrain, lorsqu’ils préparent un spectacle ou écrivent un roman, lorsqu’ils passent des heures à arpenter le préau dans le cadre d’une situation mathématique ou à observer des phénomènes naturels, le maître ne sait pas très bien comment il pourra valider ces apprentissages par une note qui soit à la fois équitable et valide. Dans une pédagogie active, tout le monde n’apprend pas la même chose au même moment et ne se prépare pas à la même épreuve. Et une partie de ce qu’on apprend ne trouve aucun équivalent dans des questions à choix multiples ou des exercices papier-crayon… Ici encore, l’évaluation traditionnelle empêche l’innovation pédagogique, en appauvrissant considérablement l’éventail des activités praticables en classe.


VI. L’obsession de l’équité formelle
détourne des apprentissages de haut niveau taxonomique

Même lorsque l’évaluation traditionnelle est continue, étalée tout au long de l’année scolaire, elle garde de l’examen une conception de l’équité qui consiste à poser les mêmes questions à tout le monde au même moment et dans les mêmes conditions. Comme s’il y avait des raisons de penser que les apprentissages peuvent être synchronisés au point que, pendant exactement le même nombre d’heures ou de semaines, et strictement en parallèle, les élèves soient capables d’apprendre la même chose.

Cette fiction, aussi peu défendable soit-elle, sous-tend tout le système d’évaluation formelle traditionnelle. Et, du moment que ce système est en vigueur et gouverne partiellement le destin scolaire des élèves, il est assez normal qu’ils soient, comme leurs parents, fortement attachés à l’équité formelle, à défaut d’égalité réelle devant l’enseignement.

Ce souci poussera la plupart du temps à évaluer des performances strictement individuelles à partir de questions standardisées et fermées. En effet, si l’on évalue le travail d’un groupe, le soupçon d’arbitraire surgit : tous les membres du groupe ont-ils fourni une contribution équivalente ? Savent-ils la même chose ? Est-il juste de mettre la même note aux leaders et à ceux qui suivent, à ceux qui conçoivent et à ceux qui réalisent ?

De même, évaluer des productions qualitativement différentes ou des réponses à des questions très ouvertes, c’est le risque de l’arbitraire, de la notation " à la tête du client ". La composition puis la dissertation bénéficient à cet égard d’un statut spécial, mais aussi d’une réputation bien établie, selon laquelle la note reflète souvent davantage les goûts et les caprices du professeur que les compétences de l’élève. Les études docimologiques montrent d’ailleurs des variations spectaculaires dans la notation des mêmes textes par vingt correcteurs expérimentés. On observe aussi que la notation est moins sévère lorsqu’elle paraît arbitraire et pèse moins dans la sélection. Ainsi, pendant longtemps, l’entrée au Cycle d’orientation genevois était déterminée par trois moyennes obtenues en 6e primaire : en mathématique, en orthographe et en grammaire ou en composition française. Dans ce dernier cas, on prenait la meilleure des deux notes, grammaire ou composition. Si bien que cette troisième composante pesait fort peu dans la sélection, parce que la note de composition était largement, en moyenne, supérieure aux autres et donc l’emportait sur la note de grammaire. Si bien qu’en définitive, la sélection se faisait sur la mathématique et l’orthographe…

On peut difficilement imaginer que ce système soit viable avec un arbitraire aussi grand étendu à toutes les disciplines. Ce qui rend possible la composition ou la dissertation, c’est d’une certaine manière leur caractère d’exception, compensées qu’elles sont par beaucoup de disciplines ou d’autres aspects du français qui se prêtent à une évaluation en apparence plus précise, là où on peut compter des erreurs ou attribuer des points en mettant relativement d’accord des correcteurs indépendants.

La conséquence, c’est que l’évaluation privilégie les savoirs et savoir-faire qui peuvent se traduire en performances individuelles et se manifester à travers des questions à choix multiple ou des exercices auxquels on peut équitablement attribuer un certain nombre de points. Dans l’ensemble des savoirs et savoir-faire valorisés par les plans d’étude, l’évaluation traditionnelle délimite un sous-ensemble assez restrictif et relativement conservateur par rapport aux nouvelles tendances des curricula, qui mettent de plus en plus l’accent sur les compétences de haut niveau taxonomique. Les déclarations d’intention privilégient désormais le raisonnement, l’imagination, la coopération, la communication, le sens critique et j’en passe. Fort bien, mais le problème majeur de l’école est de passer à l’acte, au jour le jour, dans le choix des activités et la pondération des exigences. Le système d’évaluation classique est un frein important à cette évolution, parce qu’il force les enseignants à préférer les compétences isolables et chiffrables aux compétences de haut niveau - raisonnement, communication -, difficiles à enfermer dans une épreuve papier-crayon et des tâches individuelles (Perrenoud, 1988).


VII. Une évaluation arbitraire,
peu favorable au travail en équipe pédagogique

Rien n’est plus standard, semble-t-il, que les procédures d’évaluation traditionnelles : même nombre de notes, d’épreuves, de moyennes, mêmes échéances, même carnet scolaire ; la normalisation devrait permettre à n’importe quels enseignants de travailler ensemble, puisque tout est décidé en dehors d’eux.

En réalité, les procédures d’évaluation formelle sont un cadre contraignant, mais relativement vide, qui laisse une large part d’interprétation aux enseignants. Le système ne fixe ni le niveau d’exigence, ni la nature des questions, des items, des problèmes, ni le degré de correspondance entre l’enseignement dispensé et le contenu de l’évaluation, ni les modalités exactes de passation et de correction, ni la construction des barèmes, ni les modalités de dérogation ou de négociation de cas en cas. Autant dire que l’enseignant, s’il respecte les formes, a une latitude immense, qui permet, dans le même cadre des évaluations indulgentes ou sévères, bon enfant ou policières, flexibles ou obsessionnelles, inventives ou stéréotypées. Or les choix des enseignants relèvent pour une large part de leurs croyances personnelles, de leurs conceptions de l’évaluation, de leur position par rapport à la sélection et à l’échec scolaire, de ce qu’ils estiment être une évaluation juste ou efficace.

Lorsqu’on veut former une équipe pédagogique, même sans toucher au système d’évaluation formelle, on ne peut pas laisser chacun continuer à évaluer comme il l’a toujours fait, selon ses préférences ou ses exigences strictement personnelles. La cohérence de l’équipe pédagogique se juge aussi à sa façon d’évaluer, surtout si les maîtres ont des élèves en commun et doivent pratiquer des évaluations concertées. Et c’est un écueil majeur : il faut soudain mettre sur la table, expliquer, justifier des pratiques dont l’arbitraire éclate à ce moment, alors qu’il était ignoré ou minimisé auparavant. Mettez trois enseignants qui s’entendent bien en situation de rédiger une épreuve commune à leurs trois classes, de la corriger selon des critères homogènes et de fixer ensemble un barème. Vous verrez immédiatement surgir des désaccords, d’autant plus difficiles à dépasser que chacun juge très intuitivement, par exemple, du niveau auquel il faut faire correspondre l’excellence ou l’exigence minimale. Dans la même école, des professeurs croient dur comme fer qu’il ne faut jamais mettre la note maximale, parce qu’aucun élève n’atteint jamais l’excellence absolue, alors que d’autres mettent systématiquement la meilleure note à l’élève qui a les meilleurs résultats, quel que soit son niveau absolu. À l’inverse, d’autres, pour les mêmes raisons ou par souci de ne pas accabler les élèves faibles, ne recourent jamais aux notes ou aux appréciations les plus défavorables, alors que d’autres n’hésitent pas à les utiliser. Même divergence sur la question de savoir si une épreuve globalement mal réussie met en cause l’enseignement ou les élèves, s’il faut l’annuler et la refaire. Quant à la façon de corriger, d’attribuer ou d’enlever des points, elle peut varier à l’infini : deux erreurs d’orthographe dans un seul mot, c’est une seule erreur pour les uns, deux pour les autres. Une erreur de syntaxe dans un travail d’histoire ou de géographie, c’est sans rapport avec le sujet pour les uns, une pénalisation indispensable pour les autres. C’est le paradoxe du système d’évaluation, qui est à la fois très contraignant et qui laisse, sur des points de détail, les fantaisies voire les folies personnelles se donner libre cours. Or la fantaisie, a fortiori la folie, sont toujours très difficiles à négocier dans un groupe. Même lorsqu’une équipe pédagogique se met d’accord sur ses objectifs principaux, elle risque de buter sur ces détails, parce que, d’une certaine façon, les maîtres sont plus attachés à leur façon de corriger ou de noter qu’ils ne le disent, et qu’ils se différencient davantage sur ces points que sur de grandes options.


Changer l’évaluation pour changer la pédagogie ?

Tous ces freins ne fonctionnent pas nécessairement ensemble et de la façon la plus brutale. C’est bien pourquoi il reste possible, dans l’enseignement ordinaire, de favoriser des expériences et des innovations pédagogiques. L’évaluation n’empêche pas les transformations de curricula, même si elle limite leur mise en œuvre effective, en particulier dans le cas de la mathématique ensembliste et des approches communicatives de la langue. On peut aussi adopter de nouveaux moyens d’enseignement, de nouvelles méthodes d’apprentissage, de nouvelles technologies audiovisuelles ou informatiques. Mais ces changements ont un point commun : on modernise la pratique pédagogique sans toucher à ses fondements.

En schématisant, on pourrait dire que l’évaluation n’empêche pas d’innover à condition :

On peut donc, et c’est très fallacieux, avoir l’impression que le système d’évaluation n’empêche pas le changement. Si l’on s’intéresse au changement fondamental des pratiques, le seul qui soit à la mesure de l’échec scolaire et des ambitions de l’école, la réalité est moins rose.

Que faire ? Peut-être se dire une fois pour toutes qu’aucune innovation pédagogique majeure ne peut ignorer le système d’évaluation ou espérer le contourner. Et en conclure par conséquent qu’il faut, dans tout projet de réforme, dans toute stratégie d’innovation, dans toute formation continue, faire la part du système et des pratiques d’évaluation, les intégrer à la réflexion et les modifier pour permettre le changement.

De façon générale, on peut soutenir qu’une évaluation fondée sur des objectifs, des critères de maîtrise sera favorable aussi bien à la pédagogie du projet et des situations ouvertes qu’à la différenciation de l’enseignement. Et qu’une évaluation plus formative, donnant moins d’importance au classement et davantage à la régulation des apprentissages, s’intégrera mieux aux didactiques novatrices et à une pédagogie de maîtrise.

C’est pourquoi la rénovation des pratiques d’évaluation et la marche vers une évaluation formative (Allal, Cardinet & Perrenoud, 1979 ; Allal, 1988 ; Cardinet, 1986 a & b, Perrenoud, 1991), ne sauraient être des réformes parmi d’autres. Sans en faire l’alpha et l’oméga du système pédagogique, l’évaluation traditionnelle est un verrou important qui bloque toutes sortes d’autres changements. Le faire sauter, c’est donc ouvrir la porte à d’autres changements.

Peut-être est-ce bien, en fin de compte, ce qui fait peur et ce qui assure la pérennité d’un système d’évaluation qui ne change guère, alors que depuis des décennies on a dénoncé ses failles au plan docimologique et ses effets dévastateurs sur l’image de soi, le stress, la tranquillité des familles et les rapports entre élèves.


Références

Allal, L. (1988 b) Vers un élargissement de la pédagogie de maîtrise : processus de régulation interactive, rétroactive et proactive, in Huberman, M. (dir.), Assurer la réussite des apprentissages scolaires. Les propositions de la pédagogie de maîtrise, Paris, Delachaux & Niestlé, pp. 86-126.

Allal, L., Cardinet J. & Perrenoud, Ph. (dir.) (1979, 6e éd. 1991) L’évaluation formative dans un enseignement différencié, Berne, Lang.

Berthelot, J.M. (1983) Le piège scolaire.

Cardinet, J. (1986 a) Pour apprécier le travail des élèves, Bruxelles, De Boeck.

Cardinet, J. (1986 b) Evaluation scolaire et pratique, Bruxelles, De Boeck.

Chevallard, Y. (1985) La transposition didactique. Du savoir savant au savoir enseigné, Grenoble, La Pensée Sauvage Éditions.

Chevallard, Y. (1986) Vers une analyse didactique des faits d’évaluation, in De Ketele, J.-M. (dir.), L’évaluation : approche descriptive ou prescriptive ?, Bruxelles, De Boeck, pp. 31-59.

Favre, B., Perrenoud, Ph. & Dokic, M. (1986) Enseigner le français dans les grands degrés. Genève, Service de la recherche sociologique, Cahier n° 21.

Perrenoud, Ph. (1984) La fabrication de l’excellence scolaire : du curriculum aux pratiques d’évaluation, Genève, Droz.

Perrenoud, Ph. (1986 a) Scolarisation et sens des savoirs, Revue suisse de sociologie, pp. 11-29.

Perrenoud, Ph. (1986 b) De quoi la réussite scolaire est-elle faite ?, Education & Recherche, 1986, n° 1, pp. 133-160.

Perrenoud, Ph. (1987) Anatomie de l’excellence scolaire, Autrement, pp. 95-100.

Perrenoud, Ph. (1988) Nouvelles didactiques et stratégies des élèves face au travail scolaire, in Perrenoud, Ph. et Montandon, C. (dir.) Qui maîtrise l’école ? Politiques d’institutions et pratiques des acteurs, Lausanne, Réalités sociales, pp. 175-195 (repris dans Perrenoud, Ph., Métier d’élève et sens du travail scolaire, Paris, ESF, 1994, 3e éd. 1996, chapitre 5, pp. 99-114).

Perrenoud, Ph. (1991 a) Pour une approche pragmatique de l’évaluation formative, Mesure et évaluation en éducation, vol. 13, n° 4, pp. 49-81 (repris dans Perrenoud, Ph., L’évaluation des élèves. De la fabrication de l’excellence à la régulation des apprentissages, Bruxelles, De Boeck, 1998, chapitre 7, pp. 119-145).

Perrenoud, Ph. (1991 b) Ambiguïtés et paradoxes de la communication en classe. Toute interaction ne contribue pas à la régulation des apprentissages, in Weiss, J. (dir.) L’évaluation : problème de communication, Cousset, DelVal-IRDP, pp. 9-33 (repris dans Perrenoud, Ph., L’évaluation des élèves. De la fabrication de l’excellence à la régulation des apprentissages, Bruxelles, De Boeck, 1998, chapitre 8, pp. 147-167).

Perrenoud, Ph. (1992) Différenciation de l’enseignement : résistances, deuils et paradoxes, Cahiers pédagogiques, n° 306, pp. 49-55 (repris dans Perrenoud, Ph., La pédagogie à l’école des différences, Paris, ESF, 1995, 2e éd. 1996, chapitre 4, pp. 119-128).

Perrenoud, Ph. (1993) Organiser l’individualisation des parcours de formation : peurs à dépasser et maîtrises à construire, in Bautier, É., Berbaum, J. et Meirieu, Ph. (dir.) Individualiser les parcours de formation, Lyon, Association des enseignants-chercheurs en sciences de l’éducation (AESCÉ), pp. 145-182 (repris dans Perrenoud, Ph., La pédagogie à l’école des différences, Paris, ESF, 1995, 2e éd. 1996, chapitre 5, pp. 129-155).

Weiss, J. (1992) Vers une évaluation interactive à l’école, Neuchâtel, IRDP.

Weiss, J. & Wirthner, M. (1991) Enseignement renouvelé du français, premiers regards sur une rénovation, Cousset, DelVal-IRDP.

Sommaire


Source originale :

http://www.unige.ch/fapse/SSE/teachers/perrenoud/php_main/php_1992/1992_04.html

Téléchargement d'une version Word au format RTF :

http://www.unige.ch/fapse/SSE/teachers/perrenoud/php_main/php_1992/1992_04.rtf

© Philippe Perrenoud, Université de Genève.

Aucune reprise de ce document sur un site WEB ou dans une publication imprimée ne peut se faire sans l’accord écrit de l'auteur et d’un éventuel éditeur. Toute reprise doit mentionner la source originale et conserver l’intégralité du texte, notamment les références bibliographiques.

Début 

Autres textes :

http://www.unige.ch/fapse/SSE/teachers/perrenoud/php_main/textes.html

Page d'accueil de Philippe Perrenoud :

http://www.unige.ch/fapse/SSE/teachers/perrenoud/

Laboratoire de recherche Innovation-Formation-Éducation - LIFE :

http://www.unige.ch/fapse/SSE/groups/life