vendredi 1 novembre 2024

Évaluer : Pourquoi ? Comment ?


Dans les enquêtes menées sur les conditions de travail des enseignants, l’évaluation représente entre un quart et un tiers du temps de travail. 

C’est donc une activité importante à plus d’un titre. D’abord par la place dans l’emploi du temps  mais surtout parce que cette pratique est essentielle dans l’activité d’enseignement. Dans les mêmes enquêtes lorsqu’on demande aux enseignants de donner trois réponses à la question “pourquoi évaluez vous ? ”, les trois qui arrivent en tête sont :

  • mesurer les acquis des élèves (95% des réponses parmi trois réponses possibles)
  • s’assurer que les objectifs ont été atteints (90,7%)
  • fournir une note (41,4%)

[source : « Les pratiques d’évaluation des enseignants au collège » rapport  2004]

L’évaluation a donc plusieurs dimensions. Elle répond à une demande institutionnelle puisque le système éducatif demande de fournir une évaluation et le plus souvent sous forme de notes. Mais elle est aussi un élément clé de l’apprentissage avec une double fonction : servir de repère pour celui qui apprend et de feed back pour celui qui enseigne. 

Définir l’évaluation

Si on s’en tient à la définition d’un dictionnaire (le Petit Larousse) l’évaluation est la « Mesure à l'aide de critères déterminés des acquis d'un élève, de la valeur d'un enseignement, etc.». Mais cette approche est limitée et ne rend pas compte de toutes les dimensions de cette pratique. 

On lui préfèrera la définition du pédagogue belge, Jean-Marie De Ketele. Pour lui, “Évaluer” signifie...

recueillir un ensemble d’informations suffisamment pertinentes, valides et fiables

et examiner le degré d’adéquation entre cet ensemble d’informations et un ensemble de critères adéquats aux objectifs fixés au départ ou ajustés en cours de route,

en vue de prendre une décision.

Jean-Marie de Ketele (“Évaluer pour former” collectif, De Boeck, 2008)

À partir de cette définition, on peut repérer plusieurs caractéristiques de l’évaluation. Il s’agit d’abord de recueillir des informations “suffisamment pertinentes, valides et fiables” et c’est tout le talent de l’enseignant que de savoir poser les bonnes questions qui soient comprises par les élèves (voir le chapitre sur les consignes de travail) et qui permettent de bien repérer ce qui  est acquis ou non acquis dans un protocole fiable (sans triche ni biais). Pour évaluer, il est également nécessaire de formuler des critères en fonction d’objectifs clairement définis. La définition ne le dit pas mais il est évidemment préférable que ces critères et objectifs soient annoncés aux élèves de la manière la plus explicite. L’évaluation ne peut pas être une surprise et encore moins un piège.. L'évaluation comporte aussi une dimension importante de jugement (référence à une norme et à des critères) Mais on notera aussi qu’évaluer est un processus et n’est pas une procédure figée, il y a adaptation en fonction des élèves, des circonstances etc. Enfin, évaluer sert à “prendre une décision”, celle ci peut être interne à la classe ou externe. La plus simple peut être simplement de passer à la séquence suivante. Mais ce peut être aussi de revenir sur tel ou tel point qui ne semble pas acquis ou alors de proposer une remédiation pour des difficultés propres à tel ou tel élève et repérées grâce à l’évaluation. Les décisions peuvent être aussi externes. On sait bien que l’évaluation va alimenter les décisions des conseils de classe ou encore servir à l’obtention d’un examen (dans ce dernier cas, on dit alors qu’elle est "certificative") 

Avant d'aller plus loin, il est nécessaire de rappeler que mesurer les progrès, repérer les difficultés d’apprentissage, l’acquisition de compétences,… peut se traduire autrement que par une note (chiffrée). Evaluation et notation ne sont pas synonymes.  La note sur dix à l’école et sur vingt au lycée, qui nous est si familière, est en fait une spécialité bien française et beaucoup d’autres pays fonctionnent avec d’autres modalités d’évaluation. 

Illustration tirée de Gérard de Vecchi 
"banque de situation problèmes", Hachette Education


Différents types d’évaluation

On peut ensuite distinguer plusieurs types d’évaluation. La principale typologie est très connue. On la doit à Benjamin Bloom (1971) un spécialiste des sciences de l’éducation américain. Il propose de distinguer trois formes d’évaluation : 

  • diagnostique
  • formative 
  • sommative

Il s’agit en fait d’une typologie chronologique qui formalise les différents temps de l’évaluation au cours d’une séquence d’apprentissage. 

L’évaluation diagnostique (ou pronostique) est envisagée en début d'apprentissage ou de formation et intervient lorsqu'on se pose la question de savoir si un sujet possède les capacités nécessaires pour entreprendre une formation ou pour suivre un apprentissage. Elle permet donc, en principe, le repérage des difficultés et de la maîtrise des pré-requis. On peut l'utiliser aussi pour repérer les représentations et prénotions des élèves. 

L'évaluation formative intervient dans le cours d'un apprentissage et permet de situer la progression de l'élève par rapport à un objectif donné. Elle constitue ainsi une double rétroaction et une régulation des apprentissages en train de se faire. 

  • sur l'élève pour lui indiquer les étapes qu'il a franchies et les difficultés qu'il rencontre
  • sur le maître pour lui indiquer comment se déroule son programme pédagogique et quels sont les obstacles auxquels il se heurte.

Très concrètement, l’évaluation formative peut prendre la forme très simple des questions posées aux élèves au cours d’une séance mais aussi celle de petites questions (QCM, textes à trous, questions ouvertes, ...) posées à l’issue d’une séance de cours sous forme écrite ou orale.  Elle est aussi l’occasion d’une auto-évaluation et un bon moyen de montrer aux élèves qu’ils ont appris quelque chose et de les en convaincre !

L’évaluation sommative  intervient lors des bilans, au terme d'un processus d'apprentissage ou de formation. Elle peut donner lieu aussi à une attestation sociale des acquis (évaluation certificative). Concrètement sa forme la plus simple est celle du “contrôle”  ou de l'interrogation (ou "DST", appelez ça comme vous voulez…) en fin de séquence. Mais il importe de prévoir celui-ci dès le début de la séquence. 

C’est cette dernière forme d’évaluation qui est la plus fréquente dans le système éducatif français. Et c’est aussi celle qui est la plus propice à la notation chiffrée. Mais on ne peut se limiter à cette seule dimension. Car on risque alors de tomber dans une sorte de fatalité où le contrôle devient une fin en soi pour l’enseignant sommé de “fournir une note”. 

Mais comme toutes les typologies, celle ci ne peut rendre compte de toutes les pratiques réelles. Prenons un exemple très concret : si on constate que l’ensemble de la classe (ou presque) a raté un exercice du contrôle clôturant un chapitre, que fait-on ? On maintient son barème et on passe à autre chose ou on ajuste son évaluation et on réagit en revoyant cette partie du cours qui n’a pas été comprise ou en s’interrogeant sur la formulation de la consigne ? En tout état de cause, on voit bien que la frontière entre évaluation sommative et formative est quelquefois difficile à tracer. Tout comme celle avec l’évaluation diagnostique dans la mesure où, à chaque moment, les diverses évaluation permettent d’orienter l’action et de prendre la mesure de la maîtrise des pré-requis. 


Une autre typologie semble féconde pour analyser les débats actuels autour de l’évaluation. Elle s’appuie sur les finalités de cette pratique. Plusieurs auteurs proposent de distinguer l’évaluation normative de l’évaluation critériée. 

Une évaluation est dite normative quand elle mesure la performance d'un apprenant aux performances des autres.  Poussée à l’extrême cette forme d’évaluation se traduit par un classement mais la note permet de toutes façons, cette comparaison. Cette modalité peut conduire aussi à l’émulation voire à la compétition. 

Une évaluation est dite critériée quand on ne compare pas l'apprenant aux autres mais qu'on détermine par la référence à des critères de réussite, et si, ayant atteint les objectifs, il est en mesure de passer aux apprentissages ultérieurs. C’est donc une évaluation qui est d’abord propre à chaque individu et qui se définit par rapport à des objectifs individuels ou collectifs. Elle n’a pas besoin de notes pour s’exprimer puisque une mesure en terme “acquis/non acquis” est suffisante. 

Cette distinction permet de mieux comprendre les évolutions actuelles et notamment le débat autour du travail et de l’évaluation par compétences. Cette dernière démarche repose en effet sur la définition de critère de réussite (ou de “performance”) pour chaque activité et s’accommode mal d’une “moyenne” gommant les réussites et surtout les difficultés dans une logique de compensation. 

Au final, les pratiques d’évaluation en France oscillent entre deux pôles. Il y a celui de la sélection et du classement qui est symbolisé par l’usage de la note. Et il y a la logique de la régulation des apprentissages ou l’évaluation permet de se situer par rapport à des objectifs d’apprentissage. Cette deuxième logique ne passe pas forcément par une note chiffrée. 


Quelques principes pour bien évaluer


Définir clairement les objectifs d’apprentissage d’une séquence et les annoncer aux élèves. 

Qu’est ce que je veux que les élèves sachent faire à l’issue de la séquence de travail ?”. Il n’est pas aussi simple que cela de répondre à cette question. On serait tenté de manière spontanée de dire qu’il suffit de lire les programmes officiels pour définir les objectifs. Mais qu’attend t-on précisément des élèves ? Qu’ils connaissent des définitions Par cœur ? Est-ce une garantie qu’ils en ont compris le sens ? On sait bien que cela n’est pas suffisant. Il est donc nécessaire de former les élèves à des compétences et ne rien considérer comme implicite. Et, bien sûr, prévoir l’évaluation de tous ces éléments. 

Ces objectifs ou ces critères de réussite (“j’aurais réussi si je suis capable de...”) sont formulés avec des verbes d’action et de manière assez précise pour que l’élève comprenne ce qui est attendu de lui. Ils sont annoncés aux élèves (oralement ou par écrit) au début de chaque séquence mais aussi reprécisés au début de chaque heure de cours (séance). Ils servent aussi de base aux différentes modalités d’évaluation, d’abord formative tout au long de la séance puis aussi pour l’évaluation sommative. 

• Préparer l’évaluation (sommative) dès le début de la construction de la séance 

S’il semble assez évident de définir les objectifs d’une séquence lorsqu’on la construit, préparer dans le même mouvement l’interrogation finale l’est un peu moins. Pourtant, c’est un réflexe utile. On peut ainsi mieux cibler son enseignement et faire en sorte que l’évaluation sommative ne soit pas décalée par rapport à ce qui a été vu en classe.  On peut même considérer qu’il y a un gain d’efficacité à procéder ainsi. En même temps qu’on définit les objectifs et les critères de réussite, on élabore l’évaluation finale en s’appuyant sur ce que l’on vient de définir. 

• Construire une évaluation sommative repose sur quelques principes. 

D’abord la diversité des exercices. Si on part du principe que tous les élèves n’ont pas le même profil d’apprentissage, il est alors utile de proposer des exercices qui s’appuient sur différents supports et types d’activités. On ne peut inférer la maîtrise d’une compétence que si on l’évalue par différents moyens. 

Autre principe, l’unité de l’évaluation. On ne peut tout évaluer pour chaque exercice. Il est utile de se concentrer sur un savoir-faire ou un critère spécifique pour chacun et ne pas se disperser. On peut donner un exemple très concret avec l’orthographe. On a souvent tendance à vouloir pénaliser l’orthographe pour chaque “faute” repérée et cela fait quelquefois écran à ce qui est le cœur de l’évaluation de l’exercice en question. L’orthographe c’est important mais on ne peut réduire l’évaluation à cela ! Songez aussi que certains élèves peuvent avoir des problèmes spécifiques (dysorthographie par ex.) qui ne doivent pas masquer leurs réussites dans d’autres domaines. On peut bien raisonner avec une mauvaise orthographe. 

Un contrôle ne doit pas être un piège tendu à l’élève. Les derniers rapports sur les pratiques d’évaluation des enseignants montrent que la pratique de l’“interrogation surprise” est en très forte régression. Mais plus encore que cet aspect, c’est la nécessité de ne pas prendre les élèves par surprise dans les contenus et les modalités de l’évaluation qui est essentielle. Les critères d’évaluation devraient être annoncés à l’avance. Les formes d’exercice présentes dans le contrôle peuvent aussi avoir été déjà proposées dans le cadre du cours. C’est en particulier ce qu’André Antibi suggèrait en proposant une « évaluation par contrat de confiance ». D’une manière plus générale, la confection d’une évaluation sommative repose sur un équilibre entre la vérification d’un certain nombre de savoirs et de savoirs faire vus en cours et de situations inédites permettant de mobiliser des ressources acquises durant la séquence de cours. 


Evaluer n’est pas noter

 Le sociologue de l’éducation, spécialiste de l’évaluation, Pierre Merle s’était fait historien pour s’intéresser à l’invention de la note dans le système français. Les premiers à avoir « inventé » la note chiffrée sont les Chinois pour les concours des hauts fonctionnaires qu’étaient les mandarins. Les écoles jésuites s’en inspirent ensuite. Puis, vient bien plus tard, la généralisation en France. C’est par un arrêté du 5 juin 1890 qu’il est établi que « dans les compositions, chaque copie aura sa note chiffrée de 0 à 20 ». Alors que jusque-là, le baccalauréat créé en 1808, fonctionnait avec un examen oral et un système acquis / non acquis (symbolisé par des boules blanches et noires), la généralisation de la note chiffrée se fait sous la pression des responsables des grandes écoles et des concours administratifs. Car la note a un « avantage » : elle permet de classer et de sélectionner. 

Cette logique imprime tout notre système éducatif bien plus que dans d’autres pays. Le système éducatif qui se met en place a été durablement construit pour sélectionner et pour créer de l'émulation et notre modalité d’évaluation dominante en résulte. Il y a donc une culture de la note et plus encore l’idée que l’évaluation est associée à la sélection. On peut d’ailleurs expliquer ainsi les polémiques récurrentes sur le fait que le baccalauréat soit « donné » et que le « niveau baisse ».

Nous sommes shootés à la note. Et, avec cette obsession, on en oublie trop souvent que l’évaluation est aussi un outil de régulation des apprentissages et de validation des acquis. Comme nous le rappellent les neurosciences après tous les grands pédagogues, l’élève pour progresser a besoin d’un retour d’information le plus rapide possible sur les éventuelles erreurs (ne parlons pas de « fautes »). La note est un bien piètre outil pour cela... 


Qu’est-ce qu’une note juste ? 



« Oui, mais la note a l’avantage d’être objective ! » rappelleront avec force ses partisans. Y a-t-il un 12 étalon déposé au Pavillon de Sèvres ? Non, bien évidemment. La docimologie, c’est-à-dire l’étude des biais de l’évaluation bat en brèche cette idée toute faite. 

Il est bien dommage que la docimologie soit si peu étudiée dans la formation initiale et continue des enseignants. Il ne s’agit pas ici de faire un cours sur ce sujet ( !) mais de rappeler quelques éléments. Dès les premières enquêtes réalisées, les résultats montrèrent une forte dispersion des notes attribuées à chaque copie par les correcteurs. Le travail fait en commission d’entente du bac sur des copies tests le rappelle à chaque fois. Les mathématiques et la physique, réputées des sciences exactes, ne sont pas non plus épargnées par ces écarts. 

L’expérience la plus frappante est celle dite de la « note vraie ». On considère qu’elle mérite ce qualificatif quand la correction par une personne supplémentaire ne change plus la moyenne obtenue. Dans la première étude, réalisée dans les années 30, il aurait fallu 128 correcteurs en philosophie, 78 en Français, 16 en physique, 13 en mathématiques, etc. Un autre chercheur Jean-Jacques Bonniol en 1976 a repris l’expérience et montré qu’il faudrait 78 correcteurs en mathématiques et 762 en philosophie pour neutraliser les erreurs de calcul en augmentant le nombre de correcteurs pour améliorer l’objectivité de la notation.

Il y a de très nombreux biais qui agissent sur ces variations : effet de halo, effet de stéréotypie, ordre de correction, etc. La loi de Posthumus ou  « Constante macabre  » est la plus connue. L’enseignant tend à ajuster sa distribution de notes en une courbe en cloche (distribution gaussienne pour les amateurs) : les bons, les moyens et les faibles . 

L’évaluation est donc une pratique sociale et soumise à des normes (culture d'établissement, de la discipline, de la génération...) et sous-tendue par des valeurs.  L’évaluation renvoie donc chacun à sa propre conception de la justice et à ses représentations du travail, du niveau, des apprentissages, du pouvoir… C’est aussi ce qui la rend si difficile à faire évoluer car elle s’appuie sur notre propre échelle de valeurs...

Comme le rappelait un des grands spécialistes de cette discipline, Henri Piéron, en 1963 : « Pour prédire la note d’un candidat à un examen, il vaut mieux connaître son examinateur que le candidat lui-même. » La connaissance de la docimologie devrait donc inciter à la modestie face à la relativité des notes. On devrait admettre qu’on n’est pas seul à détenir la vérité. On devrait aussi être formé à connaitre tous ces biais mis en évidence par la docimologie, pour pouvoir les tenir à distance. 


En conclusio

On le voit, la notation sous des apparences rassurantes de rigueur est soumise à de nombreux biais. Et, pourtant, y a toujours l’idée que des notes élevées sont suspectes et sont le signe du laxisme, alors que bien sûr pour la majorité de l’opinion, « le niveau baisse » ! 

Evalue-t-on pour trier ou pour favoriser les apprentissages ? D’autres pays, tiennent les notes à distance et les réservent à la sélection universitaire et utilisent d’autres modes d’évaluation. Cela commence à évoluer en France surtout dans le primaire et plus modestement dans le secondaire. 

Car ces débats récurrents sur la note et le niveau sont bien le signe d’un problème culturel et même politique. Dans une société où la fiction de la méritocratie continue à servir d’idéologie scolaire, il est difficile de remettre en question cette modalité d’évaluation. D’autant plus que les « élites » et les enseignants eux-mêmes, sont le produit des notes et des concours !


Une école sans fausses notes, ce serait une école qui serait capable de bien dissocier les deux fonctions de l’évaluation : être un outil pour aider à apprendre et valider les apprentissages et sélectionner quand il le faut. On peut rêver ? 


Philippe Watrelot
---

Lectures utiles

Pierre Merle Les Notes, secret de fabrication PUF 2007 

André Antibi La constante macabre Editions Math'adore 2003

Florence Castincaud et Jean-Michel Zakhartchouk L’évaluation, plus juste et plus efficace : comment faire ? collection Repères pour agir, CANOPE CRDP d’Amiens - CRAP-Cahiers pédagogiques 2014

François Marie Gérard Évaluer des compétences, Guide pratique De Boeck 2008

Évaluer pour (mieux) faire apprendre Dossier de veille de l'IFÉ n° 94, septembre 2014   


------
Ce billet de blog constitue un complément de la vidéo portant le même titre sur la chaine YouTube TeachSchnock
















Aucun commentaire:

Enregistrer un commentaire