E. Meyer, Strasbourg le 28/11/98
Les documents d'accompagnement du programme de troisième invitent à faire observer que "la moyenne d'une population dont les éléments sont rangés par ordre croissant ne sépare pas ceux-ci, en général, en deux parties de même effectif". Cette observation justifie l'introduction de la médiane et l'idée essentielle que cet indicateur de position est censé traduire.
Le programme officiel est ainsi rédigé :
| contenus | compétences exigibles | commentaires |
| Caractéristiques de position d'une série statistique | Une série statistique étant donnée (sous forme de liste ou de tableau, ou par une représentation graphique), proposer une valeur médiane de cette série et en donner la signification. | On repère, en utilisant effectifs ou fréquences cumulés, à partir de quelle valeur du caractère on peut être assuré que la moitié de l'effectif est englobée. Les exemples ne devront soulever aucune difficulté au sujet de la détermination de la valeur de la médiane. |
Des exemples simples permettent de bien mettre en évidence le phénomène signalé par les documents d'accompagnement et l'intérêt de la notion de médiane. La stratégie pédagogique à mettre en uvre en découle tout naturellement (et ce ne sera donc pas l'objet de cet article).
Les réflexions et remarques qui suivent ont pour objet :
Quelle définition pour la médiane ?
La littérature mathématique nous en propose de nombreuses, variées, plus ou moins complexes (distinguant effectif total pair, impair ; proposant des interpolations ). Nous allons ici nous concentrer essentiellement sur la définition suggérée par les commentaires officiels.
Variation autour d'un premier exemple :
| valeurs |
6 |
8 |
9 |
10 |
11 |
12 |
14 |
15 |
17 |
18 |
| effectifs |
1 |
1 |
2 |
1 |
4 |
1 |
4 |
1 |
3 |
2 |
| effectifs cumulés |
1 |
2 |
4 |
5 |
9 |
10 |
14 |
15 |
18 |
20 |
Pour les besoins de la suite, mettons en place quelques notations :
Effectif total de la population étudiée : N.
Valeurs du caractère (éléments de R), en ordre strictement croissant : x1, x2, xn.
Fonction "effectif" : E(xi) = nombre d'individus dont le caractère est égal à xi.
Fonction "effectif cumulé croissant" : ECC(x) = nombre d'individus dont le caractère xi est inférieur ou égal à x (en cohérence avec la définition normalisée de la fonction de répartition). (On utilisera également : ECD (x) = nombre d'individus dont le caractère xi est supérieur ou égal à x.)
L'élève A propose : la médiane est 12. Voici son explication :
10 individus (soit la moitié de la population) ont un caractère inférieur ou égal à 12.
En prenant la valeur précédente (11), il n'y a que 9 individus, ce qui est insuffisant. En prenant la valeur suivante (14), il y a plus de la moitié de la population englobée ; mais ce n'est pas la peine d'aller si loin.
Le professeur : pas d'objection.
Sa définition implicite est la suivante :
La médiane est la plus petite valeur m du caractère telle que ECC(m) ³ N/2.
L'élève B propose : la médiane est 14. Voici son explication :
En prenant comme valeur 14, il y a 10 individus dont la valeur du caractère est supérieure ou égale à 14 ; en prenant 15 comme valeur, il n'y en plus que 6 ce qui ne constitue plus la moitié. C'est donc à partir de la valeur 14 qu'on est assuré que la moitié de la population est englobée.
Le professeur (après hésitation et relecture des commentaires ) : pas d'objection.
Sa définition implicite est la suivante :
La médiane est la plus grande valeur m du caractère telle que ECD(m) ³ N/2.
L'élève B' : je suis d'accord avec l'élève B pour dire que la médiane est 14, mais je préfère l'explication de l'élève A. Seulement, pour être réellement assuré que la moitié est englobée, il vaut mieux prendre 14 ; avec 12, c'est tout juste
Sa définition implicite est peut-être la suivante :
La médiane est la plus petite valeur m du caractère telle que ECC(m) > N/2.
A moins que ce soit bien :
La médiane est la plus petite valeur m du caractère telle que ECC(m) ³ N/2, mais avec une autre définition de la fonction ECC (ECC(x) = nombre d'individus dont le caractère xi est strictement inférieur à x).
L'élève C propose : la médiane est 13. Voici son explication :
Il y a exactement 10 individus dont le caractère a une valeur inférieure ou égale à 13 et exactement 10 individus dont le caractère a une valeur supérieure ou égale à 13. Cette valeur 13 partage la population en deux parties égales.
Le professeur (dans sa tête) : c'est exactement ce que je pensais que la médiane devait traduire !
Le professeur (à voie haute) : tu ne respectes pas la consigne qui précise que la médiane est une valeur du caractère.
L'élève : mais si Monsieur, voici mon tableau tel que je l'ai fait après que vous nous avez donné la série statistique initiale. La valeur 13 y figure bien.
| valeurs |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
| effectifs |
1 |
0 |
1 |
2 |
1 |
4 |
1 |
0 |
4 |
1 |
0 |
3 |
2 |
| effectifs cumulés |
1 |
1 |
2 |
4 |
5 |
9 |
10 |
10 |
14 |
15 |
15 |
18 |
20 |
Le professeur (qui aurait mieux fait de réfléchir avant) : oui, mais alors la valeur 12,5 convient également ! Et puis, imagine qu'il y a un vingt-et-unième individu dont le caractère est 13. S'adressant à la classe entière (ce qui prouve ses qualités pédagogiques), il propose comme nouvelle situation :
Variation autour d'un deuxième exemple :
| valeurs |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
| effectifs |
1 |
0 |
1 |
2 |
1 |
4 |
1 |
1 |
4 |
1 |
0 |
3 |
2 |
| effectifs cumulés |
1 |
1 |
2 |
4 |
5 |
9 |
10 |
11 |
15 |
16 |
16 |
19 |
21 |
L'élève A propose : la médiane est 13. Logique
L'élève B propose : la médiane est 13. Logique
L'élève B' propose : la médiane est 13.
L'élève C est embêté : il n'y a plus aucune valeur qui partage la population en deux parties égales . Il propose quand même 13 comme médiane, car dit-il, il y autant de monde de chaque coté (10 individus ont strictement moins de 13 et 10 ont strictement plus de 13).
Le professeur est sur le point de proposer comme définition : "la médiane est la valeur m du caractère pour laquelle ECC(m) = ECD(m)", mais il se ravise suffisamment tôt, en testant son idée sur le premier tableau proposé.
Dans quelles circonstances la médiane présente-t-elle un intérêt ?
Nous n'avons toujours pas proposé de définition pour la médiane, mais plusieurs énoncés sont des candidats potentiels.
Examinons quelques-uns des candidats sur un troisième exemple :
| valeurs |
6 |
8 |
14 |
20 |
| effectifs |
8 |
2 |
7 |
3 |
| effectifs cumulés croissants |
8 |
10 |
17 |
20 |
| effectifs cumulés décroissants |
20 |
12 |
10 |
3 |
La plus petite valeur m du caractère telle que ECC(m) ³ N/2 : 8
La plus grande valeur m du caractère telle que ECD(m) ³ N/2 : 14
La plus petite valeur m du caractère telle que ECC(m) > N/2 : 14
Une valeur réelle m pour laquelle ECC(m) = ECD(m) : toute valeur entre 8 et 14. (avec d'autres exemples : aucune solution).
C'est une situation dans laquelle la notion de médiane n'a que peu d'intérêt. Le nombre de données est trop faible et le calcul de "la" médiane trop sensible à la définition choisie ainsi qu'à de légères variations des données initiales. Un bon critère pour savoir si la notion de médiane est pertinente, est précisément de s'assurer que le résultat du calcul ne dépend que faiblement :
Quelle stratégie pour l'énoncé de questions relatives à cette notion ?
L'idée fondamentale qui guide la proposition de stratégie à adopter pour poser des questions relatives à la notion de médiane est la suivante :
Ne pas poser brutalement la question "quelle est la médiane ?", mais demander le calcul d'une valeur répondant à une propriété explicitement formulée dans le contexte de l'exercice.
Illustrons ceci à l'aide d'exemples tirés de la brochure de l'académie de Strasbourg.
Premier exemple :
Enoncé initial :
Voici la répartition des habitations d'une petite ville selon le nombre de pièces :
| Nombre de pièces |
|
|
|
|
|
|
|
|
|
|
| Nombre d'habitations |
|
|
|
|
|
|
|
|
|
|
1°) Calculer à 0,1 près le nombre moyen de pièces par habitation.
2°) Déterminer une valeur médiane de cette distribution statistique.
3°) La municipalité décide d'attribuer une prime aux habitants des 50% d'habitations ayant le moins de pièces. Quelles sont les habitations donnant droit à la prime ?
Réponses (attendues ?) :
1°) nombre moyen de pièces (à 0,1 près) : 4,3
2°)
| Nb de pièces |
|
|
|
|
|
|
|
|
|
|
| Nb d'habitations |
|
|
|
|
|
|
|
|
|
|
| Effectifs cumulés |
|
|
|
|
|
|
|
|
|
|
Le nombre total d'habitations est 1650. La moitié de ce nombre est 825.
Une valeur médiane est : 4.
3°) Les habitations donnant droit à la prime sont celles dont le nombre de pièces est inférieur ou égal à 4.
Remarque : c'est vraiment une chance que le nombre d'habitations soit pair et surtout, que la valeur 825 figure dans la ligne des effectifs cumulés
Autre énoncé, conforme à la stratégie proposée :
Voici la répartition des habitations d'une petite ville selon le nombre de pièces :
| Nombre de pièces |
|
|
|
|
|
|
|
|
|
|
| Nombre d'habitations |
190 |
200 |
230 |
225 |
316 |
215 |
175 |
60 |
30 |
10 |
1°) Calculer à 0,1 près le nombre moyen de pièces par habitation.
2°) La municipalité décide d'attribuer une prime aux habitants des habitations ayant le moins de pièces. Elle souhaite que la moitié environ des habitations soit concernée. A votre avis, quelles sont les habitations donnant droit à la prime ? Quel est le pourcentage d'habitations concernées ? (donnez le résultat à 1% près)
Réponses (attendues ?) :
1°) nombre moyen de pièces (à 0,1 près) : 4,3
2°)
| Nb de pièces |
|
|
|
|
|
|
|
|
|
|
| Nb d'habitations |
|
|
|
|
|
|
|
|
|
|
| Effectifs cumulés |
|
|
|
|
|
|
|
|
|
|
| Fréq. cum. en % |
11,51 |
23,62 |
37,55 |
51,18 |
70,32 |
83,34 |
93,94 |
97,58 |
99,39 |
100 |
A mon avis, la prime sera donnée aux habitants des habitations de 4 pièces ou moins. Cela représente environ 51% des habitations.
Deuxième exemple :
Enoncé initial :
Voici les notes trimestrielles de 10 élèves de troisième :
| Nom de l'élève |
|
|
|
|
|
|
|
|
|
|
| Note en Français |
|
|
|
|
|
|
|
|
|
|
| Note en Math |
|
|
|
|
|
|
|
|
|
|
Pour chaque matière, déterminer l'étendue, la moyenne et une valeur médiane.
Réponses (attendues ?) :
Regroupons les données :
| Notes en |
|
|
|
|
|
|
|
|
|
|
|
| Français |
|
|
|
|
|
|
|
|
|
|
|
|
cumulées |
|
|
|
|
|
|
|
|
|
|
|
| Math |
|
|
|
|
|
|
|
|
|
|
|
|
cumulées |
|
|
|
|
|
|
|
|
|
|
|
En Français : les notes vont de 7 à 14, la moyenne est 10,5 et une valeur médiane est 10.
En Math : les notes vont de 6 à 16, la moyenne est 10,5 et une valeur médiane est 11.
Remarques : là encore, il semble bien que les données ont été choisies pour "éviter" les ambiguïtés Si l'un des élèves, au lieu d'avoir 10 en Français, avait obtenu 11, qu'aurait-il fallu proposer comme valeur médiane ? Si l'élève qui a 11 en Math, avait en fait 10, la médiane passerait également de 11 à 10. Il me semble qu'ici, la notion de médiane n'est pas bien adaptée. Elle est trop sensible à de légères variations des données. Par ailleurs, l'idée d'illustrer la possibilité d'avoir la même moyenne et des médianes différentes est une bonne idée. Mais il me semble préférable de le faire dans un contexte plus "net" et qui peut être utile. C'est l'objet de la proposition suivante :
Autre proposition, avec énoncé conforme à la stratégie préconisée.
Pour choisir la marque des bougies à acheter pour un dîner aux chandelles, on a procédé à l'expérience suivante : pour chacune des deux marques en présence, on a allumé 100 bougies et noté, par période de 10 min, combien d'entre elles s'éteignaient. Voici les résultats obtenus :
| Période |
|
|
|
|
|
|
|
|
|
|
| Nombre de bougies A s'éteignant |
|
|
|
|
|
|
|
|
|
|
| Nombre de bougies B s'éteignant |
|
|
|
|
|
|
|
|
|
|
On interprète ces tableaux en disant par exemple que 14 bougies de la marque A ont une durée de vie de 50 min, que 12 bougies de la marque B ont une durée de vie de 60 min
Pour chacune des marques, déterminer la durée de vie moyenne.
Pendant le dîner, on remplacera toutes les bougies dès que 50% d'entre elles seront éteintes. Il est prévu que le dîner dure 3 heures. Quelle marque allez-vous choisir ? Expliquez votre choix.
Eléments de réponse :
La durée de vie moyenne est d'environ 71 minutes pour les deux marques.
| Période |
|
|
|
|
|
|
|
|
|
|
| Nombre de bougies A éteintes |
1 |
5 |
19 |
52 |
66 |
78 |
85 |
91 |
96 |
100 |
| Nombre de bougies B éteintes |
3 |
7 |
15 |
27 |
48 |
89 |
98 |
100 |
0 |
0 |
Avec les bougies de la marque A :
Premier remplacement : entre 50 et 60 min.
Deuxième remplacement : entre 100 et 120 min.
Troisième remplacement : entre 150 et 180 min.
Quatrième remplacement : entre 200 et 240 min.
Il faudrait donc effectuer 3 remplacements.
Avec les bougies de la marque B :
Premier remplacement : entre 70 et 80 min.
Deuxième remplacement : entre 140 et 160 min.
Troisième remplacement : entre 210 et 240 min.
Deux remplacements suffiraient.
Finalement, que dire d'essentiel lors d'une formation ? Quelle démarche proposer aux collègues de collège ?
1°) Si vous composez vous-même l'énoncé d'un exercice, adoptez la position suivante :
Ne posez pas brutalement la question : "quelle est la médiane ?"
Mais demandez le calcul d'une valeur répondant à une propriété explicitement formulée dans le contexte de l'exercice.
2°) Si vous êtes amenés à corriger un exercice dans lequel le calcul de la valeur de la médiane est demandé, acceptez toute réponse "conforme" à la notion de médiane et précisez (faites préciser) le calcul effectué ou le raisonnement suivi.
E. Meyer, le 28/11/98
![]() |
|