Aller au contenu

Initiation à la statistique/Médiane

Leçons de niveau 10
Une page de Wikiversité, la communauté pédagogique libre.
Début de la boite de navigation du chapitre
Médiane
Icône de la faculté
Chapitre no 3
Leçon : Initiation à la statistique
Chap. préc. :Moyenne
Chap. suiv. :Sommaire
fin de la boite de navigation du chapitre
En raison de limitations techniques, la typographie souhaitable du titre, « Initiation à la statistique : Médiane
Initiation à la statistique/Médiane
 », n'a pu être restituée correctement ci-dessus.


Les statistiques sont le domaine des mathématiques dont le but est d’organiser de grandes masses de données pour les utiliser et les interpréter.

Elles sont utiles dans les sciences (notamment humaines : économie, sociologie, démographie…) et dans des domaines appliqués : commerce, médecine…


Exemple 1 : Les notes des élèves d’une classe à un devoir

[modifier | modifier le wikicode]

Les élèves d’une classe ont obtenu les notes suivantes à un devoir :

Notes sur 20  : 10, 9, 12, 11, 10, 8, 14 ,11 ,9 ,16 ,5 ,12 ,10 ,11 ,10 ,13

On présente les résultats de l’enquête sous forme d’un tableau d’effectifs.

Tableau des effectifs et moyenne

[modifier | modifier le wikicode]

L’effectif d’une valeur est le nombre de fois où cette valeur apparaît.

notes 5 8 9 10 11 12 13 14 16 Total
effectifs 1 1 2 4 3 2 1 1 1 16
Produit 5 8 18 40 33 24 13 14 16 171

Une première méthode permettant de calculer la moyenne de la classe, consiste tout d’abord à déterminer le total de points que totalise la classe car par définition la moyenne de la classe répond à la question suivante:

Si tous les élèves avaient eu la même note, quelle serait-elle pour que la classe totalise toujours ce même nombre de points ?

Pour calculer la note moyenne de la classe, on applique donc la formule suivante :

Tableau des fréquences et moyenne

[modifier | modifier le wikicode]

La fréquence de la note 10, par exemple, se calcule ainsi :

En procédant de même pour les autres notes, on obtient le tableau des fréquences (qu'on ne transforme pas en pourcentages pour calculer la moyenne) :

notes 5 8 9 10 11 12 13 14 16 Total
fréquences 0,0625 0,0625 0,125 0,25 0,1875 0,125 0,0625 0,0625 0,0625 1
Produit 0,3125 0,5 1,125 2,5 2,0625 1,5 0,8125 0,875 1 10,6875

On trouve ici la seconde méthode de calcul de la moyenne comme somme des produits des notes par leurs fréquences.

Tableau des effectifs cumulés et médiane

[modifier | modifier le wikicode]

Reprenons l'exemple 1 des notes des élèves :

notes 5 8 9 10 11 12 13 14 16
effectifs 1 1 2 4 3 2 1 1 1
effectifs cumulés 1 2 4 8 11 13 14 15 16


La médiane d’une série statistique quantitative est

la valeur du caractère qui partage l'effectif en deux parties égales.

Ici, on peut lire la médiane dans le tableau des effectifs ;

comme il y a 16 élèves, l'effectif se partage entre les 8 notes les plus basses

et les 8 notes les plus hautes.

La huitième note la plus haute est 11.

La huitième note la plus basse est 10.

On prendra la médiane entre les deux, soit 10,5

Tableau des fréquences cumulées

[modifier | modifier le wikicode]

En procédant comme pour les effectifs cumulés, on peut construire

un tableau des fréquences cumulées,

par exemple avec l'exemple 1 des notes :

notes 5 8 9 10 11 12 13 14 16
fréquences en % 6,25 6,25 12,50 25,00 18,75 12,50 6,25 6,25 6,25
fréquences cumulées en % 6,25 12,5 25 50 68,75 81,25 87,5 93,75 100

L'étendue d’une série statistique quantitative est l'écart entre sa plus grande valeur et sa plus petite valeur.

Exemple 1 des notes

[modifier | modifier le wikicode]

La note la plus élevée est 16, la note la plus basse est 5

L'étendue est donc :

Regroupement en classes : exemple 2 des salaires

[modifier | modifier le wikicode]

Lorsque le caractère statistique peut prendre un grand nombre de valeurs différentes, on les regroupe en classes (ou intervalles, ou tranches …).

En troisième, on travaille avec des classes de même largeur.

Tableaux et moyenne

[modifier | modifier le wikicode]

Répartition des revenus annuels en milliers d’euros dans une population de 4370 personnes.

Quand on regroupe une série statistique en classe, on calcule la moyenne en prenant comme valeurs les centres de chaque classe.

On a regroupé dans le même tableau les effectifs et les fréquences ainsi que les centres des classes.

Salaires (en milliers d'euros) entre 5 (inclus) et 10 exclus entre 10 (inclus) et 15 exclus entre 15 (inclus) et 20 exclus entre 20 (inclus) et 25 exclus entre 25 (inclus) et 30 exclus entre 30 (inclus) et 35 exclus entre 35 (inclus) et 40 exclus Total
Effectifs 306 231 385 1180 1468 568 232 4370
centre de chaque classe 7,5 12,5 17,5 22,5 27,5 32,5 37,5 total des salaires
Total des salaires
de chaque classe
2295 2887,5 6737,5 26550 40370 18460 8700 106000
Fréquences 0,07 0,053 0,088 0,27 0,336 0,13 0,053 Moyenne
Produit Fréquence.centre 0,525 0,6625 1,54 6,075 9,24 4,225 1,9875 24,255

On retrouve le salaire moyen par le calcul : 106000/4370 = 24,25 soit environ 24250 euros.

La légère différence entre les méthodes de calcul avec les fréquences et avec les effectifs s'explique par l'arrondi des fréquences. Cependant, étant donnée la perte d'information due au regroupement en classes, cette différence est sans importance.

On pourrait calculer la médiane comme dans l'exemple 1 avec les effectifs, mais c’est encore plus facile avec les fréquences cumulées : il suffit de regarder quand on dépasse les 50 %, c'est-à-dire la fréquence cumulée 0,5.

Salaires entre 5 (inclus) et 10 exclus entre 10 (inclus) et 15 exclus entre 15 (inclus) et 20 exclus entre 20 (inclus) et 25 exclus entre 25 (inclus) et 30 exclus entre 30 (inclus) et 35 exclus entre 35 (inclus) et 40 exclus
Fréquences 0,07 0,053 0,088 0,27 0,336 0,13 0,053
Fréquences cumulées 0,07 0,123 0,211 0,481 0,817 0,947 1

La médiane se situe donc dans la classe [25,30[, donc le salaire annuel médian se situe entre 25000 Euros et 30 000 euros. Il est plus élevé que le salaire moyen.


On représente cette étude statistique par un histogramme formé de rectangles qui recouvrent toute la classe considérée. On a placé les effectifs en ordonnées, mais on aurait pu travailler avec les fréquences.


Polygone des fréquences cumulées

[modifier | modifier le wikicode]

On retrouve le résultat précédent entre 25 et 30, environ 26 000 euros pour le salaire médian. Un calcul exact pourrait être fait en utilisant la proportionnalité ou les fonctions affines.