Initiation à la statistique/Médiane
Les statistiques sont le domaine des mathématiques dont le but est d’organiser de grandes masses de données pour les utiliser et les interpréter.
Elles sont utiles dans les sciences (notamment humaines : économie, sociologie, démographie…) et dans des domaines appliqués : commerce, médecine…
Exemple 1 : Les notes des élèves d’une classe à un devoir
[modifier | modifier le wikicode]Les élèves d’une classe ont obtenu les notes suivantes à un devoir :
On présente les résultats de l’enquête sous forme d’un tableau d’effectifs.
Moyenne
[modifier | modifier le wikicode]Tableau des effectifs et moyenne
[modifier | modifier le wikicode]L’effectif d’une valeur est le nombre de fois où cette valeur apparaît.
notes | 5 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 16 | Total |
effectifs | 1 | 1 | 2 | 4 | 3 | 2 | 1 | 1 | 1 | 16 |
Produit | 5 | 8 | 18 | 40 | 33 | 24 | 13 | 14 | 16 | 171 |
Une première méthode permettant de calculer la moyenne de la classe, consiste tout d’abord à déterminer le total de points que totalise la classe car par définition la moyenne de la classe répond à la question suivante:
Si tous les élèves avaient eu la même note, quelle serait-elle pour que la classe totalise toujours ce même nombre de points ?
Pour calculer la note moyenne de la classe, on applique donc la formule suivante :
Tableau des fréquences et moyenne
[modifier | modifier le wikicode]La fréquence de la note 10, par exemple, se calcule ainsi :
En procédant de même pour les autres notes, on obtient le tableau des fréquences (qu'on ne transforme pas en pourcentages pour calculer la moyenne) :
notes | 5 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 16 | Total |
fréquences | 0,0625 | 0,0625 | 0,125 | 0,25 | 0,1875 | 0,125 | 0,0625 | 0,0625 | 0,0625 | 1 |
Produit | 0,3125 | 0,5 | 1,125 | 2,5 | 2,0625 | 1,5 | 0,8125 | 0,875 | 1 | 10,6875 |
On trouve ici la seconde méthode de calcul de la moyenne comme somme des produits des notes par leurs fréquences.
Médiane
[modifier | modifier le wikicode]Tableau des effectifs cumulés et médiane
[modifier | modifier le wikicode]Reprenons l'exemple 1 des notes des élèves :
notes | 5 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 16 |
effectifs | 1 | 1 | 2 | 4 | 3 | 2 | 1 | 1 | 1 |
effectifs cumulés | 1 | 2 | 4 | 8 | 11 | 13 | 14 | 15 | 16 |
La médiane d’une série statistique quantitative est
la valeur du caractère qui partage l'effectif en deux parties égales.
Ici, on peut lire la médiane dans le tableau des effectifs ;
comme il y a 16 élèves, l'effectif se partage entre les 8 notes les plus basses
et les 8 notes les plus hautes.
La huitième note la plus haute est 11.
La huitième note la plus basse est 10.
On prendra la médiane entre les deux, soit 10,5
Tableau des fréquences cumulées
[modifier | modifier le wikicode]En procédant comme pour les effectifs cumulés, on peut construire
un tableau des fréquences cumulées,
par exemple avec l'exemple 1 des notes :
notes | 5 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 16 |
fréquences en % | 6,25 | 6,25 | 12,50 | 25,00 | 18,75 | 12,50 | 6,25 | 6,25 | 6,25 |
fréquences cumulées en % | 6,25 | 12,5 | 25 | 50 | 68,75 | 81,25 | 87,5 | 93,75 | 100 |
Etendue
[modifier | modifier le wikicode]L'étendue d’une série statistique quantitative est l'écart entre sa plus grande valeur et sa plus petite valeur.
Exemple 1 des notes
[modifier | modifier le wikicode]La note la plus élevée est 16, la note la plus basse est 5
L'étendue est donc :
Regroupement en classes : exemple 2 des salaires
[modifier | modifier le wikicode]Lorsque le caractère statistique peut prendre un grand nombre de valeurs différentes, on les regroupe en classes (ou intervalles, ou tranches …).
En troisième, on travaille avec des classes de même largeur.
Tableaux et moyenne
[modifier | modifier le wikicode]Répartition des revenus annuels en milliers d’euros dans une population de 4370 personnes.
Quand on regroupe une série statistique en classe, on calcule la moyenne en prenant comme valeurs les centres de chaque classe.
On a regroupé dans le même tableau les effectifs et les fréquences ainsi que les centres des classes.
Salaires (en milliers d'euros) | entre 5 (inclus) et 10 exclus | entre 10 (inclus) et 15 exclus | entre 15 (inclus) et 20 exclus | entre 20 (inclus) et 25 exclus | entre 25 (inclus) et 30 exclus | entre 30 (inclus) et 35 exclus | entre 35 (inclus) et 40 exclus | Total |
Effectifs | 306 | 231 | 385 | 1180 | 1468 | 568 | 232 | 4370 |
centre de chaque classe | 7,5 | 12,5 | 17,5 | 22,5 | 27,5 | 32,5 | 37,5 | total des salaires |
Total des salaires de chaque classe |
2295 | 2887,5 | 6737,5 | 26550 | 40370 | 18460 | 8700 | 106000 |
Fréquences | 0,07 | 0,053 | 0,088 | 0,27 | 0,336 | 0,13 | 0,053 | Moyenne |
Produit Fréquence.centre | 0,525 | 0,6625 | 1,54 | 6,075 | 9,24 | 4,225 | 1,9875 | 24,255 |
On retrouve le salaire moyen par le calcul : 106000/4370 = 24,25 soit environ 24250 euros.
La légère différence entre les méthodes de calcul avec les fréquences et avec les effectifs s'explique par l'arrondi des fréquences. Cependant, étant donnée la perte d'information due au regroupement en classes, cette différence est sans importance.
Médiane
[modifier | modifier le wikicode]On pourrait calculer la médiane comme dans l'exemple 1 avec les effectifs, mais c’est encore plus facile avec les fréquences cumulées : il suffit de regarder quand on dépasse les 50 %, c'est-à-dire la fréquence cumulée 0,5.
Salaires | entre 5 (inclus) et 10 exclus | entre 10 (inclus) et 15 exclus | entre 15 (inclus) et 20 exclus | entre 20 (inclus) et 25 exclus | entre 25 (inclus) et 30 exclus | entre 30 (inclus) et 35 exclus | entre 35 (inclus) et 40 exclus |
Fréquences | 0,07 | 0,053 | 0,088 | 0,27 | 0,336 | 0,13 | 0,053 |
Fréquences cumulées | 0,07 | 0,123 | 0,211 | 0,481 | 0,817 | 0,947 | 1 |
La médiane se situe donc dans la classe [25,30[, donc le salaire annuel médian se situe entre 25000 Euros et 30 000 euros. Il est plus élevé que le salaire moyen.
Histogramme
[modifier | modifier le wikicode]Un histogramme est un diagramme statistique permettant de représenter des séries statistiques continues.
On place en abscisses x les modalités regroupées en classes.
Dans un histogramme, l’aire des rectangles doit être proportionnelle à l’effectif.
Si la largeur des classes est constante, les effectifs sont représentés en ordonnées y.
On représente cette étude statistique par un histogramme formé de rectangles qui recouvrent toute la classe considérée. On a placé les effectifs en ordonnées, mais on aurait pu travailler avec les fréquences.
Polygone des fréquences cumulées
[modifier | modifier le wikicode]Pour déterminer graphiquement la médiane d'une série statistique:
- On trace la courbe des fréquences cumulées (ou des effectifs cumulés).
La droite d'équation représente la fréquence égale à 50%. La médiane est l'abscisse correspondant à l'intersection de la droite et la courbe.
On retrouve le résultat précédent entre 25 et 30, environ 26 000 euros pour le salaire médian. Un calcul exact pourrait être fait en utilisant la proportionnalité ou les fonctions affines.