Initiation à la statistique/Introduction

Leçons de niveau 10
Une page de Wikiversité, la communauté pédagogique libre.
Début de la boite de navigation du chapitre
Introduction
Icône de la faculté
Chapitre no 1
Leçon : Initiation à la statistique
Retour auSommaire
Chap. suiv. :Moyenne
fin de la boite de navigation du chapitre
En raison de limitations techniques, la typographie souhaitable du titre, « Initiation à la statistique : Introduction
Initiation à la statistique/Introduction
 », n'a pu être restituée correctement ci-dessus.


Qu’est ce que les statistiques ?[modifier | modifier le wikicode]

C’est une théorie mathématique dont le but est :

  • Organiser des données en grand nombre pour pouvoir les interpréter.
    • Calculer une moyenne permet de résumer en un seul nombre un grand nombre de notes.
    • Calculer un pourcentage permet de résumer en un seul nombre la relation d’un ensemble à une de ses parties.
  • Les statistiques sont très utilisées :

Les résultats d’une enquête consistent en une liste désordonnée d’informations, dont il est difficile d’extraire la signification sans un traitement mathématique préalable.

Exemple 1 : Les notes des élèves d’une classe à un devoir[modifier | modifier le wikicode]

Les élèves d’une classe ont obtenu les notes suivantes à un devoir :

Notes sur 20  : 10, 9, 12, 11, 10, 8, 14 ,11 ,9 ,16 ,5 ,12 ,10 ,11 ,10 ,13

Pour mieux comprendre ces données, on les trie par ordre croissant :

Notes triées : 5, 8, 9, 9, 10, 10, 10, 10, 11, 11, 11, 12, 12, 13, 14, 16

Cette présentation reste peu convaincante, on décide alors de présenter les résultats de l’enquête sous forme d’un tableau d’effectifs.

Tableau des effectifs[modifier | modifier le wikicode]

L’effectif d’une valeur est le nombre de fois où cette valeur apparaît.

Exemple 1: notes des élèves

notes 5 8 9 10 11 12 13 14 16 Total
effectifs 1 1 2 4 3 2 1 1 1 16

Tableau des effectifs cumulés[modifier | modifier le wikicode]

Il sert à visualiser la vitesse de croissance des effectifs en fonction du caractère étudié. On l’utilise en troisième pour déterminer la médiane d’une série statistique.

Reprenons l’exemple 1 des notes des élèves :

notes 5 8 9 10 11 12 13 14 16
effectifs 1 1 2 4 3 2 1 1 1
effectifs cumulés 1 2 4 8 11 13 14 15 16

Tableau des fréquences[modifier | modifier le wikicode]

Lorsque la population étudiée est trop grande, ou bien lorsque l’on cherche à faire la comparaison entre deux populations de tailles différentes, on préfère se ramener à une population de 100, donc travailler en pourcentages, appelés ici fréquences.

La fréquence de la note 10, par exemple, se calcule ainsi :

En procédant de même pour les autres notes, on obtient le tableau des fréquences suivant :


notes 5 8 9 10 11 12 13 14 16 Total
fréquences en % 6,25 6,25 12,50 25,00 18,75 12,50 6,25 6,25 6,25 100

Tableau des fréquences cumulées[modifier | modifier le wikicode]

En procédant comme pour les effectifs cumulés, on peut construire un tableau des fréquences cumulées, par exemple avec l'exemple 1 des notes :

notes 5 8 9 10 11 12 13 14 16
fréquences en % 6,25 6,25 12,50 25,00 18,75 12,50 6,25 6,25 6,25
fréquences cumulées en % 6,25 12,5 25 50 68,75 81,25 87,5 93,75 100

Exemple 2 : La couleur préférée[modifier | modifier le wikicode]

On a demandé à 13 personnes leur couleur préférée.

Couleur préférée : bleu, rouge, bleu, bleu, jaune, bleu, rouge, bleu, bleu, jaune, jaune, bleu, jaune

Pour mieux comprendre ces résultats, on les trie par couleur :

Couleurs préférées triées : bleu, bleu, bleu, bleu, bleu, bleu, bleu, rouge, rouge, jaune, jaune, jaune, jaune


Cette liste reste peu éclairante, on présente les résultats de l’enquête sous forme d’un tableau d’effectifs.

Tableau des effectifs[modifier | modifier le wikicode]

Exemple 2: couleur préférée

Couleurs Effectifs
Bleu 7
Rouge 2
Jaune 4
Total 13


Tableau des fréquences[modifier | modifier le wikicode]

En procédant comme dans l’exemple précédent, on obtient le tableau des fréquences :

Couleurs Fréquences en %
Bleu 53,85
Rouge 15,38
Jaune 30,77
Total 100

Diagramme circulaire[modifier | modifier le wikicode]

Les diagrammes statistiques servent à prendre connaissance de l’essentiel d’une étude statistique en un seul coup d'œil. Le type de diagramme utilisé dépend de l'étude.

Le caractère statistique étudié ici, la couleur, n’est pas un nombre. On dit qu’il est qualitatif.

On construit alors un diagramme circulaire (ou « camembert ») : on découpe un cercle en secteurs dont la surface (et donc l’angle) est proportionnelle à l’effectif ou la fréquence.

Complétons le tableau par le calcul des angles au centre.

Couleurs Fréquences en % Angle en degré
Bleu 53,85 194
Rouge 15,38 55
Jaune 30,77 111
Total 100 360

Il ne reste plus qu’à dessiner les secteurs :

Notion de moyenne : Exemple de la taille des élèves[modifier | modifier le wikicode]

Exemple 3 : Moyenne simple[modifier | modifier le wikicode]

Voici les tailles de 5 élèves, la taille moyenne est celle d’un élève idéal ni trop grand ni trop petit. Y a-t-il un élève qui ait la taille « représentative » de la classe et quelle est cette taille ?


Tailles en cm 178 180 182 181 179


En additionnant tous les résultats et en divisant par le nombre d’individus dans la classe, nous obtiendrons ce que l’on appelle la moyenne.



La moyenne est donc 180 cm

Exemple 4 : Moyenne pondérée par les effectifs[modifier | modifier le wikicode]

Voici maintenant un groupe plus important d'élèves, dont certains ont la même taille. Peut-on calculer la taille moyenne sans additionner toutes les tailles (ce qui est long et pénible)?

Il faut d’abord construire le tableau des effectifs :


Taille 178 179 180 181 182 Effectif
Effectif 5 2 3 1 4 5+2+3+1+4=15
Taille × effectif 178 × 5 179 × 2 180 × 3 181 × 1 182 × 4 Somme des tailles
Produit 890 358 540 181 728 890+358+540+181+728=2697


La moyenne est ici le total des tailles à diviser par le nombre d'élèves : soit 2697/15 = 179,8 cm

Exemple 4 : Diagramme en bâtons[modifier | modifier le wikicode]

Le caractère statistique étudié ici, la taille, est un nombre. Un diagramme circulaire ne rendrait pas compte de sa grandeur. On construit alors un diagramme en bâtons (ou en barres).

Elevons pour chaque mesure un trait vertical proportionnel au nombre d'élèves.


Répartition des 15 élèves selon leur taille en cm.

Regroupement en classes : Exemple des salaires[modifier | modifier le wikicode]

Lorsque le caractère statistique prend un grand nombre de valeurs différentes, elles peuvent être regroupées en classes (ou intervalles, ou tranches …).

En quatrième, on travaille toujours avec des classes de même largeur.

Tableau des effectifs[modifier | modifier le wikicode]

Exemple 5 : Répartition des revenus annuels en milliers d’euros dans une population de 4370 personnes.

Salaires entre 5 (inclus) et 10 exclus entre 10 (inclus) et 15 exclus entre 15 (inclus) et 20 exclus entre 20 (inclus) et 25 exclus entre 25 (inclus) et 30 exclus entre 30 (inclus) et 35 exclus entre 35 (inclus) et 40 exclus Total
Effectifs 306 231 385 1180 1468 568 232 4370

Tableau des fréquences[modifier | modifier le wikicode]

Les effectifs ici sont trop grands pour que l’on puisse se faire une idée simple de la répartition, on préfère alors travailler en pourcentages ou fréquences et se ramener ainsi à une population de 100.

Salaires entre 5 (inclus) et 10 exclus entre 10 (inclus) et 15 exclus entre 15 (inclus) et 20 exclus entre 20 (inclus) et 25 exclus entre 25 (inclus) et 30 exclus entre 30 (inclus) et 35 exclus entre 35 (inclus) et 40 exclus Total
Fréquences 7,0 5,3 8,8 27,0 33,6 13,0 5,3 100

Moyenne[modifier | modifier le wikicode]

Quand on regroupe une série statistique en classe, on calcule la moyenne en prenant comme valeurs les centres de chaque classe.
Salaires entre 5 (inclus) et 10 exclus entre 10 (inclus) et 15 exclus entre 15 (inclus) et 20 exclus entre 20 (inclus) et 25 exclus entre 25 (inclus) et 30 exclus entre 30 (inclus) et 35 exclus entre 35 (inclus) et 40 exclus Total
Effectifs 306 231 385 1180 1468 568 232 4370
centre de chaque classe 7,5 12,5 17,5 22,5 27,5 32,5 37,5 total des salaires
Total des salaires
de chaque classe
2295 2887,5 6737,5 26550 40370 18460 8700 106000

Le salaire moyen parmi cet échantillon est donc de 106000/4370 = 24,25 soit environ 24250 Euros.

Histogramme[modifier | modifier le wikicode]

On représente cette étude statistique par un histogramme, formé de rectangles qui recouvrent toutes les classes considérées.