Statistique à deux variables/Séries de données statistiques quantitatives à deux variables

Une page de Wikiversité.


Séries de données statistiques quantitatives à deux variables
Nuvola apps edu mathematics-p.svg
Chapitre 1
Leçon : Statistique à deux variables
Retour au Sommaire
Chap. suiv. : Ajustement affine par les moindres carrées


Icon falscher Titel.svg

En raison de limitations techniques, la typographie souhaitable du titre, « Statistique à deux variables : Séries de données statistiques quantitatives à deux variables
Statistique à deux variables/Séries de données statistiques quantitatives à deux variables
 », n'a pu être restituée correctement ci-dessus.

Sommaire

[modifier] Série statistiques à deux variables

Définition

X et Y désignent deux variables statistiques quantitatives observées sur n individus d'une même population.

Pour 1\leq i\leq n, xi et yi désignent les n mesures relevées pour X et Y.

Les n couples (x_i ; y_i)\, forment une série statistique à deux variables.

Remarque : Nous pouvons étudier séparément chacune des séries X et Y comme des séries statistiques à une variable et calculer leurs moyennes, médiane, écart-type, etc. Voir Statistique à une variable. Dans la présente leçon, ce sont les relations entre X et Y qui nous intéressent.

[modifier] Nuage de points

Définition

Dans un repère orthogonal, on peut représenter l'ensemble des n points M_i(x_i ; y_i)\,.

Ils forment le nuage de points de la série (X;Y)

[modifier] Notation

Pour simplifier l'exposé des formules, nous utiliserons la notation \sum

pour signifier la somme sur toutes les valeurs prises par i.

Par exemple : x_1+x_2+x_3+\ldots+x_n=\sum_{i=1}^n x_i

[modifier] Point moyen

Définition

Le point moyen de la série (X;Y) est le point G de coordonnées (\bar{x};\bar{y}) où :


\bar{x} = \frac{x_1+x_2+x_3+\ldots+x_n}{n}=\frac{1}{n} \sum_{i=1}^n  x_i

\bar{y} = \frac{y_1+y_2+y_3+\ldots+y_n}{n}=\frac{1}{n} \sum_{i=1}^n  y_i

[modifier] Ajustement

Lorsque les deux variables X et Y sont liées l'une à l'autre, on peut s'attendre à ce que le nuage de points présente une forme particulière.


Définition

Effectuer un ajustement de y en x d'un nuage de points consiste à trouver

une fonction f telle que la courbe y = f(x) passe "le plus près possible" des points du nuage.

Remarque : La courbe peut être une droite ou une parabole.

Anscombe.svg

ou bien il peut ne pas y avoir de courbe visible :

Rand-3c.png

Parfois, une courbe est suggérée mais ne correspond pas parfaitement au nuage :

Comparaison rangs indicateurs pauvrete.png

[modifier] Méthodes sommaires d'ajustement affine

Deux méthodes peuvent être proposées pour une approche rapide de la notion d'ajustement affine.

  • La méthode empirique : l'opérateur choisit parmi les droites passant par le point moyen G celle qui lui semble épouser au mieux l'allure du nuage. Peu rigoureuse, cette méthode est très subjective.
  • La méthode de Mayer : l'opérateur partage le nuage de points en deux parties de même effectif, éventuellement à une unité près, puis détermine les points moyens G_1\, et G_2\, de chaque sous-nuage. La droite retenue est alors (G_1 G_2)\, dont on démontre qu'elle passe nécessairement par G. Malgré son apparence plus mathématique, cette méthode - enseignée dans certaines classes pour sa facilité d'accès - est d'une validité aléatoire.