Statistique à deux variables/Ajustement affine par les moindres carrées

Une page de Wikiversité.


Ajustement affine par les moindres carrées
Nuvola apps edu mathematics-p.svg
Chapitre 2
Leçon : Statistique à deux variables
Chap. préc. : Séries de données statistiques quantitatives à deux variables
Chap. suiv. : Séries chronologiques


Icon falscher Titel.svg

En raison de limitations techniques, la typographie souhaitable du titre, « Statistique à deux variables : Ajustement affine par les moindres carrées
Statistique à deux variables/Ajustement affine par les moindres carrées
 », n'a pu être restituée correctement ci-dessus.

[modifier] Ajustement par la méthode des moindres carrés

La forme d'un nuage de points invite à retenir pour l'ajuster des modèles de fonctions familières :

  • soit le modèle affine y=ax+b\,
  • soit le modèle exponentiel y=a\times b^x\,
  • soit le modèle puissance y=a\times x^b\,
  • ...

Pour ajuster une série à un modèle il faut un critère : dans la méthode des moindres carrés on retient le critère suivant : la somme des carrés des écarts verticaux entre les valeurs y_i\, observés et celles f(x_i)\, données par le modèle doit être minimale :

Sur la figure ci-dessous cela représente la somme des carrés des longueurs vertes :

Linear least squares example2.png


Définition

Effectuer un ajustement par la méthode des moindres carrées consiste à trouver une fonction f\, du modèle retenu qui minimise l'expression :

\sum_{i=1}^n  [y_i-f(x_i)]^2

[modifier] Ajustement affine par la méthode des moindres carrés

Lorsque le nuage est de forme allongée, on peut tenter un ajustement affine en utilisant le théorème suivant :


Théorème

La droite d'ajustement affine par la méthode des moindres carrés a pour coefficient directeur :

a=\frac{\sum_{i=1}^n  (x_i-\bar{x})(y_i-\bar{y})}{\sum_{i=1}^n  (x_i-\bar{x})^2}

et passe par le point moyen G(\bar{x};\bar{y}) du nuage.

Autrement dit une équation de la droite est :

y=a(x-\bar{x})+\bar{y}\,

Remarque : On appelle parfois cette droite : droite de régression de y en x.

[modifier] Interpolation et extrapolation

Pour une valeur x0 de la variable X, la connaissance de f permet de prévoir approximativement la valeur correspondante de Y. Pour cela on calcule f(x0).

  • Si x0 appartient à l'intervalle d'observation des valeurs de X, on dit qu'on fait une interpolation.
  • Si x0 est à l'extérieur de l'intervalle d'observation, on parle d'extrapolation.
Cela suppose de faire l'hypothèse que le modèle reste plausible à l'extérieur de l'intervalle.