Statistique inférentielle/Intervalle de confiance
Une page de Wikiversité.
| Chapitre 1 | |||
| Leçon : Statistique inférentielle | |||
|---|---|---|---|
| Retour au | Sommaire | ||
| Chap. suiv. : | Estimation d'un paramètre | ||
En raison de limitations techniques, la typographie souhaitable du titre, « Statistique inférentielle : Intervalle de confiance
Statistique inférentielle/Intervalle de confiance », n'a pu être restituée correctement ci-dessus.
Sommaire |
[modifier] Estimation d'une fréquence
[modifier] Exemple d'un sondage
Avant une élection, un candidat veut estimer le pourcentage p de voix qu'il va obtenir. Mais il ne peut pas interroger tous les électeurs, sauf à faire une élection avant l'heure ! Il va donc commander un sondage sur un échantillon représentatif (terme à préciser) de la population et obtenir une estimation
de son futur score.
Plusieurs questions se pose alors :
- Quelle précision peut-il escompter d'un tel sondage ?
- Quelle taille l'échantillon doit-il avoir pour avoir une précision donnée ?
- Que signifie "représentatif" ?
[modifier] Intervalle de confiance Bilatéral
|
Définition |
|
L'intervalle ![]() |
[modifier] Exemple
Si le sondage donne 40 % d'intentions de vote pour le candidat, avec une incertitude de 1 %, avec un niveau de confiance de 95 %, cela signifie que l'intervalle
est un intervalle de confiance bilatéral au niveau de confiance 0,95 pour p.
[modifier] Intervalles de confiances Unilatéraux
Parfois il peut arriver que l'on cherche à connaitre la borne maximale (ou minimale) d'un paramètre. Dans ce cas on utilise un Intervalle de Confiance qui n'est pas symétrique comme dans les IC bilatéraux, mais asymétrique.
Il en existe de 2 sortes :
|
Intervalle de confiance unilatéral à droite |
|
L'intervalle ![]() |
|
Intervalle de confiance unilatéral à gauche |
|
L'intervalle ![]() |
[modifier] Intervalle de confiance Bilatéral à 95%
|
Théorème |
|
En faisant un sondage au niveau de confiance de 95 % sur n individus, et en faisant l'hypothèse que p est assez proche de 0,5 ; on obtient un intervalle de confiance approximatif : |
[modifier] Exemple
Si le candidat demande un sondage au niveau de confiance de 95% sur 1000 personnes, quel intervalle de confiance obtient-il ?
Votre solution est bienvenue !
Remarques :
- Ce théorème approximatif ne peut se démontrer qu'à l'aide de la théorie des probabilités vue dans l'enseignement supérieur.
- Il permet cependant de constater que pour multiplier la précision par 10, il faut multiplier par 100 la taille de l'échantillon, ce qui est très coûteux.
[modifier] Exercice
Le candidat veut connaître son futur score à 0,1 % près, avec un niveau de confiance de 95 %. Combien de personnes faut-il interroger ?
- Préambule:
Pour répondre à la question posée, comme on ne connait a priori pas la loi de probabilité du sondage, il faut utiliser le théorème suivant :
|
Théorème Central Limite |
|
Soit Posons : Alors la loi de la variable aléatoire Zn converge vers une loi |
- Résolution Générale:
Hypothèse : Considérons que le candidat veut un intervalle de confiance avec une erreur bilaterale.
Notons :
et
avec
où
est la fonction de répartition de la loi normale centrée réduite.
Par défintion de l'intervalle de confiance on a :
.
Dans ce cas le problème équivaut à rechercher n tel que
avec
la distance euclidienne.
Soit encore :
.
D'où on en tire aisément que :
avec
la partie entière.
- Applications Numériques:
Or précédemment il a été fait la majoration suivante :
, l'inégalité devient
.
Pour k = 0.1%, et on obtient que 
Pour k = 1.0%, et on obtient que 
Pour k = 10.0%, et on obtient que 
On retrouve bien que pour augmenter la précision d'un facteur 10 (donc diviser k par 10), il faut multiplier par 100 la taille de l'échantillon.
est un intervalle de confiance bilatéral de niveau ![\mathbb P \left([\hat p -\delta_\alpha ; \hat p +\delta_\alpha]\ \ni p \right)=\alpha](http://upload.wikimedia.org/math/f/5/f/f5fa3b103bba0c4475d065200e3d4b1f.png)
est un intervalle de confiance unilatéral à droite de niveau ![\mathbb P \left([-\infty ; \hat p +\delta_\alpha] \ni p \right)=\alpha](http://upload.wikimedia.org/math/0/1/b/01b05c1aff8bcfc600df00dd508daf24.png)
est un intervalle de confiance unilatéral à gauche de niveau ![\mathbb P \left([\hat p -\delta_\alpha ; +\infty] \ni p \right)=\alpha](http://upload.wikimedia.org/math/6/3/3/633439432410c7c4057c474cade17051.png)
![[\hat p-\frac{1}{\sqrt{n}} ; \hat p+\frac{1}{\sqrt{n}}]\,](http://upload.wikimedia.org/math/4/0/8/40802a30171dbf3deb0724ecc9c32427.png)
un échantillon d'une loi de probabilité d'espérance
la moyenne empirique de l'échantillon, et
sa variance empirique.
.