Leçons de niveau 14

Échantillonnage et estimation pour le bio-médical/Tests d'homogénéité

Une page de Wikiversité.
Sauter à la navigation Sauter à la recherche
Début de la boite de navigation du chapitre
Tests d'homogénéité
Icône de la faculté
Chapitre no 5
Leçon : Échantillonnage et estimation pour le bio-médical
Chap. préc. :Tests de conformité
Chap. suiv. :Sommaire
fin de la boite de navigation du chapitre
Icon falscher Titel.svg
En raison de limitations techniques, la typographie souhaitable du titre, « Échantillonnage et estimation pour le bio-médical : Tests d'homogénéité
Échantillonnage et estimation pour le bio-médical/Tests d'homogénéité
 », n'a pu être restituée correctement ci-dessus.

Les tests d'homogénéité permettent de s'assurer que deux échantillons ont bien été extrait d'une même population. Dans les tests d'homogénéité les paramètres de la population sont inconnus donc ne figure pas dans les formules.

Comparaison des moyennes de deux échantillons indépendants.[modifier | modifier le wikicode]

Soit deux échantillons.

Le premier d'effectif , de moyenne et écart-type .

Le deuxième d'effectif , de moyenne et écart-type .

Le problème que l'on se propose de résoudre est : Ces deux échantillons ont-ils été extraits d'une même population ?


Mise en place du test.

Soit , l'hypothèse : Les deux échantillons ont été extraits d'une même population.

Soit , l'hypothèse : Les deux échantillons proviennent de populations différentes.


Soit l'estimation de l'écart-type de la population d'où a été extrait le premier échantillon.

Soit l'estimation de l'écart-type de la population d'où a été extrait le deuxième échantillon.

Soit la variable aléatoire qui prend pour valeur les moyennes du premier échantillon.

Soit la variable aléatoire qui prend pour valeur les moyennes du deuxième échantillon.

Nous admettrons le théorème suivant :

Si l'hypothèse est vraie et si et , la variable aléatoire définie par :

suit sensiblement une loi normale centrée réduite.

Pour faire le test, on procédera donc ainsi :

On calcule la valeur est définie par :


Si , on accepte l'hypothèse .

Si , on rejette l'hypothèse .

On rappelle que :

pour .

pour .

est le risque de première espèce.


Remarque : Les cas ou sont plus délicats et seront donc étudiés dans une leçon de niveau supérieur.


Exclamation mark white icon.svg

Exemple.

On a prélevé deux échantillons de pommes pour étudier le poids des pommes.

Le premier, au début de la récolte, a pour taille 100, pour moyenne 120 grammes et pour écart-type 20 grammes.

Le deuxième, en fin de récolte, a pour taille 150, pour moyenne 150 grammes et pour écart type 10 grammes.

la différence entre les poids moyens à ces deux époques différentes de la récolte est-elle significative au risque de première espèce 5 % ?


Réponse.

L'écart-type estimé , de la population d'où aurait été extrait l'échantillon de début de récolte est :

L'écart-type estimé de la population d'où aurait été extrait l'échantillon de fin de récolte est :

Mise en place du test.

Soit , l'hypothèse : Il n'y a pas de différence entre le poids des pommes de début et de fin de récolte.

Soit , l'hypothèse : Le poids des pommes en début de récolte n'est pas le même qu'en fin de récolte.

Si est vraie,

suis sensiblement une loi normale centrée réduite.


Calculons :

Au risque de première espèce, si était vraie, on devrait avoir . Mais on constate que . On peut en conclure que le poids des pommes en début de récolte est probablement différent du poids des pommes en fin de récolte.


Comparaison des fréquences des deux échantillons différents.[modifier | modifier le wikicode]

Soit deux échantillons.

On observe sur le premier échantillon d'effectif un caractère avec une fréquence .

On observe sur le deuxième échantillon d'effectif le même caractère avec une fréquence .


Le problème que l'on se propose de résoudre est :

Ces deux échantillons ont-ils été extraits d'une même population ?


Mise en place du Test.

Soit , l'hypothèse : Les deux échantillons ont été extrait d'une même population.

Soit , l'hypothèse : Les deux échantillons proviennent de populations différentes.


Soit la variable aléatoire qui prend pour valeur les fréquences du caractère sur le premier échantillon.

Soit la variable aléatoire qui prend pour valeur les fréquences du caractère sur le deuxième échantillon.


Nous admettrons le théorème suivant :

Si l'hypothèse est vraie et si et , la variable aléatoire définie par :

suit sensiblement une loi normale centrée réduite.

étant l'estimation de , fréquence sur la population.

est donnée par la formule :

.

Pour faire le test, on procédera donc ainsi :

On calcule d'abord  :

.

On calcule ensuite la valeur définie par :

.

Si , on accepte l'hypothèse .

Si , on rejette l'hypothèse .

On rappelle que :

pour .

pour .

est le risque de première espèce.


Remarque : Les cas ou , On ne peut rien dire.


Exclamation mark white icon.svg

Exemple.

Sur 40 malades qui ont été traités avec un médicament A, 15 % ont été guéris.

Sur 60 malades qui ont été traités avec un médicament B, 25 % ont été guéris.

Peut-on affirmer au risque 5 % qu'il y a une différence d'efficacité entre les deux médicaments.


Réponse.

Mise en place du test.

Soit , l'hypothèse : Il n'y a pas de différence d'efficacité entre les médicaments A et B.

Soit , l'hypothèse : L'efficacité des médicaments A et B est différente.

si l'hypothèse était vraie, la fréquence estimée de guérison commune des médicaments A et B serait :

Si était vraie, suivrait une loi normale centrée réduite.

Calculons

Nous remarquons que .

Donc au risque de première espèce , on ne peut pas rejeter l'hypothèse . On ne peut pas dire qu'il y a une différence d'efficacité entre les deux médicaments. La différence observée peut être due aux fluctuations d'échantillonnage.