Échantillonnage et estimation pour le bio-médical/Introduction

**Introduction**
Leçon : Échantillonnage et estimation pour le bio-médical

Chapitre n^o 1
Retour au	Sommaire
Chap. suiv. :	Échantillonnage

En raison de limitations techniques, la typographie souhaitable du titre, « Échantillonnage et estimation pour le bio-médical : Introduction
Échantillonnage et estimation pour le bio-médical/Introduction », n'a pu être restituée correctement ci-dessus.

Premières définitions

On considère une population dont l'effectif est généralement très élevé. on appelle « échantillon » un ensemble obtenue à partir de tirage d'individus de la population.

L'échantillon sera dit exhaustif si le tirage est réalisé sans remise. L'échantillon sera-dit non-exhaustive si le tirage est réalisé avec remise.

On appelle échantillonnage la théorie qui suppose connus les paramètres de la population et qui se propose d'en déduire des renseignements sur les échantillons obtenus à partir de cette population.

On appelle estimation la théorie qui suppose connus les paramètres d'un échantillon et qui se propose d'en déduire des renseignements sur la population de laquelle a été extraite l'échantillon.

Les lois obtenues dans le cas où l'échantillon est non exhaustif sont plus simples que dans le cas où l'échantillonnage est exhaustif.

On montre que lorsque l'effectif de la population est très élevé, il n'y a pratiquement pas de différence entre les paramètres d'un échantillon exhaustif et les paramètres d'un échantillon non-exhaustif.

Par conséquent, comme la population a toujours un effectif élevé, on considérera que tous les échantillons sont non exhaustifs.

Si ce n'est pas le cas, l'erreur commise sera toujours négligeable.

Tests d'hypothèses

On devons parfois faire un choix entre plusieurs hypothèses sans disposer de critères ou d'informations suffisantes pour faire le meilleur choix.

Par exemple, un nouveau médicament vient d'être mis au point pour traiter une maladie M.

Nous savons qu'un ancien médicament donnait 40 % de réussite et nous savons grâce à un test que le nouveau médicament a guéri 48 personnes sur un échantillon de 100 personnes.

Peut-on dire que le nouveau médicament est meilleur que le précédent ?

Ce n'est pas sûr. Il se peut que le pourcentage de guérison du nouveau médicament soit seulement de 37 % mais que les fluctuations d'échantillonnage aient été telles que dans l'échantillon de 100 personnes, il en ait guérit 48.

Dans toute prise de décision à partir de tests statistiques, il y a un risque de se tromper. Par conséquent, une façon de résoudre le problème serait de calculer pour chaque prise de décision la probabilité de se tromper. L'idéal serait de pouvoir dire par exemple "Ce médicament est meilleur que le précédent. Mais il y a 3 % de chance que je me trompe".

Dans cette leçon, nous nous intéresserons aux problèmes n'ayant que deux alternatives que l'on notera H₀ et H₁.

L'hypothèse noté H₀ sera rappelée « hypothèse nulle » et sera en principe l'hypothèse dont la loi est la mieux connue.

L'hypothèse noté H₁ sera rappelée « hypothèse alternative » et sera en principe l'hypothèse dont la loi est la moins bien connue.

Si par exemple, on veut tester un nouveau médicament et décider si ses effets sont identiques ou non à un ancien médicament, on choisira pour H₀, l'hypothèse : « Les effets du nouveau médicament sont identiques à l’ancien médicament » et pour H₁ l'hypothèse : « Les effets du nouveau médicament sont différents de l'ancien médicament. ».

En effet, si les effets du nouveau médicament sont identiques à l'ancien médicament, sa loi sera connue car ce sera la loi de l'ancien médicament qui lui, a suffisamment servi pour être bien connu. Par contre, si le nouveau médicament n'a pas des effets identiques à l'ancien, on ne peut pratiquement rien dire sur sa loi car il n'a pas encore été suffisamment expérimenté.

Un test statistique va nous amener à choisir entre les hypothèses H₀ et H₁ et, bien sûr, que l'on choisisse H₀ et H₁, il y aura un risque de se tromper.

On appelle risque de première espèce noté $\alpha$ , la probabilité de choisir H₁ sachant que H₀ était vraie.

On appelle risque de deuxième espèce noté $\beta$ , la probabilité de choisir H₀ sachant que H₁ était vraie.

comme H₀ est l'hypothèse la mieux connue, la probabilité $\alpha$ de rejeter H₀ sachant que H₀ est vraie est plus facile à calculer que $\beta$ .

Généralement, on fixe $\alpha =0,05$ ou $\alpha =0,01$ .

$\beta$ est lui, bien souvent impossible à calculer.

Théorème de la limite centrale

Nous admettrons ce théorème, utile en théorie de l'échantillonnage, qui s'énonce ainsi :

Théorème de la limite centrale

Soit $X_{1},\,X_{2},\,X_{3},\,\cdots ,\,X_{n}$ une suite de variables aléatoires indépendantes dont la loi de distribution est la même (pas forcément normale) et dont les espérances mathématiques et les variances sont les mêmes.