Les tests de conformité sont destinés à vérifier si un échantillon peut être considéré comme extrait d’une population donnée ou représentatif de cette population, vis-à-vis d'un paramètre comme la moyenne, la variance ou la fréquence observée. Ceci implique que la loi théorique du paramètre est connue au niveau de la population.
En théorie, si l’on suppose connu la valeur q0 d’un paramètre relatif à la population
(par exemple p, m , s2 ) et un estimateur absolument correct de q (par exemple , , s2) obtenu à partir d’un échantillon aléatoire simple de taille n, on cherche à savoir si l’échantillon est représentatif de la population pour le paramètre considéré.
H0 : q = q0 (test de conformité)
Soit X, une variable aléatoire observée sur une population, suivant une loi normale et un échantillon extrait de cette population.
Le but est de savoir si un échantillon de moyenne , estimateur de m, appartient à une population de référence connue d’espérance m0 (H0 vraie) et ne diffère de m0 que par des fluctuations d’échantillonnage ou bien appartient à une autre population inconnue d’espérance m (H1 vraie).
Pour tester cette hypothèse, il existe deux statistiques : la variance de la population de référence est connue (test e) ou cette variance est inconnue et il faut l’estimer (test T).
3.1.2.1 Statistique du test
Soit la distribution d’échantillonnage de la moyenne dans la population inconnue suit une loi normale telle que : ® N (m, ).
La statistique étudiée est l’écart : S = - m0 dont la distribution de probabilité est la suivante
S ® N (0, ) avec sous H0, E(S) = 0 et V(S) = (voir démonstration)
Nous pouvons établir grâce au théorème central limite la variable Z centrée réduite telle que
Z = =
Sous H0 : m = m0 avec connue
Z = suit une loi normale centrée réduite N(0,1)
.
3.1.2.2 Application et Décision
L’hypothèse testée est la suivante :
H0 : m = m0 contre H1 : m ¹ m0
Une valeur z de la variable aléatoire Z est calculée :
z = notée aussi eobs
e calculée (eobs) est comparée avec la valeur eseuil lue sur la table
de la loi normale centrée réduite pour un risque d’erreur a fixé (Règle de décision 1).
· si eobs > eseuil l’hypothèse H0 est rejetée au risque d’erreur a : l’échantillon appartient à une population d’espérance m et n’est pas représentatif de la population de référance d’espérance m0 .
· si eobs £ eseuil l’hypothèse H0 est acceptée: l’échantillon est représentatif de la population de référence d’espérance m0.
Exemple :
La glycémie d’une population suit une loi normale d’espérance m0 = 1g/l et d’écart-type s0 = 0,1 g/l. On relève les glycémies chez 9 patients. On trouve = 1,12g/l. Cet échantillon est-il représentatif de la population ? Réponse. |
|
3.1.3.1 Statistique du test
La démarche est la même que pour le test e mais la variance de la population n’étant pas connue, elle est estimée par :
(voir estimation ponctuelle)
La statistique étudiée est l’écart : S = - m0 dont la distribution de probabilité est la suivante
S ® N (0, ) avec E(S) = 0 et V(S) = (voir démonstration)
Nous pouvons établir grâce au théorème central limite la variable T centrée réduite telle que
T = =
Sous H0 : m = m0 avec inconnue
T = suit une une loi de Student à n-1 degrés de liberté. .
3.1.3.2 Application et Décision
L’hypothèse testée est la suivante :
H0 : m = m0 contre H1 : m ¹ m0
Une valeur t de la variable aléatoire T est calculée :
t = =
t calculée (tobs) est comparée avec la valeur tseuil lue dans la table de Student
pour un risque d’erreur a fixé et (n - 1) degrés de liberté.
· si tobs > tseuil l’hypothèse H0 est rejetée au risque d’erreur a : l’échantillon appartient à une population d’espérance m et n’est pas représentatif de la population de référence d’espérance m0 .
· si tobs £ tseuil l’hypothèse H0 est acceptée: l’échantillon est représentatif de la population de référence d’espérance m0.
Remarque : Si n < 30, la variable aléatoire X étudiée doit impérativement suivre une loi normale N(m,s). Pour n ³ 30, la variable de student t converge vers une loi normale centrée réduite e.
Exemple :
Pour étudier un lot de fabrication de comprimés, on prélève au hasard 10 comprimés parmis les 30 000 produits et on les pèse. On observe les valeurs de poids en grammes :
0,81 – 0,84 – 0,83 – 0,80 – 0,85 – 0,86 – 0,85 – 0,83 – 0,84 – 0,80
Le poids moyen observé est-il compatible avec la valeur 0,83g, moyenne de la production au seuil 98% ? Réponse.
Soit X une variable qualitative prenant deux modalités (succès X=1, échec X=0) observée sur une population et un échantillon extrait de cette population.
Le but est de savoir si un échantillon de fréquence observée , estimateur de p, appartient à une population de référence connue de fréquence p0 (H0 vraie) ou à une autre population inconnue de fréquence p (H1 vraie).
La distribution d’échantillonnage de la fréquence de succès dans la population inconnue, suit une loi normale telle que : suit N (p, ), les variances étant supposées égales dans la population de référence et la population d’où est extrait l’échantillon.
La statistique étudiée est l’écart : S = – p0 dont la distribution de probabilité est la suivante S ® N (0, ) avec sous H0 E(S) = 0 et V(S) = (voir démonstration)
Nous pouvons établir grâce au théorème central limite la variable Z centrée réduite telle que
Z = = mais seulement si np0 et nq0 ³ 10 (convergence)
Sous H0 : p = p0
Z = suit une loi normale centrée réduite N(0,1)
.
L’hypothèse testée est la suivante :
H0 : p = p0 contre H1 : p ¹ p0
Une valeur z de la variable aléatoire Z est calculée :
z = notée aussi eobs
e calculée (eobs) est comparée avec la valeur eseuil lue sur la table
de la loi normale centrée réduite pour un risque d’erreur a fixé (Stratégie 1).
· si eobs > eseuil l’hypothèse H0 est rejetée au risque d’erreur a : l’échantillon appartient à une population de fréquence p et n’est pas représentatif de la population de référence de fréquence p0 .
· si eobs £ eseuil l’hypothèse H0 est acceptée: l’échantillon est représentatif de la population de référence de fréquence p0.
Exemple : Une anomalie génétique touche en France 1/1000 des individus. On a constaté dans une région donnée : 57 personnes atteintes sur 50 000 naissances. Cette région est-elle représentative de la France entière ? Réponse. |
|