L’analyse de variance à un facteur teste l’effet d’un facteur contrôlé A ayant p modalités sur les moyennes d’une variable quantitative Y.
L’hypothèse nulle testée est la suivante :
il n’y a pas d’effet du facteur A et les p moyennes sont égales à une même moyenne m.
H0 : m1= m2 =…….= mi =….. = mp= m
alors yij = m + eij sous H0
avec eij variables aléatoires indépendantes suivant une même loi normale N(0, s).
Les résidus eij correspondent aux fluctuations expérimentales pour chaque valeur de la variable yij mesurée.
Sous l’hypothèse eij ® N(0, s) , on montre que yij ® N(m, s)
E(yij) = E(m+eij ) = E(m) + E(eij ) = m + E(eij ) = m puisque E(eij ) = 0
V(yij) = V(m+eij ) = V(m) + V(eij ) = 0 + s2 = s2 puisque V(eij ) = s2
L’hypothèse alternative est la suivante :
il y a un effet du facteur A et il existe au moins deux moyennes significativement différentes.
H1 : $ mi ¹ mj
alors yij = m + ai + eij sous H1
avec eij : variables aléatoires indépendantes suivant une même loi normale N(0, s).
ai : l’effet de la modalité i du facteur sur la variable Y
Sous l’hypothèse eij ® N(0, s) , on montre que yij ® N(m + ai, s)
E(yij) = E(m + ai +eij) = E(m) + E(ai) + E(eij) = m + ai + E(eij) = m + ai puisque E(eij) = 0
V(yij) = V(m + ai +eij) = V(m) + V(ai) + V(eij ) = 0 + 0 +s2 = s2 puisque V(eij) = s2
Ainsi il existe une différence entre les moyennes de la variable selon les modalités du facteur controlé.
Remarque : | Tester l’hypothèse nulle « absence d’effet sur facteur A » revient à tester |
H0 : les ai sont tous nuls |
Sous H0 : yij = m + eij
= notée aussi y.. = avec N =
L’ensemble des données du tableau peuvent être estimées à partir de la moyenne totale des yij à laquelle s’ajoute la part d’aléatoire dans les mesures, eij .
Sous H1 : yij = m + ai + eij
notée aussi yi. moyenne des yij pour la modalité i
d’où
et
ainsi
Soit le modèle sous H1 : yij = m + ai + eij
avec les estimateurs
avec les écarts au carré
avec les sommes pour tous les individus j
or = 0
car = 0 sachant que E(eij) = 0 si les hypothèses initiales sont vérifiées.
avec la somme pour les p modalités du facteur controlé
L’équation fondamentale de l’analyse de variance
SCEtotale SCEinter SCEintra
Notation :
SCEtotale = somme des écarts totaux ou variation totale = N
SCEinter = somme des écarts liés aux effets du facteur A ou variation inter (entre modalités)
SCEintra = somme des écarts résiduelles ou variation intra (interne à chaque modalité)
Exemple : Distribution des valeurs de la variable « anxiété des sportifs » yij en fonction des niveaux de compétition pour 30 sportifs. : moyenne pour chaque modalité i du facteur en vert, : moyenne de l’ensemble des données ai : effet de la modalité i sur la variable yij
|
|
Le rapport de corrélation donne la part de la variabilité totale des données expliquée par l’effet du facteur A :
h2 =
C’est un indice de liaison, pas nécessairement linéaire entre les variables étudiées qui varie entre 0 et 1. Il mesure la qualité de l’ajustement des effets du facteur au travers des moyennes.