Chapitre 9 : Analyse de Variance

3         Modèle de l’analyse de variance

3.1         Modèle sous H: homogénéité des données

L’analyse de variance à un facteur teste l’effet d’un facteur contrôlé A ayant p modalités sur les moyennes d’une variable quantitative Y.

                          L’hypothèse nulle testée est la suivante : 

 il n’y a pas d’effet du facteur A et les p moyennes sont égales à une même moyenne m.

            H0 : m1= m2 =…….= mi =….. = mp= m

                                  alors        yij = m + eij    sous H0  

       avec  eij   variables aléatoires indépendantes suivant une même loi normale N(0, s).

 

Les résidus eij correspondent aux fluctuations expérimentales pour chaque valeur de la variable yij mesurée.

Sous l’hypothèse    eij   ® N(0, s) ,   on montre que  yij   ® N(m, s)

              E(yij) = E(m+eij  ) = E(m) + E(eij ) = m + E(eij ) = m     puisque   E(eij ) = 0

              V(yij) = V(m+eij  ) = V(m) + V(eij ) = 0 + s2  = s2         puisque   V(eij ) = s2         

3.2       Modèle sous H1 : hétérogénéité des données

                  L’hypothèse alternative  est la suivante : 

 il y a un effet du facteur A et il existe au moins deux moyennes significativement différentes.

            H1 :      $  mi ¹ mj

                                  alors        yij = m + ai + eij     sous H1  

       avec  eij :  variables aléatoires indépendantes suivant une même loi normale N(0, s).

                a: l’effet de la modalité i du facteur sur la variable Y

Sous l’hypothèse  eij   ® N(0, s) ,   on montre que  yij   ® N(m + ai, s)

     E(yij) = E(m + ai +eij) = E(m) + E(ai) + E(eij) = m + ai  + E(eij) = m + ai    puisque   E(eij) = 0

     V(yij) = V(m + ai +eij) = V(m) + V(ai) + V(eij ) = 0 + 0 +s2  = s2               puisque V(eij) = s2         

 

Ainsi il existe une différence entre les moyennes de la variable selon les modalités du facteur controlé.

 

Remarque : Tester l’hypothèse nulle «  absence d’effet sur facteur » revient à tester

  H0 : les ai sont tous nuls

                             

3.3       Equation fondamentale de l’analyse de variance

3.3.1                   Estimation des paramètres des modèles

 

Sous H0 : yij = m + eij    

             =          notée aussi y..                         =  avec N =     

 L’ensemble des données du tableau peuvent être estimées à partir de la moyenne totale des yij   à laquelle s’ajoute la part d’aléatoire dans les mesures, eij .

 

Sous H1 : yij = m + ai + eij    

           notée aussi yi.                         moyenne des yij pour la modalité i

d’où           

  et                       

ainsi      

 

 

 

 

3.3.2                 Décomposition de la variation totale

Soit le modèle sous H1 :      yij = m + ai + eij                                                            

 avec les estimateurs         

                                         

avec les écarts au carré                                             

avec les sommes pour tous les  individus j   

                                        

 or  = 0

car  = 0  sachant que E(eij) = 0 si les hypothèses initiales sont vérifiées.

avec la somme pour les p modalités du facteur controlé

                                     

L’équation fondamentale de l’analyse de variance                       

                             

                                      SCEtotale               SCEinter                 SCEintra

 

 

Notation :

   SCEtotale = somme des écarts totaux ou variation totale = N

   SCEinter = somme des écarts liés aux effets du facteur A ou variation inter (entre modalités)

   SCEintra = somme des écarts résiduelles ou variation intra (interne à chaque modalité)

 

 

 

 

Exemple : Distribution des valeurs de la variable « anxiété des sportifs » yij en fonction des niveaux de compétition pour 30 sportifs.

 : moyenne  pour chaque modalité i du facteur  en vert,

 : moyenne de l’ensemble des données

a: effet de la modalité i sur la variable yij

 

                       

 

 

3.3.3                 Le rapport de corrélation

Le rapport de corrélation donne la part de la variabilité totale des données expliquée par l’effet du facteur A :

                       h2 =

 

C’est un indice de liaison, pas nécessairement linéaire entre les variables étudiées qui varie entre 0 et 1. Il mesure la qualité de l’ajustement des effets du facteur au travers des moyennes.