Chapitre 8 : Test du c2

5         Tests du c2d’indépendance

5.1         Principe du test

Le test du c2 d’indépendance constitue une autre formulation du test de comparaison de plusieurs distributions. Dans ce cas ce sont les distributions relatives à deux caractères (quantitatifs groupés en classe ou qualitatifs) présentant plusieurs modalités  et définis sur une même population qui sont comparées. On fait l’hypothèse qu’il y a indépendance entre les deux caractères dans la population :

H0 : les deux caractères sont indépendants.

H1 : les deux caractères ne sont pas indépendants       

.

·  Les données sont structurées sous forme d’un tableau des effectifs observés pour les deux caractères comparés ou table de contingence.           

 

 

Caractère A

modalité

1

 

 

Modalité

       i

 

 

modalité

p

total

 

 

 

Caractère

B

modalité 1

n11

 

 

ni1

 

 

np1

n.1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

modalité j

n1j

 

 

nij

 

 

npj

n.j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

modalité q

n1q

 

 

niq

 

 

npq

n.q

 

Total

n1.

 

 

ni.

 

 

np.

n..= N

 

                                  

avec          l’effectif nij correspond au nombre d’individus ayant la modalité i du caractère A et la modalité  j du caractère B                        avec     1 £ i £ p et 1 £ j £ q

                  l’effectif ni. est la somme des effectifs de la colonne i

                 l’effectif n.j est la somme des effectifs de la ligne j

                  l’effectif n.. est l’effectif total de la table de contingence

 

·  Le tableau des effectifs attendus sous l’hypothèse H0 : indépendance entre le caractère A et le caractère B      

 

Caractère A

modalité 1

 

 

modalité i

 

 

modalité p

Total

 

 

 

 

 

 

Caractère

B

modalité 1

 

 

 

 

n.1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

modalité j

 

 

 

 

n.j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

modalité q

 

 

 

 

n.q

Total

n1.

 

 

ni.

 

 

np.

n..= N

                     

 

Sous H0, l’effectif attendu tij correspondant à la modalité i du caractère A (Ai) et à la modalité j du caractère B (Bj) peut être obtenu de la façon suivante :

       P(Ai Ç Bj) = Pij = P(Ai) x P(Bj)     sous H0 : indépendance entre les deux caractères

                        d’où     Pij =   =    avec tij effectif attendu

                           d’où     tij = N * Pij    ainsi      tij =

 

  

           L’hypothèse  testée est la suivante :  

                     H: Indépendance entre le caractère A et le caractère B

                                 H: Non indépendance entre le caractère A et le caractère B      

                                     p : nombre de colonnes, q : nombre de lignes

                                                                                         

                     avec nij l’effectif observé et tij l’effectif théorique attendu sous H0

                      c2obs. est comparée avec la valeur seuil, c2seuil lue sur    la table du c2

        pour (p-1)(q-1)ddl (degrés de liberté) et pour un risque d’erreur a fixé.  

 

 

            ·   si  c2obs. > c2seuil l’hypothèse H0 est rejetée au risque d’erreur a : il n’y a pas indépendance statistique entre les deux caractères étudiés dans la population.

·  si  c2obs. £ c2seuil l’hypothèse H0 est acceptée: les deux caractères étudiés dans la population sont statistiquement indépendants.

 

Remarque : La statistique du Khi-deux c2 ne peut être calculée que si les effectifs théoriques tij sont supérieurs ou égaux  à 5.

Dans ce cas, il faut regrouper à la fois toute la ligne et toute la colonne correspond à la case possédant une valeur tij  inférieur à 5.

 

Exemple :

Sur un échantillon de la population française, on a noté pour chaque personne, la couleur des yeux et celle des cheveux (naturelle). Peut-on conclure à l’indépendance de ces deux caractères qualitatifs ? Réponse.

     Cheveux

Yeux

Noirs

Bruns

Blonds

Roux

Marrons

152

247

83

11

Vert-gris

73

114

37

8

Bleus

36

102

127

10