Le test du c2 d’indépendance constitue une autre formulation du test de comparaison de plusieurs distributions. Dans ce cas ce sont les distributions relatives à deux caractères (quantitatifs groupés en classe ou qualitatifs) présentant plusieurs modalités et définis sur une même population qui sont comparées. On fait l’hypothèse qu’il y a indépendance entre les deux caractères dans la population :
H0 : les deux caractères sont indépendants.
H1 : les deux caractères ne sont pas indépendants
.
· Les données sont structurées sous forme d’un tableau des effectifs observés pour les deux caractères comparés ou table de contingence.
|
Caractère A |
|||||||||
modalité 1 |
|
|
Modalité i |
|
|
modalité p |
total |
|
||
Caractère B |
modalité 1 |
n11 |
|
|
ni1 |
|
|
np1 |
n.1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
modalité j |
n1j |
|
|
nij |
|
|
npj |
n.j |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
modalité q |
n1q |
|
|
niq |
|
|
npq |
n.q |
|
|
Total |
n1. |
|
|
ni. |
|
|
np. |
n..= N |
|
avec l’effectif nij correspond au nombre d’individus ayant la modalité i du caractère A et la modalité j du caractère B avec 1 £ i £ p et 1 £ j £ q
l’effectif ni. est la somme des effectifs de la colonne i
l’effectif n.j est la somme des effectifs de la ligne j
l’effectif n.. est l’effectif total de la table de contingence
· Le tableau des effectifs attendus sous l’hypothèse H0 : indépendance entre le caractère A et le caractère B
|
Caractère A |
||||||||
modalité 1 |
|
|
modalité i |
|
|
modalité p |
Total |
||
Caractère B |
modalité 1 |
|
|
|
|
|
|
|
n.1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
modalité j |
|
|
|
|
|
|
|
n.j |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
modalité q |
|
|
|
|
|
|
|
n.q |
|
Total |
n1. |
|
|
ni. |
|
|
np. |
n..= N |
Sous H0, l’effectif attendu tij correspondant à la modalité i du caractère A (Ai) et à la modalité j du caractère B (Bj) peut être obtenu de la façon suivante :
P(Ai Ç Bj) = Pij = P(Ai) x P(Bj) sous H0 : indépendance entre les deux caractères
d’où Pij = = avec tij effectif attendu
d’où tij = N * Pij ainsi tij =
L’hypothèse testée est la suivante :
H0 : Indépendance entre le caractère A et le caractère B
H1 : Non indépendance entre le caractère A et le caractère B
p : nombre de colonnes, q : nombre de lignes
avec nij l’effectif observé et tij l’effectif théorique attendu sous H0
c2obs. est comparée avec la valeur seuil, c2seuil lue sur la table du c2
pour (p-1)(q-1)ddl (degrés de liberté) et pour un risque d’erreur a fixé.
· si c2obs. > c2seuil l’hypothèse H0 est rejetée au risque d’erreur a : il n’y a pas indépendance statistique entre les deux caractères étudiés dans la population.
· si c2obs. £ c2seuil l’hypothèse H0 est acceptée: les deux caractères étudiés dans la population sont statistiquement indépendants.
Remarque : | La statistique du Khi-deux c2 ne peut être calculée que si les effectifs théoriques tij sont supérieurs ou égaux à 5. |
Dans ce cas, il faut regrouper à la fois toute la ligne et toute la colonne correspond à la case possédant une valeur tij inférieur à 5. |
Exemple :
Sur un échantillon de la population française, on a noté pour chaque personne, la couleur des yeux et celle des cheveux (naturelle). Peut-on conclure à l’indépendance de ces deux caractères qualitatifs ? Réponse.
Cheveux Yeux |
Noirs |
Bruns |
Blonds |
Roux |
Marrons |
152 |
247 |
83 |
11 |
Vert-gris |
73 |
114 |
37 |
8 |
Bleus |
36 |
102 |
127 |
10 |