Chapitre 5 : Statistique descriptive

 

3          Les caractères statistiques

3.1         Définition

On appelle caractère statistique simple toute application :

                                   X : P  ® ­R

avec P un ensemble fini appelé population ; tout élément w de P s’appelle un individu.

 

 

Le caractère désigne une grandeur ou un attribut, observable sur un individu et susceptible de varier prenant ainsi différents états appelés modalités.

On appelle modalité toute valeur :

                        xi Î X (P)

telle que : X (P) = {x1 ,x2 ,x3 ,….., xi ,…., xk} avec k nombre de modalités différentes de X

 

 

Remarque : Seuls les caractères quantitatifs ont valeurs dans R, les caractères qualitatifs s’y ramenant par un codage.

 

Exemple :

Lors des recensements, les caractères étudiés sont l’âge, le sexe, la qualification professionnel, etc. Le caractère « sexe » présente deux modalités alors que pour la qualification professionnelle, le nombre de modalités va dépendre de la précision recherchée.

 

3.1.1                    Les caractères qualitatifs

 

Mesurées dans une échelle nominale, les modalités sont exprimables par des noms et ne sont pas hiérarchisées. Un caractère nominal peut être dichotomique  s’il ne peut prendre que deux modalités.

Exemple: la couleur du pelage, les groupes sanguins, les différents nucléotides de l’ADN, la présence ou l’absence d’un caractère (dichotomique), etc.

 

Mesurées dans une échelle ordinale: les modalités traduisent le degré d’un état caractérisant un individu sans que ce degré ne puisse être défini par un nombre qui résulte d’une mesure. Les modalités sont alors hiérarchisées.

Exemple: le stade d’une maladie.

 

Certains tests (non vus dans ce cours) permettent de profiter de cette information et sont alors plus puissants que des tests sur variable nominale.

 

3.1.2                   Les caractères quantitatifs

 

Le caractère est discret s’il peut prendre seulement certaines valeurs dans un intervalle donné. En général il résulte d’un comptage ou dénombrement.

Exemple : le nombre de petits par portée, le nombre de cellules dans une culture, le nombre d’accidents pour une période donnée, etc.

 

Remarque : Attention, un caractère quantitatif discret peut résulter de la transformation d’un caractère nominal (ex. comptage des individus porteurs ou non d’un caractère).

 

Le caractère est continu s’il peut théoriquement prendre n’importe quelle valeur dans un intervalle donné. En général il résulte d’une mesure.

Exemple : le poids, la taille, le taux de glycémie, le rendement, etc.

 

Remarque : En réalité le nombre de valeurs possibles pour un caractère donné dépend de la précision de la mesure. On peut considérer comme continu un caractère discret qui peut prendre un grand nombre de valeurs.

Exemple  : le nombre de globules blancs ou rouges par ml de sang, le nombre de nucléotides A dans une très longue séquence d’ADN (plusieurs Mégabases) .

 

3.2       Liens avec les concepts probabilistes

Les concepts qui viennent d’être présentés sont les homologues de concepts du calcul des probabilités et il est possible de disposer en regard les concepts homologues (voir table ci-dessous).

 

Probabilités
Statistique

Espace fondamental

Epreuve

Evènement élémentaire

Variable aléatoire

Epreuves répétées

Nbre de répétitions d’une épreuve

Probabilité

Loi de probabilité

Espérance mathématique

Variance

Population

Tirage (d’un individu), expérimentation

Individu, observation

Caractère

Echantillonnage

Taille de l’échantillon, effectif total

Fréquence observée

Distribution observée ou loi empirique

Moyenne observée

Variance observée

 

Ainsi la notion de caractère se confond avec celle de variable aléatoire.