On appelle caractère statistique simple toute application :
X : P ® R
avec P un ensemble fini appelé population ; tout élément w de P s’appelle un individu.
Le caractère désigne une grandeur ou un attribut, observable sur un individu et susceptible de varier prenant ainsi différents états appelés modalités.
On appelle modalité toute valeur :
xi Î X (P)
telle que : X (P) = {x1 ,x2 ,x3 ,….., xi ,…., xk} avec k nombre de modalités différentes de X
Remarque : | Seuls les caractères quantitatifs ont valeurs dans R, les caractères qualitatifs s’y ramenant par un codage. |
Exemple :
Lors des recensements, les caractères étudiés sont l’âge, le sexe, la qualification professionnel, etc. Le caractère « sexe » présente deux modalités alors que pour la qualification professionnelle, le nombre de modalités va dépendre de la précision recherchée.
Mesurées dans une échelle nominale, les modalités sont exprimables par des noms et ne sont pas hiérarchisées. Un caractère nominal peut être dichotomique s’il ne peut prendre que deux modalités.
Exemple: la couleur du pelage, les groupes sanguins, les différents nucléotides de l’ADN, la présence ou l’absence d’un caractère (dichotomique), etc.
Mesurées dans une échelle ordinale: les modalités traduisent le degré d’un état caractérisant un individu sans que ce degré ne puisse être défini par un nombre qui résulte d’une mesure. Les modalités sont alors hiérarchisées.
Exemple: le stade d’une maladie.
Certains tests (non vus dans ce cours) permettent de profiter de cette information et sont alors plus puissants que des tests sur variable nominale.
Le caractère est discret s’il peut prendre seulement certaines valeurs dans un intervalle donné. En général il résulte d’un comptage ou dénombrement.
Exemple : le nombre de petits par portée, le nombre de cellules dans une culture, le nombre d’accidents pour une période donnée, etc.
Remarque : | Attention, un caractère quantitatif discret peut résulter de la transformation d’un caractère nominal (ex. comptage des individus porteurs ou non d’un caractère). |
Le caractère est continu s’il peut théoriquement prendre n’importe quelle valeur dans un intervalle donné. En général il résulte d’une mesure.
Exemple : le poids, la taille, le taux de glycémie, le rendement, etc.
Remarque : | En réalité le nombre de valeurs possibles pour un caractère donné dépend de la précision de la mesure. On peut considérer comme continu un caractère discret qui peut prendre un grand nombre de valeurs. |
Exemple : le nombre de globules blancs ou rouges par ml de sang, le nombre de nucléotides A dans une très longue séquence d’ADN (plusieurs Mégabases) .
Les concepts qui viennent d’être présentés sont les homologues de concepts du calcul des probabilités et il est possible de disposer en regard les concepts homologues (voir table ci-dessous).
Probabilités |
Statistique |
Espace fondamental Epreuve Evènement élémentaire Variable aléatoire Epreuves répétées Nbre de répétitions d’une épreuve Probabilité Loi de probabilité Espérance mathématique Variance |
Population Tirage (d’un individu), expérimentation Individu, observation Caractère Echantillonnage Taille de l’échantillon, effectif total Fréquence observée Distribution observée ou loi empirique Moyenne observée Variance observée |
Ainsi la notion de caractère se confond avec celle de variable aléatoire.