Statistique descriptive : variables ordinales

Statistique descriptive : variables ordinales
? Remarque : les variables quantitatives pouvant être traitées comme ordinales, ce chapitre concerne aussi les variables quantitatives.

I NOTION D’ORDRE
Des données (numériques ou non) sont dites ordonnées lorsqu’on peut les classer, de la plus petite à la plus grande (ou de la plus grande à la plus petite). Les deux principales propriétés d’unclassement sont l’antisymétrie et la transitivité. I-1 L’ANTISYMETRIE : Si a est plus petit que b et b est plus petit que a, alors a est égal à b. (Ainsi par exemple, si Jean est de taille inférieure à Paul, et Paul de taille inférieure à Jean, alors Jean et Paul ont la même taille.) I-2 LA TRANSITIVITE : Si a est plus petit que b et b est plus petit que c, alors a est plus petit que c. (Ainsi parexemple, si Jean est de taille inférieure à Paul et Paul de taille inférieure à René, alors Jean est de taille inférieure à René.)

II VARIABLES ORDINALES
II-1 DEFINITION Une variable est dite ordinale lorsque ses modalités peuvent être naturellement ordonnées. II-2
EXEMPLES

? 1er exemple Considérons sur une population de personnes, la variable « Taille », qui associe à chaque personne, l’undes trois adjectifs « petit », « moyen », « grand », suivant une convention établie à l’avance. On a bien ici, un ordre naturel entre les trois modalités. La variable taille ainsi définie est donc une variable ordinale. ? 2ème exemple En prenant maintenant pour population l’ensemble des départements Français, on construit la variable « Numéro » qui associe à chaque département sont numéro. Les modalitéssont ici des nombres, mais il s’agit là d’un simple codage lié à l’ordre alphabétique des noms donnés aux départements. (Il aurait suffit d’appeler autrement le département du Tarn pour que son numéro change.) La variable Numéro n’est donc pas une variable ordinale, c’est une variable nominale.

1

? 3ème exemple Prenons enfin comme population un ensemble de couleurs. Une personne classe lescouleurs de la plus claire à la plus sombre. On peut alors considérer la variable « Nuance » qui associe à chaque couleur son numéro d’ordre dans le classement réalisé précédemment. Les modalités sont ici naturellement ordonnées ; la variable Nuance est donc ordinale. Il est à noter qu’ici la variable dépend de la personne ayant réalisé le classement. En effet, pour des nuances très proches deuxpersonnes peuvent avoir des visions différentes. il s’agit donc d’un ordre naturel, mais pour une personne donnée.

III UN INDICE DE TENDANCE CENTRALE POUR LES VARIABLES ORDINALES : LA MEDIANE
III-1 PRINCIPE GENERAL Étant donné une variable ordinale sur une population ? de taille N, on cherche la donnée (que l’on appellera « médiane ») située au milieu de la liste des données écrites par ordrecroissant. On a ainsi constitué 2 groupes de données de même taille: celui dont les données sont inférieures (ou égales) à la médiane, et celui dont les données sont supérieures (ou égales) à la médiane. La médiane sera la donnée située « au milieu » de la liste des données écrites par ordre croissant. III-2
EXEMPLES

? 1er exemple Considérons une population composée de 11 personnes, et la variable Agequi associe à chaque individu son âge en nombre d’années révolues. Voici la liste des âges : 8 9 15 20

21

12

15

16

22

25

13

On cherche maintenant l’âge situé au milieu de la liste des données. Cet âge va permettre de partager les données en deux groupes de même taille, un groupe dont les données sont inférieures à cet âge et un groupe dont les données sont supérieures. Ilsuffit donc pour déterminer cet âge (appelé âge médian), d’écrire la liste des données par ordre croissant : 8 9 12 13 15 15 16 20 21 22 25 Il y a ici 11 données, la donnée située au milieu de cette liste est donc la 6ème donnée : c’est donc 15 ans ( le deuxième 15 de notre liste). On a donc bien 5 données avant l’âge médian, et 5 données après l’âge médian. Les données sont donc bien partagées…