Pp ooooooooo kk ll
1ère S Statistiques – Collège de Juilly – H. Kerneïs
STATISTIQUES
1. Vocabulaire et notations
Dans ce chapitre, on considère des séries à caractères quantitatifs discrètes (sous forme « ponctuelle ») ou continues (sous forme d’intervalles) (avec, dans le cas d’une série continue, l’hypothèse d’une répartition uniforme à l’intérieur de chaque classe). On appelle population un ensemble depersonnes ou d’objets étudiés. Un individu est un élément de la population. La particularité de la population étudiée lors d’une étude statistique est appelée caractère ou variable. La valeur du caractère étudié se note xi. L’effectif correspondant à cette valeur se note ni. L’effectif total se note N. Et l’on a :
p i =1
n i = n1 + n 2 + … + n p = N .
Attention : Lorsque les caractères sontdéfinis sous forme d’intervalles (ie sous forme de classes), les calculs sont réalisés avec le centre des intervalles. La fréquence fi de la valeur xi est définie par : f i =
p i =1
ni . On a : N
f i = f 1 + f 2 + … f p = 1 .
Remarque : la fréquence est un réel compris entre 0 et 1, mais il peut aussi s’exprimer sous forme de pourcentage.
2. Paramètres de position
2.1.Caractéristiques de position de tendance centrale Ils permettent de dégager la tendance centrale de la série statistique étudiée. Définition 1 : La moyenne d’une série statistique se note x et vaut : n1 x 1 + n 2 x 2 + … + n p x p 1 p x= = nx . N i =1 i i N On l’appelle moyenne pondérée.
1
1ère S Statistiques – Collège de Juilly – H. Kerneïs
Remarques : i. La moyenne est le barycentre des nombrespondérés ( x 1 ; n1 ) , ( x 2 ; n 2 ) , …,
(x ; n ) .
p p
ii. Puisque la moyenne est un barycentre, on peut utiliser la propriété d’associativité du barycentre pour calculer la moyenne d’une série à partir des moyennes de séries partielles dont on connaît les effectifs. Définition 2 : Le mode est la valeur (ou les valeurs) du caractère de plus grand effectif. Pour un caractère continu, onparle de classe modale . Si les classes ont la même amplitude, la classe modale est la classe qui correspond au plus fort effectif. Définition 3 : La médiane est une valeur M du caractère qui partage la population ordonnée en deux sous-ensembles de même effectif. 2.1. Caractéristiques de position non centrale : les quartiles Définition 4 : Les quartiles sont les trois valeurs du caractère quipartagent les valeurs ordonnées du caractère en quatre sous-ensembles de même effectif. Le premier quartile, noté Q1, est la plus petite valeur de la série statistique telle qu’au moins 25 % des valeurs de celle-ci lui sont inférieures ou égales ; le deuxième est la médiane M et le troisième, noté Q3, est la plus petite valeur de la série statistique telle qu’au moins 75 % des valeurs de celle-ci luisont inférieures ou égales. On peut représenter cette disposition de la manière suivante :
Remarques : i. Une série admet trois quartiles ; le deuxième, dont on ne fait pas usage en première est associé à la valeur 50 %. ii. De nombreuses calculatrices considèrent les quartiles comme les médianes des deux séries obtenues après avoir partagé la série initiale par sa médiane… ce qui explique lesdifférences constatées. Dans la pratique, ces différences ont peu d’importance vu la taille des séries. iii. De la même façon, on peut définir des déciles d’une série statistique. Exemples de détermination : i. Dans le cas d’une série discrète, si
N est un entier, le premier quartile 4 N Q1 est la valeur qui dans cette liste occupe le rang et le troisième 4 3N N . Si quartile Q3 est la valeurqui dans cette liste occupe le rang 4 4
2
1ère S Statistiques – Collège de Juilly – H. Kerneïs
n’est pas un entier, le premier quartile Q1 est la valeur qui dans cette liste N occupe le rang immédiatement supérieur à et le troisième quartile 4 Q3 est la valeur qui dans cette liste occupe le rang immédiatement 3N . Par exemple : Le tableau suivant donne la répartition supérieur à 4 des…