L2
distribution
répartition des valeurs d’une variable entre les individus de la population
effective ou fréquence
le nombre ni d’individus correspondant à chaque xi . L’effectif total est alors n = n1 +...+ nk .
fréquence relative de xi :
→utile pour comparer des échantillons de tailles différentes. On a f1 +...+ fk = 1
fréquence cumulée pour la valeur xi
si les xi sont ordonnés de manière croissante, la quantité f i cum = f1 +...+ f i
tableau de contingence
un tableau à double entrée
diagrammes en barres
histogramme
→ Représenter les effectifs dans chaque classe
→ Alternative: Représenter la fréquence relative ds cq classe
→ Alternative: Représenter la fréquence cumulée ds cq classe
la moyenne
est la quotient de la somme de pls valeurs par leur nb.
quartiles
séparent l’échantillon en 4 groupes d’effectifs égaux ou quasi égaux, correspondant à 25 % de l’effectif.
dans l’ordre croissant , cf calcul
Si le quartile est non entier, alors
moyenne pondérée de 2 données adjacentes
Q0
valeur minimale xmin
Q4
valeur maximale xmax
Q2
= médiane de l’échantillon (50% de l’effectif se situe en-dessous, 50% au-dessus). C’est la 2 ème valeur ordonnée, donc la valeur "du milieu" si n est impair et la moyenne entre deux valeurs si n est pair
exemple de quartile
boîte à moustache
représentation graphique des quartiles
la variance
donne une idée de l’écart typique entre l’échantillon et sa moyenne. Elle est définie intuitivement comme la moyenne des carrés des écarts à la moyenne, et s’obtient comme la somme des (xi − x)^ 2 divisée par n −1 :
écart -type
correspond à la racine carrée de la variance s
avec une unité
étendue
écart entre les 2 valeurs extrêmes xmax - xmin (QA-Q0)
écart interquartile
écart entre les 1er et 3eme quartiles : Q3 -Q1
Si le rang se termine par 0.25, alors le quartile est la moyenne entre la valeur du rang inférieur affectée du coefficient 3 et de la valeur du rang supérieur affectée du coefficient 1
exemple
Si le rang se termine par 0.75, alors le quartile est la moyenne entre la valeur du rang inférieur affectée du coefficient 1 et de la valeur du rang supérieur affectée du coefficient 3
exemple
Si le rang se termine par 0.5, alors le quartile est la moyenne entre la valeur du rang inférieur et celle du rang supérieur affectée (sans coefficient).
pas exemple
nuage de points
représentation graphique d’un échantillon de la forme (x1 ,y1 ),...,(xn ,yn ). Il permet de mettre en évidence le type et le degré de liaison entre les deux variables.
si on observe une dépendance, une relation entre les 2 variables quantitatives alors
x et y sont liées / corrélées
liaison linéaire positive forte
liaison linéaire négative faible
liaison monotone positive
liaison monotone négative
liaison non linéaire et non monotone
absence de lien
droite de régression
liaison linéaire
a est coef directeur
quelle est la diff entre la variance et l’écart-type ?
la variance est une mesure qui permet de tenir compte de la dispersion de toutes les valeurs d’un ensemble de données. C’est la mesure de dispersion la plus couramment utilisée, de même que l’écart-type, qui correspond à la racine carrée de la variance.