1/41
Jeu de cartes couvrant définitions, méthodes de calcul, conditions d’utilisation et interprétation des principaux paramètres de position, de dispersion ainsi que la règle 68-95-99,7 de la loi normale.
Name | Mastery | Learn | Test | Matching | Spaced |
---|
No study sessions yet.
Qu’est-ce que la moyenne arithmétique et à quels types de données s’applique-t-elle ?
C’est la somme des valeurs divisée par leur nombre ; elle ne peut être calculée que pour des données métriques (quantitatives).
Comment calcule-t-on la moyenne arithmétique pour des données brutes ?
Σx / N (on additionne toutes les données puis on divise par l’effectif total).
Comment obtient-on la moyenne pour des données groupées en classes ?
On prend le centre de chaque classe comme valeur représentative puis on applique Σ(ck × fk)/N.
Quand utilise-t-on la moyenne pondérée et quelle est sa formule générale ?
Quand chaque donnée porte un coefficient de pondération ; formule : Σ(wi × xi)/Σw_i.
Que représente le mode pour des données listées ?
La valeur qui possède la fréquence absolue la plus élevée.
Comment détermine-t-on le mode dans une distribution en classes ?
On repère la classe de fréquence maximale (classe modale) et on prend son centre comme mode.
Que signifie « classe modale » ?
La classe dont l’effectif (ou la fréquence) est le plus grand.
Dans un tableau Hommes 75 / Femmes 25, quel est le mode ?
La catégorie « Hommes », car elle a l’effectif le plus élevé.
Définition de la médiane.
Valeur qui partage la distribution en deux parts égales : 50 % des observations lui sont ≤, 50 % ≥.
Comment trouver la médiane si N est impair ?
Elle est la donnée de rang (N + 1)/2 dans la série ordonnée.
Comment trouver la médiane si N est pair ?
C’est la moyenne des données de rang N/2 et N/2 + 1.
Comment estime-t-on la médiane pour des données groupées ?
On repère la classe où se situe le 50 % cumulé puis on en prend le centre (ou on interpole linéairement).
Qu’est-ce que le premier quartile (Q1) et quel est son rang ?
Valeur en-dessous de laquelle se trouvent 25 % des données ; rang (N + 1)/4 dans les données triées.
Comment calcule-t-on le troisième quartile (Q3) et le cinquième décile (D5) ?
Q3 : rang 3(N + 1)/4 ; D5 : rang 5(N + 1)/10 avec interpolation si besoin.
Dans une série de 15 valeurs, quel est le rang de la médiane ?
(15 + 1)/2 = 8 ; la médiane est la 8ᵉ valeur ordonnée.
Dans une série de 23 valeurs, quel est le rang de Q3 ?
3(23 + 1)/4 = 18 ; Q3 est la 18ᵉ valeur ordonnée.
Pourquoi la moyenne n’est-elle pas appropriée pour des données nominales ?
Parce que ces données ne sont pas numériques et l’addition n’a aucun sens.
Quel paramètre de position est utilisable pour des données nominales ?
Le mode (catégorie modale).
Quel indicateur de dispersion mesure simplement l’écart entre valeur min et valeur max ?
L’étendue des données (Range).
Pourquoi l’étendue est-elle un indicateur de dispersion peu informatif ?
Elle ne tient compte que de deux observations et ignore la distribution intermédiaire.
Définition et formule de l’écart moyen.
Moyenne algébrique des écarts (x – moyenne) : Σ(x – μ)/N.
Pourquoi l’écart moyen peut-il être nul alors qu’il existe une dispersion ?
Les écarts positifs compensent exactement les écarts négatifs autour de la moyenne.
Qu’est-ce que l’écart absolu moyen ?
Moyenne des valeurs absolues des écarts : Σ|x – μ|/N.
Quels sont les deux avantages de l’Écart Quadratique Moyen (EQM) ?
Évite la compensation des signes et donne plus de poids aux valeurs extrêmes (écarts au carré).
Quelle relation lie EQM, variance et écart-type ?
Pour un échantillon, EQM = Σ(x – μ)²/N ; Variance = Σ(x – μ)²/(N–1) ; Écart-type = √Variance.
Formule de la variance d’un échantillon de taille N.
s² = Σ(x – μ)²/(N – 1).
Propriétés principales de l’écart-type.
Toujours positif, tient compte de toutes les données, sensible aux extrêmes, exprimé dans l’unité des données.
Comment interpréter la taille de l’écart-type par rapport à l’homogénéité ?
Petit σ → distribution homogène ; grand σ → distribution hétérogène.
Qu’est-ce que le coefficient de variation (CV) et quand l’utiliser ?
CV = σ/μ ; utile pour comparer la dispersion de distributions ayant des moyennes ou des unités différentes.
Que suggère un CV plus faible ?
Une plus grande homogénéité relative des données.
Donnez la règle empirique 68-95-99,7 pour la loi normale.
≈68 % des données entre μ ± σ ; 95 % entre μ ± 2σ ; 99,7 % entre μ ± 3σ.
Dans une loi normale, quel pourcentage de valeurs se situe entre μ et μ + σ ?
La moitié de 68,26 %, soit ≈34,13 %.
Pourquoi la variance ne peut-elle pas être négative ?
Elle est basée sur la somme de carrés, toujours positive ou nulle.
L’écart-type est-il exprimé dans la même unité que les données ?
Oui, contrairement à la variance qui est au carré de l’unité.
Peut-on calculer un écart-type pour des données ordinales ?
Non, car leurs écarts n’ont pas de sens métrique fiable.
Quel indicateur utiliser pour comparer l’homogénéité de groupes exprimés dans des unités différentes ?
Le coefficient de variation (CV).
Pour l’échantillon « âge vs temps en MRS », quel aspect est le plus homogène et pourquoi ?
L’âge, car CV = 5/82 ≈ 0,06 est plus faible que CV temps = 3/11 ≈ 0,27.
Parmi cinq groupes dont les écarts-types sont 2, 5, 3, 1, 4, lequel est le plus homogène ?
Le groupe D (σ = 1) a la plus faible dispersion.
Parmi ces mêmes groupes, lequel est le moins homogène ?
Le groupe B (σ = 5) a la dispersion la plus élevée.
Quel pourcentage de données se trouvent au-delà de μ + 2σ dans une loi normale ?
(100 % – 95,44 %)/2 ≈ 2,28 %.
Si une note suit N(57, 5), quel pourcentage est supérieur à 62 ?
15,87 % (valeur au-delà de μ + σ).
Pourquoi l’écart moyen est-il considéré comme un mauvais indice de dispersion ?
Parce qu’il peut s’annuler par compensation et ne reflète pas l’amplitude réelle des écarts.