1/17
Flashcards basées sur le cours d'exploration de données avec Pandas et Matplotlib, utilisant le jeu de données Mice Protein Expression.
Name | Mastery | Learn | Test | Matching | Spaced | Call with Kai |
|---|
No analytics yet
Send a link to your students to track their progress
Le jeu de données 'Mice Protein Expression' contient les niveaux d'expression de __________ protéines mesurés dans le cortex cérébral de 1080 souris.
77
Les souris trisomiques (Ts65Dn) constituent un modèle pour le __________ __________.
Syndrome de Down
Dans ce jeu de données, la __________ est un médicament testé pour voir s'il peut sauver les déficits d'apprentissage.
Memantine
Pour charger le fichier de données, la syntaxe correcte est : mice = pd.\_\_\_\_\_\_\_\_\_\_("data/mice_protein.csv").
read_csv
La méthode __________ montre le nombre de lignes, de colonnes, les types de données et les décomptes de valeurs non nulles.
info()
Pour calculer des statistiques descriptives sur des colonnes de type chaîne de caractères (catégorielles), on utilise : mice.describe(include=\_\_\_\_\_\_\_\_\_\_).
"object"
Si le 'count' affiché par describe() est inférieur à 1080 pour une protéine, cela signifie que la colonne contient des __________.
valeurs manquantes (NaN)
La fonction __________ compte les occurrences de chaque valeur unique dans une colonne.
value_counts()
Pour trier un DataFrame par ordre décroissant selon une colonne, on utilise mice.sort_values(by, ascending=\_\_\_\_\_\_\_\_\_\_).
False
L'opérateur __________ sélectionne des données en utilisant des étiquettes explicites (index de ligne et nom de colonne).
loc
L'opérateur __________ sélectionne des données en utilisant des positions entières.
iloc
Pour combiner deux conditions de filtrage où les deux doivent être vraies, on utilise le symbole __________.
&
La méthode __________ divise les données en groupes, applique une fonction (comme la moyenne) et combine les résultats.
groupby()
Pour appliquer plusieurs fonctions d'agrégation d'un coup (comme mean, std, count), on utilise la méthode __________.
agg()
L'outil visuel qui structures les données, détecte les anomalies et souligne les liens entre variables s'appelle l'__________ (EDA).
Exploratory Data Analysis
Dans Matplotlib, l'instruction fig, ax = \_\_\_\_\_\_\_\_\_\_ crée une figure et un objet Axes.
plt.subplots()
Un __________ montre la distribution d'une variable quantitative, optionnellement groupée par une variable catégorielle.
boxplot
Pour ajouter un titre à un graphique en utilisant l'objet Axes, on utilise la méthode ax.\_\_\_\_\_\_\_\_\_\_.
set_title()