Data Science - Exploration de Données

0.0(0)
Studied by 0 people
call kaiCall Kai
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/17

flashcard set

Earn XP

Description and Tags

Flashcards basées sur le cours d'exploration de données avec Pandas et Matplotlib, utilisant le jeu de données Mice Protein Expression.

Last updated 7:34 PM on 6/19/26
Name
Mastery
Learn
Test
Matching
Spaced
Call with Kai

No analytics yet

Send a link to your students to track their progress

18 Terms

1
New cards

Le jeu de données 'Mice Protein Expression' contient les niveaux d'expression de __________ protéines mesurés dans le cortex cérébral de 1080 souris.

77

2
New cards

Les souris trisomiques (Ts65DnTs65Dn) constituent un modèle pour le __________ __________.

Syndrome de Down

3
New cards

Dans ce jeu de données, la __________ est un médicament testé pour voir s'il peut sauver les déficits d'apprentissage.

Memantine

4
New cards

Pour charger le fichier de données, la syntaxe correcte est : mice = pd.\_\_\_\_\_\_\_\_\_\_("data/mice_protein.csv").

read_csv

5
New cards

La méthode __________ montre le nombre de lignes, de colonnes, les types de données et les décomptes de valeurs non nulles.

info()

6
New cards

Pour calculer des statistiques descriptives sur des colonnes de type chaîne de caractères (catégorielles), on utilise : mice.describe(include=\_\_\_\_\_\_\_\_\_\_).

"object"

7
New cards

Si le 'count' affiché par describe() est inférieur à 1080 pour une protéine, cela signifie que la colonne contient des __________.

valeurs manquantes (NaN)

8
New cards

La fonction __________ compte les occurrences de chaque valeur unique dans une colonne.

value_counts()

9
New cards

Pour trier un DataFrame par ordre décroissant selon une colonne, on utilise mice.sort_values(by, ascending=\_\_\_\_\_\_\_\_\_\_).

False

10
New cards

L'opérateur __________ sélectionne des données en utilisant des étiquettes explicites (index de ligne et nom de colonne).

loc

11
New cards

L'opérateur __________ sélectionne des données en utilisant des positions entières.

iloc

12
New cards

Pour combiner deux conditions de filtrage où les deux doivent être vraies, on utilise le symbole __________.

&

13
New cards

La méthode __________ divise les données en groupes, applique une fonction (comme la moyenne) et combine les résultats.

groupby()

14
New cards

Pour appliquer plusieurs fonctions d'agrégation d'un coup (comme mean, std, count), on utilise la méthode __________.

agg()

15
New cards

L'outil visuel qui structures les données, détecte les anomalies et souligne les liens entre variables s'appelle l'__________ (EDA).

Exploratory Data Analysis

16
New cards

Dans Matplotlib, l'instruction fig, ax = \_\_\_\_\_\_\_\_\_\_ crée une figure et un objet Axes.

plt.subplots()

17
New cards

Un __________ montre la distribution d'une variable quantitative, optionnellement groupée par une variable catégorielle.

boxplot

18
New cards

Pour ajouter un titre à un graphique en utilisant l'objet Axes, on utilise la méthode ax.\_\_\_\_\_\_\_\_\_\_.

set_title()