Data Science definitions

0.0(0)
studied byStudied by 0 people
0.0(0)
full-widthCall Kai
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/46

encourage image

There's no tags or description

Looks like no tags are added yet.

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced

No study sessions yet.

47 Terms

1
New cards

Méthode scientifique

Processus systématique comprenant la formulation d’hypothèses ou de théories

2
New cards

Projet en science des données

Démarche structurée incluant la collecte des données

3
New cards

Données numériques

Données quantitatives exprimées sous forme de nombres utilisables pour les analyses mathématiques.

4
New cards

Variables primitives

Types de données simples (entier

5
New cards

Données structurées

Données organisées selon un schéma fixe comme des tables relationnelles.

6
New cards

Données semi-structurées

Données partiellement organisées à l’aide de balises ou clés comme JSON ou XML.

7
New cards

Données non structurées

Données sans structure formelle prédéfinie comme les textes libres ou images.

8
New cards

Loi normale

Distribution en cloche caractérisée par une moyenne et un écart-type arbitraires représentant souvent la distribution réelle de données naturelles.

9
New cards

Loi normale standard

Loi normale centrée en 0 avec un écart-type de 1 obtenue par standardisation des données.

10
New cards

Score Z

Nombre d’écarts-types séparant une valeur de la moyenne pouvant être positif ou négatif.

11
New cards

Variance

Mesure de la dispersion des données autour de la moyenne où une valeur élevée indique une distribution plus étalée.

12
New cards

Fonction de répartition

Probabilité qu’une variable aléatoire soit inférieure ou égale à une valeur donnée sous une distribution.

13
New cards

Indépendance

Situation où la probabilité d’un événement n’a aucun effet sur la probabilité d’un autre.

14
New cards

Probabilité conditionnelle

Probabilité d’un événement sachant qu’un autre événement s’est produit.

15
New cards

Addition des probabilités

Calcul donnant la probabilité que l’un ou l’autre de deux événements se produise.

16
New cards

Multiplication des probabilités

Calcul de la probabilité que plusieurs événements se produisent simultanément.

17
New cards

Théorème de Bayes

Méthode permettant de mettre à jour la probabilité d’une hypothèse à partir de nouvelles informations.

18
New cards

Addition de vecteurs

Somme des composantes correspondantes de deux vecteurs de même dimension.

19
New cards

Produit scalaire par une constante

Multiplication de chaque composante d’un vecteur par une valeur scalaire.

20
New cards

Norme d’un vecteur

Longueur d’un vecteur calculée à l’aide du théorème de Pythagore.

21
New cards

Addition de matrices

Somme des composantes correspondantes de deux matrices ayant les mêmes dimensions.

22
New cards

Multiplication de matrices

Opération combinant lignes et colonnes de matrices compatibles pour produire une nouvelle matrice.

23
New cards

Données brutes

Valeurs originales servant de base aux analyses et interprétations.

24
New cards

Métadonnées

Données décrivant les données brutes telles que leur unité

25
New cards

Métadonnées descriptives

Métadonnées facilitant l’identification et l’interprétation des données.

26
New cards

Métadonnées structurelles

Métadonnées décrivant l’organisation

27
New cards

Métadonnées administratives

Métadonnées utilisées pour la gestion

28
New cards

Nettoyage des données

Processus visant à corriger les erreurs

29
New cards

Standardisation des données

Harmonisation des formats

30
New cards

Validation des données

Vérification du respect de règles prédéfinies comme le type ou le format.

31
New cards

Vérification des données

Confirmation de l’exactitude des données par rapport à la réalité ou à la source.

32
New cards

Apprentissage supervisé

Méthode d’apprentissage automatique utilisant des données étiquetées pour prédire des sorties.

33
New cards

Apprentissage non supervisé

Méthode visant à découvrir des structures ou des patterns cachés dans les données.

34
New cards

Apprentissage par renforcement

Méthode d’apprentissage basée sur des récompenses et pénalités.

35
New cards

Fonction de coût

Mesure de l’erreur entre les prédictions d’un modèle et les valeurs réelles.

36
New cards

Gradient

Dérivée partielle indiquant la direction de variation maximale d’une fonction.

37
New cards

Régression linéaire

Modèle prédictif utilisant une droite pour estimer une variable continue.

38
New cards

Régression logistique

Méthode de classification binaire estimant la probabilité d’appartenance à une classe.

39
New cards

Régression polynomiale

Modèle ajustant un polynôme pour représenter des relations non linéaires.

40
New cards

Sous-apprentissage

Situation où le modèle est trop simple pour capturer la structure des données.

41
New cards

Sur-apprentissage

Situation où le modèle est trop complexe et apprend le bruit des données d’entraînement.

42
New cards

Série temporelle

Ensemble d’observations d’une variable mesurée à différents moments dans le temps.

43
New cards

Tendance

Mouvement général à long terme d’une série temporelle.

44
New cards

Saisonnalité

Répétition régulière de motifs à court terme dans une série temporelle.

45
New cards

Résidu

Partie imprévisible restante après retrait de la tendance et de la saisonnalité.

46
New cards

Transformation de Fourier

Méthode permettant de passer du domaine temporel au domaine fréquentiel.

47
New cards

Big Data

Ensembles de données massifs caractérisés par le volume