1/46
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced |
|---|
No study sessions yet.
Méthode scientifique
Processus systématique comprenant la formulation d’hypothèses ou de théories
Projet en science des données
Démarche structurée incluant la collecte des données
Données numériques
Données quantitatives exprimées sous forme de nombres utilisables pour les analyses mathématiques.
Variables primitives
Types de données simples (entier
Données structurées
Données organisées selon un schéma fixe comme des tables relationnelles.
Données semi-structurées
Données partiellement organisées à l’aide de balises ou clés comme JSON ou XML.
Données non structurées
Données sans structure formelle prédéfinie comme les textes libres ou images.
Loi normale
Distribution en cloche caractérisée par une moyenne et un écart-type arbitraires représentant souvent la distribution réelle de données naturelles.
Loi normale standard
Loi normale centrée en 0 avec un écart-type de 1 obtenue par standardisation des données.
Score Z
Nombre d’écarts-types séparant une valeur de la moyenne pouvant être positif ou négatif.
Variance
Mesure de la dispersion des données autour de la moyenne où une valeur élevée indique une distribution plus étalée.
Fonction de répartition
Probabilité qu’une variable aléatoire soit inférieure ou égale à une valeur donnée sous une distribution.
Indépendance
Situation où la probabilité d’un événement n’a aucun effet sur la probabilité d’un autre.
Probabilité conditionnelle
Probabilité d’un événement sachant qu’un autre événement s’est produit.
Addition des probabilités
Calcul donnant la probabilité que l’un ou l’autre de deux événements se produise.
Multiplication des probabilités
Calcul de la probabilité que plusieurs événements se produisent simultanément.
Théorème de Bayes
Méthode permettant de mettre à jour la probabilité d’une hypothèse à partir de nouvelles informations.
Addition de vecteurs
Somme des composantes correspondantes de deux vecteurs de même dimension.
Produit scalaire par une constante
Multiplication de chaque composante d’un vecteur par une valeur scalaire.
Norme d’un vecteur
Longueur d’un vecteur calculée à l’aide du théorème de Pythagore.
Addition de matrices
Somme des composantes correspondantes de deux matrices ayant les mêmes dimensions.
Multiplication de matrices
Opération combinant lignes et colonnes de matrices compatibles pour produire une nouvelle matrice.
Données brutes
Valeurs originales servant de base aux analyses et interprétations.
Métadonnées
Données décrivant les données brutes telles que leur unité
Métadonnées descriptives
Métadonnées facilitant l’identification et l’interprétation des données.
Métadonnées structurelles
Métadonnées décrivant l’organisation
Métadonnées administratives
Métadonnées utilisées pour la gestion
Nettoyage des données
Processus visant à corriger les erreurs
Standardisation des données
Harmonisation des formats
Validation des données
Vérification du respect de règles prédéfinies comme le type ou le format.
Vérification des données
Confirmation de l’exactitude des données par rapport à la réalité ou à la source.
Apprentissage supervisé
Méthode d’apprentissage automatique utilisant des données étiquetées pour prédire des sorties.
Apprentissage non supervisé
Méthode visant à découvrir des structures ou des patterns cachés dans les données.
Apprentissage par renforcement
Méthode d’apprentissage basée sur des récompenses et pénalités.
Fonction de coût
Mesure de l’erreur entre les prédictions d’un modèle et les valeurs réelles.
Gradient
Dérivée partielle indiquant la direction de variation maximale d’une fonction.
Régression linéaire
Modèle prédictif utilisant une droite pour estimer une variable continue.
Régression logistique
Méthode de classification binaire estimant la probabilité d’appartenance à une classe.
Régression polynomiale
Modèle ajustant un polynôme pour représenter des relations non linéaires.
Sous-apprentissage
Situation où le modèle est trop simple pour capturer la structure des données.
Sur-apprentissage
Situation où le modèle est trop complexe et apprend le bruit des données d’entraînement.
Série temporelle
Ensemble d’observations d’une variable mesurée à différents moments dans le temps.
Tendance
Mouvement général à long terme d’une série temporelle.
Saisonnalité
Répétition régulière de motifs à court terme dans une série temporelle.
Résidu
Partie imprévisible restante après retrait de la tendance et de la saisonnalité.
Transformation de Fourier
Méthode permettant de passer du domaine temporel au domaine fréquentiel.
Big Data
Ensembles de données massifs caractérisés par le volume