Chapitre 2 : analyse en composantes principales

0.0(0)
Studied by 0 people
call kaiCall Kai
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
GameKnowt Play
Card Sorting

1/56

encourage image

There's no tags or description

Looks like no tags are added yet.

Last updated 7:35 PM on 3/21/26
Name
Mastery
Learn
Test
Matching
Spaced
Call with Kai

No analytics yet

Send a link to your students to track their progress

57 Terms

1
New cards

Pourquoi utilise-t-on l’analyse en composantes principales (ACP) ?

Elle permet de projeter des données de grande dimension dans un espace de dimension plus faible afin de visualiser et analyser plus facilement les données

2
New cards

Comment représente-t-on les données en analyse en composantes principales (ACP) ?

On représente les données par une matrice X de taille N × p où N est le nombre d’individus et p est le nombre de variables statistiques

3
New cards

Comment définit-on les poids des individus en analyse de données ?

On définit un poids pi ≥ 0 pour chaque individu avec

Σi=1N pi = 1,

et on prend souvent pi = 1/N pour tous les individus ;

4
New cards

Comment définit-on le point moyen (centre de gravité) en analyse de données ?

Le point moyen g est défini par g = (x̄₁, …, x̄ₚ) où chaque coordonnée x̄_k est la moyenne pondérée des valeurs de la variable k : x̄_k = Σ_{i=1}^{N} p_i x_i^k ;

5
New cards

Comment définit-on le point moyen (centre de gravité) en analyse de données ?

Le point moyen g est défini par g = (x̄₁, …, x̄ₚ) où chaque coordonnée x̄k est la moyenne pondérée des valeurs de la variable k : x̄k = Σi=1N pi xik ;

6
New cards

Définition : Que sont les données centrées ?

Les données centrées sont obtenues en soustrayant la moyenne de chaque variable : yik = xik − x̄k ;

en notation matricielle : Y = X − 1 gT ;

7
New cards

Propriété : Comment s’écrit la matrice des données centrées ?

Y = (I − 1T Dp) X

I est la matrice identité,

1 le vecteur de 1 et

Dp la matrice diagonale des poids pi.

8
New cards

Propriété : Comment s’écrit la matrice de variance-covariance ?

V = XT Dp X − g gT.

9
New cards

Définition : Comment définit-on le coefficient de corrélation linéaire entre les variables k et l ?

rkl = σkl / (σk · σl)

10
New cards

Définition : Qu’est-ce que la matrice des données centrées réduites Z ?

Z = (zᵢᵏ) avec zᵢᵏ = (xᵢᵏ − x̄ₖ) / σₖ

11
New cards

Définition : Qu’est-ce que l’inertie totale d’un nuage de points ? (Ig )

Ig = Σi=1N pi (xi − g)T (xi − g) = Σi=1N pi |xi − g|2

12
New cards

Définition : Comment définit-on l’inertie en un point a ?

Ia = Σi=1N pi (xi − a)T (xi − a)

13
New cards

Définition : Quel est l’objectif de l’ACP ?

L’ACP a pour but de déterminer un sous-espace de dimension q dans lequel la projection du nuage de points a une inertie maximale.

14
New cards

Propriété : Relation entre l’inertie en a et l’inertie totale.

Ia = Ig + |g − a|2.
Propriété : Expression de l’inertie totale avec les distances entre individus.

15
New cards

Propriété : Comment s’exprime l’inertie totale au centre de gravité g ?

Ig = tr(V) où tr(V) est la trace de la matrice de variance-covariance V.

16
New cards

Définition : Qu’est-ce que l’espace des variables ? Quel est le produit scalaire associé ?

p est l’espace de représentation des variables.

On y définit le produit scalaire ⟨xk, xl⟩ = (xk)T Dp xl = Σi=1N pi xik xil

17
New cards

Remarque : Que représente la norme d’une variable dans cet espace ?

On a ||xk||2 = σk2 : la norme au carré d’une variable correspond à sa variance.

18
New cards

Interprétation : Que représente le cosinus entre deux variables ?

cos(xk, xl) = ⟨xk, xl⟩ /(||xk|| ||xl||) = σkl/(σk σl) = rkl.

Il correspond au coefficient de corrélation entre les variables k et l.

19
New cards

Définition : Qu’est-ce que l’espace des variables ? Quel est le produit scalaire associé ainsi que la norme ?

p est l’espace de représentation des variables. On y définit le produit scalaire ⟨xᵏ, xˡ⟩ = (xᵏ)ᵀ Dₚ xˡ = Σᵢ₌₁ᴺ pᵢ xᵢᵏ xᵢˡ

Remarque : la norme d’une variable xᵏ dans cet espace est :
‖xᵏ‖ = √(Σᵢ₌₁ᴺ pᵢ (xᵢᵏ)²)

20
New cards

Conséquence : Que représente-t-on dans le cercle des corrélations (espace des variables) ?

Dans l’espace des variables, on représente les variables comme des vecteurs plutôt que comme des points, et on s’intéresse aux angles entre ces vecteurs.

21
New cards
Qu’est-ce que l’analyse factorielle ?
Une méthode qui consiste à trouver des directions maximisant l’inertie des données projetées
22
New cards
Quelles hypothèses fait-on sur les données en analyse factorielle ?
Elles sont centrées et réduites
23
New cards

Quelle propriété importante possède la matrice V ?

Elle est symétrique définie positive V = R

24
New cards
Que permet cette propriété de la matrice V ?
Elle peut être diagonalisée et admet des valeurs propres et vecteurs propres
25
New cards
Dans le cas d = 1, que cherche-t-on ?
La direction qui maximise l’inertie des données projetées
26
New cards
Que représentent les valeurs propres λ₁ ≥ λ₂ ≥ ... ≥ λp ≥ 0 ?
L’importance de l’inertie selon chaque direction
27
New cards

Quelle sont Les coordonnées des individus projetés sur la droite de vecteur directeur u = (u1 u2 …. up) pour d = 1 ?

Les coordonnées des individus projetés sur la droite de vecteur directeur u = (u1 u2 …. up) est

c = Xu = Σk=1p xk uk

28
New cards

Quelle est l’inertie des points projetés ? (var(c) = …)

var( c ) = Σk=1p pi ci = cᵀ D c

= uT XT D X u

= uT V u = uT R u

29
New cards

Quelle quantité cherche-t-on à maximiser pour trouver cette direction ?

On cherche u* = argmax ||u|| = 1 uᵀ V u

30
New cards
Comment exprime-t-on un vecteur u dans la base des vecteurs propres ?

u = Σk=1p αk vk

31
New cards

Comment s’écrit la quantité uᵀVu dans cette base ?

uᵀVu = (Σk=1p αk vk)T V (Σk=1p αk vk)

= (Σk=1p αk vk)Tk=1p αk λk vk)

= Σk=1p αk2 λk ||vk||2

= Σk=1p αk2 λk

32
New cards

Quand uᵀVu est-elle maximale ?

Quand u est égal au premier vecteur propre v₁ (αk = 1 k = 1, αk = 0 sinon )

33
New cards

Que fait-on dans le cas général en dimension d >= 1 ?

On projette sur les d premiers vecteurs propres

34
New cards
Qu’est-ce que les composantes principales ?
Des variables artificielles définies par les facteurs principaux : cᵏ = X vₖ
35
New cards
Que contiennent les composantes principales ?
Les coordonnées des projections orthogonales des individus sur les axes principaux
36
New cards

En quoi consiste l’ACP ? (diagonalisation et facteurs principaux)

À diagonaliser la matrice R pour obtenir les facteurs principaux v1, v2, v3, …, vd et à calculer les composantes principales ck= X vk

37
New cards

Quelle est la variance d’une composante principale cᵏ ? Que contiennent-elles ?

Elle est égale à la valeur propre λₖ : var(ck) = X λk

Elles contiennent les coordonnées des projections orthogonales des individus sur les axes définis par les facteurs principaux.

38
New cards

Pourquoi la variance est-elle égale à λₖ ?

Parce que V = R et ||vₖ|| = 1

39
New cards

Comment interpréter la variance d'une composante principale ck qui est égale à la valeur propre λₖ?

Les composantes principales sont des combinaisons linéaires de variables initiales de variances maximales. De plus, les nouvelles variables sont déconnectées.

40
New cards

Quelle est la formule de reconstitution ?

X = Σk=1p ck vk T

41
New cards

Quel est le théorème d’Eckart-Young en ACP ?

La matrice X̃ = Σk=1d cᵏ vₖᵀ est la meilleure approximation de X par une matrice de rang d au sens des moindres carrés

42
New cards

En quoi consiste la méthode ACP ? (méthode factorielle linéaire + transformer variable…)

On dit que l'ACP, méthode factorielle linéaire.

L’ACP consiste à transformer des variables xk corrélées en de nouvelles variables ck (appelées composantes principales) non corrélées entre elles, de variance maximale et les plus liées aux xk.

43
New cards

Comment définit-on le critère de qualité d’une ACP ?

C’est le pourcentage d’inertie totale expliquée : (Σk=1d λₖ ) / (Σk=1p λₖ) = Σk=1d λₖ/ (Ig)

44
New cards
Comment interpréter la qualité de représentation d’un individu en ACP ?
On regarde l’angle : si cos(θ) ≈ ±1 il est bien représenté, si cos(θ) ≈ 0 il est mal représenté
45
New cards
Qu’est-ce que le critère de Kaiser en ACP ?
On retient les composantes principales dont la valeur propre est supérieure à 1 (λₖ > 1)
46
New cards
En quoi consiste le critère du coude ?
On observe le diagramme des valeurs propres et on garde les composantes avant le point où la courbe forme un “coude”
47
New cards
À quoi servent les critères empiriques en ACP ?
Ils servent à déterminer le nombre d’axes (composantes principales) à retenir pour représenter les données
48
New cards

Que regarde-t’on principalement pour donner un sens aux axes retenus ?

On regarde les coefficients de corrélation linéaire r( c, xk) entre les composantes principales et les variablesinitiales.

49
New cards

Quel coefficient de corrélation va-t’on privilégier ?

On privilégie les coefficients les plus forts en valeur absolue (proche de 1)

r(c, xk) = rac(λₖ) vk

50
New cards
Qu’est-ce que le cercle de corrélation en ACP ?
C’est une représentation des variables sur un plan factoriel où chaque flèche correspond à une variable
51
New cards
Que représente une flèche dans le cercle de corrélation ?
Elle représente une variable projetée selon ses coordonnées sur les axes principaux
52
New cards
Que signifie une petite flèche dans le cercle de corrélation ?
Elle indique que la variable est faiblement représentée (peu significative) sur le plan
53
New cards
Que signifie une flèche orientée vers la droite (axe 1) ?
La variable est positivement corrélée avec le premier axe
54
New cards
Comment calcule-t-on la contribution d’un individu à une composante ?
Par la formule pᵢ (cᵢᵏ)² / λₖ
55
New cards

A quoi correspond cᵢᵏ ?

La valeur pour l'individu i de la k-ième composante ck

56
New cards
Quand dit-on qu’une contribution est importante ?
Lorsqu’elle est supérieure à la contribution moyenne (pᵢ (cᵢᵏ)² / λₖ > pᵢ)
57
New cards

Qu’est-ce que les éléments supplémentaires en ACP ?

Ce sont soit des variables élémentaires, soit des attributs système. Ils n'ont pas servi pour déterminer des facteurs, mais pour les reproduire. Ils apportent une information supplémentaire, à but d'interprétation ou de validation. Ce sont des valeurs tests.

Explore top notes

note
Achievements of Reconstruction
Updated 1200d ago
0.0(0)
note
VSEPR Charts memorization
Updated 1265d ago
0.0(0)
note
Basic Spanish pt. 1
Updated 1756d ago
0.0(0)
note
Chapter 12- The Cell Cycle
Updated 1180d ago
0.0(0)
note
Concise Chemistry Summary
Updated 278d ago
0.0(0)
note
Achievements of Reconstruction
Updated 1200d ago
0.0(0)
note
VSEPR Charts memorization
Updated 1265d ago
0.0(0)
note
Basic Spanish pt. 1
Updated 1756d ago
0.0(0)
note
Chapter 12- The Cell Cycle
Updated 1180d ago
0.0(0)
note
Concise Chemistry Summary
Updated 278d ago
0.0(0)

Explore top flashcards

flashcards
Science
119
Updated 1019d ago
0.0(0)
flashcards
Manufacturing (SAS 7)
60
Updated 944d ago
0.0(0)
flashcards
Aardrijkskunde
72
Updated 111d ago
0.0(0)
flashcards
Manufacturing (SAS 8 and SAS 9)
42
Updated 941d ago
0.0(0)
flashcards
Unit 2 Exam Review
86
Updated 1058d ago
0.0(0)
flashcards
AP LANG- Terms summative
35
Updated 926d ago
0.0(0)
flashcards
le exam study guide
86
Updated 1035d ago
0.0(0)
flashcards
Science
119
Updated 1019d ago
0.0(0)
flashcards
Manufacturing (SAS 7)
60
Updated 944d ago
0.0(0)
flashcards
Aardrijkskunde
72
Updated 111d ago
0.0(0)
flashcards
Manufacturing (SAS 8 and SAS 9)
42
Updated 941d ago
0.0(0)
flashcards
Unit 2 Exam Review
86
Updated 1058d ago
0.0(0)
flashcards
AP LANG- Terms summative
35
Updated 926d ago
0.0(0)
flashcards
le exam study guide
86
Updated 1035d ago
0.0(0)