Analyse en Composantes Principales (ACP)
L'analyse en composantes principales est un algorithme de réduction de dimensions.
Il s'agit d'une technique linéaire permettant de projeter des données X de dimension d en d'autres données t de dimension p<d.
Elle permet de:
- réduire le nombre de dimensions
- étudier la variabilité entre les individdus
- étudier les liaisons entre les variables
L'idée de l'ACP est de projeter les données sur des axes présentant la variance des données. Avec p=2 ou 3 on peut visualiser les données.
Principe
Approximer un nuage de point X de dimension d par sa prjection linéaire en dimension p<>d.
L'ACP minimise la variance des points projetés.
On cherche à réaliser une projection \(x € R^d -> t € R^p\), p<d.
L'espace de projection P
Évaluation
Un modèle ACP peut être évaluée avec la technique du coude.
ACP non linéaire
Le critère de Kaiser
La méthode du coude