Aller au contenu

Analyse en Composantes Principales (ACP)

L'analyse en composantes principales est un algorithme de réduction de dimensions.

Il s'agit d'une technique linéaire permettant de projeter des données X de dimension d en d'autres données t de dimension p<d.

Elle permet de:

  • réduire le nombre de dimensions
  • étudier la variabilité entre les individdus
  • étudier les liaisons entre les variables

L'idée de l'ACP est de projeter les données sur des axes présentant la variance des données. Avec p=2 ou 3 on peut visualiser les données.

Principe

Approximer un nuage de point X de dimension d par sa prjection linéaire en dimension p<>d.

L'ACP minimise la variance des points projetés.

On cherche à réaliser une projection \(x € R^d -> t € R^p\), p<d.

L'espace de projection P

Évaluation

Un modèle ACP peut être évaluée avec la technique du coude.

ACP non linéaire

Le critère de Kaiser

La méthode du coude