[PDF] 3 ANALYSE EN COMPOSANTES PRINCIPALES 2 31 - Accueil





Previous PDF Next PDF



D- interprétation dune ACP

D- interprétation d'une ACP Kaiser en ACP normée: I/p= 1 : On ne retiendra que les axes ... D-3 Interprétation des axes : nuage des points individus.



D- interprétation dune ACP

D- interprétation d'une ACP choisir le nombre q d'axes factoriels (ou de composantes ... Kaiser en ACP normée: I/p= 1 : On ne retiendra que les axes.



Statistique Descriptive Multidimensionnelle (pour les nuls)

C'est l'interprétation de ces graphiques qui permettra de comprendre la pour comprendre le mécanisme d'une A.C.P. et donc pour l'utiliser correctement.



Analyse en composantes principales (ACP)

Analyse en composantes principales (ACP). François Husson 4 Aides à l'interprétation ... Marketing : valeur d'indice de satisfaction k pour la marque i.



Ch2 : Analyse en Composantes Principales (ACP)

Ch2 : Analyse en Composantes. Principales (ACP). A- Objectifs. B- construction d'un espace factoriel. C- Les étapes d'une ACP. D- Interprétation. E- Limites 



Introduction à lAnalyse en Composantes Principales (ACP)

et vecteurs propres d'une matrice de variances ou corrélation et FIGURE 1 – Interprétation géométrique de l'ACP comme la recherche du.



Interpretation génétique des ACP inter-groupes sur les haplotypes d

Ce papier propose une interprétation supplémentaire des résultats d'ACP pour la caractérisation de la structure génétique des populations.





Séance 4: Analyse en Composantes Principales

Interprétation et qualité des résultats d'une ACP. Analyse factorielle d'un tableau de distance. Quatri`eme partie IV. Analyse en Composantes Principales.



Analyse en Composantes Principales (ACP)

Cette interprétation sera guidée par un certain nombre d'indicateurs numériques et graphiques appelés aides à l'interpréta- tion



Analyse en Composantes Principales - CNRS

Exemples et Exercices ACP Exemple 1: les vins de Bordeaux Source : « Probabilités et Statistiques » D Dacunha-Castelle M Duflo) Dans le cadre d’une étude de vins de Bordeaux on recueille 34 observations climatiques des mois d’Avril à septembre des années 1924 à 1957 Les variables sont les suivantes :



3 ANALYSE EN COMPOSANTES PRINCIPALES 2 31 - Accueil

3 1 2 Interprétation géométrique de l'ACP L'ACP revient à effectuer une rotation du sytème d'axes initial puisque les vecteurs propres sont orthogonaux entre eux et constituent donc un nouveau repère de coordonnées Les cosinus entre les nouveaux axes et les anciens sont les composantes des vecteurs propres



D- interprétation d’une ACP - BOUZAHIR

D-Interprétation d’une ACP La décomposition précédente est faite par des logiciels statistiques (Statistica R SAS ) Non automatique (interprétation des résultats): choisir le nombre q d’axes factoriels (ou de composantes principales) à retenir pour obtenir un r ésumé suffisamment



Analyse en Composantes Principales - univ-rennes2fr

Introduction Nuages Np et Nn La méthode de l’ACP Interprétations Analyse en Composantes Principales N Jégou Université Rennes 2 Master1Géographie



Analyse en Composantes Principales (ACP) - univ-toulousefr

D’un point de vue plus “mathématique” l’ACP correspond à l’approxima-tion d’une matrice (n;p) par une matrice de même dimensions mais de rang q

3- Analyse en composantes principales 1

3. ANALYSE EN COMPOSANTES PRINCIPALES........................................................................

..... 2

3.1 Méthodologie de l'ACP........................................................................

....................................... 2

3.1.1 Recherche de sous-espaces optimaux

............. 3 3.1.2 Interprétation géométrique de l'ACP.........................................................................

............. 5

3.1.3 Analyse dans l'espace des échantillons........................................................................

........... 5

3.1.4 Reconstruction complète et partielle de la matrice X.............................................................. 6

3.1.5 Coordonnées des observations et des variables sur les vecteurs propres (composantes

.......................................................... 6

3.1.6 Qualité de la représentation des observations et des variables.................................................. 7

3.1.7 Contributions des observations et des variables...................................................................... 7

3.1.8 Règles d'interprétation des vecteurs propres........................................................................

... 7 3.2 Exemple numérique........................................................................

............................................ 9

3.3 Observations et variables supplémentaires........................................................................

.......... 10

3.4 ACP de la matrice des covariances........................................................................

..................... 11

3.5 ACP de la matrice des corrélations........................................................................

..................... 11 3.5.1 Cas particulier de l'ACP avec 2 variables........................................................................

..... 12

3.6 Exemples d'application........................................................................

...................................... 14

3.6.1 ACP des données des montérégiennes........................................................................

......... 14

3.6.2 Utilisation en télédétection........................................................................

.......................... 15 3.6.3 Détermination de l'orientation d'une veine à partir de données de forages............................... 15

3.6.4 Détermination des contraintes principales et de leur orientation en un point d'un massif rocheux

................... 16

3.6.5 Étude des joints et fractures........................................................................

......................... 17 Exemple: On a observé les 15 joints suivants:........................................................................

...... 18

3.6.6 Filtrage de données géochimiques........................................................................

............... 19

3.6.7 Analyse de données TBF (Marroquin, 1997)........................................................................

20

3.7 Tableau récapitulatif........................................................................

.......................................... 21 3.8 Exemple numérique complet........................................................................

.............................. 22

Réponses aux questions et exercices........................................................................

........................ 24 ...................................................... 25

3- Analyse en composantes principales 2

3. ANALYSE EN COMPOSANTES PRINCIPALES

L'analyse des données consiste essentiellement à établir quelles sont les relations existant entre les observations,

entre les variables, et entre les observations et les variables. Il s'agit donc de mettre un peu d'ordre dans le

fichier de données, souvent de taille considérable (quelques centaines ou milliers d'analyses et quelques

dizaines de variables. Ceci peut être fait à l'aide de diagrammes binaires, à l'aide des corrélations et corrélations

partielles, à l'aide de diagrammes spécifiques propres au domaine étudié (ex. diagramme AFM et diagrammes

de Harker en pétrologie). L'analyse en composantes principales est un autre outil permettant une meilleure

visualisation de nos données.

3.1 Méthodologie de l'ACP

Le tableau de données n x p forme un nuage de n points dans un espace à p dimensions, ou un nuage de p

points dans un espace à n dimensions. Un diagramme binaire consiste à projeter ces points sur deux des

dimensions choisies plus ou moins arbitrairement. L'ACP consiste à projeter les points sur une droite, un plan...

un sous-espace à s dimensions (avec s p) choisi de façon à optimiser un certain critère. Intuitivement, on

cherchera le sous-espace donnant la meilleure visualisation possible de notre nuage de points. Un bon choix

consiste à rechercher la plus grande dispersion (le plus grand étalement) possible des projections dans le sous-

espace choisi. On est amené ainsi à chercher une rotation de notre système d'axes initial (les variables)

permettant de mieux voir notre nuage. Définissons u 1 le vecteur unitaire (i.e. de norme 1; u 1 'u 1 =1) recherché; c'est le vecteur présentant la plus grande dispersion des projections.

Soit la matrice X

nxp ; chaque ligne représente une observation. Chaque colonne représente une variable. On

supposera chaque variable centrée, i.e. on a soustrait la moyenne de chaque variable au préalable. Ceci est fait

de façon à faire coïncider le centre de gravité du nuage de points avec l'origine. Les projections des n observations sur le vecteur u 1 sont données par: C=Xu 1 (produit scalaire) La somme des carrés de ces projections (inertie) est: C'C=u 1 'X'Xu 1

On choisira u

1 de façon à maximiser cette dernière quantité. Le problème est donc:

Maximiser u

1 'X'Xu 1 sujet à u 1 'u 1 =1

Il s'agit d'un problème classique d'optimisation sous contrainte que l'on peut solutionner par la méthode de

Lagrange.

On forme le Lagrangien:

L = u 1 'X'Xu 1 - (u 1 'u 1 -1) On dérive par rapport à chacune des p composantes du vecteur u 1 ainsi que par rapport au multiplicateur de Lagrange () et on pose les dérivées partielles égales à zéro.

3- Analyse en composantes principales 3

2XXuu = 0

uu = 1 11 11

Simplifiant, on trouve:

X'X u 1 = u 1 u 1 'u 1 = 1

On reconnaît là l'équation de vecteurs propres et de valeurs propres de la matrice X'X. On note que cette

matrice est, à un facteur 1/n ou 1/(n-1) près, la matrice de variances (sur la diagonale) et de covariances (hors-

diagonale) des p variables. Le vecteur donnant les projections ayant la plus grande dispersion est donc le 1

er vecteur propre de la matrice de variances-covariances de X (c.f. remarque ii. ci-bas).

Remarques:

i. La matrice des produits scalaires (X'X) est, par construction, symétrique et au moins positive semi-

définie. Ceci implique que les valeurs propres et les vecteurs propres seront réels. De plus les valeurs

propres seront toutes positives ou nulles. Finalement, rappelons que les vecteurs propres d'une matrice

symétrique sont toujours orthogonaux entre eux, i.e. u 1 'u 2 =0. Ce n'est généralement pas le cas lorsque la matrice n'est pas symétrique. ii. Les projections sur le vecteur u 1 définissent une nouvelle variable qui est combinaison linéaire des variables originales. La variance de cette nouvelle variable est donnée par:

1/n (u

1 'X'Xu 1 ) = 1/n (u 1 1 u 1 ) = 1/n 1

La variance des projections est donc égale (au facteur 1/n) à la valeur propre. Le maximum est donc

atteint avec la 1

ère

valeur propre. C'est pourquoi on retient le 1 er vecteur propre.

iii. On sait que la somme des valeurs propres d'une matrice est égale à la trace de la matrice originale. La

quantité totale de variation n'est donc pas modifiée. De plus, le rapport 1 i ) indique la proportion de la variance totale prise en charge par le 1 er vecteur propre.

Question 1: Quelle relation y a-t-il entre les vecteurs propres et les valeurs propres de X'X et ceux de

X'X/n?

3.1.1 Recherche de sous-espaces optimaux

A la section précédente, on a établi que le vecteur pour lequel la variance des projections est maximale

est le 1 er

vecteur propre de la matrice des variances-covariances. Qu'en est-il maintenant si on recherche le plan

pour lequel la variabilité (l'étalement) des projections est maximale?

Théorème: Le plan expliquant le mieux le nuage de points (au sens des moindres carrés) contient

nécessairement le vecteur u 1

Démonstration:

On suppose que u

1 n'est pas inclus dans le meilleur plan et on montre que l'on arrive alors à une contradiction.

3- Analyse en composantes principales 4

i. Il existe au moins une droite (disons u 2 ) contenue dans le meilleur plan et qui est orthogonale à u 1

Soit u

1 la projection de u 1 dans le meilleur plan. On peut écrire u 1 = u* 1 + (u 1 - u* 1

Soit u

2 la droite du meilleur plan orthogonale à u* 1 . Par construction, u 2 est aussi orthogonale à (u 1 - u* 1 ) donc u 2 est orthogonale à u 1

ii. L'inertie (i.e. la somme des carrés des projections) sur tout plan est égale à la somme des

inerties expliquées par deux droites orthogonales du plan (trivial par le théorème de Pythagore

et la définition d'inertie). iii. Le "meilleur" plan est défini par u 2 et u 1 . Ce plan explique moins d'inertie que le plan défini par u 2 et u 1 car u 1 est la droite expliquant le plus d'inertie. On arrive donc à une contradiction et on conclut que le meilleur plan contient nécessairement u 1

Le résultat est important puisqu'il nous permet de chercher le vecteur expliquant le maximum d'inertie puis le

second vecteur, orthogonal au premier, expliquant le maximum d'inertie, etc..... Recherche du 2e vecteur expliquant le maximum d'inertie.

On cherche u

2 tel que: u 2 'X'Xu 2 soit maximum sujet à u 2 'u 1 = 0 et u 2 'u 2 = 1

Le Lagrangien est:

L = u

2 'X'Xu 2 - w(u 2 'u 1 2 (u 2 'u 2 - 1) Dérivant le Lagrangien par rapport à chacune des composantes du vecteur u 2 et par rapport à 2 et w 2 puis simplifiant, on trouve: X'X u 2 2 u 2 u 2 'u 2 = 1 u 1 'u 2 = 0

Le vecteur recherché est le vecteur propre associé à la 2e plus grande valeur propre de la matrice de variances-

covariances. Ces résultats se généralisent aisément à plusieurs dimensions et on trouve que:

Théorème: L'espace à s dimensions s p donnant la meilleure explication (en termes d'inertie) du nuage

original est défini par les s vecteurs propres de X'X associés aux s plus grandes valeursquotesdbs_dbs6.pdfusesText_11
[PDF] Qualité de l'information - CTREQ

[PDF] (1 Construire et conduire une séance d'EPS)

[PDF] DESCRIPTIFS ET CRITERES DE RÉUSSITE

[PDF] L'évaluation en pédagogie : Définitions et concepts- clés - MENFP

[PDF] l'évaluation en svt - SVT aaoi

[PDF] Décision et Critères multiple - Lamsade

[PDF] Segmentation stratégique et marketing en B to B - cloudfrontnet

[PDF] La segmentation et le ciblage : principaux piliers de la stratégie

[PDF] Échantillonnage - Théorème de Shannon

[PDF] Correction des exercices Ch20 p : 533 n°24 : NUMERISATION DE L

[PDF] Pistes didactiques

[PDF] D- interprétation dune ACP

[PDF] Guide de contrôle 2016 Tableau de classement hôtelier ATOUT

[PDF] L'Essentiel du Droit consitutionnel - Tome 1 - Numilog

[PDF] Critères microbiologiques applicables à partir de 2015 aux - FCD