L'analyse des correspondances

Page 1 sur 8 | Table des matières | Précédent | Suivant

1. Introduction
Ce travail est une introduction à l'analyse des correspondances, méthode statistique permettant d'analyser et de décrire graphiquement de manière synthétique de grandes tables de contingences, c'est-à-dire de tableaux dans lesquels à l'intersection d'une ligne est d'une colonne on trouve le nombre d'individus de la populations ayant à la fois la caractéristique de la ligne et celle de la colonne.

.

A.

L'analyse des donnees

.

Dans les cours de statistiques que l'on peut suivre en HEC, il s'agit en général d'estimer les paramètres d'un modèle a-priori : c'est la vocation de l'économetrie. Il s'agit toujours d'une démarche déductive, on pose un modèle et on utilise ensuite les données pour estimer les "vrais" paramètres du modèle, pour finalement quantifier l'adéquation de notre théorie à la réalite. L'ecole institutionnaliste critique cette approche de la réalité par l'étroite fenetre du R2.

C'est qu'une autre approche est possible, négligée chez nous mais pas partout : nous partirions ici des données elles-mêmes (avec une embryon de réflexion a-priori pour décider lesquelles valent la peine d'être recueillie) pour essayer par une abstraction progressive de dégager des régularites dans la structure des données, de voir comment les séries de chiffres s'organisent, quelles variables ou groupe de variables sont corrélés. C'est la voie inductive. En statistique, cette branche s'est rlcemment dlvelopple en utilisant des outils mathlmatiques plus complexes que les moyennes, variances et coefficients de corrélations empiriques de notre statistique descriptive, et cette nouvelle branche a pris le nom d'analyse des données (ou Exploratory Data Analysis).

On pourrait definir l'analyse des données comme un ensemble de méthodes statistiques visant à la description synthétique d'un grand nombre de données. Les théoriciens de l'analyse des données sont souvent très critique de notre discipline : "Sous le nom de statistique mathématique, des auteurs ont édifié une pompeuse discipline, riche en hypothèses qui ne sont jamais satisfaites dans la pratique" (Benzecri: 1980, p.3)

.

B.

L'analyse factorielle
.

Une branche florissante de la famille de l'analyse des données est constituée par les différentes méthodes d'analyse factorielle. De quoi s'agit-il ?

Partant d'un tableau de n observations sur p variables, decrivant un nuage de points p-dimensionnel (si p<n), l'analyse factorielle va déterminer les k premiers axes d'un systême d'axes orthogonaux résumant le plus de la variance du nuage. La structure sous-jacente des données ainsi révélée nous permettra peut-etre de l'interpréter intuitivement, en disant : les données sont séparées par une première dimension (axe) qu'on pourrait appeler niveau de richesse, culture, ruralité/urbanité etc... dépendant des données que nous traitons. L'idée fondamentale est d'éliminer la redondance dans les données originales en essayant de résumer les variations à l'aide d'un nombre plus faible de variables (les facteurs) qui sont une combinaison des variables originales. C'est une méthode inductive classique, utilisée comme outil exploratoire pour mettre à jour les régularités empiriques fondamentales d'un ensemble de données. C'est un appareil à décrire tres puissant.L'analyse des correspondances est une méthode d'analyse factorielle qui porte sur des variables catégorielles.

.

Page suivante : Généralités sur la méthode


L'analyse des correspondances
La homepage de François Micheloud