10 – Exploiter les données : indices et analyses multivariées

Analyser les données nécessite souvent de combiner plusieurs variables entre elles. On peut d’abord envisager de créer un indice. La création d’indices répond à différentes motivations : économiser du temps, mieux cerner un phénomène, tenir compte de la fragilité des indicateurs ; il peut aussi s’agir d’élaborer des échelles d’attitudes, qui permettent de mieux cerner les valeurs sous-jacentes des individus. Construire des indices nécessite quelques précautions méthodologiques, notamment le calcul du coefficient Alpha de Cronbach.

Un point délicat de l’analyse des données concerne l’interprétation des corrélations. Une corrélation ne signifie pas une causalité. Interpréter des corrélations nécessite d’engager des analyses plus complexes que les tris croisés. Une première étape est de faire intervenir une tierce variable (ou variable de contrôle). L’étape suivante concerne les analyses multivariées, c’est-à-dire les analyses qui tentent de contrôler simultanément plusieurs variables de façon à raisonner « toutes choses égales par ailleurs ». Les analyses de régression incluent deux grandes familles : la régression linéaire et la régression logistique, la première portant sur les variables quantitatives, la seconde sur les variables qualitatives. Ces analyses visent à vérifier l’effet d’une variable une fois que toutes les autres ont été contrôlées. Elles permettent aussi d’estimer la valeur prédictive de différents modèles statistiques.

Vincent Tournier

Acheter le chapitre 10