Methods in quantitative sociology


Objectif

Ce cours consiste en la présentation de méthodes statistiques avancées, encore peu utilisées en sciences sociales et peu abordées dans le cursus à l’Ensae, mais qui se révèlent très performantes et tout à fait complémentaires avec une formation en économétrie. Le cours se composera de 4 modules de 6 heures, chaque module abordant une méthode de manière pratique et interactive, à partir de l’analyse de données empiriques à l’aide de logiciels spécialisés.

Plan

  • Analyse des séquences – une approche du traitement des données longitudinales qui se diffuse assez largement depuis une dizaine d’années.
  • Arbres de classifications et de régressions et algorithmes ensemblistes (bagging, forêts aléatoires, etc) – cette famille de méthodes constitue une alternative intéressante et non paramétrique aux modèles de régressions standards.
  • Modèles multiniveaux – ces modèles permettent d’étudier des données hiérarchisées (par exemple, élèves au sein de classes, patients au sein d’hôpitaux) en tenant compte de l’influence d’effets contextuels sur les phénomènes étudiés, au-delà de l’effet des caractéristiques individuelles.
  • Analyse en classes latentes (ACL) et modèles de mélange – une vaste famille d’approches probabilistes de la classification – dont l’ACL fera l’objet d’attention de ce module – qui permettent l’évolution de l’approche algorithmique, heuristique et géométrique (e.g., K-Means, Classification hiérarchique, ACM) vers un traitement statistique d’hypothèses préalables sur des données complexes et des populations hétérogènes.

Références