Data Science, statistique & apprentissage


La troisième année de l’ENSAE comporte six voies de spécialisation. Chacune a été conçue pour proposer une séquence de cours de spécialisation cohérente, dans une perspective “métiers” et non “discipline”. Chacun des métiers exercés par des ENSAE fera appel à des degrés divers à l’analyse économique et aux méthodes statistiques. Ces disciplines sont donc présentes au sein de chaque voie.

Profils

La voie “Data science, statistique & apprentissage” comporte une dominante d’enseignements avancés en mathématiques appliquées (probabilité, statistique), en informatique, ainsi qu’une ouverture à différents domaines d’application (finance, assurance, sciences sociales, et éventuellement compétences basiques en biologie).

Le « Data Scientist » ainsi formé possède une expertise scientifique de très haut niveau qui lui permet d’aider à la prise de décision dans de nombreux domaines (décision économique, finance, biostatistique, imagerie, statistique publique) ou d’effectuer de la recherche fondamentale. Ce profil polyvalent peut mener aussi bien à des carrières d’expert qu’à des postes décisionnels ou d’encadrement en entreprise.

Les voies de data science de l’ENSAE permettent d’acquérir un profil hautement qualifié en statistique et en économétrie appliquées pour lequel les débouchés sur le marché du travail sont extrêmement variés, du data scientist à l’enseignant-chercheur, en passant par le conseil, l’expertise statistique publique ou industrielle.

MÉTIERS

On assiste depuis plusieurs années à une explosion du volume de données disponibles, dans des domaines très divers (par exemple la génétique, les neurosciences, la climatologie, mais aussi la finance, le marketing et les sciences humaines et sociales). Après une période où les questions portaient principalement sur le stockage et la conservation de ces données, ce sont maintenant les problématiques liées à leur exploitation statistique et à leur analyse qui apparaissent comme porteuses d’enjeux d’importance. Les emplois générés nécessitent tout à la fois des compétences techniques et une compréhension stratégique des enjeux sous-jacents.

Le caractère transversal des méthodes quantitatives présentées dans cette voie permet aux étudiant·es d’accéder à une large palette de métiers, aussi bien dans le public que dans le privé. Cette voie développe, entre autres, les compétences attendues pour les postes de « Chief Data Officer » qui émergent dans le contexte lié aux « Big Data ».

La voie Data science, statistique et apprentissage vise à délivrer des compétences à la fois larges et approfondies en vue de concevoir des modèles statistiques, de construire des bases de données (plans d’expérience, pré-traitements, etc.) et d’organiser les tests ou l’apprentissage statistique pour soutenir la prise de décision en rationalité limitée. Il offre des cours dans différents domaines : les enseignements liés aux enquêtes statistiques conduisent aux métiers de méthodologue au sein des instituts de sondage, dans les services statistiques et d’études des grandes entreprises et des administrations, et au sein des sociétés de conseil ; les enseignements orientés vers l’apprentissage et les statistiques en grande dimension conduisent aux métiers d’experts statistiques dans l’industrie ou les grandes entreprises utilisant de grandes bases de données telles que Google ou Amazon, mais aussi dans les start-up technologiques. Ces enseignements sont soutenus par des cours théoriques fondamentaux et mènent aussi à la recherche en statistique.

Enseignements

Premier semestre

Cours obligatoires

Matière ECTS Horaires (cours+TD)
Apprentissage Statistique avancé 4 18+6
Big Data et droit des données 2 18+0
Statistique bayésienne 4 18+0

Cours optionnels

Vous avez le choix parmi 4 à 7 options* sur l’ensemble du catalogue de cours de 3A, semestre 1 (sous réserve de compatibilité avec votre emploi du temps,). Nous vous recommandons les cours suivants :

*dont langue vivante

Matière ECTS Horaires (cours+TD)
Langue vivante (1 langue max, anglais obligatoire si niveau inférieur à B2) 3 18+0
Computational statistics 3 12+6
Éléments logiciels pour le traitement des données massives 3 0+15
Enchères et Matching : apprentissage et approximations 3 18+0
Entrepreneuriat 1 3 18+0
Estimation non paramétrique 4 15+9
Gestion des risques de l’énergie 2 12+0
Microeconometric Evaluation of Public Policies 3 24+0
Modèles à chaîne de Markov cachée et méthodes de Monte Carlo séquentielles 3 18+0
Optimisation avancée 4 24+0
Randomized Methods and Policy Evaluation 3 24+0
Semi and Non Parametric Econometrics 4 24+0
Statistical Methods of Econometrics 3 18+0
Statistique en grande dimension 4 15+9
Sociogenomics 3 24+0

Stage d'application (2A) ou cursus intégré

Si vous étiez en deuxième année à l’ENSAE

Matière ECTS
Stage d’application de 2A 7

 

Si vous arrivez directement en troisième année (cursus intégré), vous devez suivre le bloc d’harmonisation de 5 semaines, quelle que soit la voie de spécialisation choisie pour la suite.

Matière ECTS Horaires (cours+TD)
Séries temporelles (CI) 1 15+12
Statistiques mathématiques 1,5 18+12
Économétrie (CI) 1,5 18+12
Introduction aux langages R et Python (CI) 1 12+0

Option des élèves de la voie “économie”

Introduction à l’apprentissage statistique 2 12+6

Option des élèves de la voie “mathématiques appliquées”

Microéconomie 1 18+12
Macroéconomie 1 18+12

Option pour poursuivre dans la voie actuariat

Instruments financiers 3A 0

Second semestre

Cours obligatoires

Matière ECTS Horaires (cours+TD)
Apprentissage en ligne et agrégation 3 18+0
Compressed Sensing 4 21+0
Et un cours semi-obligatoire au choix parmi : 
Machine Learning for Natural Language Processing 3 18+0
Reinforcement learning 3 18+0

Cours optionnels

Vous avez le choix parmi 2 à 4 options* sur l’ensemble du catalogue de cours de 3A, semestre 1 (sous réserve de compatibilité avec votre emploi du temps,). Nous vous recommandons les cours suivants :

*dont langue vivante

 

Matière ECTS Horaires (cours+TD)
Applications du bootstrap et autres techniques de ré-échantillonage 3 18+0
Blockchain Technologies and Tokenomics 3 21+0
Data Storytelling 3 15+0
Deep Learning: Models and Optimization 3 18+0
Econometrics 3 (Panel data and duration models) 4 24+0
Entrepreneuriat 2 3 18+0
Entrepreneuriat digital 3 21+0
Formation par la recherche 3
Histoire et épistémologie de la statistique 2 18+0
Langue vivante (1 langue max, anglais obligatoire si niveau inférieur à B2) 3 20+0
Machine learning for Econometrics 4 24+0
Optimal Transport : theory, computations, statistics and ML applications 3 12+6
Programmation en GPU 2 12+0
Projet informatique 4 0+9
Séminaire de sondages 3 18+0
Statistique 3 4 24+0
Techniques avancées d’apprentissage 2 18+0
Traitement des données distribuées 3 18+0

Stage de fin d'études

Matière ECTS
Stage de fin d’études 7