Data Science, statistique & apprentissage


PROFILS

Les voies de Data science de l’ENSAE permettent d’acquérir un profil hautement qualifié en statistique et en économétrie appliquées pour lequel les débouchés sur le marché du travail sont extrêmement variés, du Data Scientist à l’enseignant-chercheur, en passant par le conseil, l’expertise statistique publique ou industrielle.

La voie Data science, statistique & apprentissage comporte une dominante d’enseignements avancés en mathématiques appliquées (probabilité, statistique), en informatique, ainsi qu’une ouverture à différents domaines d’application (finance, assurance, sciences sociales, et éventuellement compétences basiques en biologie).

Le « Data Scientist » ainsi formé possède une expertise scientifique de très haut niveau qui lui permet d’aider à la prise de décision dans de nombreux domaines (décision économique, finance, biostatistique, imagerie, statistique publique) ou d’effectuer de la recherche fondamentale. Ce profil polyvalent peut mener aussi bien à des carrières d’expert qu’à des postes décisionnels ou d’encadrement en entreprise.

MÉTIERS

On assiste depuis plusieurs années à une explosion du volume de données disponibles, dans des domaines très divers (par exemple la génétique, les neurosciences, la climatologie, mais aussi la finance, le marketing et les sciences humaines et sociales). Après une période où les questions portaient principalement sur le stockage et la conservation de ces données, ce sont maintenant les problématiques liées à leur exploitation statistique et à leur analyse qui apparaissent comme porteuses d’enjeux d’importance. Les emplois générés nécessitent tout à la fois des compétences techniques et une compréhension stratégique des enjeux sous-jacents.

Le caractère transversal des méthodes quantitatives présentées dans cette voie permet aux étudiants d’accéder à une large palette de métiers, aussi bien dans le public que dans le privé. Cette voie développe, entre autres, les compétences attendues pour les postes de « Chief Data Officer » qui émergent dans le contexte lié aux « Big Data ».

La voie Data science, statistique et apprentissage vise à délivrer des compétences à la fois larges et approfondies en vue de concevoir des modèles statistiques, de construire des bases de données (plans d’expérience, pré-traitements, etc.) et d’organiser les tests ou l’apprentissage statistique pour soutenir la prise de décision en rationalité limitée. Il offre des cours dans différents domaines : les enseignements liés aux enquêtes statistiques conduisent aux métiers de méthodologue au sein des instituts de sondage, dans les services statistiques et d’études des grandes entreprises et des administrations, et au sein des sociétés de conseil ; les enseignements orientés vers l’apprentissage et les statistiques en grande dimension conduisent aux métiers d’experts statistiques dans l’industrie ou les grandes entreprises utilisant de grandes bases de données telles que Google ou Amazon, mais aussi dans les start-up technologiques. Ces enseignements sont soutenus par des cours théoriques fondamentaux et mènent aussi à la recherche en statistique.

Cours obligatoires du premier semestre

Matière ECTS Horaires (cours+TD)
Apprentissage Statistique 4 18+9
Big Data et droit des données 2 12+0
Statistique bayésienne 4 24+0

Options de spécialisation du premier semestre

Options d'ouverture du premier semestre

5 à 10 ECTS parmi tous les cours du 1er semestre de 3e année dont en particulier :

Matière ECTS Horaires (cours+TD)
Entrepreneuriat 1 3 18+0
Gestion des risques d’énergie 2 12+0
Langue vivante 3 18+0
Microeconometric Evaluation of Public Policies 3 24+0
Randomized Methods and Policy Evaluation 3 24+0

Cours obligatoires du second semestre

3 cours au choix :

Matière ECTS Horaires (cours+TD)
Analyse textuelle 3 18+0
Apprentissage en ligne et agrégation 4 15+6
Compressed Sensing 4 15+9
Statistique 3 4 24+0
Stochastic Optimization and Automatic Differentiation for Machine Learning 4 15+6

Options d'ouverture du second semestre