La Data Science à l’ENSAE


Pourquoi la data science occupe une place centrale à l'ENSAE

L’ENSAE forme des ingénieurs spécialisés dans la modélisation mathématique, notamment appliquée à la décision économique et financière. La formation à l’ENSAE fait une utilisation intensive des mathématiques, à la fois pour la modélisation appliquée à l’économie et à la finance, et pour la « data science », qui fournit les outils de traitement et d’analyse des données, fondamentaux pour les métiers auxquels prépare l’ENSAE.

La formation d’ingénieur ENSAE est réputée pour son exigence quant à la maîtrise des outils de mathématiques appliquées, ce qui implique d’abord un enseignement rigoureux sur le plan théorique, avant leur manipulation dans le cadre de projets appliqués. Les enseignements sont donnés par les enseignants-chercheurs de l’école, de niveau mondial dans leurs spécialités, mais aussi par des universitaires et des professionnels de très haut niveau appartenant au monde de l’entreprise ou de l’administration.

La formation à l’ENSAE est faite d’aller-retours entre théorie (économique, financière…) et données. La modélisation mathématique donne un cadre d’analyse rigoureux, gage de cohérence, en s’appuyant sur des hypothèses permettant d’élaborer une représentation simplifiée de la réalité. La confrontation aux données est donc une étape essentielle pour apprécier la pertinence de cette modélisation. Inversement, l’exploitation seule des données peut parfois être très performante en prédiction, mais ne suffit pas à fournir une analyse des comportements ou des phénomènes à l’oeuvre. Or cette dimension d’interprétation est cruciale pour la décision, car elle permet de cibler correctement les outils stratégiques à mobiliser (par les entreprises, par l’État).

Les données sont devenues une matière première essentielle pour les acteurs économiques : les technologies numériques, présentes dans tous les secteurs d’activité, génèrent des flux colossaux d’information. L’enjeu pour les grandes entreprises, les institutions financières, les pouvoirs publics, les startups, est de tirer parti de ces données pour prévoir, évaluer et décider. Les diplômés de l’ENSAE sont plus que jamais recherchés pour leur capacité à modéliser les phénomènes économiques et financiers avec les outils scientifiques les plus récents, et surtout à donner du sens aux données.

Au-delà des compétences requises pour traiter d’énormes volumes de données en utilisant les algorithmes et les outils informatiques les plus adaptés (« big data »), c’est désormais la capacité à analyser ces données grâce à la connaissance approfondie des domaines d’application (finance, assurance, économie, marketing…) qui fait la différence (« smart data ») : cette connaissance permettre d’intégrer à l’analyse des données une information qui rendra leur exploitation plus performante.

La Data science comporte trois dimensions complémentaires :

  • La statistique mathématique
  • L’informatique
  • La connaissance des domaines d’application

Ce sont ces trois composantes prises ensemble – et si possibles maîtrisées par la  même personne ! – qui permettent d’exploiter l’information disponible pour prendre les meilleures décisions possibles. Ces trois composantes sont au coeur de la formation à l’ENSAE. La data science est la nouvelle industrie issue de la transformation numérique, son développement ne fera que croître, et les diplômés des meilleures formations dans ce domaine seront de plus en plus recherchés.

La data science dans le tronc commun du cycle ingénieur

La première année est une année d’introduction aux disciplines fondamentales de l’école, notamment la théorie des probabilités, la statistique mathématique, l’optimisation, l’informatique (python, bases de données), l’analyse numérique. Les différents éléments de la data science sont ainsi introduits dès la première année.

La deuxième année est l’année clé, où sont dispensés les cours fondamentaux de statistique et d’économétrie (statistique mathématique, économétrie linéaire, économétrie des variables qualitatives, données de panels, séries temporelles…). Le projet de statistique appliquée permet de mettre en application les méthodes théoriques à partir de données réelles, sous la direction d’un enseignant-chercheur ou d’un professionnel. Un cours d’informatique est également obligatoire (C++ ou python pour le data scientist).

Des cours plus avancés sont proposés dès la deuxième année dans le cadre des cours électifs (voir ci-dessous).

Les cours d'approfondissement de deuxième année

Un parcours type préparant au mieux aux enseignements de troisième année dans la voie Data science (module Statistique et apprentissage) comporte les enseignements suivants :

  • Introduction au machine Learning
  • Statistique 2
  • Introduction aux processus
  • Sondages
  • Séminaire de modélisation statistique
  • Simulation et Monte Carlo

La voie Data science en troisième année

Le mastère spécialisé en data science

La formation de mastère spécialisé s’adresse à des étudiants ayant déjà une formation de niveau M2 (mathématiques appliquées, diplôme d’ingénieur…) et désireux d’acquérir un complément de formation en data science. Cette formation recoupe en grande partie celle des voies de spécialisation du cycle ingénieur.

Plus d’information sur le mastère spécialisé en data science.

Peut-on faire de la recherche en data science après l'ENSAE ?

La formation ENSAE donne un bagage de très haut niveau en data science, notamment s’agissant de la statistique mathématique. Pour approfondir le domaine, les élèves peuvent suivre un master en troisième année, afin notamment de poursuivre en doctorat.

La formation doctorale de l’ENSAE se déroule au sein du CREST, Centre de recherche en économie et statistique dont l’un des pôles est la statistique et la data science.

Les élèves de l’ENSAE qui s’orientent vers le doctorat et la recherche académique y réussissent souvent brillamment du fait de leur spectre large de compétences et du haut niveau de maîtrise donné par la formation à l’école.

Les masters en Data science

Le master Data science est proposé en partenariat avec l’École polytechnique, Télécom ParisTech, l’ENS Paris Saclay et l’Université Paris Sud.

Le master Statistique et machine Learning est proposé en partenariat avec l’École polytechnique, Télécom ParisTech, et l’Université Paris Sud. Son orientation es tplus théorique que le précédent.

Le master MVA (vision et apprentissage) est également accessible pour les élèves de l’ENSAE. Il est porté par l’ENS Paris-Saclay en partenariat avec un grand nombre d’institutions, dont l’ENSAE.

Voir plus bas l’articulation entre masters et cycle ingénieur.

Formation d'ingénieur ou master ?

Les masters peuvent être suivis en parallèle de la troisième année par les élèves souhaitant approfondir un domaine spécifique, notamment en vue de commencer un doctorat à la fin de leur scolarité à l’ENSAE. Le double cursus ingénieur-master recherche est facilité par le fait qu’une partie des cours est commune entre le cycle ingénieur et les masters.

Le cycle ingénieur est conçu pour vous préparer à la vie professionnelle. Il est orienté vers les métiers, et propose pour cela une formation pluridisciplinaire de haut niveau (économie, mathématiques appliquées, informatique, langues…) préparant aux carrières dans le monde professionnel. Les masters sont conçus pour offrir des cours complémentaires de niveau recherche dans une discipline donnée (économie, data science…), et préparent ainsi aux métiers de la recherche. Le diplôme d’ingénieur délivre ainsi un spectre de compétences plus large, et les masters une formation plus approfondie mais sur un champ plus étroit.

Selon que vous privilégiez une insertion rapide sur le marché du travail ou une poursuite d’études en thèse, vous pourrez choisir d’effectuer la dernière année d’études en alternance, sous « contrat de professionnalisation », ou bien de suivre un master en double cursus.

La recherche en data science à l'ENSAE

Faire un doctorat

Qui sont les professeurs en data science de l'ENSAE ?

Les enseignant-chercheurs, de très haut niveau, enseignent la plupart des cours magistraux fondamentaux, et les cours les plus académiques de master et doctorat. Ils effectuent leur recherche au sein du CREST (Centre de recherche en économie et statistique), l’unité mixte de recherche ENSAE-X-CNRS-ENS.

La formation fait aussi une large place à des professionnels de haut niveau (banque, grande entreprise, ministères…), qui donnent un enseignement en lien direct avec les problématiques des entreprises. Des chercheurs du CNRS et des universitaires interviennent également à l’ENSAE.

Les professeurs assistants de l’ENSAE, ont un rôle clé dans l’organisation de la scolarité à l’ENSAE : ils enseignent des travaux dirigés et des cours ; ils coordonnent les projets ; ils appuient les enseignants et les élèves.

La formation continue en data science