ENSAE Paris - École d'ingénieurs pour l'économie, la data science, la finance et l'actuariat

Data challenge S2

Objectif

Le Data Challenge se présente sous la forme d’une compétition entre plusieurs groupes d’élèves autour d’un projet data sur l’ensemble de l'année. Plusieurs entreprises proposent, en collaboration avec les enseignants-chercheurs de l’école, un sujet statistique, économique ou financier et fournit les données sur lesquelles travaillent plusieurs groupes d’étudiants d’octobre à mai. L’objectif est de répondre à une problématique formulée par chaque entreprise. Pour cela, les élèves disposent de données mises à disposition par l’entreprise et doivent mettre en application l’ensemble des enseignements de l’ENSAE.

Les élèves une fois inscrits à ce cours formulent leur classement des entreprises/sujets proposés, et sont ensuite affectés en groupe au sujet (plusieurs groupes travaillant sur le même sujet avec une entreprise donnée).

Les groupes seront guidés et aidés dans leur réflexion tout au long de l’année. Des spécialistes de l’entreprise sponsor pourront répondre à leurs questions sur les données et les enjeux clients. D’autre part, chaque groupe est supervisé par des enseignant-chercheurs de l’école. Les travaux sont évalués et pour chaque sujet, le meilleur travail peut éventuellement être récompensé par un prix.

 

L’essentiel du travail fourni par les élèves dans le cadre de ce projet porte sur l’analyse économique/statistique/financière, la modélisation et la mise en oeuvre des techniques de data science (économétrie et machine learning) sur les données réelles mises à disposition par l’entreprise sponsor.

En réalisant ce challenge les élèves pourront se confronter à la réalité des questions soulevées en entreprise. Le projet réalisé doit être vu comme un travail d’étude intensif en data, dans une optique « recherche et développement » visant à explorer et tester de nouvelles idées pour améliorer en vraie grandeur la stratégie de l’entreprise dans une ou plusieurs dimensions.

Entreprises participant au data challenge en 2025-2026 :

  • Alptis : machine learning, santé, assurance (recommandé pour 3A-DSBD, MS-MQDE, 3A-DSSA et MS-DS)
  • APICIL : machine learning, santé, assurance (recommandé pour 3A-DSBD, MS-MQDE, 3A-DSSA et MS-DS)
  • Carmignac : machine learning, gestion d’actifs (recommandé pour 3A-FRD, 3A-DSSA et MS-DS)
  • CNP Assurances : actuariat, macroéconomie, gestion des risques (recommandé pour 3A-A, 3A-FRD, 3A-DSSA et MS-DS)

Plan

Cet enseignement se déroule sur l’ensemble de l’année scolaire (octobre 2025 – mai 2026). L’inscription est obligatoire au S1 comme au S2

L’évaluation du 1er semestre se fait par le rendu d’une note de mi-parcours ; celle du 2e semestre par un mémoire et une soutenance.

Fin octobre 2025 : Kick-off

Début décembre 2025 : Jalon 1 – exploration et problématique

Fin Janvier 2026 : Jalon 2 – méthodologie choisie et note de mi-parcours

Fin février 2026 : Jalon 3 – point d’étape

Début avril 2026 : Jalon 4 – pré-restitution

Fin avril/début mai 2026 : Jury de soutenance + remise de prix éventuelle