Business Data Challenge : Cdiscount défie les ENSAE


L’ENSAE Paris organisait aujourd’hui aux côtés de ses partenaires Cdiscount et DataStorm, la cérémonie virtuelle de remise de prix du Business Data Challenge. Cette grande compétition lancée le 17 janvier 2020 a rassemblé quatre groupes d’élèves, des enseignants-chercheurs de l’ENSAE Paris, des représentants de l’équipe data de Cdiscount et toute l’expertise DataStorm autour des enjeux du commerce en ligne.

Ce projet venait ainsi conclure – dans un contexte particulier de confinement – la dernière année de formation des élèves-ingénieurs de la voie Data Science and Business Decision et de Mastère spécialisé Méthodes quantitatives pour la décision économique et financière.

Lancement du Business Data Challenge le 17 janvier 2020 dans les locaux de l’ENSAE Paris

Travailler sur des données réelles

L’organisation d’un Business Data Challenge constitue, selon les participants « une réelle plus-value en termes de format d’apprentissage. La prise d’un problème de bout en bout sur une thématique business permet d’appliquer les outils de l’ENSAE sur un sujet économique réel ».

L’objectif de ce nouveau dispositif pédagogique est en effet de permettre aux élèves de l’ENSAE Paris de mobiliser leurs compétences en économie, en économétrie et en statistiques pour répondre à une problématique business formulée par une entreprise partenaire.

Soutenance à distance d’Abdul KASSAB et Charlène BASS (équipe 4)

Pour cela, les participants disposaient cette année de données mises à disposition par Cdiscount, leader du e-commerce français. Guidés tout au long du semestre par des experts métier sur les enjeux du client et par des enseignants-chercheurs sur l’approche et les techniques utilisées pour répondre au sujet, les élèves ont pu se confronter à la réalité des questions soulevées en entreprise.

Pour Charlène BASS, qui a participé à cette première édition « ce format d’apprentissage nous oblige à adapter nos méthodes aux contraintes réelles auxquelles font face les entreprises, notamment sur les données à leur disposition. Il ne s’agit pas d’un cas théorique dans lequel on aurait accès à toutes les données dont on peut rêver, mais d’une réflexion qui tient compte des contraintes dans l’accès aux données réellement disponibles ».

Les quatre groupes ont ainsi présenté les conclusions de leurs travaux, menés tout au long du semestre, à un jury composé de représentants de l’ensemble des partenaires : Philippe CHONÉ, enseignant-chercheur de l’ENSAE Paris, Benoît Ravel, président de DataStorm et François MARICAL, directeur data chez Cdiscount.

Une expérience professionnelle valorisante

Benoît Ravel, président de DataStorm et membre du jury, a salué le « travail impressionnant » des participants et des présentations « très didactiques et professionnelles ».

Soutenance à distance de Coline FOUCHE, Robin BEURAUD et Adrien TSOUNGUI AYIDA (équipe n°3)

Pour l’équipe de Coline FOUCHE, Robin BEURAUD, Benjamin DUFOUR-JULES et Adrien TSOUNGUI AYIDA, ce Business Data Challenge a permis « d’avoir une expérience intermédiaire entre un stage en entreprise et un projet de cours classique (…) et de conclure de manière concrète et sensée nos années passées à l’ENSAE ».

Il s’agit pour Adbul KASSAB, élève en double diplôme ESSEC-ENSAE d’un « exemple parfait de mix entre ce qu’on attend d’un data-scientist et d’un commercial. Il s’agissait d’utiliser nos connaissances qualitatives dans un but non de recherche, mais d’optimisation de résultats d’entreprise ».

« C’est une expérience très intéressante qui nous prépare au rôle que beaucoup d’entre nous pourront avoir dans notre carrière future ». Charlène BASS, élève-ingénieure 3A

Les lauréats 2020 du Business Data Challenge, Julie BORGHESE, Antoine COMPS, Maximillien PERRIN et Caroline PINTON (équipe mixte cycle ingénieur-mastère spécialisé), ont remporté la compétition avec une proposition composée d’un modèle nested logit instrumenté pour estimer des élasticités de la demande par rapport aux prix et d’un modèle de prédiction des quantités vendues selon les caractéristiques d’un produit, basé sur la théorie des forêts aléatoires. Ce groupe remporte également la somme de 2 000 € en bons d’achats Cdiscount.

Maximilien PERRIN, Julie BORGHESE, Caroline PINTON et Antoine COMPS, lauréats du Business Data Challenge

« Ici tous les choix techniques, de données, d’organisation, de rythme de travail, de modèles sont à la charge des élèves et c’est toute la palette des enseignements de l’École qu’il faut savoir mobiliser ». Pour les lauréats, il est « très différent d’appliquer un Random Forest dans un cours de Machine Learning quand quinze autres méthodes potentiellement meilleures et plus adaptées sont en concurrence. De même, il est bien plus différent de choisir d’adopter une méthode de modélisation économétrique fine, lorsqu’il faut être en mesure de l’appliquer en chaîne dans tous les cas particuliers soulevés par les données. Cela demande une prise de hauteur plus importante vis-à-vis de nos enseignements, une maîtrise technique, une humilité et une honnêteté intellectuelle poussée. »

Encore merci aux équipes de Cdiscount, à l’ensemble des participants pour le travail fourni et la qualité des présentations, mais aussi toutes celles et ceux qui se sont mobilisés pour faire de cet événement une belle réussite !