Introduction au machine learning


Objectif

Ce cours constitue une introduction d'ensemble aux méthodes de machine learning. Si la différence entre statistique et machine learning apparaît parfois comme floue, car certaines méthodes sont communes aux deux disciplines, l'idée de base est que l'est que la statistique est avant tout orientée vers l'estimation de paramètres, en vue de leur interprétation, alors que le machine learning est avant tout orienté vers la prédiction. Le cours présentera un certain nombre d'algorithmes de prédiction populaires. D'une part, on essaiera de comprendre comment analyser d'un point de vue mathématiques les performances de ces algorithmes. D'autre part, à travers des séances de TP sous R, on verra comment utiliser ces méthodes en pratique.

 

Mode d'évaluation:

La note finale du cours sera composée de la note de contrôle continu (33%) et de l'examen final (67%). La note de contrôle continue est égale à la moyenne de mi-parcours, évalué lors d'un TP sur machine.

Plan

1 Introduction.
Différence entre estimation (statistique) et prédiction (ML); définition des fonctions de perte, risque, risque empirique. Passage du paradigme où l'objet de base est plus l'algorithme (ML) que le modèle (statistique).

2 Algorithmes de classification.
Méthodes provenant de la statistique, discrimination linéaire. Méthode des plus proches voisins et autres méthodes universellement consistantes. Arbres de décisions et random forests.

3 Algorithmes de régression.
Méthode des moindres carrés. Méthodes par pénalisation. Estimateur RIDGE. Estimateur LASSO.

4 Sélection d'estimateurs.
Discussion des méthodes de minimisation du risque empirique. Données d'apprentissage et de test. Validation croisée.

Références