Dynamic optimization and reinforcement learning

Enseignant

DUMITRESCU Roxana

Département : Finance

Crédits ECTS :
3

Heures de cours :
18

Heures de TD :
0

Langue :
Anglais

Modalité d'examen :
écrit

Objectif

Les problèmes d'optimisation dynamique s'intéressent aux propriétés des systèmes dynamiques évoluant de manière déterministe ou dans un environnement d'incertitude, et sur lesquels on peut agir/guider au moyen d'un contrôle afin d'optimiser un certain critère (contrôle optimal). Les origines et applications sont très diverses : ingénierie (fusée: contrôle de trajectoire), mécanique (voiture: tourner le volant, pédale d'accélérateur), gestion, économie ou finance, apprentissage automatique, jeux vidéo, robotique, etc

L'objectif de ce cours est de présenter les outils et différentes approches mathématiques de base de la théorie du contrôle optimal, notamment de la programmation dynamique, et de les illustrer par des applications concrètes notamment en économie et finance. La première partie concernera le cadre déterministe, et la seconde portera sur le cadre stochastique avec une introduction aux aspects théoriques et algorithmiques de l'apprentissage par renforcement.

Plan

Partie 1 - Optimisation déterministe

Introduction : modèle à temps discret
Approche par programmation dynamique en temps continu
Principe du maximum de Pontryagin en temps continu

Partie 2 - Introduction à l’optimisation stochastique en temps discret et à l'apprentissage par renforcement

Introduction
Processus de décision Markovien
Principe d'optimalité de Bellman
Algorithmes d'apprentissage par renforcement

Références

Part I

Carlier G. Programmation dynamique, notes de cours de l'ENSAE, 2007.
Fleming W.H. et Rishel R.W. (1975), Deterministic and Stochastic Optimal Control, Springer-Verlag.
Kamien M. et N. Schwartz: Dynamic Optimization, 1991, 2ème édition, North Holland.
Trélat E. : Contrôle optimal : théorie et applications, 2008, Vuibert, 2nde édition.

Part II

Bauerle, N. et U. Rieder (2011): Markov Decision Processes with Applications to Finance, Springer
Sutton et Barto (1998): Introduction to Reinforcement Learning.
Szepesvari (2009): Algorithms for Reinforcement Learning.
Groupe PDMIA (2008): Processus décisionnels de Markov en intelligence artificielle.

Retour