Introduction à l’apprentissage par renforcement
Présentation
Ce cours de deuxième année du cycle ingénieur offre une introduction complète aux concepts fondamentaux et aux techniques de l’apprentissage par renforcement (RL).
RL est un domaine de l’intelligence artificielle (IA) qui se concentre sur la façon dont les agents intelligents peuvent apprendre à prendre des décisions optimales dans un environnement donné, en interagissant avec cet environnement et en recevant des récompenses ou des pénalités.
Ce cours fournira aux étudiants une base solide en théorie du RL, ainsi qu’une expérience pratique de la mise en œuvre d’algorithmes de RL pour résoudre des problèmes concrets.
Pré-requis
- Connaissances de base en calcul différentiel et intégral, en algèbre linéaire et en probabilités.
- Compétences de base en programmation (Python recommandé).
- Intérêt pour l’IA et l’apprentissage automatique.
Objectifs d’apprentissage
- Comprendre les concepts clés de l’apprentissage par renforcement, tels que les processus de décision markoviens (MDP), les fonctions de valeur et les politiques.
- Mettre en œuvre et comparer différents algorithmes de RL, tels que Q-learning, Deep Q-Networks (DQN) et REINFORCE.
- Évaluer les performances des agents RL et analyser leurs limites.
Contenus et activités
- Cours 1 : Introduction
- Théorie : Concepts de base du RL, Q-learning (.pdf)
- Pratique : Implémentation de Q-learning (.zip)
- Cours 2 : Algorithmes basés sur la valeur
- Théorie : Algorithmes SARSA et DQN (.pdf)
- Pratique : Implémentation de DQN (colab)
- Cours 3 : Algorithmes basés sur la politique
- Théorie : Algorithmes REINFORCE et Actor-Critic (.pdf)
- Pratique : Implémentation de REINFORCE (colab)
- Cours 4 : Benchmarking pour RL
- Théorie : Techniques de benchmarking, comparaisons d’algorithmes (.pdf)
- Pratique : Mise en pratique de techniques de benchmarking sur des algorithmes réalisés pendant les cours précédents (.zip)