Cette section présente les liens vers le matériel et les livrables semaines par semaines:
Semaine | Matériel | Exercises | Livrables |
---|---|---|---|
125 Août |
IntroductionFormulation du problème: fonction de coût, contraintes, politique, etc.
|
|
C.1.5 : Fonction de coût pour un pendule |
28 Sept |
Programmation dynamique
|
|
C.2.1 : Navigation optimale dans un graphe |
315 Sept |
Commande stochastique
|
|
C.3.1 Loi de commande pour une suspension active |
422 Sept (AM!) |
Équation de Bellman et algorithmes
|
|
C.6.1 Gestion optimale d'un barrage |
529 Sept (AM!) |
Solution LQR
|
|
C.5.1 Solution LQR par programmation dynamique |
66 Oct (AM!) |
Apprentissage par renforcement (Q-learning)
|
|
C.7.1 Q-learning pour une navigation optimale |
727 Oct |
Approximation de fonctions
|
|
C.7.2 Q-learning avec approximation de fonctions |
83 Nov |
Implémentation
|
|
C.8.3 : Classe Gym pour votre projet |
910 Nov |
À venir!
|
|
Définition de projet (1 page) |
1017 Nov (AM!) |
À venir!
|
|
Examen |
1124 Nov |
À venir!
|
|
- |
121 Déc |
À venir!
|
|
- |
138 Déc |
À venir!
|
|
Présentation des projets et code source |