Cette section présente les liens vers le matériel et les livrables semaines par semaines:
Semaine | Matériel | Exercises | Livrables |
---|---|---|---|
126 Août |
IntroductionFormulation du problème: fonction de coût, contraintes, politique, etc.
|
|
C.1.5 : Fonction de coût pour un pendule |
23 sept |
Programmation dynamique
|
|
C.2.1 : Navigation optimale dans un graphe |
39 sept |
Commande stochastique
|
|
C.3.1 Loi de commande pour une suspension active |
416 sept |
Équation de Bellman et algorithmes
|
|
C.6.1 Gestion optimale d'un barrage |
523 sept (AM!) |
Solution LQR
|
|
C.5.1 Solution LQR par programmation dynamique |
630 sept |
Apprentissage par renforcement (Q-learning)
|
|
C.7.1 Q-learning pour une navigation optimale |
77 octobre |
Approximation de fonctions
|
|
C.7.2 Q-learning avec approximation de fonctions |
828 octobre |
Implémentation
|
|
C.8.3 : Classe Gym pour votre projet |
94 Nov |
À venir!
|
|
Définition de projet (1 page) |
1011 Novembre |
À venir!
|
|
Examen |
1118 Novembre |
À venir!
|
|
- |
1225 Novembre |
À venir!
|
|
- |
132 Décembre |
À venir!
|
|
Présentation des projets et code source |