IFT-4201 Apprentissage par renforcement
Outils théoriques expliquant les raisons, les conditions et les garanties de fonctionnement d'un algorithme; formulation d'un problème réel (instance d'apprentissage par renforcement interactif); caractérisation empirique des algorithmes; environnements simples (Multi-Armed Bandit) communément utilisés pour aborder des problèmes d'apprentissage par renforcement interactif; algorithmes fondamentaux (Upper Confidence Bound, Thompson Sampling) permettant d'aborder le compromis exploration-exploitation en apprentissage par renforcement; utilisation efficace de l'information structurelle par la régression paramétrique ou non et par les réseaux de neurones; variantes dans les dynamiques des environnements et applications associées, y compris l'optimisation bayésienne; prise de décision séquentielle dans les processus de décision markoviens (MDP).
Responsables
- Faculté des sciences et de génie
- Département d'informatique et de génie logiciel
Préalables
(GLO-2100 OU IFT-2008) ET (MAT-1200 OU MAT-2930 OU PHY-1001) ET (IFT-4102* OU GIF-4101*)
* Indique un préalable qui peut être suivi simultanément.
Cette activité est contributoire dans:
Cours équivalents ou jumelés ULaval
Les cours équivalents sont des activités de même cycle dont le contenu est identique ou très semblable. La réussite de l'un signifie la reconnaissance de l'autre.
Les cours jumelés sont des activités de cycles différents. L'étudiant qui a suivi le cours de niveau 4000 ne peut pas suivre le cours correspondant de niveau 6000 ou 7000 s'il poursuit des études au 2e ou au 3e cycle et il ne peut pas demander à la direction de son programme de le reconnaître.
Cette page constitue la description officielle de cette activité. L'Université Laval se réserve le droit de modifier l'activité sans préavis. Tous les horaires indiqués sont sujets à changement.
Répartition hebdomadaire
- 3h Cours
- 0h Laboratoire ou travaux pratiques
- 6h Travail personnel
- 9h Total
Horaire
Pour vous inscrire, accédez à monPortail.
Automne 2023 – 1 section offerte
NRC 85775 Capacité maximale: 3 étudiants Enseignant: Audrey Durand
Plages horaires
-
- Type: Sur Internet
- Dates: Du 5 sept. 2023 au 15 déc. 2023
-
- Type: En classe
- Dates: Du 5 sept. 2023 au 15 déc. 2023
- Journée: Jeudi
- Horaire: De 9h30 à 12h20
- Pavillon: Adrien-Pouliot
- Local: 2573
Automne 2022 – 1 section offerte
NRC 85843 Capacité maximale: 10 étudiants
Plage horaire
-
- Type: Classe virtuelle synchrone
- Dates: Du 6 sept. 2022 au 16 déc. 2022
- Journée: Jeudi
- Horaire: De 9h30 à 12h20
Automne 2021 – 1 section offerte
NRC 86158 Capacité maximale: 5 étudiants
Plage horaire
-
- Type: Classe virtuelle synchrone
- Dates: Du 30 août 2021 au 10 déc. 2021
- Journée: Jeudi
- Horaire: De 9h30 à 12h20