Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction à Reinforcement Learning
- Aperçu de l'apprentissage par renforcement et de ses applications
- Différences entre l'apprentissage supervisé, non supervisé et par renforcement
- Concepts clés : agent, environnement, récompenses et politique
Processus de décision de Markov (PDM)
- Comprendre les états, les actions, les récompenses et les transitions d'état
- Fonctions de valeur et équation de Bellman
- Programmation dynamique pour résoudre les PDM
Algorithmes RL de base
- Méthodes tabulaires : Q-Learning et SARSA
- Méthodes basées sur la politique : Algorithme REINFORCE
- Cadres de critique d'acteur et leurs applications
Profonds Reinforcement Learning
- Introduction aux réseaux Q profonds (DQN)
- Reprise d'expérience et réseaux cibles
- Gradients de politique et méthodes avancées de RL profond
Cadres et outils de RL
- Introduction à OpenAI Gym et à d'autres environnements RL
- Utilisation de PyTorch ou TensorFlow pour le développement de modèles RL
- Entraînement, test et évaluation des agents RL
Les défis du RL
- Équilibrer l'exploration et l'exploitation dans la formation
- Traiter les récompenses éparses et les problèmes d'attribution de crédits
- [Défis en matière de flexibilité et de calcul dans le domaine de la logique des relations interpersonnelles
Travaux pratiques Activiti
- Mise en œuvre des algorithmes Q-Learning et SARSA à partir de zéro
- Formation d'un agent basé sur le DQN pour jouer à un jeu simple en OpenAI Gym
- Ajustement des modèles RL pour améliorer les performances dans des environnements personnalisés
Résumé et prochaines étapes
Pré requis
- Forte compréhension des principes et algorithmes d'apprentissage automatique
- Maîtrise de la programmation Python.
- Familiarité avec les réseaux neuronaux et les cadres d'apprentissage profond.
Audience
- Ingénieurs en apprentissage automatique
- Spécialistes de l'IA
14 Heures
Nos clients témoignent (1)
Formateur répondant aux questions au fur et à mesure.
Adrian
Formation - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Traduction automatique