L'apprentissage par renforcement est basé sur le processus de décision de Markov, une modélisation mathématique de la prise de décision qui utilise des étapes temporelles discrètes. À chaque étape, l'agent effectue une nouvelle action qui entraîne un nouvel état de l'environnement.
Qu'est-ce que l'apprentissage par renforcement ? Le reinforcement learning est une méthode du Machine Learning qui permet d'entraîner des modèles d'intelligence artificielle (IA) de manière spécifique.
L'agent IA ou l'algorithme apprend des stratégies de manière autonome.
Types d'apprentissage automatique
Il existe fondamentalement 4 types d'algorithmes d'apprentissage automatique : supervisé, semi-supervisé, non supervisé et renforcé.