Apprentissage par renforcement : une IA qui apprend de ses erreurs
Imaginons que vous essayez d'apprendre à un robot à marcher. Contrairement à apprendre à un ordinateur à prédire les cours des actions ou à catégoriser les images, nous ne disposons pas vraiment d'un grand ensemble de données que nous pouvons utiliser pour entraîner notre robot. Bien que cela puisse vous venir naturellement, …