Aprenentatge de reforç: IA que aprèn dels seus errors
Imaginem que estàs intentant ensenyar a caminar a un robot. A diferència d'ensenyar a un ordinador com predir els preus de les accions o categoritzar les imatges, realment no tenim un conjunt de dades gran que puguem utilitzar per entrenar el nostre robot. Tot i que et pot venir de manera natural,...