Reinforcement Learning: AI die leert van zijn fouten
Stel je voor dat je een robot probeert te leren lopen. In tegenstelling tot het leren van een computer om aandelenkoersen te voorspellen of afbeeldingen te categoriseren, hebben we niet echt een grote dataset die we kunnen gebruiken om onze robot te trainen. Hoewel het voor jou misschien vanzelfsprekend is,…