Okrepljeno učenje: AI, ki se uči iz svojih napak
Predstavljajmo si, da poskušate robota naučiti hoditi. Za razliko od učenja računalnika, kako napovedati cene delnic ali kategorizirati slike, v resnici nimamo velikega nabora podatkov, ki bi ga lahko uporabili za usposabljanje našega robota. Čeprav vam je to morda samoumevno, …