Mokymosi stiprinimas: AI, kuris mokosi iš savo klaidų
Įsivaizduokime, kad bandote išmokyti robotą vaikščioti. Priešingai nei mokydami kompiuterį nuspėti akcijų kainas ar suskirstyti vaizdus į kategorijas, mes iš tikrųjų neturime didelio duomenų rinkinio, kurį galėtume panaudoti mokydami savo robotą. Nors jums tai gali pasirodyti savaime,…