Posílení učení: AI, která se učí ze svých chyb
Představme si, že se snažíte naučit robota chodit. Na rozdíl od učení počítače, jak předpovídat ceny akcií nebo kategorizovat obrázky, ve skutečnosti nemáme velký soubor dat, který bychom mohli použít k výcviku našeho robota. I když vám to může přijít přirozené,…