Навчання з підкріпленням: штучний інтелект, який вчиться на своїх помилках
Уявімо, що ви намагаєтеся навчити робота ходити. На відміну від навчання комп’ютера прогнозуванню цін на акції чи класифікації зображень, ми насправді не маємо великого набору даних, який ми можемо використовувати для навчання нашого робота. Хоча це може здаватися вам природним,...