Обучение с подкреплением: ИИ, который учится на своих ошибках
Давайте представим, что вы пытаетесь научить робота ходить. В отличие от обучения компьютера тому, как предсказывать цены акций или классифицировать изображения, у нас действительно нет большого набора данных, который мы могли бы использовать для обучения нашего робота. Хотя это может быть естественным для вас, …