یادگیری تقویتی: هوش مصنوعی که از اشتباهات خود درس می گیرد
بیایید تصور کنیم که در حال تلاش برای آموزش راه رفتن به یک ربات هستید. برخلاف آموزش رایانه برای پیشبینی قیمت سهام یا دستهبندی تصاویر، ما واقعاً مجموعه داده بزرگی نداریم که بتوانیم از آن برای آموزش ربات خود استفاده کنیم. در حالی که ممکن است به طور طبیعی برای شما پیش بیاید،…