सुदृढीकरण सीखना: एआई जो अपनी गलतियों से सीखता है
आइए कल्पना करें कि आप एक रोबोट को चलना सिखाने की कोशिश कर रहे हैं। कंप्यूटर को स्टॉक की कीमतों की भविष्यवाणी करने या छवियों को वर्गीकृत करने के तरीके के विपरीत, हमारे पास वास्तव में एक बड़ा डेटासेट नहीं है जिसका उपयोग हम अपने रोबोट को प्रशिक्षित करने के लिए कर सकें। हालांकि यह आपके लिए स्वाभाविक रूप से आ सकता है, …