व्हिडिओ गेम खेळण्यासाठी मशीन लर्निंग वापरणे

अनुक्रमणिका[लपवा][दाखवा]

गेमिंगमधील AI चा संक्षिप्त इतिहास+-
- व्हिडिओ गेम्समध्ये मशीन लर्निंग
हे कसे कार्य करते: काही प्रमुख संकल्पना+-
व्हिडिओ गेममधील मशीन लर्निंगवरील नमुना संशोधन+-
- OpenAI पाच
- सुपर मारिओ ब्रदर्स
महत्त्व
निष्कर्ष

व्हिडिओ गेम्स जगभरातील अब्जावधी खेळाडूंना आव्हान देत आहेत. तुम्हाला कदाचित हे अजून माहित नसेल, पण मशीन लर्निंग अल्गोरिदम देखील आव्हानाला सामोरे जाऊ लागले आहेत.

व्हिडिओ गेमवर मशीन लर्निंग पद्धती लागू करता येतील का हे पाहण्यासाठी AI च्या क्षेत्रात सध्या लक्षणीय संशोधन सुरू आहे. या क्षेत्रातील भरीव प्रगती हे दर्शवते मशीन शिक्षण एजंटचा वापर मानवी खेळाडूचे अनुकरण करण्यासाठी किंवा बदलण्यासाठी केला जाऊ शकतो.

याचा भविष्यासाठी काय अर्थ होतो व्हिडिओ गेम?

हे प्रकल्प फक्त मनोरंजनासाठी आहेत किंवा अनेक संशोधक गेमवर लक्ष केंद्रित का करत आहेत याची सखोल कारणे आहेत?

हा लेख व्हिडिओ गेममधील AI चा इतिहास थोडक्यात एक्सप्लोर करेल. त्यानंतर, आम्ही तुम्हाला काही मशीन लर्निंग तंत्रांचे एक द्रुत विहंगावलोकन देऊ जे आम्ही गेम कसे हरवायचे हे शिकण्यासाठी वापरू शकतो. आम्ही नंतर काही यशस्वी अनुप्रयोग पाहू न्यूरल नेट विशिष्ट व्हिडिओ गेम शिकण्यासाठी आणि मास्टर करण्यासाठी.

गेमिंगमधील AI चा संक्षिप्त इतिहास

व्हिडीओ गेम्सचे निराकरण करण्यासाठी न्यूरल नेट हे आदर्श अल्गोरिदम का बनले आहे हे जाणून घेण्याआधी, संगणक शास्त्रज्ञांनी AI मधील त्यांचे संशोधन पुढे नेण्यासाठी व्हिडिओ गेमचा वापर कसा केला ते थोडक्यात पाहू.

तुम्ही असा युक्तिवाद करू शकता की, त्याच्या सुरुवातीपासूनच, AI मध्ये स्वारस्य असलेल्या संशोधकांसाठी व्हिडिओ गेम हे संशोधनाचे एक लोकप्रिय क्षेत्र आहे.

मूळचा व्हिडीओ गेम नसला तरी AI च्या सुरुवातीच्या काळात बुद्धिबळावर मोठ्या प्रमाणात लक्ष केंद्रित केले गेले आहे. 1951 मध्ये, डॉ. डायट्रिच प्रिंझ यांनी फेरांटी मार्क 1 डिजिटल संगणक वापरून बुद्धिबळ खेळण्याचा कार्यक्रम लिहिला. हे त्या काळात होते जेव्हा या अवजड संगणकांना कागदाच्या टेपमधून प्रोग्राम्स वाचावे लागायचे.

बुद्धिबळ अल्गोरिदम

कार्यक्रम स्वतः पूर्ण बुद्धिबळ AI नव्हता. संगणकाच्या मर्यादांमुळे, प्रिंझ फक्त एक प्रोग्राम तयार करू शकला ज्याने मेट-इन-टू बुद्धिबळातील समस्या सोडवल्या. श्वेत आणि काळ्या खेळाडूंच्या प्रत्येक संभाव्य हालचालीची गणना करण्यासाठी प्रोग्रामला सरासरी 15-20 मिनिटे लागली.

बुद्धीबळ आणि चेकर्स AI मध्ये सुधारणा करण्याचे काम दशकभरात सातत्याने सुधारले आहे. 1997 मध्ये प्रगतीचा कळस गाठला जेव्हा IBM च्या डीप ब्लूने रशियन बुद्धिबळ ग्रँडमास्टर गॅरी कास्परोव्हचा सहा-गेम सामन्यांच्या जोडीमध्ये पराभव केला. आजकाल, आपण आपल्या मोबाइल फोनवर शोधू शकणारे बुद्धिबळ इंजिन डीप ब्लूला पराभूत करू शकतात.

व्हिडिओ आर्केड गेम्सच्या सुवर्णयुगात AI विरोधकांना लोकप्रियता मिळू लागली. 1978 चे स्पेस इनव्हेडर्स आणि 1980 चे Pac-Man हे AI तयार करण्यात उद्योगातील काही प्रणेते आहेत जे अगदी सर्वात अनुभवी आर्केड गेमर्सनाही आव्हान देऊ शकतात.

पॅक-मॅन, विशेषतः, AI संशोधकांसाठी प्रयोग करण्यासाठी एक लोकप्रिय खेळ होता. विविध स्पर्धा Ms. Pac-Man साठी कोणता संघ सर्वोत्तम AI घेऊन गेम जिंकू शकतो हे ठरवण्यासाठी आयोजित केले आहे.

गेम AI आणि ह्युरिस्टिक अल्गोरिदम विकसित होत राहिले कारण हुशार विरोधकांची गरज निर्माण झाली. उदाहरणार्थ, फर्स्ट पर्सन नेमबाजांसारख्या शैली अधिक मुख्य प्रवाहात आल्याने कॉम्बॅट एआयची लोकप्रियता वाढली.

व्हिडिओ गेम्समध्ये मशीन लर्निंग

मशीन लर्निंग तंत्रे त्वरीत लोकप्रिय झाल्यामुळे, विविध संशोधन प्रकल्पांनी व्हिडिओ गेम खेळण्यासाठी या नवीन तंत्रांचा वापर करण्याचा प्रयत्न केला.

Dota 2, StarCraft आणि Doom सारखे गेम यांसाठी समस्या म्हणून काम करू शकतात मशीन शिक्षण अल्गोरिदम सोडवण्याकरिता. सखोल शिक्षण अल्गोरिदम, विशेषतः, मानवी स्तरावरील कार्यप्रदर्शन साध्य करण्यात आणि मागे टाकण्यास सक्षम होते.

अगोदर निर्देश केलेल्या बाबीसंबंधी बोलताना आर्केड शिक्षण पर्यावरण किंवा ALE ने संशोधकांना शंभर अटारी 2600 गेमसाठी इंटरफेस दिला. ओपन-सोर्स प्लॅटफॉर्मने संशोधकांना क्लासिक अटारी व्हिडिओ गेमवरील मशीन लर्निंग तंत्राच्या कामगिरीचे बेंचमार्क करण्याची परवानगी दिली. Google ने त्यांचे स्वतःचे प्रकाशन देखील केले कागद ALE कडून सात गेम वापरणे

व्हिडिओ गेममध्ये मशीन लर्निंगची चाचणी करण्यासाठी aLE चा वापर केला जातो

दरम्यान, प्रकल्प जसे VizDoom AI संशोधकांना 3D फर्स्ट पर्सन नेमबाज खेळण्यासाठी मशीन लर्निंग अल्गोरिदम प्रशिक्षित करण्याची संधी दिली.

ML FPS खेळण्यासाठी प्रशिक्षण देण्यासाठी VizDoom हे एक उत्कृष्ट स्त्रोत आहे

हे कसे कार्य करते: काही प्रमुख संकल्पना

मज्जासंस्था नेटवर्क

मशीन लर्निंगसह व्हिडीओ गेम सोडवण्याच्या बहुतेक पद्धतींमध्ये न्यूरल नेटवर्क म्हणून ओळखल्या जाणार्‍या अल्गोरिदमचा समावेश असतो.

तुम्ही न्यूरल नेटचा एक प्रोग्राम म्हणून विचार करू शकता जो मेंदूच्या कार्याची नक्कल करण्याचा प्रयत्न करतो. आपला मेंदू सिग्नल प्रसारित करणार्‍या न्यूरॉन्सने कसा बनलेला असतो त्याचप्रमाणे, न्यूरल नेटमध्ये कृत्रिम न्यूरॉन्स देखील असतात.

हे कृत्रिम न्यूरॉन्स देखील एकमेकांना सिग्नल हस्तांतरित करतात, प्रत्येक सिग्नल एक वास्तविक संख्या आहे. न्यूरल नेटमध्ये इनपुट आणि आउटपुट स्तरांमधील अनेक स्तर असतात, ज्याला डीप न्यूरल नेटवर्क म्हणतात.

मजबुतीकरण शिक्षण

व्हिडिओ गेम शिकण्याशी संबंधित आणखी एक सामान्य मशीन लर्निंग तंत्र म्हणजे मजबुतीकरण शिक्षणाची कल्पना.

हे तंत्र बक्षिसे किंवा शिक्षा वापरून एजंटला प्रशिक्षण देण्याची प्रक्रिया आहे. या दृष्टिकोनासह, एजंट चाचणी आणि त्रुटीद्वारे समस्येचे निराकरण करण्यास सक्षम असावे.

Snake हा गेम कसा खेळायचा हे शोधण्यासाठी आम्हाला एआय हवे आहे असे समजा. गेमचे उद्दिष्ट सोपे आहे: वस्तूंचे सेवन करून आणि आपली वाढणारी शेपटी टाळून शक्य तितके गुण मिळवा.

साप वर मजबुतीकरण शिक्षण

मजबुतीकरण शिक्षणासह, आम्ही रिवॉर्ड फंक्शन आर परिभाषित करू शकतो. जेव्हा साप एखादी वस्तू खातो तेव्हा फंक्शन गुण जोडते आणि जेव्हा साप अडथळा आणतो तेव्हा गुण वजा करतो. सध्याचे वातावरण आणि संभाव्य कृतींचा संच लक्षात घेता, आमचे सुदृढीकरण शिक्षण मॉडेल इष्टतम 'पॉलिसी' ची गणना करण्याचा प्रयत्न करेल जे आमचे रिवॉर्ड फंक्शन वाढवते.

न्यूरोइव्होल्यूशन

निसर्गाने प्रेरित होण्याबरोबरच, संशोधकांना न्यूरोइव्होल्यूशन नावाच्या तंत्राद्वारे व्हिडिओ गेममध्ये एमएल लागू करण्यातही यश मिळाले आहे.

त्याऐवजी वापरण्याऐवजी ग्रेडियंट डिसेंट नेटवर्कमध्ये न्यूरॉन्स अद्ययावत करण्यासाठी, आम्ही उत्क्रांतीवादी अल्गोरिदम वापरू शकतो चांगले परिणाम प्राप्त करण्यासाठी.

उत्क्रांतीवादी अल्गोरिदम सामान्यत: यादृच्छिक व्यक्तींची प्रारंभिक लोकसंख्या निर्माण करून सुरू होतात. त्यानंतर आम्ही काही निकष वापरून या व्यक्तींचे मूल्यांकन करतो. सर्वोत्कृष्ट व्यक्ती "पालक" म्हणून निवडल्या जातात आणि व्यक्तींची नवीन पिढी तयार करण्यासाठी त्यांना एकत्र केले जाते. या व्यक्ती नंतर लोकसंख्येतील सर्वात कमी फिट असलेल्या व्यक्तींची जागा घेतील.

हे अल्गोरिदम सामान्यत: अनुवांशिक विविधता राखण्यासाठी क्रॉसओवर किंवा "प्रजनन" चरणादरम्यान काही प्रकारचे उत्परिवर्तन ऑपरेशन देखील सादर करतात.

व्हिडिओ गेममधील मशीन लर्निंगवरील नमुना संशोधन

OpenAI पाच

ओपनएआय फाइव्ह डोटा 2 खेळते

OpenAI पाच ओपनएआयचा एक संगणक प्रोग्राम आहे ज्याचा उद्देश DOTA 2, एक लोकप्रिय मल्टीप्लेअर मोबाइल बॅटल एरिना (MOBA) गेम खेळणे आहे.

कार्यक्रमाने विद्यमान मजबुतीकरण शिक्षण तंत्राचा फायदा घेतला, प्रति सेकंद लाखो फ्रेम्समधून शिकण्यासाठी स्केल केले. वितरित प्रशिक्षण प्रणालीमुळे, OpenAI दररोज 180 वर्षांचे गेम खेळू शकले.

प्रशिक्षण कालावधीनंतर, ओपनएआय फाइव्ह तज्ञ-स्तरीय कामगिरी साध्य करण्यात आणि मानवी खेळाडूंसह सहकार्य प्रदर्शित करण्यात सक्षम झाले. 2019 मध्ये, OpenAI पाच सक्षम होते पराभव सार्वजनिक सामन्यांमध्ये 99.4% खेळाडू.

व्हिडिओ गेममध्ये dota 2 मशीन लर्निंग

OpenAI ने हा गेम का ठरवला? संशोधकांच्या मते, DOTA 2 मध्ये जटिल मेकॅनिक्स होते जे विद्यमान खोलच्या आवाक्याबाहेर होते मजबुतीकरण शिक्षण अल्गोरिदम.

सुपर मारिओ ब्रदर्स

व्हिडिओ गेम्समध्ये न्यूरल नेटचा आणखी एक मनोरंजक अनुप्रयोग म्हणजे सुपर मारियो ब्रदर्स सारख्या प्लॅटफॉर्मर खेळण्यासाठी न्यूरोइव्होल्यूशनचा वापर.

उदाहरणार्थ, हे हॅकाथॉन प्रवेश खेळाचे ज्ञान नसल्यापासून सुरुवात होते आणि हळूहळू एका स्तरावर प्रगती करण्यासाठी काय आवश्यक आहे याचा पाया तयार होतो.

सुपर मारियो सारख्या व्हिडिओ गेममधील मशीन लर्निंग न्यूरोइव्होल्यूशनवर अवलंबून राहू शकते

स्वयं-विकसित न्यूरल नेट गेमच्या सद्य स्थितीत टाइल्सच्या ग्रिडच्या रूपात घेते. सुरुवातीला, न्यूरल नेटला प्रत्येक टाइलचा अर्थ काय आहे हे समजत नाही, फक्त "एअर" टाइल्स "ग्राउंड टाइल्स" आणि "शत्रू टाइल्स" पेक्षा वेगळ्या आहेत.

हॅकाथॉन प्रकल्पाच्या न्यूरोइव्होल्यूशनच्या अंमलबजावणीमध्ये NEAT अनुवांशिक अल्गोरिदमचा वापर करून निवडकपणे वेगवेगळ्या न्यूरल नेट्सची पैदास केली गेली.

महत्त्व

आता तुम्ही व्हिडीओ गेम्स खेळणाऱ्या न्यूरल नेटची काही उदाहरणे पाहिली असतील, तर तुम्हाला कदाचित आश्चर्य वाटेल की या सगळ्याचा मुद्दा काय आहे.

व्हिडीओ गेम्समध्ये एजंट आणि त्यांचे वातावरण यांच्यातील गुंतागुंतीचा परस्परसंवाद समाविष्ट असल्याने, AI बनवण्यासाठी ते परिपूर्ण चाचणी मैदान आहे. आभासी वातावरण सुरक्षित आणि नियंत्रणीय आहेत आणि डेटाचा अमर्याद पुरवठा प्रदान करतात.

या क्षेत्रात केलेल्या संशोधनाने संशोधकांना वास्तविक जगात समस्यांचे निराकरण कसे करावे हे शिकण्यासाठी न्यूरल नेट कसे ऑप्टिमाइझ केले जाऊ शकतात याबद्दल अंतर्दृष्टी दिली आहे.

न्युरल नेटवर्क नैसर्गिक जगात मेंदू कसे कार्य करतात यावरून प्रेरित आहेत. व्हिडिओ गेम कसे खेळायचे हे शिकताना कृत्रिम न्यूरॉन्स कसे वागतात याचा अभ्यास करून, आम्ही कसे याबद्दल अंतर्दृष्टी देखील मिळवू शकतो. मानवी मेंदू कार्य करते.

निष्कर्ष

न्यूरल नेटवर्क आणि मेंदू यांच्यातील समानतेमुळे दोन्ही क्षेत्रांमध्ये अंतर्दृष्टी निर्माण झाली आहे. न्यूरल नेट समस्या कशा सोडवू शकतात यावर सतत संशोधन केल्याने एखाद्या दिवशी अधिक प्रगत प्रकार होऊ शकतात कृत्रिम बुद्धिमत्ता.

तुमच्या स्पेसिफिकेशन्सनुसार तयार केलेला एआय वापरण्याची कल्पना करा जो तुमचा वेळ योग्य आहे की नाही हे तुम्हाला कळवण्यासाठी तो खरेदी करण्यापूर्वी संपूर्ण व्हिडिओ गेम खेळू शकतो. व्हिडिओ गेम कंपन्या गेम डिझाइन, चिमटा पातळी आणि प्रतिस्पर्ध्याची अडचण सुधारण्यासाठी न्यूरल नेट वापरतील का?

जेव्हा न्यूरल नेट अंतिम गेमर बनतील तेव्हा काय होईल असे तुम्हाला वाटते?

व्हिडिओ गेम खेळण्यासाठी न्यूरल नेट कसे शिकवायचे

व्हिडिओ गेम खेळण्यासाठी मशीन लर्निंग वापरणे – एक विहंगावलोकन