ويڊيو گيمز دنيا جي اربين رانديگرن کي چئلينج فراهم ڪرڻ جاري رکي ٿي. توهان شايد اهو اڃا تائين نه ڄاڻندا آهيو، پر مشين سکيا الگورتھم پڻ چئلينج کي وڌائڻ شروع ڪيو آهي.
في الحال AI جي شعبي ۾ تحقيق جو هڪ اهم مقدار آهي اهو ڏسڻ لاءِ ته ڇا مشين سکيا جا طريقا وڊيو گيمز تي لاڳو ٿي سگهن ٿا. هن شعبي ۾ وڏي ترقي ڏيکاري ٿي مشين جي سکيا ايجنٽ استعمال ڪري سگھجن ٿا انساني پليئر کي نقل ڪرڻ يا ان کي تبديل ڪرڻ لاءِ.
هن جي مستقبل لاء ڇا مطلب آهي وڊيو گيمز?
ڇا اهي منصوبا صرف تفريح لاءِ آهن، يا ڇا ڪي وڏا سبب آهن ڇو ته ڪيترائي محقق راندين تي ڌيان ڏئي رهيا آهن؟
هي آرٽيڪل مختصر طور تي وڊيو گيمز ۾ اي آءِ جي تاريخ کي ڳوليندو. ان کان پوءِ، اسان توهان کي ڪجهه مشيني سکيا جي ٽيڪنڪ جو هڪ تڪڙو جائزو ڏينداسين جيڪي اسان سکڻ لاءِ استعمال ڪري سگهون ٿا ته راندين کي ڪيئن هارائڻ. اسان پوءِ ڏسنداسين ته ڪجھ ڪامياب ايپليڪيشنون اعصابي جال خاص وڊيو گيمز سکڻ ۽ ماسٽر ڪرڻ لاءِ.
گیمنگ ۾ AI جي مختصر تاريخ
ان کان اڳ جو اسان ڄاڻون ته ڇو نيورل نيٽ ويڊيو گيمز کي حل ڪرڻ لاءِ مثالي الگورٿم بڻجي ويا آهن، اچو ته مختصر طور تي ڏسون ته ڪيئن ڪمپيوٽر سائنسدانن وڊيو گيمز کي استعمال ڪيو آهي AI ۾ پنهنجي تحقيق کي اڳتي وڌائڻ لاءِ.
توھان بحث ڪري سگھو ٿا، ان جي شروعات کان، وڊيو گيمز تحقيق جو ھڪڙو گرم علائقو رھيو آھي AI ۾ دلچسپي رکندڙ محققن لاءِ.
جڏهن ته اصل ۾ سختي سان هڪ وڊيو گيم ناهي، شطرنج AI جي شروعاتي ڏينهن ۾ هڪ وڏو ڌيان رهيو آهي. 1951ع ۾ ڊاڪٽر ڊيٽريچ پرنز فرانٽي مارڪ 1 ڊجيٽل ڪمپيوٽر استعمال ڪندي شطرنج کيڏڻ وارو پروگرام لکيو. اهو طريقو واپس دور ۾ هو جڏهن اهي وڏا ڪمپيوٽرن کي ڪاغذن جي ٽيپ کان پروگرام پڙهڻو پوندو هو.
پروگرام پاڻ هڪ مڪمل شطرنج AI نه هو. ڪمپيوٽر جي حدن جي ڪري، پرنز صرف هڪ پروگرام ٺاهي سگهي ٿو جيڪو ميٽ-ان-ٻن شطرنج مسئلن کي حل ڪري ٿو. سراسري طور تي، پروگرام 15-20 منٽ ورتو سفيد ۽ ڪاري رانديگرن لاءِ هر ممڪن حرڪت جي حساب سان.
شطرنج ۽ چيڪرز AI کي بهتر بڻائڻ تي ڪم سٺن ڏهاڪن ۾ مسلسل بهتر ٿي چڪو آهي. ترقي 1997 ۾ ان جي انتها تي پهتي جڏهن IBM جي ڊيپ بليو روسي شطرنج گرانڊ ماسٽر گري ڪاسپاروف کي ڇهن راندين جي هڪ جوڙي ۾ شڪست ڏني. اڄڪلهه، شطرنج انجڻ جيڪي توهان پنهنجي موبائل فون تي ڳولي سگهو ٿا، ڊيپ بليو کي شڪست ڏئي سگھن ٿا.
AI مخالفين وڊيو آرڪيڊ گيمز جي سونهري دور ۾ مقبوليت حاصل ڪرڻ شروع ڪئي. 1978 جي اسپيس انويڊرز ۽ 1980 جي Pac-Man AI ٺاهڻ ۾ صنعت جا ڪجهه علمبردار آهن جيڪي آرڪيڊ گيمرز جي تمام ويڙهاڪ کي به ڪافي حد تائين چيلينج ڪري سگهن ٿا.
Pac-Man، خاص طور تي، AI محققن تي تجربا ڪرڻ لاءِ هڪ مشهور راند هئي. مختلف گهڻن محترمه Pac-Man لاءِ منظم ڪيو ويو آهي اهو طئي ڪرڻ لاءِ ته ڪهڙي ٽيم اچي سگهي ٿي راند کي مات ڏيڻ لاءِ بهترين AI سان.
راند AI ۽ هوريسٽڪ الگورتھم ترقي ڪندي جاري رهي جيئن هوشيار مخالفن جي ضرورت پيدا ٿي. مثال طور، جنگي AI مقبوليت ۾ وڌيو جيئن جينز جهڙوڪ فرسٽ پرسن شوٽر وڌيڪ مکيه وهڪرو بڻجي ويا.
ويڊيو گيمز ۾ مشين لرننگ
جيئن ته مشين سکيا جي ٽيڪنڪ جلدي مقبوليت ۾ گلاب، مختلف تحقيقاتي منصوبن ويڊيو گيمز کيڏڻ لاء انهن نئين ٽيڪنالاجي کي استعمال ڪرڻ جي ڪوشش ڪئي.
رانديون جهڙوڪ Dota 2، StarCraft، ۽ Doom انهن لاءِ مسئلا ڪم ڪري سگهن ٿيون مشيني سکيا جا الگورٿم حل ڪرڻ. گہرے سکيا الگورتھمخاص طور تي، حاصل ڪرڻ جي قابل هئا ۽ ان کان به وڌيڪ انساني سطح جي ڪارڪردگي.
هن آرڪيڊ سکيا ماحول يا ALE محققن کي هڪ سو کان وڌيڪ Atari 2600 راندين لاءِ انٽرفيس ڏنو. اوپن سورس پليٽ فارم محققن کي اجازت ڏني ته مشين سکيا جي ٽيڪنالاجي جي ڪارڪردگي کي معياري اٽاري ويڊيو گيمز تي. گوگل پڻ پنهنجو پاڻ کي شايع ڪيو پيپر ALE کان ست رانديون استعمال ڪندي
ان دوران، منصوبا جهڙوڪ VizDoom AI محققن کي 3D فرسٽ پرسن شوٽر کيڏڻ لاءِ مشين لرننگ الگورتھم کي تربيت ڏيڻ جو موقعو ڏنو.
اهو ڪيئن ڪم ڪندو آهي: ڪجهه اهم تصور
قدرتي نيٽورڪ
مشين لرننگ سان ويڊيو گيمز کي حل ڪرڻ جا اڪثر طريقا شامل آهن هڪ قسم جو الگورٿم جنهن کي نيورل نيٽ ورڪ طور سڃاتو وڃي ٿو.
توهان هڪ اعصابي نيٽ کي هڪ پروگرام جي طور تي سوچي سگهو ٿا جيڪو نقل ڪرڻ جي ڪوشش ڪري ٿو ته دماغ ڪيئن ڪم ڪري سگهي ٿو. ساڳيءَ طرح اسان جو دماغ نيورونن مان ٺهيل آهي جيڪي سگنل منتقل ڪن ٿا، هڪ نيورل نيٽ پڻ مصنوعي نيورسن تي مشتمل آهي.
اهي مصنوعي نيورون هڪ ٻئي ڏانهن سگنل پڻ منتقل ڪن ٿا، هر سگنل هڪ حقيقي نمبر آهي. هڪ اعصابي نيٽ ۾ ان پٽ ۽ آئوٽ پٽ جي وچ ۾ ڪيترن ئي تہن تي مشتمل آهي، جنهن کي ڊيپ نيورل نيٽورڪ سڏيو ويندو آهي.
تقسيم جي سکيا
وڊيو گيمز کي سکڻ سان لاڳاپيل هڪ ٻيو عام مشين سکيا ٽيڪنڪ آهي تقويٰ جي سکيا جو خيال.
هي ٽيڪنڪ انعام يا سزا استعمال ڪندي هڪ ايجنٽ جي تربيت جو عمل آهي. هن طريقي سان، ايجنٽ کي آزمائشي ۽ غلطي ذريعي مسئلي جو حل ڪرڻ جي قابل هوندو.
اچو ته چئو ته اسان هڪ AI چاهيون ٿا اهو معلوم ڪرڻ لاءِ ته راند کيڏڻ ڪيئن آهي سانپ. راند جو مقصد سادو آهي: شيون استعمال ڪندي ۽ توهان جي وڌندڙ دم کان بچڻ سان جيترو ٿي سگهي ڪيترائي پوائنٽ حاصل ڪريو.
رينفورسمينٽ لرننگ سان، اسين ريوارڊ فنڪشن جي وضاحت ڪري سگھون ٿا. فنڪشن پوائنٽس وڌائيندو آھي جڏھن ڪو سانپ ڪا شيءِ کائي ٿو ۽ پوائنٽون ڪٽيندو آھي جڏھن سانپ ڪنھن رڪاوٽ کي ماريندو آھي. موجوده ماحول ۽ ممڪن عملن جي هڪ سيٽ کي نظر ۾ رکندي، اسان جي تقويٰ وارو سکيا وارو نمونو بهتر ’پاليسي‘ جي ڳڻپ ڪرڻ جي ڪوشش ڪندو جيڪا اسان جي انعامي ڪم کي وڌ کان وڌ ڪري.
اعصابي ارتقا
فطرت کان متاثر ٿيڻ سان گڏ موضوع کي برقرار رکندي، محقق پڻ ML کي وڊيو گيمز تي لاڳو ڪرڻ ۾ ڪاميابي حاصل ڪئي آهي هڪ ٽيڪنڪ ذريعي جيڪو نيورويوولوشن جي نالي سان مشهور آهي.
استعمال ڪرڻ بدران گريجوئيٽ نزول نيٽ ورڪ ۾ نيورسن کي اپڊيٽ ڪرڻ لاءِ، اسان بهتر نتيجا حاصل ڪرڻ لاءِ ارتقائي الگورتھم استعمال ڪري سگھون ٿا.
ارتقائي الگورتھم عام طور تي بي ترتيب ماڻهن جي شروعاتي آبادي پيدا ڪندي شروع ڪندا آهن. اسان وري انهن ماڻهن کي ڪجهه معيار استعمال ڪندي جائزو وٺون ٿا. بھترين ماڻھو چونڊيا ويندا آھن ”والدين“ ۽ انھن کي گڏ ڪيو ويندو آھي ھڪڙي نئين نسل جي ماڻھن کي ٺاھيو. اهي ماڻهو وري آبادي ۾ گهٽ ۾ گهٽ مناسب ماڻهن کي تبديل ڪندا.
اهي الگورتھم پڻ عام طور تي ميوٽيشن آپريشن جا ڪي روپ متعارف ڪرائيندا آهن ڪراس اوور دوران يا ”نسل“ جي قدم جينياتي تنوع کي برقرار رکڻ لاءِ.
ويڊيو گيمز ۾ مشين لرننگ تي نموني تحقيق
OpenAI پنج
OpenAI پنج OpenAI پاران هڪ ڪمپيوٽر پروگرام آهي جنهن جو مقصد DOTA 2 کيڏڻ آهي، هڪ مشهور ملٽي پليئر موبائل بيٽ ايرينا (MOBA) گيم.
پروگرام موجوده مضبوط ڪرڻ واري سکيا جي ٽيڪنڪ کي استعمال ڪيو، لکين فريم في سيڪنڊ کان سکڻ لاءِ ماپيل. ورهايل ٽريننگ سسٽم جي مهرباني، OpenAI هر روز 180 سالن جي قيمتي رانديون کيڏڻ جي قابل هئي.
تربيتي دور کان پوءِ، OpenAI Five ماهر سطح جي ڪارڪردگي حاصل ڪرڻ ۽ انساني رانديگرن سان تعاون جو مظاهرو ڪرڻ جي قابل ٿي ويو. 2019 ۾، OpenAI پنج ڪرڻ جي قابل ٿي ويو هار رانديگرن جو 99.4٪ عوامي ميچن ۾.
ڇو OpenAI هن راند تي فيصلو ڪيو؟ محققن جي مطابق، DOTA 2 پيچيده ميڪيڪل هئا جيڪي موجوده گہرے جي پهچ کان ٻاهر هئا قابليت جي تعليم الورورڊس
سپر ماري Bros.
وڊيو گيمز ۾ نيورل نيٽ جي هڪ ٻي دلچسپ ايپليڪيشن پليٽفارمرز کيڏڻ لاءِ نيورويوولوشن جو استعمال آهي جهڙوڪ سپر ماريو بروس.
مثال طور، هي hackathon داخلا شروع ٿئي ٿو راند جي ڪا به ڄاڻ نه هجڻ سان ۽ آهستي آهستي هڪ بنياد ٺاهي ٿو جيڪو هڪ سطح ذريعي ترقي ڪرڻ جي ضرورت آهي.
خود ترقي ڪندڙ اعصابي نيٽ راند جي موجوده حالت ۾ ٽائلس جي گرڊ جي طور تي وٺندو آهي. شروعات ۾، نيورل نيٽ کي ڪابه سمجھ نه آهي ته هر ٽائل جو مطلب ڇا آهي، صرف اهو آهي ته "ايئر" ٽائلس "زمين جي ٽائلس" ۽ "دشمن ٽائلس" کان مختلف آهن.
هيڪاٿون پروجيڪٽ جي هڪ نيورووولوشن تي عمل درآمد ڪرڻ لاءِ NEAT جينياتي الگورٿم استعمال ڪيو ويو مختلف نيورل نيٽس کي چونڊيل طور تي نسل ڏيڻ لاءِ.
اهميت
ھاڻي ته توھان ڏٺو آھي ڪي نيورل نيٽ جا مثال وڊيو گيمز کيڏڻ، توھان حيران ٿي رھيا ھئا ته ھن سڀ جو مقصد ڇا آھي.
جيئن ته وڊيو گيمز ۾ ايجنٽن ۽ انهن جي ماحول جي وچ ۾ پيچيده رابطي شامل آهن، اهو AI ٺاهڻ لاءِ بهترين ٽيسٽنگ گرائونڊ آهي. مجازي ماحول محفوظ ۽ ڪنٽرول لائق آهن ۽ ڊيٽا جي لامحدود فراهمي مهيا ڪن ٿا.
هن فيلڊ ۾ ڪيل تحقيق تحقيق ڪندڙن کي بصيرت ڏني آهي ته ڪيئن نيورل نيٽس کي بهتر بڻائي سگهجي ٿو سکڻ لاءِ ته ڪيئن حقيقي دنيا ۾ مسئلا حل ڪرڻ.
قدرتي نيٽ ورڪ متاثر ٿيل آهن ته دماغ ڪيئن ڪم ڪري ٿو قدرتي دنيا ۾. هڪ وڊيو گيم کيڏڻ جي سکيا جڏهن مصنوعي نيورون ڪيئن ڪم ڪن ٿا، ان جي مطالعي سان، اسان اهو پڻ ڄاڻ حاصل ڪري سگهون ٿا ته ڪيئن انساني دماغ ڪم.
ٿڪل
اعصابي نيٽ ورڪ ۽ دماغ جي وچ ۾ هڪجهڙائي ٻنهي شعبن ۾ بصيرت جو سبب بڻيا آهن. اڳتي هلي تحقيق ته ڪيئن نيورل نيٽ مسئلا حل ڪري سگهن ٿا ڪنهن ڏينهن جي وڌيڪ ترقي يافته شڪلن ڏانهن مصنوعي انٽيلي جنس.
تصور ڪريو هڪ AI استعمال ڪريو جيڪو توهان جي وضاحتن مطابق ٺهيل آهي جيڪو توهان کي خريد ڪرڻ کان پهريان هڪ پوري وڊيو گيم کيڏي سگهي ٿو توهان کي خبر ڏيو ته ڇا اهو توهان جي وقت جي لائق آهي. ڇا وڊيو گيم ڪمپنيون نيورل نيٽ استعمال ڪنديون ته گيم ڊيزائن کي بهتر بڻائڻ، ٽائيڪ ليول، ۽ مخالف جي مشڪلات؟
توهان ڇا ٿا سوچيو جڏهن نيورل نيٽ حتمي گيمرز بڻجي ويندا؟
جواب ڇڏي وڃو