بازی های ویدیویی همچنان چالشی برای میلیاردها بازیکن در سراسر جهان است. شاید هنوز آن را ندانید، اما الگوریتمهای یادگیری ماشین نیز شروع به مقابله با این چالش کردهاند.
در حال حاضر تحقیقات قابل توجهی در زمینه هوش مصنوعی وجود دارد تا ببینیم آیا روش های یادگیری ماشینی را می توان در بازی های ویدیویی به کار برد یا خیر. پیشرفت قابل توجه در این زمینه نشان می دهد فراگیری ماشین عوامل می توانند برای تقلید و یا حتی جایگزینی بازیکن انسانی استفاده شوند.
این چه معنایی برای آینده دارد بازی های ویدئویی?
آیا این پروژهها صرفاً برای سرگرمی هستند یا دلایل عمیقتری برای تمرکز بسیاری از محققان بر روی بازیها وجود دارد؟
این مقاله به طور مختصر به بررسی تاریخچه هوش مصنوعی در بازی های ویدیویی می پردازد. پس از آن، مروری اجمالی از برخی تکنیکهای یادگیری ماشینی که میتوانیم برای یادگیری نحوه شکست دادن بازیها استفاده کنیم، به شما ارائه میکنیم. سپس به برخی از برنامه های کاربردی موفق نگاه خواهیم کرد شبکه های عصبی برای یادگیری و تسلط بر بازی های ویدیویی خاص.
تاریخچه مختصر هوش مصنوعی در بازی
قبل از اینکه به این موضوع بپردازیم که چرا شبکههای عصبی به الگوریتم ایدهآل برای حل بازیهای ویدیویی تبدیل شدهاند، اجازه دهید به طور خلاصه به نحوه استفاده دانشمندان رایانه از بازیهای ویدیویی برای پیشبرد تحقیقات خود در زمینه هوش مصنوعی نگاه کنیم.
میتوانید استدلال کنید که از ابتدای پیدایش، بازیهای ویدیویی یک حوزه تحقیقاتی داغ برای محققان علاقهمند به هوش مصنوعی بوده است.
اگرچه شطرنج در اصل یک بازی ویدیویی نیست، اما در روزهای اولیه هوش مصنوعی تمرکز زیادی داشته است. در سال 1951، دکتر دیتریش پرینز یک برنامه شطرنج با استفاده از کامپیوتر دیجیتال Ferranti Mark 1 نوشت. این در دورانی بود که این کامپیوترهای حجیم مجبور بودند برنامه ها را از روی نوار کاغذی بخوانند.
خود این برنامه یک هوش مصنوعی کامل شطرنج نبود. به دلیل محدودیتهای رایانه، پرینز فقط میتوانست برنامهای ایجاد کند که مشکلات شطرنج را با هم حل کند. برنامه به طور متوسط 15-20 دقیقه طول کشید تا هر حرکت ممکن برای بازیکنان سفید و سیاه محاسبه شود.
کار بر روی بهبود هوش مصنوعی شطرنج و چکرز در طول دهه ها به طور پیوسته بهبود یافته است. این پیشرفت در سال 1997 به اوج خود رسید، زمانی که دیپ بلو IBM در یک جفت مسابقه شش بازی، استاد بزرگ شطرنج روسی، گری کاسپاروف را شکست داد. امروزه موتورهای شطرنجی که می توانید در تلفن همراه خود پیدا کنید می توانند Deep Blue را شکست دهند.
مخالفان هوش مصنوعی در دوران طلایی بازی های ویدیویی محبوبیت پیدا کردند. Space Invaders 1978 و Pac-Man دهه 1980 برخی از پیشگامان صنعت در ایجاد هوش مصنوعی هستند که می تواند به اندازه کافی حتی قدیمی ترین گیمرهای آرکید را به چالش بکشد.
Pac-Man، به ویژه، یک بازی محبوب برای محققان هوش مصنوعی بود تا روی آن آزمایش کنند. مختلف مسابقات برای خانم Pac-Man سازماندهی شده است تا مشخص شود کدام تیم می تواند بهترین هوش مصنوعی را برای شکست دادن بازی ارائه دهد.
هوش مصنوعی بازی و الگوریتمهای اکتشافی با افزایش نیاز به حریفان باهوشتر به تکامل خود ادامه دادند. برای مثال، با تبدیل شدن ژانرهایی مانند تیراندازی اول شخص، محبوبیت هوش مصنوعی رزمی افزایش یافت.
یادگیری ماشینی در بازی های ویدیویی
از آنجایی که تکنیکهای یادگیری ماشینی به سرعت محبوبیت پیدا کردند، پروژههای تحقیقاتی مختلف سعی کردند از این تکنیکهای جدید برای انجام بازیهای ویدیویی استفاده کنند.
بازی هایی مانند Dota 2، StarCraft و Doom می توانند به عنوان مشکل برای این افراد عمل کنند الگوریتم های یادگیری ماشین برطرف كردن. الگوریتم های یادگیری عمیقبه ویژه، توانستند به عملکرد در سطح انسانی دست یابند و حتی از آن پیشی بگیرند.
La محیط یادگیری Arcade یا ALE به محققان یک رابط برای بیش از صد بازی Atari 2600 داد. پلتفرم منبع باز به محققان اجازه می دهد تا عملکرد تکنیک های یادگیری ماشین را در بازی های ویدیویی کلاسیک آتاری محک بزنند. گوگل حتی خود را منتشر کرد مقاله با استفاده از هفت بازی از ALE
در همین حال، پروژه هایی مانند VizDoom به محققان هوش مصنوعی این فرصت را داد تا الگوریتم های یادگیری ماشینی را برای بازی تیراندازی اول شخص سه بعدی آموزش دهند.
چگونه کار می کند: برخی از مفاهیم کلیدی
شبکه های عصبی
بیشتر رویکردها برای حل بازی های ویدیویی با یادگیری ماشینی شامل نوعی الگوریتم به نام شبکه عصبی است.
شما می توانید یک شبکه عصبی را به عنوان برنامه ای در نظر بگیرید که سعی می کند عملکرد مغز را تقلید کند. مشابه اینکه مغز ما از نورون هایی تشکیل شده است که سیگنال را منتقل می کنند، یک شبکه عصبی نیز حاوی نورون های مصنوعی است.
این نورون های مصنوعی همچنین سیگنال ها را به یکدیگر منتقل می کنند و هر سیگنال یک عدد واقعی است. یک شبکه عصبی حاوی چندین لایه بین لایه های ورودی و خروجی است که شبکه عصبی عمیق نامیده می شود.
تقویت یادگیری
یکی دیگر از تکنیک های رایج یادگیری ماشینی مرتبط با یادگیری بازی های ویدئویی، ایده یادگیری تقویتی است.
این تکنیک فرآیند آموزش یک عامل با استفاده از پاداش یا تنبیه است. با این رویکرد، عامل باید بتواند راه حلی برای یک مشکل از طریق آزمون و خطا ارائه دهد.
بیایید بگوییم که ما یک هوش مصنوعی می خواهیم تا بفهمیم چگونه بازی Snake را بازی کنیم. هدف بازی ساده است: با مصرف آیتم ها و اجتناب از رشد دم خود تا حد امکان امتیاز کسب کنید.
با یادگیری تقویتی، میتوانیم تابع پاداش R را تعریف کنیم. این تابع زمانی که Snake یک آیتم را مصرف میکند امتیاز اضافه میکند و زمانی که Snake به مانعی برخورد میکند، امتیاز را کم میکند. با توجه به محیط کنونی و مجموعهای از اقدامات ممکن، مدل یادگیری تقویتی ما سعی میکند «سیاست» بهینهای را محاسبه کند که عملکرد پاداش ما را به حداکثر میرساند.
تکامل عصبی
با توجه به الهام گرفتن از طبیعت، محققان همچنین موفق شده اند از طریق تکنیکی به نام تکامل عصبی، ML را در بازی های ویدیویی به کار ببرند.
بجای استفاده از نزول شیب برای به روز رسانی نورون ها در یک شبکه، می توانیم از الگوریتم های تکاملی برای دستیابی به نتایج بهتر استفاده کنیم.
الگوریتمهای تکاملی معمولاً با تولید یک جمعیت اولیه از افراد تصادفی شروع میشوند. سپس با استفاده از معیارهای خاصی این افراد را ارزیابی می کنیم. بهترین افراد به عنوان "والدین" انتخاب می شوند و با هم پرورش می یابند تا نسل جدیدی از افراد را تشکیل دهند. سپس این افراد جایگزین افراد با کمترین تناسب در جمعیت خواهند شد.
این الگوریتمها همچنین معمولاً نوعی از عملیات جهش را در مرحله متقاطع یا «پرورش» برای حفظ تنوع ژنتیکی معرفی میکنند.
نمونه تحقیق در مورد یادگیری ماشین در بازی های ویدیویی
OpenAI Five
OpenAI Five یک برنامه کامپیوتری توسط OpenAI است که هدف آن بازی DOTA 2، یک بازی محبوب چند نفره نبرد موبایل (MOBA) است.
این برنامه از تکنیکهای یادگیری تقویتی موجود استفاده کرد که برای یادگیری از میلیونها فریم در ثانیه مقیاسبندی شدند. به لطف یک سیستم آموزشی توزیع شده، OpenAI قادر بود هر روز 180 سال بازی انجام دهد.
پس از دوره آموزشی، OpenAI Five توانست به عملکرد در سطح متخصص دست یابد و همکاری با بازیکنان انسانی را نشان دهد. در سال 2019، OpenAI Five توانست شکست 99.4 درصد از بازیکنان در مسابقات عمومی.
چرا OpenAI در مورد این بازی تصمیم گرفت؟ به گفته محققان، DOTA 2 مکانیک پیچیده ای داشت که خارج از دسترس اعماق موجود بود تقویت یادگیری الگوریتم ها
برادران سوپر ماریو
یکی دیگر از کاربردهای جالب شبکه های عصبی در بازی های ویدیویی، استفاده از تکامل عصبی برای بازی پلتفرمرهایی مانند Super Mario Bros است.
به عنوان مثال ، این ورودی هکاتون با عدم آگاهی از بازی شروع می کند و به آرامی پایه ای از آنچه برای پیشرفت در یک سطح لازم است را می سازد.
شبکه عصبی خود تکاملیافته، وضعیت فعلی بازی را به عنوان شبکهای از کاشیها به خود میگیرد. در ابتدا، شبکه عصبی درکی از معنای هر کاشی ندارد، فقط اینکه کاشی های "هوا" با "کاشی های زمینی" و "کاشی های دشمن" متفاوت هستند.
اجرای یک تکامل عصبی توسط پروژه هکاتون از الگوریتم ژنتیک NEAT برای پرورش شبکه های عصبی مختلف به صورت انتخابی استفاده کرد.
اهمیت
اکنون که نمونههایی از شبکههای عصبی در حال انجام بازیهای ویدیویی را مشاهده کردهاید، ممکن است از خود بپرسید که هدف از این همه چیست.
از آنجایی که بازیهای ویدیویی شامل تعاملات پیچیده بین عوامل و محیطهایشان میشود، میدان آزمایشی عالی برای ساخت هوش مصنوعی است. محیط های مجازی ایمن و قابل کنترل هستند و منبع بی نهایت داده را ارائه می دهند.
تحقیقات انجام شده در این زمینه به محققان بینشی در مورد چگونگی بهینه سازی شبکه های عصبی برای یادگیری نحوه حل مسائل در دنیای واقعی داده است.
شبکه های عصبی از نحوه عملکرد مغزها در دنیای طبیعی الهام گرفته شده است. با مطالعه نحوه رفتار نورون های مصنوعی هنگام یادگیری نحوه بازی کردن یک بازی ویدیویی، ممکن است بینشی در مورد چگونگی مغز انسان کار می کند.
نتیجه
شباهت های بین شبکه های عصبی و مغز به بینش هایی در هر دو زمینه منجر شده است. تحقیقات مداوم در مورد اینکه چگونه شبکه های عصبی می توانند مشکلات را حل کنند ممکن است روزی به اشکال پیشرفته تری منجر شود هوش مصنوعی.
تصور کنید از یک هوش مصنوعی متناسب با مشخصات شما استفاده میکنید که میتواند یک بازی ویدیویی کامل را قبل از خرید انجام دهد تا به شما اطلاع دهد که آیا ارزش وقت گذاشتن را دارد یا خیر. آیا شرکتهای بازیهای ویدیویی از شبکههای عصبی برای بهبود طراحی بازی، سطح تغییر و سختی حریف استفاده میکنند؟
فکر می کنید چه اتفاقی می افتد زمانی که شبکه های عصبی تبدیل به گیمر نهایی شوند؟
پاسخ دهید