استفاده از یادگیری ماشینی برای اجرای بازی های ویدئویی

فهرست مندرجات[پنهان شدن][نمایش]

تاریخچه مختصر هوش مصنوعی در بازی+-
- یادگیری ماشینی در بازی های ویدیویی
چگونه کار می کند: برخی از مفاهیم کلیدی+-
نمونه تحقیق در مورد یادگیری ماشین در بازی های ویدیویی+-
- OpenAI Five
- برادران سوپر ماریو
اهمیت
نتیجه

بازی های ویدیویی همچنان چالشی برای میلیاردها بازیکن در سراسر جهان است. شاید هنوز آن را ندانید، اما الگوریتم‌های یادگیری ماشین نیز شروع به مقابله با این چالش کرده‌اند.

در حال حاضر تحقیقات قابل توجهی در زمینه هوش مصنوعی وجود دارد تا ببینیم آیا روش های یادگیری ماشینی را می توان در بازی های ویدیویی به کار برد یا خیر. پیشرفت قابل توجه در این زمینه نشان می دهد فراگیری ماشین عوامل می توانند برای تقلید و یا حتی جایگزینی بازیکن انسانی استفاده شوند.

این چه معنایی برای آینده دارد بازی های ویدئویی?

آیا این پروژه‌ها صرفاً برای سرگرمی هستند یا دلایل عمیق‌تری برای تمرکز بسیاری از محققان بر روی بازی‌ها وجود دارد؟

این مقاله به طور مختصر به بررسی تاریخچه هوش مصنوعی در بازی های ویدیویی می پردازد. پس از آن، مروری اجمالی از برخی تکنیک‌های یادگیری ماشینی که می‌توانیم برای یادگیری نحوه شکست دادن بازی‌ها استفاده کنیم، به شما ارائه می‌کنیم. سپس به برخی از برنامه های کاربردی موفق نگاه خواهیم کرد شبکه های عصبی برای یادگیری و تسلط بر بازی های ویدیویی خاص.

تاریخچه مختصر هوش مصنوعی در بازی

قبل از اینکه به این موضوع بپردازیم که چرا شبکه‌های عصبی به الگوریتم ایده‌آل برای حل بازی‌های ویدیویی تبدیل شده‌اند، اجازه دهید به طور خلاصه به نحوه استفاده دانشمندان رایانه از بازی‌های ویدیویی برای پیشبرد تحقیقات خود در زمینه هوش مصنوعی نگاه کنیم.

می‌توانید استدلال کنید که از ابتدای پیدایش، بازی‌های ویدیویی یک حوزه تحقیقاتی داغ برای محققان علاقه‌مند به هوش مصنوعی بوده است.

اگرچه شطرنج در اصل یک بازی ویدیویی نیست، اما در روزهای اولیه هوش مصنوعی تمرکز زیادی داشته است. در سال 1951، دکتر دیتریش پرینز یک برنامه شطرنج با استفاده از کامپیوتر دیجیتال Ferranti Mark 1 نوشت. این در دورانی بود که این کامپیوترهای حجیم مجبور بودند برنامه ها را از روی نوار کاغذی بخوانند.

الگوریتم شطرنج

خود این برنامه یک هوش مصنوعی کامل شطرنج نبود. به دلیل محدودیت‌های رایانه، پرینز فقط می‌توانست برنامه‌ای ایجاد کند که مشکلات شطرنج را با هم حل کند. برنامه به طور متوسط 15-20 دقیقه طول کشید تا هر حرکت ممکن برای بازیکنان سفید و سیاه محاسبه شود.

کار بر روی بهبود هوش مصنوعی شطرنج و چکرز در طول دهه ها به طور پیوسته بهبود یافته است. این پیشرفت در سال 1997 به اوج خود رسید، زمانی که دیپ بلو IBM در یک جفت مسابقه شش بازی، استاد بزرگ شطرنج روسی، گری کاسپاروف را شکست داد. امروزه موتورهای شطرنجی که می توانید در تلفن همراه خود پیدا کنید می توانند Deep Blue را شکست دهند.

مخالفان هوش مصنوعی در دوران طلایی بازی های ویدیویی محبوبیت پیدا کردند. Space Invaders 1978 و Pac-Man دهه 1980 برخی از پیشگامان صنعت در ایجاد هوش مصنوعی هستند که می تواند به اندازه کافی حتی قدیمی ترین گیمرهای آرکید را به چالش بکشد.

Pac-Man، به ویژه، یک بازی محبوب برای محققان هوش مصنوعی بود تا روی آن آزمایش کنند. مختلف مسابقات برای خانم Pac-Man سازماندهی شده است تا مشخص شود کدام تیم می تواند بهترین هوش مصنوعی را برای شکست دادن بازی ارائه دهد.

هوش مصنوعی بازی و الگوریتم‌های اکتشافی با افزایش نیاز به حریفان باهوش‌تر به تکامل خود ادامه دادند. برای مثال، با تبدیل شدن ژانرهایی مانند تیراندازی اول شخص، محبوبیت هوش مصنوعی رزمی افزایش یافت.

یادگیری ماشینی در بازی های ویدیویی

از آنجایی که تکنیک‌های یادگیری ماشینی به سرعت محبوبیت پیدا کردند، پروژه‌های تحقیقاتی مختلف سعی کردند از این تکنیک‌های جدید برای انجام بازی‌های ویدیویی استفاده کنند.

بازی هایی مانند Dota 2، StarCraft و Doom می توانند به عنوان مشکل برای این افراد عمل کنند الگوریتم های یادگیری ماشین برطرف كردن. الگوریتم های یادگیری عمیقبه ویژه، توانستند به عملکرد در سطح انسانی دست یابند و حتی از آن پیشی بگیرند.

La محیط یادگیری Arcade یا ALE به محققان یک رابط برای بیش از صد بازی Atari 2600 داد. پلتفرم منبع باز به محققان اجازه می دهد تا عملکرد تکنیک های یادگیری ماشین را در بازی های ویدیویی کلاسیک آتاری محک بزنند. گوگل حتی خود را منتشر کرد مقاله با استفاده از هفت بازی از ALE

aLE برای آزمایش یادگیری ماشین در بازی های ویدیویی استفاده می شود

در همین حال، پروژه هایی مانند VizDoom به محققان هوش مصنوعی این فرصت را داد تا الگوریتم های یادگیری ماشینی را برای بازی تیراندازی اول شخص سه بعدی آموزش دهند.

VizDoom یک منبع عالی برای آموزش ML برای پخش FPS است

چگونه کار می کند: برخی از مفاهیم کلیدی

شبکه های عصبی

بیشتر رویکردها برای حل بازی های ویدیویی با یادگیری ماشینی شامل نوعی الگوریتم به نام شبکه عصبی است.

شما می توانید یک شبکه عصبی را به عنوان برنامه ای در نظر بگیرید که سعی می کند عملکرد مغز را تقلید کند. مشابه اینکه مغز ما از نورون هایی تشکیل شده است که سیگنال را منتقل می کنند، یک شبکه عصبی نیز حاوی نورون های مصنوعی است.

این نورون های مصنوعی همچنین سیگنال ها را به یکدیگر منتقل می کنند و هر سیگنال یک عدد واقعی است. یک شبکه عصبی حاوی چندین لایه بین لایه های ورودی و خروجی است که شبکه عصبی عمیق نامیده می شود.

تقویت یادگیری

یکی دیگر از تکنیک های رایج یادگیری ماشینی مرتبط با یادگیری بازی های ویدئویی، ایده یادگیری تقویتی است.

این تکنیک فرآیند آموزش یک عامل با استفاده از پاداش یا تنبیه است. با این رویکرد، عامل باید بتواند راه حلی برای یک مشکل از طریق آزمون و خطا ارائه دهد.

بیایید بگوییم که ما یک هوش مصنوعی می خواهیم تا بفهمیم چگونه بازی Snake را بازی کنیم. هدف بازی ساده است: با مصرف آیتم ها و اجتناب از رشد دم خود تا حد امکان امتیاز کسب کنید.

یادگیری تقویتی در Snake

با یادگیری تقویتی، می‌توانیم تابع پاداش R را تعریف کنیم. این تابع زمانی که Snake یک آیتم را مصرف می‌کند امتیاز اضافه می‌کند و زمانی که Snake به مانعی برخورد می‌کند، امتیاز را کم می‌کند. با توجه به محیط کنونی و مجموعه‌ای از اقدامات ممکن، مدل یادگیری تقویتی ما سعی می‌کند «سیاست» بهینه‌ای را محاسبه کند که عملکرد پاداش ما را به حداکثر می‌رساند.

تکامل عصبی

با توجه به الهام گرفتن از طبیعت، محققان همچنین موفق شده اند از طریق تکنیکی به نام تکامل عصبی، ML را در بازی های ویدیویی به کار ببرند.

بجای استفاده از نزول شیب برای به روز رسانی نورون ها در یک شبکه، می توانیم از الگوریتم های تکاملی برای دستیابی به نتایج بهتر استفاده کنیم.

الگوریتم‌های تکاملی معمولاً با تولید یک جمعیت اولیه از افراد تصادفی شروع می‌شوند. سپس با استفاده از معیارهای خاصی این افراد را ارزیابی می کنیم. بهترین افراد به عنوان "والدین" انتخاب می شوند و با هم پرورش می یابند تا نسل جدیدی از افراد را تشکیل دهند. سپس این افراد جایگزین افراد با کمترین تناسب در جمعیت خواهند شد.

این الگوریتم‌ها همچنین معمولاً نوعی از عملیات جهش را در مرحله متقاطع یا «پرورش» برای حفظ تنوع ژنتیکی معرفی می‌کنند.

نمونه تحقیق در مورد یادگیری ماشین در بازی های ویدیویی

OpenAI Five

OpenAI Five Dota 2 را بازی می کند

OpenAI Five یک برنامه کامپیوتری توسط OpenAI است که هدف آن بازی DOTA 2، یک بازی محبوب چند نفره نبرد موبایل (MOBA) است.

این برنامه از تکنیک‌های یادگیری تقویتی موجود استفاده کرد که برای یادگیری از میلیون‌ها فریم در ثانیه مقیاس‌بندی شدند. به لطف یک سیستم آموزشی توزیع شده، OpenAI قادر بود هر روز 180 سال بازی انجام دهد.

پس از دوره آموزشی، OpenAI Five توانست به عملکرد در سطح متخصص دست یابد و همکاری با بازیکنان انسانی را نشان دهد. در سال 2019، OpenAI Five توانست شکست 99.4 درصد از بازیکنان در مسابقات عمومی.

یادگیری ماشینی dota 2 در بازی های ویدیویی

چرا OpenAI در مورد این بازی تصمیم گرفت؟ به گفته محققان، DOTA 2 مکانیک پیچیده ای داشت که خارج از دسترس اعماق موجود بود تقویت یادگیری الگوریتم ها

برادران سوپر ماریو

یکی دیگر از کاربردهای جالب شبکه های عصبی در بازی های ویدیویی، استفاده از تکامل عصبی برای بازی پلتفرمرهایی مانند Super Mario Bros است.

به عنوان مثال ، این ورودی هکاتون با عدم آگاهی از بازی شروع می کند و به آرامی پایه ای از آنچه برای پیشرفت در یک سطح لازم است را می سازد.

یادگیری ماشین در بازی‌های ویدیویی مانند سوپر ماریو می‌تواند بر تکامل عصبی تکیه کند

شبکه عصبی خود تکامل‌یافته، وضعیت فعلی بازی را به عنوان شبکه‌ای از کاشی‌ها به خود می‌گیرد. در ابتدا، شبکه عصبی درکی از معنای هر کاشی ندارد، فقط اینکه کاشی های "هوا" با "کاشی های زمینی" و "کاشی های دشمن" متفاوت هستند.

اجرای یک تکامل عصبی توسط پروژه هکاتون از الگوریتم ژنتیک NEAT برای پرورش شبکه های عصبی مختلف به صورت انتخابی استفاده کرد.

اهمیت

اکنون که نمونه‌هایی از شبکه‌های عصبی در حال انجام بازی‌های ویدیویی را مشاهده کرده‌اید، ممکن است از خود بپرسید که هدف از این همه چیست.

از آنجایی که بازی‌های ویدیویی شامل تعاملات پیچیده بین عوامل و محیط‌هایشان می‌شود، میدان آزمایشی عالی برای ساخت هوش مصنوعی است. محیط های مجازی ایمن و قابل کنترل هستند و منبع بی نهایت داده را ارائه می دهند.

تحقیقات انجام شده در این زمینه به محققان بینشی در مورد چگونگی بهینه سازی شبکه های عصبی برای یادگیری نحوه حل مسائل در دنیای واقعی داده است.

شبکه های عصبی از نحوه عملکرد مغزها در دنیای طبیعی الهام گرفته شده است. با مطالعه نحوه رفتار نورون های مصنوعی هنگام یادگیری نحوه بازی کردن یک بازی ویدیویی، ممکن است بینشی در مورد چگونگی مغز انسان کار می کند.

نتیجه

شباهت های بین شبکه های عصبی و مغز به بینش هایی در هر دو زمینه منجر شده است. تحقیقات مداوم در مورد اینکه چگونه شبکه های عصبی می توانند مشکلات را حل کنند ممکن است روزی به اشکال پیشرفته تری منجر شود هوش مصنوعی.

تصور کنید از یک هوش مصنوعی متناسب با مشخصات شما استفاده می‌کنید که می‌تواند یک بازی ویدیویی کامل را قبل از خرید انجام دهد تا به شما اطلاع دهد که آیا ارزش وقت گذاشتن را دارد یا خیر. آیا شرکت‌های بازی‌های ویدیویی از شبکه‌های عصبی برای بهبود طراحی بازی، سطح تغییر و سختی حریف استفاده می‌کنند؟

فکر می کنید چه اتفاقی می افتد زمانی که شبکه های عصبی تبدیل به گیمر نهایی شوند؟

چگونه یک شبکه عصبی را برای انجام بازی های ویدیویی آموزش دهیم

استفاده از یادگیری ماشینی برای اجرای بازی های ویدئویی - یک مرور کلی