使用机器学习玩视频游戏

目录[隐藏][展示]

游戏中的人工智能简史+ -
- 视频游戏中的机器学习
它是如何工作的：一些关键概念+ -
电子游戏中机器学习的样本研究+ -
- OpenAI五
- 超级马里奥兄弟
重要性
结论

视频游戏继续为全球数十亿玩家带来挑战。你可能还不知道，但机器学习算法也已经开始迎接挑战。

目前在人工智能领域进行了大量研究，以了解机器学习方法是否可以应用于视频游戏。该领域的重大进展表明机器学习代理可以用来模拟甚至替代人类玩家。

这对未来意味着什么视频游戏?

这些项目仅仅是为了好玩，还是有这么多研究人员专注于游戏的更深层次的原因？

本文将简要探讨视频游戏中人工智能的历史。之后，我们将简要介绍一些可用于学习如何击败游戏的机器学习技术。然后我们将看看一些成功的应用神经网络学习和掌握特定的视频游戏。

游戏中的人工智能简史

在我们了解为什么神经网络已成为解决视频游戏的理想算法之前，让我们简要了解一下计算机科学家如何使用视频游戏来推进他们在人工智能方面的研究。

你可以说，从一开始，视频游戏就一直是对人工智能感兴趣的研究人员的热门研究领域。

国际象棋虽然不是严格意义上的视频游戏，但在 AI 的早期阶段一直是一大焦点。 1951 年，Dietrich Prinz 博士使用 Ferranti Mark 1 数字计算机编写了一个下棋程序。这可以追溯到这些笨重的计算机必须从纸带上读取程序的时代。

国际象棋算法

该程序本身并不是一个完整的国际象棋人工智能。由于计算机的限制，普林茨只能创建一个程序来解决二分之一的国际象棋问题。平均而言，该程序需要 15-20 分钟来计算白人和黑人玩家的每一个可能的移动。

几十年来，改进国际象棋和跳棋人工智能的工作稳步改进。这一进展在 1997 年达到了顶峰，当时 IBM 的 Deep Blue 在一对六场比赛中击败了俄罗斯国际象棋大师 Garry Kasparov。如今，您可以在手机上找到的国际象棋引擎可以击败深蓝。

在电子街机游戏的黄金时代，人工智能对手开始流行起来。 1978 年代的 Space Invaders 和 1980 年代的 Pac-Man 是该行业的一些先驱，他们创造了能够充分挑战最老牌街机游戏玩家的 AI。

尤其是吃豆人，它是人工智能研究人员用来试验的流行游戏。各种各样的比赛吃豆人女士已经组织起来，以确定哪个团队可以想出最好的人工智能来击败游戏。

随着对更聪明的对手的需求出现，游戏 AI 和启发式算法不断发展。例如，随着第一人称射击游戏等类型变得更加主流，战斗 AI 越来越受欢迎。

视频游戏中的机器学习

随着机器学习技术迅速普及，各种研究项目试图使用这些新技术来玩电子游戏。

Dota 2、StarCraft 和 Doom 等游戏可能会成为这些游戏的问题机器学习算法解决。深度学习算法，特别是能够达到甚至超越人类水平的表现。

街机学习环境或者 ALE 为研究人员提供了一个用于一百多个 Atari 2600 游戏的界面。这个开源平台允许研究人员对经典 Atari 视频游戏中机器学习技术的性能进行基准测试。谷歌甚至发布了自己的纸使用 ALE 的七场比赛

aLE 用于测试视频游戏中的机器学习

同时，项目如维兹杜姆让 AI 研究人员有机会训练机器学习算法来玩 3D 第一人称射击游戏。

VizDoom 是训练 ML 玩 FPS 的绝佳资源

它是如何工作的：一些关键概念

神经网络

大多数使用机器学习解决视频游戏的方法都涉及一种称为神经网络的算法。

你可以把神经网络想象成一个试图模仿大脑功能的程序。类似于我们的大脑是由传递信号的神经元组成的，神经网络也包含人工神经元。

这些人工神经元也相互传递信号，每个信号都是一个实际数字。神经网络在输入层和输出层之间包含多个层，称为深度神经网络。

强化学习

另一种与学习视频游戏相关的常见机器学习技术是强化学习的概念。

这种技术是使用奖励或惩罚来训练代理的过程。使用这种方法，代理应该能够通过反复试验提出问题的解决方案。

假设我们想要一个 AI 来了解如何玩 Snake 游戏。游戏的目标很简单：通过消耗物品并避免不断增长的尾巴来获得尽可能多的积分。

Snake 的强化学习

通过强化学习，我们可以定义一个奖励函数 R。该函数在 Snake 消耗物品时加分，在 Snake 撞到障碍物时减分。给定当前环境和一组可能的动作，我们的强化学习模型将尝试计算最大化我们的奖励函数的最佳“策略”。

神经进化

受自然启发的主题保持不变，研究人员还通过一种称为神经进化的技术将 ML 应用到视频游戏中取得了成功。

而不是使用梯度下降为了更新网络中的神经元，我们可以使用进化算法来获得更好的结果。

进化算法通常从生成随机个体的初始种群开始。然后，我们使用某些标准评估这些人。最优秀的个体被选为“父母”，并一起培育形成新一代个体。然后这些人将替换人口中最不适合的人。

这些算法通常还会在交叉或“繁殖”步骤中引入某种形式的突变操作，以保持遗传多样性。

电子游戏中机器学习的样本研究

OpenAI五

OpenAI 五玩 Dota 2

OpenAI五是 OpenAI 的一个计算机程序，旨在玩流行的多人移动竞技场 (MOBA) 游戏 DOTA 2。

该程序利用现有的强化学习技术，可从每秒数百万帧中学习。得益于分布式训练系统，OpenAI 能够每天玩 180 年的游戏。

训练期结束后，OpenAI Five 能够达到专家级的表现，并展示了与人类玩家的合作。 2019 年，OpenAI XNUMX 能够打败 99.4%的球员在公开比赛中。

视频游戏中的 Dota 2 机器学习

为什么 OpenAI 决定做这个游戏？根据研究人员的说法，DOTA 2 拥有复杂的机制，超出了现有深度游戏的范围强化学习算法。

超级马里奥兄弟

神经网络在视频游戏中的另一个有趣应用是使用神经进化来玩超级马里奥兄弟等平台游戏。

例如，这个黑客马拉松条目从对游戏一无所知开始，然后慢慢建立通关所需的基础。

超级马里奥等电子游戏中的机器学习可以依赖神经进化

自我进化的神经网络将游戏的当前状态视为瓷砖网格。起初，神经网络并不了解每个瓦片的含义，只是“空气”瓦片不同于“地瓦”和“敌人瓦片”。

黑客马拉松项目对神经进化的实现使用 NEAT 遗传算法选择性地培育不同的神经网络。

重要性

既然您已经看到了一些神经网络玩电子游戏的例子，您可能想知道这一切的意义何在。

由于视频游戏涉及代理及其环境之间的复杂交互，因此它是制作 AI 的完美试验场。虚拟环境是安全可控的，并提供无限的数据供应。

该领域的研究使研究人员深入了解如何优化神经网络以学习如何解决现实世界中的问题。

神经网络灵感来自大脑在自然界中的工作方式。通过研究人工神经元在学习如何玩电子游戏时的行为，我们还可以深入了解人类的大脑作品。

结论

神经网络和大脑之间的相似性导致了这两个领域的见解。对神经网络如何解决问题的持续研究有朝一日可能会导致更高级的人工智能.

想象一下，使用根据您的规格量身定制的 AI 可以在您购买之前玩整个视频游戏，让您知道它是否值得您花时间。视频游戏公司会使用神经网络来改进游戏设计、调整级别和对手难度吗？

当神经网络成为终极游戏玩家时，你认为会发生什么？

使用机器学习玩视频游戏——概述