【AI研究者为什么喜欢游戏】DeepMind、Open AI和微软争相开源游戏训练平台
2017-05-14 编辑:
新智元编译
参考资料来源:The Economist
翻译:刘小芹 弗格森
新智元启动 2017 最新一轮大招聘:COO、总编、主笔、运营总监、视觉总监等8大职位全面开放。
新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。加盟新智元,与人工智能业界领袖携手改变世界。
简历投递:jobs@aiera.com.cn HR 微信:13552313024
【新智元导读】游戏,更准确地说,模拟场景对于人工智能的研发来说是一个非常理想的场所,对于人工智能技术走向实际应用有着不容忽视的推动作用。目前,DeepMind、微软、Facebook、OpenAI 等都在研究通过游戏场景训练AI。本文结合《经济学人》的文章《AI研究者为什么喜欢游戏》,全面梳理了用游戏训练AI的几大开源平台,对这一方向的领导者DeepMind的路径进行分析。文章提到了“具身认知”的理论,认为智能应该完全从经验进行学习。可以肯定的是,机器“眼中”的游戏和人类所理解的游戏是不一样的,在这种虚拟与现实之间,“智能”会真正发生。
游戏,更准确地说,模拟场景对于人工智能的研发来是一个非常理想的场所。对于人工智能技术走向实际应用有着不容忽视的推动作用。目前,DeepMind、微软、Facebook和阿里巴巴都在研究用 AI 来玩游戏,希望能增强 AI 智能体的通用能力,让AI 更像人。
《经济学人》最近发表了一篇题为《AI研究者为什么喜欢游戏》的报道,通过讲述一个计算机科学家在游戏场景中训练AI,计算机系统可以更好地识别交通信号的故事,分析了视频游戏对于训练人工智能的关键作用。
从识别交通信号说起
《经济学人》的文章讲述了一个神经科学家用游戏场景来教计算机理解交通信号的故事:
去年,普林斯顿大学的一名计算机科学家Arthur Filippwicz遇到了一个“交通标志难题”。Filipowicz 正在教汽车如何“看见”和“理解”世界,让汽车拥有一个在不需要人类协助的情况下能自己驾驶的视野。其中需要的一种能力便是识别交通信号。为了达到这一目的,他曾多次尝试,希望能训练一个合适的算法。这样的训练指的是,向这一算法(更准确地说,是向运行这一算法的计算机)展示在不同的情况下大量交通信号的图片:包括新的和旧的、干净的和脏的、部分被建筑物遮挡的、强光照射下的、雨中的、雾中的、白天的、黄昏的和夜里的等等。
要想从图像数据库中拿到所有这些种类的图片并不容易。而要派人去拍下这些所有类型的图像,又太耗费人力了。所以,Filipowicz 博士选择了游戏“Grand Theft Auto V " (侠盗猎车手 V),这是一个最近很火的视频游戏。“侠盗猎车手 V” 因为包含了大量的犯罪和暴力而饱受争议,但是,在Filipowicz 看来,这款游戏很完美,因为它同样描绘了现实世界中的交通信号。通过修补游戏软件,他从游戏中拿到了数千张关于这些信号的照片,关于几乎各个场景,来让他的算法进行消化。
Filipowicz 博士的交通信号标志很好地说明了人工智能研究者对视频游戏的喜爱。其中有几个原因:一些人,例如 Filipowicz 博士,使用视频游戏作为训练场,用来代替真实世界。也有人观察到,不同的游戏要求具备不同的认知技能,他们认为,游戏可以帮助他们理解如何将智能分解为更小的、更加可以管理的细块。还有一些人,基于以上两个观察,认为游戏能帮助他们建立更加正确的人工智能(或者,甚至是自然智能)理论。
Open AI、DeepMind 和微软的开源AI游戏训练平台
显然,对于机器和人来说,“玩”游戏并不是同一回事。在上文提到的所有这些情况下,这些游戏需要先被调整解构,以便它们能被另一个计算机程序直接播放,而不是一般情况的人用屏幕来播放观看。例如,利用一个叫做“Deep Drive”的软件,“侠盗猎车手V”可以由一个有很多道路标志图像的图片源转变为一个自动驾驶汽车的驾驶模拟器。这样,这些车辆的驾驶和导航程序就可以控制了,这比让它们在真实的道路上测试更便宜,也更安全。
游戏公司也开始明白这一点。例如,2015年5月,微软启动了 Malmo 项目,这是基于一个流行游戏“Minecraft”的 AI 开发平台。2016年11月,“星际争霸II”的所有者暴雪公司与 DeepMind 宣布了类似的合作。12月,OpenAI 开源了 Universe 平台,免费供所有人使用,其中包含数百个游戏,可以通过适当的程序直接播放。Universe 提供的游戏从畅销的大型游戏如“传送门2”(一个基于物理的解谜游戏),到低成本的娱乐网游,如“小海马泡泡龙”和“太空斑马”,应有尽有。
1. 微软Malmo
微软的 Malmo 项目的目的之一就是教会 AI 软件与人类合作。为此,该项目的负责人 Katja Hofman 试图利用“我的世界”游戏创建一个智能的私人助理。她的目标是,这个软件能够预测它的人类操作者想要的东西,并帮助他实现。“我的世界”游戏里的世界虽然比现实世界简单,但仍然很复杂,吸引了研究者们的兴趣,可以说是完美的测试地。Hofman 博士和她的同事们使用这个游戏来试图教计算机与人类玩家合作,在游戏里捕捉一只虚拟的猪。由于机器无法理解书面的指示,因此,必须通过观察游戏中人类伙伴的动作来学习如何合作。
2. DeepMind Lab
DeepMind的DeepMind Lab 是一个专为基于智能体的 AI 研究设计的,完全像 3D 游戏般的平台。它从自己的视角,通过模拟智能体的眼睛进行观察。场景呈现的视觉效果是科幻风格。可用的操作能让智能体环顾四周,并且以3D的形式移动。智能体的“身体”是一个悬浮的球体,通过激活与期望运动方向相反的推动器实现悬浮和移动,并且具有围绕其主体运动的,能够观察其旋转时动作的摄像头。示例任务包括收集水果、走迷宫、穿越危险的通道且要避免从悬崖上坠落、使用发射台在平台间穿越、玩激光笔、以及快速学习并记住随机生成的环境。下面是智能体在 DeepMind Lab 中如何感知并与世界交互的图示。
3. OpenAI Universe