深度学习玩星际争霸?DeepMind与暴雪宣布游戏合作新项目
选自Bloomberg
作者:Jeremy Kahn
机器之心编译
参与:李泽南、蒋思源
谷歌的 DeepMind 团队在今年 3 月刚刚使用 AlphaGo 击败了围棋世界冠军李世乭,现在他们终于把注意力转向了经典即时战略游戏《星际争霸 2》。
DeepMind 刚刚在一年一度的 Blizzcon 上宣布他们与著名游戏公司暴雪达成了协议,在《星际争霸》系列游戏中进行合作,这家谷歌的子公司将在这一游戏平台中引入机器学习方法,进行人工智能研究。这家位于伦敦的公司在 2014 年被谷歌以创纪录的 40 亿英镑收购。DeepMind 还没有宣称自己的程序已经能够玩《星际争霸》了——至少目前还没有。「要打败人类职业选手,我们还有很长的路要走。」DeepMind 科学家 Oriol Vinyals 说道(此人曾是西班牙顶尖的星际争霸玩家),但公司的声明表示现在他们正像对待围棋一样认真对待《星际争霸》,并以此作为机器智能研究的突破点了。
《星际争霸》一直被人工智能研究者视为目标,因为它相比国际象棋与围棋更接近「复杂的现实世界」,Vinyal 认为:「能玩《星际争霸》的人工智能必须能够有效利用内存,能够进行长期战略规划,同时还得根据不断出现的新情况做出反应调整。以这种标准开发的机器学习系统,最终完全可以应用到现实世界中的任务中去」。
双方的合作目前仍在开始阶段,暴雪《星际争霸 2》首席制作人 Chris Sigaty 说道:「目前我们还在进行一系列讨论。」他同时表示目前《星际争霸 2》的电脑玩家与 DeepMind 想要实现的人工智能系统有很大区别:「它们的设计难度不在一个级别上,游戏中的电脑玩家其实有一点「作弊」,因为它可以得知人类玩家无法知道的信息,例如电脑可以在同一时间向所有单位发出指令,即使对于你来说有些单位「不在屏幕中」。暴雪制作电脑玩家的目的是创造一个比人类更强的 AI 玩家,同时受到游戏规则的限制。
虚拟挖掘
在《星际争霸》里,游戏实时在线进行,玩家需要从三个种族之中选择一个进行游戏,每个种族都有不同的优缺点。玩家在游戏中必须掌控生产,探索地图,开采水晶和气矿,然后开拓新的矿点。富有经验的玩家会记住地图中的大量信息以获得优势,即使地图还未被探索。
玩家的视角下,对手的信息是有限的——这与围棋这样的棋盘游戏不同。而且,不像棋类游戏的回合制玩法,机器学习系统在即时战略游戏中需要不断适应变化的环境。《星际争霸》需要玩家能够同时具有长期战略规划与应变对手的快速决策能力——设计能够同时处理这两种类型任务的系统对于研究人员来说是一个巨大的挑战。
Facebook 和微软的行动
Facebook 和微软的人工智能研究者们都已发表过人工智能在《星际争霸》一代中进行游戏的研究。一些玩《星际争霸》的机器人已经被开发出来,但目前这样的程序距离击败人类职业玩家还相去甚远。
微软 CEO 萨提亚·纳德拉对谷歌在人工智能研究中注重游戏的思路进行过抨击,他曾在 9 月份亚特兰大的一次活动中告诉观众「微软不会把钱花在让人工智能在游戏中击败人类」,微软希望把人工智能「用在解决急迫的社会与经济问题上去」。
电子游戏一直是人工智能研究和测试的重要组成部分。在二十世纪九十年代中期,IBM 的超级计算机「深蓝」好几次击败了国际象棋世界冠军卡斯帕罗夫。后来到了 2011 年,IBM 的沃森人工智能在游戏《危险边缘》就击败了最会玩的人类玩家,并展示了 IBM 在自然语言处理的进展。早在 2015 年,DeepMind 就开始使用机器学习来训练它玩一些复古的雅达利游戏(Atari games),并使其至少能做得和人类一样好。后来在 2016 年的三月份,DeepMind 通过另一种方法训练了 Alpha Go,并击败了围棋世界冠军李世乭。
《星际争霸》自从 1998 年发行以来,已经积聚了巨大的忠实粉丝团体。在第一个十年里就售出了 950 多万册的原版游戏,其中超过一半的销售量发生在韩国,它在那里实在是太受欢迎了。2011 年发行的《星际争霸 2》以 48 小时内售出 150 万册打破了即时战略游戏的销售记录。让两个玩家实时互相对垒,这种方式使《星际争霸》成为首屈一指的专业视频竞赛游戏。尽管它的地位目前已被其他游戏取代,但仍然还是一个重要的世界级电竞游戏。
DeepMind这次的对手也许不是韩国人,在WCS2016中,美国选手Neeb获得了世界冠军
暴雪和 DeepMind 计划在明年第一季度发布一个新环境,对所有人工智能研究人员开放。在新界面里,《星际争霸 2》的图形将被简化以便于机器学习系统进行识别,同时他们也将开放 API,允许系统读取游戏中的数据,实现原先电脑玩家的部分功能。暴雪将在未来发布游戏 replay 数据集以供机器学习。DeepMind 的最终目标是让人工智能系统和人类玩家一样,通过处理视觉信息理解游戏。
那么什么时候人工智能可以击败世界冠军呢?暴雪和 DeepMind 都对此持谨慎态度,两者都没有给出一个确切的日期,虽然 AlphaGo 的胜利比大多数人预测的要早。「我认为人工智能的支持者们会很兴奋,以至于曲解我们的话。」Sigaty 说道,所有人都十分期待这一刻。无论这需要多久时间,现在基础已经打下,《星际争霸 2》的舞台上,又一段传奇即将上演。