AlphaGo为何缺席计算机围棋赛 或已是不同物种

3月19日,UEC杯世界围棋计算机大赛在日本结束,中国的围棋程序绝艺击败日本的DeepZenGo,取得冠军。这次比赛其实也邀请了AlphaGo,但被他们拒绝了。参赛的围棋程序大都是学习2016年DeepMind的那篇论文,而现在的AlphaGo又再度进化升级,成为更为强大的“Master”了。与参赛的围棋程序相比,现在的AlphaGo可能已经是不同“物种”了,自然没必要参赛。

赛制并不完全“公平”

以往的UEC杯世界围棋计算机大赛并不广为人知,今年之所以备受关注,主要是两个参赛程序的,日本的DeepZenGo和中国的绝艺。前者马上要和芈昱廷、朴廷桓、井山裕太进行世界围棋大赛,后者则一直在对弈网站上测试,积累了相当的人气。

比赛的用时是每方30分钟,平均下来20秒左右就要落子,参赛程序的计算能力显然对比赛成绩有着很大的影响。比赛并不是所有的程序都使用统一的硬件配置,而是各自通过手里的笔记本电脑,把比赛数据发送到各自的服务器计算平台上完成。这也是为什么18日现场断网之后,比赛不得不暂停的原因。

应用了深度学习技术的围棋程序,对局时策略网络和价值网络同时工作,还要配备强大GPU等计算资源。虽然计算资源堆积到一定程度之后能起到的提升效果有限,但在UEC的快棋赛制里,计算资源上的差别还是很有影响的。

DeepZenGo是由日本最大的视频网站作为技术支持,而绝艺的背景是腾讯新浪棋牌报道过的 “丽拉”,都是受到2016年DeepMind在《自然》杂志上发表的关于AlphaGo论文启发,进而发展成现在的围棋人工智能的。从某种意义上讲,它们都是去年那个AlphaGo的跟随者。从这次世界计算机大赛的棋谱体现出的水平来看,他们距离去年击败李世石的那一版AlphaGo似乎还有一定的差距。

这个差距一方面来自于,当时AlphaGo与李世石下的是慢棋,计算时间比这次要长;另外一方面可能是谷歌在深度学习技术应用上的优势所致。

不过尤其要注意的是,现在这些围棋程序对比的对象还只是2016年与李世石大战的AlphaGo,现在的AlphaGo(或者说MAster)究竟进化到什么程度我们并不知道。

DeepMind在公布科学成果上是很谨慎的。去年人机大战之前他们说AlphaGo通过自我对弈,取得了巨大的进步,所以才有信心挑战李世石。当时不少人对此嗤之以鼻,结果被4比1的比分打了脸。

2016年11月的时候,AlphaGo团队的发言人樊麾通过微博宣布:“我们很高兴向大家宣布,AlphaGo的棋力在已过半年有巨大的进步,将在2017年初复出下棋。我们团队会在近期内公布更多讯息。”这个“巨大进步”耐人寻味,AlphaGo的研究又取得了怎样的进展呢?之后Master在网上的60盘快棋测试,让我们惊鸿一瞥。计算时间极短、完美的局面掌控、精准的局部战斗,这些细节都告诉着我们,现在的AlphaGo或者说Master,已经和一年前的它完全不同了,甚至可能已经进化到了一个更为先进的阶段。

上一次AlphaGo公布研究结果,改变了整个围棋人工智能领域,为围棋界打开了一道通往未来的大门。不久前,哈萨比斯说:“2017年将是AlphaGo与棋界兴奋的一年”,这次他们会带来什么样的惊喜呢?

(周游)

相关推荐