美公司在北京的AI研究所出了成果,中美究竟谁受益更多?
大数据文摘出品
来源:macropolo
编译:狗小白、Aileen
中美之间摩擦不断,如今,AI竞争也成为了其中重要的组成部分。
让我们假设这样一个场景:美国AI公司设立在中国的实验室取得了一些突破,谁从中受益更多?
五年前,这个问题也许根本不会出现,即使出现,答案也无外乎是:这是全球AI研究的共同成果。如今却变了样,机器学习领域大步发展,中国科技市场和相应的监管机制都有了相当大的发展革新,如今的AI竞争已经成了围绕着中美关系的问题了。
对于美国科技公司的在华研究所,或者中国科技公司在美国的研究机构来说,这些变化意味着什么?
海外智库Macropolo最新发布的一篇文章认为,对这一现象的研究对于中美关系以及相关科研成果都有重要作用。
让我们跟随这篇文章的作者,从一个特定的研究进展ResNet入手,仔细分析其中的观点、机构和人员,并且记录这些因素,或许可以更好地评价这些研究产生的效益的流向,以及政府政策和公司行为如何最有效地利用这个流向。
一起看看。
微软亚研院北京小所里诞生的大突破:ResNet
先来看一篇近五年来在AI研究领域里被引用次数最多的论文:针对图像捕捉的深度残余学习(Deep Residual Learning for Image Recognition)。
据谷歌学术统计,这篇常被缩写为ResNet的2015年的文章不仅是AI领域引用次数最多的,从2014年到2019年7月,它在任何学术领域里都是引用次数最多的一篇文章。
ResNet最重要的贡献在于它的技术使一个神经网络中堆叠多层成为可能,而这项技术是如今许多机器学习技术的引擎。堆叠多层(使他们更“深度”),应用于面部识别、自然语言处理、语音识别以及其他领域的神经网络的性能有了重大提升。
这项技术非常成功,发表论文的研究团队运用它摘得了2015年最有影响力的两项全球图像识别大赛桂冠。到2017年,这项技术作为最先进的技术之一运用在世界围棋大赛上双手互搏而大显身手,也成就了标志性的深度学习系统——AlphaGo Zero。
ResNet是微软亚洲研究所(MSRA),美国科技大佬的北京研究所里一个小研究团队的产物。
MSRA成立于1998年,坐落于清华大学附近,这间不起眼的小研究所很快成为一个研究大户,对学术研究和微软的全球产品都作出了重大贡献。
2004年,因其在机器学习领域,特别是自然语言处理、语音合成和图像识别方面的研究突破,MIT科技评论称之为“世界第一炫酷计算机研究所”。MSRA研究成果有些直接应用于Windows系统上的软件革新,或是改进微软Xbox图像,以及极大地改进了类似于中文的基于字符型的语言输入法。
然而与此同时,MSRA也在某种程度上成了过去20年内参与中国AI生态系统诞生和发展的最重要的机构。该研究所为中国胚胎期的AI生态系统培育了大量未来领军人物,从中毕业的人员包括阿里巴巴阿里云之父王坚博士、百度总裁张亚勤、字节跳动的多位干将,以及其他一些AI独角兽startup的创始人,以至于很多科技圈人士将其比喻成“AI圈黄埔军校”。
人员:谁推动了技术的突破?
回到这篇ResNet的论文,署名有四位2015年在MSRA工作或实习的研究人员,按照国际出版物上名位于姓氏前的标识方式,分别为:Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun。
这四位作者均在中国获得他们的学士学位和博士学位,目前也都在计算机视觉圈赫赫有名,除了Kaiming在中国香港拿下PhD学位之外,在发表ResNet之前,他们没有一人在大陆之外生活或工作过。在ResNet之前和之后,这些作者们都在顶级刊会上那过最佳论文奖,并获得过全球计算机视觉大赛上拿过第一名。
论文发表之后,四位作者后续都离开了MSRA。
首作何恺明(Kaiming He),也是团队中知名度最高的一位,2016年加入了Facebook在加州的AI研究团队;张祥雨(Xiangyu Zhang)和孙剑(Jian Sun)加入了旷视,孙剑如今是这家公司的首席科学家。任少卿(Shaoqing Ren)与MSRA的另外两位毕业生,共同创建了总部在北京的自动驾驶初创公司Momenta,如今已成长成为一只独角兽。
要澄清一下,ResNet被引用次数最多并不意味着它的四位作者是过去五年里最优秀或最重要的AI研究者。文献被如此广泛地引用的原因部分在于它给早前已有的方法加上了关键的一笔,使其在之后的工作里能够相对简便地复现结果。文献背后地研究者们为AI领域做出了突出的贡献,并且运用他们的能力继续为中美企业努力工作。
谁获益?谁失利?
回到我们最核心的问题:在类似于MSRA的机构里产生的研究成果,谁受益最多?上述详情为我们提供了大量信息,但依然没给出清晰的答案。
MSRA团队的文章标志着整个AI领域的一个重大发展,即使其他领域的其他研究者最终会得出类似的发现,我们也不知道这一发现究竟会产生于何时。2015年后,全球的研究者开始运用ResNet技术于各种有害或有益的AI系统。
微软自身也从该文献中有所受益。撇开商誉等无形资产,只谈有形资产,微软在短时间内存在内部运用该技术的先手优势,但研究团队在2015年获ImageNet竞赛大奖后很快将ResNet论文在网络上发表,之后该技术被各领域广泛运用,其中也包括微软的竞争对手。
对微软来说,最显著的受益在于该公司获取研究人才能力的增强,虽然ResNet的作者们离开了MSRA,但他们当时的工作极大地提升了MSRA在新生代计算机科学毕业生中的信誉。
Facebook摘取了最好的果实,招纳了ResNet的领衔作者;旷视招募两名大将,获益匪浅;中国的自动驾驶生态更是由于任少卿加入Momenta得到了极大的提升。
或被改写的历史以及可能的未来
任何对净影响的优秀评估必须同时评估一些假设情况。
让我们回到1998年,很明显如果微软从未设立MSRA,会极大地推迟中国AI生态系统的发展。
让我们来假设一下,如果1998年的美国出于某些想法要求微软,在2012年时关掉这个研究所。
当时,该文章的两名作者(何恺明和孙剑)已经在该研究上合作三年了。很有可能两位会因此转去微软在西雅图附近的总部,并在那里发表论文。这种情境下,很可能孙剑就不会加入旷视,而是继续在美国公司工作。
但也很有可能,两位会出于对家乡的感情留在一家中国研究机构继续他们的工作。2013年,百度开设了深度学习研究所,也是中国第一家这样的机构,对这些研究者来说这是一个潜在可选的工作地点。
那么,如果ResNet诞生于百度的深度学习研究所,或者某所中国大学研究所,这篇论文可能还是会公开,那么对整个人工智能或者计算机视觉生态来说,就又是另一个故事了。