谷歌研究主管Peter Norvig:创造智能不需要复制人类
选自Forbes
作者:Gil Press
机器之心编译
参与:Rick、微胖、杜夏德
2016 年,人工智能被报道了很多次,不只是因为谷歌人工智能程序战胜世界顶级围棋手李世乭。机器战胜人类引发巨大反响,有的人兴奋,有些人满是焦虑,所有人都设想——人工智能的目标是达到「人类智力水平」,或像一些人所预测的「超级智能(superintelligence)」。
「我并不那么在乎我们正在建造的东西是不是真的智能,」谷歌研究部主任 Peter Norvig 说。「我们知道如何建造真正的智能——我和我妻子已经尝试过两次,尽管她的贡献更多。我们不需要复制人类。这就是为什么我专注于利用工具来帮助我们,而不是复制我们已经知道的做事方式。我们想要人类与机器合作,做一些他/它们无法单独完成的事情。」
Norvig 进一步对神经科学与人工智能研究做了有用的区分。他说:「理解大脑令人着迷,但是我认为把它和人工智能的目标(即解决问题)区别开来,很重要。」每个领域都可以相互学习,但是,「如果你将二者混为一谈,就好像同时瞄准两座山峰——最终,你往往会落在山峰之间的低谷中」。要避免这种情况,明智的做法是明确目标,小心使用具有误导性的标签:「如果有比神经网络更好的表达,情况会更好些;如果 Google Brain 团队换一个名称也许我们会更好。Google Brain 团队提供解决问题的编程工具——它不是理解大脑的工具,也并不一定要与大脑的工作原理相关。」
为解决具体问题而开发工具以及教别人如何操作——是 Norvig 过去三十年职业生涯的标志,那是他在加州大学伯克利分校完成其博士论文之后,论文研究的是利用计算机提高文本理解能力。1995,他(与 Stuart Russell)合著了《人工智能:一种现代方法(Artificial Intelligence: A Modern Approach)》一书,该书成为这一领域的主要教科书(现在是第三版); 2011 年,他(与 Sebastian Thrun)联合教授网络课程《人工智能导论(Introduction to Artificial Intelligence)》,有来自 209 个国家的 160,000 名学生参加。由于这些及其他成就,Norvig 在 2001 年(「由于他对教育资料、自然语言处理技术、基于网络的技术以及科研管理和领导力方面的重大贡献」)成为国际人工智能协会(Association for the Advancement of Artificial Intelligence/AAAI)会士,2006 年(「由于他对人工智能和信息检索方面的贡献」)成为美国计算机协会(Association for Computing Machinery/ACM)会士。
Norvig 从很早时候起就一心关注着真正的人类智能。六年级时,他就写信向当地报纸抱怨科学报告中的数学盲化与敷衍话语。高中时,有位老师建议他成为一名科学记者,然而 BASIC 编程的学习经历以及一堂语言课程使他想到了用计算机来处理自然语言,这是一条迥然不同的职业道路。Norvig 说,这个兴趣可能也源自他的父亲——一位数学教授以及他的母亲——一位英语文学教授的综合影响。在布朗大学主修应用数学期间,他偶然发现了一门从认知科学角度教授的心理学课程,引领他朝人工智能领域又迈进了一步。因此,在麻省理工学院的一个衍生机构工作了两年并「接触到研究生的大学生活方式」之后,他觉得获得博士学位会很有趣,于是就读于加州大学伯克利分校的计算机科学系。
那时正是消减人工智能研究投资的时期(所谓的「人工智能寒冬」),但 Norvig 认为「这是最有趣的领域——你正在解决最困难的问题。当时希望研究生能深钻某一领域,但你并不期望最终会得到一个能改变世界的产品,所以,人工智能寒冬的说法并没有对我产生太多干扰。」
结果,那段时间却是人工智能研究的重大转折期。「当我还在读研究生时,」Norvig 说,「这一研究领域发生了转变,在此之前,一个专家系统要雇佣很多研究生来手写逻辑规则,积累足够的量以获取好的结果。但是,你永远都做不到——因为编写这些规则太难了。所以,我们转向一种概率的方法,你处理的是不确定性,目标是得到最好的答案,而不是试着复制专家思维。这个方法在医疗诊断和语音识别以及其他领域获得了成功,事情进展得很顺利。」另一个相关的重大变化「是使用数据,而不是自己来思考所有规则」,通过统计分析发现数据中的规则。在一篇影响深远的论文中,Norvig 及其谷歌同事要求一些领域(比如机器翻译和语音识别)的其他研究员避开理论建构,而去「拥抱复杂性,充分利用我们最好的盟友: 不合理的数据有效性。」
在过去的十五年里,Norvig 一直在谷歌工作,该公司参与解放了——并成功挖掘了——Web 时代的大数据浪潮。在这之前,他经历了各种不同的研究环境,先后任职于加州大学伯克利分校、Sun Microsystems、两家初创公司以及美国宇航局(NASA)艾姆斯研究中心。他为什么离开学术界?「作为一个大学老师,很难得到资源去做更大的项目,」Norvig 说。「所有都是一点一点地,一段时间带一个研究生,你所需要的计算资源、找到一个会为你提供数据的合作伙伴,所有这一切对一个大学老师来说都是困难的。而在工业体系中,你可以得到所有你需要的资源。」
Norvig 将研究环境从企业转向了政府,成为一名 NASA 艾姆斯研究中心的计算科学部门主管,为机器人航天器开发自驱动软件,比如 Mars Rover。至于业界的研发,对实际世界结果的需求会引导着基础研究方向。「但是在一些组织和政府方面,」Norvig 说,「并没有太多不同。如果你那个环节行不通,那么你就失去了整个任务和数亿美元。一切都必须可行,所以进程有点慢。」这种拉长进度的做法也适用于组织工作的其他方面。鉴于 NASA 所正在试图实现的事情,测试通常是作为一次模拟来进行。Norvig 将其与谷歌相比较,谷歌面对的一直是现实世界,来自真实用户的反馈是即时的,而万一失败了,该问题第二天就可以得到解决。
谷歌在研究工作方面的这种即时性状态不仅是时间上的,也是空间上的,就好像不同职业的人坐在一起办公。不同于传统的产品团队,Norvig 说,「那里的研究人员创建了一个原型然后画在墙上,接着工程师们会重新做一遍来实现它,」谷歌创造了一个非常独特的产品开发环境,其中「研发」与「开发」成员在同一个团队中是平等的。「我们觉得我们将一直发展下去,因此我们希望大家能够从头到尾地参与进来,这样他们可以继续作出改进,」Norvig 说。
这个「混合研究模型(hybrid research model)」中的一个重要激励因素在于开发出那些研究人员愿意使用的生产环境工具。这种态度逐渐扩展成开发一个内部使用的世界级 IT 基础设施,为研究人员提供最好的工具和机会来实现自己的想法。Norvig 说,早期有一些抵触自主开发,想直接从 IT 厂商那里购买硬件和软件,但是,「自己打造一些东西通常是正确的决定——我们相较之前的做法更进了一步,那么,我们就可以进行快速迭代,而不是为了一个小改动就去找一个供应商,这种做法会拖慢所有的进程。」激励研究人员的另一个因素是允许他们发表论文,并对学术合作的其他渠道给予支持,这为他们提供机会去扩展自己研究在该领域中的影响,并有机会脱离渐进式研究,致力于「范式转变(paradigmatic changes)」或谷歌的「登月计划(moonshots)」。
但是,最吸引计算机科学家的恐怕是数据,这些数据掌握在谷歌手中。在谷歌,他们可以分析带有现实世界约束条件的大量数据,做一些之前项目或研究规模无法比拟的实验。这种大规模的、实验性的、迭代的重点研究被注入了丰富的数据,正如 Norvig 所指出的,三十亿的互联网群体和一部「口袋里的超级计算机」帮助了谷歌————及其他公司的研究人员/开发者——发明出实用而成功的、以数据为中心的人工智能应用程序,其中大多数应用最近都使用了深度学习和及其他经过改进的新机器学习方法。
过去几个月中,我在很多场合听到 Norvig 谈及这些年来将机器学习应用到全球所有信息——在 O'Reilly AI Conference 上,在 波士顿举行的 ACM 会议上,一次 ACM 的网络研讨会以及在一次电话访谈中——过程中所学到的东西。他对比了机器学习和传统的软件开发,突出了前者的优势以及所独有的难题。Norvig 说,机器学习更省事,你要做的就是输入大量数据给计算机,而不是让程序员喝咖啡、吃披萨。输出也要快得多。
但是,也有很多挑战。Norvig 说,「机器学习能让你跑得更快,但是,较之于跑得慢,跑快也会有问题,系统崩溃也更加惊人。」机器学习比传统软件更难,因为调试起来更有难度——并没有传统软件那样现成、验证过的调试工具和程序,也很难隔离一个 bug;如果做了任何改变,最后可能会改变一切;另外,如何以及何时动用人力协助,训练使用者不要过分依赖机器,也是不好决定,而且还需要考虑新数据或你正用来训练机器的数据的变化;机器学习中的数据使用引发了许多深层次的问题,比如隐私、安全以及公平。Norvig 的底线可援用丘吉尔关于民主的格言:在所有人类尝试过的制度中,民主是最不坏的选择。
在与各种听众的接触中,Norvig 谈到了很多重要问题,这或许有助于加快问题的解决。最终,随着各行业和政府组织越来越多地使用机器学习,在理解和管理上,机器学习会变得像传统软件。不过,计算机所能做的会持续、快速地发生变化,因此,针对当前问题之一的每个解决方案,可能会出现一些新的小问题。
今天,我们正在经历人类与计算机互动方式的根本变革,毫无疑问,这会带来新的问题,也会带来新的机遇。我们正在从与应用程序互动占主导地位的今天,转变到与虚拟助手互动(有时是通过语音进行互动)的时代,「就像那些发明了鼠标和菜单时代的互动方式的先行者们,今天,当我们与一个系统对话时,我们不得不发明新的互动方式。现在,你电脑和手机上的所有一切都放在应用程序中,想要做什么的时候,你首先需要决定点击那个应用程序。但是,当你有了虚拟助手后,能够整合在一起的服务就能合并起来。」如何整合这些服务并让用户满意可能是后应用程序时代的一个巨大挑战,此时,新的人机互动类型以及技术会是投资、研发、失败和胜利的一个焦点。
在这场人工智能的复兴中,同很多人一样,Norvig 把一些新发现的亮点和成功归功于增长的计算机能力和大量数据的可用。但是,他认为还有两个基本的转变也很重要,一个是计算机研究和编程的供给方,另一个是需求方,也就是我们希望计算机能做什么事情。Norvig 引用了 MIT Hal Abelson 的观点,Abelson 观察到计算机科学已经从数学科学转变为自然科学,从计算出一个正确答案转变为观测,从传统的计算机软件转变为机器学习。类似的,需求已经从期望计算机把诸如加数字这样的问题做的更好转变为一些我们真正在意的事情,这些事情不像加加减减那么清晰明确,Norvig 说:「读一些有趣的东西,获取适当的推荐,分享图片并知道图片中有什么,这就是人工智能要做的事情。当我们想要优化或者给出最佳推荐时是没有一个确定答案的,都是不确定的。」
为了给这些转变带来的新应用和计算机使用方式打开机遇,Norvig 对打造机器学习和人工智能产生了兴趣,「这是所有程序员的必备技能而不是某个专业领域。」他担心没有足够的人工智能人才,并在过去的一年中一直专注于开发方便易用的工具。「如果你是一个优秀的程序员,你就应该有能力去自学人工智能方面的知识自己研究机器学习,不一定需要一个博士学位。」
今天的很多计算机程序员和博士候选人 没有在等着人工智能的普及化,都在忙着重复训练并总是将工作重心放到谈论最多最令人兴奋的计算机科学专业。「五年前,一个记者问我『人工智能是怎么走向失败的?』」Norvig 回忆到。「今天,他们会说『人工智能怎么占领世界,杀死所有人类或者霸占我们的所有工作。』」
看到各种人工智能任务的表现每年以 30% 速度增长,Norvig 很高兴,但他也清楚这些进展也带来一些偏离真正目标的炒作。「我没有看出这个世界会出现奇点。我们的观点是这个世界是复杂的,变得更加聪明并不能解决很多世界问题。」而且:「比获取类人性能更重要的是有些有用的东西不一定要像人,智能明确它要做什么不能做什么就可以了。」
提供有用的东西。解决具体的难题。不要被机器终将变得和人类一样这种莫名的期望带偏了路。了解训练机器时需要做哪些提升来在不确定的情况下做决定,传播使用知识。注重增强人类智力并开发出人机团队合作的艺术。这就是「人工智能」的全部,Peter Norvig 如是说。