乐动体育人工智能专家:AI并不像你想象的那么先进
乐动体育FV222.COM编者按:近些年,很多人工智能产品已经投入应用,走进人们的生活。人工智能迅猛的发展速度很难不引人注意,甚至有人已经在担心它快速的学习能力会对人类的生存造成威胁。而在本文作者看来,真正的人工智能还很遥远。作为领域专家,她深入分析了人工智能的一些明显缺陷,并想象了未来的可能
梅勒妮·米切尔(Melanie Mitchell)写了她的新书《人工智能:思考人类的指南》(Artificial Intelligence: A Guide for Thinking Humans),因为她对人工智能究竟取得了多大进步感到困惑。她写道,她想“了解事情的真实状态”。
得知她的矛盾心理是一种安慰,因为她自己就是一名人工智能研究员。她是波特兰州立大学的计算机科学教授,也是著名的多学科研究中心圣达菲研究所(Santa Fe Institute)科学委员会的联合主席。如果米切尔对人工智能的立场都感到困惑,请原谅我们其他人的困惑,或者是谬误百出的见解。
正如米切尔所指出的那样,许多有关人工智能胜利的故事正在流传。这些报告中,最近在计算机视觉、语音识别、游戏和机器学习的其他方面的突破表明,人工智能可能会在未来几十年很大范围的任务中超越人类的能力。有些人觉得前景不可思议;另一些人担心“超人类”计算机可能会判定不需要我们人类在身边,并有能力做些与此有关的事。
但也如米切尔另外证明的那样,即使是当今最强大的人工智能系统也有关键性的局限。它们只擅长于狭隘定义的任务,对外面的世界一无所知;它们在数据中发现相关性,而不考虑数据的含义,因此他们的预测可能是非常不可靠的;它们没有常识。
“要么取得了巨大的进展,要么几乎没有进展,”米切尔写道。“我们要么离‘真正的’人工智能只有咫尺之遥,要么离了数百年。”
米切尔解决问题的方法使这本书具有纪念意义和启发性。她对当今人工智能技术的耐心解释给人的印象是,真正的机器智能还很遥远。她表示,电脑不仅需要更好的大脑,还可能需要更好的身体。
米切尔提供了非常清晰易读的人工神经网络入门知识,该技术是图像识别,语言翻译和自动驾驶方面最新进展的核心。20世纪50年代和60年代,在最初的一些建立人工智能的尝试中使用了神经网络,但它们失宠了,因为看起来像一条死胡同,价值有限。但大约10年前有所改变,计算能力的进步使一种称为深度学习的数据密集型方法来训练神经网络成为可能。
跟随米切尔对神经网络的描述,你不需要了解繁杂的的数学。她展示了数学主要是什么,这就同时解释了它们的威力和缺陷。一种对识别图像内容特别有用的神经网络依赖于一种叫做“卷积”(convolution)的数学计算。处理文本的版本依赖于计算机表示语言统计方面的能力,即在穿过数百个维度的复杂“向量”里,单词在句子中出现的频率有多高。
令人印象深刻的是,人们已经将世界上如此多的方面进行了量化,以供计算机继续工作。同样值得注意的是,这些方法有如此多样的应用,比如检测肿瘤、自动驾驶和过滤垃圾邮件。但是这种伟大计算器的巧妙新用途并不一定赋予它们与我们的智力相当的能力。正如米切尔所指出的,让卷积神经网络(Convolutional Neural Networks, CNN)正常工作“需要大量的人类智慧”。
机器学习系统本质上是统计工作,所以很清楚,为什么它们很容易受到所馈送数据中的不准确、漏洞和其他缺点的影响。难怪如果神经网络在主要显示白人的图像上经过训练,它就不能识别黑人的脸。当一辆自动驾驶汽车无法识别一个有贴纸的停车标志,但(对人类来说)它仍然是一个明显的停车标志时,就并不奇怪。
幸运的是,这类问题已经引发了许多富有成果的讨论,这些讨论关于面部识别技术和自动决策的社会影响。纽约大学数据新闻学副教授梅雷迪思·布鲁萨德(Meredith Broussard)在2018年出版的《人工智能:计算机如何误解世界》(Artificial Unintelligence: How Computers The World)一书中有说服力地提出,无论你是否称它为“人工智能”,计算机仍然应该被当作是被我们这些好奇的人类使用的工具,人类应该始终处于这个范围内。
不过,尽管米歇尔并不是第一个指出机器学习系统弱点的人,她还是在评论中加了一层解释说,即使在它们处于最佳状态的时候,计算机可能也没有你想的那么好。在过去几年里,研究人员开发出了神经网络,他们声称,在识别照片或视频中的物体时,神经网络的表现达到甚至超过了人类的表现。这在新闻中被作为另一个必然对机器优势“抵抗无果”的例子。
米切尔指出,讨论的基准是一个基于名为ImageNet的大型图片数据库的测试。2017年,最优秀的计算机系统对来自ImageNet的图片进行了分类,正确率达98%的top-5正确率,据称超过了95%的人类正确率。(注:top-5准确率指排名前五的类别包含实际结果的准确率,即对一个图片,如果概率前五中包含正确答案,即认为正确。)
“top-5”的障碍是什么?这意味着正确的物体分类是机器作出的前五种猜测之一。米切尔写道:“如果给定一个篮球的图像,机器按这个顺序输出‘槌球’、‘比基尼’、‘疣猪’、‘篮球’和‘搬运车’,就被认为是正确的。top-5指标存在的原因可以理解:如果一张图片显示了不止一个物体,那么了解机器是否能检测出这些物体是很有用的。但它削弱了对极端技能的要求。米切尔表示,2017年,当该机器将正确的类别归置在其列表首位时,top-1的最高准确率仅为82%。(注:top-1准确率是指排名第一的类别与实际结果相符的准确率,即对一个图片,如果概率最大的是正确答案,才认为正确。)
至于说人类有95%的准确率,米切尔认为支持这一说法的数据站不住脚。在2015年发表的一个研究项目中,两个人尝试了ImageNet挑战的一部分。投入更多时间的人是安德烈·卡帕西(Andrej Karpathy),他现在是特斯拉的人工智能主管。以top-5准确率作为衡量标准,他错了5%。而现在,这个数字被用作人类表现的标准。
如果不是因为这个特殊测试的古怪之处,他的错误率可能会更低。卡帕西写道,他和另一名测试对象所犯错误的四分之一,不是因为他们对所看到的图片一无所知,而是因为他们不知道或不记得ImageNet中使用的一些确切的标签。
更糟糕的是,“据我所知,还没有人报道过机器和人类在top-1准确率上的比较,”米切尔写道。
凭借其快速和无尽的耐心,计算机是许多应用中图像识别的理想选择。在某些情况下,它们肯定比人类更准确。但说得太过了。“物体识别尚未接近被人工智能‘解决’的程度,”米切尔写道。
我很难想象我们需要什么样的突破才能制造出这样一台机器。”
人工智能目前最热门的话题之一是,如何让机器不仅检测数据中的统计相关性,而且在某种程度上理解它们正在处理的内容的意义。和米切尔一样,纽约大学的研究人员加里·马库斯(Gary Marcus)和欧内斯特·戴维斯(Ernest Davis)表示,如果没有这些改进,人工智能就不会“安全、智能或可靠”。在他们的新书《重启AI:构建我们可以信任的人工智能》(Rebooting A.I.:Building Artificial Intelligence We Can Trust)中,马库斯和戴维斯说,人们由于“可信度差距”而误以为计算机比它们更先进。
他们写道:“我们不得不从认知的角度来思考机器(‘它认为我删除了我的文件’),不管机器实际上可能遵循的规则多么简单。”
为了让机器变得不那么简单,许多研究人员正在重新探索用逻辑和常识来编码计算机的旧方法。以米切尔为例,她用类比的方式描述了她让计算机进行推理所做的努力。如果你想要一个电脑识别图像描绘“遛狗”,现在的基本方法是给它显示成千上万的遛狗的图片,然后使之相信那些照片中常见的事物——狗,皮带,手等。当机器看到之后遛狗的照片时,将触发一个积极的信号。然而,它可能会嗅出一些不寻常的遛狗行为。米切尔展示了一些例子,比如一张照片,一个人骑着自行车遛狗,另一只狗叼着另一只狗的皮带。她的研究小组正试图让计算机理解后一种情况是典型情况的“延伸”版本。
那样的工作是辛苦而缓慢的。即使它成功了——如果一台电脑可以在某种程度上理解“遛狗”可以有多种形式——如果这台机器自己从来没有遇到过狗,这种理解能有多丰富呢?
当我6岁左右的时候,我在我家附近的人行道上骑自行车,停下来看(也许还扔了) 一串从甜胶树上摘下来的带刺的种子球。突然,有人打开了街对面一所房子旁边的一扇门,出来一条棕色的狗,它犹豫了一两秒钟,然后径直扑过来,咬住我,撕破了我的灯芯绒裤子。这些记忆帮助我洞察到经历的无数方面——惊讶、恐惧和痛苦的感觉;一些狗的不可预测性;甜胶种子球的奇异古怪。相比之下,如果计算机被告知当人们说“something bit them in the ass”时并不总是一个习语,那就太肤浅了。(注:bite本意为“咬“,ass本意为“屁股”,bite (someone) in the ass指不当行为导致了不良后果。)
哲学家和其他人工智能怀疑论者一直认为,没有真实身体的电子大脑只能学到盒子里这点东西。许多人工智能研究人员将这种怀疑归咎于“某种残留的神秘主义”——正如认知科学家安迪·克拉克(Andy Clark)在1997年出版的《此在:重整大脑、身体和世界》(Being There: put Brain, Body, and World Together Again)一书中所写的那样,这是一种“对类似灵魂的精神实质的非科学信仰”。但是,当你考虑到爬行的婴儿能快速掌握基本概念,而数据中心的计算机需要大量的电力来吸收一个东西时,人工智能需要一个身体的这个想法就听起来相当不错。
米切尔似乎不情愿地转变为怀疑论者的立场。“在与人工智能搏斗多年之后,我发现关于身体化的争论越来越有说服力,”她写道。
那么,怎样才能制造出一个能在世界各地移动的机器人呢?这个机器人不仅能洞察自己的行为,还能洞察人类、动物和其他机器的行为。“我几乎无法想象,”她写道,“我们需要什么样的突破才能制造出这样一台机器。”