Michael I.Jordan发长文反思人工智能,从一个生死攸关的故事说起
大数据文摘作品
编译:VVN、蒋宝尚、龙牧雪、魏子敏
【人工智能】正在让这个时代激动不已,但也正引发不少担忧。被誉为机器学习之父的美国三院院士、伯克利教授Michael I.Jordan昨天在美国知名科技媒体Medium上,难得的发布了他的第一篇文章。一反以往的技术干货输出,这篇文章的主题是对当前AI研究中的问题进行冷静反思。
这篇名为《人工智能:革命远未到来》的长文阅读时间在20分钟左右,从14年前Jordan教授自己的一个关乎生死抉择的故事说起,回顾了AI发展的过往,更重要的是,提出了数据和机器学习当前研究是如何偏离初衷,又蕴含了怎样的巨大威胁。他认为,我们还有机会来建构一种新学科领域——真正以人类为中心的工程学科。
大数据文摘对这篇文章进行了全文编译,对原文感兴趣的读者可以在文末链接科学上网去Medium查看原文。
Michael I.Joardan教授是吴恩达的导师,在机器学习和人工智能领域建树颇深。大数据文摘曾报道过他的不少学术研究内容和技术干货讲座视频,点击蓝字可以直接查看:
吴恩达导师Michael I.Jordan刚去清华手写版书讲了三天课,这有一份他的课程笔记
吴恩达导师Michael I.Jordan学术演讲:如何有效避开鞍点(视频+PPT)
Michael I.Jordan:我们并非处于人工智能的大爆炸时代
以下为Michael I.Jordan博客全文:
作为这个时代的代名词,人工智能正被技术人员、学者、记者和风险投资人共同吟诵。
和其他专业名词一样,这个名词在被使用过程中伴随着种种误解。事实上并不是公众不理解科学家,而是科学家有时候也像公众一样迷惑。
“与人类智能相媲美的硅基智能正诞生于我们所处的时代。”这类想法让我们激动万分,也带来了同等程度的惊吓和分心。
而关于当前的时代,也有一些不同的声音。
让我先讲一个故事,它涉及到人类、计算机、数据和生死抉择。
超声波检测数据和唐氏综合征
14年前我的太太怀孕时,我们做了一次超声波检查。一位遗传学家指出,胎儿心脏周围有一些白色斑点。
“这些都是唐氏综合症的标志,”她说,“患病风险已经高达5%。”她还告诉我们,我们可以通过羊膜穿刺术来了解胎儿的实际情况,但羊膜穿刺术具有一定的危险性,手术中胎儿死亡的概率约为1/300。
作为一名统计学家,我决定找出这些数据来源。
长话短说,我发现十年前有人在英国做过一项统计分析,这一分析称,这些白点反映了钙的积累,确实是唐氏综合症的一个预测指标。
但我也注意到,在我们的测试中使用的成像仪比英国研究中使用的,每平方英寸多几百像素。我回去告诉遗传学家,我相信这些白点很可能是假阳性的,它们实际上是“白噪音”。她说:“啊,这就解释了为什么自从我们开始用新机器,唐氏综合症的诊断就不断上升。”
我们没有做羊膜穿刺术,几个月后,一个健康的女孩出生了。
这一事件让我非常困扰,特别是在粗略计算后,我发现全世界每天有成千上万的人正接受这种诊断,而且其中很多父母选择了羊膜穿刺术,导致了一些婴儿不必要的死亡。
这种情况一天又一天发生,不知何时才能停止。
这个故事中的问题与我个人的医疗保健无关;它关乎医疗系统,测量不同地点和时间的变量和结果,进行统计分析,并在其他地方和时间使用结果。
这个故事中的问题与数据分析本身有关,而且与数据来源有关。
广义而言,数据来自哪里,数据得出了什么推论,这些推断与当前情况之间的相关程度如何?
一个训练有素的专家也许能够逐案解决所有这些问题,但问题能否是设计出全球医疗系统的解决方案,以至于不用人类监督也可以解决这些问题。
我也是一名计算机科学家,想要建立这种全球的推理和决策系统所需的原则,将计算机科学与统计学相结合,并考虑到人类的福祉,我所学的知识并不能帮助我解决这些问题。
不仅在医疗领域,而且在商业、交通和教育等领域,这些原则的发展至少与建立能让我们眼花缭乱地玩游戏和进行运动感知的AI系统一样重要。
无论我们是否很快就能理解“智能”,我们都面临着一个重大挑战,即将计算机和人类友好交互,从而给人类生活带来便利。
尽管有些人将之视为“屈从于人工智能”,但它也可以被更平常地看待,就像创建一个工程学科的新分支一样。
就像过去几十年兴起的土木工程和化学工程一样,这门新学科的目标是聚合几个核心思想的力量,以安全的方式为人们带来新的资源和能力。
土木工程和化学工程建立在物理和化学之上,而这个新的工程学科将以上个世纪落地的思想为基础,这些思想包括“信息”、“算法”、“数据”、“不确定性”、“计算“、”推理“和”优化“等等。
此外,由于这个新学科建立在有关人类的数据之上,所以其发展也需要从社会科学和人文科学的视角剖析。
虽然人工智能大工程的积木块已经有了,但是把这些积木块组合在一起的原则还没有出现,所以这些积木的组合仅仅以特例的方式存在。
就像在土木工程学科出现之前建造房屋和桥梁一样,人类开始着手构建大规模的推理和决策系统,它涉及机器、人类和环境。
正如早期的建筑和桥梁有时会以不可预见的方式崩塌并带来悲催的后果一样,目前许多早期的大规模推理和决策系统已经暴露出了严重的概念缺陷。
不幸的是,我们并不善于预测下一个会出现的严重缺陷。我们缺少的是一个具有分析和设计原理的工程学科。
当公众谈到这一话题时,他们过于频繁地使用“AI”,仿佛它是个通配符(wildcard),这使得人们很难推理AI这项新兴技术的范围和后果。
因此我们需要仔细思考AI这一名词在历史上和今天,到底指的是什么。
什么才能被称为AI?
今天大多数所谓“AI”,指的是过去的几十年中被称作“机器学习”(ML)的东西。ML是一个算法范畴,它将来自统计学、计算机科学和许多其他学科的想法融合在一起,设计算法来处理数据、做出预测并帮助做出决定。
ML真正给世界带来了影响,而且它所带来的影响不是最近才发生的。事实上,在90年代初就已经非常明确了:ML会给工业界带来大规模的影响。
在本世纪初,亚马逊这样的前瞻性公司已经在所有业务中使用了ML,解决了欺诈检测和供应链预测方面的关键问题,并且对面向消费者的服务做出了创新,如推荐系统。
在接下来的20年中,随着数据集规模和计算资源的快速增长,很明显,ML将不仅为亚马逊,而且将为任何一家能够将决策与大规模数据联系在一起的公司提供动力。
新的商业模式将会出现。“数据科学”这个名词开始被用来指代这种现象,反映出ML算法专家需要与数据库和分布式系统专家合作以建立更强的ML系统,也反映这一推理系统在社会和环境方面的潜力。
这种思想和技术趋势的融合在过去几年中被重新命名为“AI”。这一重塑值得仔细推敲。
从历史上看,AI这个词在上世纪50年代末被创造出来,表达了在软件和硬件中实现具有人类智能实体的强烈愿望。我们将使用“类人AI”一词来指代这一愿望,它强调人工智能实体似乎应该是我们中的一员,即使不是身体上,但至少在精神上(无论这可能意味着什么)。
这类研究主要存在于学术领域。虽然相关的学术领域,如运筹学、统计学、模式识别、信息论和控制论已经存在,并且常常受到人类智能(和动物智能)的启发,但这些领域可以说是集中在“低级”信号和决策上。
比如说,一只松鼠能够感知它所生活的森林的三维结构,并在树枝之间跳跃,这种能力给我们带来许多启发。
“人工智能”的关注点应该不同于此,AI应当关注人类“理性”和“思考”的高级认知能力。
然而,60年过去了,高层次的推理和思想仍然难以捉摸。现在被称为“人工智能”的发展主要出现在与低水平模式识别和运动控制制相关的工程领域,以及统计学领域——专注于找到数据模式并做出有根据的预测、假设检验和决策。
著名的“反向传播”算法在20世纪80年代初被David Rumelhart重新发现,现在被视作所谓“人工智能革命”的核心。其实,反向传播最早出现于20世纪五六十年代的控制理论领域,它的早期应用之一是优化阿波罗号宇宙飞船向月球前进时的推进器。
自20世纪60年代以来,我们已经取得了很大的进展,但可以说,这并不是来自于对“类人AI”的追求。
相反,这些工程师的杰作往往隐藏在幕后,就像阿波罗飞船的情况一样。虽然公众不容易觉察,但在文件检索、文本分类、欺诈检测、推荐系统、个性化搜索、社交网络分析、规划、诊断和A/B测试等领域的研究和系统建设的确取得了重大成功,推动谷歌、Netflix、Facebook和亚马逊等公司的进步。
人们可以简单地所有这些称为“AI”,但这样的标签可能会让优化或统计领域的研究人员感到惊讶,他们一觉醒来后发现自己突然成了“人工智能研究人员”。但撇开研究人员的标签不谈,更大的问题是,使用这个单一的、定义不清的首字母缩略词,会妨碍人们对技术和商业变革的清晰理解。
2个关键问题:智能增强和智能基础设施
在过去的二十年里,“智能增强”(IA)在工业和学术界取得了重大进展,这是对“类人AI”的补充。在IA领域,计算和数据被用来增强人类智力和创造力。搜索引擎可以被看作是IA的一个例子(它增强了人类的记忆和知识),自然语言翻译也是如此(它增强了人类的交流能力)。
基于计算的声音和图像生成可以作为艺术家的调色板和创意增强器。虽然这类项目可能涉及高层次的推理和思想,但目前它们不这样涉及——它们大多执行各种字符串匹配和数字操作,捕获人类可以使用的模式。
本文的最后一个缩略词是“智能基础设施”(II)。让我们想象一个由计算、数据和物理实体组成的网络,它使人类所处的环境更加友好、有趣和安全。这种基础设施已开始出现在运输、医药、商业和金融等领域,并对个人和社会产生巨大影响。
有时也出现在关于“物联网”的话题中,但物联网一般指把“物”放在互联网上,并不涉及这些能分析数据和发现事实、在更高的抽象层面上与人互动的“物”所面临的更大挑战。
例如,回到我的个人轶事,我们可以想象在一个“社会规模的医疗系统”中生活,它建立了医生以及位于患者体内外设备之间的数据流和数据分析流程,从而帮助人类进行诊断和提供护理。
该系统将纳入来自人体细胞、DNA、血液测试、环境、群体遗传学以及大量药物和治疗文献的信息。它不仅关注单个病人和医生,而且关注所有人类。就像目前的医学测试允许在一组人(或动物)身上进行实验,然后大范围应用一样。这将有助于保持相关性、出处性和可靠性,就像当前金融业正致力于解决财务和支付的可信性一样。
当然,可以预见,这一系统将会出现很多问题,比如隐私、责任、安全问题等等,但这些问题应该被视为挑战,而不是阻碍。
我们现在遇到了一个关键问题:如果要解决上述这些更大挑战,“类人AI”研究是最佳的,或者说是唯一的方法吗?
机器学习领域里最受欢迎的成功案例中,有一些与类人AI有关,如计算机视觉、语音识别、人机对局和机器人等。所以,也许我们应该等待这些领域的进一步发展。
这里需要说明两点。首先,报纸不会告诉你,我们在类人AI上取得的成功实际上非常有限,我们距离实现类人AI的愿望还很遥远。
不幸的是,尽管进步甚微,它带来的兴奋和恐惧给这个领域带来了过度的关注,而这种情况在其他工程领域还从未出现过。
其次,更重要的是,这些领域的成功不仅不足以解决重要的IA和II问题。为什么说它们不足以解决IA和II问题呢?看看自动驾驶就知道了。
要实现这样的技术,需要解决一系列的工程问题,而这些问题可能与人的能力(准确地说,是人所缺乏的能力)关系不大。整个交通系统(II系统)可能会更像现在的空中交通管制系统,而不是模拟现在的路况:一群分散的、面朝前的、注意力不够集中的人类驾驶员。
它将比现在的空中交通管制系统复杂得多,尤其是将使用大量数据和自适应统计建模来进行更细层面上的决策。这些挑战才是最需要被摆在首位的,而在努力解决这些挑战的过程中,专注于类人AI可能会令人分心。
当然也有人认为,类人AI包含了IA和II,因为类人AI系统不仅能够解决AI的经典问题(例如图灵测试),也是解决IA和II问题的最佳选择。
但是,几乎没有先例可以支撑这样的论点。照这么说,发展土木工程是不是需要通过人造木匠或泥瓦匠来实现?发展化学工程是不是应该先造出一个人造化学家?或者这么说,如果我们的目标是建设化学工厂,那么我们是否应该先建立一个人造化学家,然后再研究如何建造一座化学工厂?
还有一种与之类似的观点认为,人类的智慧是我们目前所能知道的唯一一种智慧,我们应该先模仿它。但其实人类在某些推理上并不十分擅长——我们会有失误、偏见和局限。
而且关键的是,人类还没有演化出大规模决策的能力,这种能力是现代II系统必须拥有的。人类也还不足以应对II系统场景中的各种不确定性。
有人可能会争辩说AI系统不仅会模仿人的智能,而且会“纠正”它,并把它扩展到大规模的问题上。
但是,这是科幻小说里才有的,这种推测性的论点虽然在小说中具有娱乐性,但不应该成为我们在遇到IA和II问题时的主要策略。我们需要研究IA和II问题本身,而不仅仅是坐等让类人AI来解决问题。
II系统的算法和基础设施挑战并不难解决,而这不属于类人AI研究的核心。II系统需要管理分布式知识库,这些知识库正在迅速变化,而且很可能在国际上互不一致。
这些系统必须考虑与云端的相互作用,来做出及时的分布式决策,并且它们必须能够处理长尾现象(即少量用户的数据量巨大、而大部分用户的数据较少的现象)。它们必须解决在不同管理部门和竞争对手之间分享数据的难题。
最后,尤为重要的是,必须将激励、定价等经济概念带入统计和计算基础设施领域,是它们连接了人与人、人与商品。这样,II系统就不仅仅是提供服务了,而是在创造市场。
音乐、文学和新闻等领域正急需这样能够用数据分析将生产者和消费者联系起来的市场。这一切都必须在不断演变的社会、道德和法律规范的背景下完成。
展望未来
当然,类人AI的经典问题仍然值得关注。
然而,目前AI研究的重点还是收集数据、部署“深度学习”基础设施、展示能模仿某些狭义上的人类技能(即几乎没有新出现的解释原则)的系统。
这样的研究重点偏离了经典AI研究里最主要的开放性问题,包括,在自然语言处理系统中引入推理和意义、推断和因果关系的必要性、开发计算上易于处理的对不确定的表示的必要性、以及开发制定和追求长期目标系统的必要性。
这些都是类人AI研究中的经典目标,但在目前“AI泡沫”的喧嚣中,人们很容易忘记这些亟待解决的问题。
IA还将保持相当重要的位置,因为在可预见的将来,在抽象地理解现实世界情况的能力上,计算机还无法追上人类,我们仍然需要经过深思熟虑的人机互动经过来解决我们最紧迫的问题。
我们希望计算机能够激发人类更高一层的创造水平,而不是取代人类的创造力(无论这可能意味着什么)。
John McCarthy(当时还在达特茅斯大学担任教授一职,但很快就去了麻省理工学院任职)创造了“AI”一词,显然是为了将他的初期研究与Norbert Wiener(当时是麻省理工学院一位老教授)的研究区分。Wiener创造了“控制论”一词,用以指代他自己对智能系统的愿景,这一愿景与运筹学、统计学、模式识别、信息论和控制理论密切相关。
而McCarthy的愿景里则强调了与逻辑的联系。这里有个有趣的反转,虽然“AI”是McCarthy提出来的术语,今天占据了主导地位却是Wiener的智能理论。(然而这种情况一定只是暂时的,AI的钟摆摆的比大多数领域都要大。)
John McCarthy (1927 - 2011) 和Norbert Wiener (1894 - 1964)
但我们需要超越McCarthy和Wiener的观点。
我们要认识到,目前关于AI的公开对话内容主要都集中在工业界和学术界的很小领域里,这可能会使我们面临由AI、IA和II带来的全方位挑战和机遇。
上述的角度不关乎科幻梦想或机器超越人类的噩梦,而更关乎人类理解和塑造技术的需求。这种需求在日常生活中变得更加现实有力。此外,在这种理解和塑造过程也需要来自各行各业的不同声音,不仅仅是技术上的对话。
过于集中地关注类人AI,会让人们屏蔽很多声音。
工业领域的进步将继续推动发展,学术界也将继续发挥重要作用,学术界的作用不仅在于提供创新性的技术理念,而且在于将来自不同领域的研究人员:计算机和统计学科、来自社会科学、认知科学和人文科学等领域的研究人员汇聚起来,他们的价值和观点十分重要。
另一方面,虽然人文和科学是我们前进的关键,但我们讨论的范畴依然是工程领域——社会造物:制造新的产物,这些产物应该能按照我们想要的方式工作。
我们都不希望在建立了能帮助我们获得医疗、交通和商业机会的系统后,发现这些系统并不能真正运转起来,从这个角度来说,在机器学习和数据科学占中心地位的领域,还有一个学科亟待出现。这些已知的领域令人兴奋,但还不能被视为新的工程学科。
而且,我们应该接受这样的事实:我们正在见证一个新的工程分支的诞生。在学术界以及其它领域里,“工程学”这个术语经常被狭义地引用,用以指代冷酷无情的机器,或带有人类失去控制的消极内涵,但工程学科其实是可以成为我们想要的样子的。
当前,我们有机会来建构一种新学科领域——真正以人类为中心的工程学科。
我不会给这个新兴学科命名,但未来,如果“AI”这个词继续被滥用,它将会给我们带来颇多限制。让我们开阔视野,淡化炒作,认识到未来严峻的挑战吧!
作者简介:Michael I.Jordan是加州大学伯克利分校计算机科学与统计学教授。他在计算、推理、认知和生物科学领域有超过三十年的工作经验。
原文链接:
https://medium.com/@mijordan3/artificial-intelligence-the-revolution-hasnt-happened-yet-5e1d5812e1e7