图灵机与控制论之分歧,一切为了人类心智的荣耀
【新智元导读】图灵和维纳的思想都对人工智能的研究之路产生了重要影响,本文讨论了AI发展过程中的主要困难,特别是解释了图灵的人工智能方法和维纳的人工智能方法之间的关键区别,启发现有AI方法的未来研究方向。
艾伦·图灵,是天才的计算机科学家、数学家、逻辑学家、密码分析学家和理论生物学家,他被视为计算机科学与人工智能的奠基者之一。
图灵对于人工智能的发展有诸多贡献,例如图灵曾写过一篇名为《计算机器和智能》的论文,提问 “机器会思考吗?”(Can Machines Think? ),作为一种用于判定机器是否具有智能的测试方法,即图灵测试。至今,每年都有试验的比赛。此外,图灵提出的著名的图灵机模型为现代计算机的逻辑工作方式奠定了基础。
早在1948 年,图灵就写了一篇题为《智能机器》的论文,描绘了现在成为人工智能核心的许多概念,包括遗传算法、神经网络、强化学习等。在没有电子计算机的年代,图灵用纸和铅笔做出了这项开创性的研究,在今天引发热议。
诺伯特·维纳,是美国著名应用数学家,控制论的鼻祖。维纳在数学、物理、工程学、哲学等领域都颇有建树,但人们始终将创立控制论视为他对科学发展所作出的最大贡献,称其为 “控制论之父”。
自从 1948 年诺伯特・维纳发表了著名的《控制论 —— 关于在动物和机器中控制和通讯的科学》一书以来,控制论的思想和方法已经渗透到了几乎有的自然科学和社会科学领域。
图灵和维纳的思想都对人工智能的研究之路产生了重要影响。为了对当前实现人工智能的方法做一个高层次的总结,本文解释了图灵方法和维纳方法之间的关键共性和主要区别。
图灵所设想的人工智能设计是一次性成型的,而维纳所设想的人工智能设计是自主寻找,反复迭代多次后成型。
作者:清华大学自动化系 李力;西安交通大学人工智能与机器人研究所 郑南宁;中国科学院自动化研究所复杂系统管理与控制国家重点实验室 王飞跃
本文讨论了AI发展过程中的主要困难,特别是解释了图灵的人工智能方法和维纳的人工智能方法之间的关键区别,此外,本文还强调了人类在开发人工智能方面的作用。
特别地,对维纳的观点所涉及的问题、成功的成果、局限性以及现有方法的未来研究方向分别进行了阐述,旨在为读者提供一个良好的起点和路线图。
维纳和图灵:AI研究之路的关键节点和分歧之处
莱布尼茨(Gottfried Leibniz)在1676年提出通用语言(universal language)的思想。他希望创造一种通用语言来将所有的任务进行计算式的描述。同时,莱布尼茨还设想了一种机器,能够根据这种通用语言来计算数学论断是否正确。
之后,希尔伯特(David Hilbert)于1928 年提出了著名的“判定性问题”(Entscheidungs problem):是否存在一系列有限的步骤,它能判定任意一个给定的数学命题的真假?
邱奇(Alonzo Church)和图灵(Alan Turing)在1936-1937年各自独立解决了这一问题。他们的主要贡献在于将“判定性问题”形式化,详细定义了何为“一系列有限的步骤”。邱奇描述“有限的步骤”的模型为算子(-Calculus),而图灵描述“有限的步骤”的模型为图灵机(Turing Machine)。
从现代的角度来看,“判定性问题”中的“有限的步骤”指的就是由条件语句、循环语句等元素搭建而成的一系列可以由机械执行的过程。而这一执行过程也就是我们常说的“算法”。
邱奇和图灵还探讨了“可计算性”的概念,并提出了“丘奇-图灵论题”(Church–Turing thesis),断言:假设不考虑计算资源(脑力体力等)的限制,定义在自然数域,能被人通过算法计算的函数,也能被图灵机计算;反之亦然。
令人欣喜的是,图灵敏锐的意识到了计算和智能之间的密切联系,并开始了关于人工智能的研究。1950年,图灵发表了“计算机器与智能”一文,提出机器可以“模仿”人的思维活动(Turing, 1950)。图灵认为在没有真正理解人的心理和意识活动之前,我们只能以“模仿”方式进行机器思维的研究和测验。很遗憾,图灵在其有生之年,没有进一步对该思想进行更为透彻的阐述。
而另一方面,维纳(Norbert Wiener)于1950年出版《人有人的用处: 控制论与社会》一书,将自动机器和人进行了对比,认为两者均由感知装置,信息传递装置和行动装置等构成一个相对独立的系统。这一系统接受、处理、储存和传递信息,并籍此做出一系列行动,以实现与系统之外世界的互动。
如果将图灵和维纳的想法比较,我们不难看出两者对于人的智能的抽象方式有着某些共同之处,更有着显著不同之处。
1956年Dartmouth会议之后,人工智能研究取得了持续不断的进展。不同研究者提出了多种模型来解决特定的问题。特别的,麦卡洛特(Warren Sturgis McCulloch)和皮茨(Walter Pitts)于1943年首先提出的所谓“神经网络”人工智能模型的极大关注。在经历了多次低潮之后,Geoffrey Hinton等提出了深度神经网络,对于传统神经网络的网络结构,训练方式等进行了重要变革,极大的提升了模型的能力,在图像识别,语音处理等领域取得了显著的进展。
目前,人工智能取得了飞速发展和显著成就,已成为学界和社会关注的焦点。然而,经过了60多年的发展,我们仍然无法准确的回答“什么是人工智能?”“如何用算法实现人工智能?”“如何判定机器是否具有智能”等问题。因此,我们有必要回顾人工智能研究之路的一些关键节点和分歧之处,进一步深入考虑人工智能的本质。
在本文中,我们试图阐述如下几个话题:
1)图灵机(通用计算),图灵测试和人工智能之间的关系;
2)维纳的控制论与人工智能的关系;
3)人类智能与人工智能之间的关系。
为了表达方便,我们将自然的方式顺序展开我们的讨论,并在这一过程中插入我们对于这些话题的思考和观点。
计算和人工智能:图灵的方法
维基百科给出的人工智能定义是人工智能是指机器表现出“智能”。不过这一定义没有点出“任务”这一概念的重要地位。
有鉴于此,我们提出一个更为明确的人工智能定义:人工智能是指机器(在同样的任务中)表现出(和人类似或一样的)“智能”。需要指出的是这里的任务是不是指一般计算理论中的计算过程,而是指的是:希望人或者机器做出一系列行动(activities)来实现某种目的。
和这一定义相比较,我们不难发现图灵认为的实现人工智能需要大致三步:
- Step 1. 使用一种通用语言将现实任务描述成特定的数学命题。(智能的表述)
- Step 2. 找到一种算法(也即一台能够根据这种算法进行计算的机器)解决用这种通用语言描述的数学命题问题。(智能的设计)
- Step 3. 找到一种算法验证所提算法的正确性。(智能的测试)
如何实现Step 2已有诸多论述。然而,解决Step 1的“描述性问题”并不比Step 2的“解决问题”更加容易。如果我们使用某种图灵机来完成Step 2,则Step 1需要首先确定构成这一图灵机的各个组成元素(例如输入,状态,运行规则等)。但实际上,无论那个元素都不能简单的得到其描述方式。兹举一例。
类似于著名的“猴子和香蕉问题”(Monkey and banana problem),假设我们让机器人进入一个天花板上挂着香蕉,地上放在椅子和棍子的房间,完成摘取香蕉的任务。机器人的高度无法够到香蕉;但如果站到椅子上挥动棍子,机器人可以摘到香蕉。
如果我们不设定机器人具有移动椅子和站到木块上这两种行动,而只设定机器人具有移动自身和摘香蕉的行动;则机器人只能遵循着避撞规则在房间里面逡巡不已,却一直摘不到香蕉,导致这个任务无法完成。而让成年人类进入同样的房间完成摘取香蕉的任务,可能不费吹灰之力就能做到移动椅子到合适的位置、站到椅子上、挥动棍子、完成摘取香蕉的任务这一系列行动。这是因为人类已经通过经验积累和学习,潜意识中完成了对所允许行动集合更为合理的设定。
纵观过去多年的人工智能研究可以发现,目前尚未有一种方法能将所有任务自动地转化为计算式的描述,都需要人先将任务转为机器可以理解的特定图灵机模型,才能进行计算和求解。
基于上述以任务为核心的人工智能定义,我们可以得到如下的推论:
- 其一,特定的人工智能对应特定的任务。
- 其二,通过特定的测试只代表实现特定的人工智能。兹举两例:受过高等教育的盲人无法驾驶普通车辆;而目不识丁的健康人也可以驾车行驶(假定我们不去关心其是否识别交通标识)。
- 其三,通过特定任务的测试是实现特定人工智能的充分必要条件。该论断的充分性不言自明。如果机器完成了测试,则表明做出一系列行动来实现某种目的。而该论断的必要性则来自于定义本身。
这3条推论表明,实现人工智能Step 3必不可少。实际上,算法测试这一问题,其实非常类似于图灵机的“停机判定”问题。只不过对于人工智能而言,我们通常期望和描述的是:需要检验一台特定机器(也即该机器所运行的算法)是否能够完成特定的任务。
事实上,智能的验证同样困难重重。图灵提出的图灵测试这一试验是研究者为解决这一问题所做出的最早努力(Turing, 1950)。结合近年来的深入探讨,(Li et al., 2018)一文指出智能测试的难点主要有四:
1)与之前的分析类似,在当前的人工智能研究中,我们经常面临因为无法精确将问题表述为数学命题,因此也就难以对设计用于完成某项任务的机器的智能进行正确判定。
一个典型例子是无人车的智能测试经常采用所谓场景测试。如果受试车辆能够自主行驶通过由众多交通参与者和特定道路环境共同构成的交通系统,则称为通过该特定场景的驾驶测试。例如DARPA 2005 年无人车挑战赛便选取了212 公里的沙漠道路作为测试场景;DARPA 2007 年无人车挑战赛则选取了96 公里的城市道路作为测试场景(Urban Challenge 2007)。但实际上,无人车到底需要完成什么样的特定任务并未进行细化。因此,这样的智能测试难以量化,也不易分析测试的有效性和可靠性(Li et al., 2016; Li et al., 2018)。
另外一个典型例子则是图灵测试。早期的图灵测试并未明确的规定测试任务以及何种答案可以视为正确。这导致一些试图通过图灵测试的机器经常采用摸棱两可,王顾左右而言他的方式来试图避免直接回答(Ackerman, 2014; Levesque, 2017)。
2)随着任务的难度提升,我们很难验证受试机器对于任务中出现的任何情况都能做出正确的行动。虽然研究者提出了多种算法来尽量测试可能是最难的特定情况或者尽量覆盖可能可能出现的所有情况,但我们尚无完善的理论保证受试机器的无懈可击。
3)为了解决场地实测费时费钱的问题,研究者开始在一些人工智能应用中大量使用仿真虚拟测试的方法。然而,如何保证仿真的真实性和所呈现各种情况的丰富性依旧是目前研究的难点问题之一。
4)在很多应用中,很难直接给出一个非常明确的性能指标来评估所测试的机器是否达到了预期的指标。这个难点经常和难点2)共同出现,且和所考虑的具体人工智能应用密切相关。目前尚不能找到一个通用的模式来建模这一指标。
人工智能的尝试-测试-调整:维纳的方法
维纳将1935在中国清华大学的任教和研究经历视为Cybernetics思想的发轫之初(Wiener, 1964)。最初,Cybernetics研究被设想为:创造一整套表述方法和分析技术,以便统一且有效研究一般的信息、通信和控制问题(Wiener, 1961)。但由于维纳使用连续系统的方式来对信息论和通信技术进行建模,导致分析难度很大。而香农(Claude Shannon)使用离散系统的方式来对信息论和通信技术进行建模,获得了巨大成功(Shannon, 1948)。但维纳对于控制技术提出的反馈、稳定和镇定等概念和理论却获得了广泛认可,导致了现代控制科学理论的诞生。
特别的,Rosenblueth,Wiener和Bigelow三人于1943年发表了一篇文章,将控制看作是一个在原因和目的之间随机试探,不断验证和反复调节的过程。在1950年,维纳在其著作中将自动机器和人进行了对比,认为这一探索——验证——调节过程也是人学习新知识,完成各种任务的基本原则(Wiener, 1950)。因此,一些研究者认为维纳将反馈控制和智能系统联系到了一起(Albus and Meystel, 2001; Boden, 2006)。
我们可以根据维纳的思路,给出一个新的人工智能的定义:人工智能是指机器通过反复的探索——验证——调节所获得的,和人类似或一样完成特定任务的“智能”。
结合上文的分析,我们不难发现,图灵所设想的实现人工智能的3个步骤是单向依次进行的。而维纳所设想的实现人工智能的3个步骤中,步骤2和步骤3是循环迭代进行,直至所有任务都能被正确解决;参见下图。换而言之,图灵所设想的人工智能设计是一次性成型的,而维纳所设想的人工智能设计是自主寻找,反复迭代多次后成型。
维纳的这一思想为在更少人类智能参与的情况下,实现人工智能带来了新的解决途径。但和图灵一样,维纳未能指明到底应该用何种方式来具体实现人工智能。
践行维纳思想获得成功的研究首推神经网络的反向传播算法在神经网络中的应用(Werbos, 1975; Rumelhart et al., 1986)。神经网络一般由多个非线性映射的多层组合构成。我们主要通过不断修正这些组合之间的初始随机设定的加权系数来使得使得所研究的神经网络拟合特定的函数映射。误差反向传播是一种根据映射误差,结合优化方法调整加权系数的方法。神经网络,特别是深度神经网络获得的巨大成功表明维纳的探索——验证——调节框架具有很强的灵活性和适用性(Schmidhuber, 2015; LeCun et al., 2015)。
最近20年来,更值得关注的维纳思想成功应用是强化学习(Sutton and Barto, 1998)。强化学习首先界定了机器可能的状态和所能执行行动的集合;然后借鉴了行为主义理论,界定了行动所获得的回报函数,并设定任务完成所获得的汇报最大。接着,机器将按照某种较为简单的规则来进行探索不同行动获得的回报如何,验证当前机器所采取的行动策略是否需要优化,调节更新机器下一步所采取的行动策略,反复迭代直至任务完成。
强化学习首先在维纳创立的控制理论中取得了丰硕成果(Wang et al., 2009),接着和人工智能、机器学习的很多领域中都获得了成功应用。近年来,强化学习和深度学习相结合,使用深度神经网络来储存所习得知识,甚至籍此推测未验证的情况应采取何种行动(Wang, 2016; Wang et al., 2016a; 2016b; 2017; Li et al., 2017)。而这一点又和维纳曾经非常关注的神经网络和联结主义研究联系了起来。AlphaGo的大获成功表明,采用探索——验证——调节这一框架可以解决一些之前认为难以解决的难题(Silver et al., 2016; 2017a; 2017b)。
但是,目前这一人工智能实现框架依然存在着很多研究问题需要解决,特别是:
1)我们尚没有很好的方式判断机器是否已经足够智能。换而言之,我们经常不能保证机器已经探索和验证了足够多的情况,无法保证机器不会遇到不能处理的情况。例如,AlphaGo 虽然打败了多位人类棋手,但却在2016年意外犯下错误输给李世石一局(Silver et al., 2016; 2017a; 2017b)。
2)机器可能会记住错误的启发式知识,如何找出这些错误的记忆并剔除依然困难。AlphaGo Zero抛弃人类棋手的对弈棋谱似乎避免了记住错误的知识(Silver et al., 2016; 2017a; 2017b),但对于其它问题应该如何处理我们尚不得而知。
3)强化学习强烈依赖于我们探索和验证的情况的数目,如果所需的数据量巨大,则整个问题的求解难度依然不容忽视。AlphaGo Zero虽然能够在数天内学会下棋,但这是建立在Deepmind公司依靠强大的硬件资源积累了海量模拟对局数据的结果。如何减少对于数据的依赖是今后我们需要深入研究的方向之一。
4)很多问题我们难以直接定义合适的回报函数。为了解决这一问题,研究者提出了很多设想。例如模仿学习就是先从外在表现上模仿人类解决同样问题的行动,然后籍此建立初步的启发式知识(Hussein et al., 2017)。但这些研究结果还不具有很广的普适性。
不难发现,由于探索和验证是维纳设想的实现人工智能的重要步骤,本节提到的很多问题与上节讨论图灵实现人工智能所做测试中遇到的问题有本质的相似性。
人工智能还离不开人类智能的帮助
在当前阶段,设计和实现人工智能还不能离开人类智能的帮助。
首先,在智能表述部分,只有人类将特定任务转为为机器可以理解的特定图灵机模型,才能将计算和求解的工作留给机器来完成。
其次,图灵所设想的人工智能算法设计必须人类的参与。而维纳所设想的探索——验证——调节框架中,人类的参与可以大大减少。但目前还没有一种方式能够自动定义探索的行动集合,验证方式和调节方式。
最后,即使是人类可以较少参与的智能验证部分,尚有评价函数,停止条件等诸多内容需要人类专家来设置。
因此,从这一角度来看,目前的人工智能研究都属于人类智能和人工智能的混合(Zheng et al., 2017)。人类的奇思妙想和机器的高速低误差计算的结合,才早就了现在人工智能的成功。
此外需要注意的是,人工智能已经在某些特定的任务上超越了人类。因此,我们对于人工智能的定义或可改为:人工智能是指机器(在同样的任务中)表现出(和人类似或一样的,甚至是超越的)“智能”。
但今后人工智能机器是否能在所有任务中完全超越人类尚不得而知。图灵认为“根据哥德尔定律或者其它类似论据,一个人可以明白,无论机器构造如何,总会遇到一些无法给出答案的情况;但另一方面,一个数学家总可以得到他想得到的东西)”而维纳则暗示人和机器是并列甚至等同的地位,两者实现智能的方式本质并无不同。
因此,如何探究人类智能和人工智能的分野是今后需要关注的方向之一。值得指出的是,虽然研究者在过去几个世纪中投入了大量的人力物力,但迄今依然不能很好的解释人脑的运作机制和智能产生的内部过程。也许借鉴人脑的研究成果有助发展出更为强效的人工智能。
一切为了人类心智的荣耀!
本文探讨了分别从图灵和维纳而来的,实现人工智能的两大类思想。可以看到,图灵的想法接近功能主义,着眼于智能机器内部,主要研究智能机器的内在结构和运行方式,把机器和环境的关系放在次要地位。而维纳的想法接近行为主义,强调智能机器和环境的关系,着眼于外部,研究机器与环境各种输入输出的关系以及根据这些关系来调节机器。
这两种不同的思想带来不同的人工智能理论和实现方法,也各自有困难尚未解决。我们希望本文对于图灵和维纳实现人工智能的两大类思想的对比,能有助于研究者开阔思路,建立更为强劲的新一代人工智能机器。
在精密加工领域,我们使用粗糙的加工工具(如斧头和锉刀)制造了最早的机床。然后我们不断用低级的机床迭代更新制造出更加精密的机床,直到现在我们可以制造CPU和GPU。
类似的,我们也正在用低级的人工智能帮助制造更为高级的人工智能。在这些人工智能的帮助下,人类所能解决的任务也越来越多。
从这个角度来看,人类智能也在不断的提高。而这一切,正是“为了人类心智的荣耀!”
本文原文“On the Crossroad of Artificial Intelligence: A Revisit to Alan Turing and Norbert Wiener”,作者系清华大学自动化系 李力;西安交通大学人工智能与机器人研究所 郑南宁;中国科学院自动化研究所复杂系统管理与控制国家重点实验室 王飞跃;发表于IEEE TRANSACTIONS ON CYBERNETICS, VOL. 49, NO. 10, OCTOBER 2019
论文地址:
https://ieeexplore.ieee.org/document/8579540