陈小平:《智能机器人:变革时代的应用需求与研发方法论》
由中国人工智能学会、中国电子学会联合主办的“中国智能机器人产业发展专题论坛”于8月23日上午在北京亦创国际会展中心的二层会议室C成功举行。
本论坛邀请了中外产、学、研、用等领域的知名专家学者参与,围绕国内外机器人和智能科学的发展热点和转型支点,聚焦智能机器人的智能装备和核心技术,共同探讨中国智能机器人发展的创新与变革。
来自中国科学技术大学机器人实验室的陈小平主任主任给我们带来了《智能机器人:变革时代的应用需求与研发方法论》主题报告,深入浅出地介绍了目前处于变革时代的智能机器人研究,应当如何确立其应用需求与研发方法。陈教授在报告中点明,传统机器人依靠精确性,新应用需求依赖灵巧性。变革时代的机器人应用出现大量新场景,为了适应新应用需求,有必要建立以灵巧性为核心的新技术体系。陈教授的演讲为智能机器人的研究指明了方向,确立了完善的理论系统。
以下是陈小平教授的演讲实录:
陈小平 中国科学技术大学机器人实验室主任,计算机学院教授
陈小平:今天我利用这个机会和大家做一个分享,我是中国科大机器人实验室主任,计算机学院教授。我今天的报告题目是“变革时代的应用需求与研发方法论”。今天我们这个论坛有来自学术界的专家,也有来自国内外行业组织的专家,我受人工智能学会委托来组织这个会,所以我就试图站在这两部分人的中间去思考,当然这也是我们最近几年一直在做的一些思考,就是用产业需求的观点来看我们现在的研究:我们现在的研究还需要做一些什么新的尝试?
我们知道,机器人除了交互以外,它的运动方面实际上是有两大类功能,一类是移动,前面两个报告都在集中介绍移动方面的一些最新的进展,一些前沿的成果。还有一个方面是机器人的操作。说到操作,可能我们马上就想到,工业机器人的操作不是已经做的很好了吗?但是现在如果我们用变革时代的观点,看一看未来我们的产业需要一些什么样的操作,我们就会发现,其实我们还有很大的挑战。
我这个问题的提出是这样的:56年前,工业机器人就在生产线上使用了,具体发生在通用汽车的生产线上,至今已经半个多世纪过去了。另一方面,20年前的人工智能,具体说是IBM的深蓝,已经在博弈问题中首次战胜了人类。这么长时间过去了,在产业应用中工业机器人是成功了,成功了很多年,但是智能机器人,或者说用到其它领域的机器人,比如用到服务、救援等等领域的机器人,为什么至今还不成功?
为了回答这个严峻的问题,让我们简单的回顾一下工业机器人,这里我说的都是操作方面。传统工业机器人是一种刚性机器人,它的结构很简单,基于关节和连杆结构,每个关节都是借助运动学计算,用实现编好的程序控制所有关节角度,使机械臂末端达到指定位置。这一套办法做下来很成功,重复精度可以达到亚毫米级甚至更高,重复几十万次误差在零点几个毫米,甚至0.0几个毫米。
我们往往觉得,好像只要机械臂做得重复精度达到那么高,在制造业的应用就没问题了。其实真实的情况不是这样的。事实上,当我们在工业制造需要操作一个工件,这个工件是需要用一些装置去做定位的,比如用一些夹具,这是一个夹具示意图,其中的夹具把工件夹住,而且要把它定位得非常准。所以,机械臂误差是亚毫米级,意味着同时也必须让工件的定位精度达到亚毫米级甚至更高。否则,这个手臂总是基本在同一个位置上进行操作,而被操作的工件的位置跑了,那你这个操作根本就不能达到要求。所以实际上在目前的工业应用中之所以能够成功,不仅是因为工业机械臂达到了很高的重复精度,而且工件的定位借助夹具等装备以及复杂的测量,也达到了非常高的精度。
所以现在我们得到这样一个观察:工业机器人应用的精确性实际上是由两个方面来保证的,一个是手臂的精确性,还有一个是环境的精确性,及通过生产环境的精确化改造达到的精确性。但是,这样做其实是有代价的。第一个问题就是这些夹具是非标准化的,刚才这个图就反映了这一点,如果加持工件的形状不一样,往往需要的夹具也不一样。在现场布置的时候,效率也比较低。现在夹具等辅助设备的成本已经占到机器人成本的40%,而整个生产线的成本就更高了。一条生产线里面机器人成本如果是1的话,整个生产线的成本在国内要达到3-5倍,在国外是3-8倍。也就是说,绝大部分开支不在机器人上,而在整个生产线上,而且还需要做到环境的精确化,所以成本高、效率低。一中替代方法是借助视觉观察,如果看得准就不要夹持工件了。现在这个方向确实在进步,但是目前要做到这样高的精度,视觉技术的成熟度从产业的角度来说还是达不到要求的。另外还有很重要的一点,就是在实际应用中存在着大量不能使用夹具的操作对象或者应用场合,也就是说有大量的场合不能用这套工业的办法,这对现有主流技术提出了极大的挑战。
传统的主流控制策略我在ppt上列了几条,从名称上就可以看出,这些技术试图产生一定的适应性,以降低对环境精确性的要求。但是,其实目前并没有完全做到。我们不说这些具体的技术,我们看看传统的控制原理,其实就是两类。第一类是基于决策论的精确控制,它的原理就是我用这样一个框总结出来的,当然用的是专业术语,有状态集、行动集、回报函数、概率转移函数。概率转移函数是其中一个核心,用概率转移函数计算值函数,计算最优策略。这一套方法在理论上很完善,有很多理论成果。但是在机器人上用这一套东西就比较难了,一个原因是计算效率不够,再一个是概率转移函数。到目前为止根据我们的了解,人类几乎从来没有得到过一个真正实用的大规模的概率转移函数。所以这套办法理论上很好,在实际应用中还需要做简化和优化。在机器人中是用运动学、动力学做简化,这个效果是非常好的。所以实际上传统的控制策略是决策论模型的优化实现,但是存在着局限性,就是以大量场景限制为前提,以昂贵低效工程部署为代价,在传统制造业部分领域获得成功。这是我们的一个观察:目前出现了更大量的应用场景,可能几百倍、几千倍于传统工业场景,用传统工业机器人的办法是有问题的。
第二种传统的控制原理是基于模糊数学的控制,这也有大量的理论研究,这一套理论抽象表达也是几句话,在这个框里。核心的想法是,原来的控制基于精确分类,0代表不在一个类里,1代表在这类里。而模糊分类理论上是代之以精确连续统分类,分的类就多很多了,理论上得到了很好的效果。可是在一般情况下,这是把一个困难问题归结为一个更加困难的问题,所以在实际应用中模糊控制其实用的非常少。总之,前一类控制原理是成功的,但成功的范围其实很窄。
下面我们看看机器人的一些新应用。第一个是室内服务和家庭服务。室内机器人工作在非结构化的环境中,而传统工业机器人工作在结构化环境中,而且环境始终是稳定的。但是在家庭应用里,不同的家庭环境不一样,同一个家庭不同的时间环境也是在变的,所以时间空间都存在变异性。另外,服务机器人要求和用户有互动,根据用户的需要进行操作,而工业机器人操作的时候人是不能接近它的。还有信息也需要交互,而工业机器人是通过操作工事先编程,所以这个差别是非常大的。这张图就是服务机器人,虽然服务机器人没有被实际应用,但是已经做了十几年系统性的探索。这是一个比赛,在家庭环境里出现一些事故时,机器人怎么找到人,怎么为人提供帮助,这就体现了前面一张图里的那些特点。
我们再看一下智能装配和物流,这里主要是工业物流,这时环境是半结构化的,不是完全结构化的,而且这个环境随着时间会有变化,操作工和机器人是要有互动的,比如共同做一件事,动作上要有互动,信息上也需要沟通。看这张图,这是德国Festo公司组织的一个比赛,这个比赛也好几年了。这张图里有一些加工的机器,也有一些机器人,机器在做一些操作,而工件在机器之间的传递是由机器人来完成的,这样实现的是柔性制造,生产过程可以随时调度,可以很快就换一个工艺,这是现在很多大大小小的企业正在追求的。前天我和中国一个很大的企业交流,他们就有这样的技术需要,这体现了未来的一种典型应用场景。另外还有其他应用需求,比如农业、救援等等,都有类似的需求。
我们把这两方面放在一起看,现有的成功的工业机器人技术,与当前和未来社会需要的大量新的应用场景,二者之间存在什么差距?显然存在非常大的差距,所以现在出现了新应用挑战,我们总结为:传统机器人依靠精确性,而新应用在操作方面需要的是灵巧性。这样我们就得到一个观察:精确性意味着什么?用一句话概括:意味着1%的成功和99%的失败。就是说,在工业领域是成功了,但是相对于未来大量新应用来说可能只占总量的1%的场景。100倍甚至1000倍新的场景用传统的办法是不灵的,所以这是一个非常大的挑战和机遇。
面对这个挑战怎么办?其实我们已经做了一些研究,下面简单的介绍一下。首先,针对灵巧性挑战,我们需要考虑什么问题?中科大机器人团队已经做了十几年,近十年一直在考虑这些问题。第一个要解决的问题是:大多数实用场景中机器人操作是否必须依靠精确建模?对环境、对加工对象、对机器人本身的精确建模是不是需要?第二个问题:大多数实用场景中机器人操作需要什么样的精确性?我们分析,精确性还是需要的,但是需要什么样的精确性?第三个问题:这种精确性应该用什么样的感知和控制技术来实现它?这是我们研究的三个问题。
下面用一个具体的例子说明我们的一些想法。例如,假设用户坐在桌边,要求机器人给他送一杯水,我们默认杯子是要放到桌边靠近用户的地方,就这么一个任务。这个任务看着很简单,但使用工业机器人那套办法就有问题了。为什么有问题?假设机器人感知与行动的综合误差是δ,杯子的目标位置当然不应在误差区域之内,这就需要精确测量桌面尺寸,但实际上桌面的精确测量是不可行的。当然,理论上一张桌子还是可以测的,但家庭机器人要进入千家万户,每家的桌子都精确测量,这是不可行的。桌面边缘往往不是那么规则的,而是坑坑洼洼,可能正好你要放杯子的那个地方缺了一块,这时操作就有问题。
那怎么办?我们的办法是用局部-现场推理来解决这个问题。我们并不去事先精确测量整个桌面,而是去测量机器人的感知误差、操作误差,进一步计算它的综合误差,这是和机器人有关的,跟环境没有直接的关系,所以这个我们是可以测的。测了以后,在实际操作杯子的时候,每次机器人都是用局部感知去观测杯子的目标点,测量目标点与桌子边缘的距离,让杯子的目标点避开桌面上的δ误差区,不放到那个区域里。这样就把很多困难问题都避免了,而用户任务也能够完成。这是我们提出的一个方案,这个方案不需要桌面形状和边缘的准确度量和建模。这个原理可以用到很多地方去。
基于这样的想法,我们开发了中科大的可佳机器人,它大概的构成是这样:在这张图片里,上面几个模块是人机交互、多模式自然语言处理和通用规划器,这些是人工智能技术;下面有机器人控制、感知、执行,还有机器人硬件。这样一个机器人是需要从外界获取一些知识的。我们做过一些实验,其中一个是可佳操作微波炉,整个加热食品的过程都由可佳机器人实现了。这里就有前面说的一些挑战,这个微波炉的位置不能被固定,固定以后很多操作就完成不了。但是不固定的话,稍微动它一下,比如一拉那个门,微波炉的位置就变化了;下面再关门,位置又动了。这种情况下,要去按微波炉的按纽,按照原来工业机器人的办法,通过精确测量与建模,那是行不通的。反之,用我前面说的新的办法,这个任务是可以实现的。
在视频里,这个测试任务中有三个用户,分别和可佳对话。可佳通过人机对话了解用户有什么任务,它马上现场就用自然语言理解,把用户任务变为机器人内部表示。现在看到的是第二个用户,第二个用户说我也要饮料,但是和第一个用户的不一样,这就需要自然语言分析。之后,两个用户的任务由机器人自动规划出来了。第三个用户说,我要爆米花,你给我用微波炉加热。可佳说OK,表示它听懂了。但接着机器人做规划,却发现它不会用微波炉。用户说你查一下说明书,这说明书都在网上。现在可佳不能处理说明书全部内容,但可以处理微波炉按纽功能说明那一部分。现在我们看到的是可佳正在分析那一段说明书,分析完了自动提取知识,然后可佳就把三个用户的任务自动规划出来了,排了20多步。排出来以后,它就开始一步一步执行了。现在机器人自动把门打开了,一打开微波炉的位置就变了,它还要把碗放进去,再把门关上,这时微波炉位置又变了。机器人通过观察显示屏,看是不是按中了。现在按中的成功率是90%,就按三次,三次按不中它就请人帮忙了。现在机器人在给用户送饮料,这也是机器人自主规划的。她知道那两个用户坐在一起,她就“偷懒”,把其中一个用户的饮料放在自己的盘子上,手里再拿一个,一次就送过去了。整个过程都是机器人自动完成的,这里面的挑战主要和操作有关,因为这种室内相对简单的环境中,定位导航还是相对比较容易的。
最后给出几点结论。总结一下,传统工业机器人成功是靠精确性,但是精确性并不像我们通常认为的那样,只靠机械臂的重复精度高就行了,实际上还涉及到环境的结构化,操作对象的精确定位、建模等等,所以所谓精确性并不是单纯的设备软硬件特性。第二点,变革时代的机器人应用出现了大量新场景,包括智能制造、物流、救援、农业、家庭服务等等,面临本质性新需求,如环境非结构性、变异性、交互性。这些要求和精确性不一致,所以为了适应这些新的应用需求,我们需要建立以灵活性为核心的新的技术体系。目前在学术界已经有一些研究了,但是未来还有很多新的挑战,这也给我们带来很多新的机会。最后谢谢大家!
听众:很有意思的报告,我很多年前做过很多机械臂方面控制的问题。你最后讲到挑战的时候,精度的挑战还有柔韧性的挑战,我就是没有听到你谈关于力控制,因为力控制实际上是我们人做操作的时候非常重要的传感信息。很多精度上人的绝对空间控制精度非常低,但是我们所利用的是力传感,触觉传感以此克服精度传感不足,我不知道你对这方面有没有什么想法?
陈小平:非常专业,一下抓住一个要害。关于这个有很多不同的研究,有不同的思路去做,确实是前沿的课题。我们的想法大概是这样:从操作的角度,我们没有从比较传统的那种办法去做。我们现在是想的另外一种办法,就和我刚才说的是一个思路的,我们是从硬件上现在用soft robotics技术。这种硬件是软的,它不仅能达到一个位置,而且能控制它的朝向,所以自由度更高。另外,这种手爪抓东西能够有更好的贴合度,对形状分析的要求就大大降低了,就不需要对形状、位置知道那么准确。我们认识到精确控制是很难的,可能十年二十年都没有办法达到那种要求,所以干脆就让手爪的适应性更强,贴合度更高,反正它抓住了物体再说,大概是这样一个想法。
听众:我知道陈老师的机器人和相关技术多次获奖。除此之外,我觉得你刚才提了一个最好的想法是建立一个以灵巧为核心的新的技术体系,或者把它叫做人的智能化的新体系,这个对工业以及对我们产业的影响是比较大的。刚才举传统机器人跟新人工智能机器人在新体系方面的影响,这个体系会涉及到未来的标准制造和产业模式,我就想问陈老师,你这个体系现在有没有产业化方面的具体考虑和计划,就是说基本这个体系的构建已经形成了还是在做一些新的探索?
陈小平:郝院长从产业角度提出了很关键的问题,我们现在当然主要还是在做研究,同时已经开始把它按照产业的需求来做这种技术的体系。有一些技术方面还需要进一步研究,短期可能成熟度相对还比较低。但是现在确实在考虑产业的实际需求,希望能比较快的衔接上。既然精确性办法难度比较大,周期比较长,现在我们在硬件上用soft执行器,软件上以灵巧性为出发点,已经开始和产业接轨,也找到了一些合作伙伴,现在正在开始做一些对接,希望把这套东西先在一些典型的应用场景中做应用,从这个应用场景来看它到底是不是合适,同时我们也根据对应用场景更好的理解,更全面的理解,更深入的理解,更好地做我们的研究。现在是这样的一个阶段。
听众:陈老师好,我作为一个本科生问您一个问题,我看您最后展示那个视频,是中科大的对吧,他们面孔都很年轻,我想问本科生如何参与到这种制作和设计中。
陈小平:这个问题我觉得也很好,中国机器人人才缺口很大,郝院长他们调研一年缺好几万。所以现在中国机器人产业培养人才也是中国发展机器人产业的重中之重之一。在我们学校,因为学校招生招的比较少,相对来说教师比较多一些,所以我们采取的措施是从本科二年级就开始吸引本科生进实验室。不能有硬性的规定,但基本成一个传统,到三年级都要进实验室,三年级还不进实验室就觉得不太对劲了。我说的实验室是老师的科研实验室,不是教学实验室,教学实验室那是另外一回事。通过进老师的科研实验室,本科生二、三年级加入科研团队,一开始可能也做不了科研,但是就跟在后面看一看,这样就知道书本和真正的科研有些什么不同,我觉得这一点非常重要。因为我一直觉得中国的教学存在比较严重的理论脱离实际。所以在我们学校通过这种办法,本科生进科研实验室的办法,帮助本科生更好的了解科研,更顺利的进入科研。
CAAI原创 丨 作者薛陈小平
未经授权严禁转载及翻译
如需转载合作请向学会或本人申请
转发请注明转自中国人工智能学会