从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

上周三,阿里云人工智能科学家、大数据孵化器团队负责人闵万里博士参与了由钛媒体主办的在线直播课堂,带来了题为“KDD Cup 2017背后的人工智能实践”的演讲。从人脑神经网络的研究谈起,再到人脑研究的应用案例,阿里云的人工智能是如何重现人脑思考过程的?又为人类带来了哪些便利呢?


主讲人介绍:

闵万里博士,千人计划专家,同济大学客座教授,2017 KDD CUP 大赛出题者。14岁被中科大少年班录取,19岁赴美攻读物理学硕士,后获得芝加哥大学统计学博士学位。先后在IBM TJ Watson Research Center及 Google 担任研究员。2013年加入阿里巴巴,参与主导了杭州城市大脑、饿了么人工智能调度等大型AI项目。

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

以下是部分精彩内容,想下载闵博士全部分享内容,请在天池公众号(微信号:tianchibigdata001)对话框内回复“闵万里”,即可获得分享的pdf版本哦!


人工智能和神经网络

今天许多创业公司做计算机视觉识别、语音的对话,甚至做一些机器人的控制,四肢发达,但是我们没有看到有一家公司在做大脑,所以今天给大家分享的最核心的理念就是我们要做互联互通的人工智能,要做大脑,大家听说过的城市大脑,其实就是其中之一。

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

如图中左脑和右脑,左脑负责逻辑、算术、理性的推演,右脑负责的是艺术、文学鉴赏、创造力,人工智能在这两个维度上发展,从远古的算盘到近代的计算机,再到深蓝以及AlphaGo,在理性上人工智能早就超过了人类,但是在感性的基础上还是有很大的空间。

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

对人脑的研究在国外很多年前就已经开始了,2013年的时候,奥巴马总统提出在美国高校研究机构联合做关于大脑功能的研究。核心是要充分理解人脑的认知层面,它究竟是怎样工作的,它的信号链路,它激活的功能区究竟是怎样相互关联的,时间的滞延、先后的逻辑顺序、空间、时空上的特征是怎么样分布的,对于旋转的物体、快速移动的物体,以及颜色快速变化、但是位置又不变化的物体,人脑识别过程又是怎样激活神经元、细胞元、认知的功能区呢?如果我们对认知过程的抽象理解,能够用一些算法或者公式甚至是一些定理描述出来,那么就有可能从算法层面,以及工程层面重现人脑的思考过程,这可能是人工智能最极致的状态。

那么,这样一个雄心壮志的目标是否能够实现?答案是可以。

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

如何用算法重现人脑的思考过程?图为一张高度抽象的脑部神经元相互作用的一个网络模型,在这个模型上,每一个节点可能是一个功能区,或者是一个细胞神经元,它们之间是远近相连的,信号的传递又有速度,不可能瞬时完成,我们抽象出一个简化的网络流模型之后,就有很多的数学定义可以帮助我们来反推,反映快就是信号传递得更快,反映慢就代表信号传递的速度会慢一点,所以这个网络跟交通网络非常或者水管网络很相似。

在这个模型当中,当我们观测到两个节点之间的信息流,这个信息流是源源不断随着时间在变化的,我们可以反推这个信息流的传播特殊路径是什么,它不可能是漫无边际的在整个网络上面均匀的传递,一定是沿着一个特殊的主要路径去传递,激活某一个功能元。

在一个固定的网络结构上,我们观测到了很多信号的传递,怎么样来理解这些信号的特征路径,以及预测某一类新的信号会沿着什么样的路径去传递?

我会用三页纸来解释一下背后的定理,这些定理是我们自主研发的,确切来说是我在过去十几年里做的一些研究发表的论文。

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

图中列有我的几篇主要论文,05年的是相关理论性的东西,11年和13年的两篇是基于这个理论的应用。

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

那么,在这个里面最核心的理论是什么?

就是当我们观测到了非常多的信息流之后,我们对它进行一些统计分析的时候,它的分布特性是什么样的,今天在脑神经认知科学的流程当中,当你观测到某一个现象非常多次数之后,它是否趋近于一个平均值或者一个正态分布,这几篇paper当中实际上给了一些正面的回答,在一定条件下,它是可以满足正态分布以及中心极限分布的特性。

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

定理如下:当我们在网络流、信息流这个认知过程当中,如果网络本身是有限连接和紧致连接,我们是可以证明的。当你重复很多次的时候,会看到一个收敛的过程。

人脑研究的应用案例

以上这些理论,具体有哪些用途呢?以下是我们做的一些具体项目:

1、《我是歌手》总决赛的排名预测

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

基于理性的判断,后面就有很多延伸,比如什么样的进程会让你感觉到是值得去追寻,响应会是什么样,当行为变得可预期了,用途在哪里呢?

图为一年前做《我是歌手》的歌手最后总决赛的预测,大家可以看到,图片上有当时的结果,我们预测了一个总决赛的排名。

在这个过程当中,我们要研究的不仅是选的歌好与坏,还有唱的好不好,现场的氛围好不好,而这些都是一些神经刺激的信号,都会对人的认知过程产生一些影响,如果是大部分人都认为很好的信号,就可能得到一个正面的反馈,这个反馈模型是我们通过很多过去的音乐、所得到的下载、点赞数算出来的。

2、ET

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

做了《我是歌手》之后,8月份我们发布了ET,ET包括语音的对话、网络流的预测,比如预测交通网络是不是堵塞等。我们要判断多种不同的信号,在我是歌手中,有声音、有光、有伴舞、现场氛围等多种不同的信号对人的认知过程产生的刺激,这些刺激是正面的还是负面的,那些人就是500个大众评审;而在ET的发布当中,我们要判断的是多种信号所带来的复杂的叠加效应会怎样在网络流上传播,这个网络就是整个城市网。

3、交通管理

基于网络流的理论,它的应用不光光在预测唱歌上或者是文学艺术的创作上,还可以在现实的物理网络当中同样的用起来,最简单的就是交通网络,大家每天都要参与进程,从一个节点跑到另外一个节点,这是交通网络上的一个动态流,对于这个信息流,我们需要提前预知它会怎么样变化,现在的拥堵会蔓延到哪里,怎么样进行预防性的排堵等。

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

这张图解释了我们去年做的一个工作,它可能是在人工智能指挥交通管理当中第一个成功的实践。这是因为我们改变了交通管理当中最核心的信号灯,在实际生活当中经常会发现,有时候在等红灯变绿的时候,很多车都在等,但是在绿灯的方向一辆车都没有,这种红和绿的供给错配是因为没有及时的发现网络流已经发生了变化。我们用移动互联网的数据,以及交警自有的数据,把多种信号融汇在一起来判断,当一个路口的信号灯不健康的时候,配时不合理的时候对其进行调节,相当于在这个网络上刺激一个信号进去,他会怎么样沿着这个网络传递?

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

上图可以解释背后的机理,从对比中看,传统的信号灯是一个近视眼,因为所有的触觉都是基于周边采集设备所看到的情况,比如说视频、地面的线圈、雷达枪等等,但是探测的范围非常的局部,看不到未来,看不到远处;

而互联网信号灯则不一样,我们看到的数据是从天而降的,根据手机定位聚合在一起就成了交通路况,甚至可以精准的知道在每一个路段上有多少辆车在跑,往东边走、直行还是左转,整个城市没有盲点,再配上人工智能的算法、网络流算法就可能看得透,直接效果就是我们能够判断管控的信号调整,比如调整绿灯的时间占比,会怎么样影响到周边的几个街道,怎么蔓延,这就像在脑部的神经当中某一个神经元上刺激一下之后,会影响到大脑当中周边哪些区域,哪些功能区。

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

我们也可以用深度学习的方法来做,从图中可以看到,这是一个典型的城市路网实时路况,每个路段上标的颜色是红黄绿,代表交通通行的速度是拥堵还是畅通。这张图片是一个image,设想在我们的城市当中,每分每秒都有一个snapshot(快照),实际上我们就有一串的image来显示这个城市的交通状态,所以我们就可以把一个交通状态的描述从网络的结构转化为一个image,有了image之后,后面就有很多经常用到的深度学习方法来进行分类或者进行unsupervised learning或supervised learning,来判断当前的状态会怎么样演变。

如果用深度学习的方法,对当前的盘面做推演,就应该清楚在哪些地方该下手调整,但对数据的回答上,在今天深度学习还做不上,还是需要回归到原始的网络流的模型上去,所以在这个approach当中,深度学习可以给我们找到下手的目标,然后再用网络流的理论来判断应该采用多大的力度,在什么时间点内采取行动,阻止整个盘面的恶化。

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

那么,这件事在去年已经在广州的两个区成功落地,今年在广州市将要全面推开,图为2月7号广州日报头版的新闻,可以看到互联网+信号灯已开始在全市推开,在全世界这是第一个在大规模的城市当中用人工智能去实时控制的信号灯。

4、城市大脑

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

如果说用互联网的数据控制信号灯是人工智能在交通管控当中成功落地的一个案例,那么上面这个城市大脑就是一个全面的升级,可以这样讲,互联网信号灯是城市大脑的1.0版本,而城市大脑是一个更加雄心壮志的版本。

这张图片是城市大脑的一个截屏,它要把所有的数据汇集,要看得清楚各种信号,在地图上面,我们要做实时的推演、判断盘面、交通状况的变化、公交车在哪里会有堵塞等,基于这个判断,我们要实时的调度比如调节高架路的信号灯、调节地面道路的信号灯、调节主干线公交运行班次甚至临时加开特快专线等。

现实生活当中有很多伪智慧城市的工程,是因为不在线导致的。事后诸葛亮的分析大家都可以做,但是在线的实时分析,在线的有智慧分析,却需要海量的计算能力、海量数据的处理能力,所以云计算的出现使得大数据的分析变成实时在线可能,城市大脑也就自然而然的出现了。

KDD Cup 赛题

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

说到城市大脑,上图要解释的就是KDD Cup, KDD是国际数据挖掘计算机学会,代表权威的数据挖掘大赛已经有20多年了,每年举行一次。这次我们提交了一个赛题,赛题的立意来自于广州信号灯、互联网的信号灯,希望有更多的人关注这个问题,找到更好的答案。

我们做了充分的讨论,模拟委员会答疑置疑,最后发现从信号灯的管控上,高速路口的瓶颈着手,既能够解实际问题,同时又有非常难的学术挑战性。

更重要的是,我们在广州已经有了成功的实践,所以知道这道题目是有答案的,只是今天的答案可能不是很完美,当你是一个全球首创的解决方案的提出者的时候,你肯定知道有更好的东西在后面,我们希望通过这道赛题,能够唤醒学术界的关注,包括同仁们的关注,让我们一起找到更好的答案,尽快的让信号灯变得智能,让大脑神经能够触摸到信号灯,让城市大脑能够跟它的每一个触觉地面上的信号灯实时联动。

大赛在本周一正式开赛,面向全球的参赛者、全球高校的老师学生、还有企业界工业界的同仁们、技术爱好者们。天池大赛平台是中国最大的大数据竞赛品牌,我们聚集了全球6万多数据爱好者,已经举办了三年,有几十个大数据竞赛,包括跨行业的、航空调度、安全、电商等。我们还要进行机场、航空公司、航线等方面的大赛,所以它是一个非常综合性的大数据竞赛的平台,承载了非常多的企业界实战问题,然后抽象为一个学术上可解的问题,邀请全球的数据爱好者来一起挑战,找最强大脑,找最好的答案。

5、运输车辆调度

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

案例如图,有一个工厂每天需要从周边的零部件供应商那儿用卡车把部件送到生产厂组装线上来实时的生产,生产线有非常严格的开工时间要求,一旦开工就不能停下来,那些送货的人必须确保零部件及时的送到工厂,所以他们每天用七辆卡车、1835公里来运输。

那么,当我们用人工智能大数据,以及云计算的方法去实时的计算整个沿途所能遇到的情况,现在生产线还有多少冗余的备件,还可以运行多久的时候,就有可能判断,卡车可以有顺风单的概念,就是说可以在运输的过程当中,再去取一个部件去另外一个地方取备件送过去,保证时间同时还能节省一趟无谓的行程,最后我们成功做到了,我们只用了五辆卡车,每天只跑1600多公里就已经做到同样的要求。

这背后得益于我们有一套实时在线的调度引擎,能够看到所有的位置,以及各个岗位上现在的状况,还有沿途整个交通状况,集合在一起就做了一个经典的运筹学问题,叫Vehicle Routing Problem(车辆路径问题)。

6、送外卖

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

图中有三种角色,一种是餐馆,一种是吃饭点餐的人,还有一种是运输的人,中央调度台需要判断每一个订单分给哪一个运输的人,这样一个实时调配问题,尤其在高峰期靠人来调的时候已经应接不暇了,到处是报警,到处是需求,而运力只有有限的人数。那这个问题还是需要靠一套调度的机制和算法实时在线进行计算,算得好算得准,不仅要知道彼此的位置,还需要知道时间,还需要知道从一个点到另外一个点中间的行程时间,交通状况是不是有拥堵,而这个问题我们从去年年底开始,已经在饿了么开发上线,所以现在饿了么已经有相当多的站点是自动化的调度。

7、质量管控

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

上个月有一篇报道,在江苏的协鑫光伏是全球最大的光伏切片企业,做太阳能发电板的面板,在这家企业当中,我们成功的用数据挖掘的算法和模型,帮助他们把整个生产线的良品率提升了一个百分点,每年创造上亿元人民币的价值。

我们做的跟原来用统计的方法做的事情是完全不一样的,今天在生产线上有几十个环节,上千个参数,而且是实时在线收集的,数据量已经超过用经典统计方法可以分析的力度,所以有复杂性,有离散性变量、有连续性变量、还有采集的变量之间还带有一些强依赖性,有冗余性在里面。更重要的是,它需要做实时在线的分析,及时发现异常实时反馈控制这个生产线,我们要把生产线抽象为一个神经元的问题,就是一个神经链路有多个功能区链接在一起,你可以认为是某一种认知行为的一个特征路径。

在这个特征路径上面,每一个环节到下一个环节,都传递的是一个信息,而在光伏切片当中,传递的是一组参数,以及这个物件用这样一组参数切割下来的产品到了哪个阶段,然后传递到下游去,所以传递的信息是通过光伏的板块来传递的。所以当我们把切割的流程抽象为一个信息的流程的时候,后面的分析就变得很自然了,它就是一个信息流。那么它的异常以及信息流上的关键节点,哪些对整个信息完整的表达是最至关重要的,我们通过历史的海量数据,全量数据,100%的数据去挖掘,在云计算的大数据平台上去挖掘,是能够发现这个最关键节点,也就是对应了在生产流程当中最关键的工序,在对应关键节点的工序上,他最优的参数控制应该是什么样。

协鑫的案例代表一类看上去非常传统的制造业,尤其是流程制造业,包括半导体流片、印染企业、钢铁炼钢都是流程制造企业,都可以抽象为一种信息流,有不同的节点,怎么样从海量的100%的历史数据当中去发掘在这个信息流当中最关键的节点,以及每一个关键节点里面最优的参数控制,协鑫的实践具有很大很强的行业辐射性。

8、量子计算

今天在基础理论上要突破,我们的方向在哪里?

我们不缺平台,缺的是思想和算法,更重要的是我们缺少原创性的算法和理论。在科学和技术这两者的结合上,今天有相当多的公司,包括从业者们,更看重的或者更加关注的是那些技术上的发展,某开源平台把计算效率提升了多少,但是为什么深度学习的理论,包括神经网络的理论,不是在中国这边创造出来的,或者说我们有没有机会在下一轮的人工智能理论或者脑科学的发展上,做出一个开创性的成果。这个方向在哪里?在量子计算。

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

图中解释了什么问题呢?量子计算机或者量子算法是一种崭新表征,来解释我们在人脑过程当中所传递的信息流程,不是用传统的电子计算机的0或者1来表达,它是用量子位来表达的,这是一个全新的理念。人脑的神经元的物理过程当中,经常处在一种模糊态,神经元可能是半梦半醒之间,是一个混合态,不是非黑即白的状态。对于混合态的描述,一个细胞可能处在激活或者没激活之间过渡态的时候,什么样的机理和数学理论是比较合适的?答案就是量子算法,就是qubit,它是一个非常好的数学工具,能够非常巧妙的描述一种半梦半醒之间的混合态。

从人脑研究入手,使人工智能不再“四肢发达,头脑简单”

目前,IBM已经商用化了50位的一个量子计算机,这可能会带来一个革命性的影响。那么,当量子计算机哪天成功的实现后,能够改造为用量子位来表征的一个算法,究竟能带来多大效能的提升?

这是一个非常基础性的理论问题,我们也一直在追踪研究,但做量子计算机的实验是非常难的。阿里巴巴跟中国科学技术大学潘建伟院士有合作,我们已经宣布要在量子计算机上进行突破,我们要在原创性的机器学习、人工智能的算法理论上进行突破。

这是一个非常漫长的过程,我们唯一能保证的就是埋头苦干,也希望科技界的同仁和我们能够一起来关注这件事,呼吁这样一个方向,让更多的科技从业者能够关注量子算法。

*本文首发钛媒体,根据闵万里博士在钛坦白上的分享整理。钛坦白是钛媒体旗下的在线课,专注于在线分享和垂直人群交流。点击阅读原文可查看。

相关推荐