独家 大数据:当梦想遇到现实(干货)
更多完整图文内容,请关注公众号“THU数据派”(ID:datapi)
[导读]本内容选自清华大学数据科学研究院执行副院长韩亦舜于2016年10月26日在AI大数据加速器活动上所做的题为《大数据:当梦想遇到现实》的演讲。大家好,真的很高兴来到这么激情四射的活动现场,徐小平老师讲完以后我们这些理工男都没法上台了,他把大家的激情调动得太好了。今天是AI大数据专题,我们分享一下对大数据的看法,15分钟之内这么大的题目把大家从理想带回到现实,或者把大家从现实引向理想境界都是不容易的一件事。
我们来看看现实的情况,先从大数据荣与“衰”讲起,这是Gartner技术成熟度曲线,投资人很多都看这个曲线。到2010年的时候大数据没有出现,2011年“大数据”一词出现在曲线上。2012年在这里,2013年达到巅峰了,2014年已经开始没落了。大家知道,2014年贵州的大数据才刚刚开始,就是说我们搞不好又是起大早赶个晚集,我们启动大数据的时候在这个曲线上已经开始没落了。2015年“大数据”一词从曲线上消失,大数据去哪儿了?2016年曲线上也没有“大数据”一词。大家不用着急,让我随便挑几个曲线上的技术,这些很多都跟大数据密切相关。可以说大数据已经不再作为一个技术在曲线上继续发展,而是真正意义上讲的大象无形,出现在我们生活中的方方面面。
我们常讲“理想很丰满现实很骨感”,大数据的发展也是这样,理想和现实差距还是很大的。
我们理想中大数据作为监控手段让我们真正实现所谓的把权力关在笼子里,但现实中,很多公共大数据被权力和各种借口关在了笼子里。
理想是我们希望有数据中心,数据交易所,顿时GDP因为大数据而一飞冲天,但是现实就是有这么多的困难,P2P等依托大数据对接贷款人和借贷人渠道产生了新的问题——这些都是现实和理想的差距。
理想是我们希望信息高速公路的建设带来数据可以流动可以四通五达,现实中仍然存在很多信息孤岛的现象。
原来希望大数据能够引领中国迅速走向世界前列,现实我看到这样的图,这是一家外国公司,发布的(Global Open Data Index),很不幸,2013年中国排第38位,2014年是58位,2015年是93位。这是我们的梦想和现实之中的差距。这也没什么可怕的,在技术发展的道路上,我们一路走来都是这样,少不了磕磕绊绊。曾经有一个年代,AI在低谷时期,说谁是搞AI的都是一种“骂人的话”,我会不会大数据也会有这样一天呢?我觉得如果是这样,也正常,因为很多我们的理想和现实是有差距的,然后需要一些新的努力,随着新时代的到来,新技术的发展进行新一波的发展,一定是呈现所谓螺旋式上升,在哲学课上就讲到过这个理念。
讲到大数据的产业特征,呈现两个三角形。第一个正三角形代表在基础技术领域,有技术难度,需要较大的科技投入,会产生较多的知识产权。而在产品应用领域,技术难度会较低,科技投入需要少一些。中间产品领域介乎于两者中间。
第二个是倒三角形,反映了产业应用领域,在人才需求,思维挑战,双创机会和社会价值方面产出更大。基础技术领域在这四方面会少一些。大数据未来技术发展的趋势,我觉得一定朝这几个方向发展。让大数据更直观,更安全,更方便的使用,都是技术发展的新趋势,这里头包括人工智能,包括区块链。比如:区块链这个概念以前也提过,在大数据时代又被重新提起。
我们再来看在应用领域,这些都是我准备PPT时想到的一些领域,相信台下很多人实践都远远超出了我这里所罗列的几个有限的方向。
中国大数据的应用发展方向是什么?我想说,国家发展需要什么,大数据就应该朝那个方向发展。比如:从消费端到生产端,用需求倒逼供给侧改革等都是我们未来大数据的发展方向。再如:需要出现一些技术,在中国这样的情况带动一批中小企业,让他们进入IT时代进而走进DT时代。
讲到大数据在中国发展的必由之路,首先是要补上两化融合的课。今天在座的多是做AI的人,都工作在技术前沿,对这个感受不是特别深,其实中国两化融合还是有很大发展空间。IT的相对水平还比较低。另外,有些是改良式创新,有些是颠覆式创新会并存。我们进入了所谓工业4.0时代,实际中我们有些工厂也已经走在了前面,像山东的红领集团。但更多的将会是多种状态并存,工业的1.0,2.0,3.0,4.0都会存在。今天不要单纯追求时髦的概念,应该是只要适合中国国情,行之有效方法我们都应用。
最后分享一下怎么看待一个技术的发展进程及对社会的贡献。今天很多人把大数据形容成16世纪末17世纪初望远镜和显微镜发明的时代,比如:望远镜能够看到星星,立刻觉得人类的能力得到巨大的提升,为此人们很兴奋。但是当在显微镜下看到一些很恶心的细菌的时候,人们突然间会产生焦虑。这个很像现在的大数据时代初期,一方面我们觉得人类能力得到无限的延伸,我们可以获取宇宙中的很多数据。但另外一方面我们每个人的数据都被监控,完全没有隐私,产生了很多的焦虑。这些在科技发展的历史上都很常见。
我还沿着这个例子来说望远镜显微镜发明的巨大社会价值。大家知道望远镜的出现彻底颠覆了地心说,显微镜的出现极大延伸了人类的生命。
就这个问题再往下深究的话,大家会发现什么?望远镜发明之前已经出现“地心说”和“日心说”两种不同的观点,只不过当时的数据支持地心说。所以望远镜的出现用了不长的时间“日心说”就被接受了。随着望远技术的继续发展,我们又发现“日心说”也不对,太阳系不过是银河里一个子系统。在显微镜出现之前有的医生已经发现交叉感染的问题,要求医务人员洗干净手,就可以减少交叉感染。那时候只是经验丰富的人隐隐约约意识到了什么,也有经验处理手段,但不知道为什么。显微镜出现之后发现有细菌,解释了洗手的意义。但是当我们遇到全新东西的时候,需要一些时间才能产生效果。显微镜发明到出现“微生物”一词已经是200年以后的事了,出现抗生素是300年以后的事。所以一个科技的进步真正作用于人类,跟当时的条件,认知能力有关,对于今天的大数据来说,其实也是这样的情况。
今天我有些担心,随着“大数据”一词在技术界不那么“火”了,一哄而上关注和投资大数据的热潮会不会退去?会不会明年两会,大家会追捧下一个新词?一哄而上可怕,一哄而下更可怕。我觉得还是应该关注大数据,当人类有更多数据来描述我们这个世界的时候,甚至发现比DNA更新更细的数据来描述人的时候,一定会对我们产生的更多更深远的影响,只不过它可能需要一点时间。所以无论是在座的创业者,还是投资人,我想最后跟大家说一句话,“让大数据再飞一会儿”。谢谢大家!