Emtech China峰会在京召开顶尖大脑聚焦 这一趟值了!

1月28日,《麻省理工科技评论》与DeepTech深科技主办的新兴科技峰会EmTech China于北京国贸大酒店正式召开。

Emtech China峰会在京召开顶尖大脑聚焦 这一趟值了!

《麻省理工科技评论》的EmTech 系列峰会已经在全球举办超过19年。来自世界各地的18位顶尖科学家、21 名科技公司领袖、35 位青年科技先锋出席了本次千人级大会EmTech China ,并在现场分享他们对于新兴科技的深刻见解。

延续《麻省理工科技评论》系列峰会的既往传统,2018年的EmTech China同样将目光聚焦在新兴科技上,这一次,人工智能、区块链、量子计算、可持续能源、生物医疗、自动驾驶成为本次大会的热门关键词。

而在这场科技大牛的盛会上,主办方邀请到了来自谷歌、亚马逊、高通、NVIDIA、微软、IBM、D-Wave、麻省理工学院、宾夕法尼亚大学、斯坦福大学、阿里巴巴、腾讯、科大讯飞、宜信公司、商汤科技、远景能源、平安科技、Hyperledger、Flagship Pioneering等机构。

我们也得到了他们对于科技趋势的独到见解。在28日这一场中主要议题以人工智能为主,共包括“实验室里的AI诞生记”、“云端上的AI风暴”、“芯片让AI重生?”、“企业级AI的高阶打法”、“AI对战星际争霸胜算几何?”五大板块。

让我们一起去看看他们都说了什么?

“实验室里的AI诞生记”

《深度学习:从炼金术走向化学》——MIT计算机科学与人工智能实验室教授Tomaso Poggio

Emtech China峰会在京召开顶尖大脑聚焦 这一趟值了!

在Tomaso Poggio的演讲中,他表示,深度学习有点像我们这个时代的炼金术,但是需要从炼金术转化为真正的化学。这样我们才能知道,深度学习在未来到底可以实现什么。

他举了一个将计算机视觉和机器学习进行整合的例子,机器识别行人和信号灯,从与原本的每秒出现10个错误变成每30英里只出现一个错误。究其背后成功的动因,是机器学习的算法,第一是深度学习,第二是强化学习。

深度学习可以帮助我们解决10%的难题,剩下的90%呢?Tomaso Poggio给出的答案是可能也需要来自神经科学以及认知科学的研究,更好地了解人的思维和大脑。这也是MIT大脑、心智和机器中心(CBMM)在研究的问题,大脑中智能的产生,是科学现在需要解决的元问题。

CBMM想通过以下三条路径解决这个问题。

一:计算机科学+机器学习

二:神经科学

三:认知科学

过去几年中,技术发展和理论发展、包括深度神经网络领域的发展很显著。要了解深度神经网络的运作原理,需要回答背后的三个基本问题:

  1. 1.逼近理论:深层网络什么情况下会比浅层网络更有效?

  2. 2.最优化:应该如何设计经验风险函数?

  3. 3.学习理论:为什么深度学习不会产生过拟合?

这三个问题是机器学习的奠基石。它们的答案很复杂,要解决这种问题,需要一开始就思考深度学习的一些技术理论,以及它的局限性。

在演讲的最后,Tomaso Poggio表示,现在是应用人工智能的黄金时代,因为深度学习及其工程应用,终于帮助我们将传统的人工智能科学理论应用于了工程实际,而且能够为我们进行赋能。假如我们可以超越深度学习的理论,可以更好的去了解人类智能的话,我们也可以更加深刻地了解我们人类到底是什么。

《人工智能的中国式文艺复兴》——香港中文大学信息工程系教授汤晓鸥

Emtech China峰会在京召开顶尖大脑聚焦 这一趟值了!

汤晓鸥教授的这段演讲中,以他对目前中国电影的看法开题,简单阐述了原创的重要性,在科技领域,原创一直是大家推崇也不断追求的方面。在谷歌的AlphaGo推出后,不少的公司开始着手让机器去打扑克牌,这反映的是当前的一种现实情况,跟着大公司的步伐走,这好像成为了一种心照不宣的打法,因此,“创新”反而显得尤为宝贵。

汤晓鸥表示,在AlphaGo之前他们就做了一件事情,2014年,其团队从事人脸识别在全球第一次让机器的人脸识别能力超过了人的眼睛,像AlphaGo一样,在某一个人类定义的单项任务上,机器超越了人类。然而在真正应用、从实验室走向大规模的产业化的时候,发现从实验室走出需要不断提升。

2014年,他们用20万人脸来对机器进行了训练做到了98.5%的准确率,而人是97.5%;2015年用30万人脸进行训练,达到了99.55%的准确率;2016年,用6000万人脸训练可以达到了百万分之一的误识率;2017年,用20亿人脸训练可以达到一亿分之一的误识率,而这样的误识率才可以真正地应用到各行各业,包括监控、金融、安防、手机等行业。

除了人脸识别之外,汤晓鸥还介绍了视频分析中的行为检测,比如,里约奥运会的跳水比赛直播,可以用计算机视觉分析方法将视频里的内容重点检测出来,跳过没有意义的部分,直接看一些真正的跳水的镜头。除此之外,还有基于内容的视频搜索,从电影种把各式各样的片段搜索出来;或是基于自然语言进行场景搜索,通过用自然语言描述响应的场景,可以自动搜索出相关的内容。总结起来,就是我们在教机器,教会他们下棋、识别人脸等等。

汤晓鸥表示,实际上所有的任务,都是我们人安排给机器做的,机器是按照我们的指令在做事情,不存在机器控制人类这样的事情,AI的真正目的是帮助人类,帮助我们提高生产效率。

他还给年轻人留下两句话:

第一句,电影一定要自己亲自去看。

第二句,AI这个词在中国拼音翻译过来就是“爱”,所以谈恋爱也要自己亲自去谈,否则你就不止“前任3”了,很有可能“前任4”、“前任5”了。

《AI崛起在于利用非结构化数据》——自然语言处理顶级专家,宾夕法尼亚计算机与大学教授Dan Roth

Emtech China峰会在京召开顶尖大脑聚焦 这一趟值了!

当我们连接wifi的时候,或者当你在下载的时候,会出现一个提示框询问你是否接受用户协议。这是一份很长的文本,那么你要接受吗?要认同吗?可能你会回答,对,我要接受,哪怕这个时候,可能你还没有读完这份长长的文本。但是这个文本中会涉及很多问题,比如,它会如何利用我的个人信息?不会侵害我的隐私?我们需要了解这些知识,这个文本能不能让用户清楚了解这些相关的保密内容呢?我们现在还没有一种稳定的方法可以去了解整个文本的内容,这就是我们现在遇到的问题。这个问题不仅是一个科学上的问题。这些文本关乎我们个人信息的安全性,这是每个人都要面对的问题。

因此,这就引出了Dan Roth所说的大多数的数据都是非结构性的。而建立一个系统,进行分析、学习,弄懂它背后的意义,这就成为一个重要的任务。

对于计算机而言,弄懂语意理解是十分困难的,因为在他们的背后有两层意思,包括语言层和底层意义层,语言层具有模糊性,可能会产生歧义,我们需要了解它的背景推测它的意义除此之外,语言层还有多样性,想要表达的每一点,都可以通过不同的方式表达出来。

其中,Dan Roth举了一个例子,三篇文本中,都提到了芝加哥,但可能提到芝加哥的乐队、足球队等都可以表达出芝加哥的意思。

传统的编程能力暂时没办法帮助我们解决语言的模糊性问题。所以就要利用最新的机器学习去减少文本中的模糊性,去连接语言中的逻辑,去解读背景知识,去识别不同的词汇之间,以最终消解这种模糊性。

机器学习是解决语言中模糊性和多样性一个必要的工具,在过去几年我们也看到了这个领域的发展。我们有不同分类方法来解决文本分类问题,他们依据不同的规则,使用不同的方法。比如我们会通过打上一个标签对文本进行标记,在标记的过程中对文件进行分类。比如可以通过病例来判断一个患者是否可以复诊,这是一种宏观的分类方法。

人工智能能够帮助我们进行分类,在过去的几年它也取得了长足的发展。这其中不仅有机器学习发展的功劳,还有其他的技术,包括计算能力的发展和储存成本的下降,都促进了机器学习领域的发展,还有新的分类方法的诞生。

大家如果关注这个领域,就会发现现在机器学习分类还不是非常的有效。如果把这些方法比喻成一个魔盒的话,需要了解这个魔盒中需要什么样的工具和内容。

我们不仅需要找到方法,更应该了解推理的方法,包括了解原因、假设结果和测试方法。因为推理应该是分类之上的逻辑,让同样的类别在一起进行集成。我们要清楚,一个点是否能推到下一个点,这样才能更好的解决问题、回答问题和进行优化。

自然语言处理现在有很多应用。比如,一个律所需要获得所有人的名字,这些人名都包含在邮件中,有不同的分析邮件的方法,我们该如何确定这些人的名单呢?我们还没有真正完全解决这些问题,还有许多其他挑战,包括推理、适应性训练,因为现在的模型大多不具有普适性。因此,最大的挑战是——监督。

那什么是监督?就是神经网络的监督。我们赋予神经网络一个任务,去模拟它,然后收集数据,设置一个模型。但现在我们发现我们的数据不够,没有办法去训练所有的模型,我们也不太清楚,什么是全部的任务。那这种方法就无法升级和进行普适性的应用,它更大程度上是只是一种偶然性的训练。

我们也发现很多的零散信号,如何收集这些零散的信号,进行训练模型?这有一个例子可以清楚的解释,如果你喜欢喝咖啡,就需要告诉机器人你的喜好,标准的机器学习的方法就是提供一个有隐喻的文本和很多意义的标记,就像是像一个老师一样,通过深入的沟通,为机器人提供信息,但这样做成本会比较昂贵。

现在则是想为它提供一些非直接性的信号,去训练机器人,把信息传递出去,如果它按照给定的方法去做,就说明信息传递十分清晰,反之,则说明例子不够好。因此,今天的挑战就是能不能实现这种依赖于这种描述语言、实现信息的传达,这将带来下一集的技术革命。

以上,是对于这次盛会的部分嘉宾的演讲整理,更多的消息,敬请继续关注!

相关推荐