CCAI2017专访｜清华大学朱军：深度学习“盛行”，传统方法何去何从？

辉兔子

2017-07-13

记者 | 何永灿

朱军博士是清华大学计算机系长聘副教授、智能技术与系统国家重点实验室副主任、卡内基梅隆大学兼职教授。2013年，入选IEEE Intelligent Systems的“人工智能10大新星”（AI’s 10 to Watch）。他主要从事机器学习研究，在国际重要期刊与会议发表学术论文80余篇。担任国际期刊IEEE TPAMI和Artificial Intelligence的编委、国际会议ICML 2014地区联合主席、以及ICML、NIPS等国际会议的领域主席。

CCAI2017专访｜清华大学朱军：深度学习“盛行”，传统方法何去何从？

清华大学计算机系长聘副教授朱军

近日，朱军博士接受了CSDN的专访，采访中分享了目前最新的研究进展，深度学习与传统机器学习如何融合发挥最大作用，成为优秀青年科学家的必备特质，以及在CCAI 2017上的分享与筹备工作。

7月22-23日，中国人工智能大会（CCAI 2017）将于杭州国际会议中心举行，朱军将作为“人工智能青年论坛”共同主席主持会议，欢迎青年学者到现场参与讨论。

深度学习 VS. 传统机器学习

CSDN：在深度学习“盛行”的大环境下，如何看待相对来说比较传统机器学习（如支持向量机、贝叶斯学习、决策树等）？

朱军：这个问题可以从两个方面来看：

首先，深度学习不是万能的，它虽然在特定任务上取得了显著性能提升，但也面临着很多挑战，比如：对抗样本的鲁棒性、可解释性、处理不完全信息与不确定环境等，随着应用范围的扩大，深度学习不擅长解决的问题会逐渐明显，未来肯定会有更好的机器学习方法出现，或许还叫“深度学习”也可能是其他的名字。
其次，深度学习不是孤立的，它的进展与所谓的“传统机器学习”是分不开的，不能把功劳都归于“深度学习”，例如：用于保护深度神经网络避免过拟合的Dropout技术实际是一种贝叶斯学习方法，用于AlphaGO的深度神经网络需要在强化学习框架下发挥作用等。

因此，学术界和工业界都应该更客观地看待深度学习，它的优点可以与其他机器学习方法共融，比如已经取得很多进展的贝叶斯深度学习、深度产生模型（如GAN）等。同时，它的缺点也需要从其他方向寻求改善，比如：我们最近从信息论的角度出发，设计了一种新的训练准则和测试准则，可以显著提升深度神经网络（如CNN,VGG,ResNet）对对抗样本的鲁棒性；另外，我们与清华大学的刘世霞老师合作，研制了CNNVis和DGMTracker可视化系统，它们综合利用了信息可视化与图形学的工具，对深度模型的学习过程进行解释，帮助调试。

CSDN：对于“有了生成模型之后，引入深度学习就能解决统计学习的核心问题（如模型复杂度的选择、泛化性能的理论保证、学习效率等）”的观点你怎么看？

朱军：这个问题也要从两个方面来看待：

首先，生成模型通常要引入假设，在假设符合实际的情况下，这种模型是最优的，可以提升学习效率和泛化性能。
其次，也是因为假设，如果假设不符合实际，这种模型可能带来偏差。实际应用中，还需要对模型进行检验。

CSDN：去年参加CCAI 2016的AAAI主席Rao Kambhapati认为中国学者基本都在研究机器学习，范围有点窄，你是否认同中国人工智能研究存在这样的误区？除了机器学习之外，还有哪些领域或者哪些问题是值得我们关注的？

朱军：机器学习受到很多关注是有一定道理的。作为实现现代人工智能的主要技术途径（之一），机器学习的目标是从经验数据中不断改善性能，它的作用在大数据时代变得更加明显。目前，机器学习已经成为很多应用领域的首选技术方案。

但是，人工智能的其他方向也同样重要，而且在国内也正在受到很多的关注，比如自然语言理解、模式识别、知识工程、机器人，甚至是从脑科学寻求启发的尝试等。目前，可能是因为机器学习已经融入到这些方向中，才给人一种“到处都是机器学习”的感觉。但是，每种方法都有优点和缺点，学术界和工业界都需要鼓励多样性。比如：数据驱动的方法（如深度学习）往往需要大量的训练数据，而知识驱动的方法（如贝叶斯方法）可以在小样本下进行有效学习，二者具有互补的优势，它们的有机融合是当前的一个热点。

关于珠算平台

CSDN：请谈谈你近期的研究课题和进展，以及目前关注的研究和应用情况。

朱军：我们近期主要关注贝叶斯方法与深度学习的融合。我们的最近工作包括建模、学习算法和平台，在无监督、半监督等学习任务上取得了一些进展。为了有效支持这方面的研究，我们研发了珠算（http://zhusuan.readthedocs.io），它提供了一个Python编程库，能够便捷地实现贝叶斯深度学习的建模和推理。同样在贝叶斯框架下，我们对不确定、不完全信息环境下的决策也非常感兴趣，最近也做了一些博弈论的工作，包括即将发表在ICML上的文章。另外，如上所说的，我们也在提升深度学习的鲁棒性和可解释性方面做了一些积极尝试。

我们所做的机器学习工作，研发的算法和平台（如珠算）通常都是开源的，工业界可以使用。另外，我们也与一些公司合作，针对具体应用开发特定的机器学习技术。

CSDN：能否概述你的团队基于贝叶斯深度学习构建的“珠算”有哪些创新之处？适用于哪些领域？目前有哪些比较好的应用案例？

朱军：首先，珠算是一个概率编程的库，用户在上面可以很容易地实现贝叶斯深度学习的模型和推理，就像在TensorFlow上写一个神经网络一样便捷。贝叶斯深度学习是一个前沿方向，它的基本框架是概率图模型（贝叶斯网络），融合了深度神经网络在可学习的函数拟合方面的长处。和确定性的深度神经网络（如CNN）比，它的主要优点在于可以刻画不确定性（如噪声、信息不完整、随机过程），进行推理和决策。

其次，珠算上支持的应用已经有很多，比如无监督学习、半监督学习、贝叶斯学习等。我们在珠算上已经实现了目前主要的模型，如变分自编码器（VAE）、生成对抗网络（GAN）、主题模型、贝叶斯神经网络等，以及最好的概率推理算法。用户可以直接使用这些模型，也可以便捷地实现自己的模型。

最后，珠算在技术上也有很多创新，与TensorFlow很好地融合在一起。我们正在整理文章，很快将会公布技术细节。

CSDN：“珠算”选择构建在TensorFlow之上，其中有什么故事可以分享？

朱军：我们做珠算的主要目的是希望能够通过开源社区，支持大规模贝叶斯深度学习的概率编程，让这个前沿方向的科研和实践变得更容易。

我们考察过不同的平台，选择TensorFlow是有一些原因的。首先，TensorFlow已经有庞大的社区，并且展示出成为通用计算图框架的潜力。建立在TensorFlow之上有利于融入当前的生态系统。其次，TensorFlow计算图（computation graph）支持的操作（operation）种类远多于其他框架，能够最大程度满足概率编程的需求。最后，Tensorflow是少数支持多机多卡的分布式计算图框架，非常适合做为大规模贝叶斯深度学习的基础设施。

如何成为优秀的青年科学家

CSDN：成为人工智能领域优秀的青年科学家，你认为需要具备哪些特质？

朱军：科研是一个长期的过程，需要兴趣和坚持，同时，对问题要形成自己的认知和选择。现在是人工智能、机器学习发展快速的时期，是好事也可能是坏事，太快的进展容易让人失去定力，追逐一些容易出成果的“热点”。随大流虽然能发很多文章，但是，很难形成自己的系统性工作。因此，有些时候需要“少做”，才能选择重要的问题集中精力去做。

CSDN：就你自己而言，理论扎实，成果丰富，能否介绍是哪些因素对你今天的成绩起到了关键的作用，是时代机遇，个人坚持，前辈指导，同行交流，还是其他？

朱军：有很多因素。正如前面所说的，首先是要有兴趣，愿意投入精力去学习和钻研。其次要能够坚持，遇到困难不回避，能够主动思考解决的办法。只有通过思考得到的东西才是属于自己的。最后，要善于向前辈和同行学习，别人的观点可能是启发思路的火种。

CSDN：你介绍过一些工作在付出很多努力之后不得不中止，所以说选择方向很重要，这方面有哪些心得可以分享？

朱军：越是创新性高的科研工作，它的不确定性也会越高，导致结果有时会与预期相差甚远。但是，一个失败的探索过程也是有价值的，它至少告诉你哪些路是不可行的。选择了大方向以后，可以大胆尝试，遇到困难或挫折是很正常的，不用气馁。

CSDN：CMU博士后研究的经历给你最大收获是什么？如何理解国内外环境的差异？以目前的情况来看，你对青年是否要出国深造有什么建议？

朱军：博士后是一个过渡阶段，从科研和教学两个方面，都为后来的清华任教打下了好的基础。CMU有最好的学术环境、非常友好的同事和朋友，给我的帮助很大，我自己也在尝试借鉴CMU的经验指导学生。

目前，国内外的差异已经越来越小了，信息的不对称也在逐渐消失，国内的机会也很多。最近，我也很高兴看到有很多CMU的朋友陆续回国工作，这和几年前我回国时的情形完全不同，当时我们甚至开玩笑说我是先回国给大家探路的。因此，我觉得每个人可以根据自己的情况选择是否出国深造，盲目跟随应该会成为过去式。

CSDN：你如何理解和处理科研与教学二者的关系？

朱军：清华非常注重教学。我认为如果能平衡好二者的关系，教学与科研是可以相辅相成的。科研做的好能够帮助教学，对一个领域的深入理解能够将课堂上讲的知识点融合贯通，形成有机整体，而不是生硬式的拼凑。同时，教学的过程也能帮助系统地整理学科知识，加深理解，有时也能激发科研想法。

在CCAI 2017上的分享与筹备工作

CSDN：作为 CCAI 人工智能青年论坛的共同主席，对于组织这一论坛，你的出发点是什么？本次论坛将主要围绕哪些内容展开？希望为听众解决哪些问题？

朱军：随着数据和计算资源的增加，以及算法的改进，以深度学习为代表的现代人工智能技术正在越来越多的领域中获得应用和发展，并已经在一些特定领域取得显著进展，包括图像识别、语音识别、电脑游戏等。

但是，随着应用范围的扩展和复杂化，人工智能仍然面临着多方面的挑战，包括鲁棒性、可解释性、安全性、隐私保护等等。

目前，人工智能获得显著进展的领域通常需要大量的训练数据，如何发展对训练样本更高效的人工智能技术是很多场景下要解决的关键问题；另外，如何在信息不完全、不确定的非结构化环境下进行高效学习和决策也是未来要解决的重要问题。该论坛将探讨人工智能领域的前沿进展和未来趋势，嘉宾们将通过分享自己的观点、与听众互动，解答听众关心的问题。

CSDN：你是从哪几个维度来组织嘉宾阵容的？由此构建起的人工智能青年论坛将有哪些独特之处？

朱军：该论坛尽量覆盖人工智能的多个方面。邀请的嘉宾有学术界和工业界的优秀代表，也有优秀的女性科学家代表。另外，嘉宾的背景也具有很好的代表性、多样性。希望该论坛能够给听众带来最前沿的思想碰撞。

关于 CCAI

中国人工智能大会（CCAI），由中国人工智能学会发起，目前已成功举办两届，是中国国内级别最高、规模最大的人工智能大会。秉承前两届大会宗旨，由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办，CSDN、中国科学院自动化研究所承办的第三届中国人工智能大会（CCAI 2017）将于 7 月 22-23 日在杭州召开。

作为中国国内高规格、规模空前的人工智能大会，本次大会由中国科学院院士、中国人工智能学会副理事长谭铁牛，阿里巴巴技术委员会主席王坚，香港科技大学计算机系主任、AAAI Fellow 杨强，蚂蚁金服副总裁、首席数据科学家漆远，南京大学教授、AAAI Fellow 周志华共同甄选出在人工智能领域本年度海内外最值得关注的学术与研发进展，汇聚了超过 40 位顶级人工智能专家，带来 9 场权威主题报告，以及“语言智能与应用论坛”、“智能金融论坛”、“人工智能科学与艺术论坛”、“人工智能青年论坛”4 大专题论坛，届时将有超过 2000 位人工智能专业人士参与。

机器学习深度学习朱军清华大学

辉兔子

0 关注 0 粉丝 0 动态

相关推荐

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 2020-11-09

自动驾驶汽车深度学习如何应对挑战?

在自动驾驶汽车中使用深度学习可以帮助克服各种挑战，例如了解行人的行为，找到最短的路线以及对人和物体进行准确检测。根据一份报告，2018年约有80%的道路交通事故是由于人为错误造成的。因此，将自动驾驶汽车纳入主流的主要目标之一是消除对人类驾驶员的需求并减少道

86377811 2020-11-06

不要上手就学深度学习！超详细的人工智能专家路线图，GitHub数天获2.1k星

反过头来看，这些方法可能作用并不是很大，却消耗了大量的时间和金钱。如果你想成为数据科学家、机器学习或者 AI 专家，而又苦于找不到合适的学习方法，本文将提供一组思路清晰、简单易懂的人工智能专家路线图。这是一家德国软件公司 AMAI GmbH 近期发布的 G

Niteowl 2020-11-05

DJL 如何正确打开 [ 深度学习 ]

本文转载自微信公众号「小明菜市场」，作者小明菜市场。很长时间，Java都是一个相当受欢迎的企业编程语言，其框架丰富，生态完善。为了减少Java开发者学习深度学习的成本，AWS构建了一个Deep Java Library，一个为Java开发者定制的开源深度

ohbxiaoxin 2020-11-04

揭开AI、机器学习和深度学习的神秘面纱

深度学习、机器学习、人工智能——这些流行词皆代表了分析学的未来。在这篇文章中，我们将通过一些真实世界的案例来解释什么是机器学习和深度学习。这样做的目的不是要把你变成一个数据科学家，而是让你更好地理解你可以用机器学习做什么。开发人员能越来越容易地使用机器学习

bigquant 2020-11-03

用 Java 训练深度学习模型，原来可以这么简单！

HelloGitHub 推出的《讲解开源项目》系列。这一期是由亚马逊工程师：Keerthan Vasist，为我们讲解 DJL系列的第 4 篇。很长时间以来，Java 都是一个很受企业欢迎的编程语言。得益于丰富的生态以及完善维护的包和框架，Java 拥有着

PandaJiong 2020-11-02

面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。MLP使用一种称为反向传播的监督式学习技术进行训练。反向传播有助于调整神经元权重，以获得更接

fengzhimohan 2020-11-02

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 2020-11-19

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 2020-11-19

机器学习新风暴：如何用ML模型预测房价？

从驾驶汽车到识别语音+翻译，机器学习通过软件预测变幻莫测的现实世界，正在人工智能领域掀起一场风暴。机器学习是教计算机系统使用反馈的旧数据进行预测的过程，基本上是训练计算机根据过去的数据预测未来的数据。机器学习大致分为两大类：监督学习和无监督学习。对此可以使

81510295 2020-11-17

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 2020-11-17

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 2020-11-16

LinkedIn开源Dagli，发布Java机器学习函数库

近年来，越来越多的优秀的机器学习工具不断涌现，如 TensorFlow、 PyTorch、 Caffee 和 CNTK、用于大规模数据的 Spark 和 Kubeflow，以及用于各种通用模型的 scikit-learn、 ML.NET 和最近的 Trip

lgblove 2020-11-16

关于机器学习算法的16个技巧

您可能听说过瑞士军刀。如果没有，请看下面的图片。它包含许多刀片和工具。每个人都专门从事一项特定的任务。在某些情况下，不同的刀片可以完成相同的任务，但性能不同。我将机器学习算法视为瑞士军刀。性能可能会根据任务和数据的特征而变化。例如，对数损失是与所有分类算法

Pokemogo 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 2020-11-16

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 2020-11-13

需要知识的后深度学习时代，如何高效自动构建知识图谱

前沿的知识图谱自动构建技术有哪些？这篇文章将逐一解答这些问题。二者展示的信息量是差不多的，但右边这种看起来更加直观。而且，随着文本篇幅的增长，这种优势会体现得更加明显。其中，图的节点代表现实世界中存在的“实体”，图的边则代表实体之间的“关系”。基于知识图谱

lizhengjava 2020-11-13

10个丰富自我的机器学习项目

机器学习项目有很大的发展潜力，最近大火的韩剧也出现了这个词语并且用很浪漫的说法解释了它。毕竟招聘者一般通过你拥有的技能来判断你的潜力。此外，确保所有数据集都呈现开放状态允许自由访问。很多机器学习课程将这个数据运用于教学目的，它可以预测人类的活动类别，这是一

ohbxiaoxin 2020-11-13

机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。金融科技初创厂商是智能手机、大数据、机器学习、区块链等新技术的早期采用者，被认为是被更传统的银行和金融机构所效仿的潮流引领者。机器学习和深度学习的最新进展确实推动了计算机视觉和自然语言处理的界限。Sta

Icevivian 2020-11-13

24个提高知识和技能极限的机器学习项目

数据科学项目为你提供了一种有前途的方式来启动你在该领域的职业。你不仅可以通过应用它来学习数据科学，还可以在自己的简历上展示一些项目！这是大多数人挣扎和错过的地方。另外，我们确保所有数据集都是开放的并且可以自由访问。它由中型和大型数据集组成，需要一些认真的模

EchoYY 2020-11-12

辉兔子

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号