清华AI Time：要强大的“黑匣子”，还是“可解释”的机器学习？

supergxt

2019-06-23

清华AI Time：要强大的“黑匣子”，还是“可解释”的机器学习？

来源：大数据文摘

清华AI Time：要强大的“黑匣子”，还是“可解释”的机器学习？

要不要用准确性换可解释性？这可能是许多资源有限的创业公司，在技术研发中面临的重要问题，同时也是机器学习可解释性研究中的重要议题。

把场景具体化，让我们先来看这样一道选择题。

如果你是一个投资公司老板，针对电话诈骗检测，现在有一个可信度85%，但无法解释的“黑盒”模型，和一个可信度75%，但可解释的机器学习模型摆在你面前，你会选择哪一个？

6月19日下午，AItime第二期以《论道自动机器学习与可解释机器学习》为主题，邀请到美国伊利诺伊大学芝加哥分校(UIC)特聘教授Philip Yu（俞士纶）、美国密歇根大学梅俏竹教授、北京大学的王立威教授和百度高级研究员李兴建进行了一次对谈。

这次的对谈就从这个问题开始。

但最初的最初，让我们先来理清这两个概念：自动机器学习与可解释机器学习。

理清概念

机器学习自动化（AutoML）：让机器自己炼丹

清华AI Time：要强大的“黑匣子”，还是“可解释”的机器学习？

王立威教授首先解释了什么是机器学习自动化。机器学习的应用需要大量的人工干预，比如特征提取、模型选择、参数调节等，深度学习也被戏称为炼丹术。

而AutoML 是试图将这些与特征、模型、优化、评价有关的重要步骤进行自动化地学习，实现从end to end 到learning to learn，使得机器学习模型无需人工干预即可被应用。让机器自己炼丹，让深度学习自动寻找最优框架。

使用AutoML，就像是在使用一个工具，我们只需要将训练数据集传入AutoML，那么这个工具就会自动帮我们生成参数和模型，形成训练模型，这样即使不具备机器学习方面深入的专业知识也可以进行机器学习方面的工作。

可解释机器学习（Explainable ML）：信任之后人与机器才能更好地互动

清华AI Time：要强大的“黑匣子”，还是“可解释”的机器学习？

随着AutoML学习模型的发展，机器学习的黑箱似乎在越来越大。这种缺乏解释的情况既是一个现实问题，也是一个伦理问题。所以近年，很多研究者呼吁我们需要可解释机器学习。

梅俏竹教授在解释XML的时候强调，辩题的核心还是在于AI和人的关系。我们大多同意未来的世界是AI与人共同合作，AI目前肯定还是做不到取代人。AutoML与XML其实并不矛盾，问题在于合作中如何人要如何达成对于AI的信任。

基于人工智能的结果越重要，对可解释人工智能的需求就越大。高风险的情况下，比如自动驾驶和医疗领域，人们可能需要明确地解释是如何得出特定结果的。而相对低风险的人工智能系统可能就更适合黑盒模型，人们很难理解其结果。

为什么说，机器学习中的可解释性很重要

追逐解释是人类的天性

场景问题是大家公认的导致可解释问题重要的一个原因。我们可以容忍机器没有理由地给我们错误推荐了一首不喜欢的歌，但是把重大的投资问题或者医疗建议交由机器决定的时候，我们希望可以得到充分的解释说明。

解释是跨多个行业和科学学科的负责任的、开放的数据科学的核心。

俞士纶教授提到对可解释人工智能的需求与人类的影响会同步上升，比如医生应用机器评估数据并得出决策数据，但是机器无法回答病人的疑问。以及在过滤假新闻的时候，机器在作出粗略判断和初步筛选之后，还是需要人类解释其中细微差别。

Clever Hans问题

Hans是一匹聪明的马，人们以为它会计算加法，因为有人说2+3的时候，它就会敲5下蹄子。但后来人们发现，它只是单纯地在敲蹄子，直到人们的表情发生改变就停下来。如果没有可解释性，任何人都无法保证高正确率模型其实只是另一匹Hans。

李兴建工程师说道，可解释也是企业实际应用非常关心的问题。如果人工智能系统出错，构建者需要理解为什么会这样做，这样才能改进和修复。如果他们的人工智能服务在黑盒中存在并运行，他们就无法了解如何调试和改进它。

可解释也许是一个伪命题

有些事情是无法解释，也不需要解释

但很有意思的事，解释可能无法穷尽。

王立威教授提出一个有趣的例子。机器作出判断，这是一只猫。如果我们要寻求解释，问为什么这是一只猫，机器可能回答，因为它有皮毛，有四只猫爪……我们再问，那为什么这是皮毛？

当然机器还可以继续解释，但是解释的结果可能会更加复杂，比直接告诉你这是皮毛要曲折得多。

人类大脑是非常有限的，而现在的数据太多了。我们没有那么多脑容量去研究所有东西的可解释性。世界上有那么多应用、网站，我们每天用 Facebook、Google 的时候，也不会想着去寻求它们背后的可解释性。

对于医疗行业的可解释机器学习的应用王立威教授也提出完全不同的想法，他认为只有在开始阶段，医生不够信任系统的时候可解释才重要。而当系统性能足够优化，可解释就不再重要。在不可解释上做的能超过人类，这就是未来机器学习的可为之处。

来自Geoffrey Hinton 的驳斥

Geoffrey Hinton 曾经大胆宣称，纠结深度学习（可与不可）解释性问题根本是一个伪命题。为什么一定要存在识别数字的理论才能证明我们擅长识别数字？难道非要通透骑车每一个细节的物理力学，才能证明自己会骑车？其实不是神经网络需要理论解释，而是人类克制不住自己讲故事的冲动，理论再合理也只是主观判断，并不能帮助我们理解为什么。

王立威教授表示赞同，以历史做类比。历史书上简单归纳出的胜败输赢难道就是真实的历史吗，不过是人类编造出的故事。真实的历史复杂，现实生活复杂，只言片语的解释和理论不过是管窥蠡测。

通过神经网络反思人的思维，同一个网络框架，初始点不同结果可能完全不同。解释可能会有两套截然不同的解释，就像对同一件事不同的人可能会有不同的解释。

一个人都无法完全理解另一个人，更何况与人的思维完全不同的机器？即使把alpha go下围棋中的所有数据告诉人也没有用，因为机器每一步的判断所用的数据是百万量级，而人最多处理到百的程度。就算打开黑匣，一千个人可能会看到一千种解释。

清华AI Time：要强大的“黑匣子”，还是“可解释”的机器学习？

俞士纶教授认为Hinton的说法还是有些激进，解释不仅是为了说服，解释的形式和含义都非常之广，就算是autoML我们还是要朝着可解释的方向不断推进。

梅俏竹教授则认为单纯讨论autoML还是XML是没有意义的，就像我们判断autoML好不好，怎么算是一个好的推荐算法？如果机器中午十二点推荐你去吃午饭，的确它的准确率是百分之百，但是对于用户来说这是完全没有意义的一个推荐。评判需要加入人的因素进行考量，还是要看人机配合得怎么样，加入用户体验。

autoML的能耗问题：ACL论文痛批其捡芝麻丢西瓜

最近一份提交到自然语言处理顶会ACL 2019的论文引起热议，研究人员对几种常见的NLP模型进行碳排放评估后发现，像Transformer、GPT-2等流行的深度神经网络的训练过程可以排放超过62.6万磅的二氧化碳当量，几乎是美国汽车平均寿命期内排放量(包括制造过程)的五倍。

某些模型可能经过了千百次的训练之后取得最优成果，但是实际进展非常微小，而背后的代价是不成比例的计算量和碳排放。

李文钰提出业界现在的解决办法有比如共享参数、热启动，利用之前训练好的参数，避免再从头训练一个模型。

真正的autoML应该是在大型数据集上搜索，操作类型，拓扑结构，加上人的先验知识，未来希望找到又小又高效的好的模型。我们希望用机器代替节约人力，但是人也要去限制一些盲目搜索，节约成本的约束。

未来之路：炼金，观星，算命都不可取

清华AI Time：要强大的“黑匣子”，还是“可解释”的机器学习？

几位教授最后都同意autoML和XML在未来是可以结合的。不管是autoML还是XML，现在还是在底层信号的层面运作，比如识别图像、文本，关键还是在知识层面，我们需要的是对整个网络结构更高层、更进一步的理解。

梅教授提出过犹不及，有三条走得太过的路是炼金、观星和算命。

炼金就是走极端的autoML之路。不要为了全自动就抛开所有代价去追求自动化，最后你也无法保证炼出来的是金子还是破铁；

观星，扩大范围，如果非要在一大堆的变量中拼命找联系，总能找寻到一二；

而算命的原理是找一些你愿意听的说，讲你爱听的故事，观星和算命都是在可解释的道路上走得太远。

最后的最后，梅教授也提醒大家，解释性可以解释部分问题，关于伦理，关于道德，但是它不是万能药。不要纠结于理解，为了理解而理解。

编辑：文婧

— 完 —

关注清华-青岛数据科学研究院官方微信公众平台“THU数据派”及姊妹号“数据派THU”获取更多讲座福利及优质内容。

机器学习黑匣子人工智能

supergxt

0 关注 0 粉丝 0 动态

相关推荐

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 2020-11-19

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 5评论 2020-11-19

机器学习新风暴：如何用ML模型预测房价？

从驾驶汽车到识别语音+翻译，机器学习通过软件预测变幻莫测的现实世界，正在人工智能领域掀起一场风暴。机器学习是教计算机系统使用反馈的旧数据进行预测的过程，基本上是训练计算机根据过去的数据预测未来的数据。机器学习大致分为两大类：监督学习和无监督学习。对此可以使

81510295 2020-11-17

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 5评论 2020-11-17

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 12评论 2020-11-16

LinkedIn开源Dagli，发布Java机器学习函数库

近年来，越来越多的优秀的机器学习工具不断涌现，如 TensorFlow、 PyTorch、 Caffee 和 CNTK、用于大规模数据的 Spark 和 Kubeflow，以及用于各种通用模型的 scikit-learn、 ML.NET 和最近的 Trip

lgblove 2020-11-16

关于机器学习算法的16个技巧

您可能听说过瑞士军刀。如果没有，请看下面的图片。它包含许多刀片和工具。每个人都专门从事一项特定的任务。在某些情况下，不同的刀片可以完成相同的任务，但性能不同。我将机器学习算法视为瑞士军刀。性能可能会根据任务和数据的特征而变化。例如，对数损失是与所有分类算法

Pokemogo 8评论 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 12评论 2020-11-16

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 12评论 2020-11-13

需要知识的后深度学习时代，如何高效自动构建知识图谱

前沿的知识图谱自动构建技术有哪些？这篇文章将逐一解答这些问题。二者展示的信息量是差不多的，但右边这种看起来更加直观。而且，随着文本篇幅的增长，这种优势会体现得更加明显。其中，图的节点代表现实世界中存在的“实体”，图的边则代表实体之间的“关系”。基于知识图谱

lizhengjava 12评论 2020-11-13

10个丰富自我的机器学习项目

机器学习项目有很大的发展潜力，最近大火的韩剧也出现了这个词语并且用很浪漫的说法解释了它。毕竟招聘者一般通过你拥有的技能来判断你的潜力。此外，确保所有数据集都呈现开放状态允许自由访问。很多机器学习课程将这个数据运用于教学目的，它可以预测人类的活动类别，这是一

ohbxiaoxin 6评论 2020-11-13

机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。金融科技初创厂商是智能手机、大数据、机器学习、区块链等新技术的早期采用者，被认为是被更传统的银行和金融机构所效仿的潮流引领者。机器学习和深度学习的最新进展确实推动了计算机视觉和自然语言处理的界限。Sta

Icevivian 8评论 2020-11-13

24个提高知识和技能极限的机器学习项目

数据科学项目为你提供了一种有前途的方式来启动你在该领域的职业。你不仅可以通过应用它来学习数据科学，还可以在自己的简历上展示一些项目！这是大多数人挣扎和错过的地方。另外，我们确保所有数据集都是开放的并且可以自由访问。它由中型和大型数据集组成，需要一些认真的模

EchoYY 12评论 2020-11-12

IT自动化和人工智能将在2021年走向何方？

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

CSDN人工智能头条 5评论 2020-11-11

无监督机器学习的重要指南

人们如今正处在数字化转型时代，只有一个不变的因素——进化。而组织采用的高科技解决方案正在引入数字化转型。因此，毫不奇怪的是，技术进步已完全取代了平凡的业务。因此，人们需要了解无监督机器学习在各行业中的广泛应用。如果用户标记了可以作为示例的训练数据，人们将其

mogigo00 5评论 2020-11-11

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

在数据领域，很多人都在说机器学习，但是只有很少的人能说清楚怎么回事。网上关于机器学习的文章，大多都是充斥各种定理的厚重学术三部曲，或是关于人工智能、数据科学魔法以及未来工作的天花乱坠的故事。尽管数据分析实际工作中用到机器学习的机会真的不多，但我觉得它仍是数

jaybeat 8评论 2020-11-10

理解AI：为什么要在人工智能系统中寻求可解释性呢？

本文转载自公众号“读芯术”。或许这是你第一次听到人工智能前面加“可解释的”这个形容词，但其实它的涵义你一定能理解。可解释的人工智能是指构建AI应用程序的技术和方法，人们借此以理解它们做出特定决策的原因。换句话说，如果我们可以从AI系统获得有关其内部逻辑的解

白飞飞Alan 2020-11-11

机器学习的未来就在这里：高斯过程和神经网络是等价的

高斯进程已经存在了一段时间，但它只是在过去5-10年，有一个大的复苏，其兴趣。部分原因是求解的计算复杂：由于他们的模型需要矩阵反转，复杂性是 O，很难更快地获得。高斯过程最酷的特征之一是它们非常非常相似的神经网络。中央极限定理可以统一明显复杂的现象，在这

lemonade 12评论 2020-11-10

Python 用5行代码学机器学习—线性回归

我准备使用scikit-learn给大家介绍一些模型的基础知识，今天就来讲讲线性回归模型。开始之前，你要确保Python和pip已经成功安装在电脑上噢，如果没有，请访问这篇文章：超详细Python安装指南进行安装。如果你用Python的目的是数据分析，

机器学习之家 2020-11-10

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 15评论 2020-11-09

supergxt

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号