2018年机器学习和人工智能领域最重要的突破是什么？

Ysp

2018-12-30

2018年机器学习和人工智能领域最重要的突破是什么？

来源：新智元

本文约3300字，建议阅读8分钟。

本文为你介绍2018年机器学习和人工智能领域最重要的突破，并预测2019年的AI发展。

[ 导读 ]2018年，人工智能发展到什么阶段了？Quora鼎鼎有名的大V认为，AI炒作和AI威胁论在今年都降温，并且不会有AI寒冬，升温的是各种开源框架，2019年的AI，你认为会是怎样？

2018年，机器学习和人工智能领域最重要的突破是什么？

（这里给你留出充分思考的时间。）

2018年机器学习和人工智能领域最重要的突破是什么？

看看其他的观点。

之前，KDnuggets邀请了11位来自工业、学术和技术一线人员，回顾2018年AI的进展。其中，呼吁阻止AI学术顶会向商业化沦陷的CMU助理教授Zachary C. Lipton认为，2018年 (深度学习) 最大的进展就是没有进展。

最近，Forbes则采访了120位AI行业的创始人和高管，在2018年AI技术和产业现状的基础上，对2019年进行展望，提出了120个预测。

与往年一样，Quora鼎鼎有名的大V、机器学习研究者、前Quora工程负责人Xavier Amatriain，也写下了他认为2018年机器学习和人工智能领域最大的进展：

AI炒作和AI威胁论都有所降温；
越来越多的人开始关注公平性、可解释性或因果关系等问题；
深度学习不会再遇到寒冬，并且在图像分类以外（尤其是自然语言处理）领域投入实用并产生效益；
AI框架方面的竞争正在升温，要是你想做出点事情，最好发表几个你自己的框架。

一起来看看。

深度学习寒冬不会到来，2018对AI的期望和恐惧都下降了

正如Xavier Amatriain说的那样，深度学习的寒冬不会到来——这项技术已经用到产业里并带来了收益，现实让人们收起了一部分对AI的期望和恐惧，业界开始思考数据的公平性、模型的可解释性等更本质的问题。

如果说2017年是人工智能炒作和威胁论的风口浪尖，那么2018似乎是我们开始冷静下来的一年。

虽然马斯克等人确实还在继续强调他们对人工智能的恐惧，但他们可能忙于处理其他事务而无暇顾及这个议题。

与此同时，媒体和公众看来也都意识到，虽然自动驾驶汽车和类似的技术在推进，但不会很快到来。不过，仍然有声音支持对AI本身进行管制，Xavier Amatriain认为这种观点是错误的，真正该管制的是AI所造成的结果。

深度学习：可解释性得到更多关注，NLP迎来ImageNet时刻

关于AI炒作和AI威胁论的降温实际上前面已经说过了，Xavier Amatriain表示他很高兴看到今年的重点似乎已经转移到去解决更具体的问题上面。

例如，业内围绕公平性 (fairness) 展开了大量的讨论，不仅举办了多个相关主题的会议 (比如FATML、ACM FAT)，甚至还出现了一些在线课程。

2018年机器学习和人工智能领域最重要的突破是什么？

ACM FAT会议，2019年1月底在美国召开

关于可解释性 (interpretability) 、对算法或模型的理解 (explanation) 和因果关系 (causality)。后者重新成为人们关注的焦点，主要是因为Judea Pearl出版了“The Book of Why”这本书。关于推荐系统的ACM Recsys会议，最佳论文奖也颁给了一篇讨论如何在嵌入中包含因果关系的论文 (Causal Embeddings for Recommendations)。

话虽如此，许多其他作者认为，因果关系在某种程度上是对深度学习理论的干扰，我们应该再次关注更具体的问题，比如 interpretability 或 explanation。说到 Explanation，这个领域的亮点之一可能是华盛顿大学 Marco Tulio Ribeiro等人发表的 Anchor论文和代码，这他们对自己提出的著名模型LIME的改进。

虽然关于深度学习是最通用的AI范例这一点，仍然存在许多疑问(提问者算我一个)；虽然Yann LeCun和Gary Marcus两人已经是第n次争论这个问题，但很明显，深度学习不仅仅停留于此。

在这一年里，深度学习方法在视觉以外的领域，包括语言、医疗、教育等领域取得了前所未有的成功。尤其是教育方面，国内国外的自适应学习(Adaptive Learning) 都愈发火热，以中国的松鼠AI (乂学教育) 为代表的个性化自适应教学平台，甚至请到了“机器学习教父”Tom Mitchell出任首席科学家。

事实上，在NLP领域，我们看到了今年最引人注目的进展。如果让我必须选择今年最令人印象深刻的AI应用程序，那么我的选择都来自NLP领域(而且都来自谷歌)。第一个是谷歌的超级有用的Smart Compose智能撰写邮件工具，第二个是Duplex对话系统。

2018年机器学习和人工智能领域最重要的突破是什么？

使用语言模型的想法加速了NLP的进步，这个想法在今年由Fast.ai的UMLFit推广起来。接着，我们看到了其他(改进的)方法，如艾伦研究所的ELMO，Open AI的transformers，以及最近谷歌发布的BERT，它在许多任务上击败了此前的SOTA结果。这些模型被描述为“NLP的ImageNet时刻”，因为它们提供了随时可用的预训练通用模型，也可以对特定任务进行微调。

除了语言模型之外，还有许多其他有趣的改进，比如facebook的多语言嵌入。值得注意的是，我们还看到这些方法和其他方法是如何迅速地集成到更一般的NLP框架中，比如AllenNLP或Zalando的FLAIR。

2018年机器学习和人工智能领域最重要的突破是什么？

生态：AI框架战升温，要出成绩你最好发表几个自己的框架

说到框架，今年的“AI框架战争”可谓愈演愈烈。令人惊讶的是，随着Pytorch 1.0的发布，Pytorch似乎正在赶上TensorFlow。

虽然在生产中使用Pytorch的情况仍然不够理想，但是Pytorch在这方面的进展似乎比TensorFlow在可用性、文档和教育方面的进展要快。有趣的是，选择Pytorch作为实现Fast.ai library的框架很可能起了重要作用。

话虽如此，谷歌已经意识到了这一切，并正在朝着正确的方向推进，例如将Keras纳入框架。最后，我们都能从所有这些伟大的资源中获益，所以请继续迎接它们的到来吧!

2018年机器学习和人工智能领域最重要的突破是什么？

pytorch 与 tensorflow 的搜索趋势

在框架空间中，另一个进展很快的是强化学习。

虽然我认为RL的研究进展并不像前几年那样令人印象深刻 (浮现在我脑海中的只有DeepMind最近的Impala工作)，但令人惊讶的是，在一年时间里，我们看到所有主要AI玩家都发布了RL框架。

谷歌发布了用于研究的Dopamine框架，Deepmind发布了某种程度上与Dopamine竞争的TRFL框架。Facebook不甘落后，发布了Horizon，而微软发布了TextWorld，后者更专门用于训练基于文本的智能体。希望2019年所有这些开源的优势能够帮助RL领域取得更多进步。

最后，我很高兴看到谷歌最近在TensorFlow之上发布了TFRank。 Ranking是一个非常重要的ML应用。

数据：用合成数据训练DL模型

深度学习似乎最终消除了对数据的智能需求，但事实远非如此。

围绕着改进数据的想法，该领域仍有一些非常有趣的进展。例如，虽然数据增强已经存在了一段时间，并且对于许多DL应用程序来说是关键，但谷歌今年发布了AutoAugment，这是一种深度强化学习方法，可以自动增强训练数据。

一个更极端的想法是用合成数据训练DL模型。这已经在实践中尝试了一段时间，被许多人视为AI未来的关键。NVidia在Training Deep Networks with Synthetic Data这篇论文中提出了有趣的新颖想法。在“Learning from the experts”这篇论文中，我们还展示了如何使用专家系统来生成合成数据，然后将合成数据与实际数据相结合，使用这些数据来训练DL系统。

最后，还有一个有趣的想法，即使用“弱监督”来减少对大量手工标记数据的需求。Snorkel是一个非常有趣的项目，旨在通过提供一个通用框架来促进这种方法。

2018年机器学习和人工智能领域最重要的突破是什么？

基础理论：AI没有太多基础性突破？

我并没有看到太多AI更基础性的突破。我并不完全同意Hinton的观点，他说这种创新的缺乏是由于该领域“资深人士太少，年轻人太多”，尽管在科学上确实存在这样的趋势，即突破性研究经常是在更老的年纪完成的。

在我看来，目前缺乏突破的主要原因是，现有方法和变体仍然有许多有效的实际应用，所以很难冒险采用那些可能不太实际的方法。当该领域的大部分研究由大公司赞助时，这一点就更加重要了。

这方面，今年有一篇有趣的论文挑战了某些假设，题为“对用于序列建模的一般卷积和递归网络的经验评估”(An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling)。在高度经验主义和使用已知方法的同时，这篇论文打开了发现新方法的大门，因为它证明了通常被认为是最优的方法实际上并不是最优。

需要明确的是，我不同意Bored Yann LeCun的观点，他认为卷积网络是最终的“终极算法”(master algorithm)，而且我认为RNN也不是。

2018年机器学习和人工智能领域最重要的突破是什么？

即使是序列建模，也有很大的研究空间！另一篇具有高度探索性的论文是最近的NeurIPS最佳论文“Neural Ordinary Differential Equations”，它挑战了DL中的一些基本内容，包括layers本身的概念。

2018年，机器学习和人工智能的发展卡在了数据集上面

在 Xavier Amatriain 的观点之后，我们也补充一点：

2018年，机器学习和人工智能的进展卡在了数据集上面。

为什么这么说？

昨天，创业公司Graphext在Reddit上发帖，公布了他们对2018年Reddit网站Machine Learning内容分类里2509条帖子聚类分析的结果 (点击“阅读原文”查看大图)：

(Reddit上) 人们最关心的话题 (占比20%) 是数据集，包括训练数据，大规模数据集，开源，新的数据、模型、样本等等；其次是研究论文 (占比18%)，包括复现结果、Kaggle竞赛和谷歌、FB的工作；再次是训练 (占比16%)。

2018年机器学习和人工智能领域最重要的突破是什么？

Graphext对2018年Reddit机器学习帖子聚类结果：最受关注的是数据

虽是一家之言，但这个聚类结果也在一定程度上反映了当前机器学习和人工智能从业者的关注点——数据！大数据！开源大数据！

也难怪作为学者的Zachary Lipton要说，2018年深度学习最大的进展就是没有进展——我们仍旧在依靠大数据，手握大数据和大算力的谷歌、FB等巨头最容易出成果，而迫切复现其算法和模型的其他机器学习工程师则关注训练的问题。

你的答案是什么？欢迎在评论里留言！

— 完 —

关注清华-青岛数据科学研究院官方微信公众平台“THU数据派”及姊妹号“数据派THU”获取更多讲座福利及优质内容。

人工智能机器学习

Ysp

0 关注 0 粉丝 0 动态

相关推荐

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 2020-11-19

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 2020-11-17

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 2020-11-16

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 2020-11-13

10个丰富自我的机器学习项目

机器学习项目有很大的发展潜力，最近大火的韩剧也出现了这个词语并且用很浪漫的说法解释了它。毕竟招聘者一般通过你拥有的技能来判断你的潜力。此外，确保所有数据集都呈现开放状态允许自由访问。很多机器学习课程将这个数据运用于教学目的，它可以预测人类的活动类别，这是一

ohbxiaoxin 2020-11-13

机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。金融科技初创厂商是智能手机、大数据、机器学习、区块链等新技术的早期采用者，被认为是被更传统的银行和金融机构所效仿的潮流引领者。机器学习和深度学习的最新进展确实推动了计算机视觉和自然语言处理的界限。Sta

Icevivian 2020-11-13

IT自动化和人工智能将在2021年走向何方？

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

CSDN人工智能头条 2020-11-11

无监督机器学习的重要指南

人们如今正处在数字化转型时代，只有一个不变的因素——进化。而组织采用的高科技解决方案正在引入数字化转型。因此，毫不奇怪的是，技术进步已完全取代了平凡的业务。因此，人们需要了解无监督机器学习在各行业中的广泛应用。如果用户标记了可以作为示例的训练数据，人们将其

mogigo00 2020-11-11

理解AI：为什么要在人工智能系统中寻求可解释性呢？

本文转载自公众号“读芯术”。或许这是你第一次听到人工智能前面加“可解释的”这个形容词，但其实它的涵义你一定能理解。可解释的人工智能是指构建AI应用程序的技术和方法，人们借此以理解它们做出特定决策的原因。换句话说，如果我们可以从AI系统获得有关其内部逻辑的解

白飞飞Alan 2020-11-11

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 2020-11-09

IT自动化和人工智能将在2021年走向何方?

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

EastCarFxxBlog 2020-11-09

强化学习到底是什么，它如何运作？

强化学习是一种行为学习模型，由算法提供数据分析反馈，引导用户逐步获取最佳结果。不同于使用样本数据集训练机器模型的各类监督学习，强化学习尝试通过反复试验掌握个中诀窍。强化学习与人类在婴幼儿时期的学习过程非常相似。这是一种基于经验的学习流程，机器会不断尝试、不

83153251 2020-11-06

数字营销：AI如何“看透”人类行为模式？

人工智能在市场营销领域取得的成功，揭示了人类的一些思维和行为模式，这些模式可以转化为其他应用程序。市场营销业已成为AI创新的试水之地，尤其是在人类行为建模和AI与人类交互探究层面更具实验价值。目前AI的局限性阻碍了机器使用溯因推理或创造性思维的能力。AI已

lizhengjava 2020-11-05

当教练、做监工…… 人机协同下的AI更懂你

看起来枯燥、高冷的算法，在经过不断迭代升级之后，如何变成可感知外界的人工智能，成为辅助人类决策的工具?在本届进博会上，这一过程有了生动的展示。人工智能可以是“读心”的乒乓球机器人，可以是灵活装配、节省成本的生产线“魔术师”，也可以是瞬间读懂人体密码的“灵魂

机器人智力研究 2020-11-18

Facebook借助人工智能对内容审核排序

据外媒，Facebook目前加大了对机器学习算法的应用，根据内容的权重，通过AI进行审核排序，同时设定了传播度、敏感度、违规严重程度这三大参考原则，但目前Facebook未透露具体的权重规则，总体上一旦过滤器遇到被标记可能违反平台政策、或被用户投诉的内容时

randy0 2020-11-17

人脸识别技术发展现状及未来发展趋势

人脸识别，通常也称人像识别、面部识别，是基于人的脸部特征信息进行身份识别的一种生物识别技术，主要用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人脸进行脸部的一系列相关技术。近年来，随着人工智能的发展以及国家经济发展

MachineIntellect 2020-11-18

零基础也能看懂的人工智能教程

提起如今IT圈最火的技术，就不得不提起人工智能了。连马首富在人工智能大会现场也讲了未来30年人工技术将深入到社会的方方面面，彻底重塑传统制造业。目前机器学习主要应用于个性化推荐、精准营销、数据分析等领域。

机器之心 2020-11-17

关于人工智能的解读，看这一篇就够了

总体来讲，当前对人工智能的定义大多可划分为四类，即机器“像人一样思考”、“像人一样行动”、“理性地思考”和“理性地行动(或决策)”。强人工智能观点认为“有可能”制造出“真正”能推理和解决问题的智能机器，并且，这样的机器将被认为是具有知觉、有自我意识的。基础

迪哥有点愁 2020-11-22

谷歌正在测试一个人工智能系统，帮助视障人士参加跑步比赛

本文转自雷锋网，如需转载请至雷锋网官网申请授权。谷歌正在测试一种人工智能系统，帮助盲人和有视力障碍的人自行参加比赛。Project Guideline是一项早期研究计划，试图给予这些人更多的独立性。据VentureBeat报道，为了使用该系统，跑步者需要将

人工智能快报 2020-11-21

Ysp

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号