牛！他本科没毕业就进入Google Brain，还发表了最火的深度学习顶级论文…… 你呢？

天在那边

2017-06-25

牛！他本科没毕业就进入Google Brain，还发表了最火的深度学习顶级论文…… 你呢？

请点击此处输入图片描述

这位本科还没毕业，就已进入谷歌大脑，与Google资深研究员Lukasz Kaiser共同发表了最近的一篇热门论文----"One Model To Learn Them All"，成功证明，一个神经网络是能同时处理多项任务的。

这小子到底是谁？是什么大学这么牛逼，造就了他？关于这篇论文，这位本科生脑子里到底怎么思考的？

作者 | U of T, Google

译者 | failbetter

编辑 | AI100

这位传奇人物就是Aidan Gomez，而他目前就读的大学为多伦多大学。

在多伦多大学，Gomez主修计算机科学和数学。

刚过去的那一学期，他选择了休学，前往硅谷的Google Brain团队实习。

尚未毕业，尚未毕业，尚未毕业...（小编邪恶抛问：请问你大学在做什么？）

But，在Google资深研究员Lukasz Kaiser的指导下，他们共同发表了最近的一篇热门论文，主题是用一个神经网络进行多任务学习。这篇论文一经推出，迅速火遍了全网。

论文地址：https://arxiv.org/abs/1706.05137

来看现状。

当前，大多数神经网络都是单任务的，只能专注于鉴别图片内的物品、理解自然语言或语音识别的某一个目的。而Kaiser与Gomez等人的研究就是要证明，一个神经网络是能同时处理多项任务的。

既然提到这个论文了，让我们先放下鸡汤，再深入扒一扒这个论文。

这篇题为"One Model To Learn Them All"（Kaiser是第一作者）的论文甚至证明，多任务学习还能让神经网络的整体性能得到提升。

牛！他本科没毕业就进入Google Brain，还发表了最火的深度学习顶级论文…… 你呢？

请点击此处输入图片描述

Gomez的论文模型：包括多种网络模型及编码器、I/O混合器、自回归解码器

“Lukasz和我基本上是退了一步来考虑问题：为什么不能用某种特定类型的模型来解决所有问题呢？”Gomez说到。

他以人类基于过往的经验来习得认知工具的过程来做类比。

“结果证明，我们的神经网络确实能做到这点。它不仅能用上这些工具，而且在新任务的性能表现上也更出色。”Gomez解释道。

Kaiser和Gomez所训练的模型，可同时解决八个问题，其中包括ImageNet大赛的图像分类识别。

在此插播一个小背景：

2012年，多伦多大学的Geoffrey Hinton，与Emeritus教授和他的研究生Alex Krizhevsky、Ilya Sutskever一起，以深度神经网络的突破性成果赢得过该比赛的冠军。而今，Sutskever在马斯克的OpenAI掌管人工智能研究。

（小编说：你想搞那块研究，你在哪个学校，学校有哪些名师，这个太重要了。所谓站在巨人肩膀嘛。又是一年高考时，希望各个小鲜肉想清楚自己未来想要的，慎重填志愿啊...）

对于ImageNet大赛，Gomez认为非常难，因为它的任务涉及到1000项分类，超过一百万张图片。

“一开始，我们比较担心——用ImageNet数据集来训练模型会不会跟其他数据冲突？我们的模型会不会把所有计算资源都用来处理最难的ImageNet数据？事实证明，我们多虑了。”

Gomez继续说，

“不同的任务之间，似乎存在着某种协同关系；每项任务的训练都能有助于其他任务的执行，模型的整体性能就有了显著的提高。”

牛！他本科没毕业就进入Google Brain，还发表了最火的深度学习顶级论文…… 你呢？

请点击此处输入图片描述

用相同的参数来同时处理不同的任务：Gomez论文模型各部分的架构

Dot-Prodcut注意力模块：Google最新的机器翻译论文"Attention Is All You Need"所用的注意力架构。
注意力模块：关键是定时信号，基于位置来对内容的注意力进行集中；拥有源张量和目标张量两个输入。
卷积模块：用于发现局部模式，并将其泛化；内含线性整流函数ReLU、SepConv和归一层三个组件。
编码器：由6个重复的卷积模块搭成，中间为专家混合层。
混合器：由注意力模块与2个卷积模块构成。
解码器：由4个卷积模块加上注意力模块组成，中间为专家混合层。

“事实上，我们的神经网络已经做到了用相同的参数来同时处理不同的任务，正如你我的神经系统无需任何架构调整就能处理各项新任务一样。”

Gomez解释此次研究的主要目的，是针对“迁移学习（transfer learning）”，也就是如何把已经学到的知识重新应用到新的任务中。他们的模型还解决了语言翻译、图片注释、英语音频转录文本、语法分析（把语句拆解成语法树）中的同步问题。

“尽管看上去不是很相关，但同时处理语法分析与图像分类这样的任务，却能让我们的模型表现出更好的性能。这跟过去是截然相反的。”

牛！他本科没毕业就进入Google Brain，还发表了最火的深度学习顶级论文…… 你呢？

请点击此处输入图片描述

Gomez的研究成果，分别用于图片注释、图片分类、不同语言翻译与句法分析

Gomez认为，这里的方法会有助于模型性能的提升，即便是面对数据非常有限的情况。

“数据匮乏是模型训练的拦路虎，” Gomez解释，“但我们的研究说明，多重任务的训练可以等同于更多数据的训练——只需让模型执行更多的任务，无论其内容相似与否，模型的性能都能获得提升。”

Gomez在Google Brain的研究，是多伦多大学计算机科学系本科暑期研究项目的一部分。今年有50多名学生参加了该项目。（小编想再次强调平台的重要性，吼吼）

尽管这篇Google论文一经推出，马上火遍了整个机器学习圈子，但Gomez透露，稍后还有更加重磅的机器学习研究成果会发布，届时他和他导师将共同推出一篇新论文。Gomez的导师是多伦多大学助理教授Roger Grosse，这位助理教授同时也是Geoffrey Hinton的Vector人工智能研究所的联合创始人。

在此，多提两句多伦多大学的牛逼之处。

在Hinton等大神级人物的开创性工作下，多伦多大学已成为全球的人工智能与深度学习研究中心。他们所创造的技术，对各行各业的影响都太深远了，特别是癌症检测，还有将AI用于律师诉讼案件的研究。

就连最近因创始人离职而不断上头条的Uber，也在想跟这个学校建立起关系，即便是砸重金也在所不惜。它在今年早些时候宣布，要在这里打造一个由多伦多大学副教授Raquel Urtasun领导的无人驾驶研究中心。

类似的事例不再一一例举......

看来，想要在一个领域有突出的成就，到底背靠哪里的学术氛围，能给你多深的底蕴，这点太重要了。

牛逼的平台+过人的天资，这是让这位本科生突颖而出的背后原因。

“这里的本科生活非常棒，不过我已经准备好去做博士研究了。”

Gomez说，

“倘若没有进入多伦多大学的话，我真不认为自己能做出这么多成果。这里的学习和灵感，让我找到了真正热衷的方向，并不断地推动自己前进。”

你呢，找好让自己不断进取的好地方和好方向了吗？

原文链接：

https://www.utoronto.ca/news/making-impact-u-t-undergrad-co-authors-important-machine-learning-study-google

https://research.googleblog.com/2017/06/multimodel-multi-task-machine-learning.html

机器学习 brain 深度学习神经网络

天在那边

0 关注 0 粉丝 0 动态

相关推荐

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 2020-11-09

自动驾驶汽车深度学习如何应对挑战?

在自动驾驶汽车中使用深度学习可以帮助克服各种挑战，例如了解行人的行为，找到最短的路线以及对人和物体进行准确检测。根据一份报告，2018年约有80%的道路交通事故是由于人为错误造成的。因此，将自动驾驶汽车纳入主流的主要目标之一是消除对人类驾驶员的需求并减少道

86377811 2020-11-06

不要上手就学深度学习！超详细的人工智能专家路线图，GitHub数天获2.1k星

反过头来看，这些方法可能作用并不是很大，却消耗了大量的时间和金钱。如果你想成为数据科学家、机器学习或者 AI 专家，而又苦于找不到合适的学习方法，本文将提供一组思路清晰、简单易懂的人工智能专家路线图。这是一家德国软件公司 AMAI GmbH 近期发布的 G

Niteowl 2020-11-05

DJL 如何正确打开 [ 深度学习 ]

本文转载自微信公众号「小明菜市场」，作者小明菜市场。很长时间，Java都是一个相当受欢迎的企业编程语言，其框架丰富，生态完善。为了减少Java开发者学习深度学习的成本，AWS构建了一个Deep Java Library，一个为Java开发者定制的开源深度

ohbxiaoxin 2020-11-04

揭开AI、机器学习和深度学习的神秘面纱

深度学习、机器学习、人工智能——这些流行词皆代表了分析学的未来。在这篇文章中，我们将通过一些真实世界的案例来解释什么是机器学习和深度学习。这样做的目的不是要把你变成一个数据科学家，而是让你更好地理解你可以用机器学习做什么。开发人员能越来越容易地使用机器学习

bigquant 2020-11-03

用 Java 训练深度学习模型，原来可以这么简单！

HelloGitHub 推出的《讲解开源项目》系列。这一期是由亚马逊工程师：Keerthan Vasist，为我们讲解 DJL系列的第 4 篇。很长时间以来，Java 都是一个很受企业欢迎的编程语言。得益于丰富的生态以及完善维护的包和框架，Java 拥有着

PandaJiong 2020-11-02

面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。MLP使用一种称为反向传播的监督式学习技术进行训练。反向传播有助于调整神经元权重，以获得更接

fengzhimohan 2020-11-02

选择困难终结者：不同问题之下的机器学习算法

刚开始学习数据科学时，笔者经常面临这样一个问题：遇到具体问题，选择何种算法才合适。也许你也和我一样，搜了很多有关机器学习算法的文章，会看到许多详细的描述，却并没有减少让抉择的难度。问题陈述2：深挖客户统计数据用以识别模式。问题陈述12：根据车辆特性预估车辆

lwnylslwnyls 2020-11-06

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 2020-11-19

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 2020-11-19

机器学习新风暴：如何用ML模型预测房价？

从驾驶汽车到识别语音+翻译，机器学习通过软件预测变幻莫测的现实世界，正在人工智能领域掀起一场风暴。机器学习是教计算机系统使用反馈的旧数据进行预测的过程，基本上是训练计算机根据过去的数据预测未来的数据。机器学习大致分为两大类：监督学习和无监督学习。对此可以使

81510295 2020-11-17

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 2020-11-17

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 2020-11-16

LinkedIn开源Dagli，发布Java机器学习函数库

近年来，越来越多的优秀的机器学习工具不断涌现，如 TensorFlow、 PyTorch、 Caffee 和 CNTK、用于大规模数据的 Spark 和 Kubeflow，以及用于各种通用模型的 scikit-learn、 ML.NET 和最近的 Trip

lgblove 2020-11-16

关于机器学习算法的16个技巧

您可能听说过瑞士军刀。如果没有，请看下面的图片。它包含许多刀片和工具。每个人都专门从事一项特定的任务。在某些情况下，不同的刀片可以完成相同的任务，但性能不同。我将机器学习算法视为瑞士军刀。性能可能会根据任务和数据的特征而变化。例如，对数损失是与所有分类算法

Pokemogo 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 2020-11-16

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 2020-11-13

需要知识的后深度学习时代，如何高效自动构建知识图谱

前沿的知识图谱自动构建技术有哪些？这篇文章将逐一解答这些问题。二者展示的信息量是差不多的，但右边这种看起来更加直观。而且，随着文本篇幅的增长，这种优势会体现得更加明显。其中，图的节点代表现实世界中存在的“实体”，图的边则代表实体之间的“关系”。基于知识图谱

lizhengjava 2020-11-13

10个丰富自我的机器学习项目

机器学习项目有很大的发展潜力，最近大火的韩剧也出现了这个词语并且用很浪漫的说法解释了它。毕竟招聘者一般通过你拥有的技能来判断你的潜力。此外，确保所有数据集都呈现开放状态允许自由访问。很多机器学习课程将这个数据运用于教学目的，它可以预测人类的活动类别，这是一

ohbxiaoxin 2020-11-13

机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。金融科技初创厂商是智能手机、大数据、机器学习、区块链等新技术的早期采用者，被认为是被更传统的银行和金融机构所效仿的潮流引领者。机器学习和深度学习的最新进展确实推动了计算机视觉和自然语言处理的界限。Sta

Icevivian 2020-11-13

天在那边

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号