PyTorch横扫顶会，TensorFlow退守业界：机器学习框架一年变天

FlyLeo

2019-10-11

关注关注

TensorFlow 2.0正式发布没几天，PyTorch 1.3今天也上线了。

一个疯狂强调“易用性”，一个整出了移动端部署。老将和新秀都卯足了劲。

毕竟，机器学习框架的世界，局势变化过于迅猛，稍不注意就会被抢了地盘。

一年前，TensorFlow还是各大顶会论文选择的主流框架，如今顶会几乎成了PyTorch的天下。

CVPR 2019，只提到PyTorch的论文有280篇，只提到TensorFlow的论文有125篇，但这还不是悬殊最大的一场会议。

有网友 (@programmerChilli) 说，虽然知道大批研究者逃离TF拥抱PT：

但我绝对想不到涨幅能到这种地步。

那么，PyTorch的优势到底在哪里？

PyTorch一路凯歌，对TensorFlow经营多年的格局又有怎样的冲击。

这一次，一位来自康奈尔大学的少年Horace He，用一份详尽的调查报告，对现状进行了总结，也为潜在入门者提供了方向：

PyTorch制霸学界

报告开头就提到：目前的大背景是，大量研究人员从TensorFlow转投PyTorch。

但大家未必知道，这势头来得多猛烈。来看2018年与2019年的各大顶会对比吧：

表格列出了CVPR、NAACL、ACL、ICLR、ICML这五大顶会上，仅提到PyTorch/仅提到TensorFlow的论文数量。

2018年，PyTorch五项数据全部低于TensorFlow。

2019年，PyTorch五个数字全部超越TensorFlow。

PyTorch每项数据的增幅，都在192%到450%之间，涨势十分凶猛。

其中，以自然语言处理(NLP) 的顶会NAACL (450%) 和ACL (290%) 最为显著；在视觉顶会CVPR上也有大幅增长 (240%) 。

相比之下，TensorFlow有三项数据下滑。其中NAACL数据下降幅度达到了38.2%，而这里正是PyTorch飞跃式增长的地方。

此消彼长，PyTorch只用了一年，便把弱势变成了压倒性优势：

280:125 (CVPR) ，两倍有余。

66:21 (ACL) ，三倍有余。

103:33 (NAACL) ，三倍有余。

在语言和视觉顶会上，PyTorch的主导地位最明显。这跟上文提到的涨幅是吻合的。

如果还有人把PyTorch当做一个新秀，试图在TensorFlow主导的世界里，划出一片自己的地盘，那么数据告诉他们，已经不是这样了。

虽然，看上去TensorFlow还有两项数据在增长，但其实只有ICML的涨幅 (32.5%) ，还跟得上会议总录取论文数的增长。

也就是说，在另外四场会议上，TensorFlow已经开始衰退了。

为何研究人员爱PyTorch？

一是简单。它和NumPy比较像，风格很Python，能轻易和Python生态集成起来。

比如，你只要把一个pdb断点扔进PyTorch模型里，它直接就能用了。

相比之下，在TensorFlow模型里面debug的话，便会复杂得多了。

二是API好。比起TensorFlow的API，大多数研究人员更偏爱PyTorch的API。PyTorch设计得更科学；而TensorFlow要在各种API之间切换，令人操作不便：

‘layers’ -> ‘slim’ -> ‘estimators’ -> ‘tf.keras’

三是性能。虽然PyTorch的动态图 (Dynamic Graphs) 提供的优化空间比较小，但许多用户都反馈说PyTorch的速度不亚于TensorFlow，甚至比对方还快。

虽然，没有严格测试数据表明到底谁更快，但至少TensorFlow并没有明显的优势。

这样，再加上前两点，足够让许多研究人员拥抱PyTorch了。

TensorFlow在研究领域会怎样？

就算今后TensorFlow变得像PyTorch一样友好，PyTorch的地盘也已经很大了。

这就是说，PyTorch的代码实现更容易找到，人们也更有动力发表PyTorch的代码给大家用，跟别人合作的话队友也可能会倾向PyTorch。

所以，迁回TensorFlow 2.0这件事，大概率不会进展很快。

当然，谷歌和DeepMind内部研究还是会用TensorFlow。他们的研究成果，大概也给了一部分研究人员，继续用TensorFlow的信心。

不过Horace He听说，谷歌内部也有许多研究人员，渴望逃离TensorFlow了。

另一方面，PyTorch主导地位越来越强，谷歌研究人员可能和整个社区之间产生隔阂：他们很难在外部研究的基础上搭建自己的应用，外面的研究人员也很难借鉴谷歌的代码。

最后，TensorFlow 2.0能不能挽回一些研究人员，还需要时间来观察。Eager Execution一定是个吸引人的点，而Keras API就不一定了。

TensorFlow守住工业界

虽然在各个开发者社区，“PyTorch真香”论声势浩大，现在又在顶会数据上实力压倒TensorFlow，但其实，在工业界，TensorFlow仍具优势。

比如，根据Medium博主Jeff Hale的统计结果，2019年，TensorFlow在线上招聘启事中拥有1541个新增职位，而PyTorch有1437个。

从arXiv的论文数量来看，TensorFlow也仍然占据首位，只是领先优势在缩小。

一方面，TensorFlow的诞生早于PyTorch，工业界对新鲜事物的追逐，不像学术界那样热切，使用TensorFlow已成行业惯性。

并且，许多企业的代码都是基于TensorFlow搭建的，想要迁移到PyTorch上，并非易事。

另一方面，相比于PyTorch，TensorFlow本身就是为工业界量身打造的。

相比于研究实验，工业界会有更多的限制和要求，比如：

· 不用Python。Python在服务器上运行时开销太大，有些公司承受不来。

· 可移动性。移动二进制文件中没法嵌入Python解释器。

· 服务。无停机更新，模型间无缝切换，可预测时间的批处理，等等等等。

TensorFlow在这些方面显然比PyTorch做得好得多。比如，训练好模型，然后使用TF Lite进行部署，是目前最可靠的生产管道之一。

有网友举了个例子：

TensorFlow能够将模型导出到coreml Android模型中，也能很容易地将其转移到GCP（谷歌云端平台）环境等任何形式的生产环境中。

相比之下，PyTorch的部署有些让人头秃：模型无法导出到非Python环境，无法优化，无法在移动设备上运行（随着PyTorch 1.3的发布，无法在移动端部署的问题已经得到解决）。

况且，TensorFlow还有Keras这个好伙伴呢。

不过，也有网友认为，PyTorch在工业界取得主导地位，只是时间问题。

毕竟在2018年的顶会上，TensorFlow还是主流呢。仅仅一年时间，王座就已易主。

“融合”趋势

PyTorch势头猛烈，但TensorFlow也没有坐以待毙。

一个有趣的现象是，现在，这两个机器学习框架呈现出了“融合”的趋势。

十一假期，TensorFlow 2.0正式登场，进一步整合TensorFlow和Keras，增强易用性，官方表示，这是一个快速、可扩展、可投入生产的灵活而强大的平台。

Keras的作者François Chollet甚至说：“TensorFlow 2.0是一个来自未来的机器学习平台，它改变了一切。”

在默认的eager execution模式下，TensorFlow 2.0能提供PyTorch eager模式下的大部分有点，比如易用性、可调试性等。

并且，针对TensorFlow的API过于复杂这个问题，2.0版本也提供了更易用的API。模型的训练和serving都无缝集成在了基础框架中。

PyTorch这边，2018年底引入了JIT编译器和“TorchScript”，增加图形功能。

就在今天，PyTorch 1.3发布，新增移动端部署、量化和命名张量等功能。

机器学习框架未来的游戏规则会如何改变，还真令人期待呢。

FB谷歌双料实习生

最后，介绍下这份详细报告的作者：

Horace He，来自康奈尔大学，是2016年入学的本科生。

自从上了大学，他每个暑假都在大厂实习：2017年是Facebook实习软件工程师，2018年是谷歌的实习软件工程师，2019年在Facebook做PyTorch实习生。

另外，少年还是VSCodeVim (标星6.2k) 的主要贡献者之一：

tensorflow python机器学习机器学习

FlyLeo

0 关注 0 粉丝 0 动态

关注关注

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 2020-11-19

如何在PyTorch和TensorFlow中训练图像分类模型

图像分类是计算机视觉的最重要应用之一。它的应用范围包括从自动驾驶汽车中的物体分类到医疗行业中的血细胞识别，从制造业中的缺陷物品识别到建立可以对戴口罩与否的人进行分类的系统。他们是如何做到的呢？你必须已阅读很多有关不同深度学习框架之间差异的信息。Tensor

xjtukuixing 11评论 2020-10-27

对比PyTorch和TensorFlow的自动差异和动态模型

使用自定义模型类从头开始训练线性回归，比较PyTorch 1.x和TensorFlow 2.x之间的自动差异和动态模型子类化方法，这篇简短的文章重点介绍如何在PyTorch 1.x和TensorFlow 2.x中分别使用带有模块/模型API的动态子类化模型

lybbb 2020-10-15

现在知道还不算晚，输入示例自动生成代码，谷歌开源这项神器要火

操作张量并非易事，因为它需要很多先决条件，例如跟踪多个维度，Dtype兼容性，数学正确性和张量形状等。当然最大的挑战还是从数百种可用选项中确定正确的TensorFlow操作。如果会的话，谷歌的TensorFlow Coder可以帮你实现这一点。然后，它会运

lybbb 2020-09-29

TensorFlow推出新接口，简化 ML移动端开发流程

在移动设备上使用 TensorFlow Lite 模型运行推理不仅仅是与模型交互，还需要额外的代码来处理复杂的逻辑，如数据转换、预处理/后处理、加载关联文件等。今天，我们将为大家介绍TensorFlow Lite Task Library，这是一组功能强大

ghjk0 2020-09-24

如何在浏览器中使用TensorFlow？

TensorFlow 2.0引入的创新之一是JavaScript实现：TensorFlow.js。我没料到这会加快训练或推理速度，但确实如此，它通过WebGL API支持所有的GPU。TensorFlow.js是一个库，用于使用JavaScript开发

yamaxifeng 2020-09-09

2020年深度学习框架对比速读

TensorFlow于2015年11月面世，基于Apache License 2.0协议发布，由Google Brain团队研发。到目前为止也是github上热度最高、使用人数最多的深度学习框架，业界很多招聘要求中也提到了它。2019年3月推出Tenso

GDGYZL 2020-08-28

输入示例，自动生成代码：TensorFlow官方工具TF-Coder已开源

如何使编程更加便捷？最近，谷歌 TensorFlow 开源了一个帮助开发者写 TensorFlow 代码的程序合成工具 TF-Coder。用过 TensorFlow 框架的应该都知道，在操纵张量时，需要跟踪多个维度、张量形状和数据类型兼容性，当然还需要考虑

lybbb 2020-08-28

TensorFlow Lattice：灵活、可控、可解释的机器学习

本文转自雷锋网，如需转载请至雷锋网官网申请授权。大多数的机器学习实践者都曾遇到过训练数据和实际运行时用以评估模型的样本差别很大的情况。因此，相对灵活的机器学习解决方案，如DNN和随机森林等，仅依赖于训练数据的模型，在训练数据集和验证数据集没有覆盖的输入空间

Icevivian 2020-08-25

TensorFlow 2入门指南，初学者必备！

TensorFlow是谷歌推出的深度学习框架，于2019年发布了第二版。它是世界上最著名的深度学习框架之一，被行业专家和研究人员广泛使用。Tensorflow v1难以使用和理解，因为它的Pythonic较少，但是随着Keras发行的v2现在与Tenso

comwayLi 2020-08-16

使用tensorflow进行音乐类型的分类

音乐流媒体服务的兴起使得音乐无处不在。我们在上下班的时候听音乐，锻炼身体，工作或者只是放松一下。这些数据可能来自出版歌曲的人手工标注。但这并不是一个很好的划分，因为可能是一些艺人想利用一个特定流派的流行趋势。在描述了所使用的数据源之后，我对我们使用的方法及

carbon0 2020-08-16

【tensorflow】常量和变量的定义

data1 = tf.constant # 声明常量。data2 = tf.Variable # 声明变量。print # 打印数据的

源式羽语 2020-08-09

如何在tensorflow中判断tensor(张量)的值

众所周知，在tensorflow程序中，tensor只是占位符，在会话层没有run出tensor的值之前，我们是无法获知tensor的值的。也就是说，下面的逻辑是无法实现的：。#a is a 1-D tensor, b is a 1-D tensor to

sherry颖 2020-08-01

TensorFlow会话常用的两种方式

需要注意的是我们可以使用两种方法来创建并使用session. 我们计算WX+b，其中W，X和b是从随机正态分布中抽取的。我们开始定义一个shape=（3,1）的常量X：。实现一个线性功能：。初始化X，类型为tensor的随机变量，维度为(3,1). res

songbinxu 2020-07-19

Ｍnist手写数字识别 Tensorflow

MNIST 数据集来自美国国家标准与技术研究所, National Institute of Standards and Technology . 训练集由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局的

sherry颖 2020-07-18

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

每个在自定义层中使用Keras函数式API的用户都要注意了！使用用Keras的Functional API创建的权重，可能会丢失。这一话题在Reddit机器学习板块上被热议，引起不少TensorFlow用户共鸣。也就是说，原本需要训练的权重现在被冻结了。让

Niteowl 2020-07-15

TensorFlow中超大的30个机器学习数据集

由谷歌Brain的研究人员创建的TensorFlow是机器学习和数据科学领域最大的开源数据库之一。它是一个端到端的平台，适用于初学者和有经验的数据科学家。TensorFlow库包括工具、预训练模型、机器学习指南，以及开放数据集的语料库。为了帮助你找到所需的

Kindle君 2020-07-15

解决import tensorflow报错：ImportError: DLL load failed: 找不到指定的模块

将visual c++ 升级到2019版本。安装完之后，即可解决该问题。

源式羽语 2020-07-04

Yolo v3 Introduction to object detection with TensorFlow 2

https://medium.com/analytics-vidhya/yolo-v3-introduction-to-object-detection-with-tensorflow-2-ce75749b1c47

源式羽语 2020-06-28

Sklearn 与 TensorFlow 机器学习实用指南第二版

十六、使用 RNN 和注意力机制进行自然语言处理

卖小孩的咖啡 2020-06-28

安科网

PyTorch横扫顶会，TensorFlow退守业界：机器学习框架一年变天

FlyLeo

PyTorch制霸学界

为何研究人员爱PyTorch？

“融合”趋势

FB谷歌双料实习生

FlyLeo

相关推荐

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

如何在PyTorch和TensorFlow中训练图像分类模型

对比PyTorch和TensorFlow的自动差异和动态模型

现在知道还不算晚，输入示例自动生成代码，谷歌开源这项神器要火

TensorFlow推出新接口，简化 ML移动端开发流程

如何在浏览器中使用TensorFlow？

2020年深度学习框架对比速读

输入示例，自动生成代码：TensorFlow官方工具TF-Coder已开源

TensorFlow Lattice：灵活、可控、可解释的机器学习

TensorFlow 2入门指南，初学者必备！

使用tensorflow进行音乐类型的分类

【tensorflow】常量和变量的定义

如何在tensorflow中判断tensor(张量)的值

TensorFlow会话常用的两种方式

Ｍnist手写数字识别 Tensorflow

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

TensorFlow中超大的30个机器学习数据集

解决import tensorflow报错：ImportError: DLL load failed: 找不到指定的模块

Yolo v3 Introduction to object detection with TensorFlow 2

Sklearn 与 TensorFlow 机器学习实用指南第二版

FlyLeo