让PyTorch更轻便，这款深度学习框架你值得拥有！GitHub 6.6k星

yoohsummer

2020-07-14

关注关注

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

一直以来，PyTorch就以简单又好用的特点，广受AI研究者的喜爱。

但是，一旦任务复杂化，就可能会发生一系列错误，花费的时间更长。

于是，就诞生了这样一个“友好”的PyTorch Lightning。

直接在GitHub上斩获6.6k星。

首先，它把研究代码与工程代码相分离，还将PyTorch代码结构化，更加直观的展现数据操作过程。

这样，更加易于理解，不易出错，本来很冗长的代码一下子就变得轻便了，对AI研究者十分的友好。

话不多说，我们就来看看这个轻量版的“PyTorch”。

关于Lightning

Lightning将DL/ML代码分为三种类型：研究代码、工程代码、非必要代码。

针对不同的代码，Lightning有不同的处理方式。

这里的研究代码指的是特定系统及其训练方式，比如GAN、VAE，这类的代码将由LightningModule直接抽象出来。

我们以MNIST生成为例。

l1 = nn.Linear(...) 
l2 = nn.Linear(...) 
decoder = Decoder() 
 
x1 = l1(x) 
x2 = l2(x2) 
out = decoder(features, x) 
 
loss = perceptual_loss(x1, x2, x) + CE(out, x)

而工程代码是与培训此系统相关的所有代码，比如提前停止、通过GPU分配、16位精度等。

我们知道，这些代码在大多数项目中都相同，所以在这里，直接由Trainer抽象出来。

model.cuda(0) 
x = x.cuda(0) 
 
distributed = DistributedParallel(model) 
 
with gpu_zero: 
download_data() 
 
dist.barrier()

剩下的就是非必要代码，有助于研究项目，但是与研究项目无关，可能是检查梯度、记录到张量板。此代码由Callbacks抽象出来。

# log samples 
z = Q.rsample() 
generated = decoder(z) 
self.experiment.log('images', generated)

此外，它还有一些的附加功能，比如你可以在CPU，GPU，多个GPU或TPU上训练模型，而无需更改PyTorch代码的一行；你可以进行16位精度训练，可以使用Tensorboard的五种方式进行记录。

这样说，可能不太明显，我们就来直观的比较一下PyTorch与PyTorch Lightning之间的差别吧。

PyTorch与PyTorch Lightning比较

直接上图。

我们就以构建一个简单的MNIST分类器为例，从模型、数据、损失函数、优化这四个关键部分入手。

模型

首先是构建模型，本次设计一个3层全连接神经网络，以28×28的图像作为输入，将其转换为数字0-9的10类的概率分布。

两者的代码完全相同。意味着，若是要将PyTorch模型转换为PyTorch Lightning，我们只需将nn.Module替换为pl.LightningModule

也许这时候，你还看不出这个Lightning的神奇之处。不着急，我们接着看。

数据

接下来是数据的准备部分，代码也是完全相同的，只不过Lightning做了这样的处理。

它将PyTorch代码组织成了4个函数，prepare_data、train_dataloader、val_dataloader、test_dataloader

prepare_data

这个功能可以确保在你使用多个GPU的时候，不会下载多个数据集或者对数据进行多重操作。这样所有代码都确保关键部分只从一个GPU调用。

这样就解决了PyTorch老是重复处理数据的问题，这样速度也就提上来了。

train_dataloader, val_dataloader, test_dataloader

每一个都负责返回相应的数据分割，这样就能很清楚的知道数据是如何被操作的，在以往的教程里，都几乎看不到它们的是如何操作数据的。

此外，Lightning还允许使用多个dataloaders来测试或验证。

优化

接着就是优化。

不同的是，Lightning被组织到配置优化器的功能中。如果你想要使用多个优化器，则可同时返回两者。

损失函数

对于n项分类，我们要计算交叉熵损失。两者的代码是完全一样的。

此外，还有更为直观的——验证和训练循环。

在PyTorch中，我们知道，需要你自己去构建for循环，可能简单的项目还好，但是一遇到更加复杂高级的项目就很容易翻车了。

而Lightning里这些抽象化的代码，其背后就是由Lightning里强大的trainer团队负责了。

PyTorch Lightning安装教程

看到这里，是不是也想安装下来试一试。

PyTorch Lightning安装十分简单。

代码如下：

conda activate my_env 
pip install pytorch-lightning

或在没有conda环境的情况下，可以在任何地方使用pip。

代码如下：

pip install pytorch-lightning

创建者也有大来头

William Falcon，PyTorch Lightning 的创建者，现在在纽约大学的人工智能专业攻读博士学位，在《福布斯》担任AI特约作者。

2018年，从哥伦比亚大学计算机科学与统计学专业毕业，本科期间，他还曾辅修数学。

现在已获得Google Deepmind资助攻读博士学位的奖学金，去年还收到Facebook AI Research实习邀请。

此外，他还曾是一个海军军官，接受过美国海军海豹突击队的训练。

前不久，华尔街日报就曾还曾提到这个团队，他们正在研究呼吸系统疾病与呼吸模式之间的联系。可能会应用到的场景，是通过电话在诊断新冠症状。目前，该团队还处在数据收集阶段。

果然，优秀的人，干什么都是优秀的。叹气……

怎么样，是不是想试一试？赶紧戳下方链接下载来看看吧！

上手传送门

https://github.com/PyTorchLightning/pytorch-lightning

深度学习框架机器学习

yoohsummer

0 关注 0 粉丝 0 动态

关注关注

2020年深度学习框架对比速读

TensorFlow于2015年11月面世，基于Apache License 2.0协议发布，由Google Brain团队研发。到目前为止也是github上热度最高、使用人数最多的深度学习框架，业界很多招聘要求中也提到了它。2019年3月推出Tenso

GDGYZL 2020-08-28

自己动手实现深度学习框架-3 自动分批训练, 缓解过拟合

为Session类增加自动分批训练模型的功能, 使框架更好用。新增缓解过拟合的算法: L2正则化, 随机丢弃。增加Dataset类负责管理数据集, 自动对数据分批。在Session类中增加fit方法, 从Dataset得到数据, 使用事件机制告诉外界训练情

阳光非宅男 2020-04-16

如何使用百度深度学习框架paddlepaddle快速搭建深度神经网络？

数据预处理就是将数据从源文件中读取出来，然后进行一系列操作，将数据分为训练集和测试集两部分

HeiSeDiWei 2019-11-22

2019深度学习框架决战：PyTorch横扫AI顶会，再夺NeurIPS 2019！

NeurIPS 2019使用的机器学习框架：PyTorch 68-> 166，TensorFlow 91-> 74. 帖主Horace He是康奈尔大学的学生，他的研究兴趣是编译器和机器学习的交叉。他分析了 NeurIPS 2019论文使用的机

zhuzhishi0 2019-11-19

linux下darknet深度学习框架上手

darknet是一个基于c与cuda轻量级深度学习框架，编译部署简单，移植性好，适合初学者上手。下面来介绍一下dark的安装和简单使用。YOLO是基于深度学习的端到端的实时目标检测系统。

wandaxiao 2019-06-30

手把手教你学会深度学习框架 — PyTorch

基本上，它所有的程序都是用python写的，这就使得它的源码看上去比较简洁，在机器学习领域中有广泛的应用。PyTorch是一个灵活的深度学习框架，它允许通过动态神经网络自动分化。它支持GPU加速、分布式训练、多种优化以及更多的、更简洁的特性。默认情况下，P

HappinessSourceL 2019-06-28

深度学习框架PyTorch为何值得学

大家知道，深度学习的发展和推进，在某种程度上也是一场框架的争夺战，其中 Google 发布的TensorFlow和 Facebook 主力支持的 PyTorch 是最耀眼的两颗明星。我们今天就来看看其中一位明星 PyTorch，看看它为何值得学。而最近一年

yangzzguang 2019-05-27

Caffe2代码全部并入PyTorch：深度学习框架格局剧震

昨日，Caffe2 的 Github 页面突然出现了一个「巨大的改动」：Caffe2 开源代码正式并入 PyTorch，至此，Facebook 主力支持的两大深度学习框架已合二为一。这两大框架，在整个深度学习框架格局中都极受关注。在 Caffe 2 的 G

atbjss 2018-04-02

PyTorch为何如此高效好用？来探寻深度学习框架的内部架构

作为 Facebook 人工智能团队提供支持的深度学习框架，PyTorch 自 2017 年 1 月推出以来立即成为了一种流行开发工具。其在调试、编译等方面的优势使其受到了学界研究者们的普遍欢迎。本文中，来自蒙特利尔综合理工学院的研究员 Christian

tuzhen0 2018-03-13

2018年深度学习框架势力排行榜！

yueguizhilin 2018-09-20

TensorFlow到Theano：横向对比七大深度学习框架

在深度学习项目开始前，选择一个合适的框架是非常重要的事情。最近，来自数据科学公司 Silicon Valley Data Science 的数据工程师 Matt Rubashkin为我们带来了深度学习 7 种流行框架的深度横向对比，希望本文能对你带来帮助。

Adan 2017-02-17

ArXiv最受欢迎开源深度学习框架榜：TensorFlow第一，PyTorch第四

早鸟票已经售罄，现正式进入全额票阶段。即将于北京举办的2018年中国AI开年盛典——2018新智元AI技术峰会上，我们邀请到了德国总理默克尔的科学顾问、诺贝尔奖唯一计算机领域评委、工业4.0教父、世界顶级自然语言处理专家Wolfgang Wahlste教授

TensorFlowers 2018-03-09

无需深度学习框架，如何从0开始用Python构建神经网络

选自TowardsDataScience，作者：James Loy，机器之心编译。这是一份用于理解深度学习内部运作方式的初学者指南。作者根据自己从零开始学习用 Python 构建神经网络的经验，编写了一份攻略。内容涵盖神经网络定义、损失函数、前向传播、反向

WFRainn 2018-05-28

每个认真机器学习者应该熟悉的5个深度学习框架

1 - TensorFlowTensorFlow最初是由Google Brain Team的研究人员和工程师开发的。其目的是面向深度神经网络和机器智能研究。自2015年底以来，该图书馆在GitHub上正式开源。TensorFlow对于快速进行基于图形的计算

pandazjd 2018-03-25

深度学习框架Caffe在Mac上的安装和测试

深度学习框架介绍先概括一下深度学习的几大流行的框架：Pylearn2, Theano, Caffe, Torch, Cuda-covnet，Deeplarning4j等。Theano是一个Python库，也是一个强大的数学表达式编译器。Pylearn2是在

cluster 2016-06-22

PaddlePaddle常规赛前三名：我们眼中的深度学习框架

随着AI的不断普及发展，作为人工智能的基础支撑力，深度学习引发了开发者们的深入研讨，其热度持续升温。2018年9月28日，针对深度学习，百度面向全球AI爱好者发起了PaddlePaddle常规赛，此次常规赛面向全社会开放，选手可通过真实的行业数据、多样的算

hackerlong 2018-11-05

谷歌移动端深度学习框架 TensorFlow Lite

TensorFlow Lite 是一款 TensorFlow 用于移动设备和嵌入式设备的轻量级解决方案。TensorFlow 可以在多个平台上运行，从机架式服务器到小型 IoT 设备。但是随着近年来机器学习模型的广泛使用，出现了在移动和嵌入式设备上部署它们

ruizhenggang 2018-11-11

无需深度学习框架，如何从零开始用Python构建神经网络

我相信，对于任何有理想的数据科学家而言，理解神经网络内部的运作方式都非常重要。本文涵盖了我学到的所有东西，希望你也能从中获益!许多有关神经网络的介绍资料会将神经网络与大脑进行类比。但我发现，将神经网络简单地描述为一个从输入映射到输出的数学函数理解起来更容易

KuoJunLin 2018-05-28

百度上线“逆天”新工具Visual DL 可适用于各大深度学习框架

1月17日，百度PaddlePaddle & ECharts团队宣布上线深度学习可视化工具Visual DL，该工具可以使得深度学习任务变得生动形象，实现可视分析。百度希望能够借此为全球更广泛的用户提供更便捷高效的深度学习工具。反观Visual D

nextwhy 2018-01-18

处理移动端传感器时序数据的深度学习框架：DeepSense

DeepSense 是一种在端设备上运行的深度学习框架，它可以在本地获取需要处理的传感器数据，并且在不上传到云端的情况下对这些数据应用深度学习模型，如卷积神经网络或门控循环神经网络等。分类任务的一个例子是异构人体活动识别，即基于运动传感器测量数据来检测某

机器学习菜鸟 2017-08-28

安科网

让PyTorch更轻便，这款深度学习框架你值得拥有！GitHub 6.6k星

yoohsummer

关于Lightning

PyTorch与PyTorch Lightning比较

模型

数据

优化

损失函数

PyTorch Lightning安装教程

创建者也有大来头

上手传送门

yoohsummer

相关推荐

2020年深度学习框架对比速读

自己动手实现深度学习框架-3 自动分批训练, 缓解过拟合

如何使用百度深度学习框架paddlepaddle快速搭建深度神经网络？

2019深度学习框架决战：PyTorch横扫AI顶会，再夺NeurIPS 2019！

linux下darknet深度学习框架上手

手把手教你学会深度学习框架 — PyTorch

深度学习框架PyTorch为何值得学

Caffe2代码全部并入PyTorch：深度学习框架格局剧震

PyTorch为何如此高效好用？来探寻深度学习框架的内部架构

2018年深度学习框架势力排行榜！

TensorFlow到Theano：横向对比七大深度学习框架

ArXiv最受欢迎开源深度学习框架榜：TensorFlow第一，PyTorch第四

无需深度学习框架，如何从0开始用Python构建神经网络

每个认真机器学习者应该熟悉的5个深度学习框架

深度学习框架Caffe在Mac上的安装和测试

PaddlePaddle常规赛前三名：我们眼中的深度学习框架

谷歌移动端深度学习框架 TensorFlow Lite

无需深度学习框架，如何从零开始用Python构建神经网络

百度上线“逆天”新工具Visual DL 可适用于各大深度学习框架

处理移动端传感器时序数据的深度学习框架：DeepSense

yoohsummer