全新版本，李沐《动手学深度学习》TF2.0版本来了

tuzhen0

2019-12-12

关注关注

机器之心整理

参与：一鸣

还记得李沐老师的《动手学深度学习》吗？近日，该书的 TF2.0 代码复现项目来了。

UC 伯克利李沐的《动手学深度学习》开源书一经推出便广受好评。很多开发者使用了书的内容，并采用各种各样的深度学习框架将其复现。据机器之心所知，现在已有 MXnet（原版）和 PyTorch 版本。

近日，《动手学深度学习》书又有了一个新的复现代码版本——TensorFlow2.0 版。这一项目登上了 12 月 9 日的 GitHub 热榜，一天获得了百星。

全新版本，李沐《动手学深度学习》TF2.0版本来了

项目地址：https://github.com/TrickyGo/Dive-into-DL-TensorFlow2.0

项目作者表示，该项目是基于中文版的书进行的更新和重构，在代码上参考了 PyTorch 版本。目前该项目已更新到第五章，仍在继续更新。

本项目主要两位作者来自北大软件和微电子学院。项目已获得李沐老师本人授权。

全新版本，李沐《动手学深度学习》TF2.0版本来了

TF2.0 版的《动手学》怎么样

本项目包括 code 和 doc 两个文件夹。其中 code 保存了 Jupyter 格式的代码，而 doc 则是 md 格式的书籍文件。由于原书使用的是 MXnet，因此代码和文本略有不同。

书籍内容展示

考虑到 md 格式对公式的展示不太优秀，作者使用 docsify (https://docsify.js.org/#/zh-cn/) 将文本转到了 GitHub pages 上，你可以像浏览网页那样阅读全书。

网页展示地址：https://trickygo.github.io/Dive-into-DL-TensorFlow2.0

全新版本，李沐《动手学深度学习》TF2.0版本来了

从网页来看，目前确实更新到了第五章，但是考虑到这是一个小团队做的代码重构工作，能完成这么多实属不易。

代码展示

在书中，代码和文本是穿插进行了，因此可以一边读书一边写代码复现，还可以随时随地检查结果。

全新版本，李沐《动手学深度学习》TF2.0版本来了

以「构建 MLP 网络」为例，作者提供了最 Python 的复现方法——为模型定义一个类，并继承 tf.keras.Model 的基类。在 TF2.0 的代码中，这是一种较为稳妥的方法。

全新版本，李沐《动手学深度学习》TF2.0版本来了

当然，也有这样较为简单的实现代码。总之，代码非常简洁易懂。

全书目录

和之前机器之心介绍过的一样，这里提供全书目录，供读者参考。

简介

阅读指南

1. 深度学习简介

2. 预备知识

2.1 环境配置
2.2 数据操作
2.3 自动求梯度
2.4 查阅文档

3. 深度学习基础

3.1 线性回归
3.2 线性回归的从零开始实现
3.3 线性回归的简洁实现
3.4 softmax回归
3.5 图像分类数据集（Fashion-MNIST）
3.6 softmax回归的从零开始实现
3.7 softmax回归的简洁实现
3.8 多层感知机
3.9 多层感知机的从零开始实现
3.10 多层感知机的简洁实现
3.11 模型选择、欠拟合和过拟合
3.12 权重衰减
3.13 丢弃法
3.14 正向传播、反向传播和计算图
3.15 数值稳定性和模型初始化
3.16 实战Kaggle比赛：房价预测

4. 深度学习计算

4.1 模型构造
4.2 模型参数的访问、初始化和共享
4.3 模型参数的延后初始化
4.4 自定义层
4.5 读取和存储
4.6 GPU计算

5. 卷积神经网络

5.1 二维卷积层
5.2 填充和步幅
5.3 多输入通道和多输出通道
5.4 池化层
5.5 卷积神经网络（LeNet）
5.6 深度卷积神经网络（AlexNet）
5.7 使用重复元素的网络（VGG）
5.8 网络中的网络（NiN）
5.9 含并行连结的网络（GoogLeNet）
5.10 批量归一化
5.11 残差网络（ResNet）
5.12 稠密连接网络（DenseNet）

6. 循环神经网络

6.1 语言模型
6.2 循环神经网络
6.3 语言模型数据集（周杰伦专辑歌词）
6.4 循环神经网络的从零开始实现
6.5 循环神经网络的简洁实现
6.6 通过时间反向传播
6.7 门控循环单元（GRU）
6.8 长短期记忆（LSTM）
6.9 深度循环神经网络
6.10 双向循环神经网络

7. 优化算法

7.1 优化与深度学习
7.2 梯度下降和随机梯度下降
7.3 小批量随机梯度下降
7.4 动量法
7.5 AdaGrad算法
7.6 RMSProp算法
7.7 AdaDelta算法
7.8 Adam算法

8. 计算性能

8.1 命令式和符号式混合编程
8.2 异步计算
8.3 自动并行计算
8.4 多GPU计算

9. 计算机视觉

9.1 图像增广
9.2 微调
9.3 目标检测和边界框
9.4 锚框
9.5 多尺度目标检测
9.6 目标检测数据集（皮卡丘）
待更新...

10. 自然语言处理

10.1 词嵌入（word2vec）
10.2 近似训练
10.3 word2vec的实现
10.4 子词嵌入（fastText）
10.5 全局向量的词嵌入（GloVe）
10.6 求近义词和类比词
10.7 文本情感分类：使用循环神经网络
10.8 文本情感分类：使用卷积神经网络（textCNN）
10.9 编码器—解码器（seq2seq）
10.10 束搜索
10.11 注意力机制
10.12 机器翻译

怎样使用这一项目

作者在项目介绍中提供了两种使用方法，你可以从网页上阅读全书和配套代码，并一步一步跟着复现。当然，还有另一种本地浏览的方法。

具体而言，你需要首先安装 docify-cli 工具：

npm i docsify-cli -g

接着将本项目 clone 到本地并进入目录：

git clone https://github.com/TrickyGo/Dive-into-DL-TensorFlow2.0
cd Dive-into-DL-TensorFlow2.0

然后可以运行一个本地服务器，你可以在浏览器中输入 http://localhost:3000，然后就可以实时访问文档并查看渲染效果了。

docsify serve docs

深度学习李沐机器学习

tuzhen0

0 关注 0 粉丝 0 动态

关注关注

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 2020-11-09

自动驾驶汽车深度学习如何应对挑战?

在自动驾驶汽车中使用深度学习可以帮助克服各种挑战，例如了解行人的行为，找到最短的路线以及对人和物体进行准确检测。根据一份报告，2018年约有80%的道路交通事故是由于人为错误造成的。因此，将自动驾驶汽车纳入主流的主要目标之一是消除对人类驾驶员的需求并减少道

86377811 2020-11-06

不要上手就学深度学习！超详细的人工智能专家路线图，GitHub数天获2.1k星

反过头来看，这些方法可能作用并不是很大，却消耗了大量的时间和金钱。如果你想成为数据科学家、机器学习或者 AI 专家，而又苦于找不到合适的学习方法，本文将提供一组思路清晰、简单易懂的人工智能专家路线图。这是一家德国软件公司 AMAI GmbH 近期发布的 G

Niteowl 2020-11-05

DJL 如何正确打开 [ 深度学习 ]

本文转载自微信公众号「小明菜市场」，作者小明菜市场。很长时间，Java都是一个相当受欢迎的企业编程语言，其框架丰富，生态完善。为了减少Java开发者学习深度学习的成本，AWS构建了一个Deep Java Library，一个为Java开发者定制的开源深度

ohbxiaoxin 2020-11-04

揭开AI、机器学习和深度学习的神秘面纱

深度学习、机器学习、人工智能——这些流行词皆代表了分析学的未来。在这篇文章中，我们将通过一些真实世界的案例来解释什么是机器学习和深度学习。这样做的目的不是要把你变成一个数据科学家，而是让你更好地理解你可以用机器学习做什么。开发人员能越来越容易地使用机器学习

bigquant 2020-11-03

用 Java 训练深度学习模型，原来可以这么简单！

HelloGitHub 推出的《讲解开源项目》系列。这一期是由亚马逊工程师：Keerthan Vasist，为我们讲解 DJL系列的第 4 篇。很长时间以来，Java 都是一个很受企业欢迎的编程语言。得益于丰富的生态以及完善维护的包和框架，Java 拥有着

PandaJiong 2020-11-02

面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。MLP使用一种称为反向传播的监督式学习技术进行训练。反向传播有助于调整神经元权重，以获得更接

fengzhimohan 2020-11-02

如何在PyTorch和TensorFlow中训练图像分类模型

图像分类是计算机视觉的最重要应用之一。它的应用范围包括从自动驾驶汽车中的物体分类到医疗行业中的血细胞识别，从制造业中的缺陷物品识别到建立可以对戴口罩与否的人进行分类的系统。他们是如何做到的呢？你必须已阅读很多有关不同深度学习框架之间差异的信息。Tensor

xjtukuixing 2020-10-27

详解深度学习感知机原理

我们之前的机器学习专题已经结束了，我们把机器学习领域当中常用的算法、模型以及它们的原理以及实现都过了一遍。虽然还有一些技术，比如马尔科夫、隐马尔科夫、条件随机场等等没有涉及到。但是这些内容相比来说要弱一些，使用频率并不是非常高，我们就不一一叙述了，感兴趣的

深度学习大讲堂 2020-10-14

用Windows电脑训练深度学习模型？超详细配置教程来了

虽然大多数深度学习模型都是在 Linux 系统上训练的，但 Windows 也是一个非常重要的系统，也可能是很多机器学习初学者更为熟悉的系统。Kaggle Master 及机器学习实践者 Abhinand 立足于自己的实践，给出了一种简单易行的 Windo

Trent 2020-10-13

深度学习未来发展的三种学习范式：混合学习，成分学习和简化学习

本文转自雷锋网，如需转载请至雷锋网官网申请授权。深度学习是一个很大的领域，其核心是一个神经网络的算法，神经网络的尺寸由数百万甚至数十亿个不断改变的参数决定。似乎每隔几天就有大量的新方法提出。然而，一般来说，现在的深度学习算法可以分为三个基础的学习范式。每一

qijiqiguai 2020-10-09

深度学习之后会是啥？

我们被困住了，或者说至少我们已经停滞不前了。有谁还记得上一次一年没有在算法、芯片或数据处理方面取得重大显著进展是什么时候?几周前去参加Strata San Jose会议，却没有看到任何吸引眼球的新进展，这太不寻常了。我不是唯一一个注意到这些的人。例如，这

mpkno 2020-09-26

深入了解目标检测深度学习算法的技术细节

本文转载自公众号“读芯术”。本文将讨论目标检测的基本方法，并尝试理解每个模型的技术细节。为了让经验水平各不相同的读者都能够理解，文章不会使用任何公式来进行讲解。目标检测(或识别)基于图像分类。IoU是一个度量，用预测的框和真值框的重叠面积除以它们的并集面积

ustbfym 2020-09-21

理解卷积神经网络中的自注意力机制

计算机视觉中的编解码结构的局限性以及提升方法。卷积神经网络广泛应用于深度学习和计算机视觉算法中。虽然很多基于CNN的算法符合行业标准，可以嵌入到商业产品中，但是标准的CNN算法仍然有局限性，在很多方面还可以改进。由于其简单和准确，该体系结构被广泛使用。顾名

sunxinyu 2020-09-17

分析深度学习背后的数学思想

深度神经网络本质上是通过具有多个连接的感知器而形成的，其中感知器是单个神经元。可以将人工神经网络视为一个系统，其中包含沿加权路径馈入的一组输入。然后处理这些输入，并产生输出以执行某些任务。随着时间的流逝，ANN“学习”了，并且开发了不同的路径。各种路径可能

walkpower 2020-09-16

Keras创始人：过去6个月，深度学习岗位已崩溃

深度学习岗位在这6个月以来已经崩溃。对于那些投资深度学习的小企业来说，目前的情形已经很清楚了：深度学习岗位不是必须的，随着疫情的到来，它们将可能被裁撤。需要澄清一下，我个人认为这只是一个疫情期间经济衰退的现象，而不是又一个AI寒冬。知情网友在针对这场话题的

davidsmith 2020-09-04

TensorFlow Lattice：灵活、可控、可解释的机器学习

本文转自雷锋网，如需转载请至雷锋网官网申请授权。大多数的机器学习实践者都曾遇到过训练数据和实际运行时用以评估模型的样本差别很大的情况。因此，相对灵活的机器学习解决方案，如DNN和随机森林等，仅依赖于训练数据的模型，在训练数据集和验证数据集没有覆盖的输入空间

Icevivian 2020-08-25

在30分钟内创建你的深度学习服务器

每当我开始一个新的项目时，我发现自己一次又一次地创建一个深度学习机器。从安装Anaconda开始，最后为Pytorch和Tensorflow创建不同的环境，这样它们就不会相互干扰。而在这中间，你不可避免地会搞砸，从头开始。这种情况经常发生多次。这不仅是对时

QFYJTL 2020-08-23

浅谈人工神经网络与BP算法

如今，深度学习技术，也叫机器学习技术日益火热，运用深度学习技术的领域也愈来愈广泛，这些领域包括图像识别、语音识别、自然语言处理以及游戏、机器人之类的。由于本人是电子信息专业，在大学期间接触了一过一些机器学习的知识，并且在毕业后顺利进入一家世界500强的互联

ohbxiaoxin 2020-08-20

TensorFlow 2入门指南，初学者必备！

TensorFlow是谷歌推出的深度学习框架，于2019年发布了第二版。它是世界上最著名的深度学习框架之一，被行业专家和研究人员广泛使用。Tensorflow v1难以使用和理解，因为它的Pythonic较少，但是随着Keras发行的v2现在与Tenso

comwayLi 2020-08-16

安科网

全新版本，李沐《动手学深度学习》TF2.0版本来了

tuzhen0

tuzhen0

相关推荐

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

自动驾驶汽车深度学习如何应对挑战?

不要上手就学深度学习！超详细的人工智能专家路线图，GitHub数天获2.1k星

DJL 如何正确打开 [ 深度学习 ]

揭开AI、机器学习和深度学习的神秘面纱

用 Java 训练深度学习模型，原来可以这么简单！

面向深度学习的五大神经网络模型及其应用

如何在PyTorch和TensorFlow中训练图像分类模型

详解深度学习感知机原理

用Windows电脑训练深度学习模型？超详细配置教程来了

深度学习未来发展的三种学习范式：混合学习，成分学习和简化学习

深度学习之后会是啥？

深入了解目标检测深度学习算法的技术细节

理解卷积神经网络中的自注意力机制

分析深度学习背后的数学思想

Keras创始人：过去6个月，深度学习岗位已崩溃

TensorFlow Lattice：灵活、可控、可解释的机器学习

在30分钟内创建你的深度学习服务器

浅谈人工神经网络与BP算法

TensorFlow 2入门指南，初学者必备！

tuzhen0