深度学习入门：投身深度学习你需要哪些准备？

无风而起

2017-11-20

我想回答一些我经常被问到的问题：我需要什么样的电脑来进行深度学习？为什么fast.ai推荐Nvidia GPU？你为初学者推荐什么深度学习库？你如何把深度学习引入生产？我认为这些问题都属于一个总的主题：你需要什么（硬件、软件、背景和数据）来进行深入学习？这篇文章是针对那些新进入这个领域的，并且对入门感兴趣的人。

你需要的硬件

我们感谢游戏业

电子游戏行业（收入方面）大于电影和音乐行业的总和。在过去的20年里，视频游戏产业推动了GPU（图形处理单元）的巨大进步，其用于绘制图形所需的矩阵数学。幸运的是，这些正是深度学习所需的计算类型。GPU技术的这些进步是为什么现在的神经网络比几十年前更强大的一个关键部分。在没有GPU的情况下训练深度学习模型在大多数情况下将会非常缓慢。

深度学习入门：投身深度学习你需要哪些准备？

并非所有的GPU都是一样的

大多数深度学习从业者不是直接编程GPU; 我们使用处理这个问题的软件库（如PyTorch或TensorFlow）。但是，要有效使用这些库，你需要访问正确类型的GPU。在几乎所有情况下，这意味着可以从Nvidia公司获得GPU。

CUDA和OpenCL是GPU编程的两种主要方式。CUDA是迄今为止最发达，拥有最广泛的生态系统，也是深度学习库最有力的支持。CUDA是由Nvidia创建的专有语言，因此它不能被其他公司的GPU使用。当fast.ai推荐使用Nvidia GPU时，我们并不是对Nvidia有特别的亲近或信任，而是这是迄今为止深度学习的最佳选择。

Nvidia在GPU市场占据主导地位，其次是竞争对手AMD公司。今年夏天，AMD宣布发布一个名为ROCm的平台，为深度学习提供更多的支持。 PyTorch，TensorFlow，MxNet和CNTK等主要深度学习库的ROCm状态仍在开发中。虽然我希望看到一个开源的替代方案取得成功，但我不得不承认，我发现ROCm的文档很难理解。我刚刚阅读了ROCm网站的Overview，Getting Started和Deep Learning页面，但仍然不能用我自己的话来解释ROCm，尽管我想在这里把它包括在内以便完整。（我承认没有硬件背景，但我认为像我这样的数据科学家应该成为这个项目的目标受众之一。）

如果你没有GPU ...

如果你的电脑没有GPU或者没有Nvidia GPU，那么你有几个很好的选择：

使用Crestle，通过你的浏览器：Crestle是一项服务（由fast.ai学生Anurag Goel开发），为你提供在云上的已经预先安装并配置为在GPU上运行的所有流行的科学和深度学习框架的云服务。它很容易通过你的浏览器访问。新用户可免费获得10小时和1 GB的存储空间。之后，GPU使用率是每小时59美分。我向那些刚接触AWS或新手的人推荐使用这个选择来使用控制台。
通过你的控制台设置AWS云实例：你可以按照这个fast.ai设置课程中的步骤创建一个AWS实例（远程为你提供Nvidia GPU）。AWS每小时收取90美分。尽管我们的设置材料都是关于AWS（并且你会发现对AWS最多的论坛支持），但是一位fast.ai学生创建了一个设置Azure虚拟机进行深度学习的指南。如果有人写关于Google云端引擎的博客文章，我很乐意分享和添加一个链接。
建立你自己的框架。这是我们的fast.ai论坛中的一个冗长的话题，在论坛里人们可以提出问题，分享他们正在使用的组件，并发布其他有用的链接和提示。最便宜的新型Nvidia GPU是300美元左右，一些学生在eBay或Craigslist上发现了更便宜的旧版GPU，而另外一些则是为了更强大的GPU支付更多的费用。我们几个学生写博客文章记录他们如何建立他们的机器：

深度困惑：建立深度学习机的不幸事件（Mariya Yao）
建立一个便捷的深度学习机器（Sravya Tirukkovalur）
建立你自己的深度学习框（Brendan Fortuner）

你需要的软件

深度学习是一个相对年轻的领域，库和工具正在迅速改变。例如，Theano，在2016年我们选择使用在我们的课程的第1部分，它刚刚退休。目前我们正在使用的PyTorch仅在今年（2017年）发布。就像Jeremy之前写的那样，你应该假定你今天学到的任何特定的库和软件都会在一两年内被淘汰。最重要的是理解底层概念，为此，我们在Pytorch上创建了自己的库，我们相信深度学习概念更清晰，并将最佳实践编码为默认值。

Python是深度学习中最常用的语言。有许多深度学习库可供选择，几乎所有主要科技公司都支持不同的库，尽管这些公司的员工经常使用各种工具。深度学习库包括TensorFlow（谷歌），PyTorch（Facebook），MxNet（华盛顿大学，由亚马逊改编），CNTK（微软），DeepLearning4j（Skymind），Caffe2（也是Facebook），Nnabla（索尼），PaddlePaddle（百度），以及Keras（在此列表中的其他几个库之上运行的高级API）。所有这些都有可用的Python选项。

动态与静态图计算

在fast.ai，我们优先考虑程序员可以进行实验和迭代（通过更容易的调试和更直观的设计）比理论性能提速更重要的速度。这就是我们使用PyTorch的原因，PyTorch是一个具有动态计算功能的灵活的深度学习库。

深度学习库之间的一个区别是它们是使用动态还是静态计算（一些库，如MxNet和现在的TensorFlow，两个都允许）。动态计算意味着程序按照你编写的顺序执行。这通常使得调试更容易，并且更容易将你的想法转换成代码。静态计算意味着你预先为你的神经网络构建一个结构，然后对其执行操作。从理论上讲，这允许编译器进行更大的优化，尽管这也意味着在你的程序和编译器执行的程序之间可能存在更多的断开。这也意味着，错误可能会更多地从导致错误的代码中移除（例如，如果你在构建图形时存在错误，那么直到你稍后执行操作时，你才可能意识到）。尽管理论上有静态计算图的语言比具有动态计算的语言具有更好的性能，但我们常常发现，在实际中，这种情况并非如此。

谷歌的TensorFlow大多使用静态计算图，而Facebook的PyTorch使用动态计算。（注：TensorFlow在两周前宣布了一个动态计算选项Eager Execution，然而它还很早，大多数TensorFlow文档和项目都使用静态选项）。今年9月，fast.ai宣布，我们选择了PyTorch而不是TensorFlow来在今年的课程中使用，并用于开发我们自己的库（PyTorch的高级包装器，用于编码最佳实践）。简单地说，下面是我们选择PyTorch的几个原因（在这里更详细地解释）：

更容易调试
动态计算更适合于自然语言处理
传统的面向对象的编程风格（这对我们来说更自然）
TensorFlow使用如范围和会话等不寻常的约定可能会令人困惑，而且需要更多的学习

谷歌已经投入了比任何其他人更多的资源来营销TensorFlow，我认为这是TensorFlow如此知名的原因之一（对于许多深度学习以外的人来说，TensorFlow是他们听说过的唯一的DL框架）。如上所述，TensorFlow几周前发布了一个动态计算选项，解决了上述一些问题。许多人都在问fast.ai我们是否要切换回TensorFlow。动态选项还是相当新的，而且还不太成熟，所以我们现在会继续使用PyTorch。然而，TensorFlow团队非常乐意接受我们的想法，我们很乐意看到我们的fastai库被移植到TensorFlow。

注意：我们更新的课程的个人版本，其使用PyTorch以及我们自己的fastai库，目前正在进行。课程结束后将免费在线发布（预计发布时间：1月）。

你生产所需要的东西：不是GPU

许多人把生产中深度学习的想法过于复杂，认为他们需要比他们实际做的更复杂的系统。你可以在生产中使用CPU和你选择的网络服务器进行深入学习，事实上，这是我们推荐的大多数使用情况。这里有几个关键点：

生产中进行训练是非常罕见的。即使你想每天更新你的模型权重，你也不需要在生产中进行训练。这意味着你只是在生产过程中进行推理（通过你的模型向前传递），比培训更快更容易。
你可以使用任何你喜欢的Web服务器（例如Flask），并将其设置为简单的API调用。
如果你能够有效地批量处理数据，GPU只会提供更快的速度。即使你每秒获得32个请求，使用GPU也可能会使你减慢速度，因为从第一次到达收集全部32个时，你必须等待一秒钟，然后执行计算，然后返回结果。我们建议在生产中使用CPU，并且可以根据需要添加更多的CPU（比使用多个GPU更容易）。

对于大公司来说，在生产中使用GPU可能是有意义的——然而，当你达到这个规模的时候，这将会是明确的。过早地尝试在需要之前进行扩展只会增加不必要的复杂性，并会使你放慢速度。

你需要的背景：1年的编码

激励我和Jeremy为程序员创建用于编码的实践深度学习的一个挫折是，大多数深度学习材料分为两类：

如此肤浅和高水平，以至于不能提供实际在工作场所深度学习所需的信息或技能，或创造出最先进的模型。如果你只是想要一个高层次的概述，这是好的，但如果你想成为一个有工作的从业者，那就太令人失望了。
高度理论化并承担研究生水平的数学背景。对于许多人来说，这是一个阻挡的障碍，即使是有数学博士学位的人，我也发现这个理论在学习如何编写实用的解决方案方面并不是特别有用。许多材料都有这个倾向并不奇怪。直到最近，深度学习几乎完全是一门学科，很大程度上是由在顶级学术刊物上发表的内容引发的。

我们免费的实践深度学习课程的独特之处在于，唯一的先决条件是1年的编程经验，但它仍然教你如何创造最先进的模型。你的背景可以是任何语言，但在开始课程之前你可能需要学习一些Python，因为这是我们所使用的。我们根据需要介绍数学概念，我们不建议你尝试提前学习数学理论。

如果你不知道如何编写代码，我强烈建议学习，如果你对数据科学感兴趣的话，Python是一个很好的语言。

你需要的数据：远远低于你的想象

虽然很多人声称你需要Google大小的数据集来深入学习，但这是错误的。迁移学习的力量（结合数据增强等技术）使得人们可以将预先训练的模型应用于更小的数据集。正如我们在别处谈到的那样，在医疗初创企业Enlitic，Jeremy Howard领导的一个团队只使用了1000例肺癌CT扫描与癌症相比，建立了一个比一组4位专家放射科医师更准确的诊断肺癌的算法。C ++库Dlib有一个例子，其中一个人脸检测器只使用4个图像进行精确训练，只包含18个人脸！

关于入门的说明

对于绝大多数与我交谈的人来说，进入深度学习的门槛远远低于他们的预期，成本也在预算之内。但是，我意识到事实并非如此。我定期联系想要参加我们的在线课程，但无法承担AWS成本的学生。不幸的是，我没有办法。同时还有其他的障碍。BrunoSánchez-Nuño撰写了关于在没有可靠互联网接入的地方进行数据科学的挑战，而且国际学者Tahsin Mayeesha在孟加拉国等国家描述了MOOC访问的隐藏障碍。我关心这些入门的问题，然而这是无解的。

文章原标题《What you need to do deep learning》，作者：Rachel Thomas，译者：董昭男，审校：李烽

机器学习深度学习人工智能 aws 英伟达 fast

无风而起

0 关注 0 粉丝 0 动态

相关推荐

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 2020-11-09

自动驾驶汽车深度学习如何应对挑战?

在自动驾驶汽车中使用深度学习可以帮助克服各种挑战，例如了解行人的行为，找到最短的路线以及对人和物体进行准确检测。根据一份报告，2018年约有80%的道路交通事故是由于人为错误造成的。因此，将自动驾驶汽车纳入主流的主要目标之一是消除对人类驾驶员的需求并减少道

86377811 2020-11-06

不要上手就学深度学习！超详细的人工智能专家路线图，GitHub数天获2.1k星

反过头来看，这些方法可能作用并不是很大，却消耗了大量的时间和金钱。如果你想成为数据科学家、机器学习或者 AI 专家，而又苦于找不到合适的学习方法，本文将提供一组思路清晰、简单易懂的人工智能专家路线图。这是一家德国软件公司 AMAI GmbH 近期发布的 G

Niteowl 2020-11-05

DJL 如何正确打开 [ 深度学习 ]

本文转载自微信公众号「小明菜市场」，作者小明菜市场。很长时间，Java都是一个相当受欢迎的企业编程语言，其框架丰富，生态完善。为了减少Java开发者学习深度学习的成本，AWS构建了一个Deep Java Library，一个为Java开发者定制的开源深度

ohbxiaoxin 2020-11-04

揭开AI、机器学习和深度学习的神秘面纱

深度学习、机器学习、人工智能——这些流行词皆代表了分析学的未来。在这篇文章中，我们将通过一些真实世界的案例来解释什么是机器学习和深度学习。这样做的目的不是要把你变成一个数据科学家，而是让你更好地理解你可以用机器学习做什么。开发人员能越来越容易地使用机器学习

bigquant 2020-11-03

用 Java 训练深度学习模型，原来可以这么简单！

HelloGitHub 推出的《讲解开源项目》系列。这一期是由亚马逊工程师：Keerthan Vasist，为我们讲解 DJL系列的第 4 篇。很长时间以来，Java 都是一个很受企业欢迎的编程语言。得益于丰富的生态以及完善维护的包和框架，Java 拥有着

PandaJiong 2020-11-02

面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。MLP使用一种称为反向传播的监督式学习技术进行训练。反向传播有助于调整神经元权重，以获得更接

fengzhimohan 2020-11-02

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 2020-11-19

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 2020-11-17

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 2020-11-16

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 2020-11-13

10个丰富自我的机器学习项目

机器学习项目有很大的发展潜力，最近大火的韩剧也出现了这个词语并且用很浪漫的说法解释了它。毕竟招聘者一般通过你拥有的技能来判断你的潜力。此外，确保所有数据集都呈现开放状态允许自由访问。很多机器学习课程将这个数据运用于教学目的，它可以预测人类的活动类别，这是一

ohbxiaoxin 2020-11-13

机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。金融科技初创厂商是智能手机、大数据、机器学习、区块链等新技术的早期采用者，被认为是被更传统的银行和金融机构所效仿的潮流引领者。机器学习和深度学习的最新进展确实推动了计算机视觉和自然语言处理的界限。Sta

Icevivian 2020-11-13

IT自动化和人工智能将在2021年走向何方？

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

CSDN人工智能头条 2020-11-11

无监督机器学习的重要指南

人们如今正处在数字化转型时代，只有一个不变的因素——进化。而组织采用的高科技解决方案正在引入数字化转型。因此，毫不奇怪的是，技术进步已完全取代了平凡的业务。因此，人们需要了解无监督机器学习在各行业中的广泛应用。如果用户标记了可以作为示例的训练数据，人们将其

mogigo00 2020-11-11

理解AI：为什么要在人工智能系统中寻求可解释性呢？

本文转载自公众号“读芯术”。或许这是你第一次听到人工智能前面加“可解释的”这个形容词，但其实它的涵义你一定能理解。可解释的人工智能是指构建AI应用程序的技术和方法，人们借此以理解它们做出特定决策的原因。换句话说，如果我们可以从AI系统获得有关其内部逻辑的解

白飞飞Alan 2020-11-11

IT自动化和人工智能将在2021年走向何方?

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

EastCarFxxBlog 2020-11-09

强化学习到底是什么，它如何运作？

强化学习是一种行为学习模型，由算法提供数据分析反馈，引导用户逐步获取最佳结果。不同于使用样本数据集训练机器模型的各类监督学习，强化学习尝试通过反复试验掌握个中诀窍。强化学习与人类在婴幼儿时期的学习过程非常相似。这是一种基于经验的学习流程，机器会不断尝试、不

83153251 2020-11-06

数字营销：AI如何“看透”人类行为模式？

人工智能在市场营销领域取得的成功，揭示了人类的一些思维和行为模式，这些模式可以转化为其他应用程序。市场营销业已成为AI创新的试水之地，尤其是在人类行为建模和AI与人类交互探究层面更具实验价值。目前AI的局限性阻碍了机器使用溯因推理或创造性思维的能力。AI已

lizhengjava 2020-11-05

无风而起

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号