王位之争：NVIDIA、AMD、Nervana谁是深度学习硬件的赢家？

DCDLIN

2017-12-25

随着Titan V的发布，现在进入了深度学习硬件的时代。目前尚不清楚NVIDIA能否在2018年保持其作为主要的深度学习硬件供应商的地位，而AMD和Intel Nervana将有望超越NVIDIA。那么，现在为什么才刚刚进入深度学习硬件的时代呢？

NVIDIA认为，在出现大规模的竞争之前，需要兑现它的垄断地位。它需要现金才能在未来1 - 2年内使自己的地位更加牢固。Titan V的价格为3000美元，在Tensor内核中， Titan V有了一个新的亮点的深度学习特性，但同时，其成本、性能比是较差，这使得Titan V的吸引力较弱。

竞争对手是十分强大的，比如AMD的硬件，而NVIDIA的可以采取现金优势，这将有助于与AMD抗衡，以便可以看到非常便宜的NVIDIA显卡。只有在AMD能够推进良好软件的情况下，才会发生这种情况，如果AMD也动摇，NVIDIA的显卡将会保持昂贵。

除此之外，还有一个新的竞争者：神经网络处理器（NNP）形成了Intel 的Nervana。它具有几个独特的功能。这些新功能正是想要的CUDA开发人员。当想编写针对深度学习优化的CUDA内核时，NNP可以解决面临的大多数问题。这个芯片是第一个真正的深度学习芯片。

一般来说，对于1-chip和1-chip的排名，我们会看到Nervana> AMD> NVIDIA，因为NVIDIA必须同时服务于游戏/深度学习/高性能计算，而AMD只需要为游戏/深度服务学习，而Nervana可以专注于深度学习，而这是一个巨大的优势。设计的架构越集中，深度学习上的芯片就越少。

然而，赢家不是由纯粹的表现决定的，甚至不是纯粹的成本/表现。这是由成本/性能+社区+深度学习框架决定的。

接下来让我们仔细看看Nervana、AMD和NVIDIA的具体内容。

Nervana的神经网络处理器

Nervana的设计非常特别，主要是由于其大型可编程缓存（类似于CUDA共享内存），与GPU相比，每个芯片的尺寸是其10倍，每个计算单元的尺寸是GPU的50倍。有了这个将能够设计缓存中的算法和模型。这将加速至少一个数量级的推理，并且将能够轻松训练带有小型高速缓存深度学习模型（例如具有200个单元的多层LSTM）的千兆字节数据。这将使这个芯片对初创公司和大公司都非常有吸引力。由于Flexpoint的特殊数据类型，可以将更多数据存储在缓存/ RAM中，并且计算速度更快，从而产生更多的好处。所有这些都可能意味着比起现在的NVIDIA GPU来，每个人都可以加速10倍左右。但是，只有这样才可以克服主要的障碍：社区和软件。

对于普通用户和研究人员来说，这一切都取决于社区。没有社区，我们不会看到缓存中的算法。没有社区，不会看到好的软件框架，并且很难与芯片一起工作。每个人都想要使用扎实的深度学习框架。软件在硬件之前。如果Nervana只运行芯片，并没有有效地推动软件和社区，那么它就会输给AMD和NVIDIA。

社区和软件问题与价格紧密相关。如果价格太高，学生们不能负担得起NNP，那么社区的表现就不会太好。仅仅为工业提供服务，你就无法获得健壮的社区。虽然工业是硬件公司的主要收入来源，但学生是社区的主要驱动力。所以如果价格合适，学生可以负担得起，那么社区和软件就会随之而来。任何超过3000美元的东西都不行，通常2000元以上的任何东西是至关重要的，并且需要特殊的折扣让学生创建一个强大的社区。一个价格为2000美元的NNP将是可控的，并且能够被采用。低于1500美元的任何东西都将使Nervana成为至少2 - 3年的市场领导者。一个价值1000美元的NNP会让NVIDIA和AMD之间的竞争变得非常艰难，软件在这里甚至不是一个问题，它会自动跟踪产生。

对于平常的消费者来说，不仅价格是重要的，而且社区是如何处理也很重要。如果我们没有看到英特尔立即向社区注入资源来启动一个坚实的软件机器，那么NNP很可能会停滞不前。不幸的是，英特尔在社区管理不善方面有着悠久的历史。

总之，如果Nervana的NNP价格低于2000美元，并且在发布之后的前几个月内能看到强大的社区和软件开发，我们将看到Nervana的NNP将成为一个明显的赢家。以更高的价格和更少的社区支持，NNP将会很强大，但是在成本/性能和便利性方面可能无法超越其他解决方案。如果软件和社区的努力失败，或者如果NNP的价格是4000美元，它可能会失败。 2000美元以上的价格要求NNP的学生有可观的折扣。

AMD：便宜又强大

王位之争：NVIDIA、AMD、Nervana谁是深度学习硬件的赢家？

AMD的显卡具有不可思议的力量。 Vega Frontier Edition系列显然与NVIDIA的同类产品不相上下，而从Volta和Pascal的不偏不倚的基准来看，如果液态冷却的话，Vega Frontier与Titan V相比将会更好。请注意，Vega是基于一个旧架构，而Titan V是全新的。将于2018年第三季度发布的全新AMD架构将进一步提升性能。

AMD希望通过从32位浮点数转换到16位浮点数来提升深度学习硬件。这是一个非常简单而强大的策略。这些芯片对于高性能计算不会有用，但是对于游戏玩家和深度学习社区来说，这些芯片是稳的，因为16位浮点运算非常简单，开发成本也会很低。

问题是软件。即使你有这个强大的AMD GPU，你也几乎不能使用它，因为没有一个主要的框架支持AMD GPU。

AMD在软件的不确定状态中处于边缘状态，甚至希望放弃OpenCL for HIP，但目前他们仍然在官方的推动和支持OpenCL道路。如果他们推出HIP，并且如果他们在未来9个月内在市场上投放了一些好的深度学习软件（不仅包括用于卷积和矩阵乘法的库，还有完整的深度学习框架，例如HIP对PyTorch的支持）他们在2018年第三季度的新GPU就有可能拆除所有竞争对手。

所以总的来说，如果AMD在软件方面得到一致的话，它可能成为主流的深度学习硬件解决方案。

NVIDIA：Titan

王位之争：NVIDIA、AMD、Nervana谁是深度学习硬件的赢家？

NVIDIA的立场是坚实的，有好的软件、好的工具、他们的硬件、社区很好的集成在一起。

它的主要问题是，他们必须服务于多个社区：高性能计算人员、深度学习人员和玩家，这对他们的硬件来说是一个巨大的压力。设计这些社区定制的芯片代价昂贵，NVIDIA的战略目前正在设计一种适合所有人的架构。

随着新兴的竞争对手的出现，NVIDIA有两个选择：（1）将排面的价格降低，直至饿死竞争对手。（2）自行开发专门的深度学习硬件。 NVIDIA拥有追求第一战略的资源，并且拥有第二个战略的专业知识。然而，一个新的设计将需要一些时间，NVIDIA可能会在此期间而失去“王位”。

王位之争：NVIDIA、AMD、Nervana谁是深度学习硬件的赢家？

总而言之，NVIDIA的王座正在受到威胁，但它拥有与新兴玩家对抗的资源和专业知识。我们将来可能会看到更便宜的NVIDIA显卡以及更专业的深度学习芯片。如果NVIDIA不采取一些措施，那么王位可能就会受到威胁。

英伟达深度学习 amd 软件社区功能机器学习芯片 amd处理器

安科网

王位之争：NVIDIA、AMD、Nervana谁是深度学习硬件的赢家？

DCDLIN

DCDLIN

相关推荐

迎Win10正式版 AMD/NVIDIA/Intel向用户推送了显卡驱动更新

Win10 7月底完成正式版你的显卡硬件支持DX12吗？

巧用Docker快速部署GPU环境

英伟达表示世界上很快的AI超级计算机即将登陆意大利

NVIDIA C++标准库Libcu++现已通过GitHub发布

用NVIDIA-NGC对BERT进行训练和微调

如何在Fedora Linux中安装Nvidia驱动

Tensorflow testing for Ubuntu 18.04.1

雷神游戏本搭载NVIDIA高性能显卡苏宁旗舰店首发优惠500元

Ubuntu 18.04安装Docker CE + NVIDIA-Docker

ubuntu docker 常用命令

linux mint 14 xfce安装nvidia显卡驱动到方法

报名 | 基于Python，学会英伟达迁移学习工具包部署与使用

ubuntu18.04搭建k8s集群

Nvidia 悄悄推出更快、更低功耗的 Tesla GPU 加速器

[Notes] Ubuntu安装nvidia-docker2

继英伟达最小边缘超算，英特尔再推10倍VPU，终端AI芯片竞争加剧

nvidia gtx1050在kali linux系统下安装显卡驱动，且可以使用x-setting切换显卡

Linux 安装 Nvidia 驱动出现的黑屏各种问题和解决方式

NVIDIA CEO宣布推出Aerial——基于NVIDIA GPU为5G提速

DCDLIN