玩转AI&DS第一步:个人计算设备搭建指南
大数据文摘出品
编译:权真、涂世文、罗然
深度学习是人工智能必不可少的一部分。而在硬件配置上,大家都在谈论GPU的重要性。不可置否,GPU是掀起深度学习热潮的主要力量,也是开展该领域工作所必不可少的硬件设备。
不幸的是,人们往往把CPU、RAM、主板、存储和机箱的选择统统推到了一边。这种唯GPU论的做法,对于深度学习来说也不算太坏,但是如果你对其他领域感兴趣,那么就还需要考虑其他PC组件!
下面文摘菌为大家推荐一份全面的深度学习主机搭建指南,可以帮助你搭建适用于人工智能及数据科学项目的个人计算机。
在本构建指南中,我们将逐步构建一台能很好地开展深度学习、数据科学、强化学习以及人工智能所有领域工作的个人计算机。
这不需要花费一大笔钱,当然也不会便宜到哪里去。这里,我们切实关注的是优化。因此只需要合适的电力、计算力和扩展空间,不会花费特别多。
我也会为那些想多花点钱升级的人提供一些选择方案,同时也为那些想在几个部件上省钱的人提供一些建议。
GPU篇
让我们从大家近来谈论的GPU开始。GPU是训练深度学习模型时,用于给大多数处理操作进行并行加速的。在深度学习的这个阶段,大多数时间在处理图像、语音或文本,也许你希望使用深层神经网络,这意味着你需要GPU了。
1080Ti可能是你此时最佳的选择。现在的话花700美元可以买到一个。它具有11GB的vRAM,运行频率在1600~1700兆赫之间。
在深度学习社区中,很多人都主张TIAN XP,因为它有12GB的vRAM。问题是,绝大多数(比如95%)情况下,您不使用额外的VRAM。因此它并没有发挥作用。TIAN XP售价1200美元…为了省钱,请选择1080TI。
2080 Ti GPU
NVIDIA最近也发布了2080Ti,其基准测试结果要优于1080Ti。话虽如此,但由于2080Ti的需求量很大,它的价格现在上涨了很多。一般售价1600美元,而且经常缺货!在我看来,就目前而言性价比不高,并不值得购买。如果想省点钱的话,GTX 1080 具有很好的性价比。它拥有8GB vRAM,在1650~1900mHz下运行速度相当快,对大多数人来说完全够用。
CPU篇
这个是经常被忽视的地方。大家可能觉得没关系,因为如果您只是开展深度学习的话,大多数进程是在GPU上进行的。但是对于强化学习和数据科学而言,大部分进程是在CPU上的。因此,我们绝不在这里省钱。
i7–8700k CPU
就我们的需求而言,售价370美元的i7-8700k 是绝佳的选择。它配有6个内核/ 12个线程,非常适合数据科学中的并行预处理。该款CPU的基准时钟频率为3.70 GHz,最高可以超频到4.70 GHz,对于我们进行强化学习的训练来说,这个计算速度已经相当快了!
此外XEON处理器也是个极好的选择,因为它们有很多内核。这对于数据预处理以及使用多核GPU进行深度学习非常有用。然而,不幸的是,如果您想要拥有更多内核和更高的主频,那就得做好花上千美元的心理准备。
如果您想节省一些开支,那Intel I5-8600K将是一个值得考虑的选择。它拥有6核/ 6线程,主频3.6 GHz,最高可超频到4.3 GHz。功能强大且只需花费260美元。
RAM篇
这是另一个经常令人困惑的的组件。深度学习社区的人们建议RAM大小应该“2倍于GPU内存”。数据科学领域,更是要“尽可能多的内存!”
我们将采取一种折衷的方案,因为对于我的机器,我发现32GB的内存就足够了。我并不会一次性使用全部的数据集,比如一次性将32GB加载到内存中。如果我这么做,我只需将其分解为多个小数据块,并在最后一次性进行处理,同时保存结果。当然,如果您有钱,配备64GB内存以预留额外的扩展空间也没有坏处。
在99%的情况下,并不需要像128GB或256GB一样夸张的东西。但一定要确保您的每根RAM为能力范围内的最大尺寸(即16GB或每根32GB)。这样,如果您想添加更多内存条,就有一些空的插槽可以用。纵然,我不会真的只有32GB的RAM。我以前搭过一台机器,经常让我觉得需要加更多的内存!
X99 Motherboard
主板篇
由于我们已经选择了第八代CPU(无论是I7- 8000 K还是I5-8600 K),因此我们需要选择与之兼容的主板。为此,我选择了华硕Prime Z37 0 A板。它有4个RAM插槽,我已经买了两个16GB的内存条,再买两个16GB的我就可以扩展到64GB。
现在很多人都会对主板和CPU以及GPU的PCIe通道问题进行讨论。简而言之,更多通道意味着您可以更快地将数据从CPU传输到GPU。通常建议每个GPU都应该是x16通道....但我们选择的主板只能支持1x16或2x8。这是不是意味着如果我们想要2个GPU,我们的主板和CPU将不能工作…..
当然不!
X99 Motherboard
大多数人真的过度重视PCIE通道问题了。有很多基准测试,包括这个很棒的基准测试,它显示采用2x8PCI通道配置几乎不会损害性能,也就损失5%-10%。问题是,如果您真的想弥补这5%到10%的性能,您必须花很多钱才能获得多通道的机器!这根本不值得。
此外,大多数人几乎不需要多个GPU。多个GPU对于并行训练多个模型是最有用的,这是非常有用的,但对于个人计算机通常不是必需的。也就是说,如果您非常热衷于多GPU操作,可以使用服务器级的X99主板,再搭配一个漂亮的Xeon处理器。
存储设备、机箱和电源篇
对于存储设备来说,因为您要移动大量的数据和文件,所以最好用固态硬盘。我个人建议购买一块大容量的固态硬盘,您会发现这很值得。快速把所有东西导入固态硬盘存放在一个地方真的很方便。再加上固态硬盘越来越便宜。您可以以200美元的价格购买一个1TB的固态硬盘,很实惠。如果您觉得500 GB足够了,那也可以。您可能还希望将大硬盘作为备份驱动器并存储大量数据集。现在这些东西很便宜,如果您暂时不需要,可以等需要的时候随时采购。
对于您的电源,选择略大于整个机器的负荷的任何电源都可以。选择您的配置组件,它会自动计算您所需的功率!要记住的一点是,有不同的电源额定值:青铜、银、金、铂等。这些基本上定义了电源的效率,其中更高=更好。如果您已经很清楚功率方面的需求(比如600W系统的700WPSU),那么来自知名制造商(Corsair、EVGA、Cooler Master,等等)的任何功率等级的产品都是可以的。我选择了EVGA Supernova 750 G3,80 Plus Gold。
这个就根据你的情况,选择喜欢的吧!我选了美观且高度模块化的MaskPro PRO 5。它可以轻松扩展,便于我增添更多的组件,且易于维护和清洁,并配有一个光滑的玻璃侧面板。如果您想找便宜点的,可以选择PC配置专家强烈推荐的NZXT S340。如果更关注美观,那么Thermaltake View 71就很不错,它的所有4个侧面都是钢化玻璃,并配有3个RGB风扇!
显示器篇
配备多个显示器,将改变你的整个工作流程。多屏可以提高效率,因为它可以有效地提供多个工作区域。对于经常使用电脑的人来说,这是改变生活的方式。你不需要超高分辨率(除非真的想要)或者超高刷新率(除非你真的想要!)这一款(https://amzn.to/2q0Gze1)真的很不错,具有很高的性价比。
相关报道:
https://towardsdatascience.com/building-a-personal-computer-for-ai-and-data-science-45189f06917e