赛灵思发布 ACAP,向英特尔、英伟达开炮
1985 年,赛灵思公司(Xilinx)推出全球第一款 FPGA 产品 XC2064。
本周一,赛灵思又推出重磅产品——ACAP(Adaptive Compute Acceleration Platform,自适应计算加速平台)。
根据赛灵思总裁兼首席执行官 Victor Peng 的说法,ACAP 不仅是赛灵思自发明 FPGA 以来最卓著的工程成就,而且是一款超越 FPGA 功能的突破性新型产品。
ACAP 到底是什么?
据悉,ACAP 历经四年的研发,累积研发投资逾 10 亿美元。首款 ACAP 产品系列,将是采用台积电 7 纳米工艺技术开发的代号为“Everest(珠穆朗玛峰)”的产品系列,该产品将于今年年底实现流片,于 2019 年交付给客户。
根据官方介绍,ACAP 是一个高度集成的多核异构计算平台,能根据各种应用与工作负载的需求从硬件层对其进行灵活修改。其核心是新一代的 FPGA 架构,结合了分布式存储器与硬件可编程的 DSP 模块、一个多核 SoC 以及一个或多个软件可编程且同时又具备硬件自适应性的计算引擎,并全部通过片上网络(NoC)实现互连。
此外,ACAP 还拥有高度集成的可编程 I/O 功能,根据不同的器件型号这些功能从集成式硬件可编程存储器控制器,到 SerDes收发器技术,以及 RF-ADC/DAC 和集成式高带宽存储器(HBM)。
在大数据与人工智能迅速兴起的时代,ACAP 理想适用于加速广泛的应用,其中包括视频转码、数据库、数据压缩、搜索、AI推断、基因组学、机器视觉、计算存储及网络加速等。软硬件开发人员将能够针对端点、边缘及云应用设计基于 ACAP 的产品。
软件开发人员将能够利用 C/C++、OpenCL 和 Python 等软件工具应用ACAP系统。同时,ACAP也仍然能利用 FPGA 工具从RTL 级进行编程。
Moor Insights & Strategy 市场调查公司创始人 Patrick Moorhead 表示:“这就是未来计算的形式。我们所说的是能在几分钟内即完成基因组排序,而非几天;数据中心能根据计算需求自行对其服务器的工作负载进行编程调整,例如在白天进行视频转码,晚上则执行影像识别。这一点意义重大。”
向英特尔和英伟达发起进攻
在发布会上,Victor Peng 介绍了塑造赛灵思未来的三大趋势:
第一个趋势是数据大爆炸。现在主要是随着传感器越来越多的部署所带来的海量视频和图像类数据,很多信息和数据都是散乱无序、非结构性的,因此,所需要的处理能力也是需要几何级倍数增长。这是传统 CPU 没有办法支持的。因而,我们需要全新的架构,支持更大的吞吐量、更高的时延,最好是实时的计算能力。
第二大趋势是人工智能的黎明(Dawn of AI)。人工智能现在还处于发展的早期阶段,今后几十年都会有非常迅速的发展,它自身并不是一个应用,而是一项能够和很多应用相结合的技术,这项应用包括现在已经存在的应用,也包括未来将会层出不穷的新的应用。这些应用会处在端点,会到边缘,然后再到云。我所说的这个端点,包括一个单一的摄像头,一个单一的传感器,它们具有人工智能和机器学习;然后是边缘,边缘也有人工智能,也有机器学习,然后再到云端,同样需要人工智能和机器学习。
第三个趋势是后摩尔定律时代的计算。从很多方面来看,摩尔定律起作用的过程已经在大大放缓,这意味着下一时代的计算越来越多的需要异构性的系统,不再像以那样只需要单一的一个 CPU,它还会需要很多的加速技术,而且也因为未来人工智能的发展,行业会有更广泛的应用,单一的架构已经没有办法来满足针对各种不同应用进行优化的需求。
显然,赛灵思的 ACAP 就是为了满足未来市场的需求而研发的。
赛灵思表示,ACAP 是高度集成的多核异构计算平台,能针对各种应用与工作负载的需求,从硬件层进行更改变化。ACAP 的灵活应变能力可支持在工作过程中以毫秒级动态调节,实现了 CPU 与 GPU 所无法企及的性能水平与单位功耗性能。
此外,Victor Peng 还明确表示,未来将以数据中心为发展新重点,以进一步推动计算加速、计算存储及网络加速领域的创新与部署,其中包括人工智能(AI)推断、视频与图像处理、基因组学等应用。
这也意味着,赛灵思已经正面向英特尔和英伟达发起了进攻。据AI科技大本营了解,亚马逊、阿里、百度等都已经推出了 FPGA 云服务平台。
AI 芯片之争
从赛灵思透露的信息来看,赛灵思也瞄准了 AI 芯片市场,并且新一代的 FPGA 架构也针对深度学习算法进行了优化。此外,赛灵思还投资了一家中国 AI 芯片公司——深鉴科技。这家公司的主要开发以 FPGA 为基础架构,面向 AI 异构计算平台 DPU(Deep-Learning Processor Unit,深度学习处理器)。
目前,AI 芯片架构之争主要集中在 GPU、FPGA 和 ASIC 三者之间,每种架构的优劣如下图所示。
目前英伟达凭借着 GPU + CUDA,在加速神经网络训练这一领域的统治地位依然牢固。此外,英特尔也先后收购 Altera 和 Nervana Systems 来发力 AI 芯片市场。
除了 GPU,ASIC 也是 FPGA 的竞争对手。
谷歌的 TPU 其实就是 ASIC 的一种,最新的第二代 TPU 不仅可以用于推理,还可以用于训练,而且谷歌已经在自家的云平台上推出了 Cloud TPU 服务,来势汹汹。此外,很多 AI 芯片创业公司也选择了 ASIC 路线。
比特大陆产品战略总监汤炜伟在接受AI科技大本营的采访时曾表示,自己更看好 ASIC 路线。
显然,Victor Peng 并不这么认为。
首先我并不认为市场上只会有一种芯片的架构,我们是非常独特的解决方案,如果我们的架构是灵活应变的,可以根据 AI 的情况进行优化,比如有一些创新型的算法出来,所以不会是一个一统天下的局面。
我并不觉得从长期或者从广泛的角度来讲,ASIC 会成为一个可行的解决方案。它可以为某一种特定的网络进行加速,但只能维持在那样一个水平,或者要等到下一代产品出来才可以再进行加速,所以它只能满足市场上一小部分的需求。
因为现在充满了变化,而且不断的有创新在出现,如果开发了一个 ASIC 的应用,它可能只能保持这一点上是最先进的,但是之后市场再发生变化它就没有办法了。但是 ACAP 和 FPGA 就不一样了,如果有不同就可以马上优化。所以如果是根据工作负载来调整的话,很多的应用就没有办法来跟着这个工作负载进行调整,但是我们的这个产品就会非常的灵活应变,所以根据现在的创新状况和布局,固定功能的芯片是做不到的。
当然,正如清华大学微纳电子系主任、微电子所长魏少军教授在 GTIC 2018 大会上所说的那样,目前还不存在适应所有应用的通用算法,所以应用领域的确定是 AI 芯片发展的一个重要前提,而 AI 的杀手级应用到目前为止还没有出现,因此 AI 芯片还有很长的路要走。
我们关心的是,在这样一场竞赛中,赛灵思能够走多远。