FPGA算法映射要点

代码之神

2019-06-26

关注关注

将图像处理的算法转换为FPGA系统设计的过程称为算法映射，CPU并行算法的实现与FPGA并行算法的实现是有一定区别的。
FPGA算法映射要点

1.算法系统结构

图像处理算法主要有两种设计结构：流水线结构和并行阵列结构。

1.1 流水线结构

在我看来，流水线结构和我们之前所理解的CPU的串行结构还是有一定区别的。相反，它与处理器的流水线结构很相似，都是依照时钟来进行流水层级的同步。
FPGA算法映射要点

1.2并行阵列结构

|--Data1--->Data1-->Data1
            |
InputData------Data2--->Data2-->Data2
            |
            |--Data3--->Data3-->Data3

2.算法转换

2.1 定常数转换

对于FPGA而言，做加法与移位较为简单，而涉及到乘法与除法时需要调用到乘法器或除法器，这在FPGA中是较为宝贵的资源，所以作为定常数，我们尽量转换为移位和加法运算，如：

ex1:
        dout = din * 255
转换后
        dout = ( din << 8 ) - din

ex2:
        dout = din * 11
转换后：
        dout = din * 2^2 + din * 2^3 - din * 2^0
             = din * (2^2 + 2^3 - 2^0)

上式中的255 和 11就是定常数

2.2 不等式等效转换

进行转换的目的也是为了在FPGA实现后能够更加节省资源。如：

ex1:
        √a￣  < b, a > 0
转换后：
        b^2 > a

ex2:
        a/b > c/b (b > 0, d > 0)
转换后
        a * d > b * c

2.3 取近似值

最简单的近似值莫过于四舍五入，假如某数据D[-1~4]为整数部分，D[3~0]为小数部分，那么四舍五入可为:

assign dout = din[3]?(dout[-1~4] + 1) : (dout[-1~4])

泰勒公式定义
FPGA算法映射要点
那么就可以有如下近似转换：

1/3 = 1/4 * (1 + 1/4 + 1/16 + 1/64 + 1/256)

3.构造查找表

查找表是使用简单的查询操作代替运行时的实时计算，使用查找表代替那些运行时经常需要用到的运算能够极大的减少时间复杂度，如我们经常用到的三角函数就应该使用查找表替换实时计算。

原文地址 coderdock.com

fpga 算法

代码之神

0 关注 0 粉丝 0 动态

关注关注

GPU相比FPGA更具优势，适应AI快速变化需求

　　他表示称目前做好一个 FPGA，整个编程时间就要几个月，而且还要在硬件层面对它进行编程。然而现在 AI 变化速度非常快，甚至更新是以分钟来计算的，所以必须要在软件端实现高度灵活的可编程。恰恰 GPU 是 AI 领域的专用芯片，他的指令集是非常有优势的，

xcznb 2019-12-29

赛灵思-5G和人工智能时代的赢家

网易智能 2019-10-28

嵌入式：一文看懂ASIC和FPGA的区别

FPGA流派的代表公司如Xilinx主推的Zynq平台，而ASIC流派的代表公司有Movidius。两大流派各有长短，下面让小编来细细分说。FPGA上市速度快，但性能较低。由于移动终端属于消费电子领域，所以未来使用的方案应当是以ASIC为主。

qwerrr 2017-07-13

FPGA加速：面向数据中心和云服务的探索和实践

Ezenwang 2019-06-28

西安交大获DAC19系统设计竞赛FPGA赛道亚军，这是他们的设计方案

近日，第二届「低功耗目标检测系统设计挑战赛」落下帷幕。来自西安交通大学人工智能与机器人研究所的队伍 XJTU-Tripler 获得本次比赛的亚军。本文将介绍这支队伍的设计解决方案。2019 年 6 月 5 日，由自动化设计顶级会议 Design Autom

zhuhong 2019-06-24

如何将FPGA资源平民化？阿里工程师有了新突破

今天我们很高兴地宣布：新晋的大规格FPGA实例，基于Xilinx 16nm Virtex UltraScale+ 器件VU9P的异构计算实例F3在阿里云上线了！我们借此机会，对阿里云FPGA计算服务本身，以及这次发布的F3实例的底层硬件架构和平台架构做一个

touchfuture 2019-06-27

【F3使用场景】F3经典使用场景

人工智能深度学习客户，推理应用最近两年，人工智能在全球掀起了巨大的应用热潮，除了互联网巨头，如Google，Facebook，Alibaba之外，涌现出众多的Start up公司，也都逐渐成为行业翘楚。可是F3在人工智能大规模商业部署中，具备独特的性能优势

九品神元师 2019-06-27

【F3使用场景】F3经典使用场景

九品神元师 2019-06-27

3天上手，30天精通！——深度学习FPGA加速器设计

本文的目标是帮助对于深度学习硬件加速器设计感兴趣的朋友快速上手基于 FPGA 的深度学习加速器设计。计算机体系结构知识：参考书《计算机组成与设计》，不需要熟读全书，但要对一些加速器设计相关的基础概念有比较清晰的理解和认识，如流水线、数据并行等。我们选取卷积

mingzheng 2019-06-03

何为真正的 FaaS？阿里舜天平台做了四大创新

以及在阿里，我们如何做到真正的 Faas？Gartner 于4月24日发布报告，阿里云以19.6%的市场份额，雄踞整个亚太第一，AWS 和微软分居第二和第三。全球范围内，仍然维持了AWS、微软和阿里云分别为冠、亚、季军的格局。

Zjzk 2019-06-03

UIUC推出最新DNN/FPGA协同设计方案，助力物联网终端设备AI应用

UIUC、IBM 和 Inspirit IoT, Inc的研究人员提出 DNN 和 FPGA 加速器的协同设计方案，通过首创的「Auto-DNN」网络搜索引擎 +「Auto-HLS」加速器生成技术，自动生成适用于终端设备的 DNN 模型及 FPGA 加速器

zhuhong 2019-05-28

深度学习中，CPU、GPU、NPU、FPGA如何发挥优势

随着AI的广泛应用，深度学习已成为当前AI研究和运用的主流方式。面对海量数据的并行运算，AI对于算力的要求不断提升，对硬件的运算速度及功耗提出了更高的要求。目前，除通用CPU外，作为硬件加速的GPU、NPU、FPGA等一些芯片处理器在深度学习的不同应用中发

flyfish 2019-05-10

英特尔推出新一代Stratix 10 FPGA加速卡：性能提升3倍

去年 10 月，英特尔发布了面向服务器的 FPGA 计算卡 Arria 10，并于今年 4 月宣布其已被部署在主流服务器中。时间仅过去不到一年，我们就看到了 Arria 的继任者。9 月 26 日，这家芯片科技巨头宣布推出 Stratix 10 SX FP

xinxuan 2018-09-28

AI 算法在 FPGA 芯片上还有这种操作？

AI算法的崛起并非一帆风顺的，现在的主流的NN类的卷积神经网络已经是第二波浪潮了，早在上个世纪80年代，源于仿生学，后又发展于概率学的早期AI算法已经取得了重大的进展，到1986年Rumelhart等人提出多层网络的反向传播算法后，第一波AI算法以“连接主

troysps 2019-04-22

全新起点！英特尔发布Agilex FPGA，采用10纳米制程 | 极客头条

四月，草长莺飞、桃花烂漫。如此茂盛的季节，给科技行业的新品推出，更加增添了几分喜气。4月3日，英特尔宣布推出全新产品家族——英特尔 Agilex FPGA。随后，英特尔中国研究院院长宋继强、英特尔亚太研发有限公司总经理卢炬和英特尔子公司Mobileye大中

王基 2019-04-04

时间序列数据库(HiTSDB)压缩算法的FPGA加速

HiTSDB 提供百万级时序数据秒级写入，高压缩比低成本存储、预降精度、插值、多维聚合计算，查询结果可视化功能；解决由于设备采集点数量巨大，数据采集频率高，造成的存储成本高，写入和查询分析效率低的问题。

NeoStudio 2017-11-30

微软推出深度学习加速平台脑波计划：FPGA驱动实时人工智能

近日在 Hot Chips 2017 上，微软团队推出了一个新的深度学习加速平台，其代号为脑波计划，机器之心将简要介绍该计划。脑波计划在深度学习模型云服务方面实现了性能与灵活性的巨大提升。微软专为实时人工智能设计了该系统，它可以超低延迟地处理接收到的请求。

樱花落瓣 2017-08-23

专访阿里云专家：异构计算，GPU、FPGA、ASIC芯片将三分天下

编者按：10月11-14日，为期四天的2017杭州云栖大会（门票火热抢购中！）将再度在杭州云栖小镇起航，作为全球最具影响力的科技展会之一，本届大会将有不少阿里集团专家以及各企业行业领袖的精彩演讲。今天，我们采访的是阿里云虚拟化平台负责人张献涛，他将在10月

pengfeibeiming 2017-09-12

深度学习硬件对比评测：英特尔FPGA和英伟达GPU哪个更好？

FPGA 会随着深度学习的发展占领 GPU 的市场吗？英特尔的研究人员对目前最好的两种芯片做了对比。数据分析经常依赖于机器学习算法。在众多机器学习算法中，深度卷积神经网络在重要的图像分类任务中具有当前最高的精确度，因而被广泛采用。采用比 32 位更少的紧密

qinrui 2017-03-24

FPGA 2017最佳论文：深鉴科技ESE语音识别引擎获奖

FPGA 芯片领域顶级会议 FPGA 2017 于 2 月 24 日在加州 Monterey 结束。在本次大会上，斯坦福大学在读 PhD、深鉴科技联合创始人韩松等作者的论文 ESE: Efficient Speech Recognition Engine

GBAEagle 2017-02-25

安科网

FPGA算法映射要点

代码之神

1.算法系统结构

1.1 流水线结构

1.2并行阵列结构

2.算法转换

2.1 定常数转换

2.2 不等式等效转换

2.3 取近似值

3.构造查找表

代码之神

相关推荐

GPU相比FPGA更具优势，适应AI快速变化需求

赛灵思-5G和人工智能时代的赢家

嵌入式：一文看懂ASIC和FPGA的区别

FPGA加速：面向数据中心和云服务的探索和实践

西安交大获DAC19系统设计竞赛FPGA赛道亚军，这是他们的设计方案

如何将FPGA资源平民化？阿里工程师有了新突破

【F3使用场景】F3经典使用场景

【F3使用场景】F3经典使用场景

3天上手，30天精通！——深度学习FPGA加速器设计

何为真正的 FaaS？阿里舜天平台做了四大创新

UIUC推出最新DNN/FPGA协同设计方案，助力物联网终端设备AI应用

深度学习中，CPU、GPU、NPU、FPGA如何发挥优势

英特尔推出新一代Stratix 10 FPGA加速卡：性能提升3倍

AI 算法在 FPGA 芯片上还有这种操作？

全新起点！英特尔发布Agilex FPGA，采用10纳米制程 | 极客头条

时间序列数据库(HiTSDB)压缩算法的FPGA加速

微软推出深度学习加速平台脑波计划：FPGA驱动实时人工智能

专访阿里云专家：异构计算，GPU、FPGA、ASIC芯片将三分天下

深度学习硬件对比评测：英特尔FPGA和英伟达GPU哪个更好？

FPGA 2017最佳论文：深鉴科技ESE语音识别引擎获奖

代码之神