NovuMind 首秀 CES,展示业界最高性能的 AI 芯片
摘要
神秘低调的硅谷创业公司 NovuMind 亮相本届 CES,向业界首次展示其自主研发的高性能、低功耗的 AI 芯片,为业界带来前所未有的超强算力。
2017 年被称作是「人工智能芯片元年」,各路巨头和创业公司奋力拼杀,NovuMind 一直都在这个角斗场中的第一梯队里保持着低调和隐形的状态。本篇,记者带你走近这家人工智能芯片领域最神秘的玩家,看看首次亮相 CES 的 NovuMind 为业界带来了哪些惊喜。
15 TOPS——拼算力,提牛刀的来了
本次 CES 上,NovuMind 向业界首次展示其自主研发的第一款高性能、低功耗的 AI 芯片 NovuTensor。据目前记者所了解到的性能指标,这可能是这个世界上除了 TPU 之外跑得最快的单芯片了。
(CES 现场,NovuMind 创始人兼 CEO 吴韧博士及 NovuMind 芯片工程副总裁李淼正在展示拥有超高性能指标的 NovuTensor 人工智能芯片)
不同于其他芯片创业公司,NovuMind 创始人兼 CEO 吴韧是异构计算领域的顶尖专家,他本人一直坚信「大数据+深度学习+高性能计算=更高的智能」,并将这样的理念和思路带到人工智能芯片的研发之中。作为业界公认的计算机博弈专家、异构智能专家、大数据解析专家,吴韧于 2015 年 8 月辞去百度杰出科学家的职位,在硅谷创立致力于提供 ASIC 芯片+训练模型的全栈式 AI 解决方案的 NovuMind(中文名称「异构智能」),并带领一支来自全球的人工智能顶尖人才所组成的队伍,践行这一大胆的尝试。
历时两年研发,第一款 NovuTensor 的实际测试结果显示,其性能已达到目前最先进的桌面服务器 GPU 的一半以上,但仅仅使用二十分之一不到的电;而相较目前最先进的移动端或者嵌入式芯片,在用电量相同的情况下,NovuTensor 的性能是其他产品的三倍以上。
这是截至目前世界上唯一一款能够实际运行的、性能达到主流 GPU/TPU 水平而性能/功耗比却远超主流 GPU/TPU 的芯片。
「我们即将推出的第二款 ASIC 芯片,将会比此次 CES 展示的版本提高 4 倍的性能,但仅仅使用不到一半的电量,实现耗能不超过 5 瓦、可进行 15 万亿次运算的超高性能。」NovuMind 芯片工程副总裁李淼说。
全球首台人工智能消化内镜展现强大本地化运算能力
就在近日刚刚对外宣布获得 3000 万人民币 Pre-A 轮融资的「希氏异构」成为国内首家人工智能消化内镜医疗科技公司,其背后强大的技术团队正是 NovuMind。
本次 CES 上,NovuMind 向世人了展示搭载 NovuMind 的 ASIC 芯片以及人工智能训练模型的全球首台人工智能消化内镜如何帮助医生更快、更好地完成消化内镜下多种类型疾病的识别和诊断。
此前,四川大学华西医院已与希氏异构达成深度合作,成立「华西—希氏医学人工智能研发中心」。双方将共同开展包括消化、病理、医学影像、超声等多医学领域的 AI 技术与产品研发,为该企业持续提供合法、高质量的医疗大数据、临床技术和应用领域的全面支持。
作为希氏异构的人工智能技术提供者,NovuMind 团队为这台人工智能消化内镜提供了强大的技术支持。2017 年年中,该项消化内镜 AI 技术已得到中央电视台、新华社、中新社、科技日报等多家主流媒体报道,被誉为「具有国际先进水平」的全球首台人工智能消化内镜。据华西医院公布数据显示,其阳性检出准确率达到 92%—96% 的高水平。
据 NovuMind 中国总裁周斌介绍,借助 NovuMind 一流的 AI 训练技术和强大的超算能力,并搭载 NovuMind 算力超群的 AI 芯片,这台人工智能消化内镜展示出了强大的本地化、产品化能力,实现临床实时消化内镜检查过程中高清连续视频流的实时识别、判定。
「未来,通过我们的芯片,会帮助更多延迟敏感型的应用真正实现实时的、本地的运算。」周斌说。
5 瓦——完美功耗比给自动驾驶一个宽敞的后备箱空间
阿法狗大战李世石让全世界看到了人工智能的强大运算能力,但是很少有人注意到他们为这样的智能所付出的耗能——李世石的大脑功耗大概只有 20 瓦,而阿法狗的功耗却是两千千瓦。如果所有的人工智能都要用 10 万倍的功耗来「打败」人类,人工智能的应用和普及将成为不可能完成的任务。
时下最热门的自动驾驶技术被专家誉为最有可能得到普及和推广、并造福人类的人工智能应用场景之一,然而就目前的芯片性能和功耗水平,未来的无人车后备箱将被这些拥有高运算能力却耗能巨大的芯片装置填满,甚至没有后备箱应有的空间。搭载 NovuMind 自主研发的 NovuTensor ASIC 芯片可以帮助自动驾驶的传感器反应速度提高 100 倍,15Tops/5w 这一完美的功耗比同时会帮助自动驾驶大大「减负」,让无人车变得更加灵敏更加安全的同时,还无人车一个宽敞的后备箱空间。
李淼向记者透露,2018 年,NovuTensor 芯片就会实现量产,到那时,NovuMind 会为业界带来最优功耗比和最高性能的人工智能专用芯片,助力无人车驶向真正的应用普及。
极致化本地智能助力城市出行更绿色、更环保
NovuMind 在此次 CES 上还向世人展示了搭载其自主研发的 ASIC 芯片如何帮助各个应用场景下的终端具有强大的本地计算能力。其中,绿色城市、绿色出行应用场景格外引人瞩目。
时下,市面上的道路监控智能设备大多都是截取图像或视频,接着将它们上传到云端。但云端 AI 应用存在反应延迟、功耗高、安全性低等固有缺陷,使得智能设备的真正实力无法充分发挥。2017 年下半年,NovuMind 所自主研发的智慧城市系统已在欧洲的部分城市正式投用,这些搭载了 NovuMind 人工智能训练模型以及 NovuTensor 芯片装置的智能设备,让终端运算代替了从前的云端传输运——借助终端专用芯片的革新,NovuMind 已成功将 AI 能力植入本地设备中,从而实现让智能设备自己去「思考」。
(NovuMind 打造的人工智能产品已帮助欧洲城市实现绿色出行 AI 升级)
NovuMind 中国副总裁谢强向记者展示了 NovuMind 和挪威一座城市的合作案例,他介绍说,NovuMind 的智能自行车计数设备仅通过摄像头就能帮助这里的道路管理部门实时统计车流情况,且在不上传任何图像和视频的情况下实时地识别、运算、统计和传回相关的数据,让当地道路管理部门实时把握城市的各个路段上机动车、非机动车、骑行者、行人等各类交通工具和人的数量及情况,并据此改善出行管理办法、帮助城市居民更加便捷、通畅、绿色的出行。
「借助人工智能芯片,这些摄像头不仅可以实现本地思考,且算力超群。」据谢强透露,在本次 CES 上,NovuMind 带来的全新芯片产品可实现实时支持 16 路摄像头的强大算力——「如果把芯片比作大脑、摄像头就像是这个大脑的眼睛,你可以想象一个大脑同时管控 16 只眼睛,这对算力的要求相当之高。」NovuMind 方面表示,待其芯片产品问世时,该指标将提升至 50 路——这一振奋人心的成绩足以让人期待。
给工业机器人装上智能眼
埃森哲分析调查显示,人工智能技术将对制造业带来最大影响,而凭借性能超强、功耗超低的人工智能芯片,NovuMind 正在向智能制造行业发力,目前已获得制造业的认可并有望在今年投入使用。此次 CES 上,NovuMind 将向全世界消费电子爱者展示其为工业机器人提供视觉智能的强大技术能力。
工业机器人在极端环境下作业时,无法保证永远在线,这时,联网或云端传输的计算结果就不足以满足工业作业的需要——比如,当工业机器人进入管道深处进行零部件的定位、识别、检测时,需要的是离线、精准、实时的作业能力。搭载 NovuMind 高算力、低功耗的人工智能芯片后,工业机器人就拥有了 ASIC 所赋予它的智慧,这些智慧被赋能到制造活动中,就像是给工业机器人装上了一双智能眼,帮助制造装备进行感知、推理、决策和学习等一系列的本地化智能活动。
「我们希望帮助更多的工业机器人具备视觉智能,让 NovuMind 为传统工业进行 AI 赋能,一起推动人机协同作业,助力工业发展更加智能化。」吴韧说。
智清智真!AI 助你看「清」世界
人们对于影像画质的追求日益提高,如何获取更加高清的视频效果成为许多厂家、发烧友甚至普通消费者十分关心的话题。本次 CES 上,NovuMind 向业界展示了全球首款借助强大的人工智能技术实时地将低分辨率的图像升级为至真至清的超高画质技术。
现场,记者看到模糊、低质的影像被实时地转化为清晰、明亮的高质量影像。运用先进的深度神经网络,NovuMind 能够智能填充视频及图像的每一个显示细节,从而达到提升画质的震撼效果,据 NovuMind 介绍,这项人工智能技术所带来的最高质量的视觉显示结果已和国际知名的智能产品制造合作方达成战略合作——NovuMind 为其提供将普通视频实时、自动转换成高清视频的技术解决方案——人工智能技术正在打造一个更加「高清」的世界。
(搭载 NovuMind 的人工智能解决方案,低质量画面秒变为超高清)
(在 CES 现场,人们被强大的深度学习训练模型以及 AI 芯片所打造的更加清晰的显示所震撼。)
这一炫酷的应用在本次 CES 上亮相吸引了来自海内外的高度关注。NovuMind 希望借助强大的深度学习训练模型以及 AI 芯片,从此帮助人们告别模糊、低质的影像,用人工智能强大的技术魅力,打造一个全新的、「智清智真」的显示时代。
大智慧安防:10 万路高清视频智能人脸识别系统 NovuFace
NovuFace 是由 NovuMind 自主研发的 AI 芯片及深度学习模型共同驱动的大智慧安防系统,可实现超大范围、实时、多路、多目标的面部识别。不同于市面上已有的其他面部识别安防系统,NovuMind 为 NovuFace 提供强大算力,支持其可扩展至数千个服务器节点,或十万路独立的摄像头进行实时的高清人脸识别,足以覆盖整个城市,成就真正的大智慧、大安防。
本届 CES 上,NovuFace 也是首次与世人见面,据此前相关报道显示,NovuFace 已实现在 1 个 GPU 的服务器上支持 32 路同步高清 1080p 视频流,4 个 GPU 下支持 128 路高清视频流。「我们利用高度优化的 GPU 代码来实现高效率的处理,使每个服务器的视频流都比竞争对手更多。」周斌告诉记者。
NovuFace 的应用十分广泛,它还可以为用户提供优化及完善已有的面部识别模型和训练数据的培训平台,为用户提供一键式的 AI 解决方案。比如,用户可以利用 NovuFace 先进的深度学习技术,一站式完成智能化升级,立即从输入的视频中检测、跟踪和识别目标。
最优性价比助力数据中心强力进入高性能计算时代
随着信息化建设的加速推进以及互联网、云计算等新技术新业务的蓬勃发展,数据中心正面临着数据类型复杂的工作负载加速难题。而数据中心操作者最关心的就是如何用最少的钱、最小的改造成本,去最大限度地提升数据中心的效率,保证最优的性价比。
「数据中心加速受到非常大的空间限制和耗电限制,这些限制因子导致数据中心在设计之初每个 Rack 之间的空间十分有限。」吴韧告诉记者,「在这样的设计下,想要突破传统 CPU 的处理能力限制,NovuTensor 无疑是目前最优的选择。」
在数据中心算力升级改造中,FPGA 的性能优势不足,而 GPU 耗电大、架构的变化还会为数据中心带来额外的运维成本——比起这些方案,拥有 15Tops/5w 这一最优性能、功耗比的 NovuTensor 在数据中心改造中体现出了强劲的优势。
NovuMind 可以为数据中心里每一个 CPU 的服务器上加上他们的加速卡,且保证供电和散热不受影响。不仅能够助力数据中心实现堪比目前桌面 GPU 最强算力的高性能,且在基本不改变数据中心任何设计方案的前提下,为每一台机器都赋予 15T 的算力,基本等同于一个机架的能力。
「这是目前世界上任何一个数据中心升级解决方案都无法与之媲美的。」吴韧说。
大数据+深度学习+高性能计算=更高的智能
大数据+深度学习+异构计算=成功
这是 NovuMind 创始人吴韧博士于 2014 年提出的两个公式。三年多过去,整个世界的人工智能技术方向都在朝着海量数据集、超强算力以及更牛的深度学习算法发展。世界需要更高的智能,更高的智能需要算力一流、功耗够低的芯片。期待在本届 CES 上大秀算力的 NovuMind 给世界带来更多惊喜。