海量数据时代，如何把握人工智能先机？

yunfuwu

2019-11-04

海量数据时代，如何把握人工智能先机？

作者 | 硅谷洞察
来源 | guigudiyixian

赢得人工智能先机的三大法宝：数据+算法+算力。

人工智能是一种变革性的技术浪潮，能够帮助每个行业的用户解决大大小小的问题，从探索宇宙奥秘的科学研究、到惠及民生的健康和精准医疗，再到与生活息息相关的运输和自动驾驶汽车。

人工智能的应用场景大到结合大数据和深度学习分析大型强子对撞机产生的大量原始数据；小到给语音助手装上耳朵和脑袋听懂用户的语句，并实现简单的对话或互动。

人工智能那么远，又那么近。

可以说，随着技术的不断成熟和普及，人工智能能够赋能我们来应对各种人类的挑战，科学家可以借助人工智能提高科研的生产力，加快造福全人类的进程；企业也可以通过人工智能的无限潜力创造新的收入来源并提高他们的底线；消费者也能继续看到更多新的应用程序。

今天硅谷洞察就来给大家分析一下，人工智能已经为各种行业领域带来了哪些转型影响。

超级计算机是什么？

提到宇宙研究就不得不提用于科学研究的超级计算机。小探最初听到超算这个概念是在《三体》的小说中，大刘有这么一段描述。

海量数据时代，如何把握人工智能先机？
（2008年出版科幻小说《三体II：黑暗森林》片段）

浮点运算的次数代表着计算机的计算实力。而11年前的科幻小说早已被现实超越。在刚刚落幕的国际超算大会公布，位于田纳西州能源部橡树岭国家实验室（ORNL）由 IBM 制造的超级计算机 Summit 以 148.6 PetaFlops (千万亿次)的HPL记录获得了世界最强的超级计算机称号。简单算一下，Summit计算速度已经达到《三体》中超级计算机的近300倍。

科学技术的发展已经超乎我们的想象，曾经遥不可及的未来也已经到来。

超级计算机，其实是指众多高性能计算机节点连接在一起，统一调度管理，从而实现强大的计算功能。简单的说就是价格在10万元以上的服务器。这些机器主要分布在大学或者科研机构服务的领域非常高精尖，都是关系着人类发展的重要领域，例如全球气候变化，宇宙探测分析、大脑仿真、开发新材料、生物医药、智慧城市等实际问题。

可以看得出来，这些研究的特点是大量数据需要分析模拟得出规律，从而进行预测。如果你需要模拟一大堆无厘头的物体之间的相互关系，就一定需要“高性能计算”。

举个例子，欧洲核子研究中心欧洲核子研究中心的大型强子对撞机（LHC）周长27公里，超过6,000个超导磁体，是世界上最大的机器和最先进的科学仪器。大型强子对撞机能够将质子加速到99.9999991％的光速，并产生非常高的能量碰撞，在某些情况下比我们的太阳核心高出100,000倍。

这些实验产生了大量的原始数据。大型强子对撞机每秒发生多达10亿次碰撞，每秒产生多达1 PB（1,024太字节或100万千兆字节）的数据流经欧洲核子研究中心的系统——远远超过世界上最重要的研究机构所能存储的数据。就需要使用专有软件以及超强的计算力才能过滤此数据。

气候预测同样需要高性能计算。气候预测，广泛来看就是对全球气流、洋流等等的预测，局限来看就是天气预报。天气预报的基本原理，就是通过气象卫星捕捉地图上每一个点的云层和气流运动轨迹，然后通过大量的计算推导出他们未来的走向。

海量数据时代，如何把握人工智能先机？

高性能计算与人工智能深度融合

超算与人工智能的融合将引领下一代计算机体系结构和系统软件应用的发展。

研究表明，运行大型高性能计算应用程序可以通过向现有高性能计算机群(High Performance Computing，简称HPC)工作流程添加深度学习功能来实现显着的效率。深度学习神经网络固有的并行性非常适合高度并行的HPC环境，其中极端的计算性能，大容量内存池和优化的节点间通信结构可以显着扩展深度学习网络识别结构和模式的能力。

美国能源部科学办公室与加州大学伯克利分校选择与英特尔合作，将深度学习与HPC基础设施相结合，创建了一个15-PetafFlop深度学习系统，用于解决科学模式分类问题。

这个深度学习系统将单个深度学习模型的训练扩展到科里（Cori）超级计算机上多达 9600 个基于英特尔至强融核处理器的节点。该模型能够更有效地从在数据多达 15TB 的气候数据集中提取天气模式。结果证明，处理大型复杂数据集时，将深度学习培训优化并扩展到多核HPC系统具有显著优势。

海量数据时代，如何把握人工智能先机？
科里（Cori）超级计算机

除了帮助处理极其复杂的数据之外，使用HPC基础设施进行深度学习的第二个主要好处是大大改善了深度学习算法训练的响应时间。

被评为全球第五快的超级计算机，德克萨斯高级计算中心 (TACC) 将使用英特尔至强铂金 8200 处理器为自己的 Frontera 系统提供动力，支持国家科学基金会资助开展的多层面先进研究。

Frontera 还将整合超过 100TB 的英特尔傲腾数据中心级持久内存，这是该技术第一次在如此大的规模上得到应用。这种将持久内存置于高性能计算系统附近的做法将能够实现极其复杂的模拟、人工智能算法和内存分析。Frontera 将有助于展现在高性能计算系统上进行大规模并行人工智能推理的可能性。

海量数据时代，如何把握人工智能先机？

位于德克萨斯高级计算中心的超级计算机Frontera被评为全球第五快的超级计算机

不仅在前端的超算中心的应用，瞄准“数据”，勾画AI全栈解决方案的英特尔AI加速技术在商用领域也广泛应用。

科大讯飞是中国最具创新力的公司之一，为通信、音乐和智能玩具等行业中应用的众多语音产品提供支持。“语音引擎”无疑是科大讯飞的拳头产品之一，它已占据中文语音技术市场70%以上的份额。但更重要的秘诀，其实是科大讯飞的 AI 核心战略：打造以人工智能为核心的开放平台。

语音识别想要获得更好的识别效果，就需要对框架进行大量的数据训练，这将带来海量的计算工作量。在一项数据训练中，每一万小时的语音数据约产生6000PetaFlops的计算量，这个计算量即便是用超级计算机Summit，也需要近1个小时的工作时长。

人工智能三要素是数据、算法和算力。

对于已经有了大量的数据基础的讯飞AI开放平台，科大讯飞19年的语音研发历程，让他们有自己一套独特的算法。自研了FSMN、DFCNN 等创新的语音识别框架在神经网络、数据结构模型、数据处理方式上，也相当老道。

剩下的核心关键，就是计算力了。海量用户上传来数据后，深度学习需要对数据进行大量的训练。这将带来巨大的计算工作量。科大讯飞意识到深度学习的发展不仅需要顶层应用的精进，也离不开底层平台在计算、数据处理和算法优化上的支持。

科大讯飞很清楚，除了传统的深度学习计算平台外，还希望构建更多的、基于不同技术方案的深度学习计算平台，增加选择上的多样性。他们需要一套深度定制的人工神经网络专属芯片系统才能支撑住这个巨无霸平台既然找芯片层面的合作商，英特尔成了他们的不二选择。

经过了三年，与英特尔的合作从最开始的硬件与基础设施的支持逐步加深，科大讯飞发现英特尔在人工智能、深度学习上的硬件技术优势和能力强大之外，英特尔通过不断地对核心计算和存储产品更新迭代，对深度训练应用和算法优化，对讯飞AI平台的改进提供了重要助力。在讯飞AI云的真实环境测试中，第二代英特尔至强可扩展处理器已经能让CPU达到甚至超过原来GPU的性能。

海量数据时代，如何把握人工智能先机？

现在，双方的深度合作在代码层级展开，不仅可以推动科大讯飞训练平台的优化，提升其工作效率，其反馈的需求和经验，也促进了用于人工智能的新一代英特尔至强融核处理器(Knights Mill)，以及其他英特尔深度学习软件工具和库的优化。

不得不说，懂算法的科大讯飞与懂计算的英特尔强强联合的模式，构建了一个业界顶级的人工智能开放平台。离能看会想，能听会讲的人工智能，越来越近了。

英特尔打破AI理论与现实的壁垒

对于如何更高效地利用和处理数据，全世界范围内的服务提供商和最终用户都看到了人工智能带来的诸多益处。

英特尔对数据处理很有信心，认为从数据科学工作站到云端，最后再到推理设备，一整套完备的工作流程至关重要，因为这不仅关系到数据处理，也关系到数据的移动和存储。

从硬实力到软实力，英特尔不断在自己的全套肌肉中融入智能，加速AI的实践应用。就像他们不断声明的一样，英特尔正积极的向人工智能公司转型。

在刚刚结束的Hot Chips 2019上，英特尔公布了首款AI芯片Nervana 神经网络处理器的技术细节。两款处理器都将用于数据中心，NNP-T 用于云端训练，NNP-I 用于云端推理。

随着AI芯片的推出，以全面AI优化的全栈式解决方案押宝人工智能未来，英特尔的版图似乎更加完整了。

你觉得赢下人工智能时代，企业最需要哪些技巧和实力？欢迎大家留言讨论。

人工智能海量数据对撞机

yunfuwu

0 关注 0 粉丝 0 动态

相关推荐

当教练、做监工…… 人机协同下的AI更懂你

看起来枯燥、高冷的算法，在经过不断迭代升级之后，如何变成可感知外界的人工智能，成为辅助人类决策的工具?在本届进博会上，这一过程有了生动的展示。人工智能可以是“读心”的乒乓球机器人，可以是灵活装配、节省成本的生产线“魔术师”，也可以是瞬间读懂人体密码的“灵魂

机器人智力研究 2020-11-18

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 2020-11-19

Facebook借助人工智能对内容审核排序

据外媒，Facebook目前加大了对机器学习算法的应用，根据内容的权重，通过AI进行审核排序，同时设定了传播度、敏感度、违规严重程度这三大参考原则，但目前Facebook未透露具体的权重规则，总体上一旦过滤器遇到被标记可能违反平台政策、或被用户投诉的内容时

randy0 2020-11-17

人脸识别技术发展现状及未来发展趋势

人脸识别，通常也称人像识别、面部识别，是基于人的脸部特征信息进行身份识别的一种生物识别技术，主要用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人脸进行脸部的一系列相关技术。近年来，随着人工智能的发展以及国家经济发展

MachineIntellect 2020-11-18

零基础也能看懂的人工智能教程

提起如今IT圈最火的技术，就不得不提起人工智能了。连马首富在人工智能大会现场也讲了未来30年人工技术将深入到社会的方方面面，彻底重塑传统制造业。目前机器学习主要应用于个性化推荐、精准营销、数据分析等领域。

机器之心 2020-11-17

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 2020-11-17

关于人工智能的解读，看这一篇就够了

总体来讲，当前对人工智能的定义大多可划分为四类，即机器“像人一样思考”、“像人一样行动”、“理性地思考”和“理性地行动(或决策)”。强人工智能观点认为“有可能”制造出“真正”能推理和解决问题的智能机器，并且，这样的机器将被认为是具有知觉、有自我意识的。基础

迪哥有点愁 2020-11-22

谷歌正在测试一个人工智能系统，帮助视障人士参加跑步比赛

本文转自雷锋网，如需转载请至雷锋网官网申请授权。谷歌正在测试一种人工智能系统，帮助盲人和有视力障碍的人自行参加比赛。Project Guideline是一项早期研究计划，试图给予这些人更多的独立性。据VentureBeat报道，为了使用该系统，跑步者需要将

人工智能快报 2020-11-21

人工智能与制造业融合有多难？我国人工智能人才缺口达30万

11月21日，2020中国5G+工业互联网大会成果发布会上，国家工业信息安全发展研究中心发布的《2020人工智能与制造业融合发展白皮书》显示，我国人工智能人才缺口达30万，人工智能相关职位平均年薪达到30万-60万元，从业时间较长者可达百万。《白皮书》指出

bigquant 2020-11-21

华人研究团队推出AI“讽刺”检测模型，准确率达86%

本文转自雷锋网，如需转载请至雷锋网官网申请授权。最近网络上散发着一股浓浓的凡尔赛文学气息，比如。好烦，睡过了，错过马尔代夫的航班，只能专机去了。在看似平淡的话语中，流露出一股浮夸的炫耀，这就是凡尔赛文学。如果答对了，你可别骄傲，因为这道题可能连AI都会。最

hiarxiaoliang 2020-11-20

程序员用AI算法生成了3000个新的宝可梦

所以多数幻想作品中的怪物、外星人也只是根据已有生物进行的简单拼接。那如果把这个问题抛给AI呢?冰冷的程序能否创造出一些让人类都大跌眼镜的作品?最近，国外一名资深程序员就在GitHub以及社交平台上公布了自己最新的研究成果——“宝可梦AI自动生成器”。这位名

湾区人工智能 2020-11-20

决策智能：方兴未艾的人工智能新方向

近日，中国科学院自动化研究所宣布开放“庙算·智胜”战术兵棋即时策略人机对抗平台，旨在进一步推动人机对抗智能技术研究。据了解，该平台曾用于“先知·兵圣”智能博弈对抗系列赛事，具有平台开放、在线对抗、技术共享等特点。人机对抗是国际公认的探索决策智能重要途径之一

clong 2020-11-20

如何认识人工智能对未来经济社会的影响

当前，在人工智能对经济的影响这个领域，相关研究已经取得了一些成果，然而目前仍处于研究的早期探索阶段，还未形成成熟的理论和实证分析框架。不过，学界的一些基本共识已经达成：短期来看，人工智能发展将对我国经济产生显著促进作用；长期来看，人工智能的发展路径和速度难

hxq 2020-11-19

AI＋智慧交通实现整体升级和协同

人工智能，是一门新的综合性技术科学或工程，能够和人一样进行感知、认知、决策、执行的人工程序或系统。国务院发布的《新一代人工智能发展规划》，提出推动人工智能与各行业融合创新，智能载运工具、智能物流等交通运输领域多项重点位列其中。根据《规划》，国家将促进智能交

huangjie0 2020-11-19

5G技术与人工智能的智能结合

5G是边缘的最终未来。尽管距离广泛部署还有很长一段时间，但5G还是向更分布式环境发展云计算生态系统的关键部分。从现在到2025年，网络行业将为全球5G贡献约1万亿美元，支持移动、边缘和嵌入式设备在全球范围内的快速普及。5G将成为执行更多工作负载、数据存储在

gguang 2020-11-17

人工智能助力教育均衡发展

近日，由中国人工智能学会、中国语言智能研究中心等单位主办的第三届中国智能教育大会在西安召开，多位专家学者围绕人工智能与教育深度融合的大趋势，对全国智能教育政策引导、前沿技术引领以及产品应用转化落地等展开探讨，进一步探索智能教育与教育均衡发展的新模式、新路径

hiarxiaoliang 2020-11-16

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 2020-11-16

2020年人工智能改变了我们生活的哪些方面？

2020年是非常普通的一年，却又非常不平凡，生活中，人工智能替代了外卖小哥，公交司机，在病情满街的时候，是人工智能承担了人患病的风险，医学上，人人关注的新冠，从数字信息的更新到疫苗的研发，在人工大数据的围墙之下，阻止了大爆发的感染。人工智能看似一个遥远的话

倦鸟归时 2020-11-16

激发校园创新火花 2020 DIGIX全球校园AI算法精英大赛圆满收官

11月13日-14日，由江苏省人工智能学会、华为终端云服务、华为南京研究所共同举办的2020 DIGIX全球校园AI算法精英大赛在华为南京研究所圆满收官。两大赛道30支决赛队伍巅峰对战，竞争大赛特设专项激励奖金158,000美金，最终风犹惊入萧独夜战队、

baijingjing 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 2020-11-16

yunfuwu

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号