技术引路：机器学习仍大有可为，但方向在哪里？

guangmang

2019-05-27

技术引路：机器学习仍大有可为，但方向在哪里？

整理 | CTA 直播小分队出品 | AI科技大本营（id：rgznai100）

杭州国际博览中心，这里曾经是二十国集团领导人第十一次峰会的主场馆，5 月 26 日 CTA 核心技术与应用峰会（杭州）同样在这里正式召开！

正如 CSDN 谷磊总编在大会开幕词中讲到的，在过去 20 年时间里，CSDN 见证了技术浪潮从 PC互联网到移动互联网、大数据、云计算、人工智能、万物互联的发展阶段，也见证了一代又一代开发者从优秀到卓越的心路历程。在 CSDN 社区，大家开放共享的精神，成为后来者技术精进的阶梯。

技术引路：机器学习仍大有可为，但方向在哪里？

本次大会的指导单位工业和信息化部人才交流中心的党委副书记陈新，也在讲话中特别提到数字经济人才聚集区的人才建设问题，将聚焦人工智能、大数据、云计算、物联网、VR/AR等前沿技术。工信部人才交流中心将通过整合国内外专业资源，打造数字经济人才学习交流、创新创业、合作共赢的平台，为当地数字经济产业的发展营造良好的产业发展生态。

技术引路：机器学习仍大有可为，但方向在哪里？

随后，大会就进入了全天的技术风暴中，来自阿里巴巴达摩院、腾讯音视频实验室、Hulu 研究院、腾讯优图、滴滴、微博等科技公司的一线技术专家，带来了当下最新的技术成果与解读，为开发者在机器学习的研究与应用之路提供了深度、有价值的意见。接下来，就跟着营长一起回顾今天不可错过的精彩内容。

华先胜：AI技术与应用成功的关键因素是创造价值

阿里达摩院城市大脑实验室负责人华先胜指出，人工智能技术发展“泼了一盆冷水”，然后指出 AI 技术和应用成功的关键因素是创造价值：锦上添花、雪中送炭、无中生有，最后是形成商业价值。

随后，基于阿里在大规模AI应用场景的基础，他从视觉智能、视觉智造、视觉诊断和城市大脑四个层面具体讲述了以机器视觉为主的技术应用案例。以视觉搜索为例，其中的关键技术是特征学习以及索引和搜索系统，从其应用中得到启发是视觉搜索应该关注核心需求：技术至上vs应用先行、刚性需求vs锦上添花、用户先行vs数据先行。

而视觉智造的主要应用有视觉编辑（比如广告植入）、自动平面设计等。对此，他给出了实践经验：要创造一个需求（不只是来自设计师），只和行业顶尖高手合作，另外，要先关注刚性需求，而不是炫酷的技术，要用商业创新反哺技术创新。

最后，他总结了对人工智能技术实践的看法。第一，人工智能发展势不可当，进展迅猛，局限巨大，无行业不 AI；第二，不深入行业，就没有深度的AI，AI+算力+数据等于价值，要首先看到价值到底是什么；第三，人工智能发展机会非常多，要用AI做人力所不能及的事情，要让AI服务于人。

技术引路：机器学习仍大有可为，但方向在哪里？

高孟平：音视频领域应用落地广泛，未来挑战同样艰巨

腾讯音视频实验室专家研究员高孟平讲述了腾讯音视频实验室的多模态机器学习技术在人眼视觉服务中的落地情况。他表示，在视频服务里有几个重要的环节，如视频理解、处理、编辑、质量评估。利用深度学习等AI技术、基于人眼视觉标准的端到端视频处理平台，在视频理解、视频处理、质量评估等三个方向有非常深入的研究。

随后，高孟平从视频、音频、图像三方面分别讲述了智能封面的架构。关于未来的工作与挑战，高孟平举了两个例子进行说明。一是 Semi-Reference Architecture，二是使用图像美学（Image Aesthetics）的通用模型，因为有些内容是无法用精彩视频描述的，如QQ音乐、K歌等，没有特定的动作。如果直接透过图像美学的评价，不用精彩视频，或许也是一个好的解决办法。

技术引路：机器学习仍大有可为，但方向在哪里？

谢晓辉：推动 AI 认知，解决语义的鸿沟，需要借助知识图谱等技术

Hulu首席研究主管谢晓辉分享了视频理解在个性化推荐与内容发现中的应用，内容涉及视频理解在内容冷启动、视频精细化标签和分组、深度推荐模型中的应用等。

随后在 Panel 环节中他还提到，所有在 AI 领域深耕的人，包括 Hulu，都会发现语义的鸿沟仍然是一个非常具有挑战性的问题，这最终还需要借助知识图谱等技术，来帮助整个AI认知取得新进展。

技术引路：机器学习仍大有可为，但方向在哪里？

彭靖田：TensorFlow 2.0 力图实现普惠 AI

谷歌机器学习专家彭靖田以《TensorFlow 2.0实现AI大众化》为题进行了演讲。他为大家分享到：TensorFlow 2.0 力图打造易于上手、性能强劲和灵活通用的端到端机器学习平台。通过 tf.keras 定义的高层次机器学习 API，用户可以快速验证模型效果、一键实现分布式训练、跨平台部署模型等。未来，TensorFlow 社区将持续提升用户体验，真正实现普惠 AI。

技术引路：机器学习仍大有可为，但方向在哪里？

彭湃：让 AI 更有温度，“科技向善”也是使命之一

腾讯优图实验室高级研究员彭湃为大家讲述了内容审核工作中 AI CV算法的实践与应用。AI 出现之前内容审核的方式都是人工审核，人工审核一百张违规照片需要 12 分钟左右，如果是 AI，只需要 1 秒钟。而 AI 审核模型是通过深度卷积神经网络实现的，从实际业务场景中探索出双模型级联合结构——DeepEye。数据是核心弹药，如何构建符合实际需要，性价比高的数据？采用主动学习机制进行数据积累，通过数据引擎挑选出值得标注的数据。

如何把网络模型 ResNet-152 变为 ResNet-50，效率提升 2 倍，精度损失降低于 1%？在性能优化工作中设计了 Deepsmart 高效模型，采用知识蒸馏兼顾大模型效果与小模型的效率，以及有助于提升模型鲁棒性的数据扩增工作。20年后的今天，AI 带来这么多的技术的升级，“科技向善”也是 AI 的使命之一，我们 AI 从业者需要有更多的社会责任感和担当，让AI更有温度，科技向善，以人为本。

技术引路：机器学习仍大有可为，但方向在哪里？

谢迪：动态恒常性是深度学习模型优化和稳定性的核心

海康威视研究院前沿技术部负责人、资深算法专家谢迪讲述了团队在完善机器学习流水线上的实践，包括信息生成（Annotation）、模型训练（Train）以及部署（Deployment）。通过分析信息初始化方法（即静态恒常性和动态恒常性）的一些特点和优势，可以得知：训练一个真正的深度网络，批量标准化是必要条件；二动态恒常性相比静态恒常性更为重要；三是相较于单个方向保持动态恒常性，在训练时保持两个方向同时保持动态恒常性，才是解决问题的关键；四是如果模型非常深，可能还需要显示对传播的信号进行调控调试。

最后，谢迪还总结了四点看法：一是在目前的深度学习框架中，模型对信息生成方式是非常敏感的；二是需要找到超越Bounding Box的更加优雅的表示方式；三是训练神经网络时，一个非常关键的因素是动态恒常性（Dynamic isometry ），它是深度学习模型优化和稳定性的核心；四是可能还需要显式对传播信号进行调制。

技术引路：机器学习仍大有可为，但方向在哪里？

齐彦杰：决定 Push 效果的背后机制——博文质量、算法模型与分发效率

微博研发中心技术专家齐彦杰分享了微博基于机器学习在个性化 Push 任务中的实践与应用。微博的 Push 任务有基于热点、人物关系、地理区域、个性化信息等多种类型，齐彦杰特别针对个性化 Push 场景下的技术实践与应用、打通链路的关键技术做了详细解读。

4.6 亿 MAU 的微博是如何进行用户增长的？这不得不提个性化 Push 任务。而决定 Push 效果的背后机制则主要是博文质量、算法模型与分发效率三方面。机器学习架构自底至上主要包括基础数据、特征工程、模型服务于排序策略四层。在此架构之后，还有一个重要的技术环节——构建推荐系统，最后，通过兴趣、实时、关系与环境四个维度构建特征体系，选择拟合与用户之间的关系模型，无论是早期的 LR 模型、还是 FM 模型、wide&deep 模型我们都进行过尝试，而样本数量在其中发挥着不可忽视的作用。

技术引路：机器学习仍大有可为，但方向在哪里？

熊超：对话问答通过图灵测试还有很长一段路要走

滴滴 AI Labs NLP 智能对话团队负责人熊超在分享中讲到，对话问答领域面临的最大的挑战就是图灵测试，目前的多轮对话能很好的回复问题，但并不表示完全理解了用户背后真正的意图，想要顺畅的解决特定领域的对话任务还需更长时间。

技术引路：机器学习仍大有可为，但方向在哪里？

圆桌讨论：AI 如何助力认知能力，提升业务水平？

数字化信息时代，虽然所有行业都在进行数字信息化，但是却没有将其真正利用。借助深度学习的快速发展，现在大家开始试图借助 AI 技术理解真实世界。”如何利用 AI 算法认知世界“就成为了核心问题。在本次 Panel 中，各位嘉宾就将围绕这个核心问题，并结合实际的业务场景中，为大家分享 AI 技术如何赋能与真实落地场景？又面临着哪些挑战？

技术引路：机器学习仍大有可为，但方向在哪里？

营长特意将圆桌讨论中每位嘉宾的精彩观点进行了摘录：

谢晓辉：所有在 AI 领域深耕的人，包括 Hulu，都会发现语义的鸿沟仍然是一个非常具有挑战性的问题。做标签会发现标签距离最终产品想要的标签，二者间语义的鸿沟很大的。最终都要借助知识图谱等技术，帮助整个 AI 认知取得下一步的进展。过去几年，AI 像脱疆的野马，快速奔跑，无论是否逼进峰值，技术的快速发展都给产业落地留下了广阔空间，未来仍大有可为！

齐彦杰：推荐系统构建于认知层之上。如何基于多模态信息理解用户是当下的一个挑战。业内现在不仅会分析文本内容，图像内容，视频内容理解也成为技术热点。当前技术飞速发展，技术团队需要随着发展做出调整，提高效率，让技术更好地落地。同时，需要知道自身数据和哪些新技术契合，才能够更高效的提升自己的业务，不被淹没在新技术的海洋之中。

高孟平：我的业务中更多的关注于视频本身的理解，如标签或者高阶语义的理解。技术进展也推动了应用的发展，提供了问题的解决方案，但是很多仍存在挑战，还有很多无法解决，如质量评估。我们的解决的思路是：先定位问题，然后寻找 AI 的解决方法，最后通过业务利用客观指标反映技术的提升效果。如果只是在某个领域里不断刷新指标，反而可能错失新领域的应用机会。

熊超：我们现在做的是智能客服，在对话问答领域面临的最大的挑战就是图灵测试，尤其是在对话非常丰富的情况下，更是一项艰巨的任务。能很好的回复问题，但并不表示完全理解了用户背后真正的意图。其次，想要顺畅的解决特定领域的对话任务还需要一个质的飞跃，也许几年、十年甚至更长的时间。

彭湃：首先，内容审核业务面临的一个非常大的挑战就是：不同的客户，因其业务的形态不同，需要过滤的规则边界也会有所差异。其次，从 To C 产品到现在助力产业互联网，会服务不同的产业客户、面临不同的需求，而这些是否都是 AI 可以解决的问题，是需要思考的。20年后的今天，AI 带来这么多的技术的升级，"科技向善"也是 AI 的使命之一，我们AI从业者需要有更多的社会责任感和担当，让AI更有温度，科技向善，以人为本。

正如谢晓辉所总结的：“未来，机器学习技术仍具有广阔的空间，大有可为”，这并不是一句简单的鼓舞人心的话语，而是在各行业技术专家、各行业的技术落地等综合考量下，深入机器学习领域本身，对未来给予的厚望。今日暴露的短板正是明日奋勇前进的方向，也更是证明了，作为中国开发者，我们想做的、能做的还很多！

最后，再次奉上本次大会官方链接，一键获取大会活动详情及部分嘉宾演讲PPT：

https://bss.csdn.net/m/topic/cta_meet/index#

（*本文为 AI科技大本营原创文章，转载请联系微信1092722531）

CTA核心技术及应用峰会

5月25-27日，由中国IT社区CSDN与数字经济人才发展中心联合主办的第一届CTA核心技术及应用峰会将在杭州国际博览中心隆重召开，峰会将围绕人工智能领域，邀请技术领航者，与开发者共同探讨机器学习和知识图谱的前沿研究及应用。

更多重磅嘉宾请识别海报二维码查看。CTA 主会议已经开始，第二日论坛少量余票即将售罄，欢迎点击阅读原文购票参会！更多详细信息15101014297，备注“CTA”，了解票务以及会务详情。

技术引路：机器学习仍大有可为，但方向在哪里？

机器学习人工智能

guangmang

0 关注 0 粉丝 0 动态

相关推荐

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 2020-11-19

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 2020-11-17

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 2020-11-16

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 2020-11-13

10个丰富自我的机器学习项目

机器学习项目有很大的发展潜力，最近大火的韩剧也出现了这个词语并且用很浪漫的说法解释了它。毕竟招聘者一般通过你拥有的技能来判断你的潜力。此外，确保所有数据集都呈现开放状态允许自由访问。很多机器学习课程将这个数据运用于教学目的，它可以预测人类的活动类别，这是一

ohbxiaoxin 2020-11-13

机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。金融科技初创厂商是智能手机、大数据、机器学习、区块链等新技术的早期采用者，被认为是被更传统的银行和金融机构所效仿的潮流引领者。机器学习和深度学习的最新进展确实推动了计算机视觉和自然语言处理的界限。Sta

Icevivian 2020-11-13

IT自动化和人工智能将在2021年走向何方？

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

CSDN人工智能头条 2020-11-11

无监督机器学习的重要指南

人们如今正处在数字化转型时代，只有一个不变的因素——进化。而组织采用的高科技解决方案正在引入数字化转型。因此，毫不奇怪的是，技术进步已完全取代了平凡的业务。因此，人们需要了解无监督机器学习在各行业中的广泛应用。如果用户标记了可以作为示例的训练数据，人们将其

mogigo00 2020-11-11

理解AI：为什么要在人工智能系统中寻求可解释性呢？

本文转载自公众号“读芯术”。或许这是你第一次听到人工智能前面加“可解释的”这个形容词，但其实它的涵义你一定能理解。可解释的人工智能是指构建AI应用程序的技术和方法，人们借此以理解它们做出特定决策的原因。换句话说，如果我们可以从AI系统获得有关其内部逻辑的解

白飞飞Alan 2020-11-11

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 2020-11-09

IT自动化和人工智能将在2021年走向何方?

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

EastCarFxxBlog 2020-11-09

强化学习到底是什么，它如何运作？

强化学习是一种行为学习模型，由算法提供数据分析反馈，引导用户逐步获取最佳结果。不同于使用样本数据集训练机器模型的各类监督学习，强化学习尝试通过反复试验掌握个中诀窍。强化学习与人类在婴幼儿时期的学习过程非常相似。这是一种基于经验的学习流程，机器会不断尝试、不

83153251 2020-11-06

数字营销：AI如何“看透”人类行为模式？

人工智能在市场营销领域取得的成功，揭示了人类的一些思维和行为模式，这些模式可以转化为其他应用程序。市场营销业已成为AI创新的试水之地，尤其是在人类行为建模和AI与人类交互探究层面更具实验价值。目前AI的局限性阻碍了机器使用溯因推理或创造性思维的能力。AI已

lizhengjava 2020-11-05

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 2020-11-19

机器学习新风暴：如何用ML模型预测房价？

从驾驶汽车到识别语音+翻译，机器学习通过软件预测变幻莫测的现实世界，正在人工智能领域掀起一场风暴。机器学习是教计算机系统使用反馈的旧数据进行预测的过程，基本上是训练计算机根据过去的数据预测未来的数据。机器学习大致分为两大类：监督学习和无监督学习。对此可以使

81510295 2020-11-17

LinkedIn开源Dagli，发布Java机器学习函数库

近年来，越来越多的优秀的机器学习工具不断涌现，如 TensorFlow、 PyTorch、 Caffee 和 CNTK、用于大规模数据的 Spark 和 Kubeflow，以及用于各种通用模型的 scikit-learn、 ML.NET 和最近的 Trip

lgblove 2020-11-16

关于机器学习算法的16个技巧

您可能听说过瑞士军刀。如果没有，请看下面的图片。它包含许多刀片和工具。每个人都专门从事一项特定的任务。在某些情况下，不同的刀片可以完成相同的任务，但性能不同。我将机器学习算法视为瑞士军刀。性能可能会根据任务和数据的特征而变化。例如，对数损失是与所有分类算法

Pokemogo 2020-11-16

需要知识的后深度学习时代，如何高效自动构建知识图谱

前沿的知识图谱自动构建技术有哪些？这篇文章将逐一解答这些问题。二者展示的信息量是差不多的，但右边这种看起来更加直观。而且，随着文本篇幅的增长，这种优势会体现得更加明显。其中，图的节点代表现实世界中存在的“实体”，图的边则代表实体之间的“关系”。基于知识图谱

lizhengjava 2020-11-13

24个提高知识和技能极限的机器学习项目

数据科学项目为你提供了一种有前途的方式来启动你在该领域的职业。你不仅可以通过应用它来学习数据科学，还可以在自己的简历上展示一些项目！这是大多数人挣扎和错过的地方。另外，我们确保所有数据集都是开放的并且可以自由访问。它由中型和大型数据集组成，需要一些认真的模

EchoYY 2020-11-12

guangmang

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号