联邦学习、AutoML、认知智能:市北·GMIS 2019带你一览AI前沿技术
机器之心原创
机器之心编辑部
「市北·GMIS 2019 全球数据智能峰会」于 7 月 19 日-20 日在上海市静安区举行。本次峰会以数据智能为主题,聚焦前沿研究方向,同时关注产业生态的发展,为技术从研究走向落地提供借鉴。点击阅读原文,即刻报名。
自 1956 年达特矛斯会议提出「人工智能」的名称和概念以后,AI 技术已经发展了 60 余年,经历过「寒冬」也经历过「复苏」。2011 年之后,得益于大数据、算力、算法的快速发展,以深度神经网络为代表的人工智能技术蓬勃发展,在图像分类、语音识别、NLP 等任务上实现了极大突破,也代表着这波人工智能浪潮的兴起。
2017 年,机器之心主办了首届全球智能机器峰会(GMIS),聚焦最前沿的 AI 技术,邀请来自全球多个领域的科学家与研究者进行分享,内容涉及无监督学习、语音识别、语音降噪、视觉信息处理、迁移学习、认知对话等技术领域,覆盖了计算机科学、语言学、神经科学等交叉学科。
历经两年,人工智能领域新研究、新应用不断涌现,如 2017 年下半年 Geoffrey Hinton 倾力推动的 CapsNet;2018 年当时号称「史上最强 GAN」的 BigGAN;异常火热的图神经网络;为 NLP 领域带来全新突破的 BERT、XLNet 等等。
此外,最新发布的剑桥 2019 年度《State of AI Report》,也把联邦学习、AutoML 等列为取得重大研究与技术突破的领域,而这也是今年「市北·GMIS 2019 全球数据智能峰会」所关注的研究热点。
联邦学习:保护数据隐私的机器学习
近年来,世界各国和地区逐渐重视保护公民的数据隐私。欧盟已通过了《数据隐私保护条例》(General Data Protection Regulation,简称 GDPR),要求公司在使用数据前要先向用户声明模型的作用。而中国的《网络安全法》也要求与第三方进行数据交易时需要确保数据保护的义务。这些法案和规定让许多大数据公司产生担忧,不敢互相交流数据,这对依赖大数据的机器学习是一个挑战。
怎样在保证数据隐私安全、合法合规的前提下,让人工智能共同使用参与各方的数据训练呢?联邦学习是一个可行的解决方案。首先,联邦学习通过加密手段交换参与各方的用户识别符,而非用户数据本身。其次,参与联邦学习的双方可根据识别符找出同样的用户,将这部分用户的不同特征作为输入、迭代训练模型和交换参数。在此过程中,双方不能反推对方拥有而自己没有的特征,因此保护了数据隐私。最终,参与联邦学习的各方可以在不共享数据的前提下,利用双方的数据优势实现各自的模型增长。
作为深耕联邦学习领域的大牛,杨强教授认为,联邦学习是机器学习面对更加严格的数据管理规定的解决方案。杨教授希望首先推动建立金融领域的联邦学习建模规范,让不同企业都受益于合规的联邦学习生态,促进机器学习业态健康发展。
随着联邦学习技术逐渐成熟,相关领域和企业也期待着它的应用落地。在今年「市北·GMIS 2019 全球数据智能峰会」上,杨强教授将为与会嘉宾深度解读联邦学习。
杨强教授是香港科技大学讲席教授,KDD 中国主席,微众银行首席人工智能官。曾于 2013 年当选国际人工智能协会(AAAI)院士,2016 年当选 AAAI 执行委员会委员,2017 年当选国际人工智能联合会(IJCAI)理事会主席。
杨强教授是联邦学习领域的开创者,带领团队开创性的发表了多篇相关领域论文,涉及联邦学习技术以及其中的数据安全、强化学习、迁移学习等问题,包括一篇 KDD TIST 2019 顶会论文。此外,杨教授在 IEEE 建立了联邦学习的框架和应用标准。杨教授所在的微众银行团队发布了《联邦学习白皮书 V1.0》,为联邦学习的发展奠定了基础。
自然语言对话:未来技术发展的机遇与挑战
随着这波人工智能浪潮的兴起,语音助手、智能音箱、聊天机器人等各种自然语言对话系统也如雨后春笋般地涌现。
在我们与这些对话系统交互的工程中,我们一方面感叹技术发展的迅速,一方面也期待人与机器之间更为自然流畅的对话。这也就是自然语言对话技术需要解决的问题。
自然语言对话的挑战在什么地方?未来可能会有哪些突破,以及需要重点研究与开发哪些技术?7 月 19 日,在市北·GMIS 2019 全球数据智能峰会」上,李航教授将发表主题为《自然语言对话:未来技术发展的机遇与挑战》的演讲。
李航教授,曾任微软亚洲研究院高级研究员与主任研究员、华为诺亚方舟实验室主任,现任字节跳动 AI Lab 总监。研究方向包括信息检索、自然语言处理、统计机器学习及数据挖掘。曾出版多部学术专著,如经典的《统计学习方法》。
VideoAI 的过去、现在和未来
在新一代信息技术的驱动下,互联网正全面视频化,以视频作为主要信息传递介质和功能载体的互联网形态——视联网,成为大势所趋。眼睛是人类感知世界的「关键窗口」,视联网新生态下,智能视频技术让人工智能拥有了感知世界的眼睛。
智能视界,如何通过 AI 聚势视频场景效能,助力视频价值规模化释放?技术飞速发展,VideoAI 如何加速视频应用技术迭代升级?极链科技首席科学家姜育刚将从数据、算法、算力等角度深度分析打造大规模智能视频分析系统的关键要素,分享对 AI 的过去、现在和未来发展的思考。
姜育刚,极链科技首席科学家,复旦大学计算机科学技术学院教授。姜育刚教授是中国视频识别与检索领军人物,曾获上海 IT 青年十大新锐 、国家万人计划青年拔尖人才,首届国际计算机学会中国新星奖得主。
认知智能:让机器善解人意
认知智能是人工智能的重要组成部分,它主要关注逻辑层的信息处理,包含自然语言理解、自动推理、知识表示等核心环节。认知智能有助于发现世界和历史上海量的有用信息,并洞察信息间的关系,不断优化自己的决策能力,从而拥有专家级别的实力,辅助人类做出决策。认知智能的发展将使大量繁琐却重要的工作变得更加高效精准,也更人性化。
认知智能在国内外都是研究的热点话题,如何使机器「能理解会思考」,是很多研究者努力的方向。目前,认知智能已在金融、法律等领域得到应用。
7 月 19 日,吕正东博士将结合实际场景中的案例,介绍深度好奇在认知智能领域从算法研究到产业落地方面的实践,以及如何用「最前沿的技术+最切实的方式」,帮助公安和金融领域的用户。
吕正东博士是深度好奇创始人兼 CTO,曾任职于微软亚洲研究院、华为诺亚方舟实验室,长期从事机器学习及人工智能的研究,在自然语言理解、自动推理、语义匹配、问答、对话等方面卓有建树,是深度学习领域(尤其是 NLP 方向)具有世界顶尖水平并享有国际声誉的科学家和技术专家。
自动机器学习技术回顾与展望
机器学习需要大量数据标注、调参优化等过程,因此它是有门槛的,需要具备专业知识的人参与其中。如果非机器学习领域的人员也想利用机器学习算法和模型来简化工作流程、提供优秀的解决方案,他们该怎么办呢?自动机器学习(AutoML)应运而生。
顾名思义,AutoML 将机器学习的流程大大自动化,这项技术旨在以数据驱动、客观、自动化的方式进行模型选择、调参等决策:用户只需提供数据,AutoML 系统会自动决定最适合该任务的方法。这能极大地降低用户使用机器学习的门槛。
AutoML 领域已经发展了很多年,社区举办了众多研讨会与比赛等。但 2017 年,谷歌 I/O 大会推出自己的 AutoML 算法,引起了极大的关注,之后 AutoML 领域的研究得到了很大的推动,实现了很多性能提升。
如今,经过两年的发展,自动机器学习领域又有哪些技术突破?未来发展方向何在?
在今年「市北·GMIS 2019 全球数据智能峰会」上,涂威威将在大会首日的「前沿研究与技术趋势」Session 中,为我们分享主题《自动机器学习技术回顾与展望》。
涂威威老师是第四范式的资深算法科学家,设计开发了百度、第四范式的大规模分布式机器学习框架,从事 AutoML 研发与应用。过去数年,涂威威曾担任 NeurIPS、KDD Cup 等国际 AI 顶会 AutoML 比赛的负责人,他也是 TPAMI 首个 AutoML 特刊创办者之一。
「市北·GMIS 2019 全球数据智能峰会」将于 7 月 19 日- 20 日在上海市静安区举行。本次峰会以数据智能为主题,力邀全球 30 余位重磅嘉宾,将进行 24 场主题演讲、2 个圆桌论坛、4 个 Session、1 场 AI 画展和「AI00」数据智能榜单发布。
大会详情如下:
市北·GMIS 2019全球数据智能峰会于7月19日-20日在上海市静安区举行。本次峰会以「数据智能」为主题,聚焦最前沿研究方向,同时更加关注数据智能经济及其产业生态的发展情况,为技术从研究走向落地提供借鉴。
本次峰会设置主旨演讲、主题演讲、AI画展、「AI00」数据智能榜单发布、闭门晚宴等环节,已确认出席嘉宾如下:
点击链接,即刻报名。