阿里90后科学家研发,达摩院开源新一代AI算法模型

阿里90后科学家研发,达摩院开源新一代AI算法模型

整理 | 一一出品 | AI科技大本营(ID:rgznai100)

AI科技大本营7月5日消息,阿里达摩院宣布开源新一代人机对话模型ESIM。该算法模型提出两年多,已被200多篇论文引用,更曾在国际顶级对话系统评测大赛(DSTC7)上获得双料冠军,将人机对话准确率的纪录提升至94.1%。

ESIM模型还被用来评测一些新提出的数据集,比如来自纽约大学的MultiNLI数据集、最近大热的来自华盛顿大学的SWAG数据集、NAACL19 Best Resource Paper常识知识QA数据集CommonsenseQA等等。

据介绍,比起业界使用最为广泛的LSTM模型,ESIM人机对话回复模型回复准确率更高。采用全新ESIM模型的人机对话回复模型,比LSTM模型回复准确率提升25%(数据来自ICASSP2019论文中Ubuntu测试集的数据)。

阿里90后科学家研发,达摩院开源新一代AI算法模型

陈谦参加第七届对话系统技术挑战赛

ESIM模型最初由达摩院语音实验室内的90后科学家陈谦(花名潭清)研发,他博士毕业于中科大,是达摩院中最年轻的科学家之一,也是2018届的阿里星(阿里星是专门针对高校顶尖人才的一个培养计划,从应届毕业生中经过层层筛选,由技术带头人担任主管,进行重点培养,每年的阿里星平均只有20人不到)。

在去年DSTC 7对话系统评测大赛上,ESIM在NOESIS赛道中从麻省理工学院、约翰霍普金斯大学、IBM研究院等近20支参赛队伍中拿下该赛道两项比赛的冠军。NOESIS赛道考察AI的人机对话能力,要求AI根据给定的多轮人机对话历史,从成百到上万个句子中选出正确的回复。

阿里90后科学家研发,达摩院开源新一代AI算法模型

ESIM模型的原理论文已于2017年发表在国际顶级自然语言处理会议ACL 2017,阿里巴巴此次开源的模型原理论文发表在了今年国际顶级语音会议ICASSP 2019上,在公开的标准数据集Ubuntu(英文)和E-commerce(中文)上均取得了目前最高的成绩。

人机对话系统及其背后的认知智能,为让机器快速准确理解人类的表达,ESIM给AI装上一套“雷达”系统,赋予它实时检索对话历史、自动去除干扰信息的能力,使它能够给出人类期待的回复。

目前,这一模型已在基于ESIM模型研发的智能语音点餐机、地铁语音售票机等应用中落地,还可能将给智能客服、导航软件、智能音箱等应用场景带去改变。

开源地址

https://github.com/alibaba/esim-response-selection

论文链接

https://arxiv.org/pdf/1901.02609.pdf

(*本文为 AI科技大本营整理文章,转载请联系 1092722531)

相关推荐