在自然语言处理领域,哪些企业的发展遥遥领先?(附报告)
后台私信回复关键词“NLP”下载研究报告(含人才分布图)
目录
- 第 1 章 自然语言处理概念篇
- 第 2 章 自言语言处理技术篇
- 第 3 章 自然语言处理人才篇
- 第 4 章 自然语言处理应用篇
- 第 5 章 自然语言处理趋势篇
自然语言处理是包括了计算机科学、语言学心理认知学等一系列学科的一门交叉学科,这些学科性质不同但又彼此相互交叉。
1950年图灵提出了著名的“图灵测试”,这一般被认为是自然语言处理思想的开端。
20世纪50年代到70年代自然语言处理主要采用基于规则的方法。
70年代以后随着互联网的高速发展,自然语言处理思潮由理性主义向经验主义过渡,基于统计的方法逐渐代替了基于规则的方法。
从2008年到现在,在图像识别和语音识别领域的成果激励下,人们也逐渐开始引入深度学习来做自然语言处理研究。
由最初的词向量到2013年word2vec,将深度学习与自然语言处理的结合推向了高潮,并在机器翻译、问答系统、阅读理解等领域取得了一定成功。
接下来我们将为大家介绍自然语言处理的业界发展,涵盖了以下企业。
微软亚洲研究院
微软亚洲研究院1998年成立自然语言计算组,研究内容包括多国语言文本分析、机器翻译、跨语言信息检索和自动问答系统等。
这些研究项目研发了一系列实用成果,如IME(Input Method Editors输入法编辑器,它是一种专门的应用程序, 用来输入代表东亚地区书面语言文字的不同字符。)、对联游戏、Bing词典、Bing翻译器、语音翻译、搜索引擎等,为微软产品做出了重大的贡献。
微软IME
微软对联游戏
微软必应词典
并且在自然语言处理顶级会议,例如ACL、COLING等会议上发表了许多论文。
语音翻译
2017年微软在语音翻译上全面采用了神经网络机器翻译,并新扩展了Microsoft Translator Live Feature。
可以在演讲和开会时,实时同步在手机端和桌面端,同时把讲话者的话翻译成多种语言。
其中最重要的技术是对于源语言的编码以及引进的语言知识,同时,微软还表示,将来要将知识图谱纳入神经网络机器翻译中规划语言理解的过程中。
人机对话
小娜现在已经拥有超过1.4亿用户,在数以十亿计的设备上与人们进行交流,并且覆盖了十几种语言。
有聊天机器人小冰,正在试图把各国语言的知识融合在一起,实现一个开放语言自由聊天的过程,目前小冰实现了中文、日文和英文的覆盖,有上亿用户。
Google是最早开始研究自然语言处理技术的团队之一,作为一个以搜索为核心的公司,Google对自然语言处理更为重视。
Google拥有着海量数据,可以搭建丰富庞大的数据库,可以为其研究提供强大的数据支撑。
Google对自然语言处理的研究侧重于应用规模、跨语言和跨领域的算法。
机器翻译
知识图谱
Google的知识图谱更是遥遥领先,例如自动挖掘新知识的准确程度、文本中命名实体的识别、纯文本搜索词条到在知识图谱上的结构化搜索词条的转换等,效果都领先于其他公司,而且很多技术都实现了产品化。
语音识别
Google一直致力于投资语音搜索技术和苹果公司的siri竞争,自2012年以来将神经网络应用于这一领域,使语音识别错误率极大降低。
2011年收购语言信息平台SayNow,把语音通信、点对点对话、以及群组通话和社交应用融合在一起。
2014年收购了SR Tech Group的多项语音识别相关专利。
Facebook涉猎自然语言处理较晚,2013年开始发展语音翻译,2015年开始语音识别的研发之路。
语音翻译
发展道路如下图所示
语音识别
2015年,Facebook相继建立语音识别和对话理解工具,开始了语音识别的研发之路。
2016年Facebook开发了一个响应“Hey Oculus”的语音识别系统。
并在2018年初开发了wav2letter,这是一个简单高效的端到端自动语音识别(ASR)系统。
百度
百度自然语言处理部是百度最早成立的部门之一,研究涉及以下方面。
百度在深度问答方向经过多年打磨,积累了问句理解、答案抽取、观点分析与聚合等方面的一整套技术方案,目前已经在搜索、度秘等多个产品中实现应用。
百度翻译目前支持全球28种语言,覆盖756个翻译方向,支持文本、语音、图像等翻译功能,并提供精准人工翻译服务,满足不同场景下的翻译需求,发布了世界上首个线上神经网络翻译系统,并获得2015年度国家科技进步奖。
阿里巴巴
阿里自然语言处理为其产品服务,在电商平台中构建知识图谱实现智能导购,同时进行全网用户兴趣挖掘,在客服场景中也运用自然语言处理技术打造机器人客服。
例如蚂蚁金融智能小宝、淘宝卖家的辅助工具千牛插件等,同时进行语音识别以及后续分析。
阿里的机器翻译主要与其国家化电商的规划相联系,2017年初阿里正式上线了自主开发的神经网络翻译系统,进一步提升了其翻译质量。
腾讯
AI Lab是腾讯的人工智能实验室,研究领域包括计算机视觉、语音识别、自然语言处理、机器学习等。
其研发的腾讯文智自然语言处理基于并行计算、分布式爬虫系统,结合独特的语义分析技术,可满足自然语言处理、转码、抽取、数据抓取等需求。
在机器翻译方面,2017年腾讯宣布翻译君上线“同声传译”新功能,用户边说边翻的需求得到满足,语音识别+NMT等技术的应用保证了边说边翻的速度与精准性。
京东
京东在人工智能的浪潮中也不甘落后。京东AI开放平台基本上由模型定制化平台和在线服务模块构成,其中在线服务模块包括计算机视觉、语音交互、自然语言处理和机器学习等。
按照京东的规划,NeuHub平台将作为普惠性开放平台,不同角色均可找到适合自己的场景,例如用简单代码即可实现对图像质量的分析评估。
从业务上说,平台可以支撑科研人员、算法工程师不断设计新的AI能力以满足用户需求。
并深耕电商、供应链、物流、金融、广告等多个领域应用,探索试验医疗、扶贫、政务、养老、教育、文化、体育等多领域应用。聚焦于新技术和行业趋势研究,孵化行业最新落地项目。
科大讯飞
科大讯飞股份有限公司成立于1999年,是一家专业从事智能语音及语言技术、人工智能技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成的国家级骨干软件企业。
科大讯飞作为中国智能语音与人工智能产业领导者,在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先的成果。
科大讯飞成立之时就开始在语言和翻译领域布局项目。基于深度神经网络算法上的创新和突破,在翻译方面的发展如下图所示。
后台私信回复关键词“NLP”下载研究报告(含人才分布图)
版权声明
AMiner属于清华-青岛数据科学研究院科技大数据研究中心。
(www.ids.tsinghua.edu.cn)
AMiner咨询产品版权为AMiner团队独家所有,拥有唯一著作权。AMiner咨询产品是AMiner团队的研究与统计成果,其性质是供客户内部参考的商业资料。
AMiner咨询产品为有偿提供给购买该产品的客户使用,并仅限于该客户内部使用。未获得AMiner团队书面授权,任何人不得以任何方式在任何媒体上(包括互联网)公开发布、复制,且不得以任何方式将本产品的内容提供给其他单位或个人使用。如引用、刊发,需注明出处为“AMiner.org”,且不得对本报告进行有悖原意的删节与修改。否则引起的一切法律后果由该客户自行承担,同时AMiner团队亦认为其行为侵犯了AMiner团队著作权,AMiner团队有权依法追究其法律责任。
AMiner咨询产品是基于AMiner团队及其研究员认为可信的公开资料,但AMiner团队及其研究员均不保证所使用的公开资料的准确性和完整性,也不承担任何投资者因使用本产品与服务而产生的任何责任。
行业研究报告是AMiner团队智能服务体系的重要组成部分。如对有关信息或问题有深入需求的客户,欢迎使用AMiner团队专项研究智能服务。