讨论 | 人工智能可以取代同传翻译吗？

zjjoy0

2019-01-04

讨论 | 人工智能可以取代同传翻译吗？

前阵子，一位同传翻译员声讨科大讯飞“AI同传造假”，在网上引起了轩然大波。人工智能和同传翻译由此成为大家热议的话题。今天，我们来谈一谈“人工智能翻译是否真的可以取代同传翻译员”?

同声传译有多难?

同声传译最早出现在一战后的巴黎和会上，英法两国代表借助同声传译人员的帮助，完成了紧张的谈判。

如今，该技术依然在国际会议上扮演着极其重要的角色。据统计，95%的国际会议都有专业同声传译人员助力。

同传翻译员在台上能够将同传能力运用自如，需要平时大量的艰苦练习，即使是双语运用自如的专业人员，在实战之前，也要进行数年的锻炼。他们不仅需要事先学习、熟悉会议资料，还需要随机应变的能力。同声传译的工作方式也比较特殊，因为压力巨大，一般多人协同，在一场数小时的过程中，每人轮流翻译几十分钟。

相较之下，普通的口译工作则要简单不少。机器翻译如能代替同声传译无疑具有巨大的价值。

人工智能翻译的水平如何?

那么，人工智能同传翻译的能力究竟怎样?会不会抢走同传翻译员的饭碗呢?

今年上半年的博鳌亚洲论坛上，首次出现了AI同传。然而，现场配备的系统却掉了链子，闹出词汇翻译不准确、重复等低级错误。

客观来讲，人工智能或机器翻译技术在自然语言处理上，的确有许多突破。这些突破给人希望，让人畅想未来，但是，短期内的价值，更多体现在辅助翻译等领域。

当然，目前机器翻译已经取得非常大的进步，在衣食住行等常用生活用语上的中英翻译可以达到大学六级的水平，能够帮助人们在一些场景处理语言交流的问题，但距离人工同传以及高水平翻译所讲究的“信、达、雅”，还存在很大的差距。

目前的差距是由现有技术水平的限制决定的，机器翻译，又称为自动翻译，是利用计算机将一种语言转换为另一种语言，机器翻译技术的发展与计算机技术、信息论、语言学等学科的发展紧密相关。从早期的词典匹配，到结合语言学专家梳理的知识规则，再到基于语料库的统计学方法，随着计算能力的提升和多语言信息的积累，机器翻译技术开始在一些场景中提供便捷的翻译服务。

新世纪以来，随着互联网的普及，互联网公司纷纷成立机器翻译研究组，研发了基于互联网大数据的机器翻译系统，从而使机器翻译真正走向实用，市场上开始出现比较成熟的自动翻译产品。近年来，随着深度学习的进展，机器翻译技术得到了进一步的发展，促进了翻译质量的提升，使得翻译更加地道、流畅。

机器翻译的难点在哪里?

这里，简单介绍一下机器翻译的难点。整个机器翻译的过程，可以分为语音识别转换、自然语言分析、译文转换和译文生成等阶段。在此，以比较典型的、基于规则的机器同传翻译为例(参见下图)，模块包含了：语音识别(语音转换为文本)、自然语言处理(语法分析、语义分析)、译文转换、译文生成和语音生成等模块。其中的技术难点主要是：语音识别、自然语言处理和译文转换等步骤。

第一个技术难点是语音识别。近二十年来，语音识别技术取得了显着进步，开始进入家电、汽车、医疗、家庭服务等各个领域。常见的应用系统有：

语音输入系统，相对于键盘输入方法，它更符合人的日常习惯，也更自然、更高效;

语音控制系统，即用语音来控制设备的运行，相对于手动控制来说更加快捷、方便，可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域;

智能对话查询系统，根据客户的语音进行操作，为用户提供自然、友好的数据库检索服务，例如家庭服务、旅行社服务系统、订票系统、银行服务等。

可以说，语音识别技术与其他自然语言处理技术相结合，可以构建出很多复杂的应用。

然而，语音识别的主要难点就是对自然语言的识别和理解。首先必须将连续的讲话分解为词、音素等单位，其次要建立一个理解语义的规则。由于语音信息量大，语音模式不仅对不同的说话人不同，对不同场景的同一说话人也是有差异的。

例如，一个人在随意说话和认真说话时的语音特征是不同的。另外，说话者在讲话时，不同的词可能听起来是相似的，这也是常见现象。单个字母或词、字的语音特性，受上下文的影响，以致改变了重音、音调、音量和发音速度等。最后，环境噪声和干扰对语音识别也有较大影响，致使识别率低。

第二个技术难点是语义解析，这是智能化的机器翻译系统的核心部分。目前，机器翻译系统可划分为基于规则和基于语料库两大类。前者以词典和语言知识规则库为基础;后者由经过划分并具有标注的语料库构成知识源，以统计学的算法为主。

机译系统是随着语料库语言学的兴起而发展起来的。目前，世界上绝大多数机译系统都采用以规则库为基础的策略，一般分为语法型、语义型、知识型和智能型。不同类型的机译系统，由不同的成分构成。抽象地说，所有机译系统的处理过程都包括以下步骤：对源语言的分析或理解，在语言的语法、语义和语用等平面进行转换，按目标语言结构规则生成目标语言。

当前，Google 的在线翻译已经为人熟知，其第一代的技术即为基于统计的机器翻译方法，基本原理是通过收集大量的双语网页作为语料库，然后由计算机自动选取最为常见的词与词的对应关系，最后给出翻译结果。

不过，采用该技术目前仍无法达到令人满意的效果，经常闹出各种翻译笑话。因为，基于统计的方法，需要建立大规模的双语语料库，而翻译模型、语言模型参数的准确性直接依赖于语料的规模及质量，翻译质量直接取决于模型的质量和语料库的覆盖面。

除了上述传统的方式，2013年以来，随着深度学习的研究取得较大进展，基于人工神经网络的机器翻译逐渐兴起。就当前而言，广泛应用于机器翻译的是长短时记忆循环神经网络。该模型擅长对自然语言建模，把任意长度的句子转化为特定维度的浮点数向量，同时“记住”句子中比较重要的单词，让“记忆”保存比较长的会话时间。该模型较好地解决了自然语言句子向量化的难题。

其技术核心是通过多层神经网络，自动从语料库中学习知识。一种语言的句子被向量化之后，在网络中层层传递，经过多层复杂的传导运算，生成译文。这种翻译方法最大的优势在于译文流畅，更加符合语法规范。相比之前的翻译技术，质量有较高的提升。

智能同传翻译离我们还有多远?

自然语言处理人工智能同传翻译翻译专业语言翻译机器翻译语音识别

zjjoy0

0 关注 0 粉丝 0 动态

相关推荐

机器翻译：谷歌翻译是如何对几乎所有语言进行翻译的？

谷歌翻译大家想必都不陌生，但你有没有想过，它究竟是如何将几乎所有的已知语言翻译成我们所选择的语言？本文将解开这个谜团，并且向各位展示如何用长短期记忆网络构建语言翻译程序。第一部分简单介绍神经网络机器翻译和编码器-解码器结构。什么是机器翻译？在机器翻译领域，

WhiteHacker 2评论 2020-10-11

MIT 推出机器翻译新算法，破译已消失的古语言

麻省理工学院计算机科学与人工智能实验室的研究人员最近开发出了一种新的计算机算法，可以帮助语言学家自动破译历史上消失已久失的古语言。官方指出，该系统能够自动破译已消失的语言，且无需对这一语言与其他语言的关系有深入的了解。他们还表明，该系统自身就可以确定语言之

baijingjing 2020-10-27

基于OpenSeq2Seq的NLP与语音识别混合精度训练

Mixed Precision Training for NLP and Speech Recognition with OpenSeq2Seq. 迄今为止，神经网络的成功建立在更大的数据集、更好的理论模型和缩短的训练时间上。为此，我们创建了OpenSeq

bensonrachel 2020-06-21

人工智能的三大领域及其工业应用

人工智能是一门新兴的技术学科，研究和开发用于模拟人类智能的扩展和扩展的理论，方法，技术和应用系统。人工智能研究的目标是让机器执行一些复杂的任务，这些任务需要聪明的人来完成。也就是说，我们希望机器可以代替我们来解决一些复杂的任务，不仅仅是重复的机械活动，而是

purgle 2020-06-01

使用Python和Keras创建简单语音识别引擎

语音识别是机器或程序识别口语中的单词和短语并将其转换为机器可读格式的能力。通常，这些算法的简单实现有一个有限的词汇表，它可能只识别单词/短语。但是，更复杂的算法具有广泛的词汇量，并包含方言、噪音和俚语。语音只是由我们的声带引起的空气周围振动而产生的一系列声

dflyzx 2020-03-04

百度语音识别新算法准确率提升超30%，鸿鹄芯片彰显AI落地新打法

今年 7 月，在开发者大会上，百度公布了其在 AI 技术上的进展。而短短四个月后，在昨日的百度语音能力引擎论坛上，百度在语音领域再次公开了最新的算法成果。同样引人关注的还有百度鸿鹄芯片的最新进展。百度通过本次发布说明，深度学习端到端技术依然大有发展空间，软

LinSeeker 2019-11-29

为什么企业应该了解聊天机器人中的自然语言处理？

自然语言处理使聊天机器人能够理解我们的会话信息并相应地作出响应。企业应该对聊天机器人中的自然语言处理有所了解，因为它可以确定用户意图，评估其情绪并了解其行为。聊天机器人已经成为企业在当今竞争激烈的市场中获得认可的当务之急。利用聊天机器人提供的前所未有的客户

saluzirobot 2020-11-05

NLP：不要重新造轮子

自然语言处理是一个令人生畏的领域名称。从非结构化文本中生成有用的结论是很困难的，而且有无数的技术和算法，每一种都有自己的用例和复杂性。作为一个接触NLP最少的开发人员，很难知道要使用哪些方法以及如何实现它们。本文的目标读者是希望将自然语言处理快速集成到他们

熊Ok 2020-10-26

十大针对机器学习的文本注释工具与服务，你会选用哪个？

下面，我将和您一起探讨目前十大针对机器学习的文本注释工具与服务。您可以根据自己项目的实际情况，从中做出选择并试用。Tagtog是一款由波兰软件公司开发的工具，可用于自动化或手动注释文本。Tagtog既支持原生的PDF注释，又包含了可用于自动化文本注释的预训

lgblove 10评论 2020-10-23

AI创业哪家强？6大选择给你方向

人工智能被认为是当代“最热门”的工作。根据《财富》杂志统计，雇佣AI专家的人数在过去4年里增长了74%，社会对人工智能专家的需求正以前所未有的速度增长。人工智能的子领域，如机器学习、深度学习、计算机视觉、统计学和自然语言处理，对这些领域专家的需求和空缺职位

guojin0 2020-10-08

自然语言处理实战：机器学习常见工具与技术

许多自然语言处理都涉及机器学习，所以理解机器学习的一些基本工具和技术是有益处的。有些工具已经在前几章中讨论过，有些还没有，但这里我们会讨论所有这些工具。数据选择和特征工程会带来偏见的风险。类似的种族、宗教甚至地理区域偏见在原始的Word2vec模型中普遍存

lirika 2020-09-27

人工智能的企业家来说，这四个新的方向可能值得重视

在过去、现在和未来，人们用人工智能改变了许多行业，取得了很大的进步，也对人工智能有着长期和系统的发展远景和规划。对于人工智能的企业家来说，这四个新的方向可能值得重视：一是人类的自然语言处理、密集学习、记忆网络和其他技术领域与其他物种不同。人类的重要能力之一

saluzirobot 2020-09-25

人工智能的研究热点:自然语言处理

人工智能作为新一轮科技革命和产业变革的重要驱动力量，正在深刻地影响世界、改变世界。而自然语言处理已成为AI领域的研究热点，它推动着语言智能的持续发展和突破，并越来越多地应用于各个行业。正如国际知名学者周海中先生曾经所言：“自然语言处理是极有吸引力的研究领域

hxq 2020-09-23

性能媲美BERT，参数量仅为1/300，谷歌最新的NLP模型

在最新的博客文章中，谷歌公布了一个新的 NLP 模型，在文本分类任务上可以达到 BERT 级别的性能，但参数量仅为 BERT 的 1/300。在过去的十年中，深度神经网络从根本上变革了自然语言处理领域的发展，但移动端有限的内存和处理能力对模型提出了更高的要

熊Ok 2020-09-22

AI写的文章，真的可以骗过老师了

在过去的几年里，机器学习和人工智能的专家们一直致力于研究一些算法，这些算法可以用以前认为人类完全可以写的方式撰写文章和其他类型的内容。前段时间，一位学生用编程语言让电脑写了一篇文章在外网火了，网友都看不出来那篇文章出自AI之手。随着这些技术越来越先进，我们

randy0 2020-09-17

自然语言处理必读：5本平衡理论与实践的书籍

当谈到学习方法时，我们常常会提到教程、博客文章、在线课程等等，书本总是会被忽略掉。即使是在找一本关于某个主题的书，也会很快发现这样的书太多了，无法快速判断哪一本最适合自己。它也称为NLTK书籍，应用Python进行自然语言处理在整个过程中都很大程度上依赖于

MakeRoomFor 2020-08-30

无需「域外」文本，微软：NLP就应该针对性预训练

在生物医学这样的专业领域训练NLP模型，除了特定数据集，「域外」文本也被认为是有用的。但最近，微软的研究人员「大呼」：我不这么觉得！这是一个拷问人工智能「门外汉」的灵魂问题。但研究人员将这部分归因于数据中的噪声。

mxs 2020-08-10

pytorch+huggingface实现基于bert模型的文本分类（附代码）

一年前的这个时候，我逃课了一个星期，从澳洲飞去上海观看电竞比赛，也顺便在上海的一个公司联系了面试。当时，面试官问我对RNN的了解程度，我回答“没有了解”。但我把这个问题带回了学校，从此接触了RNN，以及它的加强版-LSTM。时隔一年，LSTM好像已经可以退

qilixuening 2020-07-18

NLP中的标识化

从零开始掌握一门新的语言令人望而生畏。如果你曾经学过一种不是你母语的语言，你就会理解！有太多的层次需要考虑，例如语法需要考虑。这是一个相当大的挑战。这就是自然语言处理中标识化的概念。简单地说，标识化对于处理文本数据十分重要。标识化是一种将文本分割成称为标识

NgCafai 2020-06-28

人工智能的8个有用的日常例子

如果你在谷歌上搜索“人工智能”这个词，然后不知怎的就打开了这篇文章，或者用优步打车上班，那么你就利用了人工智能。虽然有人将其称为“机器人以邪恶的天才统治世界”的现象，但我们无法否认人工智能通过节省时间、金钱和精力使生活变得轻松。人工智能是指机器通过专门设计

womystery 2020-06-17

zjjoy0

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号