英文语音、方言语音识别样样拿手,百度输入法率先实现“语音自由说”
说起语音输入法,大家都不陌生。近几年,在手机上使用语音识别输入文字的朋友已不占少数,语音识别的精准程度更是今非昔比。
据iimedia Research(艾媒咨询)发布的《2019年上半年中国第三方手机输入法专题研究报告》指出,2018年中国第三方手机输入法用户规模已超7亿,预计2019年这一数字将达到7.28亿,2020年达到7.43亿,未来行业内将围绕人工智能技术升级展开激烈的竞争,AI技术也将成为输入法行业的最大变革助推力。
以百度输入法为例,经过长时间的技术优化和体验升级,2019年上半年百度输入法已拥有高达2.71亿的语音输入用户数量规模,稳居中国第三方手机输入用户规模的第一名,相比之下,搜狗和讯飞输入法分别以2.47亿、1.54亿用户规模居于二三位。此外,百度输入法离线识别精度也超越了行业最高水平的15%,在线语音的识别精度也高于行业平均水平35%。
另一方面,凭借今年初上线的“中英自由说”、“方言自由说”、离在线语音切换等功能,百度输入法强势占据语音用户占比的行业排名之首。据艾媒咨询数据显示,2019年上半年第三方手机输入法用户人均每日语音输入数次的统计中,百度输入法以3.28次位居第一,讯飞和搜狗输入法分别以3.21次和2.96次位列二、三位。
简单的做个计算,可以说每10个中国手机用户,就会有3、4个人在使用百度输入法的语音输入功能,这与百度输入法语音功能的识别准确率、人性化的便捷功能是分不开的。
不仅如此,百度输入法除官方版(主线版)外,还有与各类厂商合作、为不同手机品牌用户定制的版本,这种定制版更符合用户需求。比如笔点君自用的主力手机小米9,其MIUI系统就预装了百度输入法小米版,该版本与小米手机最新版MIUI 10系统深度适配,功能与官方的“主线版”界面略有差异。
此外,百度输入法还于2019年1月推出了拥有百度大脑众多AI技术加持的“百度输入法AI探索版”,如上图右侧界面所示,该版本默认为全语音输入,点击语音即可开启输入,界面清爽直接。它和百度输入法官方版一样,承载了百度语音技术的流式截断的多层注意力建模(SMLTA),将在线语音识别精度提升了15%,并实现全球首次基于Attention技术的在线语音识别服务的大规模上线应用。笔点君特意将三个版本逐个体验对比,其中官方主线版是目前功能最为丰富全面的版本,点击键盘左上角百度输入法LOGO按钮,即可看到6行4列、二十余个功能类别。
不知道这些功能大家有没有挨个体验,除了以往高频使用的功能,其他的我都把玩一番。其中,最好用的功能自然是语音转文字的识别功能,在百度输入法主线版上,长按空格键启用。下图是我用百度输入法主线版在知乎APP上语音输入撰写文章的过程,可以看到无论是识别速度还是准确度,百度输入法都是异常出色的。
百度输入法不仅对普通话识别准确,对多种语言混合输入也是信手拈来,更有离线识别、长文本语音(想说多久就说多久)、智能语音指令、轻声识别(小声说话也可以轻松识别)等功能加持。事实上,今年1月与百度输入法AI探索版同期诞生的“流式阶段多层注意力建模”(SMLTA)实现了两个中文在线语音识别历史上的重大突破,并基于SMLTA模型成为业内首家实现“中英自由说”,和首家实现“方言自由说”的输入法。
简言之,在不影响识别精度的前提下,百度输入法可以自由语音输入普通话+英文,或者自由语音输入普通话+6大方言(包括山东话、合肥话、四川话、河南话、西安话、东北话)。从此无论是“一口地道的伦敦腔”,还是倍感亲切的地方口音,都能被百度输入法快速、准确地转化成文字,难怪百度输入法能够稳居语音输入用户规模的第一位。
对我们用户而言,语音识别准确,自然爱不释“嘴”,从艾媒咨询的统计数据排行来看,百度输入法的语音输入的确“有口皆碑”,准确度评分与体验感评分均遥遥领先于第二、第三位的讯飞与搜狗输入法。
值得一提的是,百度输入法目前还有年轻用户群体喜闻乐见的语音斗图、神剧配图等功能,结合emoji表情、颜文字、表情包斗图可以玩出各种花样。
超级皮肤、悬浮键盘(仅支持安卓系统)、OCR识别/文字扫描、105种语言支持等等或实用、或极具个性的功能,更是让百度输入法深受各大用户群体欢迎。
有了百度输入法的这些语音输入秘密武器,双十一可以闭着眼睛打出剁手清单、跟老乡口述方言文字聊天,和女友语音斗图狂撒狗粮——谁能想到手机输入法也可以如此拉风!这大概就是一个“懂你的输入法”应该有的样子吧!可以想象,借助诸多AI技术,未来的百度输入法将会更加聪明、便捷,也将更懂你心。