渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

Jarvan

2017-12-23

机器之能，是机器之心旗下关注全球人工智能产业应用场景及商业化的内容账号。欢迎关注与互动：almosthuman2017

我们也请来了天猫精灵、小米音箱、Rokid（若琪）以及叮咚音箱，这些渡鸦音箱的「兄弟们」将与它一起接受我们的检验。

撰文 | 宇多田

在今年三个多小时的世界大会主论坛上，百度把一半时间都留给了渡鸦音箱。

渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

这个造型极其吸睛的四色正方体，暂时代替了无人车，成为李彦宏唯一揣到兜里带到乌镇互联网大会的「百度技术代表作」。

渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

与其他重量级 AI 硬件厂商相比，百度推出这款音箱的时间绝对不能算早。

在已经有了阿里、小米、京东等一众巨头摇旗呐喊的智能音箱市场，大概只有百度自己知道，这款姗姗来迟，且并不便宜的音箱，到底能不能让消费者买账。

渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

渡鸦音箱 Raven H，市场价格 1699 元

如何来衡量它呢？

对于一款普通音箱来说，音质必然是重中之重；而智能音箱，标准则要复杂太多。

不过，各家厂商最不愿听的，其实不是「音质差」，而是被叫做「智障」。

虽然在某种程度上，截止目前，这个称呼安在任何一家音箱上都几乎没差（谁用谁知道）。但在一定范围内，由于语音交互系统这个内核各不相同，各厂智能的音箱表现的确差异较大。

换句话说，在材质、音质、语音交互体验以及内容资源等多个评测维度中，后两者更为关键且联系紧密。

而对于要自称要 All in AI 的百度，虽然在很久之前就开始把 DuerOS（语音交互开放平台）嵌入到大大小小其他品牌的硬件产品中，而此次自家硬件的诞生，或许对于DuerOS继续招揽硬件生意起到「样板」作用。

没错，这是第一款可以让大众直接检验百度 AI 技术软硬实力的消费级产品。

拿景鲲的话来说，百度就是要通过这个音箱来告诉大众，什么才是不裹挟于成本与市场竞争的用户体验，为什么 DuerOS 才是真正的产业领导者·。

「无论从颜值、声音，还是内容和交互，渡鸦都是音箱类产品的标杆。有众多竞品是非常好的，因为这样市场会越来越大，但在音箱市场，我们想着重用户体验的突破，也应该有 iPhone 这样的定位。」

「软」要做 AI 时代的安卓，「硬」要做音箱界的 iPhone，百度的胃口不可谓不大。但这款音箱能否承「使命之重」，以下评测，算是渡鸦正式进入市场前的一个「小测验」吧。

渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

渡鸦 Raven H 由主机和 touch 两部分组成。touch 就是手里的这块点阵屏，可单独拆卸作为远程触控板进行主机的操控，譬如你上厕所，就可拿着这个小屏控制卧室音箱

作为第一个拿到渡鸦音箱的垂直新媒体，我们首先并没有被它颜色鲜艳，且「风格清奇」的外观所迷惑（据说直男相当喜欢）。

但把它拿在手上反复摩挲，突然可以理解这番「想做音箱界 iPhone」的野心。这种被称为 Kalix 的箱体材料，有一种区别于常用普通硬件塑料或网布的特别触感（掺杂了颗粒感的顺滑）。

渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

4 种颜色的搭配，是选择了色彩学中的德国工业标准色 RAL 体系）

而这种特殊的触感以及着色工艺，据称是渡鸦团队与比利时著名化学材料供应商 Solvey 的博士们协作几个月后才最终拍板的方案。

还有这个酷似乐高玩具的奇特造型，则在很大程度上出自瑞典著名消费品设计公司 Teenage Engineering 的手笔。

渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

渡鸦的产品经理一直向我们灌输一种「美学与艺术优先」的产品理念，但我们知道，对比市面上其他音箱，这里面肯定有一笔不菲的设计费与材料费。

另外，假如这是一款美到爆表的音箱，但是「智商」和「功能」却低于市场平均水平，你愿意买一个这样的摆件回去，还是选择那些「穿着秋裤」，但价格相对低廉的普通柱状音箱？

因此，重点来了，「用户体验」才是我们最关心的。换言之，这次测试也是我们对 DuerOS 的一次考验。

为了能够全方位「折磨」出渡鸦音箱语音交互系统的各项水平，我们也请来了天猫精灵、小米音箱、Rokid（若琪）以及叮咚音箱，从「语音识别」、「语义理解」、「问题反馈」（包括多轮对话，能提供的技能与服务数量）等多个维度对这四款音箱进行横向评测：

渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

从左到右分别是叮咚音箱、天猫精灵、渡鸦音箱、Rokid、小米音箱

远近场语音唤醒

对声音的捕捉，是智能音箱开始执行你指令的第一步。如果这款音箱能够有效过滤环境噪音，准确捕捉较远、较小的声音及指令，那么它才能继续「读懂」你的命令，进而做出合理的反馈。

在这一环节，我们首先在保证唤醒音量一致的前提下，从距离远近对 4 款音箱进行测试。

首先，在相对安静的环境中（只有窃窃私语声），我们分别在距离不到 1 米处，3 米处以及 5 米处，对四个音箱进行唤醒。

第二轮中，我们又将音箱播放的音乐调至 100 分贝，在距离音箱不到 1 米处和 3 米处进行唤醒，结果如下：

渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

从这个结果来看，市面上大厂产品的远场识别的水平线基本一致。

但有一个很明显的问题，叮咚音箱与 Rokid 都是仅用闪烁灯（无声音）来提示用户「已被唤醒」，但在站着（明显高于音箱时，我们看不清 Rokid 的闪烁灯）或者是背对音箱的角度，我们有时候难以知晓音箱是否已经被唤醒。

一、远近场语音识别：

同样是基于不同的距离维度（小于 1 米、3 米、5 米），在相对安静的环境以及提问音量一致的前提下，我们分别问了 5 个音箱两个很基础的问题：

（1）北京天气怎么样？

（2）李彦宏是谁？

5 款音箱的表现如下：

渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

这个结果同样看不出各个音箱背后的语音交互系统在语音识别方面的明显差异。

二、中英文混合语音识别

虽然各家音箱都表示可以进行「中英文混合识别」（提醒一下：他们单独识别英文的水平几乎为 0），但识别效果显然还是有些许差距。

我们问了这样几个问题，只能说，不要太过于期望国内音箱给你播想听的英文歌：

1、我想听 Justin Bieber 的歌

2、我想听 Alexander Jean 的歌

3、我想听 What do you mean

4、什么是 Tensorflow？

5、试了若干首不是小贾（Justin Bieber）和霉霉（Taylor Swift）唱的英文歌（结果……很不理想）

结果如下：

渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

很明显，作为大 IP 和点播率较高的海外歌手，Justin Bieber 与 Taylor Swift 的歌意料之中地好识别，几乎 5 款音箱都准确识别出这两位歌手的英文名字。

但其他歌手就非常不理想了，譬如 Alexander Jean，尽管虾米音乐（阿里）与百度音乐（百度）曲库里都有他们的歌，但音箱都识别不出这个乐队。

而作为 Justin Bieber 的热门歌曲，What do you mean 的识别准确率普遍相对较高。

但在5款音箱中，对于其他稍冷门国外歌手的作品，无论发音多么简单，所有音箱的识别率都较低。

而一些英文专有名词，譬如 Tensorflow……还是不要难为国内的音箱了。这就像跟让 Google Home 说中文一样，绝对不能强求。

三、句子里只有单个关键词的语义识别：

如果说语音识别的准确率大同小异，那么音箱交互体验的差距或许会在语义识别方面逐渐显现。

在顺利捕捉到你的声音，并将这些模拟音频信号进行数字化处理（语音识别）后，关键的一步来了：对这些文本信息进行分析，「读懂」这些信息，然后才能给出一个正确的反馈。

这里的「基于单个关键词」，指的是句式中的主语一般只有一个，无形容词（范围限定词）。音箱在识别并分析单个关键词后，便能给出准确答案。

譬如：什么是 A，B 怎么样，来点 C。

我们问了 5 个问题，都是这种简单的句式：

1、刘强东是谁？

2、设个闹钟

3、放首周杰伦的歌

4、来点相声

5、想听娱乐新闻

而结果如下：

渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

所有问题都有正确的反馈。

其中，对于「刘强东是谁」，Rokid 的回答稍简单，而其他音箱的答案似乎都搬出了百度或其他百科词条。

而「设定闹钟」这个问题，天猫精灵、小米音箱、渡鸦可以进行「多轮问答」，也就是说，能够针对具体时间进行二次确认。

实际上，除了语音和语义识别的准确率，音箱能否针对问题本身进行反馈，还涉及到其背后掌握的内容资源的丰富程度（内容布局，你懂得）。

其中，在提出「来点娱乐新闻」这个要求时，天猫精灵的回答明确指出「娱乐新闻」主要来自微博，而渡鸦的娱乐新闻主要来自百度搜索，其他音箱的新闻则没有指明具体来源。

而对于「来点相声」这个问题，这些音箱的内容源几乎都来自喜马拉雅。

四、句中涉及多个关键词的语义识别

对于关键词较多，语句相对复杂的问题，各个音箱「理解能力」开始有了明显的差距。我们问了以下 5 个问题，反馈各不相同：

1、刘强东的老婆/妻子是谁？（也同样问了「刘强东的女朋友是谁」）

2、爱因斯坦什么时候提出的相对论？（相对论是什么时候提出的）

3、我想听励志的歌曲（我想听励志的中文歌）

4、想听国内的科技新闻

5、我只想听周杰伦、孙燕姿和陈奕迅这三个人的歌。

渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

通过增加了问题的复杂性，我们得到了一些非常有意思的反馈。

无论是「老婆」还是「妻子」，渡鸦音箱、小米音箱都可以给出正确的答案，而京东旗下的叮咚音箱，则一会儿回答是「章泽天」，一会儿表示「我不关心这类八卦」……

而提到「女朋友」，只有叮咚音箱给了正确回答。

值得注意的是，虽然「女朋友」是一个错误的事实，但是对于我们人类来说，出于本能，都会回答出跟「老婆」一样的答案。

而「相对论」这个问题，渡鸦音箱表现得更为优秀。

除了有技术方面的原因外，百度产品经理还认为这跟公司的搜索与百科基因有很大关系。他表示，「只要涉及到知识问答一类的问题，百度的强大就会显露出来」。此外，小米的表现也相对不错。

而给音乐限定范围的问题，大多表现都不太好，只有渡鸦和天猫精灵在音乐的限定范围内给出了正确的答案。

不过，涉及到有范围限定的新闻，则「全军覆没」。

值得注意的是，对于最后一个问题，渡鸦的表现的确有些让人意外，因为这种多个关键词的识别与理解难度很大。我们连续听到渡鸦播放的歌曲，的确依次是「周杰伦」「孙燕姿」以及「陈奕迅」的歌。

至于为何能做到这个问题，百度给机器之能的回复显得简单粗暴：「这就是百度在自然语言处理技术上的一个创新点，是一个创新的产品功能。」

五、多轮问答

知乎专栏一位叫「我偏笑」的 AI 产品经理发表了这样一个观点：

自然语言解析技术已经逐渐不再成为各家广义智能助理产品的核心竞争力，而识别用户意图之后所提供的服务开始成为对话机器人差异化的核心。

这里的「后续服务」，就包括「多轮对话体验」。

他认为，在识别用户意图后，为了帮助你在多种可行方案中做出选择，语音交互系统应该通过多次交互最终执行你的明确指令。

在我们对 5 款音箱的体验中，除了「设定闹钟」，「问询股价」，以及天猫精灵的「购物」与「充话费」等简单的多轮对话设定外，很少有可以进行多轮对话的问题（这里指，不需要每下一个指令就叫「唤醒词」的连续作答）。

但渡鸦音箱在音乐单领域的「多轮问答」表现，体验还不错。

举个例子，在说「我想听运动的歌」，音箱开始播放音乐之后；你可以再次唤醒它（说句「小度小度」），并接着提出要求——「播放中文的」，这时音箱就默认为「你要听运动的中文歌曲」，继而执行命令。

以下问题，经过我们的测试，在进行二次唤醒后，都可以针对上个问题进行第二次「缩小范围的设定」，而其他音箱暂时做不到这些。

渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

不知作为用户的你，是否认为这是一种必要的对话流程。

当然，如果是混领域的多轮问答，譬如“今天北京天气怎么样？”“帮我查一下从北京到上海的机票”，这些对话由于涉及到技术、内容资源等多个维度，所以暂时市面上几乎所有音箱都达不到这个效果。

六、反馈处理-音箱功能的丰富性

我们在刚才已经提到了，每个音箱针对问题的回答，除了跟系统能否有效识别和分析你的指令有关，还有一个很重要的因素——音箱的内容资源与语料库能否支持你想要的这个功能。

换言之，就是音箱背后的生态实力是否足够强大。

我们从用户比较常用的三个维度列出了一个简略的功能表，而各家可以实现的功能，在很大程度上取决于自家厂商的生态基因。

但需要注意的是，这必然属于智能人机交互产品的核心竞争力——「后续服务」（上面已经提到）中的一个重要维度。

渡鸦音箱独家测评：代表百度AI技术DuerOS, 用户体验真的好吗？

很明显，从功能的丰富性与背景基因来看，创业公司会有些许劣势。

而对于大厂来说，各家有各家的优势，譬如阿里的天猫精灵与京东的叮咚更擅长 O2O 功能，而可以接入小米（其本身就有一个庞大的硬件王国）和渡鸦的智能硬件数量（DuorOS 起步较早）则看起来更加可观。

综上所述，根据我们对音箱「语音交互体验」这个维度的评测显示，刚刚面市的渡鸦音箱的实力还是不容小觑的，甚至在「多轮对话」方面明显高人一筹。

也就是说，渡鸦音箱中 DuorOS 提供的交互体验，在某种程度上认证了百度的技术实力。

但是我们需要清楚的是，一个音箱是否能赢得市场，除了交互体验，音质、价格、交货能力（产能）以及可以连接的硬件数量也将是考验产品的重要维度。

对于渡鸦来说，在交互体验过关后，面对市场，仍然还有很长一段路要走。

百度渡鸦 dueros 百度ai 数码人工智能

Jarvan

0 关注 0 粉丝 0 动态

相关推荐

人像特效还能这么用？百度大脑开放日用四大场景揭秘AI人像特效能力

9月25日，百度大脑开放日人像特效专场在北京中关村百度大脑创新体验中心召开。开放日上，百度大脑宣布全新开放互动娱乐、虚拟试妆、虚拟人、美业/健康四大人像特效应用场景下，七大类特效能力，并在现场演示产品使用效果。零技术低门槛、小时级批量制作高保真素材、半分钟

magvwiz 2020-09-26

百度世界2020|百度CTO王海峰发布百度大脑6.0，AI新基建加速产业智能化

如果让你见到二十年前的自己，和他（她）进行一次对话，你会和他（她）聊点什么？不用脑补了，这一如同科幻电影般的场景，已经在“百度世界2020”大会上演了。9月15日，百度联合央视新闻举办的“百度世界2020”大会以线上直播的形式召开。此次，百度大脑再次全新升

rungod 2020-09-16

百度AI新基建亮相2020服贸会最新人工智能成果全景展出

新一轮科技革命和产业变革孕育兴起，数字化、智能化技术正在成为我国服务贸易的亮眼“名片”。9月4日-9日，2020年中国国际服务贸易交易会在京开幕。百度作为全球领先的人工智能平台型公司全方位参与了此次盛会。百度CTO王海峰出席数字贸易发展趋势和前沿高峰论坛。

xiaozhukuaitui 2020-09-05

百度AI新基建亮相服贸会，CTO王海峰展示百度助推产业智能化硕果

AI正在为各行各业注入新活力，而AI新基建也在为包括服务贸易领域在内的社会经济发展提供新动力。9月4日，万众瞩目的2020中国国际服务贸易交易会正式召开。这是疫情发生以来，我国在线下举办的第一场重大国际经贸活动，吸引了1.8万家境内外企业及机构前来参展，并

小西0 2020-09-05

百度发力新基建：2030年百度智能云服务器数量超过500万台

预计到2030年，百度智能云服务器台数超过500万台。当天，百度还宣布未来5年预计培养AI人才500万，为中国智能经济和智能社会的发展提供AI人才保障。有媒体报道，到2025年中国AI人才缺口将达到1000万。此次百度宣布培养AI人才500万计划，率先扛起

shilongdred 2020-06-28

百度AI的研究帮助中国赢得21世纪

在今天，李彦宏登上了新一期《年代周刊》亚洲版封面。这也是我国互联网公司企业家初度在《年代周刊》上封。　　“The Innovator （立异者）”，《年代周刊》如此称谓李彦宏。?前者首要重视用于新式数据密集型运用的高效数据剖析技能，后者则要害重视机器人技能

worldkun 2020-01-10

打开2020年人工智能的正确姿势，十大科技趋势预测发布

本文转自雷锋网，如需转载请至雷锋网官网申请授权。向前一步，再向前一步，2019年就这样进入了尾声。12月24日，百度研究院发布了2020年十大科技趋势预测。百度研究院发布的科技趋势预测，很大程度上代表了最早被感知的风向。其一，百度认为AI技术本身以及各类商

weiloser 2019-12-25

AI技术领跑、23个国际冠军，2019百度AI如何彰显核心竞争力

BERT 自然语言处理模型，TensorFlow、PyTorch 深度学习平台，Waymo 自动驾驶汽车……这些能让我们记住的、与顶级 AI 相关的底层技术、平台、产品几乎无一不是舶来品。但 2019 年，我们也看到了部分「进口」技术断供带来的震荡和恐慌。

magvwiz 2019-12-23

Go实战项目推荐：开源版百度文库竟然是一个人完成的

互联网老司机应该多少都用过百度文库吧？！今天推荐的这个项目，他的作者在读大学时，不止是用百度文库，还想尝试自己搭建一个。虽然这个愿望是几年后才实现的。这是一个 Go 语言项目，基于 Beego 框架。喜欢 Go 语言、喜欢 Beego 的朋友可以了解下这个

mickeychan 2020-09-17

百度CTO王海峰详解语言与知识完整布局

语言与知识技术是人工智能认知能力的核心。2010年，百度成立自然语言处理部，在前瞻技术与产业格局上不断引领、创新，十年间已成为中国NLP发展的一面旗帜。十年来，百度大脑语言与知识技术成果丰硕，获得包括国家科技进步奖在内的20多个奖项，30多项国际竞赛冠军，

xiaozhukuaitui 2020-08-25

百度语言与知识技术峰会召开王海峰揭秘NLP技术演进路径

AI正在向更深层次进化，语言与知识技术的重要性愈加凸显。在演讲中，王海峰表示，“在百度语言与知识技术的布局和发展中，我们始终在注意把握两个趋势，即技术发展趋势和产业发展趋势，并力争引领趋势。”

龙心尘 2020-08-25

乌镇百度大脑开放日召开启动EasyDL产业智能创新大赛

8月21日，百度大脑开放日在乌镇举办“乘风新基建，加速产业智能化升级”专场，桐乡市经济和信息化局副局长陈再飞、乌镇镇科协秘书长钱永琪、桐乡市工业互联网企业联合会会长于亚东等出席活动。会上，百度大脑发布了新近开放和升级的AI能力，重磅推出乘风人脸通行考勤平台

rungod 2020-08-22

Python灰帽子：黑客与逆向工程师的Python编程之道PDF高清完整版免费下载|百度云盘

提取码：8nki 目录······ 第1章搭建开发环境 11.1 操作系统要求 11.2 获取和安装Python 2.5 21.2.1 在Windows下安装Python 21.2.2 在Linux下安装Python 21

waiwaiLILI 2020-07-20

百度网盘无限下载器，无限下载下载助手，

2、打开此软件复制百度网盘的链接和提取码就会自动打开。

zmosquito 2020-06-26

C# 调用百度AI接口实现文字识别

今天心血来潮做了个识别图片文字的demo，现在文字识别技术已经比较成熟了，而且还有可以调用的公共接口。今天做的demo主要简单对比了Tesseract-OCR和BAIDU.AI 这两种方法，感觉百度的中文识别准确率更高，Tesseract-OCR中文别准确

人工智能快报 2020-06-09

尚硅谷2019最新大数据课程百度云

很多人都在怎样才可以学习大数据。学习大数据最重要的是需要掌握一些大数据方面的知识。下面为大家介绍学习大数据需要具备的能力。

shilongdred 2020-06-08

AI: 百度AI实战教学

id=3&hmsr=%E5%BC%80%E5%8F%91%E8%80%85-AI%E5%AD%A6%E4%B9%A0%E8%B7%AF%E7%BA%BF&hmpl=&hmcu=&hmkw=&hmci=

zmosquito 2020-06-02

百度CTO王海峰：飞桨深度学习平台是新基建的重要一环

产业智能化快速深入推进，人工智能基础设施的建设不可或缺。5月20日，由深度学习技术及应用国家工程实验室与百度联合主办的“Wave Summit 2020”深度学习开发者峰会在线上召开。百度CTO王海峰在致辞中表示，时代契机为飞桨的发展提供了最好的机遇，作为

nextwhy 2020-05-20

vue-cli3关闭eslint语法检查

lintOnSave: false,warnings: true,

shilongdred 2020-05-03

android百度地图定位服务

创建一个Module包名为com.mingrisoft,将项目结构类型切换为Project,解压缩下载的BaiduLBS_Android-SDK_Lib.zip文件，将libs下的jar文件复制到该Module的libs文件夹中。选中这些文件，单击右键选择

fengyeezju 2020-04-20

Jarvan

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号