用开放的AI语音助理Mycroft确保隐私
其中一个是“开窗”漏洞:比如说,不怀好意的人路过敞开的窗户,喊道“嘿,开门!”,就能进入房子。研究人员还发现Alexa和谷歌语音助理有成千上万个误报性唤醒词,这种潜在的攻击途径便于注入恶意命令。一些人提到了通过电视注入亚音速命令的风险。亚马逊已经在操纵频率,以免Alexa在商业广告中激活。另外与任何联网计算机设备一样,还存在后门及其他常见漏洞这种可能。
确保隐私和安全的开源技术
像Mycroft AI的开源语音助理有意为安全和隐私提供了一条途径。本质上,开源软件鼓励对代码进行审查以便曝光漏洞。
我工作的公司Mycroft推崇这个概念:语音辅助技术可以很安全。我们有一套流程来处理披露的常见漏洞(CVE)。作为一种开发工具,我们高度依赖SSH之类的系统,并始终鼓励更改设备的默认密码,包括设置向导中的密码。我们还将意图解析、技能和文本到语音转换(TTS)等功能移到设备端,其他大公司可在云端执行此操作。对于技术娴熟的家庭用户来说,我们很快会发布必要的组件,以便在防火墙后面运行整个体验。我们希望用户对软件拥有最大的控制权。
声纹使人工智能能够通过声音来区分人,让用户能够为特定的人员分配锁定、购买及其他敏感功能方面的权限,以此缓解“开窗”和误报性唤醒词漏洞。这些都可以辅以使用一次性口语密码的双因子身份验证或更深入的语音生物特征识别技术。谷歌和亚马逊已经在其助理中部署了某种声纹,我们正与在该领域大有前途的一些公司建立联系。唤醒词识别方面的改进将限制可用误报性唤醒词的列表。在设计合理的反馈回路中,误报不太可能奏效,因为它用Mycroft的Precise标记工具的技术就能标记出来。
开源创新
在过去,鼓励实验的方式是借助开源。真正的创新是这样发展起来的,新技术也是这样建立起来的。
我们让创新者有机会用较少的字符串来尝试语音助理技术。开源使软件成为社区的共同工作。比如说,Mycroft有数千名开发人员提供反馈、开发新功能以及为核心软件做贡献,而不是由数名技术成员组成的16人团队。基于我们的许可模式,创新者可以轻松从新的、非常出色的实现当中建立起业务。
更深层次地说,开放意味着这项技术可以完全代表用户,而不仅仅是代表提供它的公司。语音助理能够改变人们与所有技术交互的方式。语音将以尚未想到的方式改变家庭、办公室、移动设备和公共场所。
我们希望人们提出的问题是:“我希望这项技术完全符合我的最佳利益,还是符合零售商或搜索和数据公司的最佳利益?”我们认为大多数人会选择前者。我们知道,唯一的方法就是确保开放、透明、社区驱动。
语音助理的功能
Mycroft与其他语音助理做同样的事情,但做法不同。大多数语音助理的语音系统使用设备端的唤醒词识别,然后将交互的剩余部分发送到云端来处理,最后将响应发回给说话人。
Mycroft将其中大部分环节移到运行软件的设备上。我们使用设备端的唤醒词识别来监听命令。检测到唤醒词后,记录该命令并将其发送到云端,进行语音到文本转录。一旦转录完毕,文本文件被发回到设备,自然语言处理、技能处理和语音合成在设备端执行。
技能为Mycroft赋予了能力。我们一直在将来自内部团队和社区的技能稳步添加到新的Mycroft技能市场。Mycroft可以控制多个音乐源,连接到众多物联网平台,从维基百科和Wolfram|Alpha等12个来源获取一般信息,玩游戏,掷骰子,讲故事,以及运行速度测试等。