AI大战地铁: 马云语音+刷脸购票, 马化腾微信扫乘车码, 谁占先机?
没在乌镇参加“饭局”的马云转身到了上海,体验了阿里巴巴落地地铁的三项AI技术——阿里云12月5日宣布了与上海地铁合作的阶段成果:语音购票、刷脸进站、智能客流监测。其中语音购票的技术最为吸引眼球:系统具备在地铁等强噪音场景下的精确语音识别、无唤醒词人机交互等能力。
巧合的是,上个月,马化腾也在广州坐了一趟地铁,“在无数聚光灯下,马化腾亲自打开手机,为价值千万的地铁扫码付款”。
阿里:不用扫码,动动嘴就能语音购票
12月5公开的信息显示,阿里在上海地铁目前的核心技术有三项:语音购票、刷脸支付&进站、客流监控。乘客只需对售票机说出目的地,如“我要去东方明珠”,售票机会自动向乘客推荐线路和站点,乘客扫码或刷脸即可购票,全程不过数秒钟时间。
其中,结合地铁复杂场景的语音购票的技术具有较大意义。阿里巴巴iDST资深人工智能专家鄢志杰表示,iDST深度融合了语音信号处理和计算机视觉技术,解决了强噪声干扰问题。
另外,新技术的一大亮点还在于,目前市面上的主流语音交互产品,都需要通过“唤醒词+语音指令”的方式进行交互。而语音售票机能够自动检测乘客走近的行为,主动发起交互,无需用户唤醒。
根据新智元此前的了解,进入2017年以来,各大语音公司都在研发人机交互免唤醒词的技术,这一技术将会很快大范围普及。
除此之外,阿里巴巴还将为上海地铁提供人脸识别闸机,无需刷卡就能进站、智能人流监控解决方案。
抢地铁:微信杀手锏“小程序”,推地铁乘车码
大家都去抢地铁,但是技术着眼点却不太一样。
而在阿里云展示语音购票、刷脸支付之前,腾讯也在广州开始了对地铁这一重要出行场景入口的抢夺。11月16日,腾讯公司与广州地铁团签约,正式展开智慧交通领域的深度合作,全国首个地铁乘车码在广州正式上线试运行,乘客只需通过微信小程序中的“广州地铁乘车码”,将二维码靠近地铁站的闪客峰云闸机(橙色闸机),即可扫码入闸乘坐广州地铁。
可以看到,依托于微信的小程序成为腾讯的一大利器。最新数据显示,微信的用户数量已经接近10亿。马化腾也多次出现在了“乘车码”的推广活动中。
最近引起热议的首辆智能驾驶公交车“阿尔法巴”也支持使用腾讯乘车码。此外,12月1日,全国首个长江索道乘车码在重庆正式启用。截至目前,腾讯乘车码已在广州、青岛、济南、合肥、佛山、常德、汕尾、淄博、莱芜、驻马店、呼和浩特等多个内地城市上线。
除了腾讯乘车码在公交、地铁、长江索道等场景的纵深发展,在香港,腾讯也有大动作。11月23日,腾讯与香港香港铁路有限公司正式签约,在微信支付和WeChat Pay HK在港铁的移动支付业务展开合作。此举将为内地与香港用户提供微信支付购票体验,解决用户乘坐地铁时需要兑换货币、找不到零钱等痛点。
场景争夺背后的支付战争升级与智慧交通落地
早在一个月前,上海地铁推出手机端APP“Metro大都会”,开始试点扫码进站。乘客只需要在“Metro大都会”APP中一键绑定支付宝,就可以扫乘车码进站,出站时再扣除车费,无需兑换零钱和排队购票。而此番,阿里提供的语音购票和人脸识别支付&进展,更是将地铁智能化的程度明显提高。
对公共交通场景的争夺,为人工智能技术的落地找到了用武之地,其背后,更是一场燃烧了多年的战役的升级——微信与支付宝在支付入口的争夺。
根据Analysys易观发布的《中国第三方支付移动支付市场季度监测报告2017年第2季度》数据显示,2017年第二季度,中国第三方支付移动支付市场交易规模达230408.2亿元人民币,环比增长22.50%。支付宝以53.70%的市场份额占得头筹,腾讯金融易39.12%的市场交易份额占比名列第二。总体上看,支付宝和腾讯金融二者的市场份额达到了92.82%,仍然占据绝对主导的地位。
上个月,马化腾在长江商学院演讲时表示“补贴烧钱大战推动了移动支付的普及,这是意想不到的一个收获”。腾讯为了与支付宝在移动支付上一争高下,斥资数十亿开展补贴大战,现已覆盖出行、餐饮等多个场景。根据腾讯Q3财报,腾讯移动支付交易规模保持快速增长,当季线下支付月交易次数同比大幅增加了280%。
从马化腾花如此多的精力,可以看到乘车码是腾讯抢占公共交通支付、布局智慧交通支付的重要一步,补贴也是必不可少:9月19日至24日,在广州通过羊城通乘车码扫码乘坐公交就可享6折优惠,活动覆盖广州BRT快速公交的26个站点和南沙区全线路近600台公交车。
阿里方面,阿里云“城市大脑”入选首批国家新一代人工智能开放创新平台名单。智慧交通成为其中的一大重点。目前“城市大脑”已经成功落地杭州、苏州等地,并在2017杭州云栖大会上交出了一份漂亮答卷:经过一年测试,城市大脑成功接管了杭州128个信号灯路口,试点区域通行时间减少15.3%,高架道路出行时间平均节省4.6分钟。
回到地铁,目前,广州的地铁人脸识别闸机项目已经被一家名为“佳都科技”的公司拿下。佳都科技为广州地铁研发的人脸识别闸机目前已在测试阶段 ,今后人脸识别闸机推行,乘客只需将个人照片和羊城通、银行卡等实名制绑定,就能刷脸进闸乘车。
资料显示,佳都科技是具有中科院背景的人脸识别公司云从科技的主要投资方。
拆解阿里巴巴人工智能核心团队iDST最新研究成果:“多模态智能语音交互解决方案”
此前扫码购票或者进站的技术更加依赖手机硬件设备,要支持具备NFC功能的手机才能适用。NFC由非接触式射频识别(RFID)及互联互通技术整合演变而来,在单一芯片上结合感应式读卡器、感应式卡片和点对点的功能,能在短距离内与兼容设备进行识别和数据交换。接触通过(进站)和接触支付(购票)正是NFC最主要的应用之二。不过,实践发现,NFC对于大部分用户来说门槛太高,摆脱对硬件的依赖变得十分迫切。
上海地铁语音售票机完全由阿里巴巴人工智能核心团队iDST自主研发,所运用的“下一代人机交互”技术正是阿里巴巴达摩院首批公布的重点研究方向之一。
上海地铁语音售票机使用了阿里巴巴iDST的最新研究成果,即“多模态智能语音交互解决方案”。这套多模态智能语音交互解决方案是由数个子系统组成:
1、大麦克风阵列子系统:在硬件上通过数个麦克风组成大阵列,在软件上通过语音信号处理实现高精度声源定位和语音增强;
2、计算机视觉子系统:通过光学摄像头,实现人脸,特别是眼睛、嘴唇等的检测、跟踪和动态分析;
3、多模态融合子系统:通过语音+视觉融合,实现对目标用户的精确定位及语音提取;
4、远场语音识别、语义理解、对话及语音合成子系统:将目标用户经提取、增强后的语音进行识别、理解,产生对话结果,并通过语音合成将机器的反馈输出给用户。
这套解决方案亮点在于免唤醒主动语音交互:目前市场上主流远场语音交互产品,都需要通过“唤醒词+语音指令”的方式进行交互。上海地铁语音售票机通过“语音+视觉”多模态融合技术,能够自动检测乘客走近售票机的行为,主动发起交互。
此外,售票机还有一个支持复杂口语理解并自我进化的对话系统:用户面对机器表达时往往存在语气词、犹豫、停顿、重复等口语化表达,繁琐的多轮询问确认式对话也使得主流的人机交互略显呆板。上海地铁语音售票机能够理解这些口语化表达,并不断从乘客真实对话模式中进行自我进化,变得越来越智能。
根据阿里iDST的介绍,多模态智能语音交互解决方案的主要负责人包括最新加入的声学及信号处理领域大牛冯津伟、原亚马逊级别最高的华人科学家任小枫、阿里巴巴 iDST 智能语音交互团队总监鄢志杰 。