「人脸识别」很火,但你不知道的还有很多
从马云在 CeBIT 大会上的「刷脸」支付到最近微软推出的「how - old」,关于「面部识别」技术的讨论一直备受关注,但基于这项技术的具体应用和发展状况的市场认知却十分有限。事实上,随着机器学习和深度神经网络两个领域的迅速发展以及智能设备的普及,「面部识别」技术正在经历前所未有的发展。
早在 2009 年,一家来自美国马萨诸塞州的公司—— Affectiva 便已经开始了基于云端的面部识别和情绪识别解析服务的探索,并获得了李嘉诚的投资;而在 2010 年末,Facebook 也开始了面部识别领域的布局,并于 2012 年以 6,000 万美金的价格收购了著名面部识别公司 Face.com,其面部识别项目组「DeepFace」更是宣称正在研发的面部识别技术的准确率已经接近人类水平;一直致力于人工智能领域探索的 Google 也没有闲着,近几年接连大手笔收购了 Picassa、Pittoatt 和 Viewdle 等多家人脸识别公司;就在不久前的「Build 2015」大会上,微软也发布了可供用户免费集成图像及人脸识别功能的 Project Oxford。
同样,国内的互联网巨头和创业公司们也在不同程度上针对「面部识别」技术进行着相应的探索。阿里巴巴围绕着「安全支付」同蚂蚁金服和 「Face++」 合作研发的人脸识别技术备受关注,腾讯「优图」基于人脸识别、图像识别和深度学习的技术也逐步应用于各产品线,而百度则在吴恩达博士的率领下将「面部识别」作为百度深度学习研究室的重点研究项目。除此之外,国内还涌现了像「Face++」、「Angel Eyes」 和「一登」这样的基于「面部识别」技术的创业公司。
从「图像识别」到「人脸识别」的应用场景变更
现阶段「人脸识别」技术的进步离不开早期「图像识别」技术的发展与应用。从搜索引擎相似图片搜索到手机相机应用自动美颜,再到电商依据图像识别的相似商品搜索和二维码扫描,「图像识别」技术的应用场景覆盖了众多领域。这一方面源于各领域海量数据的积累可以达到精准匹配与优化的程度,另一方面也是因为「图像识别」技术较于「人脸识别」技术的更高可操作性。
的确,由于「人脸识别」涉及到动态识别、活体检测和微表情识别等维度,在可操作性和精准度等方面的表现暂不及「图像识别」,但它却有着「图像识别」所替代不了的技术和场景优越性。首先,它能简化认证和注册的流程。如果你现在要开一个淘宝店或者注册一个微信公众账号,你便需要手持身份证拍照以验证你的身份。这固然是出于安全和信用方面的考虑,但「人脸识别」技术却能以「人脸」为独立验证 ID 简化注册与认证的流程。相同的例子还有「一登」为一些应用提供的「刷脸」注册功能。
其次,在安全支付领域,成熟的「人脸识别」技术显然要比普通的字符、字串密码来的更加快捷和安全。当用户发生支付行为时,用「刷脸」这一简单的动作代替复杂的密码输入操作可以缩短用户支付时间;而当用户出现密码被盗的情况时,不仅可以通过独立人脸 ID 迅速找回,还能通过后台保留的用户人脸 ID 避免密码被轻易修改。
同时,在娱乐领域,「人脸识别」技术也有丰富的利用空间。之前由「落网电台」推出的情绪识别 app ——「emo」便是利用了由「一登」提供的技术进行刷脸注册和情绪识别音乐推荐;而在游戏领域,开发者也可以通过「人脸识别」技术的应用来捕获玩家的表情变化,从而优化游戏设计与关卡逻辑。
当然,关于「人脸识别」技术还有很多的想象空间,一个真实且脑洞大开的故事是波士顿警方曾在 Facebook 「人脸识别」技术的辅助下成功抓获了一名涉嫌儿童性侵案的嫌犯。
听上去很酷,但实现起来很难
的确,「人脸识别」技术有着十分广泛的应用范围和落地场景。但不可否认的是,过高的技术门槛和相关人才的缺失成为了其发展的最大短板。以国内为例,有关「人脸识别」的最核心技术和人才基本集中于 BAT 这样的科技巨头手中,而巨头们出于自身生态和战略的考虑都对相关技术进行着有限开放和相对封闭的上层领域开发;而技术能力相对较弱的中小团队只能凭借着不断的摸索从小的领域寻找突破口。此外,由于关键技术的封闭,在现实应用领域,光线、角度等因素仍对识别结果有着一定的影响,识别结果的精确度和安全性仍有很大的提高空间。
其次,目前国内的「人脸识别」也缺乏统一的技术标准。虽然国内团队在类似 LFW 的国际标准测试中的精度不断提升,基本上每家的 LFW 通过率都在 95% 以上,但真实的场景要比 LFW 的测试复杂得多,行业对「人脸识别」技术的评判缺乏一个更为细致的可靠辨识度。
与此同时,用户数据信息渠道的封闭也使得用户图像信息与其他相关信息间的关联缺乏有效连接,各公司和开发者依据自身数据积累进行研发的小闭环难以形成生态效应,这也加大了「人脸识别」技术准确度在海量数据研究基础上的提升。
同样,有关「人脸识别」所涉及的隐私问题也一直备受争议。此前,Facebook 因为未经用户允许而私自储存和使用用户的「人脸识别」数据而饱受诟病;而 Google 则因隐私政策和舆论压力而禁止 Glass App 使用「人脸识别」功能。这是涉及到用户个人信息安全的共性问题,一方面需要企业合开发者们有过硬的技术实力来保证用户数据安全,同时对用户数据在征得同意的情况下进行合理使用;另一方面也需要对相关用户市场进行针对性教育。
未来,共性合作大于个性爆发
任何行业和技术的发展都不会一蹴而就,一个健康生态的形成也绝非一朝一夕。我们不可否认「人脸识别」技术的发展前景,但也不能忽视它在发展中所存在的问题。当然,这些问题也并非哪一方就能解决的,需要整个行业各环节的共同努力。
对于「人脸识别」技术的开发团队而言,除了在技术研发方面的努力外还应拓展技术实现场景,实现有效数据积累。在用户市场,除了上述的小众娱乐领域,开发团队们还可以进行安全解锁和数据检索方向的探索;而在企业市场,企业级身份认证和基于「人脸识别」的可穿戴设备及智能家居植入也有很多的想象空间。毕竟,依托海量数据的技术研发才更具有应用的精准度和可靠性。
对于 BAT 这些生态级的巨头而言,开放战略不能仅仅纸上谈兵。相关技术与数据的开放带动的是整个生态的繁荣,之如 Google 对 Android 的开源政策,只有大的行业生态不断向前发展才能带动小生态稳定繁荣。对中小开发团队的开放与合作能够给巨头企业带来更多的想象空间,从底层小众应用到上层生态构造,让「人脸识别」技术可以形成「链条式」的打通,推动更多应用场景的产生,而不是各自闭门造车。