自拍测运势?这都是人脸识别技术的功劳
新年伊始,算鸡年运势是很多年轻人茶余饭后热衷做的事情。虽然“算运势”这种行为可能更多只是一种休闲,但也能给人们带来信心或是提出警示,从心理暗示上真正“改变运势”。
有意思的是,今年春节百度图像搜索推出了一款“自拍测运势”神器,打开手机百度,对准摄像头进行自拍或上传照片,图像搜索就会给出新年运势,引得不少网友上传照片去测自己的运势。这个新功能看起来挺可笑的,因为不少人笑称,手机居然也可以算命了?其实这一点也不可笑,因为“自拍测运势”用上了图像识别的黑科技,而这一黑科技背后全靠真功夫。
“测运势”背后到底有什么黑科技
“自拍测运势”神器主要是利用百度图像搜索功能,依托于百度图像识别技术,根据人脸识别技术,对眉毛、眼睛、嘴唇、脸型等四个关键检测点评价打分。综合面部特征,结合中国传统相面研究,为用户提供新年运势分析。
坦率来说,“测运势”这个功能并无太多科学依据,但却是真正的“黑科技”。因为人们的面部信息非常丰富,且每个人都截然不同,如脸型、眉毛、眼睛、鼻子等轮廓信息称之为关键点。
百度人脸识别技术主要还是把每个人的脸部图像进行多轮处理,如轮廓定位态校正、全局粗定位、局部精细定位,跟踪人脸72个关键点的特征,最后组合成一个面部表情网,来识别每个人的表情和相貌特征,以此再推断出所谓的“运势”,在春节娱乐大众,给大家带来一些欢乐。
除了“测运势”以外,前不久搭载百度大脑的小度机器人还在《最强大脑》舞台上战胜了从未失算的“水哥”王昱珩,而比拼的内容就是人脸识别。当时王昱珩在节目录制的前,主动要求把视频明暗度调低20%,让挑战难度增加了好几倍,希望以此战胜小度机器人。
王昱珩谈到,对于增加难度,他想的是,是不是越暗,电脑的噪点就越多?如果把亮度降下来的话,(电脑在处理的时候)可能就回不来(亮度)。不过图像识别的精准度远比人要高。机器识别主要也是靠图像轮廓,并不畏惧亮度下降。
图像识别看似简单实则难度极大
我们在看到测运势的时候或是小度战胜水哥的时候,大多只是几秒钟之间发生的。前面所讲的跟踪人脸72个关键点的特征似乎也只是一瞬间的事情。
不过,识别面孔看似简单,实则很难。人类脸部存在相似性,不同个体之间的区别不大,所有的人脸的结构都相似,甚至人脸器官的结构外形都很相似。这样的特点对于利用人脸进行定位是有利的,但是对于利用人脸区分人类个体是不利的。
其次是个人人脸存在易变性,人脸的外形很不稳定,人可以通过脸部的变化产生很多表情,而在不同观察角度,人脸的视觉图像也相差很大,另外,人脸识别还受光照条件(例如白天和夜晚,室内和室外等)、人脸的很多遮盖物(例如口罩、墨镜、头发、胡须等)、年龄等多方面因素的影响。
也正是如此,图像识别的考验算法以及数据量的丰富程度。国外有一个图像数据库叫LabelMe。上图是其中一张图像,标得非常细,房屋的外形、轮廓、窗户、汽车、所有草地、马路都标得很清楚。这个图库中大概有十万图片,而真正标记清晰的图像大概是一万张。这些图片都是人工一点点输入的。
就拿这次最强大脑节目中,小度机器人和水哥王昱珩之间比赛来看。小度的算法还要面临各种环境光源的考验,甚至还要面临人脸姿态和饰物的考验,以及摄像机的图像问题,乃至动态监测中丢帧的影响。机器人在识别人脸时必须经过人脸检测、人脸预处理、人脸图像特征提取、人脸图像匹配与识别等一系列的过程。
这些难点其实都考验着机器视觉的准确率。不过,随着百度在这一领域的研究深入,图像识别技术将越来越精准。
人脸识别究竟可以有哪些实际运用
测运势、搞综艺节目当然和我们的生活还是存在一定的距离。那么图像搜索在生活之中究竟又哪些实际运用呢?这可能才是真正会影响到我们的问题。
图像搜索、人脸识别等技术真正可以运用的领域有很多,比如这四大块。
1、可以提供拍图翻译、拍题找答案、查药品,以及识别美食检索做法等一系列服务,解决人们生活中很多文字“不可描述”,图像才能描述的问题。我们出门在外,如果看到自己喜欢的商品,可以打开购物APP,识别后直接购买就好。像手机百度在识别红烧肉的图片时,就会直接给出制造方法。
2、由于图像识别技术远比人要可靠,也被运用在互联网金融的授信之中,能够缩短中间环节,反而还提高授信安全度,甚至是实现刷脸支付。百度金融其实已经把人脸识别运用在金融授信中。这种方式可以实现秒批,防止身份冒用的情况。让金融安全得到极大提升。