专访|中国95后流行色是什么?人工智能给出的答案是它
机器之心原创
作者:老红、高静宜
中国 95 后的流行色是什么?人工智能说是 RGB 值为 22/20/24 的「黑色」。
纽约时间 2 月 13 日,QQ 空间、腾讯优图、唯品会亮相纽约时尚周,联手举办业界首个「AI+时尚」秀。三方还联合发布了《AI+时尚:中国 95 后流行色报告》,报告指出中国 95 后年轻人最喜欢的颜色是 RGB 值为 22/20/24 的「黑色」,并被命名为「95度黑」。
中国 95 后的服装颜色排行
得出上面的结果并非易事。据了解,腾讯优图借助了人工智能人脸识别与图像处理技术,分析 2016 年 QQ 空间相册千亿张公开的照片,结合唯品会 95 后服装销售大数据,最终发现「95 度黑」等上图中展示的中国 95 后流行色彩及时尚品味。
虽然实现的技术过程可用上面的语句概述,但中间有着不少技术难点。机器之心对腾讯优图团队进行了专访,腾讯集团副总裁、优图实验室负责人梁柱,腾讯优图实验室总监黄飞跃博士分别为我们进行了解答。
机器之心:可否讲解一下找到 95 后流行色的技术过程和难点?
腾讯优图:基于机器学习的人脸识别和图像处理技术,一直以来都是未来技术发展热点,其应用范围、落地场景非常广泛。
借助 QQ 空间相册的海量图像大数据及用户需求反馈,腾讯优图的 AI 图像识别技术已经发展得十分成熟,并在不同场景下进行广泛应用。此次与唯品会、张驰合作,是 AI 图像识别技术在时尚领域的一次应用探索。在大数据的基础上,我们通过精准识别用户年龄、锁定用户,并对其服装颜色进行精确分析,帮助设计师更好地捕捉用户喜好,找到灵感,从而去创作新的时尚风潮。找到 95 后流行色需要跨越两大技术难点:
一、人脸深度学习,智能识别年龄。首先,精确分析不同年龄的流行色,需要对参与统计的人脸照片进行年龄识别。从 AI 的技术角度出发,首先要给计算机非常多不同年龄的人脸照片数据,然后通过人脸检测、人脸五官点定位、人脸归一化处理,再送到一个深度学习网络中训练获得模型,从而对照片人物进行年龄识别。在本次统计中,腾讯优图将误差控制在正负 3 岁内,保证数据统计的准确性。
二、人衣分割算法,智能识别颜色。对于流行色研究,最重要的就是对用户的衣服进行颜色分析,然后进行色系统计。空间里面用户上传的完全公开照片大多数是生活照,因此背景和颜色非常复杂,这是一大技术难点。为了实现准确的颜色获取,腾讯优图借助多项人工智能算法,包括人体检测、衣服分割,将人体和衣服从背景中分割出来。衣服分割的精度直接影响颜色统计的结果,目前腾讯优图的算法可以做到95%的像素分割精度,也就是说,背景区域被认为是衣服区域的比例,只占整个衣服区域的5%。精确分割之后,会针对衣服区域做颜色校正和主颜色分析,提取最显著的RGB颜色值作为衣服的主颜色。对这些提取的颜色值进行直方图统计,结合人脸年龄分析的结果,得到不同年龄分组的流行色分析结果。
机器之心:95 后的限定涉及到一个年龄的判断,是否采用了新的算法?限定年龄段的人脸识别,其中最难的地方在哪里?
腾讯优图:年龄识别是一个比较典型的问题,关键在于准确率如何。腾讯优图积累了比较多数据,也有很好的算法和模型,能做到平均 3-5 岁的误差,这在行业是比较领先的。在较高的准确性上,我们的努力方向是最大化技术应用场景。
机器之心:人脸识别的核心问题之一是人脸图像像素之间高层语义的对齐,即人脸关键特征点的定位,错误的特征定位会导致提取的人脸描述特征严重变形,进而导致识别性能下降,腾讯优图是如何解决这个问题的?
腾讯优图:这个判断的核心还是在于识别的正确率,在特征定位上我们能做到 1 个像素误差左右,属于业界领先水平。另外在这次的流行色分析中,严重变形的人脸作为特例(一般也很少见)会被筛除,保证分析的准确性。
机器之心:面部识别是从像素层级抽取特征,那么面对最近流行的美颜(对图像进行高斯模糊)其模糊了人物线条会导致丢失部分信息而影响识别率,腾讯优图又是如何解决这个问题的呢?
腾讯优图:优图基于海量数据学习经验,搭建了一个优秀的模型,即使人脸模糊或有美颜 PS 效果,识别仍能做到很高的准确率,保持年龄误差在 3-5 岁,在业界是比较领先的。
比如在身份证自拍照对比的人脸识别应用中,有的身份证人脸比较模糊,或者需要用一个人 10 年前的照片去辨识他现在的样子,这些模糊条件都对人脸识别提出了更高要求,我们优秀的模型和机器学习的鲁棒性兼容性,能发挥出更好的作用来兼容这些问题。
但是不排除会有过度美颜或严重 PS 的特例情况,在这次流行色的分析里,我们会筛除这些特例,保证分析结果的准确性。当然如果在技术应用案例中出现这些案例,深度学习本身也有很高的鲁棒性和兼容性能够部分处理。
机器之心:能否介绍一下数据量,包括分析用的照片库以及训练用的大规模人脸年龄数据库?
腾讯优图:这是利用千亿公开照片库做的分析,覆盖了所有年龄段和全国地域,是一个全面而完整的精确分析。训练利用了数百万人脸数据库,从 10 岁到 70 岁间,每个年龄段都有数据,同时保证数据的均衡分布。
机器之心:流行色是一个已有的概念,每年权威色彩机构 Pantone 都会发布下一年的流行色,今年的是草木绿,是为来年的流行趋势做一个指示引导的作用。这个项目是根据 95 后目前已有的穿着打扮进行分析,就是对已经存在的趋势进行分析,这个结论除了为设计师迎合市场需求还有什么作用?有没有更深远点的意义?之后这个项目算法还能怎么拓展用到什么领域?
腾讯优图:此次合作,是电商、黑科技与时尚的一次跨界创新应用,让销售大数据、人工智能跟时尚流行产生碰撞,让数据与艺术产生连接,也为时尚领域的创作提供更多的灵感和可能性。
AI+大数据的未来,具有很大的想象空间。在这次时尚跨界合作中,图片内容的智能识别很关键。借助 AI 技术,我们不仅可以很快速地获得结论,还大大提高了分析人群的覆盖范围和精准度。以往的定性调查,只能在有限样本内进行分析和判断,而运用 AI 分析,则让覆盖全国所有地域、所有年龄段的分析有了可能,是以往无法想象的全面性定量分析。
机器之心:您认为今年在人脸识别领域的热门研究方向是什么?腾讯优图对此会有哪些研发计划?
腾讯优图:人脸识别技术在理论研究上(较为理想的情况中)已比较成熟甚至取得了超越人眼的技术水平。现阶段的难点,反而是在多变的实际应用环境里,如何通过技术定制和优化,发挥出技术最大的作用。
比如在与公安合作的安防场景人脸识别中,要在百万人脸中识别罪犯,人脸数据并不是设定好的通用情况,会有很多变化,这时就需要从采集特定数据训练调优,发挥工程的丰富经验进行优化,满足应用需求。
此外,也要从真实的产品需求出发,给出更好的技术建议。如员工刷脸的公司门禁,单靠人脸识别其实并不能达到最佳安防效果,也可以结合其他特征的识别,比如是否佩戴门卡等等,也许可以能更有效地满足企业的真实需要。
优图现在为腾讯超过五十个业务提供相关技术支持,并在财付通、微众银行、QQ 空间、QQ 音乐、天天 P 图等明星产品中成功落地。2016 年,优图推出了开放平台,并和腾讯云密切合作提供领先的 AI 技术。
腾讯优图开放平台
经过近几年的发展,优图在人工智能多个领域均积累了领先的技术实力和完整的解决方案,主要包括人脸技术、深度学习与图像理解、音频语音分析、智能图像处理等。
人脸识别是优图的优势项目,以海量数据和优质模型排名国内前列,并将借助腾讯云进行更大规模的落地运营。在优势项目之上,我们还希望发展的目标包括:
1) 覆盖 1:1 的人脸验证到 1:N 的人脸检索
在 1:1 验证中,要证明「我是我」。如没带身份证要核对公民身份,优图能做到通过 88 个采样点精准面部识别细微特征,再用独创的基于随机验证码的唇语活体检测技术,大大提高识别安全性。比如「微众银行」基于人脸识别的开户系统流程,以及和公安部门合作的互联网+警务建设中,在身份证二次申领、居住证、出国签证等远程办理时,市民仅需用手机简单核对身份,公安机关就能快速审核
而在 1:N 检索中,要解决的问题是「这么多人,哪个才是我」。比如考勤打卡、会议签到,要做到杜绝伪造签到。目前该项技术在腾讯众多自主品牌产品中落地应用,如腾讯深圳滨海新办公大楼的人脸识别门禁、「腾讯云」的万象优图中即将上线的人脸检索等等,都有丰富的应用场景。
2) 图像识别:从 OCR、名片和快递单的识别,到色情图片等更复杂图像的识别
图片鉴黄是优图实验室「明星技术」之一。它打破了传统鉴黄方式限制,日处理达十亿量级,精度 99.99% 以上,为微信、QQ 空间、腾讯云万象鉴黄等多款产品提供了便利。基于 DeepEye 主动色情识别引擎技术,通过视频截图,图像识别,语音技审,弹幕监控,关键字抽取等能力智能识别色情内容,提高鉴黄准确率和实时性。
3)音频相关算法研发:包括用机器学习算法更好支持 QQ 音乐,如哼唱识别和音乐检索;基于深度学习的更自然的语音合成系统等等