快消品图像识别丨无人店背后的商品识别技术

古驿道

2017-11-06

人工智能一浪接一浪地席卷全球，AI的其中一个重要分支——计算机视觉，也如雨后春笋，不断涌现出新的想法和应用。人脸识别已经逐渐渗透我们的日常生活，机器能够认准人脸，想必大家都有所耳闻;而另一类计算机视觉的应用，是进行商品识别。

当前新兴的一些无人零售店，背后就需要机器对商品进行自动识别，拍图购物、AR互动营销等场景，也运用了商品识别技术。人工智能商业公司ImageDT，则利用商品图像识别技术提供2B商业服务，包括基于互联网图片大数据的商业分析，以及基于门店货架识别的渠道数据洞察，帮助消费品企业提升业绩。今天，图酱就跟大家科普应用在无人店、新零售中的商品识别技术。

数据逻辑

1. 让小孩“记住”超市里的所有商品

我们教一个小孩识物的时候，比如“苹果”，首先要让他反复的看到 “苹果”，他便能认识“苹果”;他可能会认错，把“梨”认成“苹果”，这个时候应该帮他指出来。小孩看到的“苹果”越多，辨识的能力就越强。

快消品图像识别丨无人店背后的商品识别技术

基于深度神经网络的人工智能，让机器具备理解的能力，基本过程就像教一个小孩认苹果一样。首先要有大量的数据，比如“苹果”的图片;同时，要增加大量机器会认错的“负样本”，比如“梨”的图片;然后经过一个深度神经网络，反复学习，最终获得一个有效的识别模型。对于快消商品的识别，我们不仅要认出一个瓶子包装，还要认出是一瓶酸奶还是啤酒;不仅要认出酸奶，还要认出是哪个品牌的酸奶，甚至是哪个口味和规格。要让机器能够准确识别成千上万的快消商品SKU，是一项极其庞大而复杂的AI工程。

数据采集

2. 让机器获得学习的原始素材

首先，我们需要梳理出所有的目标商品清单，并设法获得每一件商品的图片数据。根据商品的特征辨识度，通常需要几十到几百张的有效图片。数据采集是一套组合拳。电商平台上拥有结构化的商品介绍图片以及大量的买家晒图，社交平台上也能获取到大量的消费者晒图，是性价比最高的数据源。超市店内的真实货架数据，是最可靠的数据源，但获取和后期处理的成本都比较高。除此之外，ImageDT还通过自主研发智能灯箱和智能采集车，模拟各种不同的场景对商品进行360°拍摄从而建立庞大的训练数据库，以此来获取最丰富的训练数据。

快消品图像识别丨无人店背后的商品识别技术

数据标注

3. 有多少人工，才有多少智能采集到原始图片数据，通常会混杂许多“脏数据”，需要进行清洗;大部分情况下，还需要对图片中的物体进行标注和分类。只有可靠的数据才能产生高质量的识别模型。在每一个人工智能公司，都有一支特殊的军队——数据标注团队。ImageDT也不例外，在背后支撑这个团队的是一个充满黑科技的标注系统。

快消品图像识别丨无人店背后的商品识别技术

比如，图片在标注前通常会先经过弱模型的处理，让机器先解决 50%的问题;系统有支持批量标注的小图模式，让标注员可以一目十行，成倍提高标注的速度;产品经理反复打磨每一个功能，做A/B测试，从每处细节提高标注的体验和效率。除此之外，标注团队还为不同任务配置了不同等级的质量保证机制，包括抽样审核、全量审核、交叉校验、埋点校验等，确保让机器学习最准确最可靠的训练数据。

模型训练

4. “活到老学到老”，机器也要不断学习

准备好了数据，下一步就是让机器进行学习，建立识别模型的过程。同样的数据，选择不同的神经网络算法、以及不同的参数设置，将会影响最终模型的效果。模型建立之后，还需要进行管理：模型之间存在层次关系，数据和模型会存在版本的迭代，这些问题，当遇到大量商品类别的时候，显得非常艰难。在ImageDT内部，有一个自助式的深度学习平台，支持拖拉拽的算法和参数测试，甚至一个非程序员都可以傻瓜式的完成一次建模任务，并获得模型的效果评估报告。每一位ImageDT的新员工，不管是工程师，还是前台，都会接受一次半小时的建模培训;而在培训结束后，每个人都将能够独立的建立一个图像识别模型，整个过程只需要半小时。

快消品图像识别丨无人店背后的商品识别技术

同时，深度学习平台就像一个模型仓库，兼顾着对象、数据和模型的管理。整个建模的过程已经标准化，最快只需要一天，就能完成从数据采集、标注、建模到上线的整个流程。ImageDT的研发团队分为四个组，产品组、建模组、数据组和研究组。前三个组，负责实现流水线的搭建和经营，使得每天都能井井有条地建立大量新的商品识别模型，并快速上线，对每天数千万的图片数据进行识别和分析。研究组，则要克服各种疑难杂症，比如容易产生褶皱的软包装、商品侧面和背面的识别、遮挡和反光环境下的识别等等。

快消品图像识别丨无人店背后的商品识别技术

图像识别人工智能计算机视觉苹果快消品 text-align

安科网

快消品图像识别丨无人店背后的商品识别技术

古驿道

古驿道

相关推荐

人脸识别技术发展现状及未来发展趋势

NLP/CV模型跨界，视觉Transformer赶超CNN?

可以提高你的图像识别模型准确率的7个技巧

指纹和脸，真的能代表生物识别吗？

人脸识别门禁系统启用后，轻松过闸之时也要留意潜在风险

人脸识别，要方便更要安全

人工智能如何应用于数据中心的物理安全

这款人像生成AI，可以让简笔草图“一秒”生成真实人脸

人脸值多少钱？人脸识别灰色产业链

PC人脸识别登录，出乎意料的简单

PC人脸识别登录，出乎意料的简单

从“人脸”到“狗脸”，AI也要去宠物经济分杯羹？

微软旷视人脸识别100%失灵!照片「隐身衣」,帮你保护照片隐私数据

超强干货！一文看懂人脸识别在 App 应用中的隐私安全问题

证件阅读器API接口SDK二次开发APP应用

证件阅读器API接口SDK二次开发APP应用

基于opencv的人脸采集、训练及识别应用

Android 图片文字识别DEMO（基于百度OCR）

IBM 全面停止 AI 人脸识别相关技术业务

Python怎么识别文字？正确的方法详解

古驿道