深度学习和OpenCV的对象检测(MobileNet SSD图像识别)

南七忆梦

2019-08-26

关注关注

基于深度学习的对象检测时，我们主要分享以下三种主要的对象检测方法：

Faster R-CNN(后期会来学习分享)
你只看一次（YOLO，最新版本YOLO3,后期我们会分享）
单发探测器（SSD，本节介绍，若你的电脑配置比较低，此方法比较适合）

深度学习和OpenCV的对象检测(MobileNet SSD图像识别)

R-CNN是使用深度学习进行物体检测的训练模型; 然而，这种技术很难理解,难以实施，并且难以训练。

如果我们只追求速度，那么我们倾向于使用YOLO，因为这个算法要快得多，但是识别物体位置精准性差，召回率低

R-CNN 与YOLO各有自己的优缺点，由谷歌开发的SSD是两者之间的平衡。

MobileNets：高效（深层）神经网络

在构建对象检测网络时，通常使用现有的网络架构，例如VGG或ResNet，然后在对象检测管道中使用它。问题是这些网络架构可能非常大，大约为200-500MB。

相反，我们可以使用MobileNets，Google在2017年提出的适用于手机端的神经网络模型。我们将这些网络称为“MobileNets”，因为它们专为资源受限的设备而设计。MobileNets与传统CNN的区别，主要使用了深度可分离卷积Depthwise Separable Convolution 将卷积核进行分解计算来减少计算量

引入了两个超参数减少参数量和计算量

宽度乘数（Width Multiplier）: [减少输入和输出的 channels ]

分辨率乘数（Resolution Multiplier）：[减少输入输出的 feature maps 的大小]

可以将一个标准卷积核分成一个深度卷积depthwise convolution 和一个1X1的卷积（叫作逐点卷积pointwise convolution）。如下图所示

深度学习和OpenCV的对象检测(MobileNet SSD图像识别)

( 左）具有批量标准化和ReLU的标准卷积层。（右）深度可分的卷积与深度和点的层，批量标准化和ReLU

结合MobileNets和Single Shot Detectors，实现快速，高效的基于深度学习的物体检测

mobilenet_ssd caffe模型可视化地址：http://ethereon.github.io/netscope/#/gist/5b1ffa5d22f6ac1f25f30fbd24a716be

深度学习和OpenCV的对象检测(MobileNet SSD图像识别)

conv13是骨干网络的最后一层，作者仿照VGG-SSD的结构，在Mobilenet的conv13后面添加了8个卷积层，然后总共抽取6层用作检测，貌似没有使用分辨率为38*38的层，可能是位置太靠前了吧。

提取默认框的6层为conv11, conv13, conv14_2, conv15_2, conv16_2, conv17_2,该6层feature map 每个cell产生的默认框个数分别为3，6，6，6，6，6。也就是说在那6层的后边接的用于坐标回归的3*3的卷积核（层名为conv11_mbox_loc……）的输出个数（num output）分别为12，24，24，24，24，24，24。

那6层后边接的用于类别得分的3*3卷积核（层名为conv11_mbox_conf……）的输出个数为3*21（类别为21类，3个默认框） = 63，126， 126， 126， 126， 126。

如果我们将MobileNet架构和SSD CAFFE框架结合起来，我们就可以实现快速，高效的基于深度学习的对象检测方法。

MobileNet SSD模型数据： COCO dataset

在图像中检测到20个对象（背景类为+1），包括飞机，自行车，鸟类，船，瓶，公共汽车，汽车，猫，椅子，奶牛，餐桌，狗，马，摩托车，人，盆栽植物，绵羊，沙发，火车和电视监视器。

使用OpenCV进行基于深度学习的对象检测

caffe prototxt 与caffemodel模型已经共享百度网盘：

回复：MobileNet SSD

即可领取

在本节中，我们将使用 OpenCV中的MobileNet SSD +深度神经网络（ dnn）模块来构建我们的对象检测器

深度学习和OpenCV的对象检测(MobileNet SSD图像识别)

待我们的神经网络检测完成后，我们遍历检测模型，得到检测对象的尺寸box与label

深度学习和OpenCV的对象检测(MobileNet SSD图像识别)

使用训练好的模型，我们简单的使用便可以实现对象检测，一共代码20多行，再次感谢Google团队对MobileNet SSD模型的研究以及训练（如何训练自己的模型，我们后期分享）

微&信搜索：启示AI科技

可以体验不同的AI工具

深度学习和OpenCV的对象检测(MobileNet SSD图像识别)

图像识别机器学习深度学习 opencv 卷积

安科网

深度学习和OpenCV的对象检测(MobileNet SSD图像识别)

南七忆梦

MobileNets：高效（深层）神经网络

结合MobileNets和Single Shot Detectors，实现快速，高效的基于深度学习的物体检测

使用OpenCV进行基于深度学习的对象检测

南七忆梦

相关推荐

基于opencv的人脸采集、训练及识别应用

opencv 人脸识别

用Python20行代码实现人脸识别

NLP/CV模型跨界，视觉Transformer赶超CNN?

人脸识别技术发展现状及未来发展趋势

指纹和脸，真的能代表生物识别吗？

人脸识别门禁系统启用后，轻松过闸之时也要留意潜在风险

人脸识别，要方便更要安全

人工智能如何应用于数据中心的物理安全

这款人像生成AI，可以让简笔草图“一秒”生成真实人脸

可以提高你的图像识别模型准确率的7个技巧

人脸值多少钱？人脸识别灰色产业链

PC人脸识别登录，出乎意料的简单

PC人脸识别登录，出乎意料的简单

从“人脸”到“狗脸”，AI也要去宠物经济分杯羹？

微软旷视人脸识别100%失灵!照片「隐身衣」,帮你保护照片隐私数据

超强干货！一文看懂人脸识别在 App 应用中的隐私安全问题

证件阅读器API接口SDK二次开发APP应用

证件阅读器API接口SDK二次开发APP应用

Android 图片文字识别DEMO（基于百度OCR）

南七忆梦