Google发布新Tensorflow物体识别API

qinmiaofu

2017-08-31

关注关注

大数据文摘作品，转载具体要求见文末

作者 | Priya Dwivedi

编译 | Lisa，Saint，Aileen

做图像识别有很多不同的途径。谷歌最近发布了一个使用Tensorflow的物体识别API，让计算机视觉在各方面都更进了一步。

这篇文章将带你测试这个新的API，并且把它应用在youtube上（可以在GitHub上获取用到的全部代码

https://github.com/priya-dwivedi/Deep-Learning/blob/master/Object_Detection_Tensorflow_API.ipynb），结果如下：

Google发布新Tensorflow物体识别API

API概述

这个API是用COCO（文本中的常见物体）数据集（http://mscoco.org/）训练出来的。这是一个大约有30万张图像、90种最常见物体的数据集。物体的样本包括：

Google发布新Tensorflow物体识别API

COCO数据集的一些物体种类

这个API提供了5种不同的模型，使用者可以通过设置不同检测边界范围来平衡运行速度和准确率。

Google发布新Tensorflow物体识别API

上图中的mAP（平均精度）是检测边界框的准确率和回召率的乘积。这是一个很好的混合测度，在评价模型对目标物体的敏锐度和它是否能很好的避免虚假目标中非常好用。mAP值越高，模型的准确度越高，但运行速度会相应下降。

（想要了解更多跟模型有关的知识https://github.com/tensorflow/models/blob/477ed41e7e4e8a8443bc633846eb01e2182dc68a/object_detection/g3doc/detection_model_zoo.md）

实测时间

我决定使用最轻量级的模型（ssd_mobilenet）。主要步骤如下：

1. 下载一个打包模型(.pb-protobuf)并把它载入缓存

2. 使用内置的辅助代码来载入标签，类别，可视化工具等等。

3. 建立一个新的会话，在图片上运行模型。

总体来说步骤非常简单。而且这个API文档还提供了一些能运行这些主要步骤的Jupyter文档——

https://github.com/tensorflow/models/blob/master/object_detection/object_detection_tutorial.ipynb

这个模型在实例图像上表现得相当出色（如下图）：

Google发布新Tensorflow物体识别API

更进一步——在视频上运行上

接下来我打算在视频上尝试这个API。我使用了Python moviepy库，主要步骤如下：

首先，使用VideoFileClip函数从视频中提取图像；
然后使用fl_image函数在视频中提取图像，并在上面应用物体识别API。fl_image是一个很有用的函数，可以提取图像并把它替换为修改后的图像。通过这个函数就可以实现在每个视频上提取图像并应用物体识别；
最后，把所有处理过的图像片段合并成一个新视频。

对于3-4秒的片段，这个程序需要花费大概1分钟的时间来运行。但鉴于我们使用的是一个载入缓存的模型，而且没有使用GPU，我们实现的效果还是很惊艳的！很难相信只用这么一点代码，就可以以很高的准确率检测并且在很多常见物体上画出边界框。

当然，我们还是能看到有一些表现有待提升。比如下面的例子。这个视频里的鸟完全没有被检测出来。

Google发布新Tensorflow物体识别API

再进一步，继续探索

几个进一步探索这个API的想法：

尝试一些准确率更高但成本也更高的模型，看看他们有什么不同；
寻找加速这个API的方法，这样它就可以被用于车载装置上进行实时物体检测；
谷歌也提供了一些技能来应用这些模型进行传递学习。例如，载入打包模型后添加一个带有不同图像类别的输出层。

参考文献：

Google Tensorflow Object Detection Github

COCO dataset

原文链接：https://medium.com/towards-data-science/is-google-tensorflow-object-detection-api-the-easiest-way-to-implement-image-recognition-a8bd1f500ea0

tensorflow api

安科网

Google发布新Tensorflow物体识别API

qinmiaofu

qinmiaofu

相关推荐

如何在浏览器中使用TensorFlow？

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

如何在PyTorch和TensorFlow中训练图像分类模型

对比PyTorch和TensorFlow的自动差异和动态模型

现在知道还不算晚，输入示例自动生成代码，谷歌开源这项神器要火

TensorFlow推出新接口，简化 ML移动端开发流程

2020年深度学习框架对比速读

输入示例，自动生成代码：TensorFlow官方工具TF-Coder已开源

TensorFlow Lattice：灵活、可控、可解释的机器学习

TensorFlow 2入门指南，初学者必备！

使用tensorflow进行音乐类型的分类

【tensorflow】常量和变量的定义

如何在tensorflow中判断tensor(张量)的值

TensorFlow会话常用的两种方式

Ｍnist手写数字识别 Tensorflow

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

TensorFlow中超大的30个机器学习数据集

解决import tensorflow报错：ImportError: DLL load failed: 找不到指定的模块

Yolo v3 Introduction to object detection with TensorFlow 2

Sklearn 与 TensorFlow 机器学习实用指南第二版

qinmiaofu