计算机视觉领域非常好用的5个开源图像标注工具

木瓜子

2019-10-08

本文介绍了 5 个很棒的标注工具，我希望它们能帮助你创建计算机视觉数据集。

如果你是一名计算机视觉领域的数据科学家，你可能也意识到了你需要一个快速而简单的标注工具，其原因至少是以下两个之一:

PoC（译者注：Proof of Concept）或研发实验需要创建数据集
保证你的数据质量，这样它就不会影响你的深度学习算法的性能

我深入探究了计算机视觉标注领域，发现它包含了大量令人印象深刻的工具（请看如下三个超级棒的工具清单：清单一，清单二，清单三，或者查看这个博客）。我花了相当多的时间比较最有前景的（和活跃的）项目，发现其中大部分工具都只能达到如下三个设计目标中的其中一个:

1、如果你想在标注行业展开业务，你需要：

a. 先进的项目管理功能

b. 足够多的功能，以完成任何标注任务

c. 提高效率的自动化工具

2、如果你属于一家创业公司，你可能需要：

a. API，或者至少是将标注工具连接到私有 API 的简单方法

b. 直观的用户体验（UX），使你临时聘用的每个标注人员都可以立即开始工作

3、如果你只是为自己工作，你：

a. 不用关心 API 或者项目管理

b. 只是想尽快开始标注！

下面是我最喜欢的工具列表，这些工具允许为计算机视觉应用标注包围框（用于物体检测任务）和多边形框（用于分割任务）。

如果你发现这些工具不能正常工作，请尝试在 Chrome 中运行它们。

计算机视觉标注的简要基础知识 [可选]

在计算机视觉中，训练算法的数据主要有三种类型:

图片 + 分类器训练标签（ResNets）
包围框 + 检测器标签（YOLOv3，Faster R-CNN……）
多边形 + 用于分割应用程序标签（Mask R-CNN）

计算机视觉领域非常好用的5个开源图像标注工具

注意分割数据（蓝色）与检测数据（紫色）的差异

正如你很可能已经意识到的，对于 AI 项目来说，成功的最重要的影响因素之一是你可以使用的“优质数据”的数量。我所说的计算机视觉应用的“优质数据”是指:

每个图片 / 标注都有一个恰当的标签
每个边界框或多边形都紧致地包围着要训练的物体。

即使后一种定义明显缺乏客观性，但我们希望我们的算法能够达到人类的水平。因此，我们需要“人类水平”的标注。

打标公司的最佳开源标注工具

计算机视觉标注工具（CVAT）

计算机视觉领域非常好用的5个开源图像标注工具

计算机视觉标注工具（CVAT）

在推出 OpenCV 近 20 年后，Intel 在计算机视觉领域再次发力，并发布了 CVAT，这是一个非常强大和完整的标注工具。尽管它需要一些时间来学习和掌握，但它包含了大量的功能来标注计算机视觉数据。

优点：

它很容易安装和扩展，因为它是一个运行在 Docker 中的 Web 应用程序
它包含了许多自动化工具（如使用 TensorFlow 物体检测 API 的自动标注、视频插值……）
它允许协同工作管理，这样团队中的不同成员就可以在同一个标注任务上协同工作

缺点：

UI 相当复杂。例如，对于初次设置标注任务的用户而言，这可能会非常棘手
一开始用起来不是很直观，可能需要几天的时间来掌握
只能运行于 Chrome，所以如果你担心谷歌……，你必须找到其他变通办法

点击这里查看在线演示：https://c.onepanel.io/onepanel-demo/projects/cvat-public-demo/workspaces！

创业公司的最佳开源标注工具

可视化对象标注工具（VoTT）

计算机视觉领域非常好用的5个开源图像标注工具

可视化对象标注工具（VoTT）

VoTT 是由微软开发的，它提供了非常棒的用户体验，这可能会在你标注时为你节省大量的时间和精力。而且，创建项目也很直接，所以你可以不用深入阅读其文档就能使用它。

优点：

代码写得非常好（在 React 中），并且完美地定义了接口，因此获取代码和添加所需的额外功能都很容易
正如我所说的，UX 是完美的，它有一个黑色的主题和一个跟随鼠标的虚线网格，所以很容易知道从哪里开始标注一个边界框。这看起来像是一种额外嘉奖，但是相信我，这对于标注来说真的很重要！
它提出使用深度学习算法来自动检测对象（它附带了在 COCO 数据集上训练的 SSD 模型）
它是一个 web 应用程序和一个电子应用程序。这使你可以将它作为一个重客户端使用，也可以将它作为 web 浏览器中运行的应用程序来使用

缺点：

要使用 web 应用程序版本，你需要将数据托管在微软的云计算服务 Azure 上（然而，电子版应用程序允许你在硬盘上使用数据，但需要使用 npm 安装程序）
它没有提供一个内置的 API（但是，通过调整代码，使你的私有 API 能够与之通信，这是非常容易的）
你不能给整张图片贴标签：你只被允许绘制带有相关标签的边界框（或多边形）。因此，它不适合创建分类数据库

点击 https://vott.z5.web.core.windows.net/ 查看网页应用程序！

DataTurks

计算机视觉领域非常好用的5个开源图像标注工具

DataTurks

DataTurks 是一家成立于 2018 年的初创公司，提供图片、视频和文字的标注服务。然而，直到最近它才成为开源软件（这可能与沃尔玛在 2019 年 2 月买下了它有关），此前你都必须向其付费。尽管在那之后，他们几乎没有对外发声，而且似乎已经停止了任何开发，但是这个标注工具非常棒，而且现在是免费的！

当你使用它的时候，不用在意任何许可，也不用考虑随处可见的任何非商业用途的限制条款。Dataturks 现在免费啦，而且你可以使用它的所有功能（我已经尝试和测试过了）！

优点：

说起 CVAT，它是一个在 Docker 中运行的 Web 应用程序（查看 https://medium.com/@dataturks/dataturks-on-prem-a-fully-self-hosted-data-annotation-solution-86b455bf0634 获取 Docker 图像）
允许协作和异步工作：处理相同数据集的两个队友不会得到相同的图像进行标注
提出一种用于创建和获取标注任务的 API

缺点：

DataTurks 似乎已经停止了其产品的开发
UX 还可以，但是一些小小的调整还可以让它变得更好
点击 https://dataturks.com/projects/Dataturks 查看在线演示！

自定义最好的开源图像标注工具

Make-Sense

计算机视觉领域非常好用的5个开源图像标注工具

MakeSense.ai

Make-sense 在 2019 年 6 月刚刚发布，并且已经拥有了令人难以置信的用户体验。开始启动打标从来没有这么快！进入网站，拖放你的图片，即可开始标注。

优点：

快速，高效，但最重要的是，简单!
很酷的用户体验
至于你上传的图片的隐私问题，不要担心，因为他们说:“【我们】不会存储你的图片，因为我们不会把它们发送到任何地方。”

缺点：

不提供任何项目管理功能
也不提供任何 API

点击 https://www.makesense.ai/ 开始打标！

计算机视觉电脑 text-align

安科网

计算机视觉领域非常好用的5个开源图像标注工具

木瓜子

计算机视觉标注的简要基础知识 [可选]

打标公司的最佳开源标注工具

创业公司的最佳开源标注工具

DataTurks

自定义最好的开源图像标注工具

木瓜子

相关推荐

5个优秀的计算机视觉应用与相关数据集

计算机视觉如何给企业带来不同？

计算机视觉岗常见面试题

TensorFlow2020:如何使用Tensorflow.js执行计算机视觉应用程序？

三个可能会被计算机视觉技术改变的行业

图像也能做情感迁移？罗切斯特大学团队提出计算机视觉新任务

4个计算机视觉领域用作迁移学习的模型

AI创业哪家强？6大选择给你方向

NLP/CV模型跨界，视觉Transformer赶超CNN?

可以提高你的图像识别模型准确率的7个技巧

以国家战略科学家身份，顶级AI学者朱松纯回国，筹建北京通用AI研究院

五种图像标注的简介

没有足够多的数据怎么办？计算机视觉数据增强方法总结

人工智能和物联网：智慧城市的交通管理

PG&E使用AI来降低野火风险

为什么AI感知与人类感知无法直接比较？

[ Datawhale ] 计算机视觉下 —— HOG特征描述算子

Deep Learning for Image Super-resolution: A Survey

知乎热议：未来3到5年内，哪个方向机器学习人才最稀缺？

人工智能的三大领域及其工业应用

木瓜子