向AI转型的程序员都关注了这个号???
人工智能大数据与深度学习 公众号:datayx
对于监督学习算法而言,数据决定了任务的上限,而算法只是在不断逼近这个上限。世界上最遥远的距离就是我们用同一个模型,但是却有不同的任务。但是数据标注是个耗时耗力的工作,下面介绍几个图像标注工具:
Labelme
LabelMe,由麻省理工学院开发的。在这里可以看到一个在线版本,
或者在这里可以运行它。
http://labelme.csail.mit.edu/Release3.0/
https://github.com/wkentaro/labelme
Labelme适用于图像分割任务的数据集制作:
它来自下面的项目:https://github.com/wkentaro/labelme
该软件实现了最基本的分割数据标注工作,在save后将保持Object的一些信息到一个json文件中,如下:
https://github.com/wkentaro/labelme/blob/master/static/apc2016_obj3.json
同时该软件提供了将json文件转化为labelimage的功能:
labelImg
Labelme适用于图像检测任务的数据集制作:
它来自下面的项目:https://github.com/tzutalin/labelImg
其中标签存储功能和“Next Image”、“Prev Image”的设计使用起来比较方便。
该软件最后保存的xml文件格式和ImageNet数据集是一样的。
yolo_mark
yolo_mark适用于图像检测任务的数据集制作:
它来自于下面的项目:https://github.com/AlexeyAB/Yolo_mark
它是yolo2的团队开源的一个图像标注工具,为了方便其他人使用yolo2训练自己的任务模型。在linux和win下都可运行,依赖opencv库。
Vatic
Vatic适用于图像检测任务的数据集制作:
它来自下面的项目:http://carlvondrick.com/vatic/
比较特别的是,它可以做视频的标注,比如一个25fps的视频,只需要隔100帧左右手动标注一下物体的位置,最后在整个视频中就能有比较好的效果。这依赖于软件集成的opencv的追踪算法。
Sloth
Sloth适用于图像检测任务的数据集制作:
它来自下面的项目:
https://github.com/cvhciKIT/sloth
https://cvhci.anthropomatik.kit.edu/~baeuml/projects/a-universal-labeling-tool-for-computer-vision-sloth/
在标注label的时候,该软件可以存储标签,并呈现标注过的图片中的bbox列表。
Annotorious
Annotorious适用于图像检测任务的数据集制作:
它来自下面的项目:
http://annotorious.github.io/index.html
代码写的相当规范,提供了相应的API接口,方便直接修改和调用。
RectLabel
RectLabel适用于图像检测任务的数据集制作:
它来自下面的项目:
https://rectlabel.com/
这是一个适用于Mac OS X的软件,而且可以在apple app store中直接下载。
VoTT
VoTT适用于图像检测任务的数据集制作:
它来自下面的项目:
https://github.com/Microsoft/VoTT/
微软的开源工具,既可以标注视频,也可以标注图片,而且支持已有模型的集成,功能强大。
IAT – Image Annotation Tool
IAT适用于图像分割任务的数据集制作:
它来自下面的项目:
http://www.ivl.disco.unimib.it/activities/imgann/
比较有特色的是,它支持一些基础形状的选择,比如要分割的物体是个圆形的,那么分割时可以直接选择圆形,而不是用多边形选点。
images_annotation_programme
images_annotation_programme适用于图像检测任务的数据集制作:
它来自下面的项目:
https://github.com/frederictost/images_annotation_programme
网页版的哦
除此之外,还有很多类似的工具,与上面的工具相比,并没有什么特色了,我们只给出链接,不详细介绍了:
ImageNet-Utils
https://github.com/tzutalin/ImageNet_Utils
labeld
https://github.com/sweppner/labeld
VIA
http://www.robots.ox.ac.uk/~vgg/software/via/
ALT
https://alpslabel.wordpress.com/2017/01/26/alt/
FastAnnotationTool
https://github.com/christopher5106/FastAnnotationTool
LERA
https://lear.inrialpes.fr/people/klaeser/software_image_annotation
计算机视觉标注工具(CVAT)
在推出 OpenCV 近 20 年后,Intel 在计算机视觉领域再次发力,并发布了 CVAT,这是一个非常强大和完整的标注工具。尽管它需要一些时间来学习和掌握,但它包含了大量的功能来标注计算机视觉数据。
优点:
它很容易安装和扩展,因为它是一个运行在 Docker 中的 Web 应用程序
它包含了许多自动化工具(如使用 TensorFlow 物体检测 API 的自动标注、视频插值……)
它允许协同工作管理,这样团队中的不同成员就可以在同一个标注任务上协同工作
缺点:
UI 相当复杂。例如,对于初次设置标注任务的用户而言,这可能会非常棘手
一开始用起来不是很直观,可能需要几天的时间来掌握
只能运行于 Chrome,所以如果你担心谷歌……,你必须找到其他变通办法
点击这里查看在线演示!
https://c.onepanel.io/onepanel-demo/projects/cvat-public-demo/workspaces
可视化对象标注工具(VoTT)
VoTT 是由微软开发的,它提供了非常棒的用户体验,这可能会在你标注时为你节省大量的时间和精力。而且,创建项目也很直接,所以你可以不用深入阅读其文档就能使用它。
优点:
代码写得非常好(在 React 中),并且完美地定义了接口,因此获取代码和添加所需的额外功能都很容易
正如我所说的,UX 是完美的,它有一个黑色的主题和一个跟随鼠标的虚线网格,所以很容易知道从哪里开始标注一个边界框。这看起来像是一种额外嘉奖,但是相信我,这对于标注来说真的很重要!
它提出使用深度学习算法来自动检测对象(它附带了在 COCO 数据集上训练的 SSD 模型)
它是一个 web 应用程序和一个电子应用程序。这使你可以将它作为一个重客户端使用,也可以将它作为 web 浏览器中运行的应用程序来使用
缺点:
要使用 web 应用程序版本,你需要将数据托管在微软的云计算服务 Azure 上(然而,电子版应用程序允许你在硬盘上使用数据,但需要使用 npm 安装程序)
它没有提供一个内置的 API(但是,通过调整代码,使你的私有 API 能够与之通信,这是非常容易的)
你不能给整张图片贴标签:你只被允许绘制带有相关标签的边界框(或多边形)。因此,它不适合创建分类数据库
点击这里查看我们的网页应用程序!
https://vott.z5.web.core.windows.net/
DataTurks
DataTurks 是一家成立于 2018 年的初创公司,提供图片、视频和文字的标注服务。然而,直到最近它才成为开源软件(这可能与沃尔玛在 2019 年 2 月买下了它有关),此前你都必须向其付费。尽管在那之后,他们几乎没有对外发声,而且似乎已经停止了任何开发,但是这个标注工具非常棒,而且现在是免费的!
当你使用它的时候,不用在意任何许可,也不用考虑随处可见的任何非商业用途的限制条款。Dataturks 现在免费啦,而且你可以使用它的所有功能(我已经尝试和测试过了)!
优点:
说起 CVAT,它是一个在 Docker 中运行的 Web 应用程序(查看这里获取 Docker 图像)
允许协作和异步工作:处理相同数据集的两个队友不会得到相同的图像进行标注
提出一种用于创建和获取标注任务的 API
缺点:
DataTurks 似乎已经停止了其产品的开发
UX 还可以,但是一些小小的调整还可以让它变得更好
点击这里查看在线演示!
https://dataturks.com/projects/Dataturks
仅为你自己服务的最好的开源图像标注工具
MakeSense.ai
Make-Sense
Make-sense 在两个月前刚刚发布(如果你在很久之后才读到我这篇文章,说明下,这个时间是 2019 年 6 月),并且已经拥有了令人难以置信的用户体验。开始启动打标从来没有这么快!进入网站,拖放你的图片,即可开始标注。
优点:
快速,高效,但最重要的是,简单!
很酷的用户体验
至于你上传的图片的隐私问题,不要担心,因为他们说:“【我们】不会存储你的图片,因为我们不会把它们发送到任何地方。”
缺点:
不提供任何项目管理功能
也不提供任何 API
点击这里开始打标!
https://www.makesense.ai/
VGG VIA ,一个非常容易使用的标注器,其由牛津机器人实验室开发。它被编码在单个的 html/js 文件里,所以它很容易进行开发!
Coco-Annotator 似乎功能很齐全,但它是最近才出现的(用户身份验证系统、API 接入点)。查看这里的演示
https://annotator.justinbrooks.ca/#/
阅读过本文的人还看了以下文章:
不断更新资源
深度学习、机器学习、数据分析、python
搜索公众号添加: datayx
长按图片,识别二维码,点关注
AI项目体验
https://loveai.tech