66008d78240ea5eb0ad8b78a3ddd3d60.png

本次分享一个谷歌暗度陈仓收集客户标注数据的故事,城市套路深,我要回农村;分享九个数据标注最常用的工具,涵盖打点,拉框,OCR,语义分割,3D等。

01一个故事

2004 年,谷歌宣布开启全球图书馆馆藏图书的数字化计划,扫描了哈佛大学、牛津大学、斯坦福大学、康奈尔大学、纽约公共图书馆等世界一流设施内的书籍,光哈佛大学就有 1600 万册,将它们制作成电子版。

书页内的文字主要通过 OCR 光学字符扫描分析,转换成为文本。识别过程并非完美,字迹模糊、污迹等都可能产生错误,所以需要配合人工修正。

62cdbcc3a025c467ce402b1525f108fb.png

谷歌怎么做呢?他们直接把难于识别的文字,做成了验证码,当你在某些情况下需要登录验证谷歌帐号时,展示两个单词——一个单词是谷歌已知信息,靠这个完成真正的验证动作,另一个就是上述无法识别的图书文本,谷歌让你来肉眼识别,至少三个用户给出同一个结果,就会被提交给谷歌服务器。

恭喜你被套路了!

同样的,谷歌将这套发扬到了无人驾驶领域,做成了图形验证界面,让用户在验证环节,从一堆谷歌街景的实拍照片矩阵中,选出「人」、「车」或是「路牌」。

c3f04637d6d052fb51caf43a97984577.png

尽管谷歌自身已有海量数据积累,但为了提升现行主流的「有监督学习」算法模型的准确度,数据永远不嫌多,直接或者间接从用户手中花样收集数据标注,包装出各种各样的形态,防不胜防.但背后的一切还是流量的支持,没有流量怎么办?踏踏实实一点一点标注吧。02九个工具

1.LabelImg

主页地址:https://github.com/tzutalin/labelImg

下载以后根据作者提供的安装指南即可安装,如果安装不上怎么办,不用这么麻烦,下面这个地址提供了直接下载的地址,下载预编译exe即可:

https://github.com/zhaobai62/labelImg

支持VOC2012格式与tfrecord自动生成!

9cbcab6692aa76db044dc0337a5a53c2.png

2.LabelIme

主页地址:https://github.com/wkentaro/labelme

支持对象检测、图像语义分割数据标注,实现语言为Python与QT。

支持导出VOC与COCO格式数据实例分割

强烈推荐,实例分割都可以用它标注!

8b631580c2939b96e0c76a07db582a04.png

3.RectLabel

https://rectlabel.com/

支持导出YOLO、KITTI、COCOJSON与CSV格式

读写Pascal VOC格式的XML文件

da729bb25a0d7c09be4d360f72b0d353.png

4.OpenCV/CVAT

官方主页:https://github.com/opencv/cvat

高效的计算机视觉注释工具,支持图像分类,对象检测框,图像语义分割

592b34ed6d094553fbeb735edd54cf32.png

5.VOTT

官方主页:https://github.com/microsoft/VoTT

Microsoft发布了一个基于WEB的可视化数据注释工具,用于本地部署。

支持图像和视频数据注释

f967e2f7eaba66fe3b393ae91d25efd8.png

6.LableBox

官方主页:https://github.com/Labelbox/Labelbox

WEB模式下的标记工具

提供自定义注释API支持

纯JS + HTML支持

da45a9d11a3691cc45b88c5dd512b371.gif

7.VIA-VGG Image Annotator

http://www.robots.ox.ac.uk/~vgg/software/via/

VGG发布的图像标准工具

基于WEB方式的标注工具

e45a671ce05118bf5b776946172a46f2.png

8.PixelAnnotationTool

https://github.com/abreheret/PixelAnnotationTool

ac1c3d77e91702760339d72e2167695a.png

9.point-cloud-annotation-tool

官方地址:https://github.com/springzfx/point-cloud-annotation-tool

3D点云数据注释工件

支持3D BOX盒子生成

支持KITTI-bin格式数据

9f15433dd52a02389ffab37ba9e9a06c.png

2e7c203b51f3b10017c1bfc84f14cd1f.png

6c2b1346d8da90e18e51578c6e7424cc.png

数据标注|国家信息安全标准化技术委员会-人工智能安全标准化白皮书(2019)

数据标注|明星秒变宠物脸

数据标注|定义我,请先了解我

aefd6882a036bf77f114910d76d4d2b7.png
Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐