一款好用的数据标注工具对于创立高质量的AI训练数据集至关重要,您能够通过高效的标注工具进步数据标注速度,让工作流变得更为有序。随着计算机视觉技术的倒退,咱们能够在开源社区看到越来越多的图像标注工具,任何人都能够收费应用并从弱小的性能中获益,咱们在下文中列举了10款咱们认为优良的开源标注工具!
- LABEL STUDIO
咱们最为举荐的开源标注工具是Heartex开发的 Label Studio,该工具分为付费和开源版本,即使是收费的开源版本,也足以反对宽泛的标注类型,包含图像分类、指标检测、语义宰割等,除了图像外,也能够用在音频、文本和 HTML场景的标注,并具备名为 Labeling Config 的独特配置,您能够在其中依据所需定制UI,Label Studio整合了多种算法辅助的自动化性能,包含能够基于现有AI模型对数据进行预标注。最初,咱们举荐的另外一个重要的因素在于它领有一个沉闷的用户社区,您能够在其中分享应用技巧或提出问题。
- DIFFGRAM
咱们举荐的第二款是Diffgram,此前它还是一个付费的工具,然而从 2021 年Q1之后,Diffgram 已转为齐全开源的工具,提供可选的付费托管服务和企业反对。
它的突出之处在于除了作为数据标注工具外,还具备各种数据集和工作流治理性能。
它反对图像和视频相干的大多数数据标注场景,例如2D突围框、多边形、语义宰割、立方体和关键点等。
它的语义宰割性能还提供了各种辅助性能,例如主动贴合、组合形态、点到全多边形等等!
此外,它的视频标注反对关键帧和序列标注,例如事件跟踪和指标跟踪。
- LABELIMG
LabelIMG是一款十分风行的开源图像标注工具。大多数接触数据标注工作的人应用过的第一款标注工具就是它,因为其简略直观的UI以及它能够离线应用以提供最大的数据安全性,而受到诸多算法工程师的青眼。
它能够在简直所有环境中应用,例如 Windows、Linux、Ubuntu 和 Mac OS,它的 Python 库也能够在 Anaconda 或 Docker 中应用。然而,尽管LabelIMG十分易于上手,但因为它没有任何协同标注性能,而且仅反对突围框标注,所以不适宜用于多人协同标注,也不适宜任何其余标注类型。
它能够将标注后果保留为 PASCAL VOC 格局以及 YOLO 和 CreateML 格局的 XML 文件。
- CVAT
CVAT 是英特尔开发的开源软件,尽管入门难度绝对较高,但它具备十分丰盛的标注工具和各种自动化性能,基于 Chrome 运行,反对突围框、多边形、线和关键点的标注,同时CVAT 反对复制粘贴标注对象、指标主动跟踪和关键帧标注,由 TensorFlow OD API 提供反对。在CVAT 中的多人合作很容易,能够拆分和委派工作。
CVAT十分受到国内外出名的数据标注公司青眼,同时它也是咱们次要应用的平台,基于CVAT的弱小性能,咱们开发了冰山标注平台,整合语音、文本标注工具和录音工具,并且在CVAT提供的工作流根底之上进行了改良,更加灵便地治理多个数据标注团队和众包团队,您能够分割咱们以申请试用冰山标注平台。
- IMAGETAGGER
ImageTagger是一个用于合作的图像标注的开源在线平台。该平台由汉堡大学信息学系的 Niklas Fiedler 专门针对机器人世界杯的需要而开发,旨在使标注数据的过程尽可能直观和疾速。
它反对应用突围框、多边形、线和关键点来标注图像集。它的一些性能对于数据标注项目管理非常无效,比方一些有助于管控品质的选项和性能,例如图像预加载、上传现有标注信息和标注验证。此外,因为它专一于多人合作标注,容许通过将标注员分成多个团队来对数据集进行大规模标注。
- LABELME
LabelMe 被认为是最驰名的数据标注工具之一。由麻省理工学院于2008 年公布,用以构建标准的 LabelMe 数据集,LabelMe 能够在线或离线应用。它能够在 Windows、Ubuntu 和 Mac 等环境中运行。LabelMe 可标注突围框、多边形、关键点、折线以及图像宰割,反对图像和视频标注,它能够导出 VOC 和 COCO 格局的语义和实例宰割后果。然而毛病和LabelIMG一样不反对多人协同,所以不适用于大规模的标注我的项目。
- VIA
VGG 图像标注工具也叫 VIA,由牛津大学的视觉几何小组开发。这是一个相当简略的标注工具,能够手动标注图像、音频和视频,十分易于应用和装置,它能够基于简直任何web浏览器运行。
VIA 能够用来标注突围框、圆形、椭圆、多边形、关键点和线。VIA反对导出CSV和JSON,以及提供大量的项目管理性能,比方容许为标注员设置多个工作,并通过UI直观地监控我的项目进度。
- MAKE SENSE
Make Sense 是一个绝对年老的开源数据标注平台。由 Piotr Skalski于 2019 年公布的
Make-sense 具备十分丑陋的 UI,并且在标注方面没有多余的装璜,并具备额定的指标检测和图像识别性能。如需试用请间接拜访他们的网站,将您的原始图片拖拽进去就能够立刻开始标注了,他们不存储任何用户数据,所以不会存在隐衷隐患。
Make Sense 反对突围框、关键点、线和多边形标注,也反对应用 AI 模型进行预辨认标注,例如在 COCO 数据集上预训练的 SSD 模型和 PoseNet 模型,可用于预测人的姿势和图像或视频中的要害主体。
比拟遗憾的是,Make Sense 没有任何项目管理性能或 API。
- COCO ANNOTATOR
COCO Annotator由 Justin Brooks 应用Vue.js开发,它是一个基于 Web 的图像宰割工具,旨在帮忙开发和训练指标检测、定位和关键点检测模型。
标注数据集能够应用自在曲线、多边形和关键点以及其余特色来标注图像片段、追踪对象实例,甚至容许在单个实例中标注多个断开的可见局部,可存储为COCO数据集格局,因而得名COCO Annotator。
COCO Annotator还反对用半训练模型预标注图像,并领有 DEXTR、MaskRCNN 和 Magic Wand 等高级选项。
最初,它还提供了一个用户身份验证零碎来保障安全性。
- DATATURKS
最初向您举荐的是一个曾经停更的开源平台。Dataturks 已经是一项付费服务,2018 年被沃尔玛收买,尔后开发便进行了,当初能够在 GitHub 上收费应用。只管在应用该软件时会屡次提醒用户能够为进阶性能付费,但实际上它能够完全免费应用。尽管曾经有一段时间没有更新版本了,但依然是一个牢靠的开源数据标注工具。它容许团队协同解决各种数据标注类型,包含图像、视频、文本和 NER。
它容许标注多边形和图像宰割mask,也能够通过在标注元素增加子标签进行图像分类。它也反对指标追踪标注,能够在视频中的关键帧标注突围框,并且该工具将主动在这些关键帧之间进行补间。Dataturks 能够以 VOC、Tensorflow 和 Keras 格局导出标注后果。
心愿本文举荐的数据标注工具对您有所帮忙,如果您须要大规模的人工标注服务,能够随时分割咱们,咱们能够反对各种类型的数据采集、数据荡涤和数据标注工作。
发表回复