共计 2338 个字符,预计需要花费 6 分钟才能阅读完成。
前言
图像语义宰割始终是数据标注中最繁琐、最耗时的标注工作之一,利用钢笔工具手动描边的标注形式所带来的工夫老本和低准确率都将影响模型的生产速度和模型性能。整数智能 ABAVA 数据工程平台最新公布了基于 SAM(Segement Anything Model)改良的语义宰割标注 2.0 工具,借助与其余模型的合作和高效的掩码编辑工具,进步数据工程的生产速度,助力 AI 模型训练研发。
对于 SAM 的更多干货,可参考整数智能的上期文章:火爆 CV 圈的 SAM 是什么?
整数智能如何应用 SAM 提效标注?
https://www.bilibili.com/video/BV1Lo4y147XR/?aid=398394980&ci…
尽管 SAM 是一款十分优良的 zero-shot 图像宰割模型,然而如果将 SAM 间接用于数据标注中作为生产力工具进行应用,依然存在一些缺点,须要进一步改良优化。首先,在应用 SAM 进行图像宰割时,指标的宰割边界可能不够精密,须要进行前期调整以达到更精准的宰割成果。其次,SAM 无奈很好地调整宰割对象的粒度信息,无奈满足更丰盛的标注需要。最初,”Segment Anything” 算法须要较长的工夫响应,对于须要高效标注的场景可能存在肯定影响。为了更好地满足客户的需要,咱们一直摸索优化 SAM 算法的办法,进步 ABAVA 数据工程平台的标注效率和精度。相较于传统开源工具,咱们平台领有以下诸多劣势:
- 完满解决 SAM 边界缝隙,密集相邻指标宰割边界自适应调整,生成像素级贴合指标的标注后果
- 极致的响应速度,SAM 底层优化与动静缓存图片序列化机制,缩减模型等待时间至原版的 1 /3
- 更优良的显存分配机制,可能解决更大更简单的图片
- 动静细粒度调整联合动静面积抉择,更好地管制标注细节及宰割对象的抉择
- 反对动静模型加载,平台基于云端动静扩大,实现高并发解决需要
- 反对多种宰割后果输入,反对简单镂空对象导出
- 多种交互抉择,反对一键全景宰割,点选交互式宰割
- 反对多人同时在线利用 SAM 进行标注,实现多用户分工协作
基于 SAM 的智能语义宰割标注
一键宰割,简略高效
SAM 能够在无训练的状况下对任何指标进行切分,可能极大的晋升语义宰割的标注效率。咱们针对不同标注场景和标注需要对 SAM 进行了参数优化,剔除了重叠图层和细小碎片,宰割后果更精确,前期编辑更简略。
图:在整数智能 ABAVA 平台工作设置的智能工具选项中抉择 SAM 模型 -Segment Anything 选项
图:进入标注界面,点击智能标注,一键宰割
预标注后果批改标签类型
SAM 模型宰割的后果不蕴含标签类型的预辨认,在 ABAVA 平台能够依照标注需要配置对应的标签类型,智能宰割之后的标签只须要点击抉择对应的标签类型即可实现标注,方便快捷。
图:标签批改
掩码编辑工具,轻松编辑
因为 SAM 模型自身无奈产生准确共边的后果,因而对于全景语义宰割标注我的项目,咱们自研了一套掩码编辑工具,蕴含钢笔、画笔、套索等多种标注形式,对边缘地位进行疾速的增补、共边等操作,补足了 SAM 模型的最初一块短板。
图:掩码工具编辑
基于 SAM 的智能语义宰割标注
在实例宰割等场景之下,点选智能标注通过加选减选即可实现标签的绘制,是最高效的标注形式。
图:点选智能标注
对于整数智能
80% 的数据 + 20% 的算法 = 更好的 AI
人工智能的研发是一个十分标准化的流程,它会经验 4 步,从数据采集 -> 数据标注 -> 模型训练 -> 模型部署。而 80% 的研发工夫,则耗费在了数据采集与数据标注的环节。数据工程的外围在于高效率、高质量的数据标注。
整数智能——AI 行业的数据合伙人
整数智能信息技术(杭州)有限责任公司,起源自浙江大学计算机翻新技术研究院,致力于成为 AI 行业的数据合伙人。整数智能也是中国人工智能产业倒退联盟、ASAM 协会、浙江省人工智能产业技术联盟成员。
整数智能提供了智能数据工程平台(ABAVA Platform)与数据集构建服务(ACE Service)。满足了智能驾驶、AIGC、智慧医疗、智能安防、智慧城市、工业制作、智能语音、公共治理等数十个利用场景的数据需要。目前公司已单干海内外顶级科技公司与科研机构 200 余家,领有知识产权数十项,屡次参加人工智能畛域的规范与白皮书撰写。整数智能也受到《CCTV 财经频道》《新锐杭商》《浙江卫视》《苏州卫视》等多家新闻媒体报道。
1. 专业级的团队和技术撑持
- 弱小的研发团队继续迭代 AI 数据平台 ABAVA Platform,发明极致的 AI 数据标注效率
- 数据专家为您制订数据集构建计划,满足您对数据集的定制化需要
2. 满足全畛域多场景的数据标注需要
- 在图像与视频数据方面,反对关键点标注、线标注、框标注、语义宰割标注、平面框标注、逐帧标注等标注需要
- 在点云数据方面,反对 3D 点云框标注、3D 点云语义宰割、3D 点云车道线标注、2/3D 交融标注等标注需要
- 在文本数据方面,反对 NER 命名实体标注、SPO 文本三元组标注、内容审核、情绪剖析等标注需要
- 在音频数据方面,反对 ASR 标注、音素标注、MIDI 标注等标注需要
图:图像 / 视频数据标注工具
图:点云数据标注工具
3. 极致的的数据交付品质
- 整数智能领有数十家自建数据产业基地和单干产业基地,笼罩 10 万名人工智能训练师,逐步形成一套迷信业余的人员、品质管控及数据安全保障机制依靠数据标注方面所积攒的教训,平台可达成 100 万张图像标注量级的峰值。
- 整数智能数据管理平台通过流程与机制的双重保障,为您提供品质更优、响应速度更快的数据服务,助力企业用户实现降本增效
分割咱们
心愿可能与正在浏览这篇文章的您进一步交换沟通,一起摸索 AI 数据的更多可能性。欢送分割咱们:
电话(微信同号):137-8507-0844
邮箱:zzj@molardata.com
也能够关注咱们的账号:整数智能 AI 研究院