关于人工智能:详解曼孚科技SEED数据服务平台1全场景覆盖

6次阅读

共计 1367 个字符,预计需要花费 4 分钟才能阅读完成。


工欲善其事,必先利其器。

在人工智能技术与产业深度交融的时代背景下,根底数据服务行业的重要性愈发凸显。如何为 AI 行业提供优质、场景化的数据服务,是摆在一众数据服务企业背后的首要难题。

行业竞争愈发“内卷化”,这对数据服务企业的产品迭代速度与产品质量均提出了更高的要求。

截止目前,曼孚科技数据标注工具经验了两代更迭。第一代数据标注工具次要解决了标注工具有无以及是否好用的问题。

然而,即使咱们将数据处理效率晋升至行业平均水平的几倍以上,但咱们认为,这依然没有冲破传统数据处理工具的条框——咱们的工具与诸多竞品工具类似,性能都仅限于将非结构化数据转化为结构化数据,这并没有技术壁垒,也没有产生量变。

于是咱们想做一些其他人还没有做的事件,用平台来更好地实现对 AI 数据全生命周期的治理,于是 SEED 平台应运而生。

SEED 平台全称为“SEED 数据服务平台”,咱们将 SEED 定义为“平台”而不是“工具”,是因为咱们认为数据从诞生到被算法模型调用的全生命周期内,须要历经的过程通常包含采集、荡涤、标注、质检审核、交付等流程,两头还会交叉数据集的治理、人员的治理、我的项目的治理、供应链的治理等泛滥内容。

以往传统的数据标注工具解决的仅仅是标注这一流程,项目管理、团队人员治理等依附的依然是传统口耳相传模式,在沟通效率、执行老本以及流程透明度等方面体现不尽如人意。只有流程化、规范化、标准化的平台,能力无效满足大规模 AI 基础设施建设带来的迫切需要。

所以,为了更好地满足 AI 根底数据多样化的需要,冲破数据与利用场景之间存在的边界,解决以往应用繁多工具在执行效率上的欠缺,曼孚科技自研了一套贯通数据处理、项目管理和数据安全管控等各环节于一体,并且能对图像、文本、语音、视频以及 3D 点云数据做到一站式解决的 SEED 数据服务平台。

SEED 数据服务平台

在将来的一段时间内,咱们将推出系列文章,从“数据标注”以及“项目管理”两个角度具体介绍 SEED 平台各个功能模块,详尽展现 SEED 平台在数据生命周期治理方面的独到之处。

本篇内容为系列文章的第一篇,详解 SEED 平台的多场景数据处理能力:

依据数据类型的不同,标注类型可大抵分为计算机视觉、语音交互以及自然语言解决三大类。其中计算机视觉又能够进一步划分为计算机视觉 -2D 以及计算机视觉 -3D 两种类型。

SEED 数据服务平台具备三大标注模式以及四维标注工具,全面笼罩计算机视觉、自然语言解决以及语音交互等具体利用场景,满足不同利用场景下的各类数据标注业务需要。

SEED 数据服务平台多场景数据处理能力

计算机视觉 -2D

计算机视觉 -2D 解决数据类型以 2D 图像类数据为主,常见的标注类型包含 2D 框、多边形、3D 立方体、关键点、多段线、全景语义宰割、贝塞尔曲线、椭圆等。

2D 框

3D 立方体

多边形

关键点

多段线

全景语义宰割

贝塞尔曲线

计算机视觉 -3D

计算机视觉 -3D 解决数据类型以 3D 点云类数据为主,常见的标注类型包含单帧物体检测、间断帧、2D3D 交融标注,点云语义宰割等。

点云单帧物体检测

点云间断帧 +2D、3D 交融

语音交互

语音交互解决数据类型以语音类数据为主,常见的标注类型包含 ASR 语音转写以及 TTS 语音合成等。

ASR 语音转写

自然语言解决

自然语言解决波及数据类型以文本类数据为主,常见的标注类型包含 OCR 转写、实体辨认、文本分类等。

OCR 转写

正文完
 0