关于人工智能:数据万象-AIGC-存储内容安全解决方案

36次阅读

共计 1638 个字符,预计需要花费 5 分钟才能阅读完成。

AIGC(人工智能生产内容)曾经成为与 PGC(业余生产内容)、UGC(用户生产内容)并驾齐驱的内容生产方式。因为 AI 的个性,AIGC 在创意、个性化、生产效率等方面具备独特的劣势,这些劣势能够使得高质量的内容制作更简略,但也会帮忙歹意份子更高效地炮制守法违规内容。数据万象从 AIGC 的输出、生产、存储全方面染指,公布了《AIGC 存储内容平安解决方案》,帮忙各开发者及时发现危险信息,升高业务平安危险。

2022 年,ChatGPT 的推出,使 AIGC 这个名词进入了公众的视线。Stable Diffusion、MidJourney 等能够生成图片的 AIGC 间接引爆了 AI 作画畛域。Gartner 将生成性 AI 列为 2022 年五大影响力技术之一。AIGC 曾经曾经成为 AI 畛域的新疆域,推动着人工智能步入下一个新时代。

AIGC 的风潮间接吸引了大量的开发者簇拥而入,渴望能占到这个风口的红利。但现实情况是,大量的 AIGC 在上线初期就面临关停危险,外围起因就在于 AIGC 输入的内容具备不确定性,导致这些平台因涉嫌流传违规内容而被勒令下架。所以,AIGC 的倒退必须解决内容上的平安与标准。

4 月 11 日,国家互联网信息办公室起草了《生成式人工智能服务治理方法(征求意见稿)》,这意味着国家曾经在亲密关注 AIGC 的倒退,在非法合规的前提下,反对 AIGC 的商用及衰弱倒退。

在《意见稿》中,有 13 条规定是面向 AIGC 平台的,因 AI 的个性,让 AIGC 在解决平安危险方面有着更大的挑战:

成倍增长的审核量 :AIGC 正处业务增长暴发期,数据量将继续增高;AIGC 生成内容速度较快,短时间即可生成大量内容。
对审核的时效性要求极高 :随着 AIGC 利用的场景越来越宽泛,在实时交换等交互性强的场景中要求毫秒级的审核响应。
违规类型多种多样 :AIGC 依据人为的“指令”生成内容,生成内容由大模型随机而成,产出类型不可预测。
内容费解简单:AIGC 可被人为训练疏导,生成变体文本、费解违规含意的图片,对审核的精确辨认要求极高。

基于以上挑战,腾讯云数据万象从 AIGC 的输出、生产、存储全方面染指,公布了《AIGC 存储内容平安解决方案》,帮忙各开发者及时发现危险信息,升高业务平安危险。

内容输出审核

用户通过 AIGC 利用输出原始的文本、图片 prompt;
平台可将用户的原始输出信息通过万象间接进行审核;
依据审核后果:敏感信息间接拦挡、失常信息进入 AIGC 大模型。

内容生产审核

失常的 prompt 进入大模型,生成 AI 数据(文本、图片、音视频);生成的图片、文本数据通过数据万象进行审核;
依据审核后果:敏感数据间接拦挡,失常的文本内容可间接通过利用返回给用户,失常图片进入对象存储 COS。

内容存储审核生成音视频数据先进入对象存储 COS,再通过数据万象进行异步审核;
对于存储在 COS 中通过了审核后的图片、音视频数据,可在应用层通过 COS 链接的模式返回给用户进行拜访查看。

与其余平安审核服务相比,数据万象内容审核具备人造的 存审一体化 的联合劣势:

  1. 与 COS 深度集成,反对一键扫描审核 COS 中的历史数据;
  2. 审核模块与 COS 之间内网获取数据,罢黜因拉取数据而产生的外网流量费用;
  3. 高度便捷的操作,反对数据上传到 COS 后主动执行审核、主动解冻违规数据;

同时数据万象反对 用户自定义审核策略,可依据不同数据场景应用不同的策略:

  1. 在用户输出的 prompt 提醒词场景:可适当升高审核要求,让用户尽可能放弃输出体验,重点拦挡高度敏感的内容;
  2. 在 AIGC 模型生成的内容场景:严格把控进步审核要求,确保存储、散发的内容是非法合规的,除高度敏感的内容外,擦边、低俗等内容也应在管控拦挡范畴内。

不论是对新涌入的老手开发者,还是打算涉猎 AIGC 的巨头企业,AIGC 都是一个危险与时机并存的畛域,所有新事物的倒退都必须在非法合规的前提之下。放弃本身业务的平安、衰弱,才是 AIGC 平台可继续倒退的关键因素。数据万象在内容平安畛域继续深耕,心愿能够为各大 AIGC 平台提供最松软的平安保障。

正文完
 0