关于人工智能:蚂蚁智能内容合规审核产品探秘

1次阅读

共计 2826 个字符,预计需要花费 8 分钟才能阅读完成。

随着互联网服务的一直深入,产品营销的模式从传统文本、长图文,减少到短视频、直播等新媒介状态,展示模式更加丰盛的同时,也为营销宣传内容合规审核带来了诸多难题。

  • 如何解决一劳永逸的审核量与合规审核人员无限之间的矛盾?
  • 如何晋升审核效率,满足业务部门疾速公布需要?
  • 对于音视频、直播,如何对这些新媒介模式实现高效高质量的审核?

基于上述挑战,蚂蚁数科推出了全栈式智能内容合规审核平台产品。该产品基于 AI 智能技术及业余内容审核规定积淀,向金融、互联网、政企、传媒等行业客户提供一站式智能内容合规审核解决方案,可助力机构无效升高营销合规危险…

值得一提的是,蚂蚁团体与博时基金共建的基金内容合规智能审核零碎是国内的当先实际,荣获了第八届证券期货科学技术奖优秀奖和 2021 年度深圳市金融创新奖三等奖。该审核零碎具备高度自主知识产权,处于国内外领先水平。

一、产品能力

合规专家人力无限,越来越有力撑持海量内容的人工审核,且人工危险排查存在排查规范不对立,危险开掘不深刻,评审后果无沉淀等一系列问题。

蚂蚁智能审核产品基于人工智能技术及专家教训的解读和积淀,提供了一站式的营销合规危险管控解决方案,将监管要求进行数字化转译,通过程序化伎俩实现疾速的机审策略配置;同时提供了对立审核服务接入,反对文本、图片、语音、视频、直播、文件等全媒体格式的营销宣传内容辨认,结构化内容特色,进行规定推理,实现危险决策和处理。

多媒体内容辨认
反对全媒体格式解决,实用于企业级推销产品或服务的文字、图片、音频、视频、直播或其余内容展现模式,以实现针对用户可感知的利用页面、营销宣传、金融产品信息、销售行为过程等内容的全媒体格式的智能审核。

智能内容审核
合规专家会将本人的审核经验总结成规定或违规危险点,基于特定审核场景,交融各类算法模型构建简单且精准的策略体系,打造感知引擎 - 认知引擎 - 决策引擎为外围的多媒介金融风险精细化审核引擎,达成以机器审核代替人工审核的指标。

二、技术底细

1. 多媒体内容辨认
在内容审核的过程中,针对不同的内容往往须要采纳不同的解决形式来达到审核的目标。日常遇到的内容包含营销广告、产品页面文案、启动屏、IM、电销、直播、超链接、气氛图、弹窗、信息流、PUSH、短信、邮件等各种面向消费者的信息展现模式,这些内容大多以各种素材相似一张图片 / 一段音频 / 一段视频等形式承载。内容解决核心服务于审核前的内容预处理环节,即从这些素材中提取出须要审核的信息,进行内容转换、抽取、压缩等。

1.1 根底能力建设:

  • 文件解决:提供文件内容抽取、文件类型转换、文件生成图片等多种文件解决性能。
  • 图片解决:提供图片压缩、智能切割、图像增强、降噪解决等多种图像处理能力。
  • 音视频解决:提供音视频转码,视频抽帧,音频文件提取,语音 ASR、加强、降噪等多种能力。

1.2 简单解决流程编排: 为了应答灵便多变的内容解决流程,内容解决核心反对自定义内容解决流程编排,针对不同场景通过自定义脚本的形式实现内容解决节点的灵便编排。譬如为了满足简单监管要求,当视频中语音波及产品业绩介绍时,视频页面该当播放业绩展现板,通过自定义脚本的形式实现视频抽音频后,辨认其中要害内容,再抽取对应工夫图片,进行联结送审。

2. 智能内容审核及规定编排
为辨认更简单且荫蔽的金融风险问题,晋升合规危险辨认的准确率和召回率,咱们建设了感知 & 认知 & 决策三层漏斗式解决引擎。同时建设对立算法能力接入平台,实现原子算法能力业务无感插拔。最初在调用节点的输入输出之间退出了工程能力染指,如灰度图等,以加强算法模型的辨认能力。

与天生具备天然属性的概念不同,监管合规概念是由社会活动的演进而呈现,再由相干监管部门进行定义与标准的,专家会将本人的审核经验总结成规定或违规危险点,机审则须要对这些规定进行算法实现,规定生产配置的过程其实就是将一项项专家教训转换成机审能力的过程。在这个过程中,规定数量大,须要笼罩的场景多,为每条规定研发一个脚本工作量大,前期保护老本昂扬。同时在研发规定脚本时,发现很多规定是有类似的解决逻辑的,且具备肯定程序性,由此提炼原子能力,设计出一套规定的编排计划,疾速实现业务规定,同时在规定产生调整时可疾速切换组合形式,同时能够基于简略的配置化,做到业务的疾速接入和应用。

3. 模型迭代优化
审核中算法模型的优化迭代更新依赖大量的标注样本。在内容合规畛域,没有成熟、间接可用的样本集,强依赖合规专家教训的继续输出,然而合规专家打标的人力老本和工夫老本都十分昂扬,因而如何升高打标老本是内容合规畛域的重中之重。围绕着这个问题,咱们采纳了小样本学习、被动学习、噪声学习等技术,在打标环节筛选高质量的样本,节俭专家工夫的同时使算法模型达到业务要求的精度,进步人在回路体系的效率。

以小样本学习为例,咱们应用大规模预训练语言模型,应用 NLP 的 prompt(模板填充)模式,联合半监督学习,充分利用未打标样本,可能在样本量缩小一半的状况下,模型成果放弃不变。在特定工作中,样本量能缩小到原先的 1 /5。在这套框架下,“人”、“数据”、“模型”三者是相互晋升的,数据在整个回路里从未标注变成强标注,人从对审核规定有初步了解变成审核方面的专家,模型从无监督到强监督。

三、落地案例

博时基金 - 蚂蚁智能审核样板间 丨通过 AI 技术,实现基金产品销售素材智能化审核服务

蚂蚁智能审核产品始终以来致力于为用户提供智能内容合规审核能力,与行业共建合规规定库,继续优化更新。在基金产品宣传材料方面,博时基金引入了蚂蚁团体智能合规审核服务,构建博时基金内容治理与智能审核平台。智能审核能力晋升了合规审核效率,升高合规危险,大幅优化了业务 - 合规审核流程。内容治理平台提供营销素材存储、治理、复用、共享服务,助力不同素材需求方疾速获取审核通过的定稿素材,晋升营销品宣效率。

博时基金与蚂蚁共建的智能审核零碎还具备以下两大特点:

技术创新点:基于深度神经网络框架,使用大规模预训练、多模态辨认、人在回路算法等技术构建了国内当先的金融合规模型集群,将合规专家教训转化为智能审核能力,解决了简单语境下的准确率和审核效率问题。

业务翻新点:围绕内容生命周期,部署全流程的合规治理利用场景,并创造性实现了人机联合利用界面,翻新实现视频直播类智能合规审核,从“0 到 1”的冲破。

目前蚂蚁团体智能合规内容审核产品已开始向基金、保险、银行等金融机构推广落地。

四、将来瞻望

目前,智能审核产品曾经广泛应用在包含蚂蚁保、蚂蚁基金、网商银行、博时基金等多家机构,继续帮忙机构定位与洞察合规业务危险,晋升业务协同效率。同时蚂蚁智能审核产品现已向金融机构提供商业化服务,期待与更多机构共建行业合规规定库,发展合规畛域大模型的构建和利用实际,进一步晋升智能化程度。

后续咱们会继续分享蚂蚁团体智能合规内容审核能力演进过程中的落地与思考,欢送大家提出任何意见与倡议。

如有趣味,能够分割:gengliu.gl@antgroup.com

正文完
 0