关于算法:社交泛娱乐应用海外淘金文化关怎么过

43次阅读

共计 2867 个字符,预计需要花费 8 分钟才能阅读完成。


(点击报名)

出海风光万般好,谨防被困“文化”礁。关注【融云寰球互联网通信云】理解更多
近期,位列东南亚最大在线购物网站之一的出海电商引起了轩然大波。该平台在广告中启用了一位风评简单的跨性别网红和一名坐轮椅的女士作为广告配角,被认为映射长年坐轮椅的泰国王室成员和歧视残疾人。

只管平台曾经下架广告并郑重赔罪,但感到被挫伤的人们却并不买账。广告风波不仅轰动了泰国总理,导致平台遭军队抵制,被政府部门起诉,甚至引来了中国驻泰国大使馆官网回应。

正如泰国政府发言人针对此事件强调的,“内容创作者,应该小心他们在网上公布的内容。”本应在审核中过滤出的危险内容因文化差异而不查,未曾想引起如此巨浪。

而出海企业都会面临这样的“水土不服”,内容审核成为不容忽视的环节。

作为寰球 30 万 + App 的通信云搭档,融云不仅以遍布寰球 233 个国家和地区的通信网(SD-CAN)和自研的最优链路调度算法为根底,为用户提供平安、牢靠的通信云服务,还 联结业余合作伙伴打造出海内容审核解决方案 ,为寰球社交、泛娱乐利用提供 多语言智能内容风控 服务。


海内掘金第一关克服文化上的“水土不服”

对于出海企业而言,对当地文化的敏感和常识储备,是管制危险的必要条件。在涵盖多个宗教文化的东南亚地区,更须要审慎,尤其是在社交畛域。随着行业迅速倒退,社交产品呈现出数量大、品种多、状态丰盛、内容多元等特点,流量和利益激增的同时,也随同着一系列监管危险,内容平安的预防、管制和清理,各个环节都须要严格把关。

社交产品对内容审核能力有着更高要求和更大挑战,次要体现在:

1. 各国监管要求不同的复杂性

对于海内市场来说,法律、宗教、文化、语言等简单因素影响下,出海 App 的合规性既要满足当地法律,还要合乎当地的人文习性,这给内容审核带来了新的挑战。

欧美市场 来说,互联网内容采纳严格的分级制度,对 3 岁、13 岁、17 岁等不同年龄段的未成年人有严格的爱护策略,并且对种族舆论是明令禁止的;在 中东地区 ,十字架、猪等波及宗教的元素极为敏感;在 日本和泰国,要防止发表对天皇制和皇室不满的舆论,韩国对朝鲜政府的涉政舆论在当地也是被严格审查的。

2. 爱护品牌形象的必要性

在线上社交成为支流的明天,如何给用户营造一个洁净、衰弱的社交环境,是影响到品牌形象的头等大事,进而影响到 App 的胜利。

经考察显示,用户在衰弱的环境中参加互动后,留存率会减少 3 倍,会话时长减少 60%,而在受到网络骚扰后,15% 的用户会转向其余社交平台。


国别、场景错落各异海内内容危险品种多样,细节繁冗


文化的差别体现在方方面面,比方,东南亚国家的笑点与国内有很大不同,在气氛上,他们的直播会显得更加“嘈杂”。而在内容审核方面,除了不同地区带来的差别,即使是同一地区,不同的利用场景也面临极大的审核差别。

比方,在社交场景中,Kill、Shoot 等字眼是不被容许的,要被辨认及躲避;而它们呈现在游戏类场景中,则很正当。
再比方,在游戏昵称中,企业个别会对 Admin、Operator 等词汇的应用设定特地规定,因为放心用户借此伪装成软件经营方,带来欺诈等危险;而它们呈现在聊天中则不用特地留神。

这就要求内容审核服务业余而全面,对于海内社交属性的 App 来说,内容的危险品种次要包含 涉黄、涉政、涉毒、涉暴、种族、歧视、宗教、未成年人、唾骂、拉人广告 等,以上都是各国网络监管部门重点关注的对象。


聚焦海内社交业余、全面的风控策略

融云在 IM 即时通讯和 RTC 实时音视频的双核心能力之上,减少 X 元素 —— 通信周边能力的总和,全效赋能开发者。而“审核”就是融云重点布局的 X 能力之一。

在这方面,融云和业内当先的业余搭档单干,帮忙社交场景下的开发者,精准辨认即时通讯、实时音视频业务中的 文本、图片、音频、视频 的黄、暴、恐等违规内容,满足全场景需要;通过数字化的形式,提供审核、打标、自定义配置等服务来满足企业需要,打造业务、内容、用户 三重平安保障。

(内容审核检测类别,点击查看大图)

  • 反对中文(简体)、中文(繁体)、英文、日语、韩语、泰语、越南语、马来语、印尼语、印地语(拉丁印地语)、菲律宾语、阿拉伯语、土耳其语、俄语、德语、法语、意大利语、西班牙语、葡萄牙语、瑞典语、波兰语、希腊语、挪威语、荷兰语 24 种规范语言的文本及音频审核
  • 反对中东埃及、沙姆、北非、海湾、苏丹 5 种外乡方言以及印度地区孟加拉语、乌尔都语、马拉地语、阿萨姆语的文本检测。

1. 文本审核

全球化部署文本审核,审核后果在 100ms 以内响应,可依据海内不同国家的审核规范制订策略,反对标准语、方言、俚语、缩略语、社交费解语等表述,可联合上下文语义辨认防止误检,且紧跟各国最新政策、时政新闻,不断更新算法模型。

(文本审核示例)

2. 图片审核

应用先进的指标检测及内容辨认算法,实时检测图片中的违规内容,反对卡通场景和真人场景辨认,反对“画中画”、头像小图、含糊图片等简单场景,对光线遮挡、角度偏移等有较强检测能力。

(图片审核示例)

3. 音频审核

专一于社交等场景,可精准辨认并审核 23 种语言,利用 ASR+ 文本模型以及声纹模型综合判断涉黄、唾骂、暴恐、涉政、拉人广告、怨恨舆论、未成年人等内容,无效抵挡音频内容违规危险,准确率达到 95% 以上。

(音频审核实用场景)

4. 视频审核

精准辨认各类场景下的涉黄、涉政、暴恐、广告等视频内容,抵挡违规危险,保障视频内容平安合规,反对 智能定义抽帧策略,在保障检测准确率的状况下,晋升审核效率,节约老本,交融 EAST、CRNN、efficient-net、Resnet 等模型,防止繁多模型的误杀和漏检,辨认准确率高。

5. 多语言未成年爱护策略

对侵害未成年的内容进行辨认检测是融云内容审核计划中海内审核的一大特色。

在用户方面,可对未成年的年龄、人脸以及音色进行辨认;
在内容方面,阻断未成年人色情低俗、血腥暴力、思维毒害、个人信息等敏感内容,帮忙平台建设未成年人专属的智能内容举荐计划,通过多方面策略爱护未成年人隐衷。

(未成年爱护策略)


实际案例

国内某社交 App,应用了融云残缺的国内审核服务,当业务步入寰球倒退阶段,仅国内审核不足以撑持简单的场景需要,于是开明了 海内文本 + 视频 + 图片审核 服务,一举解决了三大痛点:

❓在用户聊天过程中,联合语种、语境、变体等来综合判断并屏蔽敏感词。
☑计划:多语言文本审核,智能屏蔽敏感词。

❓对视频进行涉黄、涉暴辨认,特地是针对画中画色情,图片边缘、含糊光线下敏感部位裸露等难辨认的场景。
☑计划:通过主动截帧 - 送审 - 图片审核服务,辨认敏感内容;其中,图片审核服务通过针对性数据加强解决简单场景难题。

❓在图片辨认中,除去国内的涉黄、涉暴、涉政等,有些国家还会对吐舌图片,吸烟、脚部图片有要求,并且辨认简单场景,如长图、海报、画中画、漫画等。
☑计划:图片审核服务启用吐舌、脚部、亲吻、图文、涉黄、涉政等细粒度模型辨认敏感图片。

对于社交利用来说,内容平安问题在任何时候都属于 怎么强调都不为过的生死线问题。融云携手业内业余平台,助力出海开发者寰球通信顺畅无忧,面向广大市场,把好“平安关卡”。

正文完
 0