共计 2420 个字符,预计需要花费 7 分钟才能阅读完成。
无论大企业或小公司,在面向公众提供的服务中,内容的合规审查都是重中之重。以往这次要依赖人工审核,耗时短暂且老本昂扬。
好在随着 AI 技术的倒退,咱们曾经能够用程序自动检测辨认用户向平台上传的各类内容,检测其中是否蕴含不合规内容,进而依据检测后果酌情采取必要措施。
本文将通过一个实在案例,向大家介绍如何利用 Amazon Rekognition 服务主动查看图像内容,实现疾速、高效、低成本的图像合规审查。
Amazon Rekognition 是什么?
Amazon Rekognition 是一项基于机器学习(ML)技术的图像与视觉剖析服务,可帮忙用户辨认图像及视频中的对象、人物、文本、场景及流动,并同步检测出是否存在不当内容。Amazon Rekognition 文本检测性能则可能从图像及视频中辨认并提取出文本内容。例如,在图像共享与社交媒体利用中,咱们能够应用图像内文本所蕴含的关键字实现图像索引以及可视化搜寻。在媒体与娱乐类利用中,大家还能够依据屏幕上的文本,例如广告、新闻、体育赛事比分以及字幕等等,对视频内容进行分类。
以下截屏,展现了一个提取图像内文本的具体示例。
在本文中,咱们将展现 REA Group 如何通过应用 Amazon Rekognition Text in Image 性能的 DetectText API,为其房地产列表建设起自动化图像合规审查解决方案。
REA Group 简介
REA Group 是一家专门面向房地产与实业资产的跨国数字广告公司。该公司曾经领有 20 多年市场倒退历史,业务遍布澳大利亚、马来西亚、香港、泰国、印度尼西亚、新加坡以及中国。REA Group 在亚洲的业务包含多个当先门户网站品牌,如 iproperty.com.my、squarefoot.com.hk、thinkofliving.com,同时在新加坡与印度尼西亚持有 99 Group 的大量股份。REA Group 还在印度持有 Move, Inc 与 PropTiger 公司的可观股份。他们次要为消费者提供房地产购买、发售与租赁服务,同时公布各类房产新闻、装修技巧以及生存形式层面的内容。每天都有数百万消费者拜访 REA Group 网站。
图像合规难题
REA Group 提供基于搜寻的门户网站,房地产销售商通过该门户上传在售的房地产图片,从而向消费者提供宽泛的可搜寻抉择。但 REA Group 发现,经销商上传的图像往往不合乎应用条款要求。其中局部图片蕴含商标或联系方式,这可能导致潜在的客户散失问题。为此,他们曾建设起专门的审核小组,以人工形式解决图像中的不当内容。但因为每日图像上传量过大,减少的审核过程往往令房产材料的公布工夫延后达数天之久。
图像合规解决方案
为此,REA 团队开发出一套图像合规性零碎,可自动检测图像中存在的各类不合规状况并及时告诉卖方。最后,他们在 Amazon Elastic Compute Cloud(Amazon EC2)上训练了本人的 ML 模型,检测商标与联系方式。但这套模型呈现大量误报,特地是在联系方式细节检测方面体现不佳。为了进一步提高模型的准确率,他们须要在模型训练与优化方面投入大量精力。为了满足我的项目指标并以及工夫要求,该团队须要一套易于施行的解决方案,为业务提供必要的准确率反对。
思考到这一指标,他们决定扩大现有 ML 模型,并在工作流程中引入 Amazon Rekognition Text in Image,以此进步检测准确率并缩小误报。他们还增加了更多业务规定,合成到自研模型和 Amazon Rekognition 的各种预测,从而实现决策自动化。
为了进一步优化推理基础设施的经营老本,REA 团队还采纳一个基于事件驱动的架构来治理商标和联系方式检测模型中的推理引擎,这是利用 AWS Lambda 来实现的。这种形式不仅进步了其基础设施资源的应用效率,也在满足业务指标的同时显著节约了经营老本。
具体工作原理
这套解决方案以无服务器栈为根底,如下图所示。其中图像上传经 Amazon API Gateway 到面向 Amazon Simple Storage Service(Amazon S3)的上传 API,上传事件会触发以 Lambda 函数实现的工作流,运行一系列用于主动决策的机器学习模型和业务规定。
整个事件驱动工作流如下所示:
- 卖方通过 API Gateway 向门户网站提交带有图像的房产列表。
- 图像被上传至 Amazon S3,继而触发 Amazon S3 事件。
- 蕴含 Amazon S3 对象相干元数据的事件,被进一步公布至分布式队列 Amazon Simple Queue Service(Amazon SQS)当中。
- 将 Amazon SQS 与 Lambda 相集成,Lambda 会轮询该队列直到发现新的可用事件调用 Lambda 函数。随着发送至 Amazon SQS 事件的继续减少,Lambda 还会主动调用更多函数来应答。
- 当函数被调用时,函数内的图像审核业务逻辑将被执行,并通过商标及分割信息模型与 Amazon Rekognition 独特推理图像是否存在违规。
- 将模型输入组合起来,即可依据业务规定实现进一步解决,决定后续操作:告诉代理、转发至审核人员团队以进行查看或主动批准。
业务后果
数据迷信与工程负责人 Mohammad Alauddin 示意,“随着业务的增长,晋升效率曾经成为影响咱们扩大规模的重要因素。咱们的团队也开始集思广益,思考如何在更好地服务于客户的同时,放弃团队的高效率。通过 AWS Lambda 与 Amazon Rekognition 在 AWS 利用机器学习,咱们减少了平台上高质量合规列表的数量,同时缩小了列表的审核工夫与老本。此外,咱们不仅在规定的时间表内实现我的项目,并将误报数量缩小了超过 56%。”
总结
大家能够在 Amazon Rekognition 管制台上依据业务要求测试 Amazon Rekognition 的图像文本辨认成果。对于 Amazon Rekognition 文本检测 API 的更多详细信息,请参阅 Amazon Rekognition 阐明文档。