在工作或者是本人练习开发的工程中,为了进步开发的一个效率,咱们常常会去各个接口商店查看有没有合乎本人需要的 API,而后申请 API 服务,申请实现间接就能够接入到本人的我的项目当中。这样就极大的进步了咱们的一个开发效率。
最近在网上看到了 APISpace 的一个接口服务平台,外面的接口都蛮不错的,从申请到接入整个流程都十分的简洁顺畅。明天我给大家分享它外面的一个 API——通用文字辨认 OCR。
性能介绍
标准版:对图片中的文字进行检测和辨认,反对多种语言。并且蕴含文字在图片中的地位信息,不便进行版式的二次解决。
利用场景
- 拍照 / 截图辨认
应用通用文字辨认技术,实现拍照文字辨认、相册图片文字辨认和截图文字辨认,可利用于搜寻、书摘、笔记、翻译等挪动利用中,不便用户进行文本的提取或录入,无效晋升产品易用性和用户应用体验。 - 内容审核与监管
主动提取图像中的文字内容,联合文本审核技术辨认违规内容,提醒相应危险,帮助进行违规解决,可利用于电商广告审核、舆情监管等场景,帮忙企业无效躲避业务危险。 - 视频内容分析
检测辨认视频中的字幕、题目、弹幕等文字内容,并依据文字地位判断文字类型,可利用于视频分类和标签提取、视频内容审核、营销剖析等场景,无效晋升内容分类、检索的效率。 -
纸质文档电子化
辨认提取各类医疗单据、金融财税票据、法律卷宗等纸质文档中的文字信息,并可基于地位信息进行比对、结构化解决,进步信息录入、存档、检索的效率。接口详情
- 接口简介:多场景、多语种、高精度的整图文字检测和辨认服务,多项指标行业当先,可辨认中、英、日、韩、法、德多种语言。
- 申请形式:POST
- 申请格局:JSON
- 申请参数:
- 返回参数:
{
"word_result": {
"54354377xxxx638": [[185, 166],
[447, 166],
[447, 186],
[185, 186]
],
"寄件方:": [[61, 232],
[150, 232],
[150, 260],
[61, 260]
],
"李 x 茹": [[57, 281],
[149, 281],
[149, 314],
[57, 314]
],
"17600xxxx77": [[532, 277],
[738, 277],
[738, 300],
[532, 300]
],
"北京市北京市昌平区龙泽园街道苑": [[61, 331],
[582, 332],
[582, 356],
[61, 355]
],
"收件方:": [[60, 426],
[150, 426],
[150, 454],
[60, 454]
],
"夏 x 萌": [[57, 477],
[148, 477],
[148, 508],
[57, 508]
],
"15798xxxx56": [[531, 480],
[737, 480],
[737, 503],
[531, 503]
],
"广东省广州市天河区天河南街道体育西路": [[58, 523],
[739, 525],
[739, 552],
[58, 550]
]
},
"word_count": 9,
"log_id": "165658704014560536668263"
}