PaddleOCR 是基于 PaddlePaddle 的多语言超轻量 OCR 工具包,反对 80+ 语言辨认,提供数据标注和合成工具,反对服务器、挪动、嵌入式和物联网设施之间的训练和部署,旨在打造一套丰盛、当先、且实用的 OCR 工具库,助力使用者训练出更好的模型,并利用落地。
在部署方面,PaddleOCR 针对不同利用场景,提供了三种预测部署计划。
- Inference 离线预测 ,这种形式次要利用在对预测响应的及时性要求不高,特地是须要大量图片预测的场景。像文档电子化、广告信息提取等。尽管不能及时响应预测申请,然而没有网络延时,计算效率比拟高,数据安全性很高。
- Serving 服务化部署 ,这种形式次要利用在对预测响应的及时性要求很高的场景,像商业化 OCR 的 API 接口、实时拍照翻译、拍题等场景。尽管这种形式能及时对预测需要及时响应,然而网络耗时开销比拟大,GPU 利用率往往不高,而且存在数据安全危险。
- Lite 端侧部署 ,这种形式次要心愿模型部署到手机、机器人等端侧设施上,次要思考部署不便和数据安全性,像手机 APP 外面身份证辨认、银行卡辨认,工业利用场景的仪表监控辨认等。这种办法,对 OCR 模型的大小比拟敏感。尽管没有网络延时,数据安全性很高,然而因为算力限度,预测效率不高
其中,在桌面场景下,Inference 离线预测是最受欢迎的计划之一,Inference 推理有多种语言的实现, 本周三、周四早晨(2 月 23 日 -24 日),将有 3 位飞桨社区开发者为咱们具体分享 PaddleOCR 在 Java 和 C# 的部署计划 ,欢送大家退出技术交换群,获取直播链接~
相干我的项目领先看:
- OCR java SDK 工具箱:蕴含方向检测,图片旋转,文字辨认,版面剖析,表格辨认等。我的项目链接:https://github.com/mymagicpower/AIAS/blob/main/1_image_sdks/text_recognition/ocr_sdk/README.md2. PaddleOCR 的.NET 调用库:蕴含文本辨认、文本检测、基于文本检测后果的统计分析的表格辨认性能并进行了针对性优化。我的项目链接:https://github.com/raoyutian/PaddleOCRSharp3. Paddle Inference 的.NET/C# 调用形式,蕴含 PaddleOCR 模型的调用及部署且同时反对 Windows/Linux 平台。我的项目链接:https://github.com/sdcb/PaddleSharp
PaddleOCR 我的项目地址:
GitHub: https://github.com/PaddlePaddle/PaddleOCR
Gitee: https://gitee.com/paddlepaddle/