关于linux:图像文字提取功能

12次阅读

共计 562 个字符,预计需要花费 2 分钟才能阅读完成。

实现图像文字提取性能

零碎:macOS

相干教程:https://segmentfault.com/a/11…

一、装置软件

# 根本装置
brew install  tesseract

# 装置 tesseract 的同时装置训练工具
brew install --with-training-tools tesseract
 
# 装置 tesseract 的同时装置所有语言,语言包比拟大,如果装置的话工夫较长,倡议不装置,按需抉择
brew install  --all-languages tesseract
 
# 装置 tesseract,并装置训练工具和语言
brew install --all-languages --with-training-tools tesseract 

二、查看装置

# 装置后软件地位

/usr/local/Cellar

# 语言库地址

https://github.com/tesseract-ocr/tessdata

# 语言包地位

/usr/local/Cellar/tesseract/4.0.0_1/share/tessdata

进入语言库下载简体中文并放到语言包地位

三、测试

输出 tesseract 测试是否装置胜利

测试图片辨认

tesseract + 图片门路 + 保留后果名 + -l 语言集 

原图片

辨认后

感觉随随便便吧,然而性能实现了,该进去的都进去了

不定期更新:Github

正文完
 0