共计 284 个字符,预计需要花费 1 分钟才能阅读完成。
tesseract 是 python 的一个 OCR 辨认库
在应用 pytesseract 之前咱们须要去下载 tesseract
下载地址:https://digi.bib.uni-mannheim.de/tesseract/
过程可能会相当的慢。
下载实现后要将 Tesseract-OCR 文件夹中的 tessdata 文件夹增加到零碎环境变量当中。
重点
像上述一样
变量名:TESSDATA_PREFIX
变量值:tessdata 文件夹门路
而后在 pycharm 中 下载 pytesseractpip install pytesseract
下载实现后咱们能够做一个小测试
测试图片:
测试后果:
这样子就实现啦!
正文完