在很久之前,分享过一次 Python 代码实现验证码辨认的方法。
过后采纳的是pillow
+pytesseract
,长处是收费,较为易用。但其辨认精度个别,若想要更高要求的验证码辨认,初学者就只能去抉择应用百度 API 接口了。
但其实百度 API 接口和 pytesseract 其实都须要进行后期配置,对于初学者来说就不太敌对了。
而且百度 API 必须要联网,对于某些机器不能联网的敌人而言,就得 pass 了
最近群里有位群友分享了一个新库,试用一下发现十分实用,特意明天分享给大家。
该库名也是十分乏味 —— ddddocr(谐音带带弟弟 OCR)
环境要求:
python >= 3.8
Windows/Linux/Macox..
能够通过以下命令装置
pip install ddddocr
参数阐明:
在网上随机寻找了一个验证码图片,应用这个库来实战一下。
起源:百度搜寻
import ddddocr
ocr = ddddocr.DdddOcr()
with open('1.png', 'rb') as f:
img_bytes = f.read()
res = ocr.classification(img_bytes)
print(res)
胜利辨认进去了验证码文字!
而且长处也非常明显:首先代码十分精简,比照前文提到的两种办法,不须要额定设置环境变量等等,5 行代码即可轻松辨认验证码图片。另一方面,咱们应用魔法命令 %%time
也测试进去吗,这段代码辨认速度十分快。
上面用更多的验证码图片持续测试:
我又找了 6 个验证码图片来测试,察看后果,发现这类简略的验证码根本能够进行疾速辨认。但也有局部后果有问题——字母大小写没有进行辨别(比方第 6 张图片)。
总而言之,如果你须要进行验证码辨认,且对精度要求不是过高。
那么,带带弟弟 OCR(ddddocr)这个库是一个不错的抉择~
咱们的文章到此就完结啦,如果你喜爱明天的 Python 实战教程,欢送关注公众号:Python 编程学习圈,理解更多编程技术干货。