关于python:5行Python实现验证码识别太稳了

31次阅读

共计 827 个字符,预计需要花费 3 分钟才能阅读完成。

在很久之前,分享过一次 Python 代码实现验证码辨认的方法。

过后采纳的是pillow+pytesseract,长处是收费,较为易用。但其辨认精度个别,若想要更高要求的验证码辨认,初学者就只能去抉择应用百度 API 接口了。

但其实百度 API 接口和 pytesseract 其实都须要进行后期配置,对于初学者来说就不太敌对了。

而且百度 API 必须要联网,对于某些机器不能联网的敌人而言,就得 pass 了

最近群里有位群友分享了一个新库,试用一下发现十分实用,特意明天分享给大家。

该库名也是十分乏味 —— ddddocr(谐音带带弟弟 OCR)

环境要求

python >= 3.8
Windows/Linux/Macox..

能够通过以下命令装置

pip install ddddocr

参数阐明

在网上随机寻找了一个验证码图片,应用这个库来实战一下。

起源:百度搜寻

import ddddocr

ocr = ddddocr.DdddOcr()
with open('1.png', 'rb') as f:
    img_bytes = f.read()
res = ocr.classification(img_bytes)

print(res)

胜利辨认进去了验证码文字!

而且长处也非常明显:首先代码十分精简,比照前文提到的两种办法,不须要额定设置环境变量等等,5 行代码即可轻松辨认验证码图片。另一方面,咱们应用魔法命令 %%time 也测试进去吗,这段代码辨认速度十分快。

上面用更多的验证码图片持续测试:

我又找了 6 个验证码图片来测试,察看后果,发现这类简略的验证码根本能够进行疾速辨认。但也有局部后果有问题——字母大小写没有进行辨别(比方第 6 张图片)。

总而言之,如果你须要进行验证码辨认,且对精度要求不是过高。

那么,带带弟弟 OCR(ddddocr)这个库是一个不错的抉择~

咱们的文章到此就完结啦,如果你喜爱明天的 Python 实战教程,欢送关注公众号:Python 编程学习圈,理解更多编程技术干货。

正文完
 0