绝了,dddd带带弟弟OCR识别验证码
前言
上一篇介紹了通過 python 的 pytesserract 模塊進行識別驗證碼,但是他只能識別一些簡單的驗證碼,比如像這種。
遇到稍微復雜一點的驗證碼,就會識別不了。
那咋辦?
網上找了一圈,介紹了不同的第三方平臺識別驗證碼,像百度 ocr 、打碼兔、超級鷹等,其中百度 ocr 呼聲最高。
鏈接: https://cloud.baidu.com/product/ocr_others/webimage
奈何去試了一下,上面 3T9Q 這個驗證碼都不能識別出來...
而且收費還不低。
算了,后面在 github 上找到一個開源庫,而且還很強大。這個庫叫 ddddocr ,
帶帶弟弟,
哲哥的博客地址:https://wenanzhe.com/
不單單可以學到技術,還可以學到不少的人生道理。左邊技術,右邊人生道理。
網友們對這個庫高度評價,
ddddorc 安裝使用
環境要求:
python <= 3.9
Windows/Linux/Macos..
以下是在windows上安裝
更新 pip
python -m pip install --upgrade pip -i https://pypi.douban.com/simple
不更新 pip 有可能會安裝失敗。
安裝 ddddocr
pip install ddddocr -i https://pypi.douban.com/simple
使用方法
# -*- coding:utf-8 -*-
import ddddocr # 導入 ddddocr
ocr = ddddocr.DdddOcr() # 實例化
with open('002.png', 'rb') as f: # 打開圖片
img_bytes = f.read() # 讀取圖片
res = ocr.classification(img_bytes) # 識別
print(res)
單個圖片的識別:
多個圖片識別:
# -*- coding:utf-8 -*-
import ddddocr # 導入 ddddocr
ocr = ddddocr.DdddOcr()
for i in range(1, 4):
with open(str(i) + '.png', 'rb') as f:
img_bytes = f.read()
res = ocr.classification(img_bytes)
print(res)
有些大小寫還是不能識別出來。
封裝一下:
# -*- coding:utf-8 -*-
import ddddocr
ocr = ddddocr.DdddOcr()
def ddocr(file):
try:
with open(file, 'rb') as f:
img_bytes = f.read()
res = ocr.classification(img_bytes)
return res
except:
print("獲取驗證碼失敗,請繼續!")
r = ddocr('3.png')
print(r)
分界線----------------------------------------------
運行過程中,有可能會遇到這個問題。
ddddocr模塊的項目使用pyinstaller 打包后報錯 ImportError: Microsoft Visual C++ Redistributable for Visual Studio 2019 not installed on the machine.
解決辦法:
安裝Microsoft Visual C++ Redistributable 2019
https://aka.ms/vs/16/release/VC_redist.x64.exe
直接點擊就可以下載了,下載后直接安裝即可。
總結
以上是生活随笔為你收集整理的绝了,dddd带带弟弟OCR识别验证码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何快糙好猛的使用Shiqi.Yu老师的
- 下一篇: 乌班图docker版本18.04升级到1