Tesseract图形识别软件的安装
安裝
下載安裝: tesseract
安裝 pytesseract 和 Pillow
pip install pytesseractpip install Pillow這里只說 winsows 系統(tǒng)下的安裝,linux 基本不會(huì)有什么問題。
在利用 pytesseract 調(diào)用 tesseract 時(shí)遇到以下錯(cuò)誤:
于是我看了下pytesseract源碼,發(fā)現(xiàn)有這樣的一行
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLYtesseract_cmd = 'tesseract'估計(jì) windows 系統(tǒng)要手工添加環(huán)境變量,所以才產(chǎn)生的問題,于是又將 tesseract 添加到環(huán)境變量 Path 中,但還是會(huì)報(bào)錯(cuò):
pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\eng.traineddata')這個(gè)是eng.traineddata文件路徑有誤才會(huì)出現(xiàn)的錯(cuò)誤。
解決辦法:
先查看tesseract有沒有這個(gè)語言包,有CMD中輸入命令:
tesseract --list-langs結(jié)果:
List of available languages (2): eng osd然后再查看然后再google搜索一下問題,發(fā)現(xiàn)還是 tesseract 的環(huán)境變量的問題,找到了下面這一句話
Please make sure the TESSDATA_PREFIX environment variableisset to the
parent directory of your"tessdata"directory.
于是新建的一個(gè)TESSDATA_PREFIX變量,指定tessdata的上級(jí)目錄也就是C:\Program Files (x86)\Tesseract-OCR
安裝完成。
先用一個(gè)簡(jiǎn)單的驗(yàn)證碼測(cè)試一下:
from PIL import Image import pytesseract result = pytesseract.image_to_string(Image.open(r'F:\PIN_ws\692.jpg',"r"), lang='eng') print(result)
總結(jié)
以上是生活随笔為你收集整理的Tesseract图形识别软件的安装的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 用 Win7,硬件也有新天地
- 下一篇: DS4700电池更换步骤