python智能识别_Python人工智能识别文字内容(OCR)
環境準備
安裝pytesseract和PIL安裝這兩個包可以借助pip命令行安裝
pip install PIL
pip install pytesseract
安裝識別引擎tesseract-ocr
下載地址:
選擇對應版本下載
實現及效果
原圖
代碼
from PIL import Image
import pytesseract
#上面都是導包,只需要下面這一行就能實現圖片文字識別
text=pytesseract.image_to_string(Image.open('1.png'),lang='eng')
print(text)
說明:lang=“為模型名稱”。
效果
TesseractNotFoundError錯誤,提示未發現Tesseract-OCR安裝路徑
解決方案:
1、將Tesseract-OCR配置為環境變量
2、修改pytesseract.py源碼,如下圖:
再次運行效果
附錄:
要是實現中文識別,需要下載中文模型:
修改源碼的模型名稱即可。
代碼
from PIL import Image
import pytesseract
#上面都是導包,只需要下面這一行就能實現圖片文字識別
text=pytesseract.image_to_string(Image.open('test2.jpg'),lang='chi_sim')
print(text)
原圖
效果
謹以此文獻給即將成熟的我們,都成了與想象中截然不同的人
總結
以上是生活随笔為你收集整理的python智能识别_Python人工智能识别文字内容(OCR)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python网页运行环境_Python小
- 下一篇: pythondocx文档重叠_使用PYT