日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

人工智能学习--文本识别实践-tesseract-ocr

發布時間:2025/3/13 编程问答 53 豆豆
生活随笔 收集整理的這篇文章主要介紹了 人工智能学习--文本识别实践-tesseract-ocr 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前提假設:

1. 所要檢測的圖片是純文本或者文字,最好是只有一行; 或者截圖只有一行文本的圖片。如下圖

圖片名稱: text03.jpg

?

2. 從文本檢測(深度學習網絡)軟件檢測到的 包含文本區域的圖片。

?

開源文本識別軟件(OCR)

Tesseract-OCR?

下載鏈接:https://digi.bib.uni-mannheim.de/tesseract/

可以根據自己的電腦操作系統位數決定下載32位 或者 64位,按照時間順序,可以下載最新的版本。

安裝步驟:

下載完后,是 .exe格式文件,點擊安裝,一直下一步就可以了。

注釋: 如果有提示:選擇下載包(在additional language data (download 下選擇中數學公式庫和中文庫Chinese(simplified)(traditional)),兩者都選上, 點擊“next”繼續

注釋:如果選中additional的√ 鉤號, 安裝時可能提示一個錯誤,不管它,直接按 enter 鍵盤按鍵,直到裝完。

筆者是裝在 E:| 盤,,,目錄是E:\ Tesseract-OCR

?

環境配置:

1. 將Tesseract-OCR安裝目錄(E:\Tesseract-OCR)加入環境變量path中;? ? 環境變量獲取方式:右鍵 桌面上的 “計算機”圖標, 然后如下圖所示。 雙擊 PATH 在最末尾加入剛剛軟件安裝的目錄。

2 新建環境變量,變量名TESSDATA_PREFIX?并賦值為E:\Tesseract-OCR\tessdata

?

?

運行方法:

Windows的 cmd命令行模式下 運行, 如下圖紅色框里,可以正確檢測前面 text.jpg 圖片里的英文內容。

tesseract 是命令

第一個目錄是要識別的圖片目錄和文件名

第二個目錄是結果要保存的目錄和文件名

-l 是選項符號,(-后面那個小寫字母是L的小寫)

eng 是English的縮寫,在目錄 E:\Tesseract-OCR\tessdata目錄下, 完整名稱是下圖的紅色框內? eng.traineddata文件名。

makebox是固定的寫法

注釋:如果想要檢測中文文字的圖片,則需要下載?chi_sim.traineddata文件, 下載地址:https://github.com/tesseract-ocr/tessdata

注釋: 如果以上GitHub打不開可以試試,CSDN的加速計劃?https://codechina.csdn.net/mirrors/tesseract-ocr/tessdata?utm_source=csdn_github_accelerator

?

運行結果:

運行結果是一個 .box 文件, 可以用 文本類編輯工具軟件打開或記事本打開 查看內容

結果是一行一個字母,如果圖像比較干凈,無干擾背景紋理的話,檢測準確率很高。

?

Python 版本,沒測試:可以參考:

https://zhuanlan.zhihu.com/p/113961004

https://blog.csdn.net/qq_41030861/article/details/99842001?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&dist_request_id=&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control

?

總結:

用于簡單的圖片,例如白底黑字,一行或者多行文字,字符直接比較松散,則檢測結果質量較高,準確率較高。

若,圖片中背景顏色很雜很多干擾因素,或者黑底白粗字,或者傾斜或者 其他門牌號廣告牌等大字體,藝術字體,則幾乎無法正確識別。 想要識別這些場景下的文字,則需要用深度學習神經網絡模型,網上有很多開源軟件,需要GPU伺候。

總結

以上是生活随笔為你收集整理的人工智能学习--文本识别实践-tesseract-ocr的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。