當前位置：首頁 > 编程语言 > python >内容正文

python

studioone精调效果包_cnocr: 极简的中文OCR Python包

發布時間：2024/10/14 python 50 豆豆

生活随笔收集整理的這篇文章主要介紹了 studioone精调效果包_cnocr: 极简的中文OCR Python包小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Update 2020.04.21: 發布 cnocr V1.1.0

更輕量的 cnocr-V1.1.0 ：最小模型只有 6.8M。具體說明見：

BreezeDeus：更輕量的 cnocr-V1.1.0 ：最小模型只有 6.8M?zhuanlan.zhihu.com

Update 2019.07.25: 發布 cnocr V1.0.0

cnocr發布了預測效率更高的新版本v1.0.0。具體說明見

https://github.com/breezedeus/cnocr/blob/master/README_cn.md?github.com

主要更新如下：

crnn模型支持可變長預測，提升預測效率
支持利用特定數據對現有模型進行精調（繼續訓練）
修復bugs，如訓練時accuracy一直為0等

雖然現在的對話機器人主要理解的還是用戶的文本信息，但對圖片（尤其是表情）、視頻和語音的理解，也逐漸地會成為機器人的標配能力。

理解圖片的一種最簡單的方式，就是識別圖片中的文字，做這個事的技術主要有兩種：OCR（Optical Character Recognition，光學字符識別），或者STR（Scene Text Recognition，場景文字識別）。

OCR主要針對文字比較規范，沒什么底色或底色單一的圖片，類文字掃描后獲得的圖片，如：

STR針對的圖片是更一般的復雜場景，比如隨手拍的照片中廣告牌上的文字，店鋪名稱等，如：

顯然STR比OCR難得多，所以使用的方法也會更復雜更耗資源。很多應用場景使用OCR技術就足夠了。

因為項目需要，我之前找了下已有可用的開源中文OCR工具，發現居然沒有特別好用的。所以就自己封裝了一個中文OCR Python包，稱之為 cnocr（Chinese OCR的簡稱），項目地址為：

https://github.com/breezedeus/cnocr?github.com

cnocr主打使用簡單，功能極簡。

以下是使用說明，歡迎大家試用，幫忙提issue。

cnocr

cnocr是用來做中文OCR的Python 3包。cnocr自帶了訓練好的識別模型，所以安裝后即可直接使用。

目前使用的識別模型是crnn，識別準確度約為 98.7%。

本項目起源于我們自己 (愛因互動 Ein+) 內部的項目需求，所以非常感謝公司的支持。

特色

本項目的大部分代碼都fork自 crnn-mxnet-chinese-text-recognition，感謝作者。但源項目使用起來不夠方便，所以我在此基礎上做了一些封裝和重構。主要變化如下：

不再使用需要額外安裝的MXNet WarpCTC Loss，改用原生的 MXNet CTC Loss。所以安裝極簡！
自帶訓練好的中文OCR識別模型。不再需要額外訓練！
增加了預測（或推斷）接口。所以使用方便！

安裝

pip install cnocr注意：請使用Python3 (3.4, 3.5, 3.6以及之后版本應該都行)，沒測過Python2下是否ok。

使用方法

以如下圖片文件為例，文件內容如下：

預測

代碼引用

from cnocr import CnOcr ocr = CnOcr() res = ocr.ocr_for_single_line('examples/rand_cn1.png') print("Predicted Chars:", res)

首次使用cnocr時，系統會自動從Dropbox下載zip格式的模型壓縮文件，并存于 ~/.cnocr目錄。下載后的zip文件代碼會自動對其解壓，然后把解壓后的模型相關文件放于~/.cnocr/models目錄。如果系統不能自動從Dropbox成功下載zip文件，則需要手動下載此zip文件并把它放于 ~/.cnocr目錄。另一個下載地址是百度云盤(提取碼為pg26)。放置好zip文件后，后面的事代碼就會自動執行了。

上面預測代碼段的返回結果如下：

Predicted Chars: ['笠', '淡', '嘿', '驊', '謐', '鼎', '皋', '姚', '殲', '蠢', '駝', '耳', '胬', '撾', '涯', '狗', '蒽', '子', '獷']

腳本引用

也可以使用腳本模式預測：

python scripts/cnocr_predict.py --file examples/rand_cn1.png

返回結果和前面相同：

Predicted Chars: ['笠', '淡', '嘿', '驊', '謐', '鼎', '皋', '姚', '殲', '蠢', '駝', '耳', '胬', '撾', '涯', '狗', '蒽', '子', '獷']

訓練自己的模型

cnocr安裝后即可直接使用，但如果你非要訓練自己的模型，請參考下面命令：

python scripts/cnocr_train.py --cpu 2 --num_proc 4 --loss ctc --dataset cn_ocr

未來工作

支持空格識別
修bugs（目前代碼還比較凌亂。。）
完善測試用例
考慮使用MxNet的命令式編程重寫代碼，提升靈活性
嘗試新模型，如 DenseNet、ResNet，進一步提升識別準確率

總結

以上是生活随笔為你收集整理的studioone精调效果包_cnocr: 极简的中文OCR Python包的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： sht20温湿度传感器原理图_温湿度传感
下一篇： python去除中文停用词_删除停止词P