日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

studioone精调效果包_cnocr: 极简的中文OCR Python包

發布時間:2024/10/14 python 50 豆豆
生活随笔 收集整理的這篇文章主要介紹了 studioone精调效果包_cnocr: 极简的中文OCR Python包 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Update 2020.04.21: 發布 cnocr V1.1.0

更輕量的 cnocr-V1.1.0 :最小模型只有 6.8M。具體說明見:

BreezeDeus:更輕量的 cnocr-V1.1.0 :最小模型只有 6.8M?zhuanlan.zhihu.com

Update 2019.07.25: 發布 cnocr V1.0.0

cnocr發布了預測效率更高的新版本v1.0.0。具體說明見

https://github.com/breezedeus/cnocr/blob/master/README_cn.md?github.com

主要更新如下:

  • crnn模型支持可變長預測,提升預測效率
  • 支持利用特定數據對現有模型進行精調(繼續訓練)
  • 修復bugs,如訓練時accuracy一直為0等

雖然現在的對話機器人主要理解的還是用戶的文本信息,但對圖片(尤其是表情)、視頻和語音的理解,也逐漸地會成為機器人的標配能力。

理解圖片的一種最簡單的方式,就是識別圖片中的文字,做這個事的技術主要有兩種:OCR(Optical Character Recognition,光學字符識別),或者STR(Scene Text Recognition,場景文字識別)。

OCR主要針對文字比較規范,沒什么底色或底色單一的圖片,類文字掃描后獲得的圖片,如:

STR針對的圖片是更一般的復雜場景,比如隨手拍的照片中廣告牌上的文字,店鋪名稱等,如:

顯然STR比OCR難得多,所以使用的方法也會更復雜更耗資源。很多應用場景使用OCR技術就足夠了。

因為項目需要,我之前找了下已有可用的開源中文OCR工具,發現居然沒有特別好用的。 所以就自己封裝了一個中文OCR Python包,稱之為 cnocr(Chinese OCR的簡稱),項目地址為:

https://github.com/breezedeus/cnocr?github.com

cnocr主打使用簡單,功能極簡。

以下是使用說明,歡迎大家試用,幫忙提issue。

cnocr

cnocr是用來做中文OCR的Python 3包。cnocr自帶了訓練好的識別模型,所以安裝后即可直接使用。

目前使用的識別模型是crnn,識別準確度約為 98.7%。

本項目起源于我們自己 (愛因互動 Ein+) 內部的項目需求,所以非常感謝公司的支持。

特色

本項目的大部分代碼都fork自 crnn-mxnet-chinese-text-recognition,感謝作者。 但源項目使用起來不夠方便,所以我在此基礎上做了一些封裝和重構。主要變化如下:

  • 不再使用需要額外安裝的MXNet WarpCTC Loss,改用原生的 MXNet CTC Loss。所以安裝極簡!
  • 自帶訓練好的中文OCR識別模型。不再需要額外訓練!
  • 增加了預測(或推斷)接口。所以使用方便!

安裝

pip install cnocr注意:請使用Python3 (3.4, 3.5, 3.6以及之后版本應該都行),沒測過Python2下是否ok。

使用方法

以如下圖片文件為例,文件內容如下:

預測

代碼引用

from cnocr import CnOcr ocr = CnOcr() res = ocr.ocr_for_single_line('examples/rand_cn1.png') print("Predicted Chars:", res)

首次使用cnocr時,系統會自動從Dropbox下載zip格式的模型壓縮文件,并存于 ~/.cnocr目錄。 下載后的zip文件代碼會自動對其解壓,然后把解壓后的模型相關文件放于~/.cnocr/models目錄。 如果系統不能自動從Dropbox成功下載zip文件,則需要手動下載此zip文件并把它放于 ~/.cnocr目錄。 另一個下載地址是百度云盤(提取碼為pg26)。 放置好zip文件后,后面的事代碼就會自動執行了。

上面預測代碼段的返回結果如下:

Predicted Chars: ['笠', '淡', '嘿', '驊', '謐', '鼎', '皋', '姚', '殲', '蠢', '駝', '耳', '胬', '撾', '涯', '狗', '蒽', '子', '獷']

腳本引用

也可以使用腳本模式預測:

python scripts/cnocr_predict.py --file examples/rand_cn1.png

返回結果和前面相同:

Predicted Chars: ['笠', '淡', '嘿', '驊', '謐', '鼎', '皋', '姚', '殲', '蠢', '駝', '耳', '胬', '撾', '涯', '狗', '蒽', '子', '獷']

訓練自己的模型

cnocr安裝后即可直接使用,但如果你非要訓練自己的模型,請參考下面命令:

python scripts/cnocr_train.py --cpu 2 --num_proc 4 --loss ctc --dataset cn_ocr

未來工作

  • 支持空格識別
  • 修bugs(目前代碼還比較凌亂。。)
  • 完善測試用例
  • 考慮使用MxNet的命令式編程重寫代碼,提升靈活性
  • 嘗試新模型,如 DenseNet、ResNet,進一步提升識別準確率

總結

以上是生活随笔為你收集整理的studioone精调效果包_cnocr: 极简的中文OCR Python包的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。