日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

ocr 识别 github 源码

發布時間:2024/8/1 编程问答 41 豆豆
生活随笔 收集整理的這篇文章主要介紹了 ocr 识别 github 源码 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

參考

[1]?https://github.com/eragonruan/text-detection-ctpn

[2]?https://github.com/senlinuc/caffe_ocr

[3]?https://github.com/YCG09/chinese_ocr? 感謝作者!

[4]?https://github.com/xiaomaxiao/keras_ocr

?

認真看源碼!

基于Tensorflow和Keras實現端到端的不定長中文字符檢測和識別

  • 文本檢測:CTPN
  • 文本識別:DenseNet + CTC

環境部署

  • Bash
    sh setup.sh
    ```
    * 注:CPU環境執行前需注釋掉for gpu部分,并解開for cpu部分的注釋

  • Demo

    將測試圖片放入test_images目錄,檢測結果會保存到test_result中

    ``` Bash
    python demo.py
    ```

  • 一定在終端運行demo.py 代碼,另外,因不能連接外網,所以在進行依賴時,需要用公司鏡像完成安裝。
  • 釋放占用的顯存時,只需要kernel,restart重啟即可。在jupyter notebook中加!命令,相當于終端執行的命令。
  • 切換python環境 source activate base 即可切換到常用的,安裝有許多依賴庫的 anaconda2 python2環境。這樣才能運行demo.py.

Demo

將測試圖片放入test_images目錄,檢測結果會保存到test_result中

python demo.py

模型訓練

CTPN訓練

詳見ctpn/README.md

DenseNet + CTC訓練

1. 數據準備

數據集:https://pan.baidu.com/s/1QkI7kjah8SPHwOQ40rS1Pw?(密碼:lu7m)

  • 共約364萬張圖片,按照99:1劃分成訓練集和驗證集
  • 數據利用中文語料庫(新聞 + 文言文),通過字體、大小、灰度、模糊、透視、拉伸等變化隨機生成
  • 包含漢字、英文字母、數字和標點共5990個字符
  • 每個樣本固定10個字符,字符隨機截取自語料庫中的句子
  • 圖片分辨率統一為280x32

圖片解壓后放置到train/images目錄下,描述文件放到train目錄下

2. 訓練

cd train python train.py

3. 結果

val accpredictmodel
0.9838ms18.9MB
  • GPU: GTX TITAN X
  • Keras Backend: Tensorflow

4. 生成自己的樣本

可參考SynthText_Chinese_version,TextRecognitionDataGenerator和text_renderer

效果展示

?

總結

以上是生活随笔為你收集整理的ocr 识别 github 源码的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。