日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

文档扫描识别——OpenCV与C++实现OCR文字识别

發布時間:2025/3/21 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 文档扫描识别——OpenCV与C++实现OCR文字识别 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前言

1.前面演示了如何通過線段檢測后得到拍照文檔的四個校正點,后把文檔校正,接下就是OCR識別,其實在OCR的時,也可以不用做校正,但對部分場景下的文檔,識別精度可能沒有那么好而已。
2.考慮到之后要在移動端上做APP,在選擇網絡模型時要考慮到移動端的算力,只能選擇適合移動端的小模型,chineseocr_lite和paddle Mobile都是移動端上不錯的選擇,我這里試用了chineseocr_lite的模型。
3.我的開發環境是win10, vs2019, opencv4.5, ncnn,如果要啟用GPU加速,所以用到VulkanSDK,實現語言是C++。
4.帶GUI的效果演示:
校正過之后的效果:

沒有校正的效果:

項目流程

1.文本檢測就是把文檔上所有的文字給檢測出來,檢測到之后才能切行識別,在一些場景下,如果沒有做文檔校正的話,文檔里面很容易出現檢測不到的文本。
2.文本行角度檢測,就是檢測當前文本行的文字方向,其實這步可以不做,這個模型也可以用來做文檔文字方向旋轉。
3.文本識別,就是把檢測到的文本行一行一行的識別。

工程源碼

1.代碼太多了,這里就不展示了,整個工程源碼和可執行GUI測試程序都上傳到CSND,源碼都按接口方式寫好,只要實例化一個對象就可以調用接口,調用示例如下:

#include "MasterOCR.h" #include <iostream> #include <opencv2/opencv.hpp>//OCR std::string ocr_model = "models/ocr/ncnn/"; std::string key_path = "models/ocr/key/keys_v1.txt";int main() {LiteNcnnOCR lite_ocr;lite_ocr.initModel(ocr_model, key_path, 4, true);cv::Mat cv_src = cv::imread("1.jpg",1);if (!cv_src.empty()){std::vector<std::string> result_str;lite_ocr.masterOcr(cv_src, result_str);cv::cvtColor(lite_ocr.cv_padding, cv_src, cv::COLOR_RGB2BGR);drawTextBoxs(cv_src, lite_ocr.text_boxs, 2);for (auto v : result_str){std::cout << v << std::endl;}} }

2.資源
可執行exe:https://download.csdn.net/download/matt45m/76348219
OCR源碼:https://download.csdn.net/download/matt45m/76348353?spm=1001.2014.3001.5503

總結

以上是生活随笔為你收集整理的文档扫描识别——OpenCV与C++实现OCR文字识别的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。