日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > c/c++ >内容正文

c/c++

文档扫描识别——OpenCV与C++实现OCR文字识别

發布時間:2025/3/21 c/c++ 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 文档扫描识别——OpenCV与C++实现OCR文字识别 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前言

1.前面演示了如何通過線段檢測后得到拍照文檔的四個校正點,后把文檔校正,接下就是OCR識別,其實在OCR的時,也可以不用做校正,但對部分場景下的文檔,識別精度可能沒有那么好而已。
2.考慮到之后要在移動端上做APP,在選擇網絡模型時要考慮到移動端的算力,只能選擇適合移動端的小模型,chineseocr_lite和paddle Mobile都是移動端上不錯的選擇,我這里試用了chineseocr_lite的模型。
3.我的開發環境是win10, vs2019, opencv4.5, ncnn,如果要啟用GPU加速,所以用到VulkanSDK,實現語言是C++。
4.帶GUI的效果演示:
校正過之后的效果:

沒有校正的效果:

項目流程

1.文本檢測就是把文檔上所有的文字給檢測出來,檢測到之后才能切行識別,在一些場景下,如果沒有做文檔校正的話,文檔里面很容易出現檢測不到的文本。
2.文本行角度檢測,就是檢測當前文本行的文字方向,其實這步可以不做,這個模型也可以用來做文檔文字方向旋轉。
3.文本識別,就是把檢測到的文本行一行一行的識別。

工程源碼

1.代碼太多了,這里就不展示了,整個工程源碼和可執行GUI測試程序都上傳到CSND,源碼都按接口方式寫好,只要實例化一個對象就可以調用接口,調用示例如下:

#include "MasterOCR.h" #include <iostream> #include <opencv2/opencv.hpp>//OCR std::string ocr_model = "models/ocr/ncnn/"; std::string key_path = "models/ocr/key/keys_v1.txt";int main() {LiteNcnnOCR lite_ocr;lite_ocr.initModel(ocr_model, key_path, 4, true);cv::Mat cv_src = cv::imread("1.jpg",1);if (!cv_src.empty()){std::vector<std::string> result_str;lite_ocr.masterOcr(cv_src, result_str);cv::cvtColor(lite_ocr.cv_padding, cv_src, cv::COLOR_RGB2BGR);drawTextBoxs(cv_src, lite_ocr.text_boxs, 2);for (auto v : result_str){std::cout << v << std::endl;}} }

2.資源
可執行exe:https://download.csdn.net/download/matt45m/76348219
OCR源碼:https://download.csdn.net/download/matt45m/76348353?spm=1001.2014.3001.5503

總結

以上是生活随笔為你收集整理的文档扫描识别——OpenCV与C++实现OCR文字识别的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。