日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

基于连通域字符分割的流程_基于OpenCV及连通域分析进行文本块分割

發(fā)布時(shí)間:2025/3/21 编程问答 46 豆豆
生活随笔 收集整理的這篇文章主要介紹了 基于连通域字符分割的流程_基于OpenCV及连通域分析进行文本块分割 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

上一次通過投影的方式進(jìn)行了文本塊分割,但這種方法有很大的局限性,要求分行清晰、不能有字符跨多行、不能傾斜,而且對(duì)噪聲比較敏感。還是拿上一回的圖片,但是我在上面加了一個(gè)比較大的字,得出的結(jié)果就有問題了:

可以看到,由于右下角大大的“測(cè)”字跨了多行,導(dǎo)致水平投影分行時(shí)就出錯(cuò)了。

本次換一種方法,基于連通性分析來做。簡(jiǎn)單講,就是把圖像做一定的膨脹操作,使得同一個(gè)字符的不同部分以及相鄰字符相互重疊到一起,變成一個(gè)整體,然后再通過分析找到每一個(gè)獨(dú)立的塊,排除掉噪聲,剩下的基本就是符合條件的結(jié)果了。

直接上代碼,后面再分析:

using?System;

using?System.Collections.Generic;

using?System.IO;

using?System.Text;

using?OpenCvSharp;

using?OpenCvSharp.Extensions;

using?OpenCvSharp.Utilities;

namespace?OpenCvTest

{

class?Program

{

static?void?Main(string[]?args)

{

//讀入源文件

var?src?=?IplImage.FromFile("source.jpg");

//轉(zhuǎn)換到灰度圖

var?gray?=?Cv.CreateImage(src.Size,?BitDepth.U8,?1);

Cv.CvtColor(src,?gray,?ColorConversion.BgrToGray);

//做一下膨脹,x與y方向都做,但系數(shù)不同

var?kernal?=?Cv.CreateStructuringElementEx(5,?2,?1,?1,?ElementShape.Rect);

Cv.Erode(gray,?gray,?kernal,?2);

//二值化

Cv.Threshold(gray,?gray,?0,?255,?ThresholdType.BinaryInv?|?ThresholdType.Otsu);

//檢測(cè)連通域,每一個(gè)連通域以一系列的點(diǎn)表示,FindContours方法只能得到第一個(gè)域

var?storage?=?Cv.CreateMemStorage();

CvSeq?contour?=?null;

Cv.FindContours(gray,?storage,?out?contour,?CvContour.SizeOf,?ContourRetrieval.CComp,?ContourChain.ApproxSimple);

var?color?=?new?CvScalar(0,?0,?255);

//開始遍歷

while?(contour?!=?null)

{

//得到這個(gè)連通區(qū)域的外接矩形

var?rect?=?Cv.BoundingRect(contour);

//如果高度不足,或者長(zhǎng)寬比太小,認(rèn)為是無效數(shù)據(jù),否則把矩形畫到原圖上

if(rect.Height?>?10?&&?(rect.Width?*?1.0?/?rect.Height)?>?0.2)

Cv.DrawRect(src,?rect,?color);

//取下一個(gè)連通域

contour?=?contour.HNext;

}

Cv.ReleaseMemStorage(storage);

//顯示

Cv.ShowImage("Result",?src);

Cv.WaitKey();

Cv.DestroyAllWindows();

}

}

}

下面來一步一步分析。讀入的原圖是這樣的:

轉(zhuǎn)換到灰度圖并膨脹處理后,已經(jīng)可以大致看出同一文本塊的多個(gè)字符已經(jīng)連到一起了:

二值化后的圖像:

做連通性分析后,原始分析出的結(jié)果是這樣的:

Cv.DrawContours(src,?contour,?color,?color,?1);

對(duì)每個(gè)連通域取外接矩形,得到的最終結(jié)果是這樣的:

可以看到效果比之前好了很多,比較大的字可以作為獨(dú)立的文本塊被檢測(cè)出來了。另外即使是同一行的文本塊,也會(huì)有輕微的上下浮動(dòng),不再是絕對(duì)按行對(duì)齊了。

未經(jīng)許可嚴(yán)禁轉(zhuǎn)載。

總結(jié)

以上是生活随笔為你收集整理的基于连通域字符分割的流程_基于OpenCV及连通域分析进行文本块分割的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。