當(dāng)前位置：首頁 >

基于连通域字符分割的流程_基于OpenCV及连通域分析进行文本块分割

發(fā)布時(shí)間：2025/3/21 49 豆豆

生活随笔收集整理的這篇文章主要介紹了基于连通域字符分割的流程_基于OpenCV及连通域分析进行文本块分割小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

上一次通過投影的方式進(jìn)行了文本塊分割，但這種方法有很大的局限性，要求分行清晰、不能有字符跨多行、不能傾斜，而且對噪聲比較敏感。還是拿上一回的圖片，但是我在上面加了一個(gè)比較大的字，得出的結(jié)果就有問題了：

可以看到，由于右下角大大的“測”字跨了多行，導(dǎo)致水平投影分行時(shí)就出錯(cuò)了。

本次換一種方法，基于連通性分析來做。簡單講，就是把圖像做一定的膨脹操作，使得同一個(gè)字符的不同部分以及相鄰字符相互重疊到一起，變成一個(gè)整體，然后再通過分析找到每一個(gè)獨(dú)立的塊，排除掉噪聲，剩下的基本就是符合條件的結(jié)果了。

直接上代碼，后面再分析：

using?System;

using?System.Collections.Generic;

using?System.IO;

using?System.Text;

using?OpenCvSharp;

using?OpenCvSharp.Extensions;

using?OpenCvSharp.Utilities;

namespace?OpenCvTest

{

class?Program

{

static?void?Main(string[]?args)

{

//讀入源文件

var?src?=?IplImage.FromFile("source.jpg");

//轉(zhuǎn)換到灰度圖

var?gray?=?Cv.CreateImage(src.Size,?BitDepth.U8,?1);

Cv.CvtColor(src,?gray,?ColorConversion.BgrToGray);

//做一下膨脹，x與y方向都做，但系數(shù)不同

var?kernal?=?Cv.CreateStructuringElementEx(5,?2,?1,?1,?ElementShape.Rect);

Cv.Erode(gray,?gray,?kernal,?2);

//二值化

Cv.Threshold(gray,?gray,?0,?255,?ThresholdType.BinaryInv?|?ThresholdType.Otsu);

//檢測連通域，每一個(gè)連通域以一系列的點(diǎn)表示，FindContours方法只能得到第一個(gè)域

var?storage?=?Cv.CreateMemStorage();

CvSeq?contour?=?null;

Cv.FindContours(gray,?storage,?out?contour,?CvContour.SizeOf,?ContourRetrieval.CComp,?ContourChain.ApproxSimple);

var?color?=?new?CvScalar(0,?0,?255);

//開始遍歷

while?(contour?!=?null)

{

//得到這個(gè)連通區(qū)域的外接矩形

var?rect?=?Cv.BoundingRect(contour);

//如果高度不足，或者長寬比太小，認(rèn)為是無效數(shù)據(jù)，否則把矩形畫到原圖上

if(rect.Height?>?10?&&?(rect.Width?*?1.0?/?rect.Height)?>?0.2)

Cv.DrawRect(src,?rect,?color);

//取下一個(gè)連通域

contour?=?contour.HNext;

}

Cv.ReleaseMemStorage(storage);

//顯示

Cv.ShowImage("Result",?src);

Cv.WaitKey();

Cv.DestroyAllWindows();

}

下面來一步一步分析。讀入的原圖是這樣的：

轉(zhuǎn)換到灰度圖并膨脹處理后，已經(jīng)可以大致看出同一文本塊的多個(gè)字符已經(jīng)連到一起了：

二值化后的圖像：

做連通性分析后，原始分析出的結(jié)果是這樣的：

Cv.DrawContours(src,?contour,?color,?color,?1);

對每個(gè)連通域取外接矩形，得到的最終結(jié)果是這樣的：

可以看到效果比之前好了很多，比較大的字可以作為獨(dú)立的文本塊被檢測出來了。另外即使是同一行的文本塊，也會(huì)有輕微的上下浮動(dòng)，不再是絕對按行對齊了。

未經(jīng)許可嚴(yán)禁轉(zhuǎn)載。

總結(jié)

以上是生活随笔為你收集整理的基于连通域字符分割的流程_基于OpenCV及连通域分析进行文本块分割的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： idea 提示vue插件_Vue + S
下一篇：优秀logo设计解析_必修课 | 抛开固

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

基于连通域字符分割的流程_基于OpenCV及连通域分析进行文本块分割

總結(jié)