机器视觉(十):印刷体字符识别
目錄:
機(jī)器視覺(一):概述
機(jī)器視覺(二):機(jī)器視覺硬件技術(shù)
機(jī)器視覺(三):攝像機(jī)標(biāo)定技術(shù)
機(jī)器視覺(四):空域圖像增強(qiáng)
機(jī)器視覺(五):機(jī)器視覺與世界杯
機(jī)器視覺(六):頻域圖像增強(qiáng)
機(jī)器視覺(七):圖像分割
機(jī)器視覺(八):圖像特征提取
機(jī)器視覺(九):圖像配準(zhǔn)
機(jī)器視覺(十):印刷體字符識別
機(jī)器視覺(十一):一維條碼識別
機(jī)器視覺(十二):二維條碼識別
🌏🧐以下為正文🦄🪐
????????模式識別是對圖像或各種物理對象的分類與描述的技術(shù),在機(jī)器視覺中具有廣泛的應(yīng)用,涉及到圖形、圖像和文字的識別,也涉及到有形物件的測量、分類與描述。
? ? ? ? 本章節(jié)主要介紹印刷體字符識別。
一、印刷體字符識別流程
①掃描輸入文本圖像;
②圖像的預(yù)處理,包括傾斜校正和濾除干擾噪聲等;
③圖像版面的分析和理解;
④圖像的行切分和字切分;
⑤單字圖像特征選擇和提取;
⑥單字圖像特征的模式分類;
⑦將被分類的模式賦予識別結(jié)果;
⑧識別結(jié)果的編輯修改后處理。
?一、字符圖像分割
?1.圖像亮度調(diào)整
????????在亮度過大的情況下,正常度量的閾值分割就會將本應(yīng)保留的區(qū)域?yàn)V除,而亮度過小的情況下,很多噪聲點(diǎn)無法被濾除掉。
2.色彩分割
3.基于離散余弦變換(DCT for Discrete Cosine Transform)的頻域分割
????????離散余弦變換相當(dāng)于一個(gè)長度大概是它兩倍的離散傅里葉變換,這個(gè)離散傅里葉變換是對一個(gè)實(shí)偶函數(shù)進(jìn)行的(因?yàn)橐粋€(gè)實(shí)偶函數(shù)的傅里葉變換仍然是一個(gè)實(shí)偶函數(shù)),在有些變形里面需要將輸入或者輸出的位置移動半個(gè)單位(DCT有8種標(biāo)準(zhǔn)類型,其中4種是常見的)。
????????在字符識別的應(yīng)用中,字符區(qū)域按一定的行列結(jié)構(gòu)分布,在頻域能夠呈現(xiàn)出特殊的能量分布,通常來說,其水平和垂直能量較大,高中頻分量更加豐富,因此可以通過這些頻域分布的特征將其與背景分割開來。
基于DCT的圖像頻域分割流程圖?4.基于小波變換(wavelet transform,WT)的圖像小波域分割
基于小波變換的圖像小波域分割流程圖二、字符區(qū)域校正與切分
1.基于哈夫變換的區(qū)域矯正
基于Hough變換的區(qū)域校正(在圖像的多層分辨率下分級進(jìn)行Hough變換 )????????Hough變換主要用于圖像中直線的檢測。圖像中的字符多是橫向成串出現(xiàn)的,因此可以利用Hough變換的方法擬合字符串邊緣,形成字符串邊緣直線,從而求得字符傾角。
2.基于仿射變換的圖像旋轉(zhuǎn)
????????通過仿射變換矩陣,把旋轉(zhuǎn)后的圖像坐標(biāo)仿射回原圖像點(diǎn),并通過一定的方法計(jì)算出該點(diǎn)在原圖像上的灰度值,作為旋轉(zhuǎn)后圖像該點(diǎn)的灰度值。
? ? ??
3.字符圖像縮放
????????有些字符識別方法,需要將圖像大小指定在某一個(gè)標(biāo)準(zhǔn)上這就需要在識別前對該字符圖像區(qū)域大小進(jìn)行歸一化。歸一化一般采用灰度插值的方法。最簡單的插值方法是最鄰近插值,即令輸出像素的灰度值等于離它所映射位置最近的輸入像素灰度值。但這種插值方法會使輸出圖像摻入鋸齒噪聲。
4.粘連字符切分
????????一串字符在結(jié)構(gòu)和形態(tài)上存在如下特征:單個(gè)字符長寬比例一致;多個(gè)數(shù)字和英文字符輪廓存在凹凸結(jié)構(gòu);多數(shù)情況下字符不會出現(xiàn)重疊交叉。根據(jù)這些特點(diǎn),可以檢測字符串凹凸結(jié)構(gòu),并結(jié)合字符長寬比來分割單個(gè)字符 。
總結(jié)
以上是生活随笔為你收集整理的机器视觉(十):印刷体字符识别的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一看就会的奇偶分频电路
- 下一篇: java 代码佛像_论面向组合子程序设计