图像五值化与基于三值图像的车牌识别(1)
慶祝2011年新年
?
張忠義
海口愚佬會教育科技有限公司?
全文下載 www.yulaohui.com/color5_2/摘?要:????? 圖像五值化是通過公式Y(jié) =(R+G)/2,將RGB空間映射到Y(jié)B空間,再將YB空間簡化成黑、藍、灰、黃、白五種值的圖像簡化方法。針對中國車牌,通過黑、藍合并,白、黃合并,圖像可進一步簡化成三值。基于三值圖像的車牌識別包括基于三值圖像的字符識別和基于三值圖像按分割反推的車牌定位。三值圖像保留的中間灰色可根據(jù)識別的車牌底色視同字符識別所需的車牌底色或字符色,從而能彌補受光照不均勻或車牌“臟”影響按閾值選取進行圖像二值化可能導(dǎo)致的圖像信息缺失,有利于提高字符識別的正確率。基于三值圖像按分割反推的車牌定位是指在確保圖像遍歷高效的前提下,通過基于三值圖像的投影如果可以進行字符分割則得到一個候選車牌定位。其好處是可以先按照第三方關(guān)于車牌的規(guī)定檢測字符間距,排除偽車牌,做到車牌定位不誤,還可以使車牌定位不再依賴車牌特征,可以不再理會圖像中對車牌特征所謂的干擾,做到車牌定位不漏。
?
1??? 問題
目前普遍的觀點認為車牌識別分為車牌定位、字符分割和字符識別三步。車牌定位是車牌識別中最為關(guān)鍵的一步,它決定著字符分割和字符識別的效果,是影響整個車牌識別率的主要因素。
1.1??車牌定位的主要問題
車牌定位一般是根據(jù)車牌特征,如紋理、角點、邊緣、顏色等。根據(jù)單一車牌特征進行車牌定位的主要問題是圖像背景復(fù)雜或圖像受光照不均勻影響容易發(fā)生定位遺漏。根據(jù)多車牌特征融合進行車牌定位與減少定位遺漏并無必然聯(lián)系,且會增加定位時間。
另一方面,根據(jù)車牌特征定位只能是一個大致的范圍,候選區(qū)域左右邊界不能完全確定。這是因為,邊界是背景與前景或前景與背景的過渡,當圖像受到較大干擾或前景與背景較“接近”時,邊界就容易變“模糊”。此種情況下,在邊界進行二值化和投影就容易出錯。車牌中漢字和數(shù)字、英文字符結(jié)構(gòu)不同。有些漢字是可以分割的,比如“瓊”就可以被分割成“王”和“京”。當候選區(qū)域左右邊界的不確定性與車牌中首字符可分割同時出現(xiàn)時,就有可能造成車牌首字符分割錯誤,比如把“瓊”分割成“京”,導(dǎo)致車牌首字符不能正確識別,即“瓊”有可能最終被識別成“京”。
1.2??字符分割的主要問題
車牌定位選定候選區(qū)域后,一般的做法是:
一、對候選區(qū)域進行二值化;
二、通過縱向投影和橫向投影將二值化的候選區(qū)域分割成若干個單個的字符區(qū)域;
三、對單個字符區(qū)域逐個進行字符識別;
四、若字符識別符合預(yù)設(shè)的可信度要求,則候選區(qū)域為確定車牌,推出車牌識別結(jié)果,否則,輪換下一個候選區(qū)域繼續(xù)進行上述步驟。
這里的問題是,一般而言,圖像二值化的困難在于閾值選取。閾值屬于圖像處理領(lǐng)域內(nèi)的經(jīng)典難題,事實上,沒有一個方法可以得到一個通用的閾值,也沒有一個方法可以評估得到的閾值對于要處理的圖像是否適當。另一方面,所謂“二值化”就是根據(jù)選定閾值將候選區(qū)域分類為“黑”或“白”。隨著車牌識別應(yīng)用場合越來越廣泛,應(yīng)用環(huán)境越來越復(fù)雜,獲得的受光照不均勻或車牌“臟”影響的圖像也越來越多。候選區(qū)域受光照不均勻或車牌“臟”影響的像素點往往表現(xiàn)為“灰”,其灰度值與選定閾值相差不大,有可能不被正確分類到“黑”或“白”中,從而影響投影計算,導(dǎo)致字符分割或無法分割或分割錯誤。也就是說,投影與分割建立在候選區(qū)域二值化基礎(chǔ)上,不能正確處理“灰”像素,這一處理方法自身是有缺陷的。
還有,根據(jù)投影進行字符分割,其分割是不嚴格的。圖像中“廣告用電話號碼”等偽車牌有可能被當成車牌號識別。事實上,中國車牌必須滿足公安部有關(guān)車牌的國家標準,字符之間的間距應(yīng)符合相關(guān)規(guī)定。由于車牌定位得到的候選區(qū)域其左右邊界的不確定性,即候選區(qū)域的寬度不一定是車牌寬度,所以,既不能根據(jù)候選區(qū)域的寬度按照公安部規(guī)定計算字符間距的方式來分割候選區(qū)域,反過來,既然無法得到一個確定的車牌寬度也就不能根據(jù)車牌寬度對投影得到的分割結(jié)果進行驗證。沒有分割字符的間距驗證,車牌識別只是字符串識別,圖像中“廣告用電話號碼”等偽車牌也就自然不能被杜絕。
1.3??字符識別的主要問題
圖像二值化的根本問題是不能反映圖像的中間狀態(tài),即中間“灰”。中間“灰”是客觀存在的。車牌圖像在感光成像時,除了車牌底色和字符色外,一定存在位于字符邊緣的由車牌底色向字符色過渡的中間色。由于閾值選取原因,中間色可能被過多保留,表現(xiàn)為字符筆劃變粗,中間色也可能被過多丟棄,表現(xiàn)為筆劃變細。受光照不均勻或車牌“臟”影響的“灰”像素也有可能由于閾值選取原因被過多保留,呈現(xiàn)為干擾。筆劃變粗、筆劃變細或圖像被干擾,對字符識別都是不利的。
圖像二值化完全可以理解為將圖像的所有像素點分類為車牌底色和字符色。這種簡單的分類方法是明顯不適合中間“灰”或圖像的“灰”像素。字符Q,字符D,字符B等角上像素往往呈現(xiàn)為中間“灰”。中間“灰”或圖像的“灰”像素應(yīng)作為中間狀態(tài)保留,這樣才不會造成圖像信息損害,不會影響字符識別。
字符識別的關(guān)鍵不在于選用神經(jīng)網(wǎng)絡(luò)方法,還是模板匹配方法,關(guān)鍵是應(yīng)控制二值化對圖像的損害。如果二值化對圖像的損害太大,不管用什么方法都不可能得到良好的字符識別效果。
2??? 解決上述問題的方法
車牌識別技術(shù)產(chǎn)生于20世紀90年代,盡管經(jīng)過20年的發(fā)展,車牌識別仍然只能針對成像條件較好的圖像進行,對受光照不均勻或車牌“臟”影響的圖像,其識別率仍低。尤其是近年來圖像高清化趨勢越來越明顯,圖像中車牌受到的干擾越來越多,原有針對車牌定位、字符分割和字符識別的算法越來越不適應(yīng)這一變化。原有算法概括一句話就是一個比一個好。隨著圖像越來越復(fù)雜,新的算法總能找到圖像的差異所在,總能在原有基礎(chǔ)上做到一些改進。問題是算法在不斷改進,而車牌識別率卻沒有得到大的提高。
這是因為,算法的基礎(chǔ)是顏色、灰度、二值化。圖像越來越復(fù)雜,是說中間“灰”或圖像“灰”像素越來越多。就此要找到一個恰當?shù)拈撝?#xff0c;使這些中間“灰”或圖像“灰”像素都分類正確是不容易的。相反可能會更多地被分類錯。一旦中間“灰”或圖像“灰”像素被分類錯就呈現(xiàn)為干擾。原有算法沒有關(guān)注這些最基本的問題,而是想方設(shè)法去解決這些基本問題的表現(xiàn)形式:干擾。結(jié)果是算法的魯棒性越來越差。
因此,對上述問題的解決需要從最基本的顏色、灰度、二值化著手,重新建立直接基于彩色圖像的算法體系,使算法能在圖像無損的基礎(chǔ)上,針對性更強,確定性更高。
2.1??直接基于彩色圖像
原有算法主要是在圖像灰度化和二值化基礎(chǔ)上,通過車牌特征和投影進行車牌定位和字符分割。盡管在直接基于彩色模式的車牌識別方法上進行了很多努力,但是,迄今為止基于彩色模式進行車牌識別的各種方法都沒有針對彩色模式的計算復(fù)雜性找到有效的解決辦法。所謂彩色模式,不論是通過紅色、綠色、藍色三原色表示,還是通過其他方式表示,都是三維空間。因此,如果不能降維,其計算復(fù)雜性就不能降低。客觀上,車牌識別往往需要在一個較短的時間內(nèi)完成。因此,由于耗時基于彩色模式的車牌識別都只是停留在理論上,或者說,一直沒有可以進入工程意義上的實用的成果出現(xiàn)。
圖像五值化是通過公式Y(jié)=(R+G)/2,將RGB空間映射到Y(jié)B空間,再將YB空間簡化成黑、藍、灰、黃、白五種值的圖像簡化方法。圖像五值化首先將圖像由RGB三維降成YB二維,進而將YB二維簡化成五個離散值,極大地降低了直接基于彩色圖像進行車牌識別的計算復(fù)雜性。經(jīng)五值化簡化后,盡管圖像的色彩值只有五種,但其色彩屬性被最大限度地保留下來,黑、藍、灰、黃、白仍能完整表達中國車牌識別所需的色彩信息。就中國車牌識別而言,圖像五值化簡化對原圖像是無損的。
針對中國車牌,藍牌的白字可以視為是黃色,黃牌的黑字也可以視為藍色,通過黑、藍合并,白、黃合并,圖像可進一步簡化成三值。藍底黃字可以表示藍牌和黑牌,黃底藍字可以表示黃牌和白牌。因此,就中國車牌識別而言,將圖像簡化成三值不僅具有合理性,同樣對圖像的色彩屬性也是無損的。
無論是五值圖像,還是三值圖像,都完整保留了圖像的中間“灰”,回避了圖像二值化對中間“灰”可能出現(xiàn)的分類錯誤。只要在算法中增加一點“技巧”,保留的中間“灰”就可根據(jù)識別的車牌底色動態(tài)地視同字符識別所需的車牌底色或字符色,從而能彌補受光照不均勻或車牌“臟”影響按閾值選取進行圖像二值化可能導(dǎo)致的圖像信息缺失,有利于提高字符識別的正確率。
2.2??將投影與分割建立在三值圖像基礎(chǔ)上
對于投影與分割,克服二值化缺陷的關(guān)鍵同樣是要考慮呈現(xiàn)為干擾的受光照不均勻或車牌“臟”影響的像素點“灰”化。解決辦法仍然是要保留中間“灰”或圖像“灰”像素,將投影與分割建立在圖像三值化基礎(chǔ)上。圖像二值化后,原有中間“灰”或圖像“灰”像素,如果被錯誤分類,就可能或表現(xiàn)為“損害”,或表現(xiàn)為“干擾”。“損害”是圖像信息缺失,不利于字符分割,也不利于字符識別。“干擾”是圖像中不必要的信息過多,同樣不利于字符分割,也不利于字符識別。將中間“灰”或圖像“灰”像素保留為中間狀態(tài),區(qū)別于“黑”或“白”,就可以為程序判斷提供依據(jù),使程序可以根據(jù)已通過判斷得到的車牌底色,對于中間狀態(tài)或保留,或丟棄。
2.3??通過分割反推進行車牌定位
對于解決車牌遺漏和車牌定位候選區(qū)域左右邊界的不確定性,就是要先進行字符分割,再按分割反推進行車牌定位。所謂分割反推是指在確保圖像遍歷高效的前提下,通過圖像遍歷如果可以進行字符分割則得到一個候選車牌定位。
按分割反推進行車牌定位的好處是:不僅可以先按照公安部的規(guī)定檢測字符間距,排除偽車牌,做到車牌定位不誤;還可以使車牌定位不再依賴車牌特征,可以不再理會圖像中對車牌特征所謂的干擾,做到車牌定位不漏。
2.4??算法復(fù)雜性控制
直接基于彩色圖像并通過圖像遍歷按分割反推進行車牌定位,在圖像已經(jīng)被簡化成三值后,關(guān)鍵是必須有效控制圖像遍歷的計算復(fù)雜性。否則,算法會因為處理器負荷過重而不具有實用性。
與二值圖像不同,三值圖像具有中間“灰”。顯然,定位只需要針對藍色和黃色,三值圖像中的中間“灰”是不需要定位的。因此,可以跳開大量的中間“灰”,使基于三值圖像的算法復(fù)雜性能得到有效控制。具體的控制方法是:
(1)???????? 在圖像行上可通過定位候選點標記,跳開非定位候選點,實現(xiàn)圖像的橫向加速;
(2)???????? 在圖像列上可通過大小跨機制,改變圖像行的執(zhí)行順序,快速到達車牌所在的圖像行,實現(xiàn)圖像的縱向加速;
(3)???????? 結(jié)合回溯與隔行查找,放棄部分圖像行的定位。
因此,綜合圖像橫向、縱向兩個方向的二維加速,圖像遍歷的高效是可以保證的。
3??? 目的
基于三值圖像的車牌識別從字符分割開始,按分割反推進行車牌定位。傳統(tǒng)的車牌識別是從車牌定位開始。基于字符分割并按分割反推進行車牌定位有別于傳統(tǒng)車牌定位,目的是為了減少影響車牌識別結(jié)果正確的因素,將確保車牌識別結(jié)果正確的前提單一到圖像三值化質(zhì)量上,克服傳統(tǒng)車牌識別在車牌定位、字符分割、字符識別各環(huán)節(jié)上的識別率瓶頸。
?
基于三值圖像的車牌識別過程是:
圖像三值化→字符分割→分割反推→字符識別
?
傳統(tǒng)的車牌識別過程是:
圖像灰度化→特征定位→二值化→形態(tài)學(xué)處理→字符分割→字符識別
?
基于三值圖像的車牌識別僅僅依賴圖像三值化質(zhì)量,相對于傳統(tǒng)車牌識別的圖像二值化,其質(zhì)量更能得到保證。傳統(tǒng)的車牌識別依賴圖像灰度化、車牌特征提取、圖像二值化閾值選取、形態(tài)學(xué)處理,每個環(huán)節(jié)都可能是影響最終車牌識別效果的識別率瓶頸。
字符分割在基于三值圖像的車牌識別過程中是先計算字符間距,然后對定位候選點進行字符分割符合性檢測,字符分割可驗證;字符分割在傳統(tǒng)車牌識別過程中是在圖像二值化基礎(chǔ)上投影得到,是不嚴格且不可驗證的,容易出現(xiàn)字符分割錯誤。圖像二值化實質(zhì)上是把三值圖像的中間狀態(tài)強行分類到背景或前景中,導(dǎo)致背景膨脹或前景膨脹。膨脹會影響分割,因此,傳統(tǒng)二值化后有可能需要進行形態(tài)學(xué)處理。實際上,這是兩難的。如果不進行形態(tài)學(xué)處理,由于背景或前景有可能是膨脹的,因此分割的正確性無法保證。而進行形態(tài)學(xué)處理,其處理結(jié)果未必恰當。
車牌定位在基于三值圖像的車牌識別過程中是基于字符分割并按分割反推,采用圖像遍歷方式,車牌定位既不會遺漏,也不會錯誤。而車牌定位在傳統(tǒng)車牌識別過程中是根據(jù)各種各樣的車牌特征,甚至是融合的車牌特征,在車牌特征受到較大干擾的情況下,車牌定位既可能遺漏,也可能錯誤。
在基于三值圖像的車牌識別過程中可以將中間“灰”或圖像的“灰”像素根據(jù)識別的車牌底色動態(tài)地視同字符識別所需的車牌底色或字符色。而在傳統(tǒng)的車牌識別過程中字符識別只能根據(jù)二值圖像進行,字符識別結(jié)果的正確性受圖像二值化閾值問題制約。
即在傳統(tǒng)車牌識別過程中,各環(huán)節(jié)算法所依賴的前提是不完全確定的,必須架構(gòu)在對錯誤一定程度容忍的基礎(chǔ)上,否則,該環(huán)節(jié)就成為識別率瓶頸。不確定性和錯誤容忍會最終累積到車牌識別結(jié)果,因此造成車牌識別結(jié)果在理論上一定會處于一定的誤差范圍。
4??? 圖像五值化
4.1??圖像五值化簡化方法
圖像五值化簡化方法是通過公式:黃色 =(紅色+綠色)/ 2 ,依此將紅色、綠色、藍色三原色構(gòu)成的色彩空間映射到由黃色、藍色兩種顏色構(gòu)成的色彩空間,映射后的色彩值有黑色、藍色、灰色、黃色和白色五種。
具體的簡化過程:
(1)???????? 建立公式:黃色 =(紅色+綠色)/ 2 ;
(2)???????? 建立公式:灰度 =(黃色+藍色)/ 2 ;
(3)???????? 將黃色和藍色都大于187的視同白色;
(4)???????? 將黃色和藍色都小于153的視同黑色;
(5)???????? 去除白色和黑色剩下的中間色中,若黃色<0.9×藍色,則繼續(xù)進行藍色細分,若藍色<0.9×黃色,則繼續(xù)進行黃色細分,否則,則繼續(xù)進行灰色細分;
(6)???????? 藍色細分:若黃色<0.8×藍色,視同藍色,否則,若灰度<187,視同藍色,反之視同灰色;
(7)???????? 黃色細分:若藍色<0.8×黃色,視同黃色,否則,若灰度>153,視同黃色,反之視同灰色;
(8)???????? 灰色細分:若灰度<153,視同黑色,若灰度>187,視同白色,否則,視同灰色。
?
?
?????????????????????????????????????????
待續(xù)。
轉(zhuǎn)載于:https://www.cnblogs.com/zhangzhongyi/archive/2011/01/01/1923934.html
總結(jié)
以上是生活随笔為你收集整理的图像五值化与基于三值图像的车牌识别(1)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 强大Jquery插件,table排序之二
- 下一篇: STM32程序设计心得以及易错点