CEDD(Color and Edge Directivity Descriptor)算法
FROM:?http://blog.csdn.net/leixiaohua1020/article/details/16883379
顏色和邊緣的方向性描述符(Color and Edge Directivity Descriptor,CEDD)
本文節(jié)選自論文《Android手機上圖像分類技術的研究》。
?
CEDD具有抽取特征速度較快,特征描述符占用空間較小的優(yōu)勢。下面就對CEDD原理進行詳細的闡述和分析。
1.顏色信息
CEDD特征結(jié)合了顏色和紋理兩方面信息,本小結(jié)將給出顏色信息提取的過程,重點分析RGB-HSV模型轉(zhuǎn)換、10-bins模糊過濾器和24-bins模糊過濾器的原理。
1.1.RGB模型轉(zhuǎn)換為HSV模型
RGB模型可以說是我們最熟悉、使用也最多的顏色模型,它們分別代表組成一個顏色的三個分量,(0,0,0)代表黑色,(255,255,255)代表白色,(255,0,0)代表紅色,(0,255,0)代表綠色,(0,0,255)代表藍色,其它顏色也可通過調(diào)整這三個分量表示出來。RGB顏色模型的設計是根據(jù)色彩發(fā)光原理而來的,且與硬件相關,一般情況下,計算機都會釆用這種空間模型在屏幕上顯示某種顏色的定義,即人們所熟悉的三色組合。所以,當從一幅圖像中提取像素點時首先提取的一般也是像素點的RGB信息。
HSV模型中,H (Hue)代表色調(diào),指通過物體傳播或從物體射出的顏色,一般在使用中是由顏色名稱來標識的。S (Saturation)代表飽和度,表示色調(diào)中灰色成分的比例,指顏色的純度或強度。V (Value)代表亮度,指顏色相對的明暗程度。HSV模型能夠較好地反應人對顏色的感知和鑒別能力,所以非常適合于比較基于顏色的圖像相似性,在圖像分類中也得到了廣泛應用。
綜合上述兩點,在提取顏色信息前就需要對圖像像素進行RGB-HSV的模型轉(zhuǎn)換。在此特征提取算法中RGB-HSV轉(zhuǎn)換的方式稍有不同,且最后得出的S、V取值范圍也有差別,都是(0,255),但基本原理不變,這是為了方便于后面在模糊過濾器中的運算,轉(zhuǎn)換公式如下:
這里所有的HSV值最后都取整數(shù)。
通過上面的計算,便可以得出像素點的HSV值,下面將用HSV值進行模糊過濾,得出顏色信息的直方圖。
?
1.2. 10-bins模糊過濾器
??
10-bins模糊過濾器的工作過程是通過三個通道輸入HSV信息,然后輸出10個模糊的直方圖信息值。10個直方圖信息值的含義如下:(0)黒色(Black),(1)灰色(Gray),(2)白色(White),(3)紅色(Red), (4)橙色(Orange),(5)黃色(Yellow),(6)綠色(Green),(7)青色(Cyan),(8)藍色(Blue),(9)品紅色(Magenta)。其原理如圖所示。
10-bins模糊過濾器是基于模糊理論的,我們先來分析一下模糊理論中顏色徑向邊緣的生成。由于H代表的是色調(diào),從它的計算方法可以看出H的取值范圍為0-360,則當一張圖片上出現(xiàn)由一種顏色向另一種顏色過渡時,H值的變化就會較快,這時就會出現(xiàn)所謂的顏色徑向邊緣。根據(jù)模糊理論可以找出這些徑向邊緣的位置。如圖所示,圖(a)為提取出的H通道值的圖像,圖(b)是將圖(a)通過CLF過濾器模糊處理后得出的。CLF的英文全稱為Coordinatelogic filters,它的方法就是將圖像上每個3*3方塊的九個像素點的二進制值進行邏輯“與”運算,這樣,在H通道的顏色邊緣處就會出現(xiàn)較小的H值,也就是我們看到的圖 (b)的效果。再將原H值圖像與過濾后的H圖像進行差運算即可得如圖(c)所示的較明顯的顏色徑向邊緣。圖 (d)為H通道理論上的徑向邊緣位置。
通過上述原理反復實驗可以得到H徑向邊緣的范圍,如圖所示,將H通道的值分為八個模糊區(qū)域,每一區(qū)域依次命名為:(0)紅色-橙色(Redto Orange),(1)橙色(Orange),(2)黃色(Yellow),(3)綠色(Green),(4)青色(Cyan),(5)藍色(Blue),(6)品紅色(Magenta),(7)藍色-紅色(Blueto Red)。每兩個相鄰區(qū)域都有交叉的部分。
?
3.1.3.24-bins模糊過濾器
24-bins模糊過濾器就是將10-bins模糊過濾器輸出的每種色區(qū)再分為3個H值區(qū)域,輸入一個10維向量和S、V通道值,輸出的是一個24維向量,其系統(tǒng)模型如圖3-7所示。它輸出的每一維所代表的信息分別是:(0)黑色(Black),(1)灰色(Grey),(2)白色(White),(3)暗紅色(Dark Red),(4)紅色(Red),(5)淺紅(Light Red),(6)暗橙色(DarkOrange),(7)橙色(Orange),(8)淺橙色(Light Orange),(9)暗黃色(Dark Yellow),(10)黃色(Yellow), (11)淺黃色(LightYellow),(12)深綠色(Dark Green),(13)綠色(Green),(14)淺綠色(Light Green),(15)暗青色(Dark Cyan),(16)青色(Cyan),(17)淺青色(Light Cyan),(18)深藍色(Dark Blue),(19)藍色(Blue),(20)淡藍色(LightBlue),(21)暗品紅色(DarkMagenta),(22)品紅色(Magenta),(23)淺品紅色(Light Magenta)。
?
3.2.紋理信息
本小結(jié)將介紹CEDD特征中紋理信息的提取過程,通過YIQ模型計算出像素灰度值,再提取圖像的邊緣方向直方圖紋理信息。
3.2.1.YIQ彩色空間
YIQ色彩空間屬于NTSC (國際電視標準委員會)系統(tǒng)。Y(Luminace)代表了顏色的明視度,直觀點說就是圖像的灰度值。I和Q (Chrominace)代表了色調(diào)信息,它們分別描述圖像色彩以及飽和度的屬性。在YIQ色彩空間模型中,Y分量表示圖像的亮度信息,I和Q分量表示顏色信息,I分量是指從橙色到青色,Q分量則是指從紫色到黃綠色[24]。
通過對彩色圖像從RGB到Y(jié)IQ空間的轉(zhuǎn)換,可以分開彩色圖像中的亮度信息與色度信息,并對其各自進行獨立處理。RGB轉(zhuǎn)換到Y(jié)IQ空間模型的對應關系如下面方程所示:
提取紋理特征時,最常用的就是圖像的灰度值,這里引出YIQ空間也只為求出Y值,以便后面進行紋理信息的提取。
3.2.2.邊緣方向直方圖
在這里將提出一種計算速度較快捷的紋理信息提取方法,EHD( Edge Histogram Descriptor),即邊緣直方圖描述符,將會用到5個數(shù)字濾波器,如圖3-9所示。
?
這五個數(shù)字濾波器是用來提取紋理邊緣信息的,它們能夠?qū)⑵渌饔玫膮^(qū)域分為垂直方向、水平方向、45度方向、135度方向和無方向五個類別。在對圖像進行紋理信息提取時會將圖像分為若干小區(qū)。然后每個小區(qū)再分為如圖3-9的四個大小相等的子小區(qū)。然后每個小區(qū)再分為如圖3-9的四個大小相等的子小區(qū)。用g0?(i,j),g1(i,j),g2(i,j),g3(i,j)分別表示在第(i,j)個小區(qū)內(nèi)四個子小區(qū)的平均灰度值。av?(k),ah?(k),ad-45(k),ad-135?(k)和and?(k)分別代表四個子小區(qū)平均灰度值經(jīng)過過濾器時的參數(shù),圖中每個子小區(qū)中的數(shù)值便是濾波器的參數(shù),其中k的取值范圍是0到3整數(shù),表示小區(qū)內(nèi)的四個子小區(qū)。nv?(i, j),nh?(i,j),nd-45(i,j),nd-135(i,j)和nnd(i,j)為第(i,j)個小區(qū)內(nèi)所判定各方向的取值。計算方法如下:
找出最大值,
再對所有n值規(guī)范化,
通過上面的計算公式,可以得出每個小區(qū)內(nèi)圖像邊緣的信息。CEDD中紋理信息提取的是一個6維直方圖,直方圖中各維信息的含義分別是:(0)無邊緣信息,(1)無方向的邊緣信息,(2)水平方向的邊緣信息,(3)垂直方向的邊緣信息,(4) 45度方向的邊緣信息,(5) 135度方向的邊緣信息。判斷每個小區(qū)紋理信息所屬的直方圖區(qū)域的方法如圖3-10所示:
首先設定4個閾值:T0=14,檢驗該小區(qū)是否含有邊緣信息;T1=0.68,判斷該小區(qū)是否含有無方向信息;T2=T3=0.98,用來判斷該小區(qū)是否含有其它四個方向的信息。如果mmax大于T0,則該小區(qū)含有紋理信息,如果不大于則是非含有紋理信息的小區(qū),那么6維直方圖第一維的值會加1。如果該區(qū)域是有邊緣信息的,即mmax大于等于T0,便可以計算其它各方向信息的值,如圖3-10所示。此原理圖是一個發(fā)散的五邊形,每個頂點代表一個邊緣方向類別,每個小區(qū)內(nèi)計算出的nnd、nh、nv、nd-45、nd-135值便分別落在五個點與中心原點的連線上。中心點的值為1,五邊形邊界線上的值為0。如果n值大于它相應邊緣方向類別上的閾值,則可判定該小區(qū)屬于這個邊緣方向類別,可想而知,一個小區(qū)可以同時屬于幾個類別。由此,便有如下劃分方法:若nnd大于T1,則直方圖中含有無方向信息的區(qū)域值加1;若nh大于T2,則直方圖中含有水平方向邊緣信息的區(qū)域值加1;若nv大于T2,則直方圖中含有垂直方向邊緣信息的區(qū)域值加1;若nd-45大于T3,則直方圖中含有45度方向邊緣信息的區(qū)域值加1;若nd-135大于T3,則直方圖中含有135度方向邊緣信息的區(qū)域值加1。
?
3.3. CEDD 特征
CEDD的英文全稱是Color and Edge Directivity Descriptor,即顏色和邊緣方向特征描述符。它結(jié)合了圖像的顏色和紋理信息,生成一個144位的直方圖。這個特征提取方法可以分為兩個子模塊系統(tǒng),提取顏色信息的是顏色模塊,提取紋理信息的是紋理模塊,這兩個單元的具體算法已經(jīng)在3.1小節(jié)和3.2小節(jié)進行了詳細講述。CEDD直方圖信息由六個區(qū)域組成,也就是3.2中講到的紋理模塊,六個區(qū)域就是提取出的6維向量直方圖,然后在這些紋理信息的每一維中再加入顏色模塊提取出的24維顏色信息,這樣就可以將顏色和紋理有效結(jié)合起來,最終得出6*24=144維的直方圖信息。其原理如圖3-11所示。
在實現(xiàn)過程中先將圖片分成若干小區(qū),小區(qū)的數(shù)量是根據(jù)圖像具體情況和計算機能力綜合決定的,每一個圖像小區(qū)都會經(jīng)過紋理模塊和顏色模塊的處理。
小區(qū)在紋理模塊特征提取過程中會先分為4個子小區(qū)。根據(jù)YIQ計算公式得出每個像素的灰度值,求出每個子小區(qū)的平均灰度值。再經(jīng)過5個數(shù)字濾波器過濾后,根據(jù)圖3-10的原理判斷該子小區(qū)屬于哪些紋理信息類別。
在顏色模塊中,每個圖像小區(qū)都會轉(zhuǎn)換為HSV色彩空間,系統(tǒng)會將小區(qū)內(nèi)HSV各通道的平均值通過10-bins模糊過濾器輸出的10維向量再通過24-bins模糊過濾器中。通過10-bins模糊過濾器后根據(jù)H值得出了 10個色彩類別,當通過24-bins模糊過濾器時會根據(jù)S和V的區(qū)域判定對H進行再分類輸出24維的直方圖。
圖像的每一個小區(qū)都會經(jīng)過顏色模塊的處理,處理后將24個數(shù)據(jù)分別加入到該小區(qū)所屬的各紋理類別中,最后對直方圖進行歸一化處理。
如果只進行到歸一化這一步并不能體現(xiàn)出CEDD的優(yōu)越性,因為這里面的值含有小數(shù)部分,要占用大量的存儲空間。如果對其進行量化,則量化后的整數(shù)值既方便存儲,又可以讓人們直觀的讀取特征值。表3-1是CEDD特征提取后的量化表,量化范圍是0-7的整數(shù)。可以看出它并不是一個均勻量化,向量中每一紋理區(qū)域的量化范圍都是不同的,而且區(qū)域內(nèi)的量化級也不是等比遞增,有關它的原理可以參考文獻。
?
?
原文地址:
http://www.cnki.net/KCMS/detail/detail.aspx?QueryID=0&CurRec=1&recid=&filename=1013244249.nh&dbname=CMFDTEMP&dbcode=CMFD&pr=&urlid=&yx=&uid=WEEvREcwSlJHSldSdnQ1ZStuZ0NTSk9iRWltY2FjWXRhVnU3aTllaWxjQnBWWk4yRkIrTDdmd1Bka1BrY3pZPQ==&v=MjQzNTVuVzcvQVZGMjZIYkc4R3RQSXBwRWJQSVI4ZVgxTHV4WVM3RGgxVDNxVHJXTTFGckNVUkxtZVp1UnVGeXI=
總結(jié)
以上是生活随笔為你收集整理的CEDD(Color and Edge Directivity Descriptor)算法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: FCTH(Fuzzy Color and
- 下一篇: MPEG-7 视觉描述符