图像的全局特征--HOG特征、DPM特征
???? ? HOG特征:方向梯度直方圖(Histogram of Oriented Gradient,)特征是一種全局圖像特征描述子。
???? ? 它通過計算和統計圖像局部區域的梯度方向直方圖來構成特征。Hog特征結合SVM分類器已經被廣泛應用于圖像識別中,尤其在行人檢測中獲得了極大的成功。需要提醒的是,HOG+SVM進行行人檢測的方法是法國研究人員Dalal在2005的CVPR上提出的,而如今雖然有很多行人檢測算法不斷提出,但基本都是以HOG+SVM的思路為主。
? ? ?? 參考原文:目標檢測之特征提取之—HOG特征? 如有疑義,請拜訪原文。
? ? ? ? RGB的DPM檢測特征和其級聯方法是最后一個有效的傳統的目標檢測方法,翻譯見DPM原理詳解,此后,如有疑義,請拜訪原文,作者的主頁面:http://www.rossgirshick.info/。
? ? ? ? DPM方法獲得cvpr2018的PAMI Longuet-Higgins Prize。CVPR2018;
-
PAMI Longuet-Higgins Prize (Retrospective Best Paper from CVPR 2008)
"A Discriminatively Trained, Multiscale, Deformable Part Model" by Pedro Felzenszwalb, David McAllester, and Deva Ramanan
?????? DPM項目主頁:Object Detection with Discriminatively Trained Part Based Models?? ???
?????? See also, CACM Research Highlight:
?????? Visual Object Detection with Deformable Part Models
?????? P. Felzenszwalb, R. Girshick, D. McAllester, D. Ramanan?? Communications of the ACM, no. 9 (2013): 97-105
?
一、HOG+SVM模型
1、HOG描述子的計算過程
??????????????
輸入圖像image:
1)灰度化( 將圖像看做一個x,y,z(灰度)的三維圖像);
2)采用Gamma校正法對輸入圖像進行顏色空間的標準化(歸一化);目的是調節圖像的對比度,降低圖像局部的陰影和光照變化所造成的影響,同時可以抑制噪音的干擾;
3)計算圖像每個像素的梯度(包括大小和方向);主要是為了捕獲輪廓信息,同時進一步弱化光照的干擾。
4)將圖像劃分成小cells(例如6*6像素/cell);
5)統計每個cell的梯度直方圖(不同梯度的個數),即可形成每個cell的descriptor; 原始HOG特征劃分為9個直方圖區間。
????? 意義:計算梯度直方圖,可以降低光線明暗變化帶來的影響,保持良好的光照不變性和特定的旋轉不變性。
6)將每幾個cell組成一個block(例如3*3個cell/block),一個block內所有cell的特征descriptor串聯起來便得到該block的HOG特征descriptor。(此處cell和block,每個block可以多個cell,相鄰cell之間產生特定像素的重疊,可以有效的抵擋偏移影響。行人檢測的最佳參數設置是:3×3細胞/區間、6×6像素/細胞、9個直方圖通道。則一塊的特征數為:3*3*9)
????? 意義:覆蓋劃分區域用于降低圖像塊偏移帶來的影響;并同時保持特定區域相關性。
7)將圖像image內的所有block的HOG特征descriptor串聯起來就可以得到該image(你要檢測的目標)的HOG特征descriptor了。這個就是最終的可供分類使用的特征向量了。?
?
????????
?????? 以220X310大小圖像為例,經過縮放處理后為216x304,但并不直接提取整個圖像的HOG特征,而是用一個固定大小的窗口在圖像上滑動,滑動的間隔為8個像素,opencv中默認的窗口大小為128x64(高128,寬64),即有(128÷8)x(64÷8)=16x8個cell,也即有15x7個block,這樣一來一幅圖像就可以取到(27-16)x(38-8)=11x30=330個窗口。現在提取每個窗口的HOG特征,則可得到 105x36=3780 維HOG特征向量。
2、HOG特征的全局性質
????? HOG特征并非固定長度約束的特征描述子。向量的維數和圖像大小和Cell大小有關。每一個Cell里面統計梯度直方圖,形成每個Cell的梯度特征。其中每個Cell里面提取的特征可以使用其他塊特征取代。
2.1. HOG優點:
???????? 與其他的特征描述方法相比,HOG有很多優點。首先,由于HOG是在圖像的局部方格單元上操作,所以它對圖像幾何的和光學的形變都能保持很好的不變性,這兩種形變只會出現在更大的空間領域上。其次,在粗的空域抽樣、精細的方向抽樣以及較強的局部光學歸一化等條件下,只要行人大體上能夠保持直立的姿勢,可以容許行人有一些細微的肢體動作,這些細微的動作可以被忽略而不影響檢測效果。因此HOG特征是特別適合于做圖像中的人體檢測的。
???????? 全局變形性,局部不變形,在區分行人特征和左右眼特征時具有天然的優勢。當然,HOG思想是一個算法族,Cell和Block思想是主要思想,重疊度直方圖分區塊大小可以根據實際情況進行調參,在一定的數據集上,力求達到最佳效果。
3、使用OpenCV進行HOG特征計算
OpenCV的ObjectDetect模塊包含了HOG計算的源代碼,使用例程如下
bool CEyeClassify::GetHogFeature(const cv::Mat& imggray, std::vector<float>& vecFeature) {const int cnSizeW = CEyeClassify::m_PatchWidth;const int cnSizeH = CEyeClassify::m_PatchHeight;{cv::Mat imggray1;resize(imggray, imggray1, cv::Size(cnSizeW, cnSizeH), 0, 0, CV_INTER_LINEAR);cv::HOGDescriptor hog(imggray1.size(), cv::Size(16, 16), cv::Size(8, 8), cv::Size(8, 8), 9); // 48x32 540hog.compute(imggray1, vecFeature);}return true; }?
二、DPM+LatentSVM模型
???? DPM(Deformable Part Model),正如其名稱所述,可變形的組件模型,是一種基于組件的檢測算法,其所見即其意。該模型由大神Felzenszwalb在2008年提出,并發表了一系列的cvpr,NIPS。并且還拿下了2010年,PASCAL VOC的“終身成就獎”。
1、DPM描述子的計算過程
輸入圖像image
?
2、DPM描述子的檢測過程
輸入圖像image
??????????
?
3、Latent SVM模型
輸入圖像image
????????
?
參考資料:
1.HOG維基百科:https://en.wikipedia.org/wiki/Histogram_of_oriented_gradients
2.圖像檢測法三大法寶:HOG,LBP,HAAR特征。
?
總結
以上是生活随笔為你收集整理的图像的全局特征--HOG特征、DPM特征的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 360手机卫士如何杀毒(从360开始)
- 下一篇: 农业银行黑卡最低标准