【机器学习】HOG detectMultiScale 参数分析
前段時(shí)間學(xué)習(xí)了HOG描述子及其與SVM結(jié)合在行人檢測(cè)方面的應(yīng)用。
當(dāng)我們用訓(xùn)練好的模型去檢測(cè)測(cè)試圖像時(shí),我們會(huì)用到detectMultiScale() 這個(gè)函數(shù)來(lái)對(duì)圖像進(jìn)行多尺度檢測(cè)。
這是opencv3.1里的參數(shù)解釋
可以看到一共有8個(gè)參數(shù)。
1.img(必需)
這個(gè)不用多解釋,顯然是要輸入的圖像。圖像可以是彩色也可以是灰度的。
2.foundLocations
存取檢測(cè)到的目標(biāo)位置
3.hitThreshold?(可選)
opencv documents的解釋是特征到SVM超平面的距離的閾值(Threshold for the distance between features and SVM classifying plane)
所以說(shuō)這個(gè)參數(shù)可能是控制HOG特征與SVM最優(yōu)超平面間的最大距離,當(dāng)距離小于閾值時(shí)則判定為目標(biāo)。
4.winStride(可選)
HoG檢測(cè)窗口移動(dòng)時(shí)的步長(zhǎng)(水平及豎直)。
winStride和scale都是比較重要的參數(shù),需要合理的設(shè)置。一個(gè)合適參數(shù)能夠大大提升檢測(cè)精確度,同時(shí)也不會(huì)使檢測(cè)時(shí)間太長(zhǎng)。
5.padding(可選)
在原圖外圍添加像素,作者在原文中提到,適當(dāng)?shù)膒ad可以提高檢測(cè)的準(zhǔn)確率(可能pad后能檢測(cè)到邊角的目標(biāo)?)
常見(jiàn)的pad size 有(8, 8),?(16, 16),?(24, 24),?(32, 32).
6.scale(可選)
如圖是一個(gè)圖像金字塔,也就是圖像的多尺度表示。每層圖像都被縮小尺寸并用gaussian平滑。
scale參數(shù)可以具體控制金字塔的層數(shù),參數(shù)越小,層數(shù)越多,檢測(cè)時(shí)間也長(zhǎng)。 一下分別是1.01 ?1.5 1.03 時(shí)檢測(cè)到的目標(biāo)。 通常scale在1.01-1.5這個(gè)區(qū)間
7.finalThreshold(可選)
這個(gè)參數(shù)不太清楚,有人說(shuō)是為了優(yōu)化最后的bounding box
8.useMeanShiftGrouping(可選)
bool 類(lèi)型,決定是否應(yīng)用meanshift 來(lái)消除重疊。
default為false,通常也設(shè)為false,另行應(yīng)用non-maxima supperssion效果更好。
轉(zhuǎn)自:https://www.cnblogs.com/klitech/p/5747895.html
總結(jié)
以上是生活随笔為你收集整理的【机器学习】HOG detectMultiScale 参数分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 【opencv+机器学习】error C
- 下一篇: 通俗易懂的图解堆排序