【深度学习】——物体检测的难点
目錄
一、小物體檢測
1、降采樣率減小 +空洞卷積
2、anchor設(shè)計
1)統(tǒng)計方法
2)anchor邊框聚類
3、多尺度訓(xùn)練(multi scale training——MST)
4、 特征融合
一、小物體檢測
????????在分類任務(wù)中,一般物體的大小都差不多,這也使得單純的分類任務(wù)不需要考慮物體的大小等因素,但是在目標檢測中,因為在同一個圖像中,可能會出現(xiàn)多個目標,有的目標像素占比大,有的目標像素占比小,比如遠處的人高度只有30個像素,近處的人卻有幾百個像素,這導(dǎo)致在深度學(xué)習(xí)的前向傳播過程中,由于下降樣的因素,會導(dǎo)致小目標在降采樣的過程中直接丟失。
??????? 一般解決的方法有以下幾種:降采樣率減小、anchor設(shè)計、多尺寸訓(xùn)練、特征融合、尺度歸一化(SNIP)
1、降采樣率減小 +空洞卷積
?????? 將采樣率下降的話就可以使得更小的物體能夠保留下來,而不至于在下采樣后一個像素點都不保留,但是減小下采樣率會導(dǎo)致模型的感受野減小,這樣對于模型是不利的,因此為了平衡二者之間的關(guān)系,一般我們可以使用空洞卷積來維持感受野的大小。
2、anchor設(shè)計
1)統(tǒng)計方法
????????設(shè)計多組anchor,然后將每一組anchor和真實框進行對比,以IOU和正樣本數(shù)作為指標。取一組性能指標指示最好的anchor作為訓(xùn)練的anchor。
????????同一類物體雖然在單一尺寸上有很大的區(qū)別,但是在寬高比例上可能差別不大。
2)anchor邊框聚類
????????利用k-means等聚類算法對訓(xùn)練集的真實框的長寬進行聚類,得到k個中心,將這些中心的值作為anchor生成的比例。具體可以參考yolov3模型。
3、多尺度訓(xùn)練(multi scale training——MST)
??????? 訓(xùn)練的時候?qū)D像縮放成指定的尺度,然后進行訓(xùn)練。為了實現(xiàn)多尺度,先設(shè)置多組不同的尺度,然后每次迭代訓(xùn)練的時候都是先隨機選取一個尺度,然后將輸入圖像縮放到這個尺度后再進行訓(xùn)練,雖然在同一次的迭代時,尺度是一樣的,但是不同的迭代會有不一樣的尺度,這樣得到的模型就會有較高的魯棒性。
??????? 測試的時候則將圖像放大4倍或者其他倍數(shù)后,再進行檢測,這樣有利于小物體的檢測。
4、 特征融合
??????? 一個圖像在深度學(xué)習(xí)模型前向傳播的過程中,圖像會逐漸減小,導(dǎo)致圖像的細節(jié)丟失,語義信息增加。即淺層的圖像細節(jié)多,深層的圖像語義信息多,因此可以將深層的上采樣回來和淺層的進行融合。常見的有FPN、DetNet、彩虹融合、dssd等等
?5、
?
總結(jié)
以上是生活随笔為你收集整理的【深度学习】——物体检测的难点的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: golang 反射
- 下一篇: 【深度学习】——pytorch搭建模型及