當(dāng)前位置：首頁 > 人工智能 > pytorch >内容正文

pytorch

【深度学习】——物体检测的难点

發(fā)布時間：2023/12/10 pytorch 59 豆豆

生活随笔收集整理的這篇文章主要介紹了【深度学习】——物体检测的难点小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

一、小物體檢測

1、降采樣率減小 +空洞卷積

2、anchor設(shè)計

1）統(tǒng)計方法

2）anchor邊框聚類

3、多尺度訓(xùn)練（multi scale training——MST）

4、特征融合

一、小物體檢測

????????在分類任務(wù)中，一般物體的大小都差不多，這也使得單純的分類任務(wù)不需要考慮物體的大小等因素，但是在目標檢測中，因為在同一個圖像中，可能會出現(xiàn)多個目標，有的目標像素占比大，有的目標像素占比小，比如遠處的人高度只有30個像素，近處的人卻有幾百個像素，這導(dǎo)致在深度學(xué)習(xí)的前向傳播過程中，由于下降樣的因素，會導(dǎo)致小目標在降采樣的過程中直接丟失。

??????? 一般解決的方法有以下幾種：降采樣率減小、anchor設(shè)計、多尺寸訓(xùn)練、特征融合、尺度歸一化（SNIP）

1、降采樣率減小 +空洞卷積

?????? 將采樣率下降的話就可以使得更小的物體能夠保留下來，而不至于在下采樣后一個像素點都不保留，但是減小下采樣率會導(dǎo)致模型的感受野減小，這樣對于模型是不利的，因此為了平衡二者之間的關(guān)系，一般我們可以使用空洞卷積來維持感受野的大小。

2、anchor設(shè)計

1）統(tǒng)計方法

????????設(shè)計多組anchor，然后將每一組anchor和真實框進行對比，以IOU和正樣本數(shù)作為指標。取一組性能指標指示最好的anchor作為訓(xùn)練的anchor。

????????同一類物體雖然在單一尺寸上有很大的區(qū)別，但是在寬高比例上可能差別不大。

2）anchor邊框聚類

????????利用k-means等聚類算法對訓(xùn)練集的真實框的長寬進行聚類，得到k個中心，將這些中心的值作為anchor生成的比例。具體可以參考yolov3模型。

3、多尺度訓(xùn)練（multi scale training——MST）

??????? 訓(xùn)練的時候?qū)D像縮放成指定的尺度，然后進行訓(xùn)練。為了實現(xiàn)多尺度，先設(shè)置多組不同的尺度，然后每次迭代訓(xùn)練的時候都是先隨機選取一個尺度，然后將輸入圖像縮放到這個尺度后再進行訓(xùn)練，雖然在同一次的迭代時，尺度是一樣的，但是不同的迭代會有不一樣的尺度，這樣得到的模型就會有較高的魯棒性。

??????? 測試的時候則將圖像放大4倍或者其他倍數(shù)后，再進行檢測，這樣有利于小物體的檢測。

4、特征融合

??????? 一個圖像在深度學(xué)習(xí)模型前向傳播的過程中，圖像會逐漸減小，導(dǎo)致圖像的細節(jié)丟失，語義信息增加。即淺層的圖像細節(jié)多，深層的圖像語義信息多，因此可以將深層的上采樣回來和淺層的進行融合。常見的有FPN、DetNet、彩虹融合、dssd等等

?5、

總結(jié)

以上是生活随笔為你收集整理的【深度学习】——物体检测的难点的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： golang 反射
下一篇：【深度学习】——pytorch搭建模型及

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

pytorch

【深度学习】——物体检测的难点

一、小物體檢測

1、降采樣率減小 +空洞卷積

2、anchor設(shè)計

1）統(tǒng)計方法

2）anchor邊框聚類

3、多尺度訓(xùn)練（multi scale training——MST）

4、 特征融合

總結(jié)

4、特征融合