當前位置：首頁 > 人工智能 > 目标检测 >内容正文

目标检测

【pytorch目标检测】开山之作：R-CNN算法解读

發布時間：2023/12/20 目标检测 38 豆豆

生活随笔收集整理的這篇文章主要介紹了【pytorch目标检测】开山之作：R-CNN算法解读小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

背景

將“深度學習”和傳統的“計算機視覺”的知識相結合，沒有過多的使用深度學習
2014年將PASCALVOC數據集檢測率從35%提升到53%

具體步驟

總體的步驟圖：

1.候選區域生成：ROI(Regions of Interst)

Selective Search算法

將圖像分割承小區域，合并包含同一物體可能性較高的區域，提取約2000個候選區域

歸一化處理，得到固定大小的圖像

利用 Selective Search 算法通過圖像分割的方法得到一些原始區域，然后利用一些合并策略將這些區域合并，得到一些層次化的區域結構，而這些結構就包含著可能需要的物體。這里的 SS 算法可以詳見此處，算法原始論文Selective Search for Object Recognition。（初始區域的獲取是引用另一篇論文的：Efficient Graph-Based Image Segmentation）

2.CNN提取

將固定大小的圖像，利用AlexNet CNN網絡得到固定維度的特征輸出

3.SVM分類器

線性二分類器對輸出特征進行分類
得到是否屬于此類的結果，采用難樣本挖掘來平衡正負樣本的不平衡

對2000x20的每一列近NMS處理

4.位置精修

通過回歸器對特征邊界回歸=Bounding Box regression從而得到更為精準的目標區域

存在的問題

候選區域需要提前提取并保存，占用空間較大
涉及分類中的全連接網絡，所以尺寸是固定的，精度會低
需要多步訓練，步驟繁瑣且訓練速度慢

總結

以上是生活随笔為你收集整理的【pytorch目标检测】开山之作：R-CNN算法解读的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： STL中map的使用要点
下一篇： C++ int转string以及源码