【pytorch目标检测】开山之作:R-CNN算法解读
生活随笔
收集整理的這篇文章主要介紹了
【pytorch目标检测】开山之作:R-CNN算法解读
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
背景
- 將“深度學習”和傳統的“計算機視覺”的知識相結合,沒有過多的使用深度學習
- 2014年將PASCALVOC數據集檢測率從35%提升到53%
具體步驟
總體的步驟圖:
1.候選區域生成:ROI(Regions of Interst)
利用 Selective Search 算法通過圖像分割的方法得到一些原始區域,然后利用一些合并策略將這些區域合并,得到一些層次化的區域結構,而這些結構就包含著可能需要的物體。這里的 SS 算法可以詳見 此處,算法原始論文Selective Search for Object Recognition。(初始區域的獲取是引用另一篇論文的:Efficient Graph-Based Image Segmentation)
2.CNN提取
將固定大小的圖像,利用AlexNet CNN網絡得到固定維度的特征輸出
3.SVM分類器
- 線性二分類器對輸出特征進行分類
- 得到是否屬于此類的結果,采用難樣本挖掘來平衡正負樣本的不平衡
對2000x20的每一列近NMS處理
4.位置精修
通過回歸器對特征邊界回歸=Bounding Box regression從而得到更為精準的目標區域
存在的問題
- 候選區域需要提前提取并保存,占用空間較大
- 涉及分類中的全連接網絡,所以尺寸是固定的,精度會低
- 需要多步訓練,步驟繁瑣且訓練速度慢
總結
以上是生活随笔為你收集整理的【pytorch目标检测】开山之作:R-CNN算法解读的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: STL中map的使用要点
- 下一篇: C++ int转string以及源码