當前位置：首頁 > 人工智能 > 目标检测 >内容正文

目标检测

深度学习笔记之使用Faster-Rcnn进行目标检测（原理篇）

發布時間：2023/12/31 目标检测 51 豆豆

生活随笔收集整理的這篇文章主要介紹了深度学习笔记之使用Faster-Rcnn进行目标检测（原理篇）小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Object Detection發展介紹

　　Faster rcnn是用來解決計算機視覺(CV)領域中Object Detection的問題的。經典的解決方案是使用:?SS(selective search)產生proposal,之后使用像SVM之類的classifier進行分類，得到所有可能的目標.?
使用SS的一個重要的弊端就是：特別耗時，而且使用像傳統的SVM之類的淺層分類器，效果不佳。?
鑒于神經網絡(NN)的強大的feature extraction特征，可以將目標檢測的任務放到NN上面來做，使用這一思想的目標檢測的代表是:?
RCNN Fast-RCNN到Faster-RCNN YOLO等?

　　簡單點說就是:

RCNN 解決的是，“為什么不用CNN做detection呢？”
Fast-RCNN 解決的是，“為什么不一起輸出bounding box和label呢？”
Faster-RCNN 解決的是，“為什么還要用selective search呢？”

?

Faster-Rcnn原理簡介

　　鑒于之上的分析，想要在時間上有所突破就要在如何更快的產生proposal上做工夫。?
Faster使用NN來做region proposal，在Fast-rcnn的基礎上使用共享卷積層的方式。作者提出，卷積后的特征圖同樣也是可以用來生成 region proposals 的。通過增加兩個卷積層來實現Region Proposal Networks (RPNs)?, 一個用來將每個特征圖的位置編碼成一個向量，另一個則是對每一個位置輸出一個 objectness score 和 regressed bounds for k region proposals.

?

RPN

　　RPN的作用有以下幾個:

(1) 輸出proposal的位置(坐標)和score?
(2) 將不同scale和ratio的proposal映射為低維的feature vector?
(3) 輸出是否是前景的classification和進行位置的regression

　　這里論文提到了一個叫做Anchor的概念，作者給出的定義是:

The k proposals are parameterized relative to k reference boxes, which we call anchors

　　我的理解是：不同ratio和scale的box集合就是anchor, 對最后一層卷積生成的feature map將其分為n*n的區域，進行不同ratio和scale的采樣.

?

RPN的cls和reg

　　RPN輸出對于某個proposal，其是屬于前景或者背景的概率(0 or 1)，具體的標準論文里給出的是:

和所有的ground-truth的IoU(Intersection-over-union)小于0.3視為negative(背景)
和任意的ground-truth的IoU大于0.7視為positive(前景)
不屬于以上兩種情況的proposal直接丟掉，不進行訓練使用

　　對于regression，作用是進行proposal位置的修正:

學習k個bounding-box-regressors
每個regresso負責一個scale和ratio的proposal，k個regressor之間不共享權值

RPN Training

　　兩種訓練方式:?joint training和alternating training?
兩種訓練的方式都是在預先訓練好的model上進行fine-tunning，比如使用VGG16、ZF等，對于新加的layer初始化使用random initiation，使用SGD和BP在caffe上進行訓練

?

alternating training

　　首先訓練RPN, 之后使用RPN產生的proposal來訓練Fast-RCNN, 使用被Fast-RCNN tuned的網絡初始化RPN,如此交替進行

?

joint training

　　首先產生region proposal,之后直接使用產生的proposal訓練Faster-RCNN，對于BP過程,共享的層需要combine RPN loss和Faster-RCNN los

Result

　　結果自然不用說，肯定是state-of-art，大家自己感受下吧

本文轉自大數據躺過的坑博客園博客，原文鏈接：http://www.cnblogs.com/zlslch/p/6973201.html，如需轉載請自行聯系原作者

總結

以上是生活随笔為你收集整理的深度学习笔记之使用Faster-Rcnn进行目标检测（原理篇）的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。