深度学习笔记之使用Faster-Rcnn进行目标检测 (原理篇)
Object Detection發(fā)展介紹
Faster rcnn是用來解決計算機視覺(CV)領(lǐng)域中Object Detection的問題的。經(jīng)典的解決方案是使用:?SS(selective search)產(chǎn)生proposal,之后使用像SVM之類的classifier進行分類,得到所有可能的目標.?
使用SS的一個重要的弊端就是:特別耗時,而且使用像傳統(tǒng)的SVM之類的淺層分類器,效果不佳。?
鑒于神經(jīng)網(wǎng)絡(luò)(NN)的強大的feature extraction特征,可以將目標檢測的任務(wù)放到NN上面來做,使用這一思想的目標檢測的代表是:?
RCNN Fast-RCNN到Faster-RCNN YOLO等?
簡單點說就是:
- RCNN 解決的是,“為什么不用CNN做detection呢?”
- Fast-RCNN 解決的是,“為什么不一起輸出bounding box和label呢?”
- Faster-RCNN 解決的是,“為什么還要用selective search呢?”
?
?
?
?
Faster-Rcnn原理簡介
鑒于之上的分析,想要在時間上有所突破就要在如何更快的產(chǎn)生proposal上做工夫。?
Faster使用NN來做region proposal,在Fast-rcnn的基礎(chǔ)上使用共享卷積層的方式。作者提出,卷積后的特征圖同樣也是可以用來生成 region proposals 的。通過增加兩個卷積層來實現(xiàn)Region Proposal Networks (RPNs)?, 一個用來將每個特征圖 的位置編碼成一個向量,另一個則是對每一個位置輸出一個 objectness score 和 regressed bounds for k region proposals.
?
?
?
?
RPN
RPN的作用有以下幾個:
(1) 輸出proposal的位置(坐標)和score?
(2) 將不同scale和ratio的proposal映射為低維的feature vector?
(3) 輸出是否是前景的classification和進行位置的regression
?
?
這里論文提到了一個叫做Anchor的概念,作者給出的定義是:
The k proposals are parameterized relative to k reference boxes, which we call anchors
我的理解是:不同ratio和scale的box集合就是anchor, 對最后一層卷積生成的feature map將其分為n*n的區(qū)域,進行不同ratio和scale的采樣.
?
?
?
?
RPN的cls和reg
RPN輸出對于某個proposal,其是屬于前景或者背景的概率(0 or 1),具體的標準論文里給出的是:
- 和所有的ground-truth的IoU(Intersection-over-union)小于0.3視為negative(背景)
- 和任意的ground-truth的IoU大于0.7視為positive(前景)
- 不屬于以上兩種情況的proposal直接丟掉,不進行訓(xùn)練使用
?
?
對于regression,作用是進行proposal位置的修正:
- 學(xué)習(xí)k個bounding-box-regressors
- 每個regresso負責一個scale和ratio的proposal,k個regressor之間不共享權(quán)值
?
?
RPN Training
兩種訓(xùn)練方式:?joint training和alternating training?
兩種訓(xùn)練的方式都是在預(yù)先訓(xùn)練好的model上進行fine-tunning,比如使用VGG16、ZF等,對于新加的layer初始化使用random initiation,使用SGD和BP在caffe上進行訓(xùn)練
?
?
alternating training
首先訓(xùn)練RPN, 之后使用RPN產(chǎn)生的proposal來訓(xùn)練Fast-RCNN, 使用被Fast-RCNN tuned的網(wǎng)絡(luò)初始化RPN,如此交替進行
?
joint training
首先產(chǎn)生region proposal,之后直接使用產(chǎn)生的proposal訓(xùn)練Faster-RCNN,對于BP過程,共享的層需要combine RPN loss和Faster-RCNN los
?
?
Result
結(jié)果自然不用說,肯定是state-of-art,大家自己感受下吧
本文轉(zhuǎn)自大數(shù)據(jù)躺過的坑博客園博客,原文鏈接:http://www.cnblogs.com/zlslch/p/6973201.html,如需轉(zhuǎn)載請自行聯(lián)系原作者
總結(jié)
以上是生活随笔為你收集整理的深度学习笔记之使用Faster-Rcnn进行目标检测 (原理篇)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 祝大家好梦晚安的句子183个
- 下一篇: 小班美术优质课教案《五彩花》反思