论文笔记——Rich feature hierarchies for accurate object detection and semantic segmentation
?
最近在看一些目標檢測的論文,本文是經典的R-CNN(Regions with CNN features),隨之產生的一系列目標檢測算法:RCNN,Fast RCNN,?Faster RCNN代表當下目標檢測的前沿水平。在此之前主要是SIFT和HOG特征。
Code:https://github.com/rbgirshick/rcnn
概述:
?
測試流程:(1)輸入測試圖像
??(2)利用selective search算法在輸入圖像中提取大約2000個region proposals
??(3)將每個region proposal warp(縮放)成227*227,再輸入到CNN計算特征(fc7的輸出),提取出的特征向量的維度為4096維
??(4)將提取到的特征輸入到SVMs中分類。
??(5)對分類好的region proposal做bounding-box regreesion:每個region都會給出所對應的score,選出前幾個對大數值,然后再用非極大值抑制canny來進行邊緣檢測,最后就會得到所對應的bounding-box
針對的問題:localizing objects?with a deep network 和?training a high-capacity model?with only a small quantity of annotated detection data.?
(1)圖像中的目標定位兩種思路:把定位當做回歸問題或利用滑動窗口(sliding-window)
(2)對于數據量不足(labeled data is scarce):在大數據集(ImageNet)上進行預訓練,之后在特定領域的數據集(PASCAL)上對網絡進行fine-tuning(微調)。
非極大值抑制(NMS)先計算出每一個bounding box的面積,然后根據score進行排序,把score最大的bounding box作為選定的框,計算其余bounding box與當前最大score與box的IoU,去除IoU大于設定的閾值的bounding box
運行時間分析:——快的原因:CNN的參數共享,低維度的features vectors,所需要的內存小
數據集的劃分:若region proposal與ground-truth的IoU大于某個閥值則為正樣本,否則為負樣本。閥值是由a grid search over{0,0.1,...,0.5}on a validation set產生的。
結果:將PASCAL VOC上的檢測率從35.1%提升到53.7%。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
總結
以上是生活随笔為你收集整理的论文笔记——Rich feature hierarchies for accurate object detection and semantic segmentation的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 随机采样方法整理与讲解(MCMC、Gib
- 下一篇: [SPP-NET]Spatial Pyr