人工智能:物体检测之Faster RCNN模型
人工智能:物體檢測之Faster RCNN模型
- 物體檢測
- Faster RCNN模型
- 簡介
- 卷積層
- RPN
- Roi Pooling
- Classifier
物體檢測
- 什么是物體檢測
- 物體檢測應(yīng)用場景
- 物體檢測開源數(shù)據(jù)集
Faster RCNN模型
簡介
-
Faster RCNN由Ross Girshick等人于2016年將其用于目標(biāo)檢測任務(wù)中,與傳統(tǒng)RCNN相比,利用RPN(Region Proposal Networks)完成候選框的選擇,Faster RCNN的結(jié)構(gòu)如下所示。
-
Faster R-CNN模型分為兩部分,一是RPN(Region Proposal Network),二是Faster R-CNN。
-
RPN包括proposal和conv layers,Faster R-CNN包括卷積層、ROI Pooling及后面的全連接層部分。
-
首先將整張圖片輸入CNN,提取圖片的features maps,再將圖片特征輸入RPN,得到候選框的特征信息。
-
RPN對于候選框提出的特征,使用分類器判別是否屬于待識(shí)別的目標(biāo),將屬于某一類別的候選框,用回歸器進(jìn)一步調(diào)整其位置。
-
最后將目標(biāo)框和圖片特征向量輸入到Roi Pooling中層,再通過分類器進(jìn)行分類,完成目標(biāo)檢測的任務(wù)。RPN能夠協(xié)助Fast RNN將注意力集中在候選框中。
卷積層
- Faster RCNN首先將整張圖片輸進(jìn)CNN,提取圖片的feature map,再將其輸入到到RPN,得到候選框的特征信息。
- 這里采用VGG16完成feature map的提取。
- 卷積層是被RPN和Fast R-CNN兩部分共享的。
RPN
- 相比于Fast RCNN,Faster R-CNN引入RPN(Region Proposal Network)完成候選框的提取,使得算法效率得到進(jìn)一步提升。
- RPN將任意尺寸大小的圖片作為輸入,輸出若干個(gè)矩形候選框。為了生成區(qū)域候選框,在卷積層最后一層feature map上滑動(dòng)一個(gè)(nn)的網(wǎng)絡(luò),將卷積生成的feature map與(nn)的窗口進(jìn)行卷積運(yùn)算。
- 每一個(gè)滑動(dòng)窗口都映射為一個(gè)更低維的特征。得到的特征送入兩個(gè)分支中,一個(gè)用于框分類,另一個(gè)用于框回歸。此網(wǎng)絡(luò)執(zhí)行滑動(dòng)窗口形式,所有空間位置都共享全連接層。
Roi Pooling
- Fast R-CNN改進(jìn)了R-CNN,應(yīng)用了Roi Pooling。
- 由于在全連接層,需要輸入固定大小的特征向量,R-CNN網(wǎng)絡(luò)經(jīng)過warp操作統(tǒng)一成固定的大小再送入后續(xù)網(wǎng)絡(luò),導(dǎo)致圖像的變形和扭曲。
- 而且每一個(gè)proposal均需要單獨(dú)進(jìn)行特征提取,重復(fù)計(jì)算量大。
- Poipooling通過卷積計(jì)算將圖像統(tǒng)一成固定大小的特征向量。
- Roi Pooling的輸入是卷積層得到的feature map和RNP得到的anchor,將其分割成7 * 7大小的子窗口,對每個(gè)子窗口進(jìn)行max-pooling操作,輸出ROI(region of interest)的feature map。輸入后續(xù)的全連接層判斷目標(biāo)。
Classifier
在這一步,分類器完成對候選區(qū)域的檢測。利用RoI feature maps計(jì)算ROI類別,同時(shí)再次bounding box regression獲得目標(biāo)最終的位置。
總結(jié)
以上是生活随笔為你收集整理的人工智能:物体检测之Faster RCNN模型的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AI学习与进阶实践-基于行业价值的AI学
- 下一篇: 一篇文章理解深度神经网络5个常用激活函数