卷积神经网络-目标探测
文章目錄
- 目標(biāo)探測(cè)介紹
- 任務(wù)
- 思路
- DPM
- RCNN
- 1)候選區(qū)域選擇
- 2)CNN特征提取
- 3)分類與邊界回歸
- R-CNN總結(jié)
- 優(yōu)點(diǎn)
- 缺陷
- FAST-RCNN
- FASTER-RCNN
- YOLO
目標(biāo)探測(cè)介紹
任務(wù)
分類+獲取坐標(biāo)
目標(biāo)探測(cè)
圖片分割
思路
回歸問(wèn)題:利用神經(jīng)網(wǎng)絡(luò)進(jìn)行目標(biāo)識(shí)別,同樣目標(biāo)變?yōu)樽鴺?biāo)值
該思路問(wèn)題:在位置嘗試識(shí)別,能夠完成識(shí)別的地方就是目標(biāo)位置
如何找到侯選位置?
假如你想構(gòu)建一個(gè)汽車檢測(cè)算法,步驟是,首先創(chuàng)建一個(gè)標(biāo)簽訓(xùn)練集,也就是x和y表示適當(dāng)剪切的汽車圖片樣本,這張圖片(編號(hào)1)x是一個(gè)正樣本,因?yàn)樗且惠v汽車圖片,這幾張圖片(編號(hào)2、3)也有汽車,但這兩張(編號(hào)4、5)沒(méi)有汽車。出于我們對(duì)這個(gè)訓(xùn)練集的期望,你一開(kāi)始可以使用適當(dāng)剪切的圖片,就是整張圖片x幾乎都被汽車占據(jù),你可以照張照片,然后剪切,剪掉汽車以外的部分,使汽車居于中間位置,并基本占據(jù)整張圖片。有了這個(gè)標(biāo)簽訓(xùn)練集,你就可以開(kāi)始訓(xùn)練卷積網(wǎng)絡(luò)了,輸入這些適當(dāng)剪切過(guò)的圖片(編號(hào)6),卷積網(wǎng)絡(luò)輸出y,0或1表示圖片中有汽車或沒(méi)有汽車。訓(xùn)練完這個(gè)卷積網(wǎng)絡(luò),就可以用它來(lái)實(shí)現(xiàn)滑動(dòng)窗口目標(biāo)檢測(cè),具體步驟如下。
假設(shè)這是一張測(cè)試圖片,首先選定一個(gè)特定大小的窗口,比如圖片下方這個(gè)窗口,將這個(gè)紅色小方塊輸入卷積神經(jīng)網(wǎng)絡(luò),卷積網(wǎng)絡(luò)開(kāi)始進(jìn)行預(yù)測(cè),即判斷紅色方框內(nèi)有沒(méi)有汽車。
滑動(dòng)窗口目標(biāo)檢測(cè)算法接下來(lái)會(huì)繼續(xù)處理第二個(gè)圖像,即紅色方框稍向右滑動(dòng)之后的區(qū)域,并輸入給卷積網(wǎng)絡(luò),因此輸入給卷積網(wǎng)絡(luò)的只有紅色方框內(nèi)的區(qū)域,再次運(yùn)行卷積網(wǎng)絡(luò),然后處理第三個(gè)圖像,依次重復(fù)操作,直到這個(gè)窗口滑過(guò)圖像的每一個(gè)角落。
為了滑動(dòng)得更快,我這里選用的步幅比較大,思路是以固定步幅移動(dòng)窗口,遍歷圖像的每個(gè)區(qū)域,把這些剪切后的小圖像輸入卷積網(wǎng)絡(luò),對(duì)每個(gè)位置按0或1進(jìn)行分類,這就是所謂的圖像滑動(dòng)窗口操作。
重復(fù)上述操作,不過(guò)這次我們選擇一個(gè)更大的窗口,截取更大的區(qū)域,并輸入給卷積神經(jīng)網(wǎng)絡(luò)處理,你可以根據(jù)卷積網(wǎng)絡(luò)對(duì)輸入大小調(diào)整這個(gè)區(qū)域,然后輸入給卷積網(wǎng)絡(luò),輸出0或1。
再以某個(gè)固定步幅滑動(dòng)窗口,重復(fù)以上操作,遍歷整個(gè)圖像,輸出結(jié)果。
然后第三次重復(fù)操作,這次選用更大的窗口。
如果你這樣做,不論汽車在圖片的什么位置,總有一個(gè)窗口可以檢測(cè)到它。
比如,將這個(gè)窗口(編號(hào)1)輸入卷積網(wǎng)絡(luò),希望卷積網(wǎng)絡(luò)對(duì)該輸入?yún)^(qū)域的輸出結(jié)果為1,說(shuō)明網(wǎng)絡(luò)檢測(cè)到圖上有輛車。
這種算法叫作滑動(dòng)窗口目標(biāo)檢測(cè),因?yàn)槲覀円阅硞€(gè)步幅滑動(dòng)這些方框窗口遍歷整張圖片,對(duì)這些方形區(qū)域進(jìn)行分類,判斷里面有沒(méi)有汽車。
DPM
基本思想: 提取圖像特征,制作出激勵(lì)模版,在原
始圖像滑動(dòng)計(jì)算,得到激勵(lì)效果圖,根據(jù)激勵(lì)分布確定
目標(biāo)位置
缺點(diǎn):
RCNN
神經(jīng)網(wǎng)絡(luò)分類思想: 對(duì)多個(gè)位置,不同尺寸,用卷積神經(jīng)網(wǎng)絡(luò)判斷區(qū)域內(nèi)圖片是不是某物
候選位置(proposal)提出方法:EdgeBox
RCNN(Regions with CNN features)是將CNN方法應(yīng)用到目標(biāo)檢測(cè)問(wèn)題上的一個(gè)里程碑,由年輕有為的RBG大神提出,借助CNN良好的特征提取和分類性能,通過(guò)RegionProposal方法實(shí)現(xiàn)目標(biāo)檢測(cè)問(wèn)題的轉(zhuǎn)化。
1)候選區(qū)域選擇
Region Proposal是一類傳統(tǒng)的區(qū)域提取方法,可以看作不同寬高的滑動(dòng)窗口,通過(guò)窗口滑動(dòng)獲得潛在的目標(biāo)圖像,關(guān)于Proposal大家可以看下SelectiveSearch,一般Candidate選項(xiàng)為2k個(gè)即可,這里不再詳述;根據(jù)Proposal提取的目標(biāo)圖像進(jìn)行歸一化,作為CNN的標(biāo)準(zhǔn)輸入。2)CNN特征提取
標(biāo)準(zhǔn)CNN過(guò)程,根據(jù)輸入進(jìn)行卷積/池化等操作,得到固定維度的輸出;3)分類與邊界回歸
實(shí)際包含兩個(gè)子步驟,一是對(duì)上一步的輸出向量進(jìn)行分類(需要根據(jù)特征訓(xùn)練分類器);二是通過(guò)邊界回歸(bounding-box regression) 得到精確的目標(biāo)區(qū)域,由于實(shí)際目標(biāo)會(huì)產(chǎn)生多個(gè)子區(qū)域,旨在對(duì)完成分類的前景目標(biāo)進(jìn)行精確的定位與合并,避免多個(gè)檢出。
R-CNN總結(jié)
優(yōu)點(diǎn)
缺陷
FAST-RCNN
FASTER-RCNN
YOLO
總結(jié)
以上是生活随笔為你收集整理的卷积神经网络-目标探测的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: python正则表达式操作指南_第二篇详
- 下一篇: 【Pytorch神经网络实战案例】20